A Post I La Series Tempora Is

Modelao de Sries Temporais Financeiras
Joo Nicolau
ISEG/UTL & CEMAPRE
2011
Contedo
Notas Prvias vii
Parte 1. Introduo 3
Captulo 1. Processos Estocsticos Aplicados s Finanas 5
Captulo 2. Preos e Retornos 11
2.1. Retornos Discretos 12
2.2. Retornos Contnuos 17
2.3. Retornos Contnuos vs. Retornos Discretos 21
Captulo 3. Factos Empricos Estilizados de Sries Temporais Financeiras 25
3.1. Regularidade Empricas relacionadas com a Distribuio Marginal 26
3.2. Regularidade Empricas relacionadas com a Distribuio Condicional 44
Captulo 4. Processos Estocsticos: Revises 55
4.1. Processo Estocstico e Filtrao 55
4.2. Valores Esperados Condicionais: Principais Resultados 56
4.3. Distribuio Condicional versus Distribuio Marginal 58
4.4. Processos Estocsticos Elementares, Estacionaridade e Fraca
Dependncia 62
Parte 2. Modelos Estatsticos 73
Captulo 5. O Problema da Especicao 75
5.1. O Axioma da Correcta Especicao do Modelo 75
5.2. Modelao da Mdia Condicional e Modelos Dinamicamente
Completos 76
5.3. Modelao da Varincia Condicional 78
5.4. Distribuio de Condicional 79
Captulo 6. Modelao da Mdia: Abordagem Linear 81
6.1. Denies Preliminares 81
6.2. Processos Lineares Estacionrios 84
6.3. Processos Lineares No Estacionrios 100
6.4. Modelao ARMA 111
6.5. Variveis Impulse-Dummy em Modelos de Regresso: Cuidados a
Observar 114
6.6. Previso 119
6.7. Processos ARMA Sazonais 143
Captulo 7. Modelao da Mdia: Abordagem No Linear 147
iii
iv CONTEDO
7.1. Introduo 147
7.2. Estabilidade em Equaes s Diferenas Finitas Determinsticas 149
7.3. Processos No Lineares e Estacionaridade Estrita 168
7.4. Modelo Limiar Autoregressivo (Threshold AR - TAR) 183
7.5. Modelo Markov-Switching 194
Captulo 8. Modelao da Heterocedasticidade Condicionada - Caso
Univariado 211
8.1. Introduo 211
8.2. Modelo ARCH 216
8.3. Modelo GARCH 222
8.4. Modelo IGARCH 226
8.5. Modelo CGARCH 233
8.6. Modelo GJR-GARCH 234
8.7. Modelo GARCH-M 236
8.8. Modelo de Heterocedasticidade Condicionada com Variveis
Explicativas 236
8.9. Estimao 237
8.10. Ensaios Estatsticos 246
8.11. Previso 252
8.12. Problema dos Erros de Especicao na Mdia Condicional 259
8.13. Modelos No Lineares na Mdia combinados com o GARCH 260
8.A. Estabilidade de EDF e a Estacionaridade (Caso modelo ARCH) 263
Captulo 9. Modelao da Heterocedasticidade Condicionada - Caso
Multivariado 265
9.1. Introduo 265
9.2. Densidade e Verosimilhana 266
9.3. Modelo VECH (ou VEC) 267
9.4. Modelo Diagonal VECH 270
9.5. Modelo BEKK 271
9.6. Modelo de Correlaes Condicionais Constantes 272
9.7. Modelo Triangular 274
9.8. GARCH Ortogonal 284
9.9. Testes de Diagnstico 288
Parte 3. Aplicaes 291
Captulo 10. Ecincia do Mercado de Capitais 293
10.1. Introduo e Denies 293
10.2. Teste Ecincia Fraca de Mercado 294
10.3. Teste Ecincia Semi-Forte de Mercado 300
Captulo 11. Seleco de Portfolios 305
11.1. Portfolio Baseado em Momentos Marginais 305
11.2. Portfolio Baseado em Momentos Condicionais 311
Captulo 12. Risco de Mercado e o Valor em Risco 315
12.1. Introduo 315
12.2. Abordagem No Paramtrica 317
CONTEDO v
12.3. Abordagem Paramtrica 319
12.4. Generalizao: Portfolio com : Activos 326
12.5. Abordagem pela Teoria dos valores Extremos 327
12.6. Avaliao do VaR (Backtesting) 332
Bibliograa 337
Notas Prvias
Este texto resultou dos apontamentos construdos ao longo dos ltimos anos
durante a leccionao, no Instituto Superior de Economia e Gesto, das cadeiras
de Econometria Financeira (licenciatura de Finanas), Mtodos de Previso para
Finanas (mestrado de Finanas), Sries Temporais e Previso II (mestrado de
Econometria Aplicada e Previso) e Sries Temporais Financeiras (mestrado de
Econometria Aplicada e Previso). Verses anteriores a este texto circularam com
a designao de Econometria Financeira. Todavia, parece-me que o presente ttulo
- Modelao de Sries Temporais Financeiras - mais adequado, pois a enfse do
documento centra-se exactamente na modelao estatstica de sries nanceiras.
Concretamente, este livro trata da anlise emprica de sries temporais nanceiras
em tempo discreto (para dados dirios semanais ou mensais). Damos especial
enfase s regularidades empricas habitualmente observadas em sries temporais
nanceiras e aos modelos estatsticos que podem captar essas regularidades em-
pricas, mas no descuramos as aplicaes, tratadas na ltima parte do trabalho. A
modelao de sries nanceiras pode ser vista como um m em si mesmo (anlise
da dinmica do processo estocstico subjacente), ou como suporte a variadssimos
estudos, como por exemplo, a avaliao do risco (por exemplo, atravs do Value at
Risk), a avaliao de obrigaes, opes, etc., a previso da volatilidade, a gesto
de portfolios, a anlise da previsibilidade e ecincia dos mercados, etc. So rel-
evantes todos os mtodos estatsticos que de uma forma ou outra se apliquem a
dados nanceiros. De todo o modo, os dados mais relevantes em econometria -
nanceira so de natureza temporal. Estuda-se, por exemplo, a evoluo temporal
das cotaes, taxas de cmbio, taxas de juro, etc. Por esta razo, este livro analisa
essencialmente mtodos economtricos para sries temporais, sobretudo os mto-
dos que se adequam s caractersticas prprias das sries nanceiras (como sejam,
a no linearidade e a no normalidade).
A leitura deste documento supe conhecimentos de Estatstica e Matemtica
ao nvel de uma licenciatura de Economia, Gesto ou Finanas.
Notao e Convenes
Escreve-se ) (r) para designar a funo densidade de probabilidade (fdp) de
uma varivel aleatria A. Quando esto em causa duas variveis aleatrias A e
1, escreve-se, geralmente, )
a
e )
j
para designar, respectivamente, as fdp de A
e 1 () (r) e ) (j) , em princpio, incorrecto). O uso simultneo das notaes
) (r) (fdp de A) e ) (r, j) (fdp conjunta de (A, 1 )) conituoso, pois ) ou
uma aplicao de R em R
ou uma aplicao de R
2
em R
(e, portanto, ) no
poder designar simultaneamente ambas as aplicaes). A rigor dever escrever-se
)
a
e )
a,j
. No entanto, se no existir perigo de confuso, opta-se pela notao mais
simples e habitual ) (r) e ) (r, j). Escreve-se tambm) (j[ r) ou )
j[a
para desig-
nar a fdp condicionada de 1 dado A = r. Em suma, nesta verso do documento,
vii
NOTAS PRVIAS 1
adoptam-se as notaes que se entendem necessrias e convenientes de forma a
no causar confuso. Por exemplo, num certo contexto, pode escrever-se ) (r, j)
e, noutro diferente, pode escrever-se )
j,a
.
Oprocesso estocstico j
t
, t = 1, 2, ... escreve-se indiferentemente como j
t
ou j.
a := / signica, a igual a / por denio. Por exemplo, se quisermos iden-
ticar a letra j como a mdia de A, escrevemos j :=
L
(A). Para este tipo de
relaes, certos autores usam j =
L
(A) .
Em sries temporais usamos os termos amostra grande (ou amostra pe-
quena) para identicar sries temporais longas (ou curtas).
Acrnimos e Siglas Frequentemente Usados
a
o
~ -
a
tem distribuio aproximadamente normal (usamos
o
para a
convergncia em distribuio).
EE - Estritamente estacionrio.
EDF - Equao s diferenas Finitas.
EQM - Erro Quadrtico Mdio.
ESO - Estacionrio de segunda ordem ou Estacionaridade de Segunda Ordem.
FAC - Funo de Autocorrelao.
FACP - Funo de Autocorrelao Parcial.
fdp - Funo Densidade de Probabilidade.
HC- Heterocedasticidade Condicional.
IC - Intervalo de Conna (ou de previso, consoante o contexto).
i.i.d. - Independente e Identicamente Distribudo.
RB - Rudo Branco.
v.a. - Varivel Aleatria.
Parte 1
Introduo
CAPTULO 1
Processos Estocsticos Aplicados s Finanas
Este captulo, baseado em Nicolau (2008), aborda a relao entre os processos
estocsticos e as nanas numa perspectiva histrica (o leitor poder saltar este
primeiro captulo sem perda de continuidade).
Bachelier, ummatemtico Francs na viragemdo sculo XX, visto por muitos
como o fundador da moderna Matemtica Financeira. Na sua tese de doutoramento
(Teoria da Especulao) lana as bases do movimento Browniano como modelo
do comportamento das cotaes em bolsa e usa esse modelo para avaliar opes
sobre aces. Historicamente, um dos primeiros trabalhos a usar explicitamente
processos estocsticos no mbito das nanas. Passado mais de um sculo sobre
a Teoria da Especulao, pode-se dizer que os processos estocsticos, em tempo
discreto e contnuo, esto na base da economia nanceira, por uma razo simples:
tempo, risco e incerteza so os elementos centrais que inuenciam o comporta-
mento dos agentes econmicos e dos mercados nanceiros em geral e, por essa via
so indissociveis da teoria nanceira.
A rea dos processos estocsticos, em geral, vastssima, e tem sido aplicada
em quase todos os ramos da cincia e da tecnologia. No mbito das nanas, estes
desenvolvimentos tm sido muito signicativos e, como resultado, tm aparecido
disciplinas novas, como por exemplo, Econometria Financeira, Sries Temporais
Financeiras, Finanas Computacionais (a Matemtica Financeira, como disciplina,
mais antiga e deve a sua projeco e visibilidade fundamentalmente aos trabalhos
de Fisher Black, Eugene Fama, Harry Markowitz, Robert Merton, Myron Scholes,
entre outros). Provavelmente, nenhuma outra rea da economia se desenvolveu
to rapidamente nos ltimos anos como a dos processos estocsticos aplicados a
problemas nanceiros. Algumass razes para este desenvolvimento: (1) Tem-se
assistido em muitos pases, sobretudo desde a dcada de 60/70, a uma liberaliza-
o e globalizao progressiva dos mercados nanceiros e no nanceiros. Como
resultado, o sistema nanceiro cresceu exponencialmente. Mas aumentou tambm
de complexidade (na relao entre os agentes, na diversidade produtos nanceiros,
etc.). Esta crescente complexidade do sistema nanceiro, foi acompanhada pelo
desenvolvimento de mtodos quantitativos adequados natureza das transaces
nanceiras e dos instrumentos nanceiros criados. Estes mtodos tm sido de-
senvolvidos nas universidades e, sobretudo, nas grandes instituies nanceiras.
Na indstria nanceira so bem conhecidos os quants (ou quantitative analysts).
Tratam-se de indivduos com forte formao matemtica que se dedicam aos prob-
lemas nanceiros de base quantitativa. Uma caracterstica singular destes mto-
dos quantitativos o de se basearem em grande parte em processos estocsticos
porque o risco e a incerteza esto presentes em todos os mercados nanceiros. (2)
5
6 1. PROCESSOS ESTOCSTICOS APLICADOS S FINANAS
Assistiram-se tambm a progressos muito signicativos na modelao quantita-
tiva dos mercados nanceiros. Merecem especial destaque autores como Fisher
Black, John Cox, Eugene Fama, John Lintner, Harry Markowitz, Robert Mer-
ton, Franco Modigliani, Merton Miller, Stephen Ross, Paul Samuelson, Myron
Scholes, William Sharpe, Rober Engle, entre outros, cujas contribuies lanaram
as fundaes da moderna anlise nanceira quantitativa. Todas as principais con-
tribuies envolveram explicitamente os processos estocsticos, porque (como j
argumentmos) o risco e a incerteza, presentes em todos os mercados nanceiros,
no podem ser dissociados das nanas. (3) O progresso informtico (nas ver-
tentes hardware e software) tem sido muito importante em todas as reas da es-
tatstica. Muitas das tcnicas e mtodos estatsticos propostos nos ltimos anos
teriam sido complemente irrelevantes e, certamente, condenados ao esquecimento
sem os recursos informticos existentes. Naturalmente, este argumento justica o
desenvolvimento dos mtodos estatsticos em geral, mas particularmente vlido
no mbito das sries temporais nanceiras. (4) Outro factor relevante para o de-
senvolvimento dos processos estocsticos no mbito das nanas a grande oferta
de sries nanceiras. Nenhuma outra rea da economia dispe de tantas e variadas
sries temporais como a rea nanceira. possvel, hoje em dia, obter facilmente
(sem custos) sries nanceiras longas com periodicidades extremamente elevadas
(e.g. observaes dirias e intradirias) praticamente isentas de erros de obser-
vao. Por exemplo, o website da Yahoo Finance fornece, a ttulo gratuito, cen-
tenas de milhares de cotaes nacionais e estrangeiras com periodicidade diria,
semanal ou mensal. possvel tambm, a baixo custo, adquirir bases de dados
de cotaes tick-by-tick de ttulos de aces, taxas de cmbio e taxas de juro com-
postas por milhes de observaes. Esta disponibilidade de dados permite ao in-
vestigador validar, conrmar e experimentar novas tcnicas e mtodos e descobrir
novas regularidades empricas.
O objecto de estudo pertinente em Sries Temporais Financeiras e reas ans
(e.g. Econometria Financeira) o preo nanceiro observado ao longo do tempo
(poder ser, por exemplo, uma cotao de uma aco, um ndice bolsista, uma taxa
de cmbio, uma taxa de juro, etc.). Este preo poder depois ser convertido em
rendibilidade ou retorno caso se trabalhe em tempo discreto. Quase sempre este
preo estudado no quadro de uma teoria nanceira. Esta interligao entre -
nanas e os processos estocsticos ilustrada a seguir. (1) Uma das aplicaes
mais importantes da teoria dos processos estocsticos s nanas a que respeita
determinao do preo justo ou prmio de uma opo. Fisher Black e Myron
Scholes, assumindo um movimento Browniano geomtrico, deduziram uma fr-
mula matemtica para o prmio da opo. Esta frmula, simples e extremamente
til, ainda nos dias de hoje, considerada por muitos economistas como uma das
maiores realizaes da teoria nanceira. (2) A volatilidade um tpico fundamen-
tal em nanas. O conceito de volatilidade est presente na gesto do risco, na
afectao e seleco de activos, na valorizao e hedging das opes e derivados
e em muitas outras operaes e estratgias nanceiras. A rea da modelao e da
previso da volatilidade assenta, naturalmente, em processos estocsticos. A liter-
atura muita vasta nesta rea, e inclui variadssimos modelos em tempo discreto
(e.g. modelos ARCH e modelos de volatilidade estocstica) e em tempo contnuo
(e.g. processos de difuso univariados com coeciente de difuso no constante e
processos de difuso de segunda ordem de volatilidade estocstica). (3) A gesto
1. PROCESSOS ESTOCSTICOS APLICADOS S FINANAS 7
do risco consiste, grosso modo, emidenticar as fontes de risco e emmedir, contro-
lar e gerir esse mesmo risco. Nesta rea, um conceito fundamental o Value at Risk
ou VaR (como usualmente conhecido na literatura). O VaR representa a perda
que pode ocorrer num lapso de tempo determinado, com uma certa probabilidade
c, supondo que o portfolio no gerido durante o perodo de anlise. Em termos
probabilsticos, o VaR o quantil de ordem c da distribuio terica de ganhos e
perdas. Estes ganhos e perdas evoluem ao longo do tempo e, portanto, so suscep-
tveis de serem modelados atravs de processos estocsticos. (4) Uma discusso
j longa na literatura debate a ecincia dos mercados nanceiros. O mercado de
capitais diz-se eciente se os preos dos produtos nanceiros reectirem toda a
informao disponvel. Quando libertada uma informao relevante (por exem-
plo, um anncio de distribuio de dividendos de valor superior ao esperado, um
anncio de fuses ou aquisies, etc.) num mercado eciente os agentes reagem
imediatamente comprando ou vendendo de acordo com a informao e os preos
ajustam-se imediatamente. Se o mercado eciente o preo ajusta-se rapidamente
e no h oportunidades para a realizao de rendibilidades anormais. Neste caso,
o retorno no previsvel e, portanto, dever ser no autocorrelacionado. Natural-
mente esta discusso faz-se no mbito de um modelo probabilstico de processos
estocsticos. (5) Um problema importante em nanas o da seleco e con-
stituio de portfolios de acordo com o princpio geral da obteno da mxima
rendibilidade com a menor volatilidade (risco) possvel. Existem vrias aborda-
gens para obter a rendibilidade e a volatilidade mas a mais conveniente e adequada
diz respeito s previses (temporais) de rendibilidade e volatilidades associadas
aos activos que constituem o portfolio. Com efeito, a deciso sobre constituio
de portfolio depender da rendibilidade e da volatilidade futura dos activos nan-
ceiros que constituem o portfolio. Trata-se, portanto, de um problema de previso
que deve ser tratado, naturalmente, no mbito dos processos estocsticos.
Os exemplos discutidos no ponto anterior ilustram a forte ligao entre as -
nanas e a teoria dos processos estocsticos. No entanto, a teoria nanceira no
se tem limitado a aplicar mtodos e procedimentos j estabelecidos na teoria dos
processos estocsticos. Tem tambm expandido a anlise dos processos estocs-
ticos, quer propondo novos modelos ou processos estocsticos quer propondo no-
vas metodologias de estimao e inferncia. Para ilustrar este tpico tomam-se
alguns exemplos. (1) Como referimos anteriormente, a volatilidade uma das var-
iveis mais importantes em nanas. A questo como medir, estimar e prever
a volatilidade. O modelo ARCH (Autoregressive Conditional Heteroskedasticity),
devido a Robert Engle, um produto das sries temporais nanceiras. O modelo,
denido em tempo discreto, prope uma especicao dinmica para a varincia
condicional de um processo estocstico. A estimao do modelo, normalmente
realizada no quadro da estimao de mxima verosimilhana, permite medir, es-
timar e prever a volatilidade. No exagero dizer-se que tm sido produzidos
centenas de artigos sobre estas questes. Muitos destes artigos tm renado a
abordagem ARCH, por exemplo, propondo especicaes alternativas e testes es-
tatsticos, discutindo as propriedades assimptticas dos estimadores e testes, etc.
Outros modelos de volatilidade, baseados em pressupostos alternativos, tm sido
propostos, sendo, provavelmente o mais importante, o modelo de volatilidade es-
tocstica. Estes modelos envolvem questes difceis de estimao que tambm
tm sido tratados por investigadores da rea das nanas. (2) As transaces nos
8 1. PROCESSOS ESTOCSTICOS APLICADOS S FINANAS
mercados nanceiros no ocorrem, naturalmente, de forma espaada. Se registar-
mos todas as alteraes do preo de um activo, obtemos, para mercados sucien-
temente lquidos, uma sucesso de observaes, de altssima frequncia onde o
intervalo entre observaes consecutivas pode ser encarado como um processo es-
tocstico, susceptvel de ser modelado. Na rea das Sries Temporais Financeiras
vrios modelos tm sido propostos para modelarem o intervalo entre observaes,
sendo talvez o mais relevante o modelo Autoregressive Conditional Duration. (3)
Processos estocsticos em tempo contnuo, especialmente processos de difuso,
tem sido largamente usados em nanas. Todavia, todos os modelos envolvem
parmetros ou funes desconhecidas que devem ser estimados a partir de obser-
vaes discretas do processo. A inferncia estatstica , pois, crucial em todas as
aplicaes, particularmente em nanas. Sob certas condies gerais, o mtodo
da mxima verosimilhana para processos de difuso baseados em observaes
discretas apresenta as habituais boas propriedades (consistncia, ecincia e dis-
tribuio assimpttica normal dos estimadores). Infelizmente, as densidades de
transio necessrias para construir a funo de verosimilhana so geralmente
desconhecidas. Nestas circunstncias, vrias abordagens alternativas tm sido pro-
postas, muitas delas vindas da rea das nanas. A ttulo de exemplo, citam-se as
seguintes abordagens: mtodo dos momentos generalizados baseados no operador
innitesimal; funo martingala de estimao; aproximao da verosimilhana via
expanso de Hermite; aproximao da verosimilhana via aproximao numrica
da equao progressiva de Kolmogorov; aproximao da verosimilhana via sim-
ulao; mtodos Bayesianos; mtodos baseados em modelos auxiliares (inferncia
indirecta e mtodo dos momentos ecientes). (4) Os investigadores matemticos
da rea das nanas tm expandido os modelos em tempo contnuo, focando so-
bretudo o caso em que o coeciente de difuso da equao dos preos modelado
atravs de uma outra equao diferencial estocstica, governada por outro processo
de Wiener, eventualmente correlacionado com o processo de Wiener associado
equao dos preos. Este tipo de modelos adequado para modelar preos de ac-
tivos onde se suspeite que a volatilidade dos preos ela tambm uma funo es-
tocstica. Ainda na rea da modelao dos preos, tem sido dada especial ateno
aos processos de difuso com saltos de Poisson, por se entender que estes modelos
se adequam aos processos sujeitos a alteraes bruscas da trajectria, devido, por
exemplo, a crashes bolsistas ou ataques especulativos sbitos. Estes modelos tm
sido aplicados no apreamento das opes e na estimao e previso da volatili-
dade. (5) Como referimos, nenhuma outra rea da economia dispe de tantas e vari-
adas sries temporais como a rea nanceira. possvel obter sem custos, sries -
nanceiras longas com periodicidades extremamente altas (por exemplo, de segundo
a segundo). A disponibilidade destas novas sries mostrou novas regularidades em-
pricas e lanou as bases da teoria da microestrutura de mercado. Em particular foi
revelado a existncia de um rudo de mercado impossvel de detectar com frequn-
cia de amostragem inferior. Esta questo tem sido discutida no mbito da Realized
Volatility que uma medida da volatilidade baseada na variao quadrtica de uma
semimartingala. (6) Importantes contribuies tm tambm surgido no mbito dos
processos estocsticos no lineares na mdia em tempo discreto (nota: interpre-
tamos modelos no lineares na mdia quando a mdia condicional uma funo
no linear dos seus argumentos). Estas contribuies tm incidido sobretudo nos
1. PROCESSOS ESTOCSTICOS APLICADOS S FINANAS 9
modelos do tipo regime-switching. Estes tipos de modelos adequam-se, por ex-
emplo, em situaes onde existem alteraes bruscas e inesperadas nas trajectrias
dos processos (e.g., ataques especulativos, crashes bolsistas, anncios pblicos de
medidas do governo, eventos polticos e, em geral, eventos extraordinrios no
antecipados) ou onde existem alteraes da dinmica do processo sem alteraes
bruscas nas trajectrias. Para este tipo de fenmenos, tm sido discutidos dois
tipos de modelos: 1) modelos onde a mudana de regime funo de uma varivel
observvel, como por exemplo, os modelos com variveis impulso, os modelos
limiares ou Threshold AR (TAR), os modelos onde os coecientes associados s
componentes AR so funes no lineares dos valores passados (STAR, Smoothed
Transition AR), entre outros; 2) modelos onde a mudana de regime no obser-
vada, incluindo-se, nesta classe, os modelos onde os regimes so independentes
entre si (como, por exemplo, os modelos Simple Switching ou de Bernoulli) e os
modelos onde existe dependncia entre os regimes (como por exemplo, os modelos
Markov-Switching). (7) A rea da estimao no paramtrica tem estado tambm
muito activa em nanas. Em certos casos, a teoria e os dados so insucientes
para especicar parametricamente o modelo de interesse. Nestes casos considera-
se uma abordagem no paramtrica. No mbito dos modelos de difuso, tem sido
particularmente estudada a estimao dos coecientes innitesimais (tendncia e
difuso) e das densidades de transio e estacionrias (quando existam). Estas
estimativas tm sido empregues para testar a especicao paramtrica de vrios
modelos. Outras aplicaes incluem, por exemplo, o estudo da homogeneidade
dos coecientes (concretamente, sero os coecientes innitesimais dependentes
apenas do estado do processo ou, eventualmente, dependem tambm do tempo?) e
do apreamento das opes (concretamente estuda-se se o preo das opes con-
sistente com os seus valores tericos, baseados em modelos paramtricos).Muitos
outros exemplos poderiam ser acrescentados (por exemplo, na teoria dos valores
extremos para modelar cenrios de risco e valores em perda, redes neuronais, etc.).
Dada a importncia dos processos estocsticos no mbito das nanas, pois
natural que o ensino o das sries temporais nanceiras e disciplinas ans (econome-
tria nanceira, mtodos de previso para nanas, etc.) estejam j rmemente
presentes nas principais faculdades de economia, gesto e nanas do mundo, em
todos os nveis do ensino superior (licenciatura, mestrado e doutoramento). Uma
breve consulta na Internet mostra que centenas de universidades em todo o mundo
oferecem Sries Temporais Financeiras, Econometria Financeira ou Matemtica
Financeira. Em Portugal vrias universidades oferecem tambm unidades cur-
riculares na rea de ligao entre as nanas e os processos estocsticos. No
ISEG/UTL (Instituto Superior de Economia e Gesto) tm sido leccionadas as
seguintes unidades curriculares: Econometria Financeira (licenciatura), Sries Tem-
porais para Finanas (mestrado) e Mtodos de Previso para Finanas (mestrado);
na Universidade Nova de Economia, Introduction to Financial Econometrics (mestrado);
no ISCTE (Instituto Superior das Cincias do Trabalho e da Empresa), Mtodos
e Estudos Empricos em Finanas (Doutoramento); na Faculdade de Economia da
Universidade de Algarve, Econometria Financeira (MBA); na Faculdade de Econo-
mia da Universidade de Coimbra, Anlise de Sries Financeiras (mestrado).
CAPTULO 2
Preos e Retornos
O ponto de partida para a anlise estatstica normalmente uma srie de preos
(por exemplo, a srie das cotaes de fecho do Banco XYZ num certo intervalo de
tempo). De uma forma geral, o preo pode ser, por exemplo, o valor a que um inter-
medirio nanceiro informa estar disposto a pagar pela compra de um determinado
activo, opo ou futuro (bid price), o valor a que um intermedirio nanceiro in-
forma estar disposto a receber pela venda de um determinado activo, opo ou
futuro (ask price), o valor nal da transaco, o valor denido num mercado de
futuros, entre outros.
O intervalo de tempo entre dois preos consecutivos uma varivel aleatria
com valores em R
. Isto signica que se poderia considerar uma sucesso de

preos 1
t
1
, 1
t
2
, ..., 1
t
n
comc
i
= t
i
t
i1
no constante. No obstante, prefere-
se normalmente trabalhar com uma periodicidade xa. Por exemplo, se anlise
emprica de certo fenmeno aconselha o tratamento dirio dos preos, a sucesso
pertinente passar a ser 1
1
, 1
2
, ..., 1
a
onde 1
t
representa habitualmente o valor
de fecho no dia t. O tratamento estatstico do caso em que c
i
= t
i
t
i1
encarado
como uma varivel aleatria, um pouco mais delicada, e insere-se na rea dos
modelos de muita alta-frequncia.
Depois de coligidos os preos, calculam-se os retornos associados (veremos
nos pontos seguintes duas frmulas alternativas de clculo). Na gura 2.1 apresentam-
se preos e retornos da Microsoft no perodo Janeiro de 1988 a Fevereiro de 2006.
Prefere-se geralmente a sucesso dos retornos ou das rendibilidades sucesso
dos preos. Por um lado, a sucesso dos retornos fornece tanta informao sobre a
oportunidades de investimento quanto a sucesso dos preos. Deste ponto de vista
indiferente trabalhar-se com qualquer das sequncias. H, todavia, uma razo de
peso para se preferir a sucesso dos retornos: esta mais fcil de modelar. Vere-
mos adiante, com mais pormenor, que a sucesso dos preos quase sempre no
estacionria, ao passo que a sucesso dos retornos tendencialmente estacionria
(facilitando, por isso, a aplicao de resultados essenciais, como sejam, a lei dos
grande nmeros e o teorema do limite central)
1
.
H duas formas de obtermos o retorno associado ao preo que descreveremos
a seguir.
1
Taxas de cmbio real e taxas de juro podem ser analisadas nos nveis e no nas primeiras
diferenas, se existir evidncia de estacionaridade.
11
12 2. PREOS E RETORNOS
Preos Microsoft
0
10
20
30
40
50
60
J
a
n
-
8
8
J
a
n
-
9
0
J
a
n
-
9
2
J
a
n
-
9
4
J
a
n
-
9
6
J
a
n
-
9
8
J
a
n
-
0
0
J
a
n
-
0
2
J
a
n
-
0
4
J
a
n
-
0
6
Retornos Microsoft
-0.2
-0.15
-0.1
-0.05
0
0.05
0.1
0.15
0.2
J
a
n
-
8
8
J
a
n
-
9
0
J
a
n
-
9
2
J
a
n
-
9
4
J
a
n
-
9
6
J
a
n
-
9
8
J
a
n
-
0
0
J
a
n
-
0
2
J
a
n
-
0
4
J
a
n
-
0
6
FIGURA 2.1. Preos e Retornos dirios da Microsoft no perodo
Jan 88 a Fev 06
2.1. Retornos Discretos
Seja 1
t
a cotao de um certo activo no momento t. Suponhamos que 1
observado nos momentos t = 1, 2, ..., : (podemos supor que temos : observaes
dirias).
2.1.1. Retorno Simples. O retorno simples em tempo discreto de um certo
investimento no momento t (retorno do dia t 1 para o dia t) denido como
1
t
=
1
t
1
t1
1
t1
=
1
t
1
t1
1 (2.1)
(na literatura anglo-saxnica 1
t
designado por simple net return e 1 1
t
=
1
t
,1
t1
como simple gross return). Naturalmente, tambm se tem
1
t
= 1
t1
(1 1
t
) .
Esta ltima expresso mostra que 1
t
representa, efectivamente, a taxa de rendibil-
idade de um certo investimento, adquirido por 1
t1
e vendido por 1
t
. Se 1
t1
rep-
resenta o preo unitrio de um activo nanceiro e 1 o nmero de aces adquiridas
em t 1, a taxa de rendibilidade do investimento de valor 11
t1
tambm, natu-
ralmente, 1
t
, pois 1
t
= 1
t1
(1 1
t
) =1
t
1 = 1
t1
1 (1 1
t
).
2.1. RETORNOS DISCRETOS 13
2.1.2. Retorno Multi-Perodos. Suponha-se que 1
1
, 1
2
, ..., 1
a
a sucesso
de preos dirios. Podemos estar interessados, por exemplo, no retorno semanal e,
para o efeito, basta considerar
1
t
() =
1
t
1
t
1
t
(admitindo que se observam cinco preos por semana). De uma forma geral,
1
t
(:) =
1
t
1
tn
1
tn
=
1
t
1
tn
1. (2.2)
Para calcular 1
t
(:) basta atender expresso (2.2). Suponhamos, no entanto,
que 1
t
e 1
tn
no so conhecidos. A questo , como calcular 1
t
(:) a partir dos
retornos simples em t = 1, 2, ...? Pode-se provar
2
1
t
(:) =
1
t
1
tn
1
tn
=
t
)=tn1
(1 1
)
) 1.
2.1.3. Retornos de Portfolios. Admita-se que o capital em t 1 igual 1
(unidades monetrias) e existem dois activos e 1, cujas taxas de rendibilidade
so, respectivamente, 1
,t
e 1
1,t
. Um certa fraco do capital, .
, investido em
e, a parte restante, .
1
= 1 .
, investido em 1. Desta forma, o valor do

investimento no perodo seguinte, t, igual a
1 (.
(1 1
,t
) .
1
(1 1
1,t
))
e o retorno do portfolio
1
j,t
=
1 (.
(1 1
,t
) .
1
(1 1
1,t
)) 1
1
= .
(1 1
,t
) .
1
(1 1
1,t
) 1
= .
1
,t
.
1
1
1,t
.
Com : activos, tem-se .
1
... .
n
= 1 e
1
j,t
= .
1
1
1,t
.
2
1
2,t
... .
n
1
n,t
=
n
i=1
.
i
1
i,t
. (2.3)
2
Como calcular 1
I
(i) a partir dos retornos simples em t = 1, 2, ...? Basta considerar
1
I
(i) =
1
I
1
Ir
1
Ir
=
1
I
1
I1
1
I1
1
I2
...
1
Ir+1
1
Ir
1
=
_
1
1
I
1
I1
1
__
1
1
I1
1
I2
1
_
...
_
1
1
Ir+1
1
Ir
1
_
1
= (1 1
I
) (1 1
I1
) ... (1 1
Ir+1
) 1
=
I
=Ir+1
(1 1
) 1.
Conclui-se portanto que o retorno de um portfolio igual a uma mdia ponderada
dos vrios retornos do portfolio.
A varincia do retorno de um portfolio tende a ser inferior varincia dos
retornos do portfolio. Para analisar esta questo, considere-se
Vai (1
j,t
) = Vai
_
n
i=1
.
i
1
i,t
_
=
n
i=1
Vai (.
i
1
i,t
) 2
n1
)=1
n
i=)1
Cov (.
i
1
i,t
, .
i)
1
i),t
)
= .
2
i
n
i=1
Vai (1
i,t
) 2
n1
)=1
n
i=)1
.
i
.
i)
Cov (1
i,t
, 1
i),t
) .
Simplique-se esta expresso. Admita-se que os retornos tm varincia igual,
Vai (1
i,t
) = o
2
e que os pesos so iguais, .
i
= 1,: (estas hipteses signicam
que se tomam ttulos com idntica variabilidade e com o mesmo peso na carteira).
Seja
=
n1
)=1
n
i=)1
Cov (1
i,t
, 1
i),t
)
n(n1)
2
a covarincia mdia, isto , a mdia aritmtica dos valores de todas as covarin-
cias distintas (que so em nmero de :(:1) ,2). Sob estas hipteses, vem
Vai (1
j,t
) =
o
2
:
2
1
:
2
(:1)
2
=
o
2
:

(:1)
:
.
Nestas circunstncias, fcil vericar que Vai (1
j,t
) < Vai (1
i,t
) equivalente
a o
2
. Assim, se a variabilidade dos activos (tomados isoladamente) for su-
perior mdia aritmtica dos valores de todas as covarincias distintas, o retorno
do portfolio apresenta menor varincia do que a dos activos que a constituem. A
desigualdade o
2
verica-se trivialmente se os retornos forem independentes
( = 0) ou se as covarincias forem negativas ( < 0). A desigualdade o
2

tende a vericar-se quando as covarincias so baixas e/ou existem vrias covarin-
cias negativas. Deve notar-se que a hiptese de independncia inverosmil, pois
os activos partilham aspectos comuns relacionados com o comportamento geral do
mercado (risco de mercado).
Uma forma mais convincente de sugerir Vai (1
j,t
) < Vai (1
i,t
) a seguinte.
Assuma-se: (i) os retornos tm varincia igual, Vai (1
i,t
) = o
2
, (ii) os pesos so
iguais, .
i
= 1,: e (iii) as covarincias so iguais. Resulta por construo que a
Vai (1
j,t
) < Vai (1
i,t
) . Comefeito, comece-se por observar que Cov (1
i,t
, 1
i),t
) =
jo
2
(j o coeciente de correlao). Nestas condies vem
n1
)=1
n
i=)1
jo
2
=
jo
2
:(:1) ,2 e, portanto,
Vai (1
j,t
) =
o
2
:
2
1
:
2
jo
2
:(:1)
2
.
Verica-se agora que Vai (1
j,t
) < Vai (1
i,t
) equivalente a j < 1. Como, por
denio j menor do que 1, a desigualdade Vai (1
j,t
) < Vai (1
i,t
) verica-se
sempre, sob as hipteses assumidas. Claro que, na prtica, nenhuma das hipteses
2.1. RETORNOS DISCRETOS 15
(i), (ii) e (iii) se verica de forma exacta, mas seguro dizer-se que, em condies
gerais, a diversicao (i.e. : 1) baixa a variabilidade do portfolio.
2.1.4. Retornos Ajustados aos Dividendos. Se no perodo t (ou se algures
entre t 1 e t) h lugar ao pagamento de dividendos, o retorno deve reectir esse
acrscimo de rendimento. O retorno total vem
1
t
=
1
t
1
t
1
t1
1
t1
=
1
t
1
t1
1
t1

1
t
1
t1
onde (1
t
1
t1
) ,1
t1
, por vezes, referido como capital gain e 1
t
,1
t1
como
dividend yield.
2.1.5. Retornos Ajustados Inao. At agora considermos retornos nom-
inais. Em certos estudos, sobretudo de carcter macroeconmico, tem interesse
analisar o retorno real. Para obtermos este retorno, necessrio expurgar do ganho
de capital o efeito do crescimento geral de preos. Suponhamos que a inao
foi de 4% e o retorno (anualizado) foi de 3%. Houve ganho real no investimento
realizado? Se atendermos ao efeito crescimento geral de preos a resposta neg-
ativa. tentador dizer que a perda real de 1%. Efectivamente quase 1%, mas
no chega, como se mostra a seguir. Para obtermos o retorno real, 1
ionl
t
(ajustado,
portanto, da inao), considera-se
1
ionl
t
=
1
ionl
t
1
ionl
t1
1
ionl
t1
, 1
ionl
t
=
1
t
11C
t
sendo 11C
t
o ndice de preos ao consumidor (ndice construdo pelo INE, In-
stituto Nacional de Estatstica). Observe-se que 1
ionl
t
o preo deacionado ou
simplesmente o preo real do activo. Simples lgebra, permite concluir que
1
ionl
t
=
1
ionl
t
1
ionl
t1
1
ionl
t1
=
1
t
1
t1
11C
t1
11C
t
1 =
1
t
t
1
onde
t
= (11C
t
11C
t1
) ,11C
t1
. Retomemos o exemplo acima, com1
t
=
0.08 e
t
= 0.04; logo,
1
ionl
t
=
0.08 0.04
0.04 1
= 0.0006
isto , os retornos reais caiem aproximadamente 1%, para sermos mais exactos,
caiem 0.96%. Quando a inao relativamente baixa (por exemplo, se 1
ionl
t
so
retornos reais mensais) vlida a aproximao,
1
ionl
t
1
t
t
.
Como o IPC est, no mximo, disponvel mensalmente, no possvel calcular-se
retornos reais dirios.
2.1.6. Retornos Anualizados. Para compararmos, por exemplo, o retorno dirio
do investimento A com o retorno mensal do investimento B, necessrio converter
as diferentes taxas de rendibilidades a um mesmo perodo. Toma-se normalmente
como perodo de referncia o ano pelo que, as taxas de rendibilidade depois de
convertidas em rendibilidades anuais dizem-se anualizadas. Suponhamos que um
certo investimento de valor 1
0
foi realizado no momento 0. Ao m de T anos
(T pode ser por exemplo 0.5, isto , 6 meses) o mesmo investimento vale 1
a
. A
questo que deveremos colocar a seguinte: qual a taxa de rendibilidade an-
ual, 1
, tal que, aplicada a um investimento 1

0
permite ao m de T anos obter o
investimento 1
a
Ou seja, qual o valor 1
que resolve a equao

1
0
(1 1
)
T
= 1
a

Tomando 1
como incgnita, facilmente se obtm

1
=
_
1
a
1
0
_1
T
1. (2.4)
Se os preos 1
0
, 1
1
, ...1
a
so dirios e se admitirmos que num ano se observam
250 preos, ento T = :,20 (por exemplo, com : = 00 observaes dirias,
o perodo de investimento corresponde a dois anos, T = 00,20 = 2). Nestas
condies, a frmula (2.4) pode-se reescrever na forma
1
=
_
1
a
1
0
_250
n
1.
Em termos gerais, se num ano se observam preos (por exemplo, = 12 se
as observaes so mensais) e dispomos de : observaes sobre os preos, ento
T = :, e
1
=
_
1
a
1
0
_^
n
1. (2.5)
EXEMPLO 2.1.1. Queremos comparar os seguintes investimentos:
O investimento 1 foi adquirido ao preo 1.5. Ao m de 800 dias (isto ,
800,20 = 8.2 anos) valia 1.9.
O investimento 2 foi adquirido ao preo 105. Ao m de 50 meses (isto ,
0,12 = 4.17 anos) valia 121.
Questo: qual dos investimento foi prefervel? Para os investimento 1 e 2, as
taxa de rendibilidade anualizadas foram respectivamente de
1
,1
=
_
1.0
1.
_250
800
1 = 0.0766
e,
1
,2
=
_
121
10
_12
50
1 = 0.084,
ou seja de 7.66% para o investimento 1 e 3.4% para o investimento 2. O investi-
mento 1 foi, portanto, prefervel.
2.2. RETORNOS CONTNUOS 17
Quando o perodo de observao dos preos relativamente curto as taxas
de rendibilidade anualizadas podem fornecer valores aberrantes. Por exemplo, se
numa semana, devido variabilidade dos preos, se observar 1
0
= 1 e 1
= 1.1,
a taxa anualizada de 1046.7%.
2.2. Retornos Contnuos
Sejam 1
0
e 1
1
, respectivamente o capital inicial e o capital ao m de um
perodo. Se o capital se valorizou continuamente nesse perodo, qual a taxa
de rendibilidade instantnea associada? Para discutirmos esta questo, admita-se,
para simplicar, que o perodo o ano. Se a capitalizao fosse anual, a taxa de
rendibilidade 1
o
resultaria da resoluo da equao 1
1
= 1
0
(1 1
o
) em ordem
a 1
o
. Se a capitalizao fosse semestral, a taxa de rendibilidade (semestral) 1
c
resultaria da resoluo da equao
1
1
= 1
0
_
1
1
c
2
__
1
1
c
2
_
= 1
0
_
1
1
c
2
_
2
em ordem a 1
c
. De igual forma, numa capitalizao trimestral, ter-se-ia 1
1
=
1
0
(1 1
tv
,4)
1
. Se a capitalizao contnua (capitalizao minuto a minuto,
segundo a segundo, etc.) ento o capital 1
1
pode interpretar-se como o limite de
1
1
= lim
ao
1
0
_
1
r
:
_
a
.
Como lim
ao
_
1
v
a
_
a
= c
v
, a taxa de rendibilidade instantnea r resulta da
resoluo da equao 1
1
= 1
0
c
v
em ordem a r (pode-se obter 1
1
= 1
0
c
v
resol-
vendo a equao diferencial 1
t
t
= r1
t
)
3
. Logaritmizando a equao e resolvendo
em ordem a r, obtm-se
r = log 1
1
log 1
0
.
Considere-se agora uma sucesso de preos 1
1
, 1
2
, ..., 1
a
. Dene-se a taxa de
rendibilidade instantnea ou simplesmente o retorno contnuo de um certo investi-
mento no momento t como
r
t
= log 1
t
log 1
t1
.
Naturalmente esta expresso equivalente a
r
t
= log 1
t
log 1
t1
= log
1
t
1
t1
= log
_
1
1
t
1
t1
1
_
= log (1 1
t
) .
3
Seja 1
I
o valor de um certo capital no momento t (podemos convencionar: t = 1 representa
um ano). Se o capital se valoriza em tempo discreto, a variao do capital 1
I
num certo intervalo de
tempo . 0 pode ser traduzida pela igualdade (1
I+
1
I
) 1
I
= v. (v a taxa de retorno) ou
seja
1
I+
1
I
.
= v1
I
Se o capital se valoriza continuamente, i.e., se assumirmos . 0, o lado esquerdo da equao
anterior a derivada de 1 em ordem a t, i.e., 1
0
. Desta forma tem-se a equao diferencial linear
de primeira ordem (determinstica) 1
0
I
= v1
I
, que estabelece a forma como 1
I
evolui em tempo
contnuo. Pode-se provar que a soluo geral desta equao 1
I
= cc
rI
, c R(c depende do
capital inicial). Com o capital inicial 1
0
, a soluo particular 1
I
= 1
0
c
rI
. Ao m de um perodo
t = 1 o capital vale 1
1
= 1
0
c
r
. Resolvendo esta equao em ordem a v vem v = log (1
1
1
0
) =
log 1
1
log 1
0
.
-0.3
-0.2
-0.1
0
0.1
0.2
0.3
0.4
J
a
n
-
0
0
J
u
l
-
0
0
J
a
n
-
0
1
J
u
l
-
0
1
J
a
n
-
0
2
J
u
l
-
0
2
J
a
n
-
0
3
J
u
l
-
0
3
J
a
n
-
0
4
J
u
l
-
0
4
J
a
n
-
0
5
J
u
l
-
0
5
R
r
FIGURA 2.2. Retornos mensais da IBM
Para dados dirios, semanais ou mensais pode assumir-se r
t
1
t
4
. Na gura 2.2
as diferenas entre 1
t
e r
t
so relativamente pequenas. Se os dados fossem dirios
as diferenas seriam ainda mais pequenas.
2.2.1. Retorno Multi-Perodos. Suponha-se que 1
1
, 1
2
, ..., 1
a
a sucesso
de preos dirios. Podemos estar interessados, por exemplo, no retorno semanal e,
para o efeito, basta considerar
r
t
() = log
_
1
t
1
t
_
(admitindo que se observam cinco preos por semana). De uma forma geral,
r
t
(:) = log
_
1
t
1
tn
_
= log (1
t
) log (1
tn
) .
Seguindo o mesmo raciocnio que vimos atrs, suponhamos, no entanto, que 1
t
e
1
tn
no so conhecidos. A questo , como calcular r
t
(:) a partir dos retornos
contnuos em t = 1, 2, ...? Para exemplicar, suponha-se que se tm retornos
dirios e procura-se o retorno semanal, i.e., admita-se o seguinte:
4
A srie de Taylor da funo log (1 1
I
) em torno de 1
I
= 0 , como se sabe,
v
I
= log (1 1
I
) = 1
I
1
2
1
2
I

1
8
1
3
I
... (1)
n1
1
n
I
n
...
Este desenvolvimento em srie de potncia de 1
I
vlido para todo o 1
I
tal que [1
I
[ < 1. Quando
1
I
relativamente pequeno, os termos 1
2
I
, 1
3
I
, etc., so ainda mais pequenos (por exemplo, 1
I
=
0.00 implica 1
2
I
= 2. 10
5
, 1
3
I
= 1.2 10
7
, etc.) pelo que, nestas circunstncias, 1
2
I
0,
1
3
I
0, etc., e, assim, v
I
1
I
. Se os dados so dirios, semanais ou mensais as rendibilidades 1
so geralmente pequenas (quando comparadas com as rendibilidades anuais). Assim, para este tipo
de rendibilidades, pode assumir-se v
I
1
I
.
2.2. RETORNOS CONTNUOS 19
retorno 2
o
feira r
1
= log 1
1
log 1
0
retorno 3
o
feira r
2
= log 1
2
log 1
1
retorno 4
o
feira r
S
= log 1
S
log 1
2
retorno 5
o
feira r
1
= log 1
1
log 1
S
retorno 6
o
feira r
= log 1
log 1
1
retorno da semana log 1
log 1
0
= r
1
r
2
... r
A tabela anterior sugere que o retorno da semana igual soma dos retornos
da semana. Com efeito,
log 1
log 1
0
= log 1
log 1
1
. .
v
5
log 1
1
log 1
S
. .
v
4
log 1
S
log 1
2
. .
v
3
log 1
2
log 1
1
. .
v
2
log 1
1
log 1
0
. .
v
1
(observe-se que no lado direito da expresso anterior, apenas os termos log 1
e 1
0
no cancelam). Em termos gerais,
r
t
(:) = r
t
r
t1
... r
tn1
.
2.2.2. Retornos de Portfolio. Pode imaginar-se o retorno contnuo do port-
folio como sendo o valor r
j,t
tal que, aplicado ao capital inicial 1 (i.e., 1c
v
,I
) per-
mite obter o valor do portfolio calculado atravs dos :retornos (i.e., 1
n
i=1
.
i
c
v
.,I
).
Assim, r
j,t
tal que 1
n
i=1
.
i
c
v
.,I
= 1c
v
,I
. Resolvendo esta equao em
funo de r
j,t
obtm-se r
j,t
= log (
n
i=1
.
i
c
v
.,I
) . Tendo em conta que r
i,t
=
log (1 1
i,t
) e
n
i=1
.
i
= 1, podemos ainda escrever
r
j,t
= log
_
n
i=1
.
i
c
v
.,I
_
= log
_
n
i=1
.
i
(1 1
i,t
)
_
= log
_
1
n
i=1
.
i
1
i,t
_
= log (1 1
j,t
) .
Ao contrrio dos retornos discretos, o retorno contnuo do portfolio no igual
soma ponderada dos retornos contnuos dos vrios activos, i.e., r
j,t
,=
a
i=1
.
i
r
i,t
.
Este facto constitui uma desvantagem da verso contnua dos retornos. No entanto,
quando 1
j,t
no muito alto, r
j,t
- 1
j,t
.
2.2.3. Retornos Ajustados aos Dividendos. O retorno contnuo ajustado aos
dividendos denido como
r
t
= log
_
1
t
1
t
1
t1
_
= log (1
t
1
t
) log (1
t1
) .
Note-se tambm:
r
t
= log (1 1
t
) , 1
t
=
1
t
1
t
1
t1
1
t1
.
2.2.4. Retornos Ajustados Inao. Oretorno contnuo ajustado inao
denido como
r
ionl
t
= log
_
1
t
,11C
t
1
t1
,11C
t1
_
= log
_
1
t
1
t1
_
log
_
11C
t
11C
t1
_
= r
t
t
onde agora a taxa de inao
t
denida como
t
= log (11C
t
,11C
t1
). Note-
se tambm:
r
ionl
t
= log
_
1 1
ionl
t
_
.
2.2.5. Retornos Anualizados. Tal como no caso dos retornos discretos, tam-
bm no caso dos retornos contnuos possvel obter uma taxa de rendibilidade
(agora instantnea) anualizada ou simplesmente retorno anualizado, r
. Pode
comear-se por perguntar: qual a taxa de rendibilidade anual, r
, tal que, apli-

cada a um investimento 1
0
permite ao m de T anos (de valorizao contnua)
obter o investimento 1
a
Ou seja, qual o valor r
que resolve a equao

1
0
c
v
/
T
= 1
a

Tomando r
como incgnita, facilmente se obtm

r
=
1
T
log
_
1
a
1
0
_
. (2.6)
Tambmse chega a esta expresso a partir da denio habitual r
= log (1 1
) .
Com efeito,
r
= log (1 1
) = log
_
1
_
1
a
1
0
_1
T
1
_
= log
_
_
1
a
1
0
_1
T
_
=
1
T
log
_
1
a
1
0
_
(T representa o nmero de anos do investimento).
Se os preos 1
0
, 1
1
, ...1
a
so dirios e se admitirmos que num ano se obser-
vam 250 preos, ento deduz-se a relao T = :,20. Nestas condies, a frmula
(2.6) pode-se reescrever na forma
r
=
20
:
log
_
1
a
1
0
_
.
Em termos gerais, se num ano se observam preos (por exemplo, = 12 se
as observaes so mensais) e dispomos de : observaes sobre os preos, ento
T = :, e
r
=

:
log
_
1
a
1
0
_
.
Em muitas aplicaes estuda-se uma sucesso de retornos r
1
, r
2
, ..., r
a
e obtm-
se de seguida um conjuntos de estatsticas, como por exemplo a mdia emprica
dos retornos,
r =
1
:
a
i=1
r
i
.
2.3. RETORNOS CONTNUOS VS. RETORNOS DISCRETOS 21
Uma questo interessante consiste em obter r
como funo de r. Tendo em conta

que log (1
a
,1
0
) =
a
i=1
r
i
tem-se
r
=

:
log
_
1
a
1
0
_
=

:
a
i=1
r
i
= r.
Uma forma alternativa de obtermos r
= r e que tem a vantagem de fornecer

tambm uma medida para o valor da volatilidade anualizada a seguinte. Suponha-
se, tal como anteriormente, que num ano possvel observar preos. Ento, a
varivel aleatria que representa o retorno anual dado por
A = log 1
.
log 1
0
=
.
t=1
r
t
.
Supondo
L
(r
1
) =
L
(r
2
) = ... =
L
(r
.
) , tem-se que o retorno mdio anual
dado por
L
(A) =
L
(r
t
) .
Logo, uma estimativa de
L
(A) , precisamente, r
= r . Por outro lado,

suponha-se que a sucesso r
t
no autocorrelacionada e que Vai (r
t
) = o
2
.
Nestas condies, a varincia anual (i.e., a varincia associada a r
t
()) dada por
Vai (A) = Vai
_
.
t=1
r
t
_
= o
2
. (2.7)
Resulta da equao (2.7) a famosa square root of time rule segundo a qual, a volatil-
idade anual de um activo, obtm-se a partir da regra
_
o onde o o desvio padro
associado a um medida intra anual (assume-se o desvio padro como medida da
volatilidade). Por exemplo, se os dados so dirios, a regra estabelece
_
20o
o
(o
o
o desvio padro associado aos dados dirios); se os dados so mensais, vem
_
12o
n
(o
n
o desvio padro associado aos dados mensais). A informao anu-
alizada pode ser dada em percentagem:
r 100/,
_
o 100/.
Com efeito o retorno anual em percentagem A 100 pelo que
L
(A 100) =
L
(r
t
) 100 e Vai (A 100) = o
2
100
2
=
_
Vai (A 100) =
_
o100.
Note-se, nalmente, que o retorno anualizado na verso discreta uma funo
do retorno anualizado na verso contnua, dada pela expresso 1
= c
v
/
1 (veja
a equao (2.5)).
2.3. Retornos Contnuos vs. Retornos Discretos
Neste documento d-se preferncia anlise dos retornos contnuos. Por vrias
razes:
A esmagadora maioria dos investigadores usa r
t
. Se queremos que os
nossos resultados sejam comparveis devemos usar r
t
.
Como vimos, os retornos contnuos multi-perodos so aditivos (por ex-
emplo, o retorno contnuo entre o perodo 5 e 0 igual soma dos re-
tornos contnuos entre o perodo 5 e 0). J os retornos discretos multi-
perodos no so. Em certas aplicaes necessrio modelar retornos
multi-perodos a partir do conhecimento das distribuies de r ou 1.
Neste caso, prefere-se interpretar o retorno na sua verso contnua, pois a
modelao de uma soma
log 1
t
log 1
0
=
t
i=1
r
i
bem mais fcil do que a modelao de um produto
1
t
1
0
1
0
=
t
)=1
(1 1
)
) 1.
Alm disso, a soma

t
i=1
r
i
preserva propriedades que podem ser in-
teressantes. Por exemplo, se r
i
uma sucesso de v.a. i.i.d. com
distribuio
_
j, o
2
_
, segue-se imediatamente que log 1
t
log 1
0
=
t
i=1
r
i
tem ainda distribuio normal
_
tj, to
2
_
. J no caso discreto,
se 1
i
uma sucesso de v.a. i.i.d. com distribuio normal, a v.a.
(1
t
1
0
) ,1
0
=
t
)=1
(1 1
)
) 1 no tem distribuio normal.
O facto dos retornos discretos no ser aditivos pode conduzir a con-
cluses erradas. Considere-se o seguinte exemplo (veja-se a tabela 1).
No momento t = 0 um certo activo vale 100, depois em t = 1 vale 110
e, nalmente, em t = 2 volta a valer 100. Obviamente que o retorno de
t = 0 para t = 2 zero, quer se considere a frmula (1
2
1
0
),1
0
ou
log 1
2
log 1
0
. No entanto, a mdia emprica dos retornos discretos
positiva, podendo sugerir, incorrectamente, que o activo se valorizou en-
tre o perodo t = 0 e t = 2. J a mdia emprica dos retornos contnuos
traduz correctamente a valorizao do activo.
O retorno discreto aplicado a um investimento inicial pode sugerir que o
investimento possa vir negativo. Isto uma impossibilidade. Suponha-
se 1
0
= 100. O pior cenrio no perodo 1 1
1
= 0 (perde-se todo o
investimento). Mas, aplicando o retorno discreto pode-se obter 1
1
< 0
se 1
1
< 1. Por exemplo, se 1
1
= 1.0 tem-se
1
1
= (1 1.0) 1
0
= 0.0 100 = .
um impossibilidade obter-se 1
1
< 0 e, este facto, traduz uma fraqueza
terica do modelo de retorno discreto. No caso do retorno contnuo, no
h possibilidade de 1
1
ser negativo, pois, r
1
= log (1
1
) log (1
0
) im-
plica 1
1
= 1
0
c
v
0, por denio.
O retorno discreto conserva, no entanto, uma vantagem aprecivel: o retorno
discreto do portfolio igual soma ponderada dos retornos discretos dos vrios
activos e, esta propriedade, no partilhada, como vimos, pelo retorno contnuo
do portfolio.
2.3. RETORNOS CONTNUOS VS. RETORNOS DISCRETOS 23
t 1
t
1
t
=
1
I
1
I1
1
I1
r
t
= log 1
t
log 1
t1
0 100
1 110 0.10 (10%) 0.0953
2 100 -0.0909 (-9.09%) -0.0953
: cdia 0 = 0
TABELA 1. Retornos discretos no so aditivos - mais um exemplo
CAPTULO 3
Factos Empricos Estilizados de Sries Temporais
Financeiras
conveniente distinguir sries temporais de natureza macroeconmica das de
natureza nanceira. As principais diferenas so as seguintes:
dados de natureza macroeconmica (consumo, produto, taxa de desem-
prego) podem ser observados mensalmente, trimestralmente ou anual-
mente; dados nanceiros, como por exemplo, retornos de aces ou taxas
de cmbio podem ser observados com uma frequncia muito superior;
nalguns casos, com intervalos de minutos ou segundos entre duas obser-
vaes consecutivas;
como consequncia do ponto anterior, o nmero de observaes disponveis
de dados nanceiros situa-se na ordemdas centenas de milhares. Normal-
mente, prefere-se trabalhar com dados dirios (evitando-se os problemas
das microestruturas de mercado); nestes casos trabalham-se com algumas
unidades de milhares de observaes. Com as sries macroeconmicas
raramente se passam das poucas centenas de observaes (quando, na
melhor das hipteses, se tm observaes mensais);
os dados macroeconmicos so menos veis, i.e., esto mais sujeitos
a erros de medio. Com efeito, os valores apurados no resultam de
valores efectivamente observados no mercado, como sucede com a gen-
eralidade das sries nanceiras, mas antes de valores apurados de acordo
com certa metodologia e decorrentes de inquritos preliminares;
todavia, a principal diferena qualitativa decorre das propriedades estats-
ticas dos dois tipos de sries. Ao contrrio das sries macroeconmicas,
as sries nanceiras exibem habitualmente fortes efeitos no lineares e
distribuies no normais. As propriedades estatsticas das sries nan-
ceiras sero estudadas neste captulo.
Vrios estudos empricos tm documentado que h um conjunto de regulari-
dades empricas que so partilhadas por um leque grande de sries temporais nan-
ceiras observadas com frequncia elevada (diria ou semanal). Essas regularidades
tm a ver com caractersticas das distribuies marginais e condicionais que so
comuns a muitas sries temporais nanceiras.
25
26 3. FACTOS EMPRICOS ESTILIZADOS DE SRIES TEMPORAIS FINANCEIRAS
3.1. Regularidade Empricas relacionadas com a Distribuio Marginal
Comece-se por considerar a fdp marginal
1
) de um certo retorno r
t
. Estamos
interessados em saber algo sobre ) (que geralmente desconhecida). Obtm-se
alguma informao sobre ) calculando vrios momentos da amostra. este o pro-
cedimento que comearemos por seguir. Pelo mtodo dos momentos, os parmet-
ros populacionais desconhecidos,
j =
L
(r) , o =
_
Vai (r), :/ =
L
_
(r j)
S
_
o
S
, / =
L
_
(r j)
1
_
o
1
podem ser estimados de forma consistente (sob certas condies de regularidade),
respectivamente, pelos estimadores
r =
a
t=1
r
t
:
, o =
_
a
t=1
(r
t
r)
2
:
,
:/ =
:
1
a
t=1
(r
t
r)
S
o
S
,

/ =
:
1
a
t=1
(r
t
r)
1
o
1
.
Os factos empricos estilizados que descreveremos a seguir envolvem explicita-
mente estes momentos. Concretamente, mostraremos a seguir que
r tende a ser maior do que o retorno do investimento sem risco;
o depende da natureza do activo nanceiro;

:/ tende a ser negativo;

/ tende a ser superior a 3.
3.1.1. Prmio de Risco Positivo. De acordo com a teoria nanceira o valor
esperado do retorno de um investimento no mercado de capitais deve exceder, no
longo prazo, o retorno do investimento sem risco. A essa diferena designa-se
prmio de risco (Equity Risk Premia). Este prmio deve ser positivo pois, caso
contrrio, no haveria motivao para aceitar um investimento com retornos incer-
tos, quando a alternativa um retorno garantido.
A estimao do prmio de risco deve envolver um perodo relativamente longo
(o retorno de um investimento no mercado de capitais estvel no mdio/longo
prazo, mas instvel no curto prazo - pode at ser fortemente negativo em curtos
perodos de tempo). Dimson, Marsh e Staunton (2002) zeram o seguinte exer-
ccio, com base em dados nanceiros norte-americanos: se tivesse sido investido
1 dlar em aces norte americanas (digamos, num ndice representativo do mer-
cado de aces norte-americano) e 1 dlar em bilhetes do tesouro (investimento
sem risco), ambos no incio do ano 1900, quais seriam os retornos desses inves-
timentos ao m de 101 anos (i.e. se fossem levantados no nal do ano 2000).
Os resultados apurados mostram que o investimento de 1 dlar em aces seria
1
Para simplicar, admite-se que ) homognea com respeito ao tempo, i.e., no depende de t.
Desta forma, ) (v
I
) = ) (v
I1
) = ... = ) (v
1
). Como consequncia indiferente escrever ) (v
I
)
ou simplesmente ) (v) (e, por um raciocnio similar, indiferente escrever L(v
I
) ou simplesmente
L(v)).
3.1. REGULARIDADE EMPRICAS RELACIONADAS COM A DISTRIBUIO MARGINAL 27
r
/ o
/

:/

/
`
1([v
I
v[S` o)
1([Z[S)
Cotaes de Aces
Microsoft (01-88 a 7-05) 23.9% 36.3% -.097 6.8 3.85
Coca-Cola (11-86 a 12-05) 7.2% 33.2% -0.97 18.1 4.53
PT (6-95 a 12-05) 12.3% 33.2% -0.06 6.39 5.02
ndices Bolsistas
Dax (11-90 a 11-05) 8.4% 22.1% -0.196 6.66 5.79
CAC40 (03-90 a 11-05) 5.7% 20.5% -0.101 5.77 5.61
Nikkei225 (01-84 a 11-05) 1.6% 20.5% -0.116 10.77 3.71
FTSE100 (04-84 a 11-05) 7.3% 15.8% -0.545 11.12 2.44
PSI20 (01-93 a 03-06) 8.6% 15.8% -0.61 10.9 5.99
Taxas de Cmbio
USD/EUR(12-98 a 11-05) 0.1% 7.9% -0.05 4.86 4.55
YEN/USD (1-71 a 7-05) -3.4% 9.4% -0.78 14.2 1.67
Na ltima coluna assume-se que 7 ~ (0, 1) ; o
/ =
_
20 o100/
TABELA 1. Estatsticas Descritas de Algumas Aces, ndices e
Taxas de Cmbio
vendido por 16797 dlares em 2000 (apesar das inmeras crises econmicas e -
nanceiras durante o sculo, como por exemplo, as duas guerras mundiais, a grande
depresso, os choques petrolferos, etc.), enquanto os bilhetes de tesouro seriam
vendidos por 119 dlares. Os retornos anualizados (usando a frmula 1
) seriam
de 10.1% para as aces, i.e.
1
100/ =
_
(16707)
1
101
1
_
100/ = 10.1/
e de 4.8% para os bilhetes do tesouro (valores nominais, i.e. no descontando a
inao).
Ver Taylor (2005) para mais detalhes sobre o prmio de risco.
3.1.2. Desvios Padro Diferentes Consoante os Activos. A tabela 1 mostra
que os activos com maior variabilidade (e, portanto com maior risco associado) so
os ttulos de empresas, seguidos dos ndices bolsistas e taxas de cmbio (bilhetes do
tesouro - resultados no apresentados - apresentam a menor variabilidade). No m-
bito dos ttulos de aces, vrios estudos indicam (ver por exemplo, Taylor, 2005)
que a variabilidade dos retornos tende a diminuir medida que a dimenso das
empresas aumenta (ttulos de empresas pequenas apresentam maior variabilidade).
3.1.3. Retornos de Aces e de ndices tendem a Apresentar Assimetria
Negativa. A assimetria de uma distribuio normalmente aferida atravs do co-
eciente de assimetria :/ anteriormente denido. Diz-se que a distribuio de r
assimtrica negativa (positiva) se :/ < 0 ( 0). Se :/ = 0 a distribuio
simtrica (em relao mdia populacional).
Podemos ter uma estimativa
:/ negativa se as variaes negativas fortes forem

mais acentuadas do que as variaes positivas fortes. Quando assim sucede, os
desvios negativos (r
t
r)
S
< 0 tendema dominar os desvios positivos (r
t
r)
S
0 na soma
(r
t
r)
S
e, por isso, a estimativa
:/ negativa. Observe-se ainda que

os desvios cbicos so divididos por o
S
; desta forma, elimina-se a possibilidade do
coeciente depender das unidades em que a varivel observada (por exemplo, se
multiplicarmos r por 100, para termos uma medida em percentagem,
:/ no sofre
alterao).
A tabela 1 mostra que as distribuies empricas das rendibilidades de aces e
ndice bolsistas em anlise so assimtricas negativas. Existe, portanto, evidncia
emprica de que as fortes variaes dos preos so maioritariamente de sinal neg-
ativo. Estas variaes so obviamente crashes bolsistas. Sublinhe-se, no entanto,
que alguns retornos de ttulos, por registarem episdios de fortes variaes posi-
tivas, apresentam distribuies assimtricas positiva. A assimetria negativa no ,
portanto, uma caracterstica universal das distribuies de retornos, embora, geral-
mente, tendam a apresentar assimetria negativa.
Sob certas hipteses, incluindo r
t
uma sucesso de v.a. homocedsticas
com distribuio normal, a estatstica de teste
7
1
=
_
:
:/
_
6
tem distribuio assimpttica (0, 1) . A hiptese nula H
0
: :/ = 0 pode ser
testada a partir deste resultado
2
. Mas as hipteses de partida, normalidade e homo-
cedasticidade, so relativamente severas. Na prtica, isto signica que a rejeio de
H
0
pode dever-se ausncia de normalidade e/ou homocedasticidade e no neces-
sariamente falha de simetria da distribuio. Desta forma, necessrio ter algum
cuidado na interpretao dos resultados quando H
0
rejeitada.
O estimador

:/ por vezes criticado por no ser robusto face presena de
valores extremos. Na verdade, em certos casos, a ocorrncia de apenas uma nica
variao negativa excepcionalmente forte pode resultar num valor negativo para
:/ (os ttulos que incluem na sua amostra o crash do dia 19 de Outubro de 1987
tendem a apresentar um valor estimado para :/ negativo). Por esta razo, acon-
selhvel usar-se medidas de assimetria robustas contra a presena de outliers. Uma
medida nestas condies proposta por Groeneveld and Meeden (1984)
:/
GA
=
L
(r)
0.
L
([r
0.
[)
onde
0.
o quantil de ordem 0.5, o que signica que
0.
a mediana. O
parmetro
L
([r
0.
[) fornece uma medida de disperso dos dados. Esta me-
dida tem a vantagem de variar entre -1 e 1, i.e. 1 < :/
GA
< 1. Sob certas
condies, :/
GA
pode ser estimado de forma consistente atravs da estatstica
\
:/
GA
=
r :
:
1
a
t=1
[r
t
:[
2
A nica hiptese nula possvel 1
0
: cI = 0. Por exemplo, no faria sentido testar 1
0
:
cI = 1 porque a estatstica de teste obtida sob a hiptese de normalidade e cI = 1 claramente
incompatvel com essa hiptese.
sendo : a mediana emprica. Outra medida robusta o coeciente de assimetria
de Pearson,
:/
1
=
L
(r)
0.
o
.
Note-se, nalmente, que para as taxas de cmbio no h razo especial para
esperar :/ 0 ou :/ < 0. Com efeito, suponha-se que o
t
a taxa de cmbio do
Dlar/Euro e r
t
= log (o
t
,o
t1
) . Se a distribuio de r
t
assimtrica negativa
ento a distribuio dos retornos associados taxa de cmbio do Euro/Dlar, 1,o
t
(seja r
t
esse retorno) assimtrica positiva, pois
r
t
= log
_
1,o
t
1,o
t1
_
= log
_
o
t
o
t1
_
= r
t
(note-se: se r tem distribuio com assimetria negativa, r tem distribuio com
assimetria positiva). Assim a assimetria positiva ou negativa nas taxas de cmbio
depende da forma como a taxa de cmbio est denida (no podendo, portanto,
inferir-se qualquer regularidade emprica).
3.1.4. Retornos Apresentam Distribuies Leptocrticas. O achatamento
de uma distribuio normalmente aferida atravs do coeciente de achatamento
/ (tambm designado por kurtosis ou curtose). Diz-se que a distribuio )
mesocrtica se / = 8, platicrtica se / < 8 e leptocrtica se / 8. O valor
de referncia 8 o que resulta da distribuio normal (assim, a distribuio normal
ou Gaussiana mesocrtica). Valores altos de

/ (acima de 8) indicam que cer-
tos valores da amostra se encontram muitos afastados da mdia, comparativamente
aos demais valores da amostra. Observe-se que os desvios (r
t
r)
1
so muito sen-
sveis aos valores extremos da amostra. Por exemplo, a existncia de outliers faz
aumentar a estatstica

/. Para ilustrar o impacto dos outliers no valor da estatstica
/, considere-se a gura 3.1. Pode-se observar que varincia da srie j

1
menor
do que a da srie j
2
. No entanto, o valor

/ da srie j
2
de apenas 1.5, ao passo
que o da srie j
1
de 5.5. Os valores da srie j
2
no se encontram, em termos
relativos, muitos afastados da sua mdia. J na srie j
1
h um valor que se destaca
dos demais e que responsvel pelo valor alto de

/. Para compararmos graca-
mente duas sries necessrio estandardiz-las (isto transform-las em sries de
mdia zero e varincia 1). Continuando o exemplo, considere-se agora as mesmas
variveis estandardizadas:
.
1
=
j
1
j
1
o
j
1
, .
2
=
j
2
j
2
o
j
2
.
Na gura 3.2 ambas as sries possuem a mesma varincia, mas agora claro o
valor extremo da srie j
1
Observa-se para a generalidade das sries nanceiras que os retornos muitos
altos e muito baixos ocorrem com maior frequncia do que seria de esperar se os
retornos seguissem uma distribuio normal. Uma forma de conrmar esta ideia
consiste em comparar a estimativa do coeciente de kurtosis (curtose) dos retornos
com o valor 3, que o valor de kurtosis da distribuio normal.
Na generalidade dos casos o coeciente / estimado vem quase sempre (bas-
tante) acima de 3, o que sugere que a distribuio dos retornos (de cotaes, ndice,
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
1 2 3 4 5 6 7 8 9
Y1 Y2
FIGURA 3.1. Qual das duas sries tem kurtosis estimada mais alta?
-2
-1
0
1
2
3
1 2 3 4 5 6 7 8 9
Z1 Z2
FIGURA 3.2. Sries j
1
e j
2
estandardizadas (ver gura 3.1)
taxas de cmbio e mesmo taxas de juro) leptocrtica. Nas guras 3.3 e 3.4 (esta
ltima uma ampliao da gura 3.3) mostra-se a diferena entre uma distribuio
mesocrtica (/ = 8) e uma distribuio leptocrtica (/ 8). A gura 3.4 mostra
claramente por que razo a distribuio leptocrtica tambm designada de dis-
tribuio de caudas pesadas. O ensaio H
0
: / = 8 [j ~ or:a| &j i.i.d] pode
ser conduzido pela estatstica de teste
7
1
=
_
:
_
/ 8
_
_
24
o
(0, 1) .
Por exemplo, para a Microsoft (tabela 1) e sabendo que no perodo considerado se
observaram 441 dados dirios (: = 441) tem-se
.
1
=
_
441
(6.8 8)
_
24
= 1.4.
0
0.1
0.2
0.3
0.4
0.5
-7 -4.5 -2 0.5 3 5.5
Normal
Leptoc.
FIGURA 3.3. Comparao de duas densidades (normal vs. leptocrtica)
0
0.002
0.004
0.006
0.008
0.01
-7 -4.5 -2 0.5 3 5.5
Normal
Leptoc.
FIGURA 3.4. Ampliao da gura 3.3
O valor-p 1 ([7
1
[ 1.4) - 0. Existe forte evidncia contra H
0
.
Podemos tambm conrmar a existncia de caudas pesadas calculando o rcio
1 ([r
t
r[ 8 o)
1 ([7[ 8)
. (3.1)
Se 7 ~ (0, 1) ento 1 ([7[ 8) = 0.0027. Esta , aproximadamente, a prob-
abilidade associada a eventos extremos quando 7 tem distribuio (0, 1). Se a
distribuio de r
t
possusse caudas normais deveramos esperar que
1 ([r
t
L
(r
t
)[ ,o 8) 1 ([7[ 8)
(observe-se que (r
t
r) , o so os retornos estandardizados) e, portanto, o rcio
(3.1) deveria ser aproximadamente igual a um. No entanto, a tabela 1 mostra que
esse rcio tende a ser signicativamente superior a um. Isto sugere que os retornos
muitos altos e muito baixos tendem a ocorrer com maior frequncia do que seria
de esperar se a varivel seguisse uma distribuio normal.
-.3
-.2
-.1
.0
.1
.2
30 40 50 60 70 80 90 00 10
R
-30
-20
-10
0
10
20
30 40 50 60 70 80 90 00 10
Z
Bandas (-3,3)
FIGURA 3.5. Painel Esquerdo: retornos dirios do Dow Jones no
perodo 02/10/1928 a 3/02/2011 (20678 observaes). Painel di-
reito retornos estandardizados, .
t
= (r
t
r) , o
OBSERVAO 3.1.1. Como estimar a probabilidade 1 ([r
t
L
(r
t
)[ ,o 8)
Primeiro substitumos
L
(r
t
) e o =
_
Vai (r
t
) pelas respectivas estimativas con-
sistentes, r e o. Depois, calculamos a proporo de vezes (na amostra) em que
ocorre [r
t
r[ , o 8. Obtm-se assimuma estimativa para 1 ([r
t
L
(r
t
)[ ,o 8) .
Em termos analticos:
1 ([r
t
r[ , o 8) =
1
:
a
t=1
J
[v
I
v[ oS
onde J
[v
I
v[ oS
= 1 se ocorre [r
t
r[ , o 8 e zero no caso contrrio.
Apresenta-se a seguir mais um exemplo envolvendo o rcio (3.1). No painel
esquerdo da gura 3.5 apresentam-se os retornos dirios do Dow Jones no perodo
02/10/1928 a 3/02/2011 (20678 observaes). No painel direito da mesma gura
apresentam-se os retornos estandardizados juntamente com as rectas -3 e 3. Se os
retornos seguissem uma distribuio normal seria de esperar que .
t
= (r
t
r) , o
excedesse os limiares 8 e 8 em cerca de 0.27% das vezes, tendo em conta, como
j vimos, que 1 ([7[ 8) = 0.0027, supondo 7 ~ (0, 1). Ora, na verdade .
t
excede os limiares 3 e -3 em cerca de 1.78/ das observaes (.
t
excede os limiares
359 vezes, em 20678 observaes).
Tem-se assim
1 ([r
t
r[ 8 o)
1 ([7[ 8)
=
0.017
0.0027
= 6.20
Finalmente, podemos ainda testar a hiptese conjunta H
0
: / = 8 & :/ = 0
[assumindo r ~ or:a| & r i.i.d] atravs da estatstica de Bera-Jarque
7
2
1
7
2
2
= :
_
_
_
_
/ 8
_
2
24

:/
2
6
_
_
_
o
2
(2)
-12
-8
-4
0
4
8
-12 -8 -4 0 4 8
Quantis retornos PSI20
Q
u
a
n
t
i
s
N
o
r
m
a
l
FIGURA 3.6. QQ Plot (retornos do PSI20 normalizados)
3.1.4.1. Grco QQ-Plot. Outra forma de compararmos a distribuio normal
com a distribuio dos retornos consiste em analisar o grco QQ-plot. O grco
QQ-plot o grco dos pares ordenados
(
c
,
c
) , c (0, 1)
onde
c
o quantil de ordemc da distribuio 7 ~ (0, 1) (eventualmente outra)
e
c
o quantil da distribuio emprica associada varivel estandardizada
r
t
=
r
t
r
o
,
isto
c
: 1 (7 <
c
) = c, 7 ~ (0, 1)

c
:

1 (r
t
<
c
) = c, r
t
.
Assim, se r
t
tem a mesma distribuio de 7, ento
c
-
c
e o grco
(
c
,
c
) , c (0, 1)
uma recta de 45
c
. Se, pelo contrrio, as distribuies de r
t
e 7 so diferentes o
grco afasta-se da recta de 45
c
(poderamos tambmcomparar a distribuio de r
t
com outra qualquer). A gura 3.6 permite concluir que a distribuio dos retornos
leptocrtica e assimtrica. O grco sugere, por exemplo, que 1 (7 < 8.0)
1 (r
t
< 8). A distribuio leptocrtica pois o grco tem a forma de um S
sobre a recta de 45
c
. A distribuio assimtrica porque o S no simtrico
sobre a recta de 45
c
.
3.1.5. Aumento da Frequncia das Observaes Acentua a No Normali-
dade das Distribuies. Diz-se que a frequncia das observaes aumenta quando,
se passa, por exemplo, de observaes mensais para observaes semanais ou
destas para dirias. A tabela 2 mostra que o coeciente de kurtosis aumenta quando
r o

:/

/
Retornos Dirios
Frankfurt 0.00035 0.0123 -0.946 15.0
Hong Kong 0.00057 0.0169 -5.0 119.24
Londres 0.00041 0.0092 -1.59 27.4
Nova York 0.00049 0.0099 -4.30 99.68
Paris 0.00026 0.0120 -0.53 10.56
Tquio 0.00005 0.0136 -0.213 14.798
Retornos Semanais
Frankfurt 0.00169 0.0264 -1.06 8.09
Hong Kong 0.00283 0.0370 -2.19 18.25
Londres 0.00207 0.0215 -1.478 15.54
Nova York 0.00246 0.0206 -1.37 11.25
Paris 0.0028 0.0284 -0.995 9.16
Tquio 0.00025 0.0288 -0.398 4.897
TABELA 2. ndices Bolsistas (6-Jan-86 a 31-Dez-97)
se passa de observaes semanais para observaes dirias. Assim, a distribuio
marginal dos retornos dirios apresenta um maior afastamento face distribuio
normal. possvel fazer um raciocnio inverso: a diminuio da frequncia das ob-
servaes (por exemplo, quando se passa de observaes dirias para observaes
semanais ou mensais) atenua o afastamento da distribuio dos retornos relativa-
mente distribuio normal. Uma possvel explicao terica para este facto
descrita a seguir.
Sejam 1
0
, 1
1
, 1
2
, ... os preos dirios. Se a frequncia de observaes baixa,
passamos a observar 1
0
, 1
I
, 1
2I
, ... sendo / um inteiro maior do que 1. Por
exemplo, se passarmos para dados semanais (/ = ) passamos a observar 1
0
, 1
,
1
10
, ... (imagine-se que t = 0 uma segunda-feira; passados 5 dias observa-se a
segunda-feira seguinte que corresponde a t = ). Neste caso, os retornos semanais
so:
log 1
I
log 1
0
. .
retorno 1
a
semana
, log 1
2I
log 1
I
. .
retorno 2
a
semana
, ... com / =
Para / geral, o primeiro retorno observado r
1
= log 1
I
log 1
0
. Como os
retornos contnuos so time-additive, resulta
r
1
(/) = log 1
I
log 1
0
= r
1
r
2
... r
I
=
I
i=1
r
i
(r
i
so os retornos dirios). Mesmo que r
i
no tenha distribuio normal, o retorno
associados a uma frequncia de observao mais baixa, r (/) , tender a ter dis-
tribuio normal pelo teorema do limite central. Com efeito, sob certas condies
(relacionadas com a varincia de r
i
e a memria temporal de r) tem-se
I
i=1
r
i
L
_
I
i=1
r
i
_
_
Vai
_
I
i=1
r
i
_
o
(0, 1)
quando /
3
. Para / sucientemente alto resulta
4
I
i=1
r
i
o
~
_
L
_
I
i=1
r
i
_
, Vai
_
I
i=1
r
i
__
.
Assim, espera-se que a diminuio da frequncia amostral atenue a no normali-
dade observada nas sries de retornos de alta frequncia.
3.1.6. Efeitos de Calendrio. Designamos efeitos de calendrio quando a
rendibilidade e/ou a volatilidade varia com o calendrio. Por exemplo, se certo
ttulo regista maior rendibilidade e/ou volatilidade s segundas-feiras, temos um
efeito de calendrio (efeito dia da semana). Tem-se estudado a forma como a
rendibilidade e a volatilidade varia com o dia da semana, dia do ms, com o ms
do ano e com a proximidade dos feriados. Certos autores qualicam estes efeitos
de calendrio como anomalias. Com efeito, se o mercado eciente todas
as anomalias depois de detectadas so rapidamente incorporadas nas decises
dos investidores e, tendem, por isso, a desaparecer. Para ilustrar a ideia, suponha-
se, por exemplo, que a rendibilidade do ttulo ABC tende a aumentar s 14h de
todas as teras-feiras. Todos os investidores que detectem essa anomalia ven-
dem o ttulo da empresa ABC s teras-feiras s 14h. Como resultado o preo
da empresa ABC tenderia a cair por volta dessa hora e a anomalia desaparecia.
De uma forma geral, se os investidores so racionais e dispem de toda a infor-
mao passada sobre o mercado, as anomalias relacionadas com as rendibilidades
dependentes do calendrio, tendem a desaparecer, logo que sejam detectadas. Na
prtica, subsistem certas anomalias que no desaparecem mas que, em geral, no
permitem obter rendibilidades anormais, depois de deduzidos os custos de infor-
mao e transaco. Podem assim permanecer no mercado anomalias ou ine-
cincias para as quais o benefcio de explorar essas inecincias no compensa os
custos adicionais associados.
3.1.6.1. Dia da Semana. partida espera-se que os retornos segunda-feira
sejam um pouco mais altos face aos demais dias da semana, pois a posse de ttulos
segunda-feira representa um investimento de 72 horas face ltima sexta-feira,
tendo em conta que o mercado fecha aos ns-de-semana. Analiticamente observe-
se que se o retorno dirio r
t
tem mdia j ento, para um investimento de 3 dias
(de sexta a segunda-feira) o retorno associado, r
t
r
t1
r
t2
, dever ter mdia
8j. Assim, o retorno segunda-feira deveria ser, em mdia, trs vezes superior
ao retorno dos demais dias da semana. Taylor (2005) reporta vrios estudos com
concluses contraditrias (para certos ttulos e para determinados perodos pos-
svel que o retorno segunda-feira seja mais elevado, mas no se pode concluir em
geral que o retorno s segundas seja necessariamente superior ao dos demais dias
da semana).
3
Se for possvel garantir que L
_
I
.=1
v
.
_
= nL(v
.
) e \ui
_
I
.=1
v
.
_
= Io
2
ento este
resultado pode escrever-se na forma habitual
_
I( v L(v
.
)) o
u
` (0, 1) (quando I o).
4
Observe-se: :
n
u
` (0, 1) se no limite, quando n o, :
1
tem distribuio ` (0, 1) .
Assim, para n razoavelmente alto, :
n
tem distribuio aproximadamente normal, i.e. :
n
a
~ ` (0, 1) .
Por outro lado, um investimento a 3 dias deve ser mais voltil do que um inves-
timento a um dia. Se r
t
tem varincia o
2
e r
t
uma sucesso de v.a. no autocor-
relacionadas, r
t
r
t1
r
t2
, tem varincia igual a 8o
2
. Portanto, espera-se que s
segundas-feiras o retorno apresente maior variabilidade. No entanto, argumenta-se
que a (verdadeira) varincia associada aos retornos de segunda-feira no pode ser
to alta como o valor 8o
2
sugere, pois durante o m-de-semana as notcias que
movimentam o mercado (e produzem volatilidade) so, em geral, escassas e pouco
relevantes. De todo o modo, regista-se, para um nmero considervel de activos,
um aumento de volatilidade segunda-feira.
A melhor forma de testar estes efeitos passa pela modelao ARCH (cap. 8).
Uma forma menos eciente de testar estes efeitos consiste em calcular a mdia e a
varincia dos retornos nos vrios dias da semana. Por exemplo, para analisar se as
mdias dos retornos so iguais nos vrios dias da semana, faz-se a regresso,
r
t
= , c
1
tcr
t
c
2
na
t
c
S
ni
t
c
1
:cr
t
n
t
(3.2)
onde tcr, na, etc. so variveis dummy que assumem o valor um se t corresponde,
respectivamente, a uma tera-feira, quarta-feira, etc. (note-se que o grupo base
a segunda-feira). Sendo o grupo base a segunda-feira, , a mdia do retorno
segunda-feira (
L
(r
t
[ :cq
t
= 1) = ,). Por outro lado, c
i
, para i = 1, ..., 4 repre-
sentam as diferenas da mdia do retorno dos outros dias face segunda-feira (por
exemplo, se c
S
= 0.01 ento o retorno mdio quinta-feira igual a , 0.01 e
c
S
representa a diferena face segunda-feira).
O ensaio H
0
: c
1
= c
2
= ... = c
1
= 0 corresponde a testar a no existncia de
diferenas nas mdias dos retornos dos vrios dias da semana. Aestatstica habitual
para o caso em anlise (em que H
0
estabelece a nulidade de todos os parmetros
com excepo do termo constante)
1 =
1
2
, (/ 1)
(1 1
2
) ,(: /)
onde / o nmero de regressores (incluindo o termo constante) e 1
2
o coeciente
de determinao. Sob H
0
(homocedasticidade e ausncia de autocorrelao) a es-
tatstica 1 tem distribuio 1 (/ 1, : /). Na presena de heterocedasticidade,
os teste t e 1 habituais so invlidos. Uma soluo para este problema consiste
na estimao da equao (3.2) atravs dos modelos da famlia ARCH (veremos
este aspecto no captulo 8). Outra soluo passa pela utilizao de erros padro
robustos (ou da estatstica F robusta) contra a presena de heterocedasticidade
5
.
5
Erros padro (de White) robustos contra heterocedasticidade obtm-se a partir da ma-
trix

\ui
_
^
_
= (X
0
X)
1
X
0
WX(X
0
X)
1
onde W uma matriz diagonal com elementos
_
&
2
1
, ..., &
2
n
_
. A estatstica robusta, na verso do teste de Wald, para ensaiar 1
0
: R =
r,
_
R
^
r
_
0
_
R
\ui
_
^
_
R
0
_
1
_
R
^
r
_
, e tem distribuio assimpttica
2
(q)
onde q
o numero de restries. Nota sobre o programa EVIEWS (verso 6 e 7): a opo White
em Heteroskedasticity consistent coefcient covariance que aparece depois de se seleccionar
Quick/Estimate/Options fornece no output erros padro robustos, mas no, infelizmente, a estatstica
F robusta. possvel obter esta estatstica robusta fazendo o seguinte: escolhe-se a opo White
em Heteroskedasticity consistent coefcient covariance e estima-se o modelo. Em seguida realiza-
se o teste Wald seleccionando View/Coefcient Tests/Wald, introduzindo-se depois as restries a
ensaiar.
-8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8
0.001
0.002
0.003
0.004
0.005
0.006
0.007
0.008
0.009
0.010
x
f(x)
FIGURA 3.7. Abas da t-Student ( = 4.1, - - = , = 80)
Em Taylor (2005) descrevem-se outras anomalias associadas ao calendrio.
3.1.7. Distribuies Tericas para os Retornos.
3.1.7.1. Distribuio t-Student. bem conhecida a distribuio t-Student com
graus de liberdade, t () . A fdp
) (r) =
I
_
1
2
_
_
I
_
2
_
_
1
r
2
r+1
2
.
Como se sabe, se A ~ t () , ento
L
(A) = 0, Vai (A) = , ( 2), :/ =
0 e / = 8 6, ( 4) . Como / 8 conclui-se que a distribuio t () tem
caudas pesadas. Por vezes tem interesse trabalhar com uma varivel aleatria -
com distribuio t-Student de mdia zero mas varincia igual a um. Se A ~ t ()
a soluo passa pela transformao
- = A
_
( 2) ,.
fcil constatar que Vai (-) = 1, /
.
= /
a
= 8
6
1
. Note-se que a fdp de -
q (r) =
1
_
( 2)
I
_
1
2
_
I
_
2
_
_
1
r
2
2
_
r+1
2
.
Quando mais baixo for o nmero de graus de liberdade mais pesadas so as caudas.
No caso = 4 o momento de ordem 4 no existe e, portanto, tambm no existe o
coeciente de kurtosis (quer dizer, neste caso, o integral imprprio
_
R
r
1
q (r) dr
no nito porque a expresso r
1
q (r) no tende para zero comsuciente rapidez).
3.1.7.2. Mistura de Normais. Considere-se uma distribuio mistura de nor-
mais: c100/ de
_
j
1
, o
2
1
_
e (1 c) / de
_
j
2
, o
2
2
_
. Por exemplo, imagine-
se que se faz uma extraco de nmeros aleatrios da seguinte forma: atira-se
uma moeda ao ar. Se cair caras simula-se uma varivel A
1
com distribuio
_
j
1
, o
2
1
_
; se cair coroas, simula-se A
2
com distribuio
_
j
2
, o
2
2
_
. De uma
forma geral, a varivel A, que representa a mistura de normais, pode escrever-se
da seguinte forma:
A = lA
1
(1 l) A
2
,
onde l tem distribuio de Bernoulli. Sejam ), )
&
e )
a[&
respectivamente a fdp
de A, a funo de probabilidade de l e a fdp condicional de A dado l = n.
Para obter a fdp de A usa-se a expresso bem conhecida da estatstica: ) (r) =
1
&=0
)
a[&
(r[n) )
&
(n). A distribuio de A dado l = n imediata, tendo em
conta que uma soma de normais ainda uma normal:
A[l = n ~ (
L
(A[l = n) , Vai (A[l = n)) ,
onde
L
(A[l = n) = nj
1
(1 n) j
2
Vai (A[l = n) = n
2
o
2
1
(1 n)
2
o
2
1
2n(1 n) Cov (A
1
, A
2
)
Assim, )
a[&
(r[n) a funo de densidade da normal de mdia
L
(A[l = n) e
varincia Vai (A[l = n). Desta forma,
) (r) = c)
a[&
(r[0) (1 c) )
a[&
(r[1) , 0 _ c _ 1
sendo )
a[&
(r[0) a fdp da distribuio
_
j
1
, o
2
1
_
e )
a[&
(r[1) a fdp da distribuio
_
j
2
, o
2
2
_
. No exemplo da moeda ao ar, c 0.5. interessante observar que
uma mistura de normais conduz a uma distribuio no normal. Em particular a
mistura pode ser assimtrica e leptocrtica. Com efeito, pode-se mostrar que,
L
(A) = cj
1
(1 c) j
2
;
Vai (A) = co
2
1
(1 c) o
2
2
c(1 c) (j
1
j
2
)
2
;
L
_
(A
L
(A))
S
_
= c(1 c) (j
1
j
2
)
_
(1 2c) (j
1
j
2
)
2
8
_
o
2
1
o
2
2
_
_
;
/ = 8
Sc(1c)(o
2
1
o
2
2
)
2
(co
2
1
(1c)o
2
2
)
2
8 supondo, para simplicar, que j
1
= j
2
=
0.
Na gura 3.8 representa-se ) (r) para c = 0., j
1
= 1, j
2
= 1, o
1
= 1,,
o
2
= . A fdp traada assimtrica e leptocrtica.
3.1.7.3. Distribuio com Caudas de Pareto. A fdp de Pareto
q (j) = cc
c
j
(c1)
, j c.
primeira vista pode parecer que esta distribuio no serve pois o nosso ob-
jectivo modelar os retornos e o espao de estados desta varivel claramente
R (os retornos podem assumir qualquer valor em R). Ora, sucede que q apenas
est denida para j c (e, portanto, no atribui probabilidades quando j < c).
No entanto, o que procuramos neste momento caracterizar probabilisticamente
os eventos extremos, i.e. os eventos que se encontram bem afastados da mdia.
-5 -4 -3 -2 -1 0 1 2 3 4 5
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
x
f(x)
FIGURA 3.8. Mistura de Normais
Estamos, portanto, concentrados nas abas da distribuio e, para o efeito, o que
relevante o que se passa para j c.
Diz-se que uma fdp ) (j) tem distribuio com caudas de Pareto (mesmo que
no seja uma distribuio de Pareto) se
) (j) ~ Cj
(c1)
, c 0
(C uma constante). O sinal ~ signica aqui que
lim
jo
) (j) ,Cj
(c1)
= 1.
Esta ltima equao diz-nos que para valores grandes de j, ) (j) praticamente
igual a Cj
(c1)
(no limite igual). Para valores pequenos de j, ) (j) pode
ser completamente diferente de Cj
(c1)
. A similaridade est nas caudas, quando
j (existem denies mais gerais, baseadas em funes slowly varying at
). Pode-se concluir que ) (j) tem um decaimento polinomial para zero (decai-
mento lento para zero) e, portanto, caudas pesadas. J a distribuio normal temum
decaimento exponencial (recorde-se que no caso Gaussiano, ) (j) = C oxp
_
j
2
,2
_
)
e a fdp tende para zero muito rapidamente quando j tende para . A gura 3.9
compara uma cauda Gaussiana com uma cauda de Pareto.
Uma vez que a fdp com caudas pesadas do tipo ) (j) ~ Cj
(c1)
no tende
rapidamente para zero, certos valores esperados podem no existir. De facto, se
c < / ento os momentos de ordem igual ou superior a / no existem. Com
efeito, seja 1 o espao de estados de j
t
(valores que j pode assumir). Para um
2.0 2.5 3.0 3.5 4.0 4.5 5.0
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
y
fdp
FIGURA 3.9. Cauda de Pareto vs. Cauda Gaussiana
certo c 1 e c 0, vem:
L
_
[j
t
[
I
_
=
_
1
[j[
I
) (j) dj
_
_
o
c
[j[
I
) (j) dj
=
_
o
c
[j[
I
Cj
(c1)
dj
= C
_
o
c
[j[
c1I
dj =
se c1/ 1, ou seja, se c < /. Por exemplo, Vai (j
t
) no existe se c < 2.
Estimador de Hill. Suponha-se ) (j) ~ Cj
(c1)
. Como estimar c Antes de
propormos um estimador para c, admita-se um cenrio mais simples: ) (j) tem
distribuio (exacta) de Pareto, j ~ 1arcto (c, c) , ou seja
) (j) =
cc
c
j
c1
, j c.
Assuma-se que j
t
; t = 1, 2, ..., : uma sucesso de v.a. i.i.d. com distribuio
de 1arcto (c, c) . A funo de log-verosimilhana corresponde expresso
log 1(c, c) =
a
t=1
log ) (j
t
) = :log (c) :log (c) (c 1)
a
t=1
log (j
t
) .
Diferenciando log 1 com respeito a c e igualando a zero obtm-se
c =
:
a
t=1
log (j
t
,c)
. (3.3)
c
a
maximizante, pois 0
2
log 1,0
2
c = :,c
2
< 0. Tem-se ainda
_
:( c
a
c)
o
_
0, 1 (c)
1
_
onde
1 (c
0
) =
L
_
0
2
log ) (j
t
)
0c
2
_
=
1
c
2
.
O estimador de mxima verosimilhana de c c = min
t=1,...,a
j
t
6
Retome-se agora a hiptese ) (j) ~ Cj
(c1)
. Se uma distribuio tem cau-
das de Pareto, mas no uma distribuio de Pareto, ento o estimador para c
acima apresentado no pode ser utilizado. Nestas circunstncias, se estamos ape-
nas interessados em estimar o ndice de cauda c (supondo que j tem distribuio
com caudas de Pareto, mas no segue essa distribuio), devemos aparar a amostra
j
t
; t = 1, 2, ..., : , por exemplo, considerando apenas os dados j
t
tais que j
t

(onde pode ser interpretado como um quantil de j, geralmente um quantil de or-
dem superior a 0.95). Analisa-se, portanto, o comportamento de j apenas para os
valores muitos altos (ou muito baixos) de j.
O estimador de c, designado por estimador de Hill, para a aba direita da dis-
tribuio
c() =
:()
a
t=1
log (j
t
,) J
j
I
q
, :() =
a
t=1
J
j
I
q
(3.4)
onde J
j
I
q
= 1 se j
t
e J
j
I
q
= 0 no caso contrrio. Pode-se pensar
neste estimador como se fosse o estimador (3.3), mas aplicado apenas aos valores
da amostra que vericam j
t
.
Oestimador de c para a aba esquerda da distribuio o que resulta da equao
(3.4) depois de se substituir J
j
I
q
por J
j
I
<q
, sendo agora um quantil de
ordem 0.05 ou inferior.
Pode-se mostrar
_
:() ( c() c())
o
_
0, c
2
_
,
quando : , :() e :() ,: 0. Observe-se Vai ( c()) = c
2
,:() .
Como c desconhecido podemos tomar como estimador de Vai ( c()) a ex-
presso c
2
,:() . Estes resultados assimptticos so obtidos num contexto i.i.d.
Kearns e Pagan (1997) mostram todavia que a varincia assimpttica de c aumenta
consideravelmente na presena de dependncia.
EXEMPLO 3.1.1. Resulta do quadro seguinte que c(0.01) = 8,.108 = 0.77
6
Embora a derivada da funo log 1(c, c) com respeito a c no se anule (verique), pode-se
concluir que no intervalo de valores admissveis de c, isto , c nin
I=1,...,n
|
I
, a funo log 1
(xado c) atinge o mximo em c = nin
I=1,...,n
|
I
.
j
t
J
j
I
0.01
log (j
t
,0.01) J
j
I
0.01
-0.110 0 0
0.090 1 2.197
0.100 1 2.303
-0.100 0 0
0.020 1 0.693
0.005 0 0
3 5.193
Qual o valor do threshold que devemos escolher Temos um dilema de
enviesamento versus varincia:
se alto a estimao de c() baseada em poucas observaes, i.e.,
:() baixo, pelo que a varincia de c() alta (observe-se Vai ( c()) =
c
2
,:());
se baixo, perde-se a hiptese ) (j) ~ Cj
(c1)
e, como consequn-
cia, o estimador c() enviesado e mesmo inconsistente (recorde-se que
c() baseado na hiptese ) (j) ~ Cj
(c1)
).
EXEMPLO 3.1.2. Na tabela seguinte apresentam-se estimativas do ndice da
cauda de retornos bolsistas sectoriais do mercado norte-americano no perodo
03/1/1994 a 21/01/2011 (4292 observaes).
Aba Esq. Aba Dir.
c(
0.0.02
) c(
0.97
) Retorno Volat. Skew. Kurt.
obs.efect.usadas: 108 108 Anual. Anual.
Petrleo e Gs 2.29 3.16 9.45% 25.79% -0.25 13.98
Matrias-Primas 2.81 3.15 6.77% 25.90% -0.29 10.32
Indstria 2.91 3.00 7.42% 21.90% -0.25 8.441
Consumo (bens) 3.37 2.93 2.34% 19.82% -0.15 9.025
Sade 2.90 3.52 7.12% 17.29% -0.08 11.44
Comunicaes 3.10 3.26 1.37% 22.31% 0.09 9.962
Utilities 3.06 2.78 1.86% 19.10% 0.04 14.19
Financeiras 2.68 2.37 5.02% 29.02% -0.10 15.58
Tecnologia 3.77 3.07 9.42% 30.44% 0.16 7.065
Fonte: Datastream
Algumas concluses podem ser retiradas:
Em todos os casos razovel admitir que a varincia existe. Os momen-
tos de ordem 4 podem no existir.
Os ndices de cauda estimados so relativamente baixos o que sugere
que existe uma massa de probabilidade considervel associada a valores
extremos na amostra.
3.1.8. Estimao No Paramtrica da Funo Densidade de Probabili-
dade. A forma mais simples de estimar ) (r) consiste em obter o histograma das
FIGURA 3.10. Estimativa da fdp dos retornos do DowJones no
perodo Out/1988-Jan/2010 e fdp normal de mdia e varincia es-
timadas a partir dos retornos
frequncias relativas. Existem, no entanto, estimadores preferveis. Uma estima-
tiva no paramtrica de ) (r) pode ser dada por
) (r) =
1
:/
a
i=1
1
_
r r
i
/
_
onde 1 (n) uma fdp. Sob certas condies, incluindo / 0, : , :/
pode-se provar

) (r)
j
) (r) . Na gura 3.10 apresenta-se uma estimativa no
paramtrica da fdp marginal dos retornos do Dow Jones no perodo Out/1988-
Jan/2010 (na verdade, esto representadas vrias estimativas: ) (r
1
) , ) (r
2
) , ..., ) (r
I
) ,
sendo r
I
uma sucesso de valores igualmente espaado no intervalo (0.07; 0.06)
- veja-se o eixo das abcissas da gura 3.10). Na gura representa-se tambm a fdp
da
_
r, o
2
_
onde r e o
2
so as estimativas dos dois primeiros momentos dos
retornos do Dow Jones no perodo considerado.
Comparando

) com a densidade normal, conclui-se que

) atribui maior massa
de probabilidade na vizinhana da mdia emprica e nos intervalos associados aos
valores extremos da amostra, e atribui reduzida massa de probabilidade no inter-
valo dos valores moderados da amostra, digamos no intervalo (0.08, 0.01) e
(0.01, 0.08).
3.2. Regularidade Empricas relacionadas com a Distribuio Condicional
Neste ponto discutimos regularidades que envolvem especicaes dinmicas
relacionadas com a distribuio condicional dos retornos ou de uma funo dos
retornos (por exemplo, veremos como o retorno depende dos seus valores passados,
ou como o quadrado dos retornos depende do quadrado dos retornos passados,
entre outras especicaes).
3.2.1. Autocorrelaes Lineares Baixas entre os Retornos. A correlao
entre as variveis A e 1 dada por
j =
Cov (A, 1 )
_
Vai (A) Vai (1 )
, 1 _ j _ 1.
O coeciente j mede o grau de associao linear entre 1 e A. Quanto mais alto
for [j[ maior a relao entre A e 1. Podemos tambm medir a associao linear
entre j
t
e j
t1
ou entre j
t
e j
t2
etc.
j
c
=
Cov (j
t
, j
tc
)
_
Vai (j
t
) Vai (j
tc
)
Como j
c
pode ser visto como uma funo de :, j
c
designado por funo de
autocorrelao (FAC) (ou ACF em ingls). Se assumirmos Vai (j
t
) = Vai (j
tc
)
vem
j
c
=
Cov (j
t
, j
tc
)
_
Vai (j
t
) Vai (j
tc
)
=
Cov (j
t
, j
tc
)
_
(Vai (j
t
))
2
=
Cov (j
t
, j
tc
)
Vai (j
t
)
.
Pelo mtodo dos momentos, a estimao de j
c
pode fazer-se atravs do estimador
j
c
=
1
ac
a
t=c1
(j
t
j) (j
tc
j)
1
a
a
t=1
(j
t
j)
2
.
O coeciente j
c
pode ser tambm obtido no contexto do modelo de (auto)regresso
j
t
= c j
c
j
tc
n
t
onde se admite que n
t
uma sucesso de v.a. independentes e
L
(n
t
[ j
tc
) = 0.
O rcio-t associado estimativa de j
c
permite ensaiar H
0
: j
c
= 0. Em alternativa
temos os seguintes testes standard vlidos sob a hiptese i.i.d.
Teste Kendal e Stuart H
0
: j
I
= 0
_
:( j
I
1,:)
o
(0, 1) , j
I
-
_
1
:
,
1
_
:
_
Rejeita-se H
0
ao nvel de signicncia de (aprox.) 5% se [ j
I
[ 2,
_
: (supondo
1,: - 0).
Teste Ljung-Box H
0
: j
1
= ... = j
n
= 0
Q
n
= :(: 2)
n
I=1
1
: /
j
2
I
o
2
(n)
3.2. REGULARIDADE EMPRICAS RELACIONADAS COM A DISTRIBUIO CONDICIONAL 45
FIGURA 3.11. Funes de autocorrelao dos retornos dirios
(Microsoft 1986-2006)
Em geral os coecientes de autocorrelao dos retornos so baixos. Na gura
3.11 as estimativas da FAC dos retornos dirios da Microsoft 1986 a 2006 so
relativamente baixas.
Imagine-se uma situao hipottica em que se tem um coeciente de corre-
lao negativo e alto (em mdulo), por exemplo, j
1
= 0.0, para dados dirios.
Suponha-se ainda, para simplicar a anlise, que
L
(r
t
) = 0. Se o retorno hoje
positivo, amanh o retorno tender a ser negativo e vice-versa. Nestas circunstn-
cias, se o retorno hoje alto vende-se hoje e compra-se amanh. Existe, portanto,
uma forte possibilidade de ganho (arbitragem) com base na observao passada
dos preos. Se outros participantes do mercado compram e vendem com base
neste padro de autocorrelao, o processo de arbitragem reduzir rapidamente a
correlao (se o retorno hoje alto e positivo muitos participantes vendem hoje e
compram amanh; como consequncia o preo tender a diminuir hoje e aumen-
tar amanh e a correlao tender a esbater-se). Portanto, no credvel, supor-se
j
1
= 0.0.
Retome-se a gura 3.11. A coluna Q-Stat fornece os valores de Q
n
para
: = 1, ..., 20. Fixe-se por exemplo, : = 20. Tem-se Q
20
= 86.618. O valor-p
associado zero, isto , 1 (Q
20
86.618) = 0.018. Logo existe evidncia contra
a hiptese nula H
0
: j
1
= ... = j
20
= 0. Esta concluso parece contraditria com
a ideia de baixas autocorrelaes dos retornos. No entanto, preciso observar o
seguinte:
FIGURA 3.12. Funes de autocorrelao dos retornos dirios es-
tandardizados (Microsoft 1986-2006)
em amostras muito grandes, como aquela que analisamos, qualquer pe-
queno desvio face hiptese nula implica a sua rejeio;
os coecientes estimados embora (paream) estatisticamente signica-
tivos esto, ainda assim, muito perto de zero e no oferecem informao
suciente para realizar mais-valias anormais (depois de deduzidos os cus-
tos de transaco e informao);
os testes foram utilizados sob a hiptese irrealista de os retornos serem
i.i.d. Esta suposio no vlida sobretudo devido presena de hetero-
cedasticidade condicionada.
Uma forma de mitigar a presena de heterocedasticidade consiste emestandard-
izar os retornos,
r
+
t
=
r
t
r
o
t
onde o
t
uma estimativa da volatilidade no momento t (r
+
t
pode ser encarado como
os retornos expurgados de heterocedasticidade). Como obter o
t
Discutiremos
esta questo com alguma profundidade no captulo 8. suciente agora usar uma
especicao relativamente simples (mas subptima):
o
2
t
= (1 `) r
2
t1
` o
2
t1
, ` = 0.06
Na gura 3.12 apresentam-se os coecientes de autocorrelao de r
+
t
. Observa-
se que os coecientes de autocorrelao continuam muitos baixos mas agora no
existe evidncia contra a hiptese j
1
= ... = j
20
= 0.
FIGURA 3.13. Funes de autocorrelao de j
t
=
log (G1
t
,G1
t1
) onde GNP o PIB dos EUA (dados
trimestrais de 1947 a 2003).
Sries macroeconmicas geralmente exibemmoderada ou forte autocorrelao.
Veja-se, por exemplo, a gura 3.13 onde se representa a FACde j
t
= log (G1
t
,G1
t1
)
sendo GNP (Gross National Product) o PIB dos EUA (dados trimestrais de 1947 a
2003).
3.2.2. Volatility Clustering. J vimos que valores muitos altos e muito baixos
ocorrem frequentemente (com maior frequncia do que seria de esperar se as var-
iveis seguissem uma distribuio normal). Este valores extremos no ocorrem
isoladamente: tendem a ocorrer de forma seguida (volatility clustering). Na gura
3.14 representam-se os retornos dirios associados ao ndice Dow Jones (1926-
2006). Na gura 3.15 apresentam-se os mesmos retornos mas agora dispostos por
ordem aleatria no tempo. Algumas estatsticas destas duas sucesses so obvia-
mente iguais (mdia, desvio padro, coecientes de assimetria e de achatamento).
No entanto existem diferenas signicativas. S no verdadeiro cronograma (gura
3.14) aparece uma das propriedades mais importantes dos retornos: fortes (baixas)
variaes so normalmente seguidas de fortes (baixas) variaes em ambos os sen-
tidos (volatility clustering)
-0.3
-0.25
-0.2
-0.15
-0.1
-0.05
0
0.05
0.1
0.15
0.2
O
c
t
-
2
8
M
a
y
-
3
2
D
e
c
-
3
5
J
u
l
-
3
9
F
e
b
-
4
3
S
e
p
-
4
6
A
p
r
-
5
0
N
o
v
-
5
3
J
u
n
-
5
7
J
a
n
-
6
1
A
u
g
-
6
4
M
a
r
-
6
8
O
c
t
-
7
1
M
a
y
-
7
5
D
e
c
-
7
8
J
u
l
-
8
2
F
e
b
-
8
6
S
e
p
-
8
9
A
p
r
-
9
3
N
o
v
-
9
6
J
u
n
-
0
0
J
a
n
-
0
4
FIGURA 3.14. Retornos dirios do Dow Jones (1928-2006)
-0.3
-0.25
-0.2
-0.15
-0.1
-0.05
0
0.05
0.1
0.15
0.2
FIGURA 3.15. Retornos dirios do Dow Jones dispostos por or-
dem aleatria
Se fortes (baixas) variaes so normalmente seguidas de fortes (baixas) vari-
aes em ambos os sentidos, ento r
2
t
deve estar correlacionado
7
com r
2
ti
(i =
1, 2, ...).
A gura 3.16, onde se apresentam as funes de autocorrelao de r
2
t
, onde r
o retorno associado ao ndice Dow Jones, conrma esta ideia.
Nesta seco identica-se o quadrado do retorno com a volatilidade. No
inteiramente correcta esta analogia, embora seja admissvel associar-se momen-
tos de grande (baixa) volatilidade a valores altos (baixos) de r
2
t
. De qualquer
7
Esta correlao poderia, em princpio, dever-se presena de uma mdia condicional no con-
stante. Por exemplo, se v
I
seguisse um MA(1), v
I
= cv
I1
&
I
, onde &
I
um rudo branco,
ento, por construo, ter-se-ia Coii
_
v
2
I
, v
2
I1
_
0. Se fosse este o caso, a melhor forma de con-
tinuarmos com o nosso argumento seria centrar v
I
, usando a mdia condicional, i.e. tomaramos
` v
I
= v
I
j
I
. Viria agora Coii
_
` v
2
I
, ` v
2
I1
_
= 0 se v
I
fosse genuinamente um MA(1); no caso
contrrio, se Coii
_
` v
2
I
, ` v
2
I1
_
0, teramos evidncia em favor do nosso argumento. Todavia, a
centragem ` v
I
= v
I
j
I
desnecessria, pois em sries nanceiras de aces ou de ndices de aces
a mdia condicional , geralmente, aproximadamente igual a uma constante.
FIGURA 3.16. Funes de autocorrelao dos quadrados dos re-
tornos (Dow JOnes)
forma, a principal concluso mantm-se: fortes (baixas) variaes so normal-
mente seguidas de fortes (baixas) variaes em ambos os sentidos e identicamos
este fenmeno como volatility clustering.
3.2.3. Forte Dependncia Temporal da Volatilidade. Nos pontos precedentes
observmos o seguinte: (1) valores muitos altos e muito baixos ocorrem frequente-
mente e (2) estes valores extremos aparecem de forma seguida (volatility cluster-
ing). Neste ponto refora-se a ideia de volatility clustering: no s os valores
extremos tendem a aparecer de forma seguida como tambm h alguma persistn-
cia neste fenmeno. Isto , se a volatilidade alta (baixa), ento razovel esperar
que a volatilidade se mantenha alta (baixa) durante bastante tempo. Na gura 3.17
apresentam-se os retornos dirios do Dow Jones no perodo Janeiro de 1928 a
Fevereiro de 2006. Esto identicados alguns perodos de grande volatilidade.
Estes perodos prolongam-se por vrios anos!
Para conrmarmos a ideia de forte dependncia temporal da volatilidade de-
veramos calcular a FAC da volatilidade. Como a estimao da volatilidade cabe
num captulo posterior, tomamos agora como proxy da volatilidade o valor absoluto
dos retornos [r
t
[ (tambmpoderamos considerar r
2
t
, como zemos no ponto prece-
dente). Calcule-se, assim, a FAC associado aos valores absolutos dos retornos do
Dow Jones no perodo acima considerado. A gura 3.18 mostra que a FAC de [r
t
[
apresenta um decaimento lento para zero, sugerindo forte dependncia temporal da
volatilidade. interessante observar que a autocorrelao entre, por exemplo, [r
t
[ e
-0.15
-0.1
-0.05
0
0.05
0.1
0.15
0.2
O
c
t
-
2
8
A
p
r
-
3
1
O
c
t
-
3
3
A
p
r
-
3
6
O
c
t
-
3
8
A
p
r
-
4
1
O
c
t
-
4
3
A
p
r
-
4
6
O
c
t
-
4
8
A
p
r
-
5
1
O
c
t
-
5
3
A
p
r
-
5
6
O
c
t
-
5
8
A
p
r
-
6
1
O
c
t
-
6
3
A
p
r
-
6
6
O
c
t
-
6
8
A
p
r
-
7
1
O
c
t
-
7
3
A
p
r
-
7
6
O
c
t
-
7
8
A
p
r
-
8
1
O
c
t
-
8
3
A
p
r
-
8
6
O
c
t
-
8
8
A
p
r
-
9
1
O
c
t
-
9
3
A
p
r
-
9
6
O
c
t
-
9
8
A
p
r
-
0
1
O
c
t
-
0
3
FIGURA 3.17. Retornos dirios do Dow Jones (Jan-1928 a Fev-2006)
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
1 76 151 226 301 376 451 526 601 676 751 826 901 976
FIGURA 3.18. FAC de [r
t
[ onde r
t
o retorno dirio do Dow
Jones (Jan. 1928 a Fev. 2006)
[r
t00
[ se situe ainda prximo de 0.1 (observe-se que o desfasamento corresponde
aproximadamente a dois anos).
Para processos ARMA e processos de Markov em geral, o decaimento da FAC
do tipo
[j
I
[ _ Ca
I
, 0 < C < , 0 < a < 1.
0 10 20 30 40 50 60 70 80 90 100
0.0
0.2
0.4
0.6
0.8
1.0
k
Rho
FIGURA 3.19. Decaimento Exponencial (0.0
I
) vs. Hiperblico (/
0.
)
Tem-se, portanto, um decaimento exponencial
8
. A gura 3.18 no sugere um de-
caimento exponencial; sugere antes um decaimento hiperblico da FAC que uma
caracterstica de processos de memria longa. Concretamente, um decaimento
hiperblico da FAC do tipo
[j
I
[ - C [/[
o
, , 0
Por exemplo, com j
I
= 1,/ (, = 1) tem-se um decaimento hiperblico (veja-se a
gura 3.19).
3.2.4. Efeito Assimtrico. Tem-se observado existir alguma correlao entre
a volatilidade e a ocorrncia de perdas signicativas nos mercados de capitais.
Designa-se esta relao por efeito assimtrico (ou leverage effect).
Concretamente, quando r
t1
< 0 espera-se, em mdia, um aumento de volatil-
idade para o perodo seguinte. Se tomarmos como proxy da volatilidade a varivel
[r
t
[ ou r
2
t
devemos esperar que Coii (r
t1
, [r
t
[) < 0 ou Coii
_
r
t1
, r
2
t
_
< 0. A
tabela 3 parece conrmar a existncia de um efeito assimtrico apenas para ndices
bolsistas (e, por extenso, tambm para cotaes de aces) mas no para taxas de
cmbio (a justicao pode ver-se no ponto 3.1.3).
Veremos no captulo 8 uma forma bastante mais eciente de estimar o efeito
assimtrico e de testar se os coecientes so ou no estatisticamente signicativos.
No obstante, uma forma expedita de vericar se os coecientes so estatistica-
mente signicativos consiste em fazer a regresso de r
2
t
sobre r
t1
,
r
2
t
= ,
0
,
1
r
t1
n
t
(3.5)
e depois ensaiar H
0
: ,
1
= 0 contra H
1
:,
1
< 0. Com efeito, na equao anterior,
,
1
representa ,
1
= Cov
_
r
t1
, r
2
t
_
, Vai (r
t1
) . Desta forma, ,
1
< 0 implica
Coii
_
r
t1
, r
2
t
_
< 0.
8
Pode parecer estranho dizer-se que a funo Co
I
apresenta um decaimento exponencial para
0 < C < oe 0 < o < 1. Mas observe-se, para C = 1 (simplicando), que o
I
= c
log a
k
= c
I log a
e tem-se assim um decaimento exponencial, em funo de I, dado que log o < 0.
ndices Bolsistas
[
Coii
_
r
t1
, r
2
t
_
Amesterdo -0.049
Frankfurt -0.095
Hong Kong -0.081
Nova York -0.199
Taxas de Cmbio
Libra Britnica 0.074
Dlar Canadiano 0.041
Yen -0.008
Franco Suo 0.014
TABELA 3. Efeito Assimtrico
Como a heterocedasticidade est invariavelmente presente nas sries tempo-
rais nanceiras, convm empregar erros padro robustos contra heterocedastici-
dade (uma possibilidade neste sentido a utilizao da matriz de White). Recorda-
se que, sob condies gerais, a heterocedasticidade no afecta a consistncia do
estimador OLS (afecta sim, como vimos, os erros padro).
O efeito assimtrico , por vezes identicado como leverage effect depois de
Black em 1976 ter notado que a volatilidade aumenta quando o mercado cai e
o rcio de endividamento (leverage ratio) aumenta. No entanto, vrios autores
tm salientado que o leverage muito reduzido quando comparado com o efeito
assimtrico. Vrias explicaes tm sido propostas para o efeito assimtrico.
Uma explicao designada por volatility feedback effect baseia-se na seguinte
ideia. Quando a volatilidade de uma activo aumenta, o risco agrava-se,
e a rendibilidade exigida para esse activo aumenta. Isto signica que o
activo menos atractivo e, portanto, a sua procura diminui, fazendo cair
o respectivo preo. Esta explicao pressupe que o aumento da volatili-
dade precede a queda do preo (isto , esquematicamente, o
2
t1
=| 1
t
,
podendo t aqui ter uma interpretao intra-diria). Contudo, o facto es-
tilizado envolve a implicao contrria, | 1
t1
= o
2
t
(a diminuio do
preo que precede o aumento da volatilidade).
Outra explicao sustenta que o efeito assimtrico deve-se existncia
de investidores naives (uninformed traders) que vendem os seus ttulos
quando o mercado est cair. Este comportamento conduz no s a uma
queda mais acentuada do preo como tambm a um aumento de volatili-
dade.
Outra possibilidade a seguinte. A diminuio do preo aumenta o risco
de mercado (dado que o centro de gravidade da distribuio condicional
dos retornos de desloca para a esquerda). O aumento do risco obriga
a ajustamentos imediatos no portfolio (atravs de compras e vendas de
activos que faam a cobertura do risco perdido). Este acrscimo da ac-
tividade nos mercados nanceiros aumenta a volatilidade. J variaes
positivas nos preos no tm o mesmo impacto sobre o risco e, como tal,
ajustamentos no portfolio no so prementes.
1000
2000
3000
4000
5000
6000
7000
1990 1992 1994 1996 1998 2000 2002 2004 2006
CAC
1000
2000
3000
4000
5000
6000
7000
8000
9000
1990 1992 1994 1996 1998 2000 2002 2004 2006
DAX
0
1000
2000
3000
4000
5000
6000
1990 1992 1994 1996 1998 2000 2002 2004 2006
DJ EURO STOXX 50
1000
2000
3000
4000
5000
6000
7000
1990 1992 1994 1996 1998 2000 2002 2004 2006
FTSE 100
2000
4000
6000
8000
10000
12000
14000
16000
1990 1992 1994 1996 1998 2000 2002 2004 2006
PSI20
200
400
600
800
1000
1200
1400
1600
1990 1992 1994 1996 1998 2000 2002 2004 2006
S&P 500
FIGURA 3.20. ndices Bolsistas
3.2.5. Aumento da Frequncia das Observaes Acentua a No Lineari-
dade. Vrios estudos indicam que os coecientes de autocorrelaes de r
2
t
e de
[r
t
[ tendem a aumentar com o aumento da frequncia das observaes.
3.2.6. Co-Movimentos de Rendibilidade e Volatilidade. Ao se analisarem
duas ou mais sries nanceiras de retornos ao longo do tempo, geralmente observam-
se co-movimentos de rendibilidade e volatilidade, isto , quando a rendibilidade
e a volatilidade de uma srie aumenta (diminui), a rendibilidade e a volatilidade
das outras tende, em geral, a aumentar (diminuir). Estas caractersticas so rela-
tivamente evidentes nas guras 3.20 e 3.21. A gura 3.20 mostra que os ndices
sobem e descem em sintonia (co-movimento de rendibilidade). A tabela 4, onde se
apresentam os coecientes de correlao (marginal) dos retornos dirios, corrobora
o co-movimento de rendibilidade. A gura 3.21 mostra que os perodos de alta e
baixa volatilidade so aproximadamente coincidentes (co-movimento de volatili-
dade). A tabela 5, onde se apresentam os coecientes de correlao (marginal) dos
retornos ao quadrado, corrobora o co-movimento de volatilidade.
-.08
-.04
.00
.04
.08
1990 1992 1994 1996 1998 2000 2002 2004 2006
CAC
-.12
-.08
-.04
.00
.04
.08
1990 1992 1994 1996 1998 2000 2002 2004 2006
DAX
-.08
-.04
.00
.04
.08
1990 1992 1994 1996 1998 2000 2002 2004 2006
DJ EURO STOXX 50
-.06
-.04
-.02
.00
.02
.04
.06
1990 1992 1994 1996 1998 2000 2002 2004 2006
FTSE 100
-.12
-.08
-.04
.00
.04
.08
1990 1992 1994 1996 1998 2000 2002 2004 2006
PSI20
-.08
-.06
-.04
-.02
.00
.02
.04
.06
1990 1992 1994 1996 1998 2000 2002 2004 2006
S&P 500
FIGURA 3.21. Retornos de ndices
CAC DAX DJ EURO 50 FTSE 100 PSI 20 S&P 500
CAC 1
DAX 0.78 1
DJ EURO 50 0.92 0.89 1
FTSE 100 0.79 0.70 0.81 1
PSI 20 0.52 0.50 0.57 0.47 1
S&P 500 0.43 0.47 0.46 0.41 0.25 1
TABELA 4. Matriz de correlaes dos retornos dirios (Jan 90-
Nov 06)
CAC DAX DJ EURO 50 FTSE 100 PSI 20 S&P 500
CAC 1
DAX 0.74 1
DJ EURO 50 0.91 0.85 1
FTSE 100 0.77 0.66 0.78 1
PSI 20 0.39 0.39 0.43 0.30 1
S&P 500 0.38 0.44 0.41 0.35 0.21 1
TABELA 5. Matriz de correlaes dos retornos dirios ao
quadrado (Jan 90-Nov 06)
CAPTULO 4
Processos Estocsticos: Revises
4.1. Processo Estocstico e Filtrao
Um processo estocstico um modelo matemtico para descrever, em cada
momento, depois de um instante inicial, um fenmeno aleatrio. Este fenmeno
denido num espao de probabilidade (\, T, 1), onde, \ o conjunto de todos os
estados da natureza (ou cenrios de mercado), T uma o-lgebra de subconjuntos
de \ e 1 uma probabilidade sobre T. Um processo estocstico ento uma
coleco de variveis aleatrias j = j
t
(.) , t Z, . \ , denidas sobre um
espao de probabilidade (\, T, 1) . Para cada t, j
t
() uma varivel aleatria.
Para cada . \ (cenrio) xo, j
(.) uma trajectria ou realizao do processo.

Para simplicar escreve-se j
t
em lugar de j
t
(.). A observao de um fenmeno
ao longo do tempo conduz normalmente observao de uma particular trajectria
do processo. Uma sucesso cronolgica apenas uma trajectria entre as innitas
possveis.
T tem estrutura de o-lgebra no seguinte sentido: (i) se T =
c
T; (ii)
se
i
T =
i
T; (iii) \, O T. O estudo dos processos estocsticos faz-se,
usualmente, incluindo o conceito de o-lgebra. Por um lado, as probabilidades so
denidas sobre o-lgebras e as variveis aleatrias, assume-se, so mensurveis
com respeito a essas o-lgebras.
Existe, no entanto, uma razo no tcnica para incluir o estudo das o-lgebras
no estudo dos processos estocsticos: os processos estocsticos, ao descreverem a
evoluo estocstica de um fenmeno ao longo do tempo, sugerem que, em cada
momento t = 0, possvel falar de um passado, presente e futuro. Um
observador do fenmeno, pode falar da histria do processo, daquilo que observa
no presente e daquilo que poder observar no futuro. Com vista, a caracterizar o
quanto se sabe sobre o processo, usual, equipar o espao (\, T, 1) com uma
ltrao, i.e., uma famlia T
t
; t = 0 de sub o-lgebras de T: T
c
_ T
t
_ T para
0 5 : < t < .
T
t
= o (j
c
; : _ t) pode ser identicado como a histria do processo j at
ao momento t. Certos autores, para simplicar, escrevem
T
t
= j
t
, j
t1
, ..., j
1
ou T
t
= j
t
, j
t1
, ... .
55
56 4. PROCESSOS ESTOCSTICOS: REVISES
4.2. Valores Esperados Condicionais: Principais Resultados
Comeamos comumresultado trivial:
L
(j
t
[ T
t
) = j
t
. Comefeito, j
t
pertence
ao conjunto T
t
1
(tambm se diz, j
t
mensurvel com respeito a T
t
), logo j
t
pode
ser tratado como uma constante dado T
t
.
PROPOSIO 4.2.1. Suponha-se que 1 uma v.a. tal que
L
([1 [) < , 7
uma v.a. mensurvel com respeito a ( e
L
([71 [) < ento com probabilidade
um tem-se
L
(71 [ () = 7
L
(1 [ () .
EXEMPLO 4.2.1. Considere-se j
t
= r
t
j
t1
n
t
, onde n
t
uma sucesso
v.a. i.i.d. de mdia nula. Suponha-se T
t
= o (r
c
, j
c
; : _ t) . Ento
L
(j
t
[ T
t1
) =
L
(r
t
j
t1
[ T
t1
) = j
t1 L
(r
t
[ T
t1
) .
Note-se que j
t1
mensurvel com respeito a T
t1
mas r
t
no (T
t1
des-
conhece os acontecimentos ocorridos em t).
EXEMPLO 4.2.2. No mbito da estatstica clssica tambm se sabe que
L
(A1 [ A = r) = r
L
(1 [ A = r) .
Com efeito,
L
(A1 [ A = r) =
_
rj)
j[a
(j[ r) dj = r
_
j)
j[a
(j[ r) dj = r
L
(1 [ A = r) .
PROPOSIO 4.2.2. Seja q : R R uma funo convexa num intervalo
1 R e 1 uma v.a. tal que 1 (1 1) = 1. Se
L
([1 [) < e
L
([q (1 )[) <
ento
L
(q (j)[ () _ q (
L
(j[ ()) .
Se q cncava ento
L
(q (1 )[ () _ q (
L
(1 [ ()) . (4.1)
DEM. (esboo) Prove-se
L
(q (j)) _ q (
L
(j)) e suponha-se (para simplicar)
que q
t
continua em 1. Como q convexa e q
t
continua, tem-se
q (r) _ q (a) q
t
(a) (r a) , \r, a 1.
Escolha-se para a a constante
L
(1 ) , onde 1 uma v.a. tal que 1 (1 1) = 1.
Resulta,
q (r) _ q (
L
(1 )) q
t
(
L
(1 )) (r
L
(1 ))
ou
q (1 ) _ q (
L
(1 )) q
t
(
L
(1 )) (1
L
(1 )) .
Como o lado direito da desigualdade uma funo linear em1 (q (
L
(1 )), q
t
(
L
(1 ))
e
L
(1 ) so constantes), tem-se, aplicando o operador de valor esperado a ambos
os termos da desigualdade,
L
(q (1 )) _
L
_
q (
L
(1 )) q
t
(
L
(1 )) (1
L
(1 ))
_
= q (
L
(1 )) .
1
Emtermos tcnicos, o evento (ou cenrio de mercado) . Uque determinou
I
que pertence
a T
I
. Para simplicar, assume-se T
I
= |
I
,
I1
, ...,
1
ou T
I
= |
I
,
I1
, ... e, neste caso, j
pode-se dizer
I
pertence a T
I
.
4.2. VALORES ESPERADOS CONDICIONAIS: PRINCIPAIS RESULTADOS 57
OBSERVAO 4.2.1. Nas condies da proposio 4.2.2 tem-se:
q convexa =
L
(q (1 )) _ q (
L
(1 )) ;
q cncava =
L
(q (1 )) _ q (
L
(1 )) .
EXEMPLO 4.2.3. Atendendo observao anterior conclui-se:
q (r) Conc./Conv. Desigualdade
r
2
convexa
L
_
1
2
_
_ (
L
(1 ))
2
1
a
, r 0 convexa
L
_
1
Y
_
_
1
!(Y )
log r, r 0 cncava
L
(log (1 )) _ log (
L
(1 ))
Tambm se conclui
L
_
1
2
_
_ (
L
(1 ))
2
a partir da igualdade Vai (1 ) =
L
_
1
2
_
(
L
(1 ))
2
pois, por denio, Vai (1 ) _ 0.
PROPOSIO 4.2.3 (Lei do Valor Esperado Iterado I). Suponha-se
L
([1 [) <
. Ento
L
(1 ) =
L
(
L
(1 [ ()) .
Tambm se tem
L
(1 ) =
L
(
L
(1 [ A)) .
Com efeito, identicando )
a
, )
j
, )
j[a
e )
j,a
como as funes de densidade de
probabilidade, respectivamente de A, 1 , 1 [A e (1, A) , tem-se,
L
(
L
(1 [ A)) =
_ __
j)
j[a
(j[ r) dj
_
)
a
(r) dr
=
_
j
__
)
j[a
(j[ r) )
a
(r) dr
_
dj
=
_
j
__
)
j,a
(j, r) dr
_
dj
=
_
j)
j
(j) dj
=
L
(1 ) .
EXEMPLO 4.2.4. Suponha-se que 1 dado A tem distribuio condicional de
Poisson de parmetro ` = 0A. Suponha-se ainda que A tem distribuio do Qui-
Quadrado com um grau de liberdade. Logo, pela proposio 4.2.3, vem
L
(1 ) =
L
(
L
(1 [ A)) =
L
(0A) = 0.
EXEMPLO 4.2.5. Considere-se o modelo j
t
= ,r
t
n
t
. Seja T
A
t
= r
t
, r
t1
, ... .
Suponha-se
L
_
n
t
[ T
A
t
_
= 0. Como se sabe
L
_
j
t
[ T
A
t
_
= ,r
t
. Logo
L
(j
t
) =
L
_
L
_
,r
t
n
t
[ T
A
t
__
=
L
_
L
_
,r
t
[ T
A
t
__
L
_
L
_
n
t
[ T
A
t
__
= ,
L
(r
t
) .
Neste exemplo, tambmse obtmesta expresso considerando
L
(j
t
) =
L
(,r
t
n
t
) =
,
L
(r
t
) .
t
= a r
t
j
t1
n
t
. Suponha-se que
L
(n
t
[ T
t1
) = 0,
L
(r
t
[ T
t1
) = j
a
e
L
(j
t
) =
L
(j
t1
) . Obtenha-se
L
(j
t
).
Tem-se, pela lei do valor esperado iterado,
L
(j
t
) =
L
(
L
(j
t
[ T
t1
))
=
L
(
L
(a r
t
j
t1
n
t
[ T
t1
))
=
L
(a
L
(r
t
j
t1
[ T
t1
)
L
(n
t
[ T
t1
))
=
L
(a j
t1 L
(r
t
[ T
t1
) 0)
=
L
(a j
t1
j
a
)
= a j
a
L
(j
t1
) = a j
a
L
(j
t
)
Logo
L
(j
t
) = a j
a
L
(j
t
) =
L
(j
t
) = a, (1 j
a
) .
Um resultado mais geral dado pela proposio seguinte.
PROPOSIO 4.2.4 (Lei do Valor Esperado Iterado II). Suponha-se
L
([1 [) <
e ( H. Ento
L
(1 [ () =
L
(
L
(1 [ H)[ () .
t
= acj
t1
n
t
, [c[ < 1 onde n
t
uma
sucesso v.a. i.i.d. de mdia nula. Obtenha-se
L
(j
t
[ T
t2
) . Como T
t2
T
t1
, tem-se
L
(j
t
[ T
t2
) =
L
(
L
(j
t
[ T
t1
)[ T
t2
)
=
L
(a cj
t1
[ T
t2
)
= a c
L
(j
t1
[ T
t2
) (note-se agora j
t1
= a cj
t2
n
t1
)
= a c
L
(a cj
t2
n
t1
[ T
t2
)
= a c(a c
L
(j
t2
[ T
t2
))
= a c(a cj
t2
)
= a ca c
2
j
t2
.
Facilmente se conclui serem vlidas relaes do tipo
L
(j
t
[ T
tS
) =
L
(
L
(j
t
[ T
t2
)[ T
tS
)
=
L
(
L
(
L
(j
t
[ T
t1
)[ T
t2
)[ T
tS
)
L
(j
t
[ T
o
) =
L
(
L
(
L
(
L
(j
t
[ T
t1
)[ T
t2
)[ T
tS
) ...) .
4.3. Distribuio Condicional versus Distribuio Marginal
Seja ) (j
t
[ T
t1
) a fdp condicionada
2
de j
t
dada toda informao at ao mo-
mento t 1. Comparativamente fdp marginal (ou no condicional), ) (j
t
), a fdp
) (j
t
[ T
t1
) bastante mais informativa, pois esta ltima usa toda a informao
disponvel T
t1
, ao passo que a distribuio marginal, por denio, ignora a in-
formao T
t1
. A fdp ) (j
t
[ T
t1
) pode ser entendida como uma reavaliao de
) (j
t
) perante a evidncia T
t1
.
2
Certos autores identicam ) (
I
[ T
I1
) como ) (
I
[
I1
,
I2
, ...,
1
).
4.3. DISTRIBUIO CONDICIONAL VERSUS DISTRIBUIO MARGINAL 59
-6
-4
-2
0
2
4
6
8
1 2 3 4
5
6
( )
1 2
F y f
( )
5 6
F y f
FIGURA 4.1. A fdp ) (j
t
[ T
t1
) varia ao longo do tempo
Considere-se a amostra j
1
, ..., j
a
. Um elemento da amostra escolhido ao
acaso tem fdp ) (j) . Mas observando T
t1
, a v.a. j
t
tem fdp ) (j
t
[ T
t1
) .
Na gura 4.1 traam-se duas hipotticas fdp condicionadas. Para se discutir a
gura, suponha-se que j governado genericamente por dois atributos: (1) j
t1
e j
t
, para todo o t, tendem a estar prximos; por exemplo, se j
t1
alto, j
t
tender tambm a ser alto (trata-se de uma forma de dependncia temporal) e
(2) j
t
reverte para zero,
L
(j
t
) = 0. Suponha-se ainda que j estacionrio. A
fdp marginal constante ao longo do tempo. No entanto, as densidades condi-
cionais variam. Considere-se a fdp ) (j
2
[ T
1
) traada na gura 4.1. Esta funo
atribui probabilidades associadas varivel j
2
dado T
1
. Perante a observao j
1
(e ainda sem se conhecer a realizao j
2
), a fdp ) (j
2
[ T
1
) tem moda aproximada-
mente igual a j
1
: natural esperar que o valor de j
2
venha prximo de j
1
-
dada a hiptese (1); a fdp ) (j
6
[ T
) usa a informao disponvel no momento

t = . Como, j
0, a densidade desloca-se um pouco na direco de j
, pois
j
6
tender a estar prximo de j
. Todavia, como j reverte para zero, mais

provvel o evento j
6
< j
[ j
do que j
6
j
[ j
, i.e., j
6
dever em princ-
pio aproximar-se do valor para o qual j reverte,
L
(j
t
) = 0. Nestas condies, a
fdp ) (j
6
[ T
) embora se desloque na direco de j
, continua a atribuir massa de

probabilidade signicativa a intervalos prximos de zero.
Dois parmetros fundamentais de ) (j
t
[ T
t1
) so
j
t
=
L
(j
t
[ T
t1
) =
_
j
t
) (j
t
[ T
t1
) dj
t
o
2
t
= Vai (j
t
[ T
t1
) =
_
(j
t
j
t
)
2
) (j
t
[ T
t1
) dj
t
.
Valem as seguintes propriedades.
PROPOSIO 4.3.1. A melhor previso de j
a1
dado T
a
, de acordo com Erro
Quadrtico Mdio,
L
(j
a1
[ T
a
) , i.e.
L
_
(j
a
L
(j
a1
[ T
a
))
2
_
_
L
_
(j
a
q (T
a
))
2
_
onde q (T
a
) um qualquer outro previsor T
a
mensurvel (i.e. que usa tambm
toda a informao disponvel at ao momento :).
DEM. Tem-se
L
_
(j
a
q (T
a
))
2
_
=
L
_
(j
a
L
(j
a1
[ T
a
)
L
(j
a1
[ T
a
) q (T
a
))
2
_
=
L
_
(j
a
L
(j
a1
[ T
a
))
2
_
L
_
(
L
(j
a1
[ T
a
) q (T
a
))
2
_
L
[(j
a
L
(j
a1
[ T
a
)) (
L
(j
a1
[ T
a
) q (T
a
))[
Como o terceiro termo zero (deixa-se como exerccio essa demonstrao) vem
L
_
(j
a
q (T
a
))
2
_
=
L
_
(j
a
L
(j
a1
[ T
a
))
2
_
L
_
(
L
(j
a1
[ T
a
) q (T
a
))
2
_
_
L
_
(j
a
L
(j
a1
[ T
a
))
2
_
.
O valor
L
(j
a1
) tambm um previsor no enviesado de j
a1
mas, como
no usa a informao disponvel T
t1
, pode demonstrar-se que bastante menos
preciso do que o previsor
L
(j
a1
[ T
a
).
Pode-se tambm provar
L
_
(j
aI
L
(j
aI
[ ())
2
_
_
L
_
(j
aI
L
(j
aI
[ H))
2
_
, H _ (.
Esta desigualdade resulta do facto de em ( existir mais informao. natural
esperar que um previsor que use mais informao face a um outro, tenha um EQM
inferior. Tm-se ainda os seguintes casos limites quando o previsor um valor
esperado condicionado.
( = T = T
o
=
L
_
(j
aI
L
(j
aI
[ ())
2
_
=
L
_
(j
aI
j
aI
)
2
_
= 0
e
H =? =
L
_
(j
aI
L
(j
aI
[ H))
2
_
=
L
_
(j
aI
L
(j
aI
))
2
_
.
EXEMPLO 4.3.1. Considere: A) Tem-se uma sucesso de retornos do PSI20
e retira-se aleatoriamente um elemento da sucesso. Suponha-se que a mdia e
a varincia desse retorno so conhecidas. B) Suponha que os retornos do PSI20
registaram hoje uma forte quebra e uma forte volatilidade. Q1: Qual a infor-
mao mais relevante se o objectivo prever os retornos do PSI20 e a volatilidade
para o dia de amanh? A ou B? Q2: Neste caso, qual a fdp que interessa estu-
dar? ) (j
t
[ T
t1
) ou ) (j
t
) Q3: Qual a informao relevante se o objectivo
conhecer as caractersticas gerais da srie dos retornos (ou prever os retornos e a
volatilidade para um horizonte de vrios anos)? Q4: Neste caso, qual a fdp que
interessa estudar? ) (j
t
[ T
t1
) ou ) (j
t
)
4.3. DISTRIBUIO CONDICIONAL VERSUS DISTRIBUIO MARGINAL 61
Considere o modelo de sries temporais,
j
t
= c cj
t1
n
t
, [c[ < 1
onde n
t
uma sucesso de v.a. i.i.d. com distribuio
_
0, o
2
_
. Determine-se
a distribuio de j
t
[ T
t1
. Dado T
t1
, j
t1
pode ser tratado como uma constante.
Logo j
t
[ T
t1
tem distribuio normal,
j
t
[ T
t1
~ (
L
(j
t
[ T
t1
) , Vai (j
t
[ T
t1
))
onde
L
(j
t
[ T
t1
) = c cj
t1
Vai (j
t
[ T
t1
) =
L
_
(j
t
L
(j
t
[ T
t1
))
2
T
t1
_
=
L
_
n
2
t
T
t1
_
= o
2
.
Assim,
j
t
[ T
t1
~
_
c cj
t1
, o
2
_
. (4.2)
Determine-se a distribuio marginal. No modelo em anlise verica-se
L
(j
t
) =
L
(j
t1
) . Logo
L
(j
t
) = c c
L
(j
t
) =
L
(j
t
) =
c
1 c
e, seguindo um raciocnio similar,
Vai (j
t
) =
o
2
1 c
2
.
Atendendo representao MA() do processo AR(1)
3
,
j
t
=
c
1 c
n
t
cn
t1
c
2
n
t2
...
imediatamente se conclui que j tem distribuio marginal normal (uma soma de
v.a. normais tem distribuio normal). Tambm se conclui, a partir da represen-
tao MA(), que
L
(j
t
) = c, (1 c) e Vai (j
t
) = o
2
,
_
1 c
2
_
. Assim, a
distribuio marginal de j
j
t
~
_
c
1 c
,
o
2
1 c
2
_
. (4.3)
t
= 0.0j
t1
n
t
, onde n
t
~ (0, 1) .
Sabendo que no perodo t 1 se observou j
t1
= 2 e tendo em conta (4.2)
e (4.3) tem-se
j
t
~ (0, .26)
j
t
[ T
t1
~ (1.8, 1) .
Procura-se avaliar a probabilidade de j
t
assumir um valor positivo. Assim,
1 (j
t
0) = 0.
1 (j
t
0[ T
t1
) = 1 (j
t
0[ j
t1
= 2) = 0.080.
As probabilidade so bem diferentes. Com efeito, no perodo t 1 registou-se
j
t1
= 2. Como a autocorrelao forte (c alto) natural esperar que
no perodo t o valor de j
t
ainda se encontre abaixo de zero. Por esta razo, a
3
A forma mais intuitiva de obter este resultado, consiste em aplicar o mtodo recursivo (iterando
I
ad innitum). Por exemplo,
I
= c c
I1
&
I
= c c(c c
I2
&
I1
) &
I
, e assim
sucessivamente.
probabilidade condicional confere pouca evidncia ao evento j
t
0 . Pelo con-
trrio, a probabilidade marginal, ignora o acontecimento j
t1
= 2 e, por isso,
atribui uma probabilidade razovel ao evento j
t
0 .
EXEMPLO 4.3.3. Retome-se o exemplo 4.3.2 e suponha-se que se tm : obser-
vaes e se pretende obter uma previso para o perodo : 1. Podemos usar uma
innidade de previsores, mas analisem-se apenas os seguintes:
L
(j
a1
[ T
a
) = 0.0j
a
L
(j
a1
) = 0.
De acordo com a discusso anterior, o previsor
L
(j
a1
[ T
a
) mais preciso do
que
L
(j
a1
) . A preciso aqui aferida atravs do erro quadrtico mdio (EQM)
e, com efeito, observa-se que
L
_
(j
a1
L
(j
a1
[ T
a
))
2
_
= o
2
= 1 <
L
_
(j
a1
L
(j
a1
))
2
_
=
o
2
1 c
2
= .268
4.4. Processos Estocsticos Elementares, Estacionaridade e Fraca
Dependncia
4.4.1. Processos Estocsticos Elementares.
DEFINIO 4.4.1. n um processo
4
rudo branco (RB) se
L
(n
t
) = 0
Vai (n
t
) =
L
_
n
2
t
_
= o
2
L
(n
t
n
c
) = 0, \: ,= t
Procure identicar o processo rudo branco na gura 4.2.
DEFINIO 4.4.2. n um processo rudo branco independente se
L
(n
t
) = 0,
L
_
n
2
t
_
= o
2
,
n
t
e n
c
so independentes \: ,= t
Se adicionalmente n
t
~
_
0, o
2
_
ento n
t
um rudo branco Gaussiano.
Oprocesso n
t
pode ser no autocorrelacionado, i.e., Coii (n
t
, n
c
) = 0, \: ,=
t e, mesmo assim, n
t
e n
c
no serem independentes. Por exemplo, pode suceder
Coii
_
n
2
t
, n
2
c
_
,= 0 e, neste caso, existe uma bvia ligao entre os valores n
2
t
e n
2
c
.
Contudo, existe um caso notvel onde
L
(n
t
n
c
) = 0, \: ,= t implica independn-
cia. o caso de rudos brancos com distribuio Gaussiana.
DEFINIO 4.4.3. n um processo diferena de martingala se
L
([n
t
[) < ,
L
(n
t
[ T
t1
) = 0.
4
Recorde-se a notao & = |&
I
= |&
I
; t = 1, 2, ... .
4.4. PROCESSOS ESTOCSTICOS ELEMENTARES, ESTACIONARIDADE E FRACA DEPENDNCIA63
B
-5
-3
-1
1
3
5
1 26 51 76 101 126 151 176
A
-50
-40
-30
-20
-10
0
10
20
30
40
1 26 51 76 101 126 151 176
D
-15
-10
-5
0
5
10
15
1 26 51 76 101 126 151 176
C
-5
0
5
10
15
20
25
30
1 26 51 76 101 126 151 176
FIGURA 4.2. Qual a trajectria do processo rudo branco?
PROPOSIO 4.4.1. Se n uma diferena de martingala, ento
L
(n
t
) = 0 e
L
(n
t
n
c
) = 0, \: ,= t.
DEM. Deixa-se como exerccio concluir que
L
(n
t
) = 0. Suponha-se, sem
perda de generalidade que : < t. Tem-se
L
(n
t
n
c
) =
L
(
L
(n
t
n
c
[ T
c
)) (pela proposio 4.2.3)
=
L
(n
c L
(n
t
[ T
c
))
=
L
(n
c L
(
L
(n
t
[ T
t1
)[ T
c
)) (pela proposio 4.2.4)
=
L
(n
c L
(0[ T
c
)) = 0.
DEFINIO 4.4.4. n um processo passeio aleatrio (random walk ou RW)

se
j
t
= j
t1
n
t
e n
t
um RB. j
t
diz-se um processo passeio aleatrio com deriva (random walk
with drift) se
j
t
= j
t1
c n
t
, c ,= 0.
-40
-20
0
20
40
60
80
100
120
1 101 201 301 401 501 601 701 801 901
0
200
400
600
800
1000
1200
RW
Var
FIGURA 4.3. Processo RW e

Vai (j
t
) =
t
i=1
(j
i
j
t
)
2
,t
Pode-se provar que um random walk verica:
L
(j
t
[ T
t1
) = j
t1
,
L
(j
t
) =
L
(j
0
) ,
L
_
j
2
t
_
=
L
_
j
2
0
_
o
2
t,
L
(j
t
j
tI
) = o
2
(t /) .
Na gura 4.3 apresenta-se um processo RW e

Vai (j
t
) =
t
i=1
(j
i
j
t
)
2
,t.
4.4.2. Estacionaridade.
DEFINIO 4.4.5. j um processo estacionrio de segunda ordem (ESO) se
L
(j
t
) = j, (no depende de t)
Vai (j
t
) = o
2
, (no depende de t)
Cov (j
t
, j
tI
) = (/) (no depende de t).
Na denio de processo ESO est implcito no s que os momentos no de-
pendem de t como tambm so nitos. Por exemplo, se Vai (j
t
) = , ento j
t
no ESO. Um RB, RB independente ou um RB Gaussiano so processos esta-
cionrios de segunda ordem. Uma diferena de martingala pode ser ou no um
processo ESO. um processo ESO se o segundo momento for nito e no depen-
der de t. Identique na gura 4.2 as trajectrias de processos aparentemente no
estacionrios.
Naturalmente o processo passeio aleatrio no ESO.
Geralmente entende-se que um processo no ESO quando a mdia, a varin-
cia ou as covarincias dependem de t. Mas a estacionaridade de segunda ordem
(ESO) pode tambm falhar se no existir a mdia e/ou a varincia. Por exemplo,
considere o processo j
t
= 10 n
t
, onde n
t
-4 -3 -2 -1 0 1 2 3 4
0.1
0.2
0.3
x
f(x)
FIGURA 4.4. Funo densidade de probabilidade de Cauchy
distribuio de Chauchy. A funo densidade de probabilidade (fdp) de Cauchy
) (r) =
1
(1 r
2
)
.
j no um processo ESO porque
L
([n
t
[) no existe. Com efeito,
L
([n
t
[) =
_
R
[r[ ) (r) dr =
_
R
[r[
1
(1 r
2
)
dr
no converge e, portanto,
L
([n
t
[) no est denido (i.e. no existe). Na gura 4.4
traa-se a funo ) (r) . Como a fdp tem abas muitos pesadas atribui uma massa
de probabilidade considervel para valores muito afastados da mdia. Isto signica
que embora o centro de gravidade da fdp seja zero, valores muito afastados de zero
podem ocorrer com probabilidade no nula (veja-se a gura 4.5).
DEFINIO 4.4.6. j um processo estritamente estacionrio (EE) se as dis-
tribuies conjuntas de
(j
1
, j
2
, ..., j
c
) e (j
I1
, j
I2
, ..., j
Ic
)
so iguais para qualquer : N e / Z.
No ponto 7.3 discute-se com maior profundidade este conceito.
OBSERVAO 4.4.1. Um processo estritamente estacionrio deve vericar,
em particular, a seguinte condio:
)
j
1
(r) = )
j
2
(r) = ... = )
j
n
(r) = ) (r) (4.4)
(as densidade marginais de j
1
, j
2
,..., j
a
so iguais para todo o t). Esta condio
decorre da aplicao da denio anterior para : = 1. Resulta de (4.4) que se
L
([q (j
t
)[) < , ento
L
([q (j
t
)[) constante e no depende de t, pois
L
([q (j
t
)[) =
_
[q (r)[ )
j
I
(r) dr =
_
[q (r)[ ) (r) dr, \t.
-1400
-1200
-1000
-800
-600
-400
-200
0
200
400
600
800
1 101 201 301 401 501 601 701 801 901 1001 1101 1201 1301 1401
FIGURA 4.5. Uma trajectria simulada do processo j
t
= 10n
t
,
onde n
t
uma sucesso de v.a. i.i.d. com distribuio de
Chauchy
Ambas as denies de estacionaridade basicamente exigem que a estrutura
probabilstica se mantenha constante ao longo do tempo. No entanto, enquanto a
estacionaridade estrita exige que toda a estrutura probabilstica se mantenha con-
stante ao longo do tempo, a ESO apenas faz essa exigncia para os dois primeiros
momentos e para a autocovarincia.
EXEMPLO 4.4.1. Considere-se o processo,
j
t
= 0.2j
t1
n
t
, [c[ < 1 (4.5)
onde
n
t
=
_

t
se t _ 2000
_
I2
I

t
se t 2000
(4.6)
sendo
t
e
c
independentes \t, :, e
t
iio
~ (0, 1) e
c
iio
~ t
(I)
. Para t _ 2000
tem-se
L
(n
t
) =
L
(
t
) = 0,
Vai (n
t
) = Vai (
t
) = 1
e para t 2000,
L
(n
t
) =
L
_
_
/ 2
/

t
_
= 0,
Vai (n
t
) = Vai
_
_
/ 2
/

t
_
=
/ 2
/
/
/ 2
= 1.
Como a autocovarincia de n
t
no depende de t (na verdade zero, para qualquer
t) e
L
(n
t
) e Vai (n
t
) so constantes, para todo o t, conclui-se que n
t
um
processo ESO. No entanto, no EE, pois a distribuio marginal de n
t
para t _
2000 no coincide com a distribuio marginal de n
t
para t 2000 (no primeiro
caso normal; no segundo t-Student). No se cumpre assim a condio (4.4). A
FIGURA 4.6. Uma trajectria simulada a partir de um processo
estacionrio de segunda ordem mas no estritamente estacionrio
- conram-se as equaes (4.5) e (4.6)
mesma concluso se aplica a j: ESO mas no EE. Na gura 4.6 representa-se
uma trajectria simulada a partir das equaes (4.5) e (4.6), com / = 8 (graus
de liberdade). Observe-se que a partir de t = 2000 comeam a aparecem valores
muito altos e muitos baixos (outliers) j que os erros passam a ter distribuio
t-Student com 3 graus de liberdade (embora a varincia dos erros se mantenha
sempre igual a 1). Observa-se, portanto, uma alterao da estrutura probabilstica
do processo a partir de t 2000 que implica a no estacionaridade estrita do
processo.
Alguns factos:
Se
L
_
j
2
t
_
< e j estritamente estacionrio (EE), ento j ESO.
Com efeito, tem-se )
j
I
(j) = ) (j) , \t (por hiptese) e, portanto,
L
(j
t
) =
_
r)
j
I
(r) dr
=
_
r) (r) dr =
L
(j) ,
Vai (j
t
) =
_
(r
L
(j
t
))
2
)
j
I
(r) dr
=
_
(r
L
(j))
2
) (r) dr = Vai (j) .
Por outro lado, )
j
I
,j
I+I
(r, j) = )
j
s
,j
s+I
(r, j) , \t, : (por hiptese) e,
portanto, a expresso
L
(j
t
j
tI
) =
_ _
rj)
j
I
,j
I+I
(r, j) drdj
=
_ _
rj)
j
s
,j
s+I
(r, j) drdj =
L
(j
c
j
cI
) .
no depende de t (nem de :).
Se j ESO e tem distribuio normal, ento j EE.
A estacionaridade estrita geralmente uma condio mais forte do que
a ESO, mas no implica necessariamente ESO. Por exemplo, se j
t
=
10 n
t
onde n
t
uma sucesso de v.a. com distribuio de Cauchy,
j no , como vimos, ESO; no entanto, pode-se provar que j EE: a
estrutura probabilstica mantm-se imutvel ao longo do tempo.
4.4.3. Fraca Dependncia. A propriedade fraca dependncia crucial para
se invocar resultados limites como sejam a lei dos grandes nmeros e o teorema do
limite central. Considere-se, por exemplo, a mdia emprica j
a
= :
1
a
t=1
j
t
.
Sob certas condies, a lei fraca dos grandes nmeros estabelece j
a
j
L
(j) .
Este resultado pode ser provado da seguinte forma: se lim
a L
( j
a
) =
L
(j) e
lim
a
Vai ( j
a
) = 0 ento j
a
j
L
(j) . Exigir que a varincia de j
a
convirja para
zero (no limite j
a
reduz-se a uma constante) envolve a suposio de que a sucesso
j
t
fracamente dependente num sentido que precisaremos a seguir. Com efeito,
Vai ( j
a
) =
1
:
2
Vai
_
a
t=1
j
t
_
=
1
:
2
_
_
a
t=1
Vai (j
t
) 2
a1
)=1
a
i=)1
Cov (j
i
, j
i)
)
_
_
.
Semhipteses adicionais no garantido que estas duas somas convirjam. Comece-
se por assumir que j
t
ESO. Nestas condies a covarincia Cov (j
i
, j
i)
) s
depende de , = i (i ,) e no de i (veja a denio 4.4.5). Assim, pode-se
escrever, Cov (j
i
, j
i)
) = (,). Vem,
Vai ( j
a
) =
1
:
2
_
_
:o
2
2
a1
)=1
a
i=)1
(,)
_
_
=
o
2
:

2
:
2
a1
)=1
(,)
a
i=)1
1 ( (,) no depende de i)
=
o
2
:

2
:
2
a1
)=1
(,) (: ,)
=
o
2
:

2
:
a1
)=1
(,)
_
1
,
:
_
.
O primeiro termo o
2
,: converge para zero, mas o segundo termo pode convergir
ou no. necessrio no s que (,) convirja para zero, mas tambm que essa
convergncia seja relativamente rpida. Note-se de passagemque a estacionaridade
no garante fraca dependncia.
As condies de aplicao do teorema do limite central so ainda mais exi-
gentes. Sob certas condies tem-se, como se sabe,
_
:( j
a
L
(j))
o
_
0, j
2
_
,
onde j
2
uma constante nita, denida como j
2
= lim
a
Vai (
_
:( j
a
L
(j))) =
lim
a
Vai (
_
: j
a
) . Se j
t
estacionrio, tem-se
Vai
__
: j
a
_
= o
2
2
a1
)=1
(,)
_
1
,
:
_
e, agora, comparativamente ao caso anterior, (,) tem de convergir ainda mais
rapidamente para zero para que a soma o
a
=

a1
)=1
(,)
_
1
)
a
_
convirja. Por
exemplo, uma funo de autocorrelao do tipo (,) = 1,, resulta numa soma o
a
divergente. A soma converge se a funo de autocorrelao for, por exemplo, do
tipo (,) = a
)
, com [a[ < 1.
Existem vrias denies de processos fracamente dependentes envolvendo
os chamados mixing coefcients (c-mixing, ,-mixing, j-mixing entre outros) que
permitem avaliar e medir o grau de dependncia recorrendo a diferentes interpre-
taes do conceito de independncia. Vamos adoptar uma denio alternativa
para caracterizarmos um processo fracamente dependente baseada na denio de
Wooldridge (1994):
DEFINIO 4.4.7. j umprocesso fracamente dependente se lim
a
Vai (
_
: j
a
) =
c 0.
Infelizmente esta denio tem a seguinte desvantagem: se j fracamente de-
pendente no sentido da denio 4.4.7, e q uma funo com boas propriedades,
no possvel concluir, em termos gerais, que .
t
= q (j
t
) ainda um processo fra-
camente dependente. J se j
t
,-mixing possvel inferir, sob certas condies
gerais, que .
t
= q (j
t
) ainda ,-mixing (digamos, a transformao q preserva
a propriedade de fraca dependncia do processo quando baseada no conceito dos
mixing coefcients).
Comentrios Finais
Por que razo importante o estudo da estacionaridade e da fraca dependncia
(em sries temporais)? Apontam-se algumas razes:
A aplicao do teorema central e a lei dos grandes nmeros so dois pi-
lares da inferncia estatstica. Considere-se, por exemplo,
j
a
=
1
:
a
t=1
j
t
.
Sob certas condies, a aplicao da lei dos grandes nmeros e do teo-
rema do limite central, permite obter, respectivamente
j
a
j
L
(j) ,
j
a
L
(j)
_
Vai ( j
a
)
o
(0, 1) .
No entanto, se j no estacionrio e fracamente dependente no pos-
svel invocar estes resultados clssicos (e a inferncia assimpttica habit-
ual no pode ser utilizada).
De uma forma geral, se a estrutura probabilstica se altera ao longo do
tempo (i.e., se j no estacionrio), todas as concluses que se retirem
para um certo perodo no so extrapolveis para o futuro.
A estacionaridade tambm relevante no mbito da previso: processos
estacionrios so limitados em probabilidade e a amplitude dos intervalos
de previso no diverge quando o horizonte de previso tende para mais
innito. Pelo contrrio, processos no estacionrios, por exemplo, 1 (1) ,
so extremamente difceis de prever no longo prazo, dado que a amplitude
dos intervalos de previso aumenta com o horizonte de previso.
Emtermos de poltica econmica tambmrelevante saber se umprocesso
estacionrio ou no. Medidas de poltica econmica que tenham como
objectivo alterar a trajectria de processos estacionrios, esto em geral
condenadas ao fracasso, pelo menos no mdio/longo prazo, pois choques
induzidos em processos dessa natureza tendem a se autocorrigir ao longo
do tempo (e a reverterem para a uma medida de tendncia central).
Convm sublinhar o seguinte. Embora muitas sries temporais sejam no esta-
cionrias, possvel, na maior parte dos casos, estacionariz-las, mediante trans-
formaes apropriadas do processo.
* * *
Para terminar esta seco, tecem-se algumas consideraes crticas aos mode-
los de sries temporais baseados em pressupostos estacionrios.
Sero as sries temporais nanceiras e econmicas verdadeiramente estacionrias?
Como j argumentmos, a estacionaridade envolve uma determinada hiptese de
estabilidade da estrutura probabilstica do processo. Esta estrutura depende de uma
mirade de factores, como por exemplo, dos agentes econmicos (privados e pbli-
cos) e das suas relaes, da tecnologia, da informao, do puro acaso (entre outros
factores). Apenas o puro acaso pode ser considerado imutvel ao longo do tempo;
tudo o resto evolui ao longo do tempo, pelo que um mito supor-se que a estru-
tura probabilstica de uma srie temporal nanceira ou econmica permanece con-
stante ou aproximadamente constante ao longo do(s) tempo(s). Suponha-se que
se estuda a taxa de variao relativa anual do PIB portugus (j
t
= log (111
t
)
log (111
t1
)). Aparentemente, j estacionrio se o perodo de referncia forem
alguns dezenas de anos (isto , praticamente todos os testes estatsticos disponveis,
apontariam nessa direco). Mas, se alargarmos a amostra para vrias centenas
de anos (supondo que tal era possvel), extremamente implausvel j ser esta-
cionrio (a histria diz-nos que as condies e os factores de produo evoluem ou
sofrem rupturas ao longo do tempo). Sob esta perspectiva, no existem processos
de natureza econmica e nanceira estacionrios. Poderemos ento concluir que
a anlise da estacionaridade acaba por ser intil? Embora, em termos rigorosos,
o conceito de estacionaridade envolva o passado e o futuro distante (o e o
), normalmente limitamos o perodo de anlise. Para esse perodo, assume-
se que a srie apresenta caractersticas estacionrias e a previso relevante que esta-
belecemos aplica-se, supostamente, a um futuro prximo, governado, no essencial,
pelas mesmas leis que determinaram o processo no perodo amostral. Com esta
ressalva, a estacionaridade importante, porque assegura uma forma de estabili-
dade probabilstica que essencial na inferncia estatstica.
Parte 2
Modelos Estatsticos
CAPTULO 5
O Problema da Especicao
5.1. O Axioma da Correcta Especicao do Modelo
Seja j
t
o valor de uma varivel econmica no momento t. Em termos abstrac-
tos temos a sucesso (ou coleco) de variveis aleatrias j
t
, t Z ou j
t
, t N
0
.
Uma srie econmica apenas uma subsucesso de j
t
, t N
0
. Asrie econmica
depende de inmeros factores: leis econmicas, choques externos, puro acaso, etc.
O verdadeiro comportamento de j
t
desconhecido. Pode ser caracterizado por
aquilo a que se chama data generation process (DGP) e denido como a lei de
probabilidade conjunta de j
t
, j
t1
, ...:
1
0
t
(j
t
, j
t1
, ...) ou )
0
t
(j
t
, j
t1
, ...) .
A distribuio conjunta ou a densidade conjunta (que se admite existir) descrevem
completamente a sucesso em termos probabilsticos (incorpora tudo o que inu-
encia j
t
). Note-se que as funes 1
0
t
ou )
0
t
so desconhecidas. Alm disso, de-
pendem de t, porque se admite a possibilidade de j ser no estacionrio. O DGP
pode ser equivalentemente descrito pelas densidades condicionais (supondo que
existem)
_
)
0
t
(j
t
[ T
t1
)
_
, t = ..., 1, 0, 1, ...
Com efeito (usando a propriedade 1 ( 1) = 1 ([ 1) 1 (1)),
)
0
t
(j
t
, j
t1
, ...) = )
0
t
(j
t
[ j
t1
, ...) )
0
t1
(j
t1
, j
t2
...) (5.1)
= )
0
t
(j
t
[ j
t1
, ...) )
0
t1
(j
t1
[ j
t2
, ...) )
0
t2
(j
t2
, j
tS
...)
= ...
= )
0
t
(j
t
[ j
t1
, ...) )
0
t1
(j
t1
[ j
t2
, ...) ...)
0
1
(j
1
[ j
0
, ...) ...
Logo a sucesso
_
)
0
t
(j
t
[ T
t1
)
_
fornece a mesma informao que )
0
(j
t
, j
t1
, ...).
Por exemplo, suponha-se que se simula o seguinte modelo:
j
1
~ (0, 1)
j
t
= 0.j
t1
-
t
, -
t
um rudo branco (0, 1) , t = 2, 8
Logo, o DGP da simulao
)
0
(j
S
, j
2
, j
1
) = )
0
(j
S
[ j
2
, j
1
) )
0
(j
2
, j
1
)
= )
0
(j
S
[ j
2
, j
1
) )
0
(j
2
[ j
1
) )
0
(j
1
)
= )
0
(j
S
[ T
2
) )
0
(j
2
[ T
1
) )
0
(j
1
) ,
e, portanto, pode ser completamente caracterizado pela distribuio condicional
j
t
[ T
t1
~ (0.j
t1
, 1) e pela distribuio do valor inicial (se o processo fosse
75
76 5. O PROBLEMA DA ESPECIFICAO
iniciado em t = o DGP seria caracterizado apenas pela distribuio condi-
cional).
Um modelo economtrico, denido pelo investigador, procura aproximar o
melhor possvel o DGP atravs de um modelo do tipo
' (j
t
, j
t1
, ...; d
t
; )
onde um vector de parmetros e d
t
inclui variveis no aleatrias que procu-
ram modelar alteraes no DGP ao longo do tempo (como por exemplo, variveis
articiais determinsticas, tendncias, etc.).
Este modelo encerra uma hiptese quanto fdp condicional, )
t
(j
t
[ d
t
, T
t1
, )
e, portanto, quanto aos momentos condicionais, como por exemplo
L
(j
t
[ d
t
, T
t1
, )
e Vai (j
t
[ d
t
, T
t1
, ) . O axioma da correcta especicao do modelo ' traduz-
se da seguinte forma: existe um
0
tal que
)
t
(j
t
[ d
t
, T
t1
,
0
) = )
0
t
(j
t
[ T
t1
) .
De forma anloga, os dois primeiros momentos condicionais esto correctamente
especicados se existir um
0
tal que
L
(j
t
[ d
t
, T
t1
, ) =
_
j)
0
t
(j[ T
t1
) dj
Vai (j
t
[ d
t
, T
t1
, ) =
_
j
2
)
0
t
(j[ T
t1
) dj
__
j)
0
t
(j[ T
t1
) dj
_
2
.
Na prtica, a hiptese da correcta especicao implausvel, embora seja
geralmente conveniente invoc-la como forma de estruturar e interpretar os resul-
tados estatsticos. De todo o modo, o objectivo claro: devemos procurar uma fdp
)
t
(j
t
[ d
t
, T
t1
,
0
) que esteja o mais prximo possvel da verdadeira mas descon-
hecida densidade )
0
(j
t
[ T
t1
).
5.2. Modelao da Mdia Condicional e Modelos Dinamicamente Completos
5.2.1. Modelos Dinamicamente Completos. Generalize-se a anlise e admita-
se que a j
t
depende dos valores correntes e passados de r
t
. Seja J
t
= T
t1
' T
A
t
onde T
A
t
o conjunto de informao contendo todas as variveis explicativas at
ao perodo t. Assim, J
t
= j
t1
, j
t2
, ...; r
t
, r
t1
, .... O primeiro passo na con-
struo do modelo ' o da denio da mdia condicional, o que signica que
devemos identicar todas as variveis explicativas de j
t
. Por exemplo, suponha-
se que as variveis relevantes para explicar um certo fenmeno j
t
so r
t
e j
t1
.
Normalmente expressamos esta nossa convico sobre o poder explicativo r
t
e
j
t1
escrevendo j
t
= ,
1
,
2
r
t
cj
t1
n
t
, sendo n
t
o termo de erro.
importante sublinhar que nada de relevante dito sobre o modelo se no adiantar-
mos uma hiptese sobre o comportamento de n
t
. Se dissermos que
L
(n
t
) = 0
apenas podemos concluir que
L
(j
t
) = ,
1
,
1
L
(r
t
) c
L
(j
t1
) . Se adicional-
mente dissermos que Cov (n
t
, r
t
) = Cov (n
t
, j
t1
) = 0 ento (pode-se provar
que) ,
1
,
2
r
t
cj
t1
o melhor previsor linear de j
t
. Se a nossa hiptese
L
(n
t
[ J
t
) = 0 acrescentamos bastante mais informao: de facto, reclamamos
5.2. MODELAO DA MDIA CONDICIONAL E MODELOS DINAMICAMENTE COMPLETOS 77
que a mdia condicional
L
(j
t
[ J
t
) = ,
1
,
2
r
t
cj
t1
. Todavia, nenhuma
suposio feita quanto a distribuio condicional de j
t
.
Seja x
t
o vector das variveis explicativas. No exemplo anterior tem-se x
t
=
(r
t
, j
t1
) , e pode-se vericar que
L
(j
t
[ x
t
) =
L
(j
t
[ J
t
) . De uma forma geral,
quando vlida a igualdade
L
(j
t
[ x
t
) =
L
(j
t
[ J
t
) diz-se que o modelo dinami-
camente completo. Veja um caso onde o modelo no dinamicamente completo.
Considere-se,
j
t
= ,
1
,
2
r
t
,
S
j
t1
n
t
, n
t
= c
2
n
t2
-
t
(5.2)
sendo -
t
um RB. Este modelo no dinamicamente completo, pois
L
(j
t
[ J
t
) = ,
1
,
2
r
t
,
S
j
t1
cn
t2
no coincide com
L
(j
t
[ x
t
) =
L
(j
t
[ r
t
, j
t1
) = ,
1
,
2
r
t
,
S
j
t1
.
No entanto, fcil obter um modelo dinamicamente completo a partir de (5.2).
Como
n
t
= j
t
(,
1
,
2
r
t
,
S
j
t1
) =
n
t2
= j
t2
(,
1
,
2
r
t2
,
S
j
tS
)
tem-se, a partir da representao (5.2),
j
t
= ,
1
,
2
r
t
,
S
j
t1
n
t
= ,
1
,
2
r
t
,
S
j
t1
c
2
n
t2
-
t
= ,
1
,
2
r
t
,
S
j
t1
c
2
(j
t2
(,
1
,
2
r
t2
,
S
j
tS
)) -
t
= ,
1
,
1
c
2
,
2
r
t
,
S
j
t1
c
2
j
t2
,
2
c
2
r
t2
,
S
c
2
j
tS
-
t
.
A equao anterior pode ainda escrever-se na forma
j
t
=
1

2
r
t

S
j
t1

1
j
t2

r
t2

6
j
tS
-
t
. (5.3)
O vector x
t
passa agora a ser x
t
= (r
t
, j
t1
, j
t2
, r
t2
, j
tS
) e o modelo (5.3)
dinamicamente completo pois
L
(j
t
[ J
t
) =
L
(j
t
[ x
t
) =
1

2
r
t

S
j
t1

1
j
t2

r
t2

6
j
tS
.
Num modelo dinamicamente completo, o conjunto das variveis explicativas x
t
capta toda a dinmica do processo, de tal forma que os erros no so autocorrela-
cionados (vale a pena acrescentar que um modelo dinamicamente completo no
pode ter erros autocorrelacionados).
Que diferenas existem entre os modelos (5.2) e (5.3)? O estimador OLS apli-
cado a (5.3) consistente; mas aplicado a (5.2) inconsistente, pois o regressor
j
t1
est correlacionado com os erros n
t
(
L
(n
t
[ x
t
) ,= 0). Claro que no mod-
elo (5.2) deve usar-se um mtodo de estimao consistente, como por exemplo, o
mtodo FGLS ou o mtodo da mxima verosimilhana. Quando so usados mto-
dos de estimao apropriados, do ponto de vista estatstico - por exemplo, previso
ou ajustamento - os modelos acima discutidos so (quase) equivalentes (e, portanto,
indiferente usar-se um ou o outro). Do ponto de vista da interpretao econmica
o modelo (5.3) pode ser prefervel, pois identica claramente todos os regressores
inuentes na explicao das variaes de j. Mas, tambm pode suceder o con-
trrio! Suponha-se que a teoria econmica postula para certo fenmeno a relao
78 5. O PROBLEMA DA ESPECIFICAO
j
t
= ,
1
,
2
r
t
n
t
. esta a relao que queremos estimar, mesmo que n
t
possa
exibir autocorrelao.
5.2.2. Mdia Condicional No Linear. Suponha-se que a mdia condicional
dada por
L
(j
t
[ T
t1
) = q (j
t1
, j
t2
, .., j
tj
; n
t1
, n
t2
, ...n
tq
)
(no estando presente a varivel explicativa r
t
, a o-algebra relevante T
t
e no J
t
,
como no exemplo anterior). Diz-se que o modelo
j
t
= q (j
t1
, j
t2
, .., j
tj
; n
t1
, n
t2
, ...n
tq
) n
t
no linear na mdia se q uma funo no linear dos seus argumentos. Vejamos
alguns exemplos. No caso
j
t
= cj
t1
log
_
1 j
2
t1
_
n
t
,
L
(n
t
[ T
t1
) = 0,
tem-se ummodelo no linear na mdia, pois,
L
(j
t
[ T
t1
) = cj
t1
log
_
1 j
2
t1
_
uma funo no linear de j
t1
. Tambm
j
t
= n
t1
n
t2
n
t
,
L
(n
t
[ T
t1
) = 0
um modelo no linear, pois
L
(j
t
[ T
t1
) = n
t1
n
t2
no linear nos valores
passados de n
t
. Outro exemplo Modelo Threshold
j
t
=
_
c
1
j
t1
n
t
se j
t1
/
c
2
j
t1
n
t
se j
t1
_ /.
com
L
(n
t
[ T
t1
) = 0. Desenvolveremos modelos no lineares com algum detalhe
no captulo 7.
5.3. Modelao da Varincia Condicional
Denida a mdia condicional, pode haver interesse em explicar a variabilidade
de j
t
ao longo do tempo. No modelo clssico de sries temporais assume-se que a
varincia condicional constante ao longo do tempo. Essa hiptese no credvel
em sries temporais nanceiras. No captulo 8 discutiremos esta questo em de-
talhe. Uma forma de introduzir um modelo de varincia condicional no constante
consiste em denir o termo de erro da equao j
t
=
L
(j
t
[ T
t1
) n
t
da seguinte
forma n
t
= o
t
-
t
, onde -
t
um rudo branco de varincia igual a 1 ou, mais geral-
mente, uma diferena de martingala (com varincia nita igual a 1). Resulta
Vai (j
t
[ T
t1
) = Vai (n
t
[ T
t1
) = Vai (o
t
-
t
[ T
t1
) = o
2
t
.
A tarefa do investigador a de denir uma funo adequada para o
2
t
. No captulo
8 aborda-se de forma detalhada esta questo.
5.4. DISTRIBUIO DE CONDICIONAL 79
5.4. Distribuio de Condicional
Denida a mdia condicional e a varincia condicional e, eventualmente, out-
ros momentos condicionais de ordem superior, pode haver interesse em modelar
toda a estrutura probabilstica do processo. Para o efeito necessrio no contexto
da equao j
t
=
L
(j
t
[ T
t1
) n
t
com n
t
= o
t
-
t
, especicar uma distribuio
para -
t
. Por exemplo, se a proposta do investigador -
t
~ (0, 1) , resulta que
distribuio condicional de j
t

j
t
[ T
t1
~ (
L
(j
t
[ T
t1
) , Vai (j
t
[ T
t1
)) ,
e toda a estrutura probabilstica ca denida. No contexto do ponto 5.1, a densi-
dade denida para j
t
[ T
t1
representa a funo )
t
(j
t
[ d
t
, T
t1
, ).
CAPTULO 6
Modelao da Mdia: Abordagem Linear
Neste captulo vamos focar modelos lineares na mdia. Considere-se o modelo
j
t
= j
t
n
t
(6.1)
onde n
t
so os erros e j
t
= q (j
t1
, j
t2
, .., j
tj
; n
t1
, n
t2
, ...n
tq
) a mdia
condicional. De acordo com a regra adoptada adiante, entende-se que o modelo
(6.1) linear na mdia se a funo q linear nos seus argumentos. Por exemplo, a
especicao j
t
= cj
t1
0n
t1
linear (a funo q q (r
1
, r
2
) = cr
1
0r
2
)
ao passo que j
t
= cj
2
t1
(q (r) = cr
2
) no linear.
Toma-se como varivel dependente j (pode ser um retorno de um ttulo, a
variao da taxa de cmbio, uma taxa de juro, etc.). Comearemos por admitir que
a nica informao que dispomos sobre j a prpria srie. Como explicar j
t
a
partir da informao T
t1
= j
t1
, j
t2
, ... Se j
t
no est correlacionado de
alguma forma com os seus valores passados j
t1
, j
t2
, ... a abordagem de sries
temporais intil. Pelo contrrio, se existe evidncia de autocorrelao, ento os
valores passados da srie podem explicar parcialmente o movimento de j e um
modelo linear na mdia pode ser apropriado. Na prtica, teremos de escolher um
modelo concreto. Por exemplo, j
t
= c cj
t1
n
t
ou j
t
= c c
1
j
t1

c
2
j
t2
n
t
ou j
t
= c 0
1
n
t1
n
t
entre muitos outros. Como seleccionar
o modelo apropriado? A autocorrelao (total) e autocorrelao parcial so dois
conceitos chave na fase da identicao do modelo. Iremos analis-los de seguida.
6.1. Denies Preliminares
6.1.1. Autocorrelao de Ordem : (FAC). Suponha-se que j um processo
ESO. Para medir a associao linear entre j
t
e j
tc
j vimos que se toma o coe-
ciente de autocorrelao de ordem :,
j
c
=
Cov(j
t
, j
tc
)
_
Vai (j
t
) Vai (j
tc
)
onde
Cov(j
t
, j
tc
) =
L
((j
t
L
(j
t
)) (j
tc
L
(j
tc
)))
=
L
(j
t
j
tc
)
L
(j
t
)
L
(j
tc
) .
81
82 6. MODELAO DA MDIA: ABORDAGEM LINEAR
Convencione-se chamar
c
a Cov (j
t
, j
tc
) e
0
a Vai (j
t
)
1
. Como Vai (j
t
) =
Vai (j
tc
) vem
j
c
=
Cov(j
t
, j
tc
)
_
Vai (j
t
) Vai (j
tc
)
=

c
_
2
0
=

c
0
.
Naturalmente, devido desigualdade de Chaucy-Schwarz
2
, tem-se
[j
c
[ _ 1.
6.1.2. Autocorrelao Parcial de Ordem : (FACP). Quando se calcula a
correlao entre, por exemplo, j
t
e j
t2
, por vezes sucede que a correlao detec-
tada se deve ao facto de j
t
estar correlacionado comj
t1
, e j
t1
, por sua vez, estar
correlacionado com j
t2
. Com a autocorrelao parcial procura-se medir a corre-
lao entre j
t
e j
tc
eliminando o efeito das variveis intermdias, j
t1
, ..., j
tc1
.
A anlise desta forma de autocorrelao importante na medida em que permite,
juntamente com a FAC, identicar o processo linear subjacente.
No mbito do modelo de regresso linear, sabe-se que uma forma de medir a
associao parcial ceteris paribus entre, por exemplo, j e r
1
consiste emconsiderar
a regresso j = ,
0
,
1
r
1
,
2
r
2
... ,
I
r
I
n. Com este procedimento ,
1
representa o efeito ceteris paribus de uma variao unitria de r
1
sobre j. Mede-
se, portanto, o impacto de r
1
sobre j depois do efeito das variveis r
2
, ..., r
I
ter
sido removido ou controlado. Para obtermos as autocorrelaes parciais seguimos
um procedimento similar.
Considere-se:
j
t
= c c
11
j
t1

t
j
t
= c c
21
j
t1
c
22
j
t2

t
j
t
= c c
S1
j
t1
c
S2
j
t2
c
SS
j
tS

t
...
j
t
= c c
c1
j
t1
c
c2
j
t2
... c
cc
j
tc

t
A autocorrelao parcial de ordem i dada pelo coeciente c
ii
. Por exemplo, a
autocorrelao parcial de ordem 2 dada pelo coeciente c
22
na regresso
j
t
= c c
21
j
t1
c
22
j
t2

t
. (6.2)
Podemos usar o OLS para obter

c
22
. Este coeciente mede a relao entre j
t
e
j
t2
depois do efeito de j
t1
ter sido removido. c
II
tambm pode ser estimado
atravs da expresso
c
II
=
t
r
t,I
j
t
t
r
2
t,I
onde r
t,I
o resduo da regresso linear de j
tI
sobre um termo constante e
(j
t1
, ..., j
tI1
) . Os resduos r
t,I
podem ser interpretados como a varivel j
tI
depois dos efeitos das variveis (j
t1
, ..., j
tI1
) terem sido removidos. Assim,
1
Na verdade, adoptando a conveno
s
= L((
I
L(
I
)) (
Is
L(
Is
))) resulta, por
denio,
0
= L((
I
L(
I
)) (
I
L(
I
))) = \ui (
I
) .
2
Suponha-se que L
_
[A[
2
_
< o e L
_
[Y [
2
_
< o. Ento L([AY [)
L
_
[A[
2
_
12
L
_
[Y [
2
_
12
.
6.1. DEFINIES PRELIMINARES 83
c
II
mede o efeito entre j
t
e j
tI
depois do efeito das variveis intermdias ter
sido removido.
Apresenta-se a seguir uma forma de obter c
ii
como funo dos j
t
:. Considere
a regresso linear
j
tc
= c
c1
j
tc1
c
c2
j
tc2
... c
cc
j
t

tc
e suponha-se que Vai (j
t
) = 1 e
L
(j
t
) = 0 (a correlao parcial e total inde-
pendente da origem e da escala das variveis). Multiplicando ambos os termos por
j
tc)
, , = 1, 2, ..., :, tomando os valores esperados e dividindo por
0
obtm-se
o sistema,
j
)
= c
c1
j
)1
... c
cc
j
)c
, = 1, 2, ..., :. (6.3)
Para obter c
11
considera-se a equao (6.3) para : = 1,
j
1
= c
11
j
0
(j
0
= 1).
Donde,
c
11
= j
1
.
Para obter c
22
considera-se o sistema (6.3) com : = 2,
_
j
1
= c
21
c
22
j
1
j
2
= c
21
j
1
c
22
e resolve-se em ordem a c
22
(e em ordem a c
21
). Aplicando, por exemplo, a regra
de Cramer obtm-se
c
22
=
1 j
1
j
1
j
2
1 j
1
j
1
1
=
j
2
j
2
1
1 j
2
1
.
Utilizando o mesmo procedimento pode-se concluir que
c
SS
=
1 j
1
j
1
j
1
1 j
2
j
2
j
1
j
S
1 j
1
j
2
j
1
1 j
1
j
2
j
1
1
=
j
S
2j
1
j
2
j
S
1
j
1
j
2
2
j
2
1
j
S
2j
2
1
j
2
j
2
2
2j
2
1
1
.
Estimativas consistentes de c
II
podem ser naturalmente obtidas a partir dos coe-
cientes estimados j
i
, usando as expresses anteriores.
Pode-se provar que sob H
0
: c
II
= 0,
7 =
_
:
c
II
o
(0, 1) .
6.1.3. Operador de Diferena e de Atraso. O operador diferena ^ bem
conhecido:
^j
t
= j
t
j
t1
,
^
2
j
t
= ^(^j
t
) = ^(j
t
j
t1
) = ^j
t
^j
t1
= j
t
j
t1
(j
t1
j
t2
) = j
t
2j
t1
j
t2
.
O operador de atraso ou de desfasamento 1 (lag) dene-se como
1j
t
= j
t1
.
Resulta da denio,
1
2
j
t
= 1(1j
t
) = 1j
t1
= j
t2
,
1
j
j
t
= j
tj
,
1
j
n
t
= n
tj
.
Naturalmente, podemos combinar os operadores. Por exemplo,
1^j
t
= 1(j
t
j
t1
) = j
t1
j
t2
.
Com o operador 1 podemos escrever, por exemplo,
j
t
c
1
j
t1
c
2
j
t2
= j 0
1
n
t1
n
t
na forma,
j
t
c
1
1j
t
c
2
1
2
j
t
= j 0
1
1n
t
n
t
_
1 c
1
1 c
2
1
2
_
j
t
= j (1 0
1
1) n
t
c
2
(1) j
t
= j 0
1
(1) n
t
.
Naturalmente, c
2
(1) = 1 c
1
1 c
2
1
2
e 0
1
(1) = 1 0
1
1 so polinmios em
1 (em lugar de 1 tambm se usa a letra 1 (backshift)).
6.2. Processos Lineares Estacionrios
A decomposio de Wold fornece uma motivao para os modelos de mdias
mveis (ver a seguir). Wold mostrou que um processo j ESO pode escrever-se na
forma
j
t
= \
t
n
t
c
1
n
t1
c
2
n
t2
... (6.4)
onde n
t
um RB, \
t
um processo determinstico e
o
i=1
c
2
i
< .
A decomposio destaca que qualquer processo ESO tem uma representao
linear nos erros de regresso ocorridos no passado. No entanto, o modelo (6.4)
no pode ser implementado porque existem innitos parmetros para estimar. Em
aplicaes necessrio procurar representaes lineares parcimoniosas, inspiradas
em (6.4), como por exemplo,
j
t
= n
t
0
1
n
t1
(c
1
= 0
1
, c
2
= c
S
= ... = 0)
j
t
= n
t
0
1
n
t1
0
2
n
t2
(c
1
= 0
1
, c
2
= 0
2
, c
S
= c
1
= ... = 0)
Modelos do tipo j
t
= c cj
t1
n
t
podem tambm escrever-se na forma (6.4)
(com restries sobre os c
i
). Veremos que a melhor aproximao linear parci-
moniosa que podemos efectuar estrutura (6.4), supondo \
t
= 0, baseia-se no
chamado modelo ARMA.
6.2.1. Processos Mdia Mvel.
6.2. PROCESSOS LINEARES ESTACIONRIOS 85
6.2.1.1. Processo '(1). O processo MA(1) dado por
j
t
= j 0n
t1
n
t
= j (1 01) n
t
onde n
t
um rudo branco. Este modelo representa j
t
como uma combinao
linear de choques aleatrios (n
t1
e n
t
). Outra forma de interpretarmos o mod-
elo consiste em imaginar que j
t
resulta de um mecanismo de correco: podemos
utilizar o erro cometido no perodo anterior, n
t1
, como regressor (i.e., como var-
ivel explicativa) do modelo (por exemplo, veremos que a previso de j baseia-se,
em parte, no erro de previso cometido no perodo anterior). Este modelo indi-
cado para modelar fenmenos de memria muito curta pois a autocorrelao de j
extingue-se muito rapidamente, como veremos a seguir.
Momentos Marginais
Os primeiros momentos marginais (ou no condicionais) so
L
(j
t
) =
L
(j 0n
t1
n
t
) = j
Vai (j
t
) = Vai (j 0n
t1
n
t
) = 0
2
o
2
o
2
.
Covarincias e Autocorrelaes
1
= Cov (j
t
, j
t1
) =
L
((j
t
j) (j
t1
j))
=
L
((0n
t1
n
t
) (0n
t2
n
t1
))
=
L
_
0
2
n
t1
n
t2
0n
2
t1
0n
t
n
t2
n
t
n
t1
_
= 0 0o
2
0 0
Pode-se provar
c
= 0 para : 1.
O processo j
t
ESO pois
L
(j
t
) e Vai (j
t
) so constantes e
c
no depende
de t. Conclui-se agora que as autocorrelaes so dadas por
j
1
=

1
0
=
0o
2
0
2
o
2
o
2
=
0
0
2
1
.
j
c
= 0 para : 1.
Relativamente s autocorrelaes parciais tem-se
c
11
= j
1
=
0
0
2
1
,
e (pode-se provar)
c
cc
=
0
c
_
1 0
2
_
1 0
2(c1)
.
Momentos Condicionais
Os momentos condicionais so imediatos:
L
(j
t
[ T
t1
) =
L
(j 0n
t1
n
t
[ T
t1
) = j 0n
t1
.
Vai (j
t
[ T
t1
) =
L
_
(j
t
L
(j
t
[ T
t1
))
2
T
t1
_
=
L
_
n
2
t
T
t1
_
= o
2
.
Se n
t
um rudo branco Gaussiano ento
j
t
[ T
t1
~
_
j 0n
t1
, o
2
_
.
Invertibilidade
Considere-se um processo MA(1) (sem perda de generalidade) de mdia nula,
j
t
= 0n
t1
n
t
, onde n
t
um rudo branco. Naturalmente, j pode escrever-se na
forma
j
t
= (1 01) n
t
ou j
t
(1 01)
1
= n
t
Atendendo ao desenvolvimento em srie de potncia de (1 01)
1
,
1
1 01
= 1 01 0
2
1
2
..., [0[ < 1
tem-se, para [0[ < 1,
j
t
(1 01)
1
= n
t
j
t
_
1 01 0
2
1
2
...
_
= n
t
j
t
= 0j
t1
0
2
j
t2
... n
t
. (6.5)
Diz-se neste caso, com [0[ < 1 que j
t
invertvel, isto , tem representao au-
toregressiva
3
. O facto do processo MA(1) (e, mais geralmente, o processo MA(q))
ter representao do tipo (6.5) explica por que razo a funo de autocorrelao
parcial c
ii
no nula para todo o i (porqu?).
A invertibilidade uma propriedade exigvel na previso: garante que a infor-
mao remota sobre o processo irrelevante. Imagine-se o caso contrrio, i.e. o
processo no invertvel. Isto signica que [0[ 1 e, pela equao (6.5), a infor-
mao mais atrasada tem mais peso na previso j (a rigor a representao (6.5) no
est bem denida no caso [0[ 1; no entanto, a ideia essencial mantm-se).
Um processo no invertvel pode transformar-se num processo invertvel com
funes de autocorrelao e autocorrelaes parciais iguais. Com efeito, associado
a um processo MA(1) no invertvel existe sempre um outro processo MA(1) in-
vertvel com a mesma FAC e FACP. Por exemplo, considere-se o processo MA(1)
no invertvel.
j
t
= 4n
t1
n
t
, 0 = 4. (6.6)
3
No caso
I
= j0&
I1
&
I
, [0[ < 1, a representao autoregressiva
I
=

1+0
0
I1
0
2
I2
... &
I
.
Este modelo no serve para previso pois a representao autoregressiva no est
bem denida. O processo (6.6) verica:
j
1
=
0
0
2
1
=
4
4
2
1
=
4
17
j
c
= 0 para : 1
e
c
11
= j
1
=
0
0
2
1
=
4
17
c
cc
=
0
c
_
1 0
2
_
1 0
2(c1)
= 1
4
c
1 4
2c2
.
Ora, o processo
j
t
=
1
4
n
t1
n
t
,

0 =
1
4
tem a mesma FAC e FACP do processo j. Com efeito,
j
1
=

c
11
=

0
0
2
1
=
1
0
_
1
0
_
2
1
=
0
0
2
1
=
4
17
c
cc
=
_
1
0
_
c
_
1
_
1
0
_
2
_
1
_
1
0
_
2(c1)
= 1
4
c
1 4
2c2
.
Na prtica, qual o alcance deste resultado? Se no ocorrer invertibilidade na
fase da estimao devemos denir outros valores iniciais para os parmetros. Por
exemplo, se o programa fornece como estimativa

0 = 4 devemos denir outros
valores iniciais at que o software encontre a estimativa 1,4 para o parmetro do
processo MA. Convm lembrar que a estimao de processos MA envolve proble-
mas de optimizao no linear. Por vezes, a soluo do problema de optimizao
um extremante local (e no global, como desejvel). Podero existir outros
extremantes que sero detectados se denirmos outros valores de inicializao.
6.2.1.2. Processo '(). O processo MA(q) dado por
j
t
= j 0
1
n
t1
0
2
n
t2
... 0
q
n
tq
n
t
,
= j (1 0
1
1 ... 0
q
1
q
) n
t
= j 0
q
(1) n
t
.
O processo j
t
continua a representar-se como uma combinao linear de choques
aleatrios, desta vez, em funo de n
tq
, ... n
t
. Pode-se provar:
L
(j
t
) = j
Vai (j
t
) = o
2
_
1 0
2
1
... 0
2
q
_
j
I
=
_
,= 0 se / = 1, 2, ...,
0 se / = 1, 2, ...
Pode-se provar ainda:
c
II
,= 0, mas c
II
0, quando / .
PROPOSIO 6.2.1. j
t
invertvel se as razes de 0
q
(1) (i.e. as solues de
0
q
(1) = 0) so em mdulo superiores a um (ou fora do circulo unitrio no plano
complexo). Equivalentemente, j
t
invertvel se as razes inversas de 0
q
(1) (i.e.
1,1 onde 1 so as solues de 0
q
(1) = 0) so em mdulo inferiores a um (ou
dentro do circulo unitrio no plano complexo).
No caso MA(1) a proposio 6.2.1 equivalente a exigir [0
1
[ < 1 (ou [1,0
1
[
1). Observe-se que 1,0
1
soluo de 1 0
1
1 = 0. No caso MA(2)
j
t
= j 0
1
n
t1
0
2
n
t2
n
t
= j
_
1 0
1
1 0
2
1
2
_
n
t
a proposio 6.2.1 traduz-se da seguinte forma: j
t
invertvel se
0
1
0
2
1, 0
1
0
2
< 1, 1 < 0
2
< 1.
No caso MA(), 2 necessrio calcular as razes de 0
q
(1) .
EXEMPLO 6.2.1. Verique-se que j
t
=
_
1 0.1 0.11
2
0.1
S
_
n
t
in-
vertvel. Tem-se
0
S
(1) =
_
1 0.1 0.11
2
0.1
S
_
.
Resolvendo 0
S
(1) = 0 em ordem a 1 (atravs de um qualquer software) obtm-se
as seguintes razes
0.42 1.8i, 0.42 1.8i, 1.0
Note-se agora que se uma raiz r complexa, i.e. r = a /i, o mdulo [r[ =
_
a
2
/
2
. Como
[0.42 1.8i[ =
_
.42
2
1.8
2
1 , [1.0[ 1
conclui-se que o processo j
t
=
_
1 0.1 0.11
2
0.1
S
_
n
t
invertvel. O
mtodo dos coecientes indeterminados permite determinar os parmetros c
i
que
guram do lado direito da expresso
1
1 0.1 0.11
2
0.1
S
= 1 c
1
1 c
2
1
2
...
Multiplicando ambos os termos por
_
1 0.1 0.11
2
0.1
S
_
tem-se
1 =
_
1 0.1 0.11
2
0.1
S
_ _
1 c
1
1 c
2
1
2
...
_
.
Depois de se multiplicarem e reordenarem todos os termos do lado direito da ex-
presso anterior vem,
1 = 1 (c
1
0.) 1 (0.1 0.c
1
c
2
) 1
2
...
Desta equao resulta:
_
_
_
c
1
0. = 0
0.1 0.c
1
c
2
= 0
...
Da primeira equao sai c
1
= 0.; da primeira e da segunda sai, c
2
= 0.1, etc.
Em suma
_
1 0.1 0.11
2
0.1
S
_
1
= 1 0.1 0.11
2
0.2 1
S
0.401
1
0.271
...
e, portanto,
j
t
= 0.j
t1
0.1j
t2
0.2j
tS
0.40j
t1
0.27j
t
...
Nota nal: o programa Mathematica (entre outros) calcula facilmente os parmet-
ros c
i
. A instruo
Series[
1
1 0.1 0.11
2
0.1
S
,{L,0,5}].
OBSERVAO 6.2.1. O programa EVIEWS apresenta as razes invertidas do
polinmio 0
q
(1). Nestas condies, o processo j invertvel se as razes in-
vertidas 0
q
(1) forem em mdulo inferiores a um (ou dentro do circulo unitrio
no plano complexo). Segue-se a explicao. Suponha-se que o polinmio MA
0 (1) =
_
1 0.21 0.41
2
_
. As razes de 0 (1):
0 (1) = 0 =1
1
= 0.2 1.6i, 1
2
= 0.2 1.6i
As razes esto fora do crculo unitrio, pois
[1
1
[ =
_
0.2
2
(1.6)
2
= 1.8 1, [1
2
[ = ... = 1.8 1.
Logo o processo j
t
= 0 (1) n
t
invertvel. O programa EVIEWS apresenta
as razes invertidas. No exemplo em anlise, c(1) =
_
1 0.21 0.41
2
_
, o
EVIEWS no apresenta 1
1
e 1
2
mas sim
1
1
1
e
1
1
2
.
Quando as razes so reais bvio que [1[ 1 equivalente a [1,1[ < 1 (1 ,= 0).
Quando as razes so complexas pode-se provar que [1[ 1 tambm equivalente
a [1,1[ < 1. Com efeito, suponha-se que uma raiz de c(1) a/i. Esta raiz est
fora do crculo unitrio se [a /i[ =
_
a
2
/
2
1. A raiz invertida de a /i
1
a /i
=
a
a
2
/
2

/
a
2
/
2
i
e
1
a /i
=
_
_
a
a
2
/
2
_
2
_
/
a
2
/
2
_
2
=
1
_
a
2
/
2
.
Conclui-se, portanto, que
[a /i[ =
_
a
2
/
2
1 =
1
a /i
=
1
_
a
2
/
2
< 1.
Retomando o exemplo c(1) =
_
1 0.21 0.41
2
_
o EVIEWS apresenta
1
0.2 1.6i
= 0.100 16 0.624 07i
1
0.2 1.6i
= 0.100 16 0.624 07i.
Como
_
0.100 16
2
0.624 07
2
= 0.682 0 < 1 o processo j
t
= 0 (1) n
t
in-
vertvel. Em suma, no programa EVIEWS as razes invertidas 0
q
(1) devem ser em
mdulo inferiores a um (ou dentro do circulo unitrio no plano complexo). Vere-
mos ainda que as razes invertidas do polinmio AR c(1) devem tambm ser em
mdulo inferiores a um (ou dentro do circulo unitrio no plano complexo) para
que o processo seja ESO.
EXEMPLO 6.2.2. Retome-se o exemplo 6.2.1. O programa EVIEWS em lugar
de fornecer as razes
0.42 1.8i, 0.42 1.8i, 1.0
fornece as razes invertidas, i.e., o lado direito das seguintes expresses:
1
0.42 1.8i
= 0.22 0.606i,
1
0.42 1.8i
= 0.22 0.606i,
1
1.0
= 0.02.
Assim, no programa EVIEWS as razes invertidas de 0
q
(1) devem ser em mdulo
inferiores a um (ou dentro do circulo unitrio no plano complexo). Verique que
[0.22 0.606i[ < 1, [0.22 0.606i[ < 1, [0.02[ < 1.
6.2.2. Processos Autoregressivos.
6.2.2.1. Processo AR(1). O processo AR(1) dado por
j
t
= c cj
t1
n
t
(6.7)
onde n
t
rudo branco independente de j
t1
. Este modelo muito importante
porque reproduz razoavelmente a dinmica de muitas sries econmicas e nan-
ceiras.
Momentos Marginais
Comece-se por calcular a mdia marginal
L
(j
t
) =
L
(c cj
t1
n
t
) = c c
L
(j
t1
) .
(temos uma equao recorrente em
L
(j
t
): este valor esperado depende de
L
(j
t1
)
que, por sua vez, depende de
L
(j
t2
) e assim sucessivamente). Se assumirmos
partida a condio de ESO (implicando
L
(j
t
) =
L
(j
t1
) =
L
(j)) vem
L
(j) = c c
L
(j) =
L
(j) =
c
1 c
Seguindo um raciocnio idntico vem:
Vai (j
t
) = Vai (c cj
t1
n
t
) = c
2
Vai (j
t1
) Vai (n
t
)
= c
2
Vai (j
t1
) o
2
Sob a hiptese de ESO, tem-se Vai (j
t
) = Vai (j
t1
) = Vai (j) e, portanto,
Vai (j
t
) = c
2
Vai (j) o
2
= Vai (j) =
o
2
1 c
2
.
Covarincias e Autocorrelaes
Calcule-se agora as covarincias. Como estas no dependem da mdia de j
t
,
simplique-se fazendo c = 0. Suponha-se [c[ < 1. A covarincia
1
dada por
1
= Cov (j
t
, j
t1
) =
L
(j
t
j
t1
)
=
L
(
L
(j
t
j
t1
[T
t1
)) =
L
(j
t1 L
(j
t
[T
t1
))
=
L
(j
t1 L
(cj
t1
n
t
[T
t1
)) =
L
_
cj
2
t1
_
= c
o
2
1 c
2
.
A covarincia de ordem /
I
=
L
(j
t
j
tI
) =
L
(
L
(j
t
j
tI
[T
tI
)) =
L
(j
tI L
(j
t
[T
tI
))
Para desenvolvermos a expresso precisamos de calcular primeiro
L
(j
t
[T
tI
) .
Ora
j
t
= cj
t1
n
t
= c(cj
t2
n
t1
) n
t
= c
2
j
t2
cn
t1
n
t
= ... = j
tI
c
I
n
tI1
c
I1
n
tI2
c
I2
... n
t1
c n
t
pelo que
L
(j
t
[ T
t1
) = j
tI
c
I
(todos os outros termos so nulos). Tem-se assim,
I
=
L
_
j
tI
j
tI
c
I
_
= c
I
L
_
j
2
tI
_
= c
I
o
2
1 c
2
= c
I
0
.
Uma forma alternativa de obter este valor a seguinte. Multiplique-se ambos os
termos da equao (6.7) por j
tI
(sem perda de generalidade, considere-se c = 0).
Resulta
j
t
j
tI
= cj
t1
j
tI
n
t
j
tI
.
Tomando o valor esperado e tendo em conta que
L
(n
t
j
tI
) = 0, obtm-se
I
= c
I1
.
Logo,
1
= c
0
,
2
= c
1
= c
2
0
...
I
= c
I
0
.
Finalmente,
j
I
=

I
0
=
c
I
0
= c
I
.
Tendo em conta a denio de autocorrelao parcial, tem-se:
j
t
= c c
11
j
t1

t
=c
11
= j
1
j
t
= c c
21
j
t1
c
22
j
t2

t
=c
22
= 0
Assim,
c
II
=
_
j
1
se / = 1
0 se / 1
Os dois primeiros momentos condicionais so
L
(j
t
[ T
t1
) =
L
(j
t
[ j
t1
) =
L
(cj
t1
n
t
[ j
t1
) = cj
t1
,
Vai (j
t
[ T
t1
) =
L
_
(j
t
cj
t1
)
2
j
t1
_
=
L
_
n
2
t
j
t1
_
= o
2
.
Se n
t
j
t
[ T
t1
~
_
cj
t1
, o
2
_
.
PROPOSIO 6.2.2. Se [c[ < 1 ento o processo AR(1) ESO.
DEM. Considere-se sem perda de generalidade c = 0 :
j
t
= cj
t1
n
t
= c
t
j
0
c
t1
n
1
c
t2
n
2
... cn
t1
n
t
. (6.8)
Admite-se que o processo tem incio em t = 0 em condies estacionrias:
L
(j
0
) = 0 e Vai (j
0
) =
L
_
j
2
0
_
=
o
2
1 c
2
(naturalmente pode tambm supor-se que j tem incio em e nesse caso no
necessrio iniciar o processo em condies estacionrias). Analisa-se a seguir a
mdia, o segundo momento e as covarincias.
Mdia:
L
(j
t
) =
L
(
L
(j
t
[ T
0
)) = c
t
L
(j
0
) = 0, \c.
Segundo Momento:
L
_
j
2
t
_
=
L
_
L
_
j
2
t
T
0
__
=
L
_
L
_
_
c
t
j
0
c
t1
n
1
c
t2
n
2
... cn
t1
n
t
_
2
T
0
__
=
L
_
L
__
c
2t
j
2
0
c
2(t1)
n
2
1
c
2(t2)
n
2
2
... c
2
n
2
t1
n
2
t
...
_
T
0
__
=
L
_
c
2t
j
2
0
c
2(t1)
o
2
c
2(t2)
o
2
... c
2
o
2
o
2
_
= c
2t
L
_
j
2
0
_
o
2
_
c
2(t1)
c
2(t2)
... c
2
1
_
= c
2t
o
2
1 c
2
o
2
_
c
2(t1)
c
2(t2)
... c
2
1
_
Se [c[ < 1 vem
L
_
j
2
t
_
= c
2t
o
2
1 c
2
o
2
1 c
2t
1 c
2
=
o
2
1 c
2
(constante \t).
Covarincias: J vimos que [c[ < 1 implica
I
= c
I
0
e j
I
= c
I
. Em suma, se
[c[ < 1 ento a mdia, a varincia e a covarincia no dependem de t, supondo
que a condio inicial tem distribuio estacionria ou que o processo foi iniciado
num passado remoto.
OBSERVAO 6.2.2. Se o processo AR(1) no inicializado em condies
estacionrias mas [c[ < 1, ento os momentos marginais convergem para os mo-
mentos estacionrios quando t .
OBSERVAO 6.2.3. Seguindo a demonstrao anterior, possvel concluir
que o caso c = 1 implica:
L
(j
t
) =
L
(
L
(j
t
[ T
0
)) = c
t
L
(j
0
) .
L
_
j
2
t
_
=
L
_
j
2
0
_
o
2
t.
L
(j
t
j
tI
) =
L
(
L
(j
t
j
tI
[T
tI
)) =
L
(j
tI L
(j
t
[T
tI
))
=
L
((n
0
n
1
n
2
... n
tI
)
L
(j
t
[T
tI
))
=
L
((n
0
n
1
n
2
... n
tI
) (n
0
n
1
n
2
... n
tI
))
=
L
_
n
2
0
n
2
1
n
2
2
... n
2
tI
_
= o
2
(t / 1) (depende de t)
=
t,I
.
t,I
0,I
=
o
2
(t / 1)
o
2
t
=
t / 1
t
= 1
/ 1
t
= j
t,I
.
Invertibilidade
O processo AR sempre invertvel (por denio j tem representao autore-
gressiva).
Reverso para a Mdia
Processos estacionrios commdia nita so, por vezes, designados por proces-
sos com reverso para a mdia. Exemplique-se com o processo AR(1)
j
t
= c cj
t1
n
t
, [c[ < 1.
Como j =
c
1
= c = j(1 c) (note-se que j a mdia de j,
L
(j
t
)) podemos
reescrever o AR(1) na seguinte forma:
j
t
= j(1 c) cj
t1
n
t
^j
t
= j(1 c) (c 1) j
t1
n
t
= (c 1) (j
t1
j) n
t
Esta ltima equao permite estabelecer as seguintes relaes:
(j
t1
j) 0 =
L
(^j
t
[ T
t1
) < 0
(j
t1
j) < 0 =
L
(^j
t
[ T
t1
) 0.
Por exemplo, se num certo perodo (digamos t 1) o valor de j est acima da
sua mdia de longo prazo j (i.e. j est relativamente alto) no perodo seguinte j
tender a diminuir de valor pois
L
(^j
t
[ T
t1
) < 0. Quando c positivo (esta
a situao habitual em aplicaes), possvel concluir que quanto mais alto for
c (sem, contudo ultrapassar o valor 1) mais lenta a velocidade de ajustamento
de j em direco sua mdia de longo prazo. Suponha que o processo j sofre
um choque aleatrio considervel (ou que inicializado num valor afastado da sua
mdia de longo prazo). Como que j evolui nos perodos seguintes? Tende a
-20
0
20
40
60
80
100
120
1 26 51 76 101 126 151 176
t
y
fhi=0.1
fhi=0.8
fhi=0.98
fhi=1
FIGURA 6.1. Simulao de quatro processos AR(1) (choques
aleatrios n
t
iguais e valor de inicializao j
0
= 0)
aproximar-se rapidamente ou lentamente de j? (pode mesmo suceder que no haja
qualquer efeito de reverso para uma medida de tendncia central se, no limite,
c = 1). Na gura 6.1 esto representados quatro processos AR(1) simulados de
acordo com o modelo
j
t
= 100 (1 c) cj
t1
n
t
, n
t
rudo branco (0, 1) .
Em todos os casos, o valor de inicializao j
0
= 0 e usam-se os mesmos erros n.
Quanto mais alto o valor c mais lento o ajustamento de j face mdia de longo
prazo j. No caso c = 1 no existe reverso para j, embora o processo possa cruzar
j = 100 (assim como qualquer outro valor do espao de estado de j) algures no
tempo.
Representao MA()
Umprocesso AR(1) (ou mais geralmente umAR(p)) estacionrio pode representar-
se como um MA(). J vimos
j
t
= cj
t1
n
t
= c
t
j
0
c
t1
n
1
c
t2
n
2
... cn
t1
n
t
Podemos continuar o procedimento recursivo:
j
t
= c
t
(cj
1
n
0
) c
t1
n
1
c
t2
n
2
... cn
t1
n
t
= c
t1
j
1
c
t
n
0
c
t1
n
1
c
t2
n
2
... cn
t1
n
t
= ...c
2
n
t2
cn
t1
n
t
.
Para obtermos este resultado podemos tomar um caminho alternativo. Considere-
se
j
t
= cj
t1
n
t
=j
t
(1 c1) = n
t
=j
t
=
1
1 c1
n
t
.
Supondo [c[ < 1 tem-se
1
1 c1
= 1 c1 c
2
1
2
...
Logo
j
t
=
1
1 c1
n
t
=
_
1 c1 c
2
1
2
...
_
n
t
= n
t
cn
t1
c
2
n
t2
...
6.2.2.2. Processo AR(j). Um processo AR(p) uma simples generalizao
do AR(1):
j
t
= c c
1
j
t1
... c
j
j
tj
n
t
.
Este modelo pode ainda representar-se nas seguintes formas alternativas:
_
1 c
1
1 ... c
j
1
j
_
j
t
= c n
t
, ou
c
j
(1) j
t
= c n
t
.
Momentos Marginais (ou no condicionais)
Assumindo a condio de ESO, vem
L
(j
t
) =
L
_
c c
1
j
t1
... c
j
j
tj
n
t
_
= cc
1
L
(j
t1
)...c
j
L
(j
tj
)
L
(j) = c c
1
L
(j) ... c
j
L
(j) =
L
(j) =
c
1 c
1
... c
j
.
Para obtermos a varincia til considerar (sem perda de generalidade faa-se
c = 0 =
L
(j) = 0):
j
t
= c
1
j
t1
... c
j
j
tj
n
t
j
2
t
= c
1
j
t1
j
t
... c
j
j
tj
j
t
n
t
j
t
L
_
j
2
t
_
= c
1
L
(j
t1
j
t
) ... c
j
L
(j
tj
j
t
)
L
(n
t
j
t
)
L
_
j
2
t
_
= c
1
1
... c
j
j
o
2
0
= c
1
1
... c
j
j
o
2
.
As covarincias so obtidas de forma similar (sem perda de generalidade faa-se
c = 0 =
L
(j) = 0):
j
t
= c
1
j
t1
... c
j
j
tj
n
t
j
t
j
tI
= c
1
j
t1
j
tI
... c
j
j
tj
j
tI
n
t
j
tI
L
(j
t
j
tI
) = c
1
L
(j
t1
j
tI
) ... c
j
L
(j
tj
j
tI
)
L
(n
t
j
tI
)
I
= c
1
I1
... c
j
Ij
0
= c
1
I1
0
... c
j
Ij
0
j
I
= c
1
j
I1
... c
j
j
Ij
/ _ 1.
Pode-se provar que a soluo geral da equao s diferenas nitas (determins-
tica)
4
da forma
j
I
= c
1
r
I
1
... c
j
r
I
j
,
onde c
i
constante arbitrrias e r
i
= 1,.
i
e .
i
so razes do polinmio c
j
(1). Pode-
se provar que sob a condio de ESO os coecientes de autocorrelao j
I
no se
anulam mas tendem para zero quando / 0.
Estacionaridade
PROPOSIO 6.2.3. O processo AR(p) estacionrio de segunda ordem sse as
razes da equao c
j
(1) = 0 so em mdulo superiores a um (ou fora do circulo
unitrio no plano complexo).
DEM. Apresenta-se um esboo da demonstrao. A ESO pode ser analisada
convertendo a equao j
t
= c
1
j
t1
... c
j
j
tj
n
t
num sistema de equaes
lineares mediante as seguintes mudanas de variveis:
j
1,t
= j
t
, j
2,t
= j
t1
, ..., j
j,t
= j
tj1
.
Tem-se
j
1,t
= c c
1
j
t1
... c
j
j
tj
n
t
j
2,t
= j
1,t1
.
.
.
j
j,t
= j
j1,t.
De forma compacta, tem-se uma estrutura de um processo vectorial AR(1), habit-
ualmente designado por VAR(1) (vector AR), y
t
= c Ay
t1
g
t
, i.e.
_
_
_
_
_
j
1,t
j
2,t
.
.
.
j
j,t
_
_
_
_
_
. .
y
I
=
_
_
_
_
_
c
1
c
2
c
a1
c
a
1 0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0 1 0
_
_
_
_
_
. .
A
_
_
_
_
_
j
1,t1
j
2,t1
.
.
.
j
j,t1
_
_
_
_
_
. .
y
I1
_
_
_
_
_
n
t
0
.
.
.
0
_
_
_
_
_
. .
g
I
Resolvendo recursivamente o sistema y
t
= Ay
t1
g
t
(dada a condio inicial 1
0
)
obtm-se
y
t
= A
t
y
0
A
t1
g
1
A
t2
g
2
... Ag
t1
g
t
.
relativamente bvio que devemos exigir A
t
O (matriz nula) quando t .
Por exemplo se A
t
Oquando t ento
L
(y
t
[ T
0
) = A
t
y
0
0 (vector nulo)
(isto
L
(y
t
[ T
0
) converge para a sua mdia marginal, se A
t
O). Seja A =
oiag (`
1
, ..., `
a
) a matriz dos valores prprios de A e I a matriz dos vectores
prprios associados (admitem-se linearmente independentes). Como se sabe da
lgebra linear, verica-se a igualdade A
t
= IA
t
I
1
. Logo devemos exigir que
4
Quase diramos que esta equao um processo AR(p) no fosse o facto de no possuir termo
aleatrio. De forma rigorosa, podemos dizer que uma equao (linear) s diferenas nitas, de
ordem j (de coecientes constantes). Esta terminologia usada na rea dos sistemas dinmicos em
tempo discreto.
todos os valores prprios de A sejam em mdulo menores do que um. S nestas
condies se tem A
t
O. Pode-se provar que esta condio equivalente
seguinte: o processo AR(p) estacionrio sse as razes da equao c
j
(1) = 0
esto todas fora do crculo unitrio no plano complexo.
No caso AR(1) a raiz de c(1) = 0 fcil de obter:
(1 c1) = 0 =1 =
1
c
Devemos exigir
1
c
1 =[c[ < 1.
No caso AR(2) pode-se provar que a condio de ESO :
c
1
c
2
< 1, c
2
c
1
< 1, 1 < c
2
< 1
(estas condies baseiam-se evidentemente na proposio anterior).
No caso AR(j) com j 2 no temos outra alternativa seno calcular (por
exemplo, atravs do programa Mathematica) as razes de c
j
(1) = 0.
Suponha-se que j ESO. Nestas condies, pode-se provar:
j
I
= c
1
j
I1
c
2
j
I2
... c
j
j
Ij
, / _ 1
j
I
no se anulam mas j
I
0 quando / .
c
II
=
_
,= 0 se / = 1, 2, ..., j
0 se / = j 1, j 2, ...
bvio que c
II
= 0 se / j. Por exemplo c
j1,j1
= 0 porque
j
t
= c
1
j
t1
... c
j
j
tj
0j
tj1
n
t
6.2.3. Processos ARMA. Por que no combinar os dois processos AR e MA?
isso que se prope com o modelo ARMA. No caso geral ARMA(p,q) (i.e. AR(p)
+ MA(q)) o modelo representa-se em qualquer uma das seguintes formas alterna-
tivas:
j
t
= c
1
j
t1
... c
j
j
tj
0
1
n
t1
... 0
q
n
tq
n
t
j
t
c
1
j
t1
... c
j
j
tj
= n
t
0
1
n
t1
... 0
q
n
tq
_
1 c
1
1 ... c
j
1
j
_
j
t
= (1 0
1
1 ... 0
q
1
q
) n
t
c
j
(1) j
t
= 0
q
(1) n
t
j
t
=
0
q
(1)
c
j
(1)
n
t
.
Ainda outra alternativa baseia-se no desenvolvimento em srie de potncias de 1
da funo racional 0
q
(1) ,c
j
(1). Obtm-se
j
t
= n
t
c
1
n
t1
c
2
n
t2
...
Esta expresso no corresponde decomposio de Wold (porque estes c
t
: esto
sujeitos a restries), mas constitui a melhor aproximao linear decomposio,
FAC
-1
-0.5
0
0.5
1
1 3 5 7 9 11 13 15 17 19
FACP
-1
-0.5
0
0.5
1
1 3 5 7 9 11 13 15 17 19
FAC
-1
-0.5
0
0.5
1
1 3 5 7 9 11 13 15 17 19
FACP
-1
-0.5
0
0.5
1
1 3 5 7 9 11 13 15 17 19
FAC
-1
-0.5
0
0.5
1
1 3 5 7 9 11 13 15 17 19
FACP
-1
-0.5
0
0.5
1
1 3 5 7 9 11 13 15 17 19
FAC
-1
-0.5
0
0.5
1
1 3 5 7 9 11 13 15 17 19
FACP
-1
-0.5
0
0.5
1
1 3 5 7 9 11 13 15 17 19
FIGURA 6.2. FAC e FACP tericas associadas aos seguintes
cenrios (de cima para baixo): (a) c
1
0, c
2
0; (b) c
1
< 0,
c
2
0; (c) c
1
0, c
2
< 0; (d) c
1
< 0, c
2
< 0.
baseada numa estrutura linear (a qualidade da aproximao aumenta quando j e
aumentam).
Aestacionaridade depende da estrutura AR. Concretamente, o processo ARMA(p,q)
estacionrio sse as razes da equao c
j
(1) = 0 esto todas fora do crculo
unitrio no plano complexo. A invertibilidade depende da estrutura MA. Concre-
tamente, o processo ARMA invertvel sse as razes de 0
q
(1) esto todas fora do
circulo unitrio no plano complexo. Na tabela 1 apresenta-se um quadro resumo
das principais propriedades do modelos AR, MA e ARMA.
Nas guras 6.3 e 6.4 encontram-se as FAC e FACP de vrios processos lineares
simulados (: = 0000). Procure identic-los
5
.
5
Observe que as FAC e FACP so obtidas a partir de processos simulados e, portanto, no cor-
respondem s funes tericas; por esta razo, embora alguns coecientes populacionais sejam zero,
os respectivos coecientes estimados podem no ser iguais a zero (de facto, quase uma impossibil-
idade virem exactamente iguais a zero). Assuma que os coecientes estimados muito baixos no so
estatisticamente signicativos.
FAC
-0.3
-0.2
-0.1
0
0.1
1 2 3 4 5 6 7 8 9 10
FACP
-0.4
-0.3
-0.2
-0.1
0
0.1
1 2 3 4 5 6 7 8 9 10
FAC
0
0.1
0.2
0.3
0.4
0.5
0.6
1 2 3 4 5 6 7 8 9 10
FACP
-0.1
0
0.1
0.2
0.3
0.4
0.5
0.6
1 2 3 4 5 6 7 8 9 10
FAC
-0.4
-0.3
-0.2
-0.1
0
0.1
0.2
1 2 3 4 5 6 7 8 9 10
FACP
-0.4
-0.3
-0.2
-0.1
0
0.1
1 2 3 4 5 6 7 8 9 10
FAC
-0.1
0
0.1
0.2
0.3
0.4
0.5
1 2 3 4 5 6 7 8 9 10
FACP
-0.4
-0.2
0
0.2
0.4
0.6
1 2 3 4 5 6 7 8 9 10
FAC
0.9988
0.999
0.9992
0.9994
0.9996
0.9998
1
1 2 3 4 5 6 7 8 9 10
FACP
-0.2
0
0.2
0.4
0.6
0.8
1
1.2
1 2 3 4 5 6 7 8 9 10
FAC
-0.1
0
0.1
0.2
0.3
0.4
0.5
0.6
1 2 3 4 5 6 7 8 9 10
FACP
-0.4
-0.2
0
0.2
0.4
0.6
1 2 3 4 5 6 7 8 9 10
FAC
-0.1
0
0.1
0.2
0.3
0.4
0.5
1 2 3 4 5 6 7 8 9 10
FACP
-0.3
-0.2
-0.1
0
0.1
0.2
0.3
0.4
0.5
1 2 3 4 5 6 7 8 9 10
FIGURA 6.3. FAC e FACP de 7 processos simulados a partir de
: = 0000 observaes. Qual a ordem j e dos processos? (A
resposta a esta questo encontra-se na tabela 2)
AR(p) MA(q) ARMA(p,q)
Modelo c
j
(1) j
t
= n
t
0
1
j
(1) j
t
= n
t
0
1
j
(1) c
j
(1) j
t
= n
t
em j
t
Srie nita em j
t
Srie innita em j
t
Srie innita em j
t
Modelo j
t
= c
1
j
(1) n
t
j
t
= 0
j
(1) n
t
j
t
= c
1
j
(1) 0
j
(1) n
t
em n
t
Srie innita em n
t
Srie nita em n
t
Srie innita em n
t
Estac. Razes c
j
(1) = 0 Sempre Razes c
j
(1) = 0
fora do crc. unitr. estacionrios fora do crc. unitr.
Invertib. Sempre Razes 0
j
(1) = 0 Razes 0
j
(1) = 0
invertveis fora do crc. unitr. fora do crc. unitr.
FAC Decaimento expo- Decaimento brusco Decaimento expo-
nencial e/ou sinu- para zero a partir de nencial e/ou sinu-
soidal para zero / = 1 soidal para zero
FACP Decaimento brusco Decaimento expo- Decaimento expo-
para zero a partir de nencial e/ou sinu- nencial e/ou sinu-
/ = j 1 soidal para zero soidal para zero
Fonte: Murteira et al. (1993), pg. 69
TABELA 1. Resumo das principais propriedades dos modelos
AR, MA e ARMA
MA AR
0
1
0
2
0
S
0
1
c
1
c
2
c
S
c
1
Modelo
Figura 6.3
1 .4 .4 .1 0 0 0 0 0 MA(3)
2 0 0 0 0 .4 .2 0 0 AR(2)
3 .4 0 .4 0 0 0 0 0 MA(3)
4 0 0 0 0 .4 .2 .2 0 AR(3)
5 0 0 0 0 1 0 0 0 AR(1)
6 1 0 0 0 0 0 0 0 MA(1)
7 0 0 . 0 0 0 0 0 MA(3)
Figura 6.4
1 0 0 0 0 0 0 0 .0 AR(4)
2 .8 0 0 0 .8 0 0 0 ARMA(1,1)
3 0 0 0 .8 0 0 0 .8 ARMA(4,4)
4 0 0 0 0 .4 .2 .1 .1 AR(4)
5 0 0 0 0 0 0 0 0 RBranco
6 . 0 0 0 . 0 0 0 RBranco
TABELA 2. Solues das questes colocadas nas duas guras anteriores
A tabela 2 identica os processos simulados nas guras 6.3 e 6.4.
6.3. Processos Lineares No Estacionrios
No mbito dos processos lineares usual identicar dois tipos de no esta-
cionaridade:
6.3. PROCESSOS LINEARES NO ESTACIONRIOS 101
FAC
-0.2
0
0.2
0.4
0.6
0.8
1
1 2 3 4 5 6 7 8 9 10
FACP
-0.2
0
0.2
0.4
0.6
0.8
1
1 2 3 4 5 6 7 8 9 10
FAC
0
0.2
0.4
0.6
0.8
1
1 2 3 4 5 6 7 8 9 10
FACP
-1
-0.5
0
0.5
1
1 2 3 4 5 6 7 8 9 10
FAC
0
0.2
0.4
0.6
0.8
1
1 2 3 4 5 6 7 8 9 10
FACP
-1
-0.5
0
0.5
1
1 2 3 4 5 6 7 8 9 10
FAC
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
1 2 3 4 5 6 7 8 9 10
FACP
-0.2
0
0.2
0.4
0.6
0.8
1 2 3 4 5 6 7 8 9 10
FAC
-0.4
-0.2
0
0.2
0.4
1 2 3 4 5 6 7 8 9 10
FACP
-0.4
-0.2
0
0.2
0.4
1 2 3 4 5 6 7 8 9 10
FAC
-0.4
-0.2
0
0.2
0.4
1 2 3 4 5 6 7 8 9 10
FACP
-0.4
-0.2
0
0.2
0.4
1 2 3 4 5 6 7 8 9 10
FIGURA 6.4. Continuao da gura anterior
no estacionaridade na mdia:
L
(j
t
) no constante ou
L
(j
t
) = ;
no estacionaridade na varincia: Vai (j
t
) no constante ou Vai (j
t
) =
.
6.3.1. No Estacionaridade na Mdia. Seja j
t
um processo no estacionrio
linear. A estacionarizao da mdia faz-se usualmente a partir do operador difer-
ena
^
o
j
t
= ^^...^
. .
d vezes
j
t
onde d um inteiro positivo.
Este procedimento sugere que:
se o logaritmo do PIB no estacionrio (na mdia) ento a taxa de vari-
ao do PIB (d = 1) poder ser estacionria;
se a taxa de desemprego no estacionria ento a variao da taxa de
desemprego (d = 1) poder ser estacionria;
se o logaritmo do IPC (dados anuais, para simplicar) no estacionrio
e se a inao no estacionria (d = 1) ento a variao da inao
(d = 2) poder ser estacionria.
Normalmente uma diferenciao (d = 1) suciente e raramente se considera
d = 2 (a no ser para certos ndices de preos).
DEFINIO 6.3.1. Um processo j
t
diz-se um ARIMA(p,d,q) se
c
j
(1) ^
o
j
t
= c 0
q
(1) n
t
onde j, d e so inteiros positivos.
Assim, se j
t
~ ARIMA(p,d,q), ento j
t
um processo no estacionrio que
depois de diferenciado d vezes um processo ARMA(p,q), isto ,
^
o
j
t
~ 1'(j, ) .
A letra I em ARIMA designa integrated. Diz-se que um processo j integrado
de ordem d se o polinmio autoregressivo de j possui d razes (mltiplas) iguais
a um. Por exemplo, o polinmio autoregressivo associado ao processo passeio
aleatrio, j
t
= j
t1
n
t
, c(1) = 1 1, possui uma raiz unitria, pois a soluo
de 1 1 = 0 obviamente 1 = 1.
EXEMPLO 6.3.1. Considere-se
j
t
= (1 c) j
t1
cj
t2
n
t
c
1
= 1 c, c
2
= c, 0 < c < 1
No se tem um processo ESO pois uma das condies seguintes no satisfeita
c
1
c
2
< 1, c
2
c
1
< 1, 1 < c
2
< 1
Considere-se ^j
t
= j
t
j
t1
. Tem-se
j
t
= (1 c) j
t1
cj
t2
n
t
j
t
j
t1
= cj
t1
cj
t2
n
t
^j
t
= c^j
t1
n
t
.
Logo ^j
t
um processo estacionrio (AR(1) com [c[ < 1). De forma equivalente,
j
t
um ARIMA(1,1,0).
Este exemplo indica o caminho a seguir quando j no estacionrio. Em
lugar de se analisar j, analisa-se ^j
t
. Esta transformao envolve a perda de
uma observao na amostra, mas vrios resultados para j (como por exemplo a
previso) podem ser facilmente recuperados a partir da especicao e estimao
do modelo para ^j
t
.
EXEMPLO 6.3.2. No caso j
t
= 2j
t1
j
t2
n
t
(n
t
um 11), j no
estacionrio. Porqu? Uma diferenciao produz:
^j
t
= ^j
t1
n
t
.
Logo ^j
t
um processo AR(1) com c = 1. Assim d = 1 no suciente para
estacionarizar o processo. Uma nova diferenciao produz:
^j
t
^j
t1
= n
t
^
2
j
t
= n
t
.
Assim^
2
j
t
umprocesso estacionrio (neste caso umRB). (Recorde-se: ^
2
j
t
=
j
t
2j
t1
j
t2
). De forma equivalente, j
t
um ARIMA(0,2,0).
EXEMPLO 6.3.3. O processo ARIMA(1,1,1) escreve-se nas seguintes formas
equivalentes:
(1 c1) (1 1)
. .
.
j
t
= c (1 01) n
t
(1 c1) (j
t
j
t1
) = c n
t
0n
t1
j
t
j
t1
cj
t1
cj
t2
= c n
t
0n
t1
j
t
= j
t1
cj
t1
cj
t2
c n
t
0n
t1
.
Processos com tendncia determinstica
Considere-se, por exemplo,
j
t
= c ,t n
t
, n
t
rudo branco.
Este processo no estacionrio pois
L
(j
t
) = c ,t depende de t. A no esta-
cionaridade nestes casos no to grave como no caso anterior (por exemplo, a
varincia de j constante). A literatura por vezes designa estes processos como
estacionrios em tendncia, pois removendo a tendncia o processo resulta esta-
cionrio. O operador diferena tambm estacionariza o processo. Com efeito,
^j
t
= c ,t n
t
(c , (t 1) n
t1
) = , n
t
n
t1
.
Esta transformao envolve um custo: cria-se articialmente um erro MA(1) no
invertvel. A soluo prefervel foi j sugerida no pargrafo anterior: basta re-
mover a tendncia e, para o efeito, estima-se o modelo pelo mtodo dos mnimos
quadrados. Claro que a estimao no feita no quadro clssico (porque falha a
hiptese de estacionaridade) mas, neste caso muito concreto, pode-se provar que o
estimador dos mnimos quadrados consistente
6
.
6
Na verdade mais do que isso: o estimador superconsistente (converge para o verdadeiro
parmetro a uma taxa mais alta do que o habitual). Por exemplo, o estimador OLS para , verica
n
_
, ,
_

0, n
32
_
, ,
_
u
òvio|.
Enquanto a varincia do estimador OLS habitual proporcional a 1n a do estimador superconsis-
tente acima referido, proporcional a 1n
3
.
-40
-30
-20
-10
0
10
20
500 1000 1500 2000
FIGURA 6.5. Passeio Aleatrio
Na prtica, como detectamos a existncia de um processo no estacionrio na
mdia?
7
O grco da srie pode sugerir a presena de um processo no esta-
cionrio. Na gura 6.5 traa-se uma trajectria de um processo passeio
aleatrio. Observe-se que o processo parece vaguear sem rumo no in-
tervalo (40, 20) . No ntido a existncia de um efeito de reverso
para qualquer medida de tendncia central. Alm disso, a ocorrncia de
choques mais fortes parece fazer deslocar o processo para outro nvel (os
choques so persistentes).
Como se sabe a FAC do processo j
t
= j
t1
n
t

j
t,I
= 1
/
t
1.
Assim, se FAC(estimada) de umcerto processo, apresentar, nos primeiros
lags, valores muito altos (prximos de um), poderemos suspeitar que o
processo no estacionrio. A gura 6.20 ilustra a ideia: apresenta-se a
FAC estimada associada ao passeio aleatrio representado na gura 6.5
Faz-se um teste de raiz unitria (por exemplo o teste ADF).
Teste ADF (Augmented Dickey-Fuller)
Faz-se um breve resumo dos principais procedimentos.
7
Por que no estimar logo o modelo e vericar depois se as razes do polinmio c(1) = 0 sat-
isfazem a proposio 6.2.3? Este procedimento no aconselhvel. Como as razes so estimativas,
devemos ensaiar a hiptese subjacente proposio 6.2.3 (as razes devem ser em modulo maiores
do que um para o processo ser estacionrio). Todavia, sob 1
0
o processo no estacionrio e as
distribuies assimptticas habituais no so vlidas. Felizmente, existem testes adequados como,
por exemplo, o teste Dickey-Fuller. Para concluir: prefervel, na fase da estimao, termos um
processo j estacionrio (ou, por outras palavras, a anlise da estacionaridade precede a estimao
do modelo).
FIGURA 6.6. FAC (e FACP) estimada do processo passeio
aleatrio representado na gura 6.5.
(1) Teste DF for random walk without drift
Considere-se j
t
= j
t1
n
t
onde n
t
um RB. J se sabe que este processo
(passeio aleatrio) no estacionrio. Assim faria sentido testar H
0
: c = 1 vs.
H
1
: [c[ < 1 na especicao j
t
= cj
t1
n
t
(se existisse evidncia a favor de H
0
concluiramos, ao nvel de signicncia xado, que o processo no estacionrio).
Como j
t
= cj
t1
n
t
se pode escrever na forma
^j
t
= j
t1
n
t
com = c1, ensaiar H
0
: c = 1 equivalente a ensaiar H
0
: = 0. Observe-se
ainda que, sob H
0
, o processo j possui uma raiz unitria. Isso bvio, tendo em
conta que a raiz do polinmio AR, c(1) = 1 1, igual a 1.
Parece bvio a construo do teste estatstico: calcula-se o rcio-t , o
e de-
pois consulta-se a tabela da t-Student. Este procedimento incorrecto. Com efeito,
sob H0, j no estacionrio pelo que o rcio-t , o
no tem distribuio t-Student

nem mesmo distribuio assimptoticamente normal. A hiptese de estacionaridade
aqui crucial. Se o processo no estacionrio as distribuies assimptticas ha-
bituais no so vlidas
8
.
8
De facto, pode-se provar que, sob 1
0
, n tem distribuio assimpttica igual distribuio da
varivel
(12)
_
W (1)
2
1
_
_
1
0
W (&)
2
d&
,
onde W um processo de Wiener padro ou movimento Browniano.
Como devemos proceder? Temos de consultar os valores crticos nas tabelas
apropriadas (so construdas a partir da distribuio da estatstica de teste sob H
0
que, por ser desconhecida para : nito, tem de ser obtida atravs de simulaes
de Monte Carlo
9
). A maioria das tabelas est preparada para fornecer o valor
crtico da distribuio de , o
(da trabalhar-se sobretudo com a especicao

^j
t
= j
t1
n
t
e no com j
t
= cj
t1
n
t
). A maioria dos programas de
estatstica calcula o valor-p aproximado associado hiptese nula (j no esta-
cionrio). Assim, se o valor-p for superior ao nvel de signicncia previamente
estabelecido (normalmente 0.05) no se rejeita H
0
e conclui-se que o processo
no estacionrio.
Existem outras variantes:
(2) Teste DF for random walk with drift H
0
: = 0
^j
t
= c j
t1
n
t
.
(3) Teste DF for random walk with drift and trend H
0
: = 0
^j
t
= c ,t j
t1
n
t
.
Na prtica, s muito raramente n
t
um RB. Quando n
t
exibe autocorrelao os
testes DF no so vlidos. Nestes casos deve-se branquear n
t
, adicionando
regresso, a componente c
1
^j
t1
... c
j
^j
tj
, com valor j adequado de
forma que n
t
se apresente como um rudo branco. Assim,
(1) Teste ADF for random walk without drift H
0
: = 0
^j
t
= j
t1
c
1
^j
t1
... c
j
^j
tj
n
t
.
(2) Teste ADF for random walk with drift H
0
: = 0
^j
t
= c j
t1
c
1
^j
t1
... c
j
^j
tj
n
t
.
(3) Teste ADF for random walk with drift and trend H
0
: = 0
^j
t
= c ,t j
t1
c
1
^j
t1
... c
j
^j
tj
n
t
.
Sobre a escolha do parmetro j veja o exemplo 6.3.5.
EXEMPLO 6.3.4. Seja
^j
t
= 0.1 0.01
(0.001)
j
t1
, : = 0
H
0
: = 0 vs. H1 : < 0. Uma tabela apropriada dever fornecer como valor
crtico ao nvel de signicncia de 5% aproximadamente o valor -2.92. Como
, o
= 0.01,0.004 = 2. c = 2.02 no se rejeita H0 ao nvel de

signicncia de 5%.
EXEMPLO 6.3.5. Seja lnp = log 1 onde 1 o ndice PSI20. Neste exemplo
recorre-se ao programa EVIEWS para analisar a estacionaridade de lnp. Os re-
sultados esto apresentados na gura 6.7. Tendo em conta a regresso efectuada
^log j
t
= c log j
t1
c
1
^log j
t1
n
t
, (j = 1)
9
Para n innito, a distribuio conhecida. Ver o p-de-pgina anterior.
Null Hypothesis: LNP has a unit root
Exogenous: Constant
Lag Length: 1 (Automatic based on SIC, MAXLAG=27)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -1.953504 0.3078
Test critical values: 1% level -3.432388
5% level -2.862326
10% level -2.567233
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(LNP)
Method: Least Squares
Sample (adjusted): 3 2936
Included observations: 2934 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
LNP(-1) -0.000919 0.000470 -1.953504 0.0509
D(LNP(-1)) 0.156283 0.018227 8.574451 0.0000
C 0.008356 0.004143 2.016704 0.0438
R-squared 0.025826 Mean dependent var 0.000320
Adjusted R-squared 0.025161 S.D. dependent var 0.010694
S.E. of regression 0.010559 Akaike info criterion -6.262717
Sum squared resid 0.326764 Schwarz criterion -6.256598
Log likelihood 9190.406 F-statistic 38.85062
Durbin-Watson stat 1.991441 Prob(F-statistic) 0.000000
FIGURA 6.7. Anlise da estacionaridade do logaritmo do PSI20
pode-se concluir que se escolheu a opo (2) Teste ADF for random walk with
drift H
0
: = 0
^j
t
= c j
t1
c
1
^j
t1
n
t
, (j = 1)
(note-se que a regresso envolve a constante C, equivalente ao nosso c). Deix-
mos o programa escolher a ordem j. Esta ordem escolhida automaticamente e
baseia-se no valor do critrio de informao SIC seguindo o princpio general-
to-specic. O programa escolheu j = 1. Interessa o valor-p associado hiptese
nula que 0.3078. Sendo este valor superior a 0.05, no se pode rejeitar a hiptese
= 0, ao nvel de signicncia de 5%. Existe, portanto, forte evidncia emprica
a favor da hiptese nula (no estacionaridade). aconselhvel diferenciar-se o
processo. A diferenciao conduz ao processo r
t
, onde
r
t
= log 1
t
log 1
t1
.
6.3.2. No Estacionaridade na Varincia. J vimos que se j
t
um processo
passeio aleatrio ento Vai (j
t
) proporcional a t . A diferenciao de j
t
produz
um processo estacionrio com varincia constante, e o problema da no estacionar-
idade ca resolvido com a referida transformao. A diferenciao normalmente
/(r) T (r)
Vai (j
t
) _ j
t
r
_
1
_
a
dr = 2
_
r
Vai (j
t
) _ j
2
t
r
2
_
1
a
dr = log r
Vai (j
t
) _ j
1
t
r
1
_
1
a
2
dr =
1
a
TABELA 3. Algumas transformaes habituais
resolve o problema da no estacionaridade na mdia e, em certos casos, tambm
da no estacionaridade da varincia. Supomos agora que a diferenciao apenas
resolve a no estacionaridade da mdia; supomos, assim, que a varincia, mesmo
depois da diferenciao, continua a ser uma funo de t. Admita-se:
j
t
no estacionrio na mdia, i.e., j
t
=
L
(j
t
) varia ao longo do tempo;
Vai (j
t
) = /(j
t
) (a varincia uma funo da mdia).
O objectivo consiste em encontrar uma transformao sobre j
t
, T (j
t
) tal que
Vai (T (j
t
)) seja constante. Pode-se provar que a transformao apropriada
10
T (r) =
_
1
_
/(r)
dr.
Alguns exemplos so fornecidos na tabela 3
Para concretizar, suponha-se que Vai (j
t
) proporcional ao quadrado da mdia
(e escreve-se neste caso, Vai (j
t
) _ j
2
t
). A transformao que permite tornar
(aproximadamente) constante a varincia T (r) = log r e, assim, os dados devem
ser logaritmizados. Como a transformao s est denida, em geral, para certos
valores de r (por exemplo, no caso log r tem de se assumir r 0) preciso
primeiro aplicar T (r) e s depois se verica se necessrio diferenciar (j que
uma prvia diferenciao impossibilitaria a aplicao da transformao (veja-se o
exemplo a seguir).
Na gura 6.8 representa-se a srie de preos do Dow Jones de 1969 a 2004. A
varincia (assim como a mdia) no constante.
Se se comeasse por diferenciar 1, a varincia continuaria a ser uma funo
de t. Veja-se, com efeito, o grco de ^1
t
(^1
t
= 1
t
1
t1
) representado
na gura 6.9. A gura mostra claramente que a varincia aumenta com t. Assim,
10
Pela frmula de Taylor, tem-se T (
I
) - T (j
I
) T
0
(j
I
) (
I
j
I
). Assim,
T (
I
) T (j
I
) - T
0
(j
I
) (
I
j
I
)
(T (
I
) T (j
I
))
2
-
_
T
0
(j
I
)
_
2
(
I
j
I
)
2
\ui (T (
I
)) -
_
T
0
(j
I
)
_
2
\ui (
I
) =
_
T
0
(j
I
)
_
2
I(j
I
)
Imponha-se \ui (T (
I
)) = c, i.e, (T
0
(j
I
))
2
I(j
I
) = c ou
T
0
(j
I
) =
c
_
I(j
I
)
.
Esta equao diferencial tem soluo imediata:
T (r) =
_
1
_
I(r)
dr (c = 1).
P (preos)
5
2005
4005
6005
8005
10005
12005
14005
Sep-69 Sep-74 Sep-79 Sep-84 Sep-89 Sep-94 Sep-99 Sep-04
FIGURA 6.8. Srie de Preos do Dow Jones (1969-2004)
Preos Diferenciados
-800
-600
-400
-200
0
200
400
600
Jan-69 May-73 Sep-77 Jan-82 May-86 Sep-90 Jan-95 May-99 Sep-03
FIGURA 6.9. Srie de preos diferenciados, ^1
t
, onde ^1
t
=
1
t
1
t1
, do Dow Jones (1969-2004)
antes de se diferenciar o processo, estacionarize-se primeiro a varincia. Na gura
6.10 apresenta-se
L
(j
t
) =
1
t
t
i=1
1
i
,

Vai (j
t
) =
1
t
t
i=1
_
1
i
L
(j
t
)
_
2
ao longo do tempo, onde

L
(j
t
) e

Vai (j
t
) so estimativas para a mdia e a var-
incia de j no momento t. A gura sugere que a varincia de j
t
proporcional ao
quadrado da mdia, i.e., Vai (j
t
) _ j
2
t
. De acordo com a tabela 3 deve-se usar a
transformao logartmica para estacionarizar a varincia.
A gura 6.11 sugere que a varincia constante ao longo do tempo, mas no a
mdia. Faa-se ento a diferenciao da varivel log 1
t
:
r
t
= log (1
t
) log (1
t1
)
cuja representao grca dada na gura 6.12. interessante vericar que a
srie dos retornos deve ser estudada no s devido s razes invocadas no ponto
0
500
1000
1500
2000
2500
3000
3500
4000
Sep-69 Aug-77 Jul-85 Jun-93 May-01
0.00E+00
2.00E+06
4.00E+06
6.00E+06
8.00E+06
1.00E+07
1.20E+07
1.40E+07
media(t)
var(t)
FIGURA 6.10. Mdia e Varincia estimada ao longo do tempo da
sries diria do Dow Jones (1969 a 2004)
log(P)
5
5.5
6
6.5
7
7.5
8
8.5
9
9.5
10
FIGURA 6.11. Srie de log-Preos do Dow Jones (1969-2004)
-0.3
-0.25
-0.2
-0.15
-0.1
-0.05
0
0.05
0.1
0.15
FIGURA 6.12. Srie dos retornos do Dow Jones
2.3 mas tambm porque as transformaes estacionarizantes discutidas neste ponto
conduzem precisamente varivel r
t
= log (1
t
) log (1
t1
) .
6.4. MODELAO ARMA 111
Escolha de um
modelo
Estimao dos
parmetros
Adequao do
modelo escolhido
Modelo
satisfatrio
NO
Utilizao do
modelo
Etapa 1: Identificao
Etapa 2: Estimao
Etapa 3: Avaliao do
diagnstico
SIM
FIGURA 6.13. Metodologia de Box-Jenkins
6.4. Modelao ARMA
O objectivo fundamental da modelao ARMA o de denir um modelo parci-
monioso (em termos de parmetros) que exiba boas propriedades estatsticas e de-
screva bem a srie em estudo. Para alcanarmos esse objectivo podemos seguir a
metodologia de Box-Jenkins. Prope trs etapas: identicao, estimao e avali-
ao do diagnstico (veja-se a gura 6.13).
Etapa 1: Identicao
Estacionarizao da srie;
Identicao da ordem j e atravs da FAC e FACP.
Etapa 2: Estimao
Uma vez seleccionado, na primeira etapa, o modelo ARMA(p,q), necessrio
estimar os parmetros desconhecidos (pelo mtodo da mxima verosimilhana
11
).
Etapa 3: Avaliao do Diagnstico
necessrio analisar os seguintes aspectos:
signicncia estatstica dos parmetros;
invertibilidade e estacionaridade (dispensa-se este ltimo aspecto se j for
um processo estacionrio);
11
Veja-se, no captulo 8.9, a aplicao do mtodo a um modelo mais geral.
anlise da matriz de correlao dos estimadores;
redundncia entre as estimativas;
branqueamento dos resduos;
se existir mais do que um modelo que cumpra as condies anteriores
necessrio seleccionar o melhor ( luz de determinado critrio).
Remete-se a questo da anlise da matriz de correlao dos estimadores para
Murteira et al. (1993). A signicncia estatstica dos parmetros bvia e a
questo da invertibilidade foi j tratada.
O problema da redundncia ocorre quando c(1) e 0 (1) partilham razes co-
muns. Por exemplo, no caso
(1 0.81) j
t
= (1 0.81) n
t
(6.9)
ambos os polinmio possuem a mesma raiz (1/0.8). Observe-se que os polinmios
cancelam um com o outro:
(1 0.81) j
t
= (1 0.81) n
t
=j
t
= n
t
e, portanto, o processo j denido por (6.9) , de facto, um rudo branco e no um
ARMA(1,1), como se poderia pensar. Na presena de redundncia pode provar-se
que a matriz de informao de Fisher singular. Em aplicaes, uma impossi-
bilidade as razes dos polinmios AR e MA estimados (respectivamente,

c(1)
e

0 (1)) virem exactamente iguais. De qualquer forma, se existirem razes do
polinmio AR aproximadamente iguais s do polinmio MA, surge um problema
de quase redundncia, e a matriz de Fisher embora invertvel, apresenta um de-
terminante prximo de zero. Como consequncia, os erros padro das estimati-
vas vm muitos baixos, as estatsticas-t muito altas e o determinante da matriz de
varincias-covarincias (estimada) aproximadamente de zero. fcil cair-se em
problemas de (quase) redundncia que, naturalmente, devem ser evitados.
Veja-se agora a questo do branqueamento dos resduos. Considere-se o
ARMA(1,1)
j
t
= cj
t1
0
1
n
t1
n
t
.
Suponha-se que se estima (por engano) o AR(1)
j
t
= cj
t1
j
t
onde j
t
representa o erro da equao anterior. Como detectar o erro de especi-
cao? Como j
t
= 0
1
n
t1
n
t
natural esperar que os resduos j
t
venham
autocorrelacionados.
muito importante que os resduos venham branqueados, i.e. no exibam
autocorrelaes; caso contrrio, parte da mdia condicional no foi modelada.
Apresentam-se de seguida, sem comentrios, os ensaios habituais os testes de
signicncia dos coecientes de autocorrelao dos resduos:
Teste Kendal e Stuart H
0
: j
I
( n) = 0
_
:( j
I
( n) 1,:)
o
(0, 1) , j
I
( n) -
_
1
:
,
1
_
:
_
.
6.4. MODELAO ARMA 113
Rejeita-se H
0
ao nvel de signicncia de (aprox.) 5%se [ j
I
( n)[ 2,
_
: (supondo
1,: - 0)
Teste Ljung-Box H
0
: j
1
( n) = ... = j
n
( n) = 0
Q = :(: 2)
n
I=1
1
: /
j
2
I
( n)
o
2
(njq)
.
Teste Jenkis e Daniels H
0
: c
II
( n) = 0
_
:
c
II
( n)
o
(0, 1) ,

c
II
( n) -
_
0,
1
_
:
_
.
Rejeita-se H
0
ao nvel de signicncia de (aprox.) 5% se
c
II
( n)
2,
_
:
Finalmente, discuta-se a ltima questo. Pode suceder que dois ou mais mod-
elos cumpram as condies anteriores. Como seleccionar o melhor? Se o ob-
jectivo da modelao a previso, pode-se avaliar a qualidade preditiva dos vrios
modelos concorrentes e depois selecciona-se o que apresentar melhores resultados
(discutiremos esta questo no ponto 6.6.6). Outra abordagem consiste em escol-
her o modelo mais preciso (melhor ajustamento) com o menor n
c
de parmet-
ros (parcimnia). H certamente um trade-off a resolver: maior preciso implica
menor parcimnia.
O coeciente de determinao ajustado , provavelmente, o indicador mais
utilizado. um bom indicador no mbito do modelo de regresso linear clssico,
com distribuio normal. Mais gerais so os critrios de informao de Akaike e
de Schwarz porque se baseiam no valor da funo de verosimilhana.
Seja
log 1
a
=
a
t
log ) (j
t
[ T
t1
)
o valor (mximo) da funo log-verosimilhana e / o nmero de parmetros esti-
mados. O critrio de informao de Akaike (AIC) dado pela expresso
1C = 2
log 1
a
:

2/
:
.
O critrio de Schwarz dado pela expresso
oC = 2
log 1
a
:

/
:
log :.
Tendo em conta que o modelo tanto mais preciso quanto mais alto for log 1
a
,
e tanto mais parcimonioso quanto menor for o nmero de parmetros, /, conclui-
se que deve dar-se preferncia ao modelo que minimiza as estatsticas AIC e SC
(note que os modelos s so comparveis se as variveis se encontrarem na mesma
unidade - por exemplo, no devemos comparar um modelo em j e outro em log j).
Em certos casos, um modelo pode minimizar apenas um dos critrios (por
exemplo, um modelo A minimiza o AIC e o modelo B minimiza o SC). Como
proceder nestes casos? Vrios estudos tm revelado o seguinte:
o critrio SC, em grandes amostras tende a escolher o modelo correcto;
em pequenas/mdias amostras pode seleccionar um modelo muito afas-
tado do modelo correcto;
o critrio AIC, mesmo em grandes amostras tende a seleccionar o modelo
errado, embora no seleccione modelos muito afastados do correcto.
Como consequncia, para grandes amostras o SC pode ser prefervel.
Naturalmente, estes critrios podem claricar a identicao da ordem j e
do modelo ARMA. Por exemplo, suponha-se que os modelos ARMA(1,1) e AR(3)
so bons luz de vrios critrios. Os critrios de informao, podem contudo
sugerir o ARMA(1,1) e, desta forma, j = 1, = 1.
6.5. Variveis Impulse-Dummy em Modelos de Regresso: Cuidados a
Observar
As variveis dummy ou variveis articiais so, como temos visto, bastante
teis pois permitem estimar o impacto de certas variveis qualitativas ou de eventos
sobre a varivel dependente. No entanto, h cuidados a ter no uso destas variveis.
Num modelo de previso o uso de variveis articiais (VA) estocsticas asso-
ciados a eventos que podem ocorrer no futuro deve ser evitado se as probabilidades
condicionais da VA forem desconhecidas. Com efeito, que sentido faz especicar
j
t
= cd
t
n
t
(d uma VA) se depois, no perodo de previso, o comportamento
probabilstico da varivel d completamente desconhecido?
Um caso especialmente delicado ocorre com as chamadas impulse-dummies
no mbito da inferncia estatstica.
6.5.1. Inconsistncia do Estimador. Impulse-dummies so VAs que assumem
o valor 1 apenas uma vez na amostra. Para ilustrar a situao considere-se o modelo
j
t
= c d
t
n
t
, t = 1, 2, ..., :
onde n
t
i.i.o.
~
_
0, o
2
_
e d
t
uma impulse-dummy
d
t
=
_
1 t = t
+
0 t ,= t
+
.
Seja
X =
_
_
1 0
1 0
.
.
.
.
.
.
1 0
1 1
1 0
.
.
.
.
.
.
1 0
1 0
_
_
, X
t
X =
_
: 1
1 1
_
, X
t
y =
_
a
t=1
j
t
j
t
_
6.5. VARIVEIS IMPULSE-DUMMY EM MODELOS DE REGRESSO: CUIDADOS A OBSERVAR115
fcil observar que o estimador OLS
`
=
_
c

_
=
_
: 1
1 1
_
1
_
a
t=1
j
t
j
t
_
=
_
1
a1
1
a1
1
a1
a
a1
_ _
a
t=1
j
t
j
t
_
=
_ P
n
I=1
j
I
a1

j
I
a1
1
a1
a
t=1
j
t

a
a1
j
t
_
=
_ P
n
I=1,I6=I
j
I
a1
a
a1
( j j
t
)
_
. (6.10)
Tem-se
L
_
`
_
=
L
_
_
X
t
X
_
1
X
t
y
_
=
L
_
_
X
t
X
_
1
X
t
(X u)
_
=
L
_
_
X
t
X
_
1
X
t
u
_
=
Vai
_
`
_
= o
2
_
X
t
X
_
1
= o
2
_
1
a1
1
a1
1
a1
a
a1
_
.
No se verica
j
porque
lim
ao
Vai [ [ = lim
ao
o
2
:
: 1
= o
2
ou seja, centrado mas no consistente (a preciso de no melhora quando
: aumenta e depende da varincia do rudo). Este resultado deve-se ao facto de ser
usada apenas uma observao para estimar . A propriedades do estimador para c
no so afectadas.
6.5.2. Inconsistncia do Teste-t. O rcio-t associado a (supondo o con-
hecido)
t
`
=

_
Vai [ [
=

a
a1
( j j
t
)
o
_
a
a1
=
_
:
: 1
j
t
j
o

j
t
j
o
.
Ora a distribuio de
j
I
j
o
depende da distribuio dos erros. No caso do modelo
de regresso habitual, mesmo que os erros no tenham distribuio normal, o rcio-
t para grandes amostras tem distribuio aproximadamente normal, pelo teorema
do limite central, e a inferncia habitual pode fazer-se sem problemas. No entanto,
o rcio-t associado a variveis impulse-dummies depende da distribuio dos erros.
Assim, se a distribuio dos erros desconhecida no possvel usar-se os testes
t habituais. Mesmo que se possa usar o rcio-t (por exemplo, se houver garantias
que n
t
i.i.o.
~
_
0, o
2
_
) o teste-t inconsistente no seguinte sentido: para qualquer
valor crtico com nvel de signicncia c,
1 ([t
`
[ c
c
[ H
1
: ,= 0) no tende para 1
quando : . A situao habitual (por exemplo, no mbito do modelo de re-
gresso linear clssico) a seguinte: quando : a probabilidade de rejeitar
H
0
quando H
1
verdadeira tende para 1 (se H
1
verdadeira, um teste consistente
acaba sempre, para amostras sucientemente grandes, por decidir correctamente a
favor de H
1
). Mas, com impulse-dummies isto no sucede.
6.5.3. Uma Soluo para ensaiar H
0
: = 0. Uma forma de testar H
0
:
= 0 no caso em que a distribuio dos erros desconhecida envolve a aplicao
de procedimentos bootstrap. Quando a amostra grande o ensaio H
0
: = 0 vs.
por exemplo H
1
: 0 pode ser conduzido da seguinte forma, muito simples
(equivalente ao bootstrap): estima-se o modelo de regresso
j
t
= x
t
t
, -
t
(onde x
t
t
um vector linha das variveis explicativas) sem dummy e obtm-se o
resduo -
t
associado ao momento t = t
+
. Se este resduo elevado (em mdulo)
ento provvel que no momento t
+
tenha ocorrido uma quebra de estrutura;
neste caso a varivel dummy d ser, em princpio, importante na explicao de j
(no momento t
+
). Para grandes amostras no s a estimativa associada ao modelo
j
t
= x
t
t
d
t
n
t
(aproximadamente) igual -
t
como tambm, sob H

0
: = 0, a distribuio do
estimador (aproximadamente) igual distribuio de -
t
; assim, a avaliao da
signicncia de ao nvel de c100/, equivale a vericar se -
t
est acima do
quantil de ordem 1 c da distribuio de -
t
(recorde-se que H
1
: 0). Como
a distribuio de -
t
desconhecida usa-se a distribuio emprica dos resduos -
t
-
este o princpio do bootstrap. Concretamente, rejeita-se H
0
: = 0 em favor de
H
1
: 0 ao nvel de signicncia de c100/ se -
t
for maior do que o quantil

de ordem 1 c da distribuio emprica dos resduos. A proposio seguinte
fundamenta o procedimento.
PROPOSIO 6.5.1. Considerem-se os modelo de regresso em notao ma-
tricial
y = X
1
d u, y = X
0
"
onde d = (d
t
) , d
t
= 1, d
t
= 0 para t ,= t
+
e X a matriz das variveis
explicativas estritamente exgena. Suponha-se
X
t
X
:
j
Q(denida positiva).
Ento a)
j
n
t
e b) ,-
t
j
1.
DEM. a) Dado o modelo y = X
1
d u, o estimador OLS de
=
_
d
t
Ad
_
1
d
t
Ay, A = I X
_
X
t
X
_
1
X
t
=
_
d
t
Ad
_
1
d
t
A(X
1
d u)
=
_
d
t
Ad
_
1
d
t
Au.
Analise-se a convergncia em probabilidade dos termos (d
t
Ad)
1
e d
t
'n (note-
se que

j
e

j
implica

j
). Tem-se
d
t
Ad = d
t
_
I X
_
A
t
A
_
1
X
t
_
d
= d
t
d d
t
X
_
A
t
A
_
1
X
t
d
= 1 x
t
t
_
X
t
X
_
1
x
t
= 1
x
t
t
:
_
X
t
X
:
_
1
x
t
.
6.5. VARIVEIS IMPULSE-DUMMY EM MODELOS DE REGRESSO: CUIDADOS A OBSERVAR117
Tendo em conta que x
t
t
,: 0 e
_
X
0
X
a
_
1
j
Q
1
facilmente se conclui que
d
t
Ad
j
1. (6.11)
Por outro lado,
d
t
Au = d
t
_
I X
_
X
t
X
_
1
X
t
_
u
= d
t
u d
t
X
_
X
t
X
_
1
X
t
u
= u
t
d
t
X
_
X
t
X
:
_
1
X
t
u
:
e, usando um raciocnio idntico, conclui-se que
d
t
Ad
j
n
t
. (6.12)
Devido a (6.11) e (6.12) resulta:
=
_
d
t
Ad
_
1
d
t
Au
j
u
t
.
b) Considere-se
y = X
0
", -
t
= d
t
Ay.
Tem-se
=
_
1
x
t
t
:
_
X
t
X
:
_
1
x
t
_
1
d
t
Ay
=
_
1
r
t
t
:
_
X
t
X
:
_
1
x
t
_
1
-
t
e,

-
t
=
_
1
x
t
t
:
_
X
t
X
:
_
1
x
t
_
1
.
Resulta
`
`.
I
j
1
6.5.4. Impulse-dummies e a matriz de White. Um caso que conduz a con-
cluses incorrectas ocorre quando se usa simultaneamente impulse-dummies com
a matriz de White.
Para simplicar considere-se novamente o modelo
j
t
= c d
t
n
t
, t = 1, 2, ..., :
onde n
t
i.i.o.
~
_
0, o
2
_
e d
t
uma impulse-dummy
d
t
=
_
1 t = t
+
0 t ,= t
+
.
Se razovel assumir normalidade e ausncia mas no heterocedasticidade
pode argumentar-se que a signicncia estatstica de pode ser avaliada usando o
rcio-t baseado na matriz de White. Esta suposio incorrecta e traduz provavel-
mente o caso mais grave dos vrios que analismos. Como se sabe a matriz de
White tem a forma
Vai
_
,
_
=
_
X
t
X
_
1
X
t
VX
_
X
t
X
_
1
onde V uma matriz diagonal com elementos
_
n
2
1
, ..., n
2
a
_
. No caso mais simples
que analisamos a matriz de White correspondente a
Vai [ [ =
a
t=1
_
d
i

d
_
n
2
t
a
t=1
_
d
i

d
_
2
.
Deixa-se como exerccio vericar que
Vai [ [ =
a
t=1
_
d
i

d
_
n
2
t
a
t=1
_
d
i

d
_
2
=
1
:(: 1)
a
t=1
n
2
t
.
Assim, atendendo a (6.10) o rcio-t associado a
t
`
=

_
Vai [ [
=
a
a1
(j
t
j)
_
1
a(a1)
a
t=1
n
2
t
=
a
a1
(j
t
j)
_
` o
2
a
=
:
: 1
_
:
j
t
j
o

_
:
j
t
j
o
.
Embora (j
t
j) , o possa ter distribuio aproximadamente (0, 1) para amostras

grandes
_
:(j
t
j) , o no tmcertamente distribuio (0, 1) . Se (j

t
j) , o
tem distribuio aproximadamente normal ento
_
:(j
t
j) , o ter distribuio
(0, :) . Este resultado sugere que se for usada a matriz de White numa amostra
razoavelmente grande, qualquer impulse-dummy sempre interpretada como signi-
cativa luz da distribuio habitual do rcio-t (observe-se
_
:(j
t
j) , o
quando : ).
6.5.5. Concluso. O uso de impulse-dummies envolve vrios problemas (in-
consistncia do estimador, inconsistncia do teste t, e quando usado simultanea-
mente com a matriz de White, os rcio-t so inacionados). Quer isto dizer que
o uso de impulse-dummies inapropriado? A resposta negativa. Vimos que o
estimador OLS do parmetro da impulse-dummy centrado. Por outro lado, ex-
istem procedimentos vlidos que podero ser usados para testar a signicncia do
parmetro da impulse-dummy. Finalmente, o uso impulse-dummy em modelos de
regresso importante quando se pretende estimar o efeito de um acontecimento
isolado, mantendo todas as demais variveis explicativas constantes.
EXEMPLO 6.5.1. Suponha-se que se pretende analisar o efeito de um anncio
pblico no dia t
+
sobre as cotaes da empresa ABC. Suspeita-se que o efeito
positivo sobre a empresa ABC e nulo ou irrelevante para o mercado. Pretende-
se, assim, vericar se o valor esperado do retorno da empresa ABC no dia t
+

positivo. Suponha-se ainda que, nesse dia t
+
, o mercado em geral observou uma
forte queda. Para testar esse efeito uma possibilidade consiste em considerar a
regresso
r
t
= ,
0
d
t
n
t
6.6. PREVISO 119
onde r
t
o retorno da empresa ABC e d
t
uma impulse-dummy
d
t
=
_
1 t = t
+
0 t ,= t
+
.
Contudo, poder suceder, atendendo quebra do mercado, que venha nega-
tivo ou no signicativo. Concluir-se-a que o anncio teve um impacto negativo
ou nulo sobre o retorno da empresa ABC. Mas esta concluso pode ser errnea
porque o efeito do mercado no levado em conta. Assim, necessrio controlar
ou xar o efeito do mercado atravs da regresso
r
t
= ,
0
,
1
r
t,n
d
t
n
t
onde r
t,n
o retorno do mercado (retorno associado a um ndice abrangente de
cotaes do mercado).
6.6. Previso
6.6.1. Introduo. Temos um modelo ' (j
t
, j
t1
, ...; 0) para j baseado em
: observaes j
1
, j
2
, ..., j
a
. O objectivo agora :
prever j para : 1, : 2, ...;
estabelecer intervalos de conana para as previses.
Que propriedades devemos exigir a um previsor para j
aI
Seja j
aI,a
um
previsor para j
aI
. Devemos exigir:
L
_
j
aI,a
_
=
L
(j
aI
) (propriedade do no enviesamento).
Vai
_
j
aI,a
_
= Vai (j
aI
) ( j
aI,a
deve reproduzir a variabilidade de
j
aI
);
forte correlao entre j
aI,a
e j
aI
.
O previsor j
aI,a
para j
aI
deve ser T
a
-mensurvel, isto , se prevemos j
para o instante : / e o momento em que efectuamos a previso :, s podemos
utilizar informao at :.
Em certos casos podemos permitir algum enviesamento do estimador desde
que outras propriedades mais do que compensem esse enviesamento. Na gura
6.14, qual o previsor prefervel? O previsor 1 enviesado; o previsor 2 no . No
entanto, o previsor 1 parece prefervel pois os erros de previso so, na maior parte
das vezes, inferiores.
Seja c (/) = j
aI
j
aI,a
o erro de previso. O erro quadrtico mdio
(EQM) de previso
L
_
c (/)
2
_
pondera os trs aspectos acima expostos: enviesa-
mento, variabilidade e correlao. Com efeito, prova-se a seguinte decomposio
do EQM de previso
L
_
c (/)
2
_
=
L
_
_
j
aI
j
aI,a
_
2
_
:
L
_
c (/)
2
_
=
_
L
(j
aI
)
L
_
j
aI,a
__
2
(o
j
o
` j
)
2
2o
j
o
j
_
1 j
j,` j
_
.
(6.13)
0
2
4
6
8
10
12
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Observado
Previsor 1
Previsor 2
FIGURA 6.14. Qual dos dois previsores prefervel?
O primeiro termo do lado direito mede o enviesamento, o segundo, compara a vari-
abilidade entre j e j e o terceiro mede a correlao entre j
aI
e j
aI,a
(quanto
mais baixa a correlao maior o EQM). Na gura 6.14, o previsor 1, embora apre-
sente um enviesamento elevado (i.e.,
_
L
(j
aI
)
L
_
j
aI,a
__
2
alto), os valores
dos termos (o
j
o
` j
)
2
e 2o
j
o
j
_
1 j
j,` j
_
so relativamente baixos. O previsor
2 apresenta um valor baixo na componente
_
L
(j
aI
)
L
_
j
aI,a
__
2
(enviesa-
mento reduzido ou nulo) mas valores altos em (o
j
o
` j
)
2
e 2o
j
o
j
_
1 j
j,` j
_
.
Gracamente parece que o estimador 1 prefervel, isto , ponderando todos os
aspectos, o grco sugere que o EQM do previsor 1 inferior ao EQM do previsor
2.
Ser possvel denir um previsor ptimo, luz do EQM, qualquer que seja o
modelo em anlise? A resposta armativa.
PROPOSIO 6.6.1. Oprevisor comEQMmnimo
L
(j
aI
[ T
a
) i.e., verica-
se a desigualdade
L
_
(j
aI
L
(j
aI
[ T
a
))
2
_
_
L
_
_
j
aI
j
aI,a
_
2
_
,
onde j
aI,a
T
a
um outro qualquer previsor T
a
-mensurvel.
(A demonstrao similar da proposio 4.3.1). Usaremos tambm a no-
tao j
aI,a
para
L
(j
aI
[ T
a
) . A proposio 6.6.1 permite concluir que o pre-
visor
L
(j
aI
[ T
a
) minimiza os trs termos do lado direito da equao (6.13), no
conjunto de todos os previsores T
a
-mensurveis; em particular, o primeiro termo
zero.
Recorda-se do captulo 4 que
L
_
(j
aI
L
(j
aI
[ ())
2
_
_
L
_
(j
aI
L
(j
aI
[ H))
2
_
, H _ (.
Como referimos, esta desigualdade resulta do facto de em ( existir mais infor-
mao. natural esperar que um previsor que use mais informao face a um
outro, tenha um EQM inferior.
6.6. PREVISO 121
6.6.2. Previso Pontual. Tendo em conta a proposio 6.6.1, vamos utilizar
como previsor para j
aI
a expresso
L
(j
aI
[ T
a
) . O procedimento geral para
obter a previso pontual de j
aI
:
(1) Denir o modelo j
aI
(com base no modelo especicado).
(2) Calcular
L
(j
aI
[ T
a
) .
Vamos ver alguns exemplos.
MA(2)
Previso a um passo / = 1
j
a1
= j 0
1
n
a
0
2
n
a1
n
a1
Tem-se
L
(j
a1
[ T
a
) = j 0
1
n
a
0
2
n
a1
Previso a dois passos / = 2
j
a2
= j 0
1
n
a1
0
2
n
a
n
a2
Tem-se
L
(j
a2
[ T
a
) = j 0
2
n
a
.
Previso a / passos (/ 2)
j
aI
= j 0
1
n
aI1
0
2
n
aI2
n
aI
Tem-se
L
(j
aI
[ T
a
) = j
MA()
Deixa-se como exerccio vericar:
L
(j
aI
[ T
a
) =
_
j
q
i=I
0
i
n
aIi
para / = 1, ...,
j para / = 1, ...
Sugesto: comece por vericar que, para / = 1, 2, ... tem-se
L
(j
aI
[ T
a
) =
j.
AR(1)
Na previso dos processos AR, til considerar-se a previso j realizada nos
passos intermdios. Considere-se novamente a notao j
aI,a
(igual por denio
a
L
(j
aI
[ T
a
)).
j
a1
= c c
1
j
a
n
a1
j
a1,a
=
L
(j
a1
[ T
a
) =
L
(c c
1
j
a
n
a1
[ T
a
) = c c
1
j
a
.
j
a2
= c c
1
j
a1
n
a2
j
a2,a
=
L
(j
a2
[ T
a
) =
L
(c c
1
j
a1
n
a2
[ T
a
) = c c
1
L
(j
a1
[ T
a
)
= c c
1
j
a1,a
Previso a / passos
j
aI
= c c
1
j
aI1
n
aI
j
aI,a
=
L
(j
aI
[ T
a
)
=
L
(c c
1
j
aI1
n
a2
[ T
a
) = c c
1
j
aI1,a
Conclui-se que o modelo de previso no modelo AR(1) (/ 1)
j
aI,a
= c c
1
j
aI1,a
(6.14)
OBSERVAO 6.6.1. Podemos reescrever a equao (6.14) como funo do
valor observado em :. Por exemplo, a previso a dois passos (/ = 2)
j
a2,a
= c c
1
j
a1,a
. (6.15)
Como, por sua vez, a previso a um passo j
a1,a
= c c
1
j
a,a
= c c
1
j
a
podemos substituir j
a1,a
= c c
1
j
a
na equao (6.15). Assim a previso a dois
passos pode ser escrita na forma
j
a2,a
= c c
1
j
a1,a
= c c
1
(c c
1
j
a
)
= c cc
1
c
2
1
j
a
.
De igual forma, a previso a trs passos
j
aS,a
= c c
1
j
a2,a
= c c
1
_
c cc
1
c
2
1
j
a
_
= c cc
1
cc
2
1
c
2
1
j
a
.
Seguindo este raciocnio conclui-se que
j
aI,a
= c cc
1
cc
2
1
... cc
I1
1
c
I
1
j
a
. (6.16)
Do ponto de vista prtico irrelevante prever o modelo com base no modelo (6.14)
ou com base em (6.16), pois as expresses so equivalentes. No mbito dos mode-
los dinmicos, a equao (6.14) designa-se por equao s diferenas nitas linear
de primeira ordem (a equao de juros compostos tambm uma equao do tipo)
cuja soluo, dada a condio inicial j
a,a
= j
a
, precisamente a equao (6.16).
Atendendo a que
1 c
1
c
2
1
... c
I1
1
=
1 c
I
1 c
(soma de uma progresso geomtrica)
podemos dar um novo aspecto s equao (6.16):
j
aI,a
= c
_
1 c
1
c
2
1
... c
I1
1
_
c
I
1
j
a
= c
1 c
I
1 c
c
I
1
j
a
. (6.17)
Em suma, para obter j
aI,a
indiferente considerar (6.14), (6.16) ou (6.17).
6.6. PREVISO 123
Dependent Variable: Y
Sample: 3 1000
Included observations: 998
C 10.81186 1.196611 9.035402 0.0000
Y(-1) 0.469309 0.030095 15.59406 0.0000
Y(-2) 0.314900 0.030098 10.46238 0.0000
S.E. of regression 0.499762 Akaike info criterion 1.453631
Sum squared resid 248.5130 Schwarz criterion 1.468378
Log likelihood -722.3618 F-statistic 543.0800
FIGURA 6.15. Estimao de um AR(2)
AR(2)
j
a1
= c c
1
j
a
c
2
j
a1
n
a1
j
a1,a
=
L
(j
a1
[ T
a
)
=
L
(c c
1
j
a
c
2
j
a1
n
a1
[ T
a
) = c c
1
j
a
c
2
j
a1
j
a2
= c c
1
j
a1
c
2
j
a
n
a2
j
a2,a
=
L
(j
a2
[ T
a
)
=
L
(c c
1
j
a1
c
2
j
a
n
a2
[ T
a
) = c c
1
L
(j
a1
[ T
a
) c
2
j
a
= c c
1
j
a1,a
c
2
j
a
j
aI
= c c
1
j
aI1
c
2
j
aI2
n
aI
j
aI,a
=
L
(j
aI
[ T
a
)
=
L
(c c
1
j
aI1
c
2
j
aI2
n
a2
[ T
a
)
= c c
1
j
aI1,a
c
2
j
aI2,a
Conclui-se que o modelo de previso no modelo AR(2) (para / 2)
j
aI,a
= c c
1
j
aI1,a
c
2
j
aI2,a
.
EXEMPLO 6.6.1. Estimou-se um processo AR(2), cujos resultados esto apre-
sentados na gura 6.15.
Tem-se : = 1000 e sabe-se que j
a1
=50.4360, j
a
=50.0207. Pretende-se
obter uma previso para j para os perodo 1001, 1002 e 1008 (previso a um
passo, a dois passos e a trs passos).
Previso a um passo:
j
a1,a
= c c
1
j
a
c
2
j
a1
j
a1,a
= 10.81186 0.460800 0.0207 0.8140 0.486 = 0.160.
Previso a dois passos:
j
a2,a
= c c
1
j
a1,a
c
2
j
a
j
a2,a
= 10.81186 0.460800 0.160 0.8140 0.0207 = 0.108.
Previso a trs passos:
j
aS,a
= c c
1
j
a2,a
c
2
j
a1,a
j
a2,a
= 10.81186 0.460800 0.108 0.8140 0.160 = 0.126.
AR(j)
j
a1
= c c
1
j
a
... c
j
j
a1j
n
a1
L
(j
a1
[ T
a
) =
L
_
c c
1
j
a
... c
j
j
a1j
n
a1
T
a
_
= c c
1
j
a
... c
j
j
a1j
j
a2
= c c
1
j
a1
... c
j
j
a2j
n
a2
L
(j
a1
[ T
a
) =
L
_
c c
1
j
a1
... c
j
j
a1j
n
a2
T
a
_
= c c
1
L
(j
a1
[ T
a
) ... c
j
j
a1j
= c c
1
j
a1,a
... c
j
j
a1j
Previso a / passos (/ j)
j
aI
= c c
1
j
aI1
... c
j
j
aIj
n
aI
j
aI,a
=
L
(j
aI
[ T
a
)
=
L
_
c c
1
j
aI1
... c
j
j
aIj
n
aI
T
a
_
= c c
1
j
aI1,a
c
2
j
aI2,a
... c
j
j
aIj,a
ARMA(1, 1)
j
a1
= c c
1
j
a
n
a1
0
1
n
a
j
a1,a
=
L
(j
a1
[ T
a
)
=
L
(c c
1
j
a
n
a1
0
1
n
a
[ T
a
)
= c c
1
j
a
0
1
n
a
6.6. PREVISO 125
j
a2
= c c
1
j
a1
n
a2
0
1
n
a1
j
a2,a
=
L
(j
a2
[ T
a
)
=
L
(c c
1
j
a1
n
a2
0
1
n
a1
[ T
a
)
= c c
1
j
a1,a
j
aI
= c c
1
j
aI1
n
aI
0
1
n
aI1
j
aI,a
=
L
(j
aI
[ T
a
)
=
L
(c c
1
j
aI1
n
aI
0
1
n
aI1
[ T
a
)
= c c
1
j
aI1,a
6.6.3. Intervalos de Previso I. Vimos at agora a chamada previso pontual.
Vamos agora estabelecer umintervalo de conana, IC, (ou de previso) para j
aI
.
Um IC para j
aI
a 95% baseia-se na probabilidade
1 (|
1
< j
aI
< |
2
[ T
a
) = 0.0.
Ointervalo de conana portanto (|
1
, |
2
) , ou seja, j
aI
estar no intervalo (|
1
, |
2
)
com 0.95 de probabilidade dado T
a
. Como determinar |
1
e |
2
Assuma-se que
j
aa
[ T
a
~ (
L
(j
aI
[ T
a
) , Vai (j
aI
[ T
a
))
ou seja,
7 =
j
aI
L
(j
aI
[ T
a
)
_
Vai (j
aI
[ T
a
)
T
a
~ (0, 1) .
Tem-se assim,
1 (|
1
< j
aI
< |
2
[ T
a
) = 0.0
=1
_
|
1
L
(j
aI
[ T
a
)
_
Vai (j
aI
[ T
a
)
<
j
aI
L
(j
aI
[ T
a
)
_
Vai (j
aI
[ T
a
)
<
|
2
L
(j
aI
[ T
a
)
_
Vai (j
aI
[ T
a
)
T
a
_
= 0.0
e, portanto,
|
1
L
(j
aI
[ T
a
)
_
Vai (j
aI
[ T
a
)
= 1.06 =|
1
=
L
(j
aI
[ T
a
) 1.06
_
Vai (j
aI
[ T
a
)
|
2
L
(j
aI
[ T
a
)
_
Vai (j
aI
[ T
a
)
= 1.06 =|
2
=
L
(j
aI
[ T
a
) 1.06
_
Vai (j
aI
[ T
a
)
Assim, um IC a 95% para j
aI

L
(j
aI
[ T
a
) 1.06
_
Vai (j
aI
[ T
a
).
Em termos gerais, um IC a (1 c) 100/
L
(j
aI
[ T
a
) .
1c2
_
Vai (j
aI
[ T
a
)
onde .
1c2
tal que 1
_
7 _ .
1c2
_
= 1 c,2 e 7 ~ (0, 1) . tambm
habitual apresentar-se o ICa partir da varivel erro de previso a / passos, c
a
(/) =
j
aI

L
(j
aI
[ T
a
). Como Vai (c
a
(/)) = Vai (j
aI
[ T
a
) e usando a notao
j
aI,a
=
L
(j
aI
[ T
a
) , o IC a 95% para j
aI
pode apresentar-se tambm na
forma
j
aI,a
1.06
_
Vai (c (/)). (6.18)
Na prtica j
aI,a
desconhecido, pois envolve parmetros desconhecidos. Em lu-
gar de j
aI,a
devemos usar j
aI,a
(por exemplo, na previso a um passo do mod-
elo AR(1), em lugar de j
a1,a
= cc
1
j
a
deve-se considerar j
a1,a
= c
c
1
j
a
).
A substituio de j
aI,a
por j
aI,a
aumenta a varincia do erro de previso numa
quantidade proporcional a 1,:. Veja-se esta questo mais em pormenor.
Quando j
aI,a
desconhecido, a varivel j
aI
denida em
1 (|
1
< j
aI
< |
2
[ T
a
) = 0.0,
deve ser centrada usando-se j
aI,a
(e no j
aI,a
). Observe-se que a varivel
j
aI
j
a1,a
continua a possuir distribuio normal de mdia zero. No entanto,
a varincia de j
aI
j
a1,a
agora,
Vai
_
j
aI
j
aI,a
T
a
_
= Vai
_
j
aI
j
aI,a
j
aI,a
j
aI,a
T
a
_
= Vai
_
j
aI
j
aI,a
T
a
_
Vai
_
j
aI,a
j
aI,a
T
a
_
= Vai (c (/)) Vai
_
j
aI,a
j
aI,a
T
a
_
(j
aI
j
aI,a
independente de j
aI,a
j
aI,a
, pois j
aI
j
aI,a
envolve
apenas erros aleatrios posteriores a :, enquanto j
aI,a
j
aI,a
envolve variveis
at ao perodo :). Como consequncia, o IC a 95% construdo a partir de j
aI,a

j
aI,a
1.06
_
Vai (c (/)) Vai
_
j
aI,a
j
aI,a
T
a
_
.
Pode-se provar que Vai
_
j
aI,a
j
aI,a
T
a
_
uma quantidade de ordemO(1,:);
assim, para amostra grandes, Vai
_
j
aI,a
j
aI,a
T
a
_
uma quantidade pe-
quena quando comparada comVai (c (/)) e pode ser negligenciada. Aquantidade
Vai
_
j
aI,a
j
aI,a
T
a
_
pode ser estimada a partir de uma equao auxiliar.
Para exemplicar considere-se a previso a um passo de um AR(1). A estimativa
de c da equao
j
t
= c c
1
(j
t1
j
a
) n
t
fornece uma estimativa para j
a1,I
(i.e., fornece j
a1,a
) pois j
a1
= c
c
1
(j
a
j
a
) =
c. Por outro lado, o erro padro de c = j
a1,a
uma estimativa para
Vai
_
j
a1,a
j
a1,a
T
a
_
= Vai
_
j
a1,a
T
a
_
.
De todo o modo, para amostra grandes pode-se assumir 1,: 0 e, assim,
podemos continuar a usar a expresso (6.18), substituindo os parmetros descon-
hecidos pela respectivas estimativas consistentes. Vamos ver alguns exemplos.
MA(2)
j
a1
= j 0
1
n
a
0
2
n
a1
n
a1
Tem-se
L
(j
a1
[ T
a
) = j 0
1
n
a
0
2
n
a1
c
a
(1) = j
a1
L
(j
a1
[ T
a
) = n
a1
~
_
0, o
2
_
.
6.6. PREVISO 127
Sample(adjusted): 1950:04 2005:05
Included observations: 662 after adjusting endpoints
C 10.01857 0.042397 236.3054 0.0000
MA(1) 0.373267 0.037900 9.848702 0.0000
MA(2) -0.231256 0.037917 -6.099047 0.0000
Inverted MA Roots .33 -.70
FIGURA 6.16. Estimao de um MA(2)
Logo Vai (c
a
(1)) = o
2
e, assim, um IC a 95%
j 0
1
n
a
0
2
n
a1
1.06
_
Vai (c
a
(1)) i.e.,
j 0
1
n
a
0
2
n
a1
1.06o
j
a2
= j 0
1
n
a1
0
2
n
a
n
a2
Tem-se
L
(j
a2
[ T
a
) = j 0
2
n
a
j
a2
L
(j
a2
[ T
a
) = 0
1
n
a1
n
a2
~
_
0,
_
0
2
1
1
_
o
2
_
Logo Vai (c
a
(2)) =
_
0
2
1
1
_
o
2
e, assim, um IC a 95%
j 0
2
n
a
1.06
_
_
0
2
1
1
_
o
2
EXEMPLO 6.6.2. Estimou-se um MA(2) (dados mensais), cujos resultados es-
to apresentados na gura 6.16. A ltima observao, j
a
, reporta-se ao perodo
2005:05 (Maio de 2005, na notao do EVIEWS). Tem-se ainda a seguinte infor-
mao: n
a1
= 0.6 e n
a
= 0.0. As estimativas dos parmetros so
12
:
0
1
= 0.87826,

0
2
= 0.28126.
Pretende-se um intervalo de previso para 2005:6 (j
a1
) e 2005:7 (j
a2
) a 95%,
supondo inovaes (erros) normais. Previso a um passo:
j
a1,a
= j 0
1
n
a
0
2
n
a1
j
a1,a
= j

0
1
n
a

0
2
n
a1
= 10.0187 0.87826 0.0 0.28126 (0.6)
= 10.101
IC para j
a1
a 95%:
j 0
1
n
a
0
2
n
a1
1.06o
10.101 1.06 0.0072 ou (8.82, 12.06) .
Previso a dois passos:
j
a2,a
= j 0
2
n
a
j
a2,a
= j

0
2
n
a
= 10.0187 0.28126 0.0
= 10.00
IC para j
a2
a 95%:
j 0
2
n
a
1.06
_
_
0
2
1
1
_
o
2
10.00 1.06
_
(0.87826
2
1) 0.0072
2
ou (8.01, 12.00) .
No EVIEWS o grco da previso a dois passos dada pela gura 6.17 (h uma
ligeira diferena entre os IC acima calculados e os IC fornecidos pelo EVIEWS.
Porqu?)
MA()
12
O output do EVIEWS apresenta as razes invertidas do polinmio MA. Desta forma, o modelo
invertvel sse as razes invertidas so em mdulo inferiores a um. Como as razes so em mdulo
inferiores a um conclui-se que o processo invertvel. Outra forma de chegarmos a esta concluso
consiste em vericar se as seguintes condies so vlidas:
0
1
0
2
1, 0
1
0
2
< 1, 1 < 0
2
< 1.
Tambm por aqui se conclui que o modelo invertvel vericando as desigualdades:
0
1

0
2
= 0.87826 0.28126 1,
0
1
0
2
= 0.87826 0.28126 < 1,
1 < 0.28126 < 1.
6.6. PREVISO 129
7
8
9
10
11
12
13
2005:06 2005:07
YF 2 S.E.
FIGURA 6.17. Previso do modelo MA(2) fornecida pelo EVIEWS
Deixa-se como exerccio vericar:
L
(j
aI
[ T
a
) =
_
j
q
i=I
0
i
n
aIi
para / = 1, ...,
j para / = 1, ...
c
a
(/) = j
aI
L
(j
aI
[ T
a
) =
I1
i=0
0
i
n
aIi
, (0
0
= 1)
Tem-se
L
_
c
2
a
(/)
_
= o
2
I1
i=0
0
2
i
(6.19)
e, assumindo normalidade, o IC a 95%
j
q
i=I
0
i
n
aIi
1.06
_
o
2
I1
i=0
0
2
i
AR(1)
A determinao dos intervalos de previso no imediata nos processos AR e
ARMA em geral.
j
a1
= c c
1
j
a
n
a1
j
a1,a
=
L
(j
a1
[ T
a
)
=
L
(c c
1
j
a
n
a1
[ T
a
) = c c
1
j
a
c
a
(1) = n
a1
j
a2
= c c
1
j
a1
n
a2
j
a2,a
=
L
(j
a2
[ T
a
)
=
L
(c c
1
j
a1
n
a2
[ T
a
) = c c
1
L
(j
a1
[ T
a
)
= c c
1
j
a1,a
c
a
(2) =
Para determinar c
a
(/) e consequentemente os IC a ideia consiste em represen-
tar j
aI
na forma MA. Precisamos, portanto, de uma frmula geral que fornea
c
a
(/) e Vai (c
a
(/)) (veremos isso a seguir).
6.6.4. Intervalos de Previso II - Varincia do Erro de Previso no modelo
ARMA . Para determinarmos c
a
(/) considere-se o ARMA(j, )
c
j
(1) j
aI
= 0
q
(1) n
aI
j
aI
= c
1
j
(1) 0
q
(1) n
aI
(6.20)
=
o
)=0
c
)
n
aI)
(c
0
= 1).
A expresso
L
(j
aI
[ T
a
) pode ser obtida recursivamente como vimos no caso
AR(p) com / = 2 . Agora interessa-nos representar
L
(j
aI
[ T
a
) numa outra
forma equivalente para que possamos obter c
a
(/) .
Como
j
aI
=
o
)=0
c
)
n
aI)
tem-se
L
(j
aI
[ T
a
)
=
L
_
_
o
)=0
c
)
n
aI)
T
a
_
_
=
L
_
c
0
n
aI
c
1
n
aI1
... c
I1
n
a1
c
I
n
a
c
I1
n
a1
...
T
a
_
= c
I
n
a
c
I1
n
a1
.. .
Logo
c
a
(/) = j
aI
L
(j
aI
[ T
a
)
= c
0
n
aI
c
1
n
aI1
... c
I1
n
a1
c
I
n
a
c
I1
n
a1
...
c
I
n
a
c
I1
n
a1
...
= c
0
n
aI
c
1
n
aI1
... c
I1
n
a1
=
I1
)=0
c
)
n
aI)
.
6.6. PREVISO 131
Portanto,
L
(c
a
(/)) = 0
Vai (c
a
(/)) =
L
_
c
2
a
(/)
_
= o
2
I1
)=0
c
2
)
, c
0
= 1 (6.21)
No processo MA(q) tem-se 0
i
= c
i
e, com esta igualdade, conrma-se a equao
(6.19).
EXEMPLO 6.6.3. Retome-se o exemplo 6.6.1:
Sample: 3 1000
Included observations: 998
C 10.81186 1.196611 9.035402 0.0000
Y(-1) 0.469309 0.030095 15.59406 0.0000
Y(-2) 0.314900 0.030098 10.46238 0.0000
Vimos:
j
a1,a
= 0.160, j
a2,a
= 0.108, j
aS,a
= 0.126.
Sabendo que
1
1 0.4608001 0.814001
2
= 1 0.4601 0.81
2
0.8001
S
...
determine um IC a 95% para as previses em : 1, : 2 e : 8. Vimos que a
expresso geral do IC a 95% (com erros Gaussianos) dada pela expresso
L
(j
aI
[ T
a
) 1.06
_
Vai (c
a
(/))
ou
j
aI,a
1.06
_
Vai (c
a
(/))
ou
j
aI,a
1.06
_
Vai (c
a
(/))
No caso dos modelos MA a expresso Vai (c
a
(/)) determina-se facilmente, como
vimos atrs. No caso dos modelos AR (ou ARMA) temos de usar a expresso (6.21)
Vai (c
a
(/)) = o
2
I1
)=0
c
2
)
ou

Vai (c
a
(/)) = o
2
I1
)=0
c
2
)
Um IC a 95% para a previso j
a1
(/ = 1)
j
a1,a
1.06
_
Vai (c
a
(1))
Ora j
a1,a
= 0.160 e
Vai (c
a
(1)) = o
2
11
)=0
c
2
)
= o
2
0
)=0
c
2
)
= o
2
c
2
0
= o
2
.
Assim
j
a1,a
1.06
_
o
2
0.160 1.06 0.400762.
a2
(/ = 2)
j
a2,a
1.06
_
Vai (c
a
(2)).
Ora j
a2,a
= 0.108 e
Vai (c
a
(2)) = o
2
21
)=0
c
2
)
= o
2
_
1

c
2
1
_
= 0.400762
2
_
1 0.460
2
_
= 0.80470.
Assim
j
a2,a
1.06
_
Vai (c
a
(2))
0.108 1.06
_
0.80470.
aS
(/ = 8)
j
aS,a
1.06
_
Vai (c
a
(8)).
Ora j
a2,a
= 0.126 e
Vai (c
a
(2)) = o
2
S1
)=0
c
2
)
= o
2
_
1

c
2
1

c
2
2
_
= 0.400762
2
_
1 0.460
2
0.8
2
_
= 0.87610.
Assim
j
aS,a
1.06
_
Vai (c
a
(8))
0.126 1.06
_
0.87610.
6.6.5. Previso de (muito) Longo Prazo. Previso de longo prazo signica
tomar / muito alto. Qual a previso de j
aI
quando / Isto , qual o valor
de
lim
Io
L
(j
aI
[ T
a
)
Quando : / muito alto, quando comparado com :, a informao T
a
prati-
camente irrelevante ( qualquer coisa como prever o retorno do PSI20 para daqui
a 20 anos, tendo disponvel apenas a informao do retorno de hoje). Assim, nes-
tas condies,
L
(j
aI
[ T
a
) praticamente igual a
L
(j
aI
) (quer dizer, podemos
dispensar T
a
). Tudo isto verdade se, obviamente, o processo for estacionrio.
6.6. PREVISO 133
Assim, se o processo for estacionrio tem-se
lim
Io
L
(j
aI
[ T
a
) =
L
(j
aI
) =
L
(j) .
Outra questo tem a ver com os intervalos de previso. Vimos que os intervalos de
previso dependem da varincia do erro de previso
Vai (c
a
(/)) = o
2
I1
)=0
c
2
)
onde c
i
so os coecientes que se obtm da relao c
1
j
(1) 0
q
(1) , Recorde-se,
j
t
= c
1
j
(1) 0
q
(1) n
t
=
o
)=0
c
)
n
t)
.
Qual o valor da expresso Vai (c
a
(/)) = o
2
I1
)=0
c
2
)
quando / tende para
Temos de avaliar
lim
Io
o
2
I1
)=0
c
2
)
.
Se o processo j ESOpode-se provar que
o
)=0
c
2
)
nito
13
e, portanto, Vai (c
a
())
nito. Para que valor tende? Pode-se provar (veja-se o ltimo p-de-pgina) que
Vai (c
a
()) = Vai (j) .
Assim, se j estacionrio e Gaussiano, um intervalo de conana a 95% para j
aI
com / muito alto (ou / )
L
(j) 1.06
_
Vai (j)
O que acontece se j no estacionrio?
EXEMPLO 6.6.4. Considere-se o ARIMA(0, 1, 1)
j
t
= j
t1
n
t
0
1
n
t1
.
A previso a um passo
j
a1,a
=
L
(j
a1
[ T
a
) = j
a
0
1
n
a
.
13
Vimos em que condies se estabelece a estacionaridade. Outra forma alternativa consiste em
considerar a representao MA(o) do ARMA. Vimos
I
= c
1
(1) 0
q
(1) &
I
=
1
=0
&
I
.
Tem-se
L(
I
) = 0
\ui (
I
) = \ui
_
1
=0
&
I
_
= o
2
1
=0
Assim se E2O devemos ter \ui (

I
) = o
2
1
=0
< o. Logo devemos exigir
1
=0
< o
e, portanto,
1
=0
< o condio necessria para que seja estacionrio. Nestas condies

\ui (c
n
(I)) = L
_
c
2
n
(I)
_
= o
2
I1
=0
\ui (
I
) .
A dois passos
j
a2,a
=
L
(j
a2
[ T
a
) =
L
(j
a1
n
a2
0
1
n
a1
[ T
a
)
=
L
(j
a1
[ T
a
) = j
a
0
1
n
a
A / passos
j
aI,a
= j
a
0
1
n
a
.
Calcule-se agora a varincia do erro de previso Vai (c
a
(/)) = o
2
I1
)=0
c
2
)
.
Temos de calcular os c
i
e, para o efeito, comeamos por reescrever o processo na
forma
(1 1) j
t
= (1 0
1
1) n
t
ou
j
t
=
(1 0
1
1)
1 1
n
t
Para determinar c
i
:
(1 0
1
1)
1 1
= 1 c
1
1 c
2
1
2
...
1 0
1
1 =
_
1 c
1
1 c
2
1
2
...
_
(1 1)
= 1 1 c
1
1 c
1
1
2
c
2
1
2
c
2
1
S
...
= 1 (c
1
1) 1 (c
2
c
1
) 1
2
...
Resulta:
_
_
0
1
= c
1
1
0 = c
2
c
1
0 = c
S
c
2
...
=
_
_
c
1
= 1 0
1
c
2
= 1 0
1
c
S
= 1 0
1
...
(alternativa: srie de Taylor ou melhor frmula de Taylor...).
Logo
(1 0
1
1)
1 1
= 1 (1 0
1
)
. .
1
1 (1 0
1
)
. .
2
1
2
...
e, portanto,
Vai (c
a
(/)) = o
2
I1
)=0
c
2
)
= o
2
_
1 (1 0
1
)
2
... (1 0
1
)
2
_
= o
2
_
1 (/ 1) (1 0
1
)
2
_
Quando / =Vai (c
a
(/)) (a amplitude dos IC aumenta com /).
6.6.6. Qualidade da Previso. Podemos comparar a qualidade de previso
de dois modelos diferentes (por exemplo um AR versus um MA) comparando a
varincia do erro de previso Vai (c
a
(/)) dos dois modelos. Esta a abordagem
paramtrica. Temos uma outra forma, mais ecaz, de avaliarmos a previso de um
(ou mais) modelo(s) e que descrita a seguir.
6.6. PREVISO 135
In-sample estimation period
Out-of sample
forecast
evaluation period
t
1
1
n
FIGURA 6.18. In-Samples Estimation Period vs. Out-of Sample
Forecast Period
O perodo de observao da srie dividido em dois sub-perodos: o primeiro
designado por in-sample estimation period e o segundo por out-of sample fore-
cast. Fixe-se o perodo de estimao, por exemplo, de 1 a t
1
(veja-se a gura
6.18). Embora as observaes disponveis sejam j
1
, ..., j
t
1
, ..., j
a
o modelo esti-
mado apenas para o perodo de 1 a t
1
. Com base no modelo estimado no perodo
in-sample estimation, geram-se depois as previses para o perodo out-of sample
forecast e, nalmente comparam-se as previses com os valores observados mas
no utilizados na estimao. O esforo de previso no perodo ps-estimao
equivalente ao de uma previso verdadeira
14
.
Seja
c (/) = c
t
1
(/) = j
t
1
I
L
(j
t
1
I
[ T
t
1
)
j
j
I
=
L
(j
t
1
I
[ T
t
1
)
j
c
I
= j
t
1
I
(com t
1
/ = :).
Avaliao da Previso I
Tendo-se calculado os erros c (1) , c (2) , ..., c (/) , podemos agora avali-los
atravs das seguintes medidas:
Erro Mdio de Previso
1'1 =
1
/
I
i=1
(j
c
i
j
j
i
) =
1
/
I
i=1
c (/)
14
Tambm se denem as previses in-sample forecast. Tratam-se de previses geradas no
perodo de estimao do modelo. Por exemplo, previses a I-passos
L(
I+I
[ T
I
) , t I t
1
.
O esforo de previso baixo porque o modelo de previso usa estimativas

0 baseadas nas obser-
vaes
1
, ...,
I
1
(a qualidade da previso a um passo, I = 1, pode ser avaliada atravs dos critrios
habituais de ajustamento 1
2
, o, etc.).
A avaliao da qualidade da previso deve basear-se nas previses out-of-sample.
Raiz do Erro Quadrtico Mdio (REQM ou RMSE)
11Q' =
_
1
/
I
i=1
(j
c
i
j
j
i
)
2
=
_
1
/
I
i=1
c (/)
2
Erro Absoluto Mdio (EAM ou MAE)
1' =
1
/
I
i=1
[j
c
i
j
j
i
[ =
1
/
I
i=1
[c (/)[
Erro Percentual Absoluto Mdio (EPAM ou MAPE)
11' =
1
/
I
i=1
j
c
i
j
j
i
j
c
i
=
1
/
I
i=1
c (/)
j
c
i
Coeciente de Theil
l =
11Q'
_
1
I
I
i=1
(j
j
i
)
2
_
1
I
I
i=1
(j
c
i
)
2
, 0 _ l _ 1
EQM penaliza fortemente os erros maiores. A grande maioria das previses pode
ser excelente mas o EQM pode ser alto se existir uma previso m ou muito m.
O EAM no to severo neste aspecto. Se a grande maioria das previses for boa
ento o EAM vem relativamente baixo.
Relativamente ao coeciente de Theil, quanto mais baixo l melhor a pre-
viso. O caso l = 1 o pior cenrio (por exemplo, prever sistematicamente zero
quando os valores observados so diferentes de zero, ou prever sempre valores
positivos quando os valores observados so sempre negativos, etc.).
As estatsticas anteriores avaliam a magnitude do erro de previso e, com ex-
cepo do EMP, no levam em conta se o erro de previso positivo ou negativo.
Em certos casos, o sinal do erro de previso importante. Para ilustrar esta situ-
ao, considere-se o seguinte exemplo. Seja j a hora de partida do avio, j
j
a
previso da hora de chegada ao aeroporto (para embarcar) e c = j j
j
o erro de
previso. Se c 0, ele ou ela chega adiantado; se c < 0 chega atrasado e perde
o avio. Como poderemos avaliar o erro de previso? Funo quadrtica do tipo
EQM? (penalizar de igual forma chegar cedo ou tarde?). Uma funo de avaliao
poderia ser
1(c) =
_
000 c < 0
/c c 0, / 0.
(6.22)
Assim, chegar atrasado envolveria uma perca de 999 (valor que supomos muito
alto), ao passo que chegar adiantado c unidades de tempo, envolveria uma perca
proporcional a c (supondo 000 /c). Uma estatstica de avaliao da qualidade
da previso baseada em (6.22)
1
/
I
i=1
_
000J
c(i)<0
/c (i) J
c(i)0
_
. (6.23)
Escolhe-se o modelo que minimiza (6.23).
6.6. PREVISO 137
Outro caso em que a funo perca 1(c) no simtrica aplica-se a modelos de
previso que visam denir regras de compra e venda. Seja j
j
I
a previso do retorno
a / passos e j
c
I
o correspondente valor observado. Considera-se uma previso
correcta quando j
j
I
apresenta o mesmo sinal que j
c
I
. A funo perca
1(c) =
_
1 j
j
I
j
c
I
< 0
0 j
j
I
j
c
I
0.
(6.24)
Observe-se: se a previso correcta j
j
I
e j
c
I
apresentam o mesmo sinal e, portanto,
o produto j
j
I
j
c
I
positivo. Uma estatstica de avaliao da qualidade da previso
baseada em (6.24)
1
/
I
i=1
J
j
.
j
o
.
<0
. (6.25)
A equao (6.25) representa a proporo de previses com sinal incorrecto. Pode-
se preferir, todavia, trabalhar com a proporo de previses com sinal correcto:
11oC =
1
/
I
i=1
J
j
.
j
o
.
0
.
Avaliao da Previso II
Os erros de previso podem devem-se, basicamente, s seguinte razes:
As previses esto quase sempre acima ou abaixo dos valores observados
(exemplo: valores observado: 10, 11, 9, 12; previses: 15, 16, 13, 16);
A variabilidade das previses diferente da variabilidade dos valores pre-
vistos (exemplo: valores observados: 10, 11, 9, 12; previses: 2, 18, 5,
20).
As previses esto pouco correlacionadas com os valores observados.
Na metodologia que se segue procura-se identicar estas vrias fontes de erro.
Considere-se
:
2
c
=
1
/
I
i=1
(j
c
i
j
c
)
2
, :
2
j
=
1
/
I
i=1
(j
j
i
j
j
)
2
r =
1
I
I
i=1
(j
c
i
j
c
) (j
j
i
j
j
)
:
0
:
j
e dena-se
l
1
=
( j
c
j
j
)
2
1Q'
, l
\
=
(:
c
:
j
)
2
1Q'
, l
C
=
2 (1 r) :
0
:
j
1Q'
,
respectivamente a proporo do enviesamento, da varincia e da covarincia. Note-
se 1Q' =
1
I
I
i=1
(j
c
i
j
j
i
)
2
. A estatstica l
1
mede o erro sistemtico, l
\
mede a capacidade de j
j
reproduzir a variabilidade de j
c
e l
C
mede o erro no
sistemtico. A situao ideal (j
c
i
,= j
j
i
) l
\
= l
1
= 0 e l
C
= 1. Note-se que
l
\
l
1
l
C
= 1. Para provarmos esta igualdade, veja-se em primeiro lugar
que o EQM pode-se decompor em vrias parcelas. Considere-se:
1Q' =
1
/
I
i=1
(j
c
i
j
j
i
)
2
=
1
/
I
i=1
(j
c
i
j
c
j
c
j
j
i
j
j
j
j
)
2
=
1
/
I
i=1
((j
c
i
j
c
) (j
j
i
j
j
) ( j
c
j
j
))
2
=
1
/
I
i=1
(j
c
i
j
c
)
2
. .
o
2
o
1
/
I
i=1
(j
j
i
j
j
)
2
. .
o
2
( j
c
j
j
)
2
2
1
/
I
i=1
(j
c
i
j
c
) (j
j
i
j
j
)
. .
jo
0
o
= o
2
c
o
2
j
( j
c
j
j
)
2
2jo
0
o
j
= (o
c
o
j
)
2
( j
c
j
j
)
2
2 (1 j) o
0
o
j
Assim
1Q' = (o
c
o
j
)
2
( j
c
j
j
)
2
2 (1 j) o
0
o
j
e, portanto, dividindo ambos os termos pelo EQM, obtm-se
1 =
1Q'
1Q'
=
(o
c
o
j
)
2
1Q'
. .
l
1
( j
c
j
j
)
2
1Q'
. .
l
T
2 (1 j) o
0
o
j
1Q'
. .
l
C
.
Ao contrrio do EMP, da REQM e do EAM as estatsticas EPAM, l de Theil,
l
\
, l
1
e l
C
no dependem da escala da varivel. Por exemplo, se a varivel em
estudo for entrada de turistas na fronteira (unidade: n
c
de indivduos) e depois
resolvermos passar para entrada de turistas na fronteira (unidade: milhares de
indivduos), as estatsticas EPAM, l de Theil, l
\
, l
1
e l
C
no sofrem alterao
(porque no dependem da escala da varivel).
EXEMPLO 6.6.5. Na gura seguinte apresentam-se estatsticas referentes a
trs modelos de previso. Analise a qualidade das previses com base nas es-
tatsticas REQM, l de Theil, l
1
, l
\
, l
C
e Coii (entre os valores observados e
previstos).
Recursive Forecasting vs. Rolling Window
Suponha-se que estamos incumbidos de criar um modelo de previso a 5 pas-
sos. Por exemplo, podemos estar a trabalhar com dados dirios e o nosso objectivo
6.6. PREVISO 139
Observado
h y yp1 yp2 yp3 modelo1 modelo2 modelo3
1 1 2 2 1 1 1 0
2 2 3 3 3 1 1 1
3 3 2 3 4 1 0 1
4 2 4 4 4 4 4 4
5 4 4 5 7 0 1 9
6 5 5 6 2 0 1 9
7 6 5 7 9 1 1 9
8 7 7 8 3 0 1 16
9 5 4 9 9 1 16 16
10 9 10 10 11 1 1 4
Mdia 4.4 4.6 5.7 5.3 1 2.7 6.9
Varincia 5.64 5.24 6.81 10.61 1.2 20.61 31.29
corr(y,ypi) 0.9124 0.9230 0.6567
UE 0.0400 0.6259 0.1174
UV 0.0074 0.0204 0.1129
UC 0.9526 0.3537 0.7698
U 0.0986 0.1458 0.2341
Modelos de Previso erro quadrticos de previso
0
2
4
6
8
10
12
1 2 3 4 5 6 7 8 9 10
y
yp1
yp2
yp3
FIGURA 6.19. Trs modelos em confronto
denir um modelo de previso semanal. A qualidade da previso a / passos, com
/ ,= no nos interessa (s nos interessa a qualidade da previso a 5 passos). A
avaliao da previso feita nos pontos anteriores no serve porque as estatsticas
REQM, Coeciente de Theil, etc., avaliam a qualidade da previso a vrios passos,
ponderando de igual forma esses erros. Como fazer? Para avaliar a qualidade da
previso a 5 passos fazemos variar t
1
(veja-se a gura 6.18). Podemos ainda ter a
chamada previso recursiva (recursive forecasting) ou a janela mvel (rolling
window). Exemplica-se a seguir.
Recursive forecasting
Estima-se o modelo entre as observaes 1 a 1000 e prev-se para 1005;
etc.
Rolling window
etc.
Em ambos os casos, em cada iterao, faz-se sempre uma previso a 5 passos.
Todavia, com o mtodo rolling window, o perodo de estimao contm sempre
1000 observaes (o esforo de estimao constante). Na primeira hiptese o es-
foro de estimao vai diminuindo media que se acrescentam mais observaes
no perodo da estimao. Ao m de vrias iteraes temos uma amostra de val-
ores observados e valores previstos a 5 passos, que podemos comparar usando
as estatsticas j estudadas (EQM, EAM, etc.). Em termos formais, seja,
i
I
=
j
I
, j
I1
, ..., j
i
, j
vc
I,i
:=
L
_
j
iI
[
i
1
_
a previso a / passos usando o mtodo
recursive forecasting, j
vc
I,i
:=
L
_
j
iI
[
i
iI
_
, i /, a previso a / passos us-
ando o mtodo rolling window e j
c
i
:= j
iI
os valores observados. Com base em
: previses out-of-sample, podemos calcular, por exemplo,
1Q'
vc
(/) =
1
:
c
i=1
_
j
c
i
j
vc
I,i
_
2
, 1'
vc
(/) =
1
:
c
i=1
j
c
i
j
vc
I,i
1Q'
vc
(/) =
1
:
c
i=1
_
j
c
i
j
vc
I,i
_
2
, 1'
vc
(/) =
1
:
c
i=1
j
c
i
j
vc
I,i
.
Em geral, devemos esperar
11Q'
vc
(1) _ 11Q'
vc
(2) _ ... _ 11Q'
vc
(/)
1'
vc
(1) _ 1'
vc
(2) _ ... _ 1'
vc
(/)
Previso no EVIEWS
A previso no EVIEWS denida na janela forecast. Para obter previses
out-of-sample necessrio, em primeiro lugar, encurtar a amostra na fase da es-
timao. Para concretizar, suponha-se que esto disponveis 1100 observaes da
srie y. Se o perodo out-of-sample forecast for 1001-1100, o perodo de estimao
obviamente 1-1000. Assim, na opo de estimao deve-se escrever na caixa
sample 1 1000 (veja-se a gura 6.6.6). Depois de estimado o modelo, escolhe-se
a opo forecast e na caixa Forecast sample escreve-se 1001 1100 (veja-se a
gura 6.20).
6.6. PREVISO 141
FIGURA 6.20. Previso no EVIEWS
A opo Dynamic forecast faz a previso de j ignorando os valores ob-
servados de j no perodo 1001-1100 (segue a metodologia exposta em Avali-
ao da Previso I). Por exemplo, no caso da previso AR(1) usa-se a frmula
j
aI,a
= c
c
1
j
aI1,a
. A opo Static forecast segue o esprito da metodolo-
gia Recursive Forecasting vs. Rolling Window para / = 1 com a seguinte difer-
ena: o perodo de estimao mantm sempre xo. No exemplo em anlise o
perodo de estimao sempre 1-1000. A previso AR(1) para o perodo 1001
c

c
1
j
1000
; para o perodo 1002 c

c
1
j
1001
, etc. Os parmetros estimados c e
c
1
baseiam-se sempre na amostra 1-1000. Em qualquer destas opes o EVIEWS
calcula vrias estatsticas a partir dos erros de previso c (i) , i = 1, 2, ... Por razes
bvias a previso para alm do perodo de observao da varivel (no exemplo em
estudo, 1101-) s pode fazer-se usando a opo Dynamic forecast.
6.6.7. Outros Mtodos de Previso Lineares.
6.6.7.1. Mdias Mveis. Para tendncias localmente constantes a previso
de j, para o perodo : 1, : 2, ..., baseada na informao j
1
, ..., j
a

j
j
aI
=
j
a
j
a1
... j
a.1
, / = 1, 2, ...
onde o nmero de observaes includas em cada mdia (perodo da mdia
mvel). A previso constante.
6.6.7.2. Alisamento Exponencial. Para tendncias localmente constantes a
previso de j, para o perodo : 1, : 2, ... , baseada na informao j
1
, ..., j
a
j
j
aI
= o
a
, / = 1, 2, ...
o
a
= cj
a
(1 c) o
a1
, 0 < c < 1
O alisamento exponencial uma mdia ponderada de j
1
, ..., j
a
e o
0
. Com efeito,
o
a
= cj
a
(1 c) o
a1
= cj
a
(1 c) (cj
a1
(1 c) o
a2
)
= cj
a
(1 c) cj
a1
(1 c)
2
o
a2
= cj
a
(1 c) cj
a1
(1 c)
2
(cj
a2
(1 c) o
aS
)
= cj
a
(1 c) cj
a1
(1 c)
2
cj
a2
(1 c)
S
o
aS
= ...
= cj
a
c(1 c) j
a1
c(1 c)
2
j
a2
(6.26)
... c(1 c)
a1
j
1
(1 c)
a
o
0
.
Para tendncias localmente lineares pode-se usar o mtodo de Holt.
Estes mtodos podemser encarados como casos particulares dos modelos ARIMA.
Por exemplo, a previso do modelo ARIMA(0,1,1) equivalente previso do
modelo
o
a
= cj
a
(1 c) o
a1
.
Uma forma de provar esta armao consiste em mostrar que, se j
t
segue um
ARIMA(0,1,1)
j
t
= j
t1
0n
t1
n
t
, j
t
= j
t1
0n
t1
ento, a previso para j
a1
pode-se escrever na forma da equao (6.26)
15
. Uma
demonstrao alternativa a seguinte. No modelo ARIMA(0,1,1) a previso para
j
a1

L
(j
a1
[ T
a
) = j
a1,a
. Verique-se agora que
j
t
= j
t1
0n
t1
= j
t1
0
_
j
t1
j
t1
_
= (1 0) j
t1
0j
t1
.
Logo, no modelo ARIMA(0,1,1), tem-se
j
a1,a
= (1 0) j
a
0j
a
15
Com efeito, a previso para
n+1
, j
n+1,n
,
j
n+1,n
=
n
0&
n
=
n
0 (
n
j
n
)
=
n
0
n
0j
n
= (1 0)
n
0 (
n1
0&
n2
)
= (1 0)
n
0
n1
0
2
&
n2
= (1 0)
n
0
n1
0
2
(
n2
0&
n3
)
= (1 0)
n
(1 0) 0
n1
0&
n3
= ...
= (1 0)
n
(1 0) 0
n1
(1 0) 0
2
n2
... (1 0) 0
n1
1
0
n
0
.
Para vericar que a previso do modelo ARIMA(0,1,1) equivalente previso do modelo
o
n
= c
n
(1 c) o
n1
basta comparar a expresso obtida para j
n+1,n
com (6.26). Estas
expresses so iguais para c = (1 0) (admitindo que o
0
=
0
). fcil observar que a previso
para
n+I
, I 1, em ambos os modelos, o
n
= j
n+1,n
.
6.7. PROCESSOS ARMA SAZONAIS 143
ou, redenindo, o
a
= j
a1,a
e c = 1 0, vem
o
a
= cj
a
(1 c) o
a1
,
que precisamente a expresso do alisamento exponencial.
Como concluso: os modelos ARIMA so (muito) mais gerais do que modelos
concorrentes vistos neste ponto.
6.7. Processos ARMA Sazonais
Faz-se uma brevssima anlise dos processos ARMA sazonais ou SARMA.
Muitas sucesses envolvem uma componente sazonal ou peridica de perodo o
(nmero de observaes por perodo). Na maior parte das aplicaes o assume os
valores 12 (dados mensais) e 4 (dados trimestrais).
Se s existisse a componente sazonal teramos, por exemplo,
j
t
= 1
1
j
t12
n
t
, ou
j
t
= 1
1
j
t12
1
2
j
t21
n
t
.
6.7.1. Processo AR(P)
S
.
AR(1)
S
j
t
= 1
1
j
tS
n
t
n
t
rudo branco
AR(2)
S
j
t
= 1
1
j
tS
1
2
j
t2S
n
t
AR(P)
S
j
t
= 1
1
j
t12
1
2
j
t2c
... 1
1
j
t1c
n
t
ou,
_
1 1
1
1
S
1
2
1
2S
... 1
1
1
1S
_
j
t
= n
t
1
1
_
1
S
_
j
t
= n
t
.
Para um AR(1)
S
, j
t
= 1
1
j
tS
n
t
, deixa-se como exerccio vericar que
j
t
=
o
)=0
1
)
1
n
t)S
,
L
(j
t
) = 0,
Vai (j
t
) = o
2
o
)=0
1
2)
1
=
o
2
1 1
2
1
(o
2
= Vai (n
t
) ),
Relativamente covarincia pode-se concluir:
Cov (j
t
, j
t1
) =
o
i=0
o
)=0
1
i
1
1
)
1
L
(n
tiS
n
t1)S
) = 0
Cov (j
t
, j
t2
) = Cov (j
t
, j
tS
) = Cov (j
t
, j
tS1
) = 0
Cov (j
t
, j
tS
) =
o
i=0
o
)=0
1
i
1
1
)1
1
L
(n
tiS
n
t)S
) = o
2
o
i=0
1
)
1
1
)1
1
= o
2
1
1
1 1
2
1
.
Donde
j
I
=
_
1
n
1
/ = :o, : = 0, 1, 2, ...
0 / ,= :o, : = 0, 1, 2, ...
Tambm se pode concluir
c
II
=
_
1
1
/ = o
0 / ,= o.
Na gura seguinte apresenta-se a FACe FACP (tericas) de umprocesso AR(1)
S=12
com 1
1
= 0..
FAC
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 12 24 36 48
FACP
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 12 24 36 48
6.7.2. Processo MA(Q)
S
.
MA(1)
S
j
t
= O
1
n
tS
n
t
, n
t
rudo branco;
MA(2)
S
j
t
= O
1
n
tS
O
2
n
t2S
n
t
;
MA(Q)
S
j
t
= O
1
n
tS
O
2
n
t2S
... O
Q
n
tQS
n
t
ou,
j
t
=
_
1 O
1
1
S
O
2
1
2S
... O
Q
1
Qc
_
n
t
j
t
= O
Q
_
1
S
_
n
t
Para um MA(1)
S
, j
t
= O
1
n
tS
n
t
, deixa-se como exerccio vericar que
L
(j
t
) = 0,
Vai (j
t
) =
_
1 O
2
1
_
o
2
(o
2
= Vai (n
t
) ).
Tambm se pode concluir:
j
I
=
_

O
1
1O
2
1
/ = o
0 / ,= o
e
c
II
=
_
_
_
O
1
1O
2
1
/ = o
O
r
1
(1O
2
1
)
1O
2(r+1)
1
/ ,= o.
Na gura seguinte apresenta-se a FACe FACP (tericas) de umprocesso MA(1)
S=12
com O
1
= 0.
6.7. PROCESSOS ARMA SAZONAIS 145
FAC
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 12 24 36 48
FACP
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 12 24 36 48
6.7.2.1. Processos Multiplicativos ARMA(p,q)(P,Q)
S
. Componentes no sazonal
e sazonal (modelo ARMA(p,q)(P,Q)
S
):
c
j
(1) 1
1
_
1
S
_
j
t
= 0
q
(1) O
Q
_
1
S
_
n
t
EXEMPLO 6.7.1. Modelo ARMA(2,1)(1,0)
12
_
1 c
1
1 c
2
1
2
_ _
1 1
1
1
12
_
j
t
= (1 0
1
1) n
t
_
1 c
1
1 c
2
1
2
1
1
1
12
c
1
1
1
1
1S
c
2
1
1
1
11
_
j
t
= n
t
0
1
n
t1
j
t
= c
1
j
t1
c
2
j
t2
1
1
j
t12
c
1
1
1
j
t1S
c
2
1
1
j
t11
n
t
0
1
n
t1
Corresponde a um modelo ARMA(14,1) com restries (no lineares) sobre os
parmetros (incluindo restries de nulidade).
CAPTULO 7
Modelao da Mdia: Abordagem No Linear
7.1. Introduo
Ao longo das ltimas dcadas os modelos ARMA tm dominado a abordagem
de sries temporais (os primeiros trabalhados datam de 1927 com os modelos au-
toregressivos estudados por Yule). Existem razes para o sucesso dos modelos
ARMA Gaussianos:
simplicidade: as equaes s diferenas nitas so fceis de tratar;
o modelo ARMA Gaussiano completamente caracterizado pela mdia,
varincia e pelas autocorrelaes;
so fceis de aplicar e implementar (a maioria dos programas de estats-
ticas possui um mdulo para tratar os modelos ARMA);
a teoria est completamente desenvolvida: as principais questes, rela-
cionadas com a estimao, inferncia e previso esto resolvidas;
apesar da simplicidade so relativamente exveis e teis na previso.
Todavia, os modelos ARMA apresentam limitaes:
no so apropriados para dados que exibam sbitas alteraes em pero-
dos irregulares;
no so apropriados para dados que exibam forte assimetria e achata-
mento;
os coeciente de autocorrelao e autocorrelao parcial de ordem / so
apenas umdos aspectos da distribuio conjunta de (j
t
, j
tI
) . Pode suceder
j
I
e c
II
serem baixos, mas existir uma forte relao no linear entre j
t
e
j
tI
. Por exemplo j
I
_
j
2
_
= Coii
_
j
2
t
, j
2
tI
_
pode ser alto;
no modelam dados que exibam solues peridicas estveis. Re-
tomaremos este tema mais frente.
Discuta-se um pouco mais em detalhe a primeira limitao mencionada. Um
modelo ARMA Gaussiano estacionrio possui momentos de todas as ordens, i.e.,
L
_
[j
t
[
I
_
< para qualquer / N. Este facto implica que a probabilidade de j
assumir (transitoriamente) valores muito altos ou muito baixos praticamente nula
e, neste sentido, os modelos ARMA no so apropriados para dados que exibam
sbitas alteraes em perodos irregulares. Para esclarecer este ponto, assuma-se
que
L
(j) = 0 e recorde-se que se j possui o momento de ordem /, ento (pela
desigualdade de Markov) vem, para c 0
1 ([j[ c) _ O
_
c
I
_
147
148 7. MODELAO DA MDIA: ABORDAGEM NO LINEAR
A expresso anterior estabelece que 1 ([j[ c) proporcional (ou menos do que
proporcional) a c
I
. Como c
I
tende para zero quando c , 1 ([j[ c) tende
tambmpara zero nas mesmas condies, e relativamente depressa se / uma valor
alto. Logo, a possibilidade de [j[ assumir um valor arbitrariamente grande prati-
camente nula. Se j possuir apenas o primeiro ou segundo momento, 1 ([j[ c)
continua a tender para zero, mas a uma taxa muito mais baixa, e j pode assumir
valores moderadamente altos. A existncia de todos os momento como no caso
do modelo ARMA Gaussiano, pode, em certos casos, no ser uma propriedade
desejvel, pois em ltima anlise impede que o modelo capte dados que exibam
sbitas alteraes, excluindo portanto, os casos em que j assume transitoriamente
valores muito altos ou muito baixos.
Enquanto os modelos lineares so denidos no essencial atravs da represen-
tao ARMA, o nmero de especicaes no lineares virtualmente innito. Em-
bora a literatura dos modelos no lineares esteja ainda na sua infncia, existem j
muitos modelos no lineares propostos na literatura. Vamos apenas focar alguns
modelos no lineares mais utilizados. Mas anal, o que um modelo no linear?
Uma forma simples (mas no geral) de introduzir modelos no lineares con-
siste emapresentar a no linearidade atravs dos momentos condicionais. Considere-
se o modelo
j
t
= j
t
n
t
, n
t
= o
t
-
t
onde -
t
um rudo branco, j
t
= q (j
t1
, j
t2
, .., j
tj
; n
t1
, n
t2
, ...n
tq
) a
mdia condicional de j
t
e o
2
t
= /(j
t1
, j
t2
, ..., j
t` j
; n
t1
, n
t2
, ..., n
t` q
) 0
a varincia condicional de j
t
. O modelo no linear na mdia se q uma funo
no linear dos seus argumentos
1
. O modelo no linear na varincia se o
t
no
constante ao longo do tempo pois, neste caso, o processo n
t
, denido por n
t
=
o
t
-
t
, no linear, por ser um processo multiplicativo.
Vejamos alguns exemplos. No caso
j
t
= cj
t1
log
_
1 j
2
t1
_
n
t
tem-se um processo no linear na mdia, pois, j
t
= cj
t1
log
_
1 j
2
t1
_
uma
funo no linear de j
t1
. Tambm
j
t
= n
t1
n
t2
n
t
um processo no linear, pois j
t
= n
t1
n
t2
no linear nos valores passados
de n
t
.
Os modelos no lineares na varincia mais conhecidos so os modelos do tipo
ARCH; sero discutidos no captulo 8.
Uma classe importante de processos no lineares na mdia baseiam-se na ideia
de regime-switching. Podem ser usados em duas circunstncias gerais:
1
Dizemos que uma funo no linear se no for uma funo linear am, i.e., se no vericar
a relao ) (r
1
, ..., r
n
) = o
0
o
1
r
1
... o
n
r
n
, onde o
.
R.
7.2. ESTABILIDADE EM EQUAES S DIFERENAS FINITAS DETERMINSTICAS 149
existem alteraes bruscas e inesperadas nas trajectrias dos processos
(e.g., ataques especulativos, crashes bolsistas, anncios pblicos de me-
didas do governo, eventos polticos e, em geral, eventos extraordinrios
no antecipados).
existem alteraes da dinmica do processo sem alteraes bruscas nas
trajectrias. Por exemplo, a taxa de juro no perodo 1993 a 2006 ex-
ibe dois perodos com comportamento bem diferenciado: no primeiro,
as taxas de juro e a volatilidade so relativamente altas e o processo ev-
idencia uma tendncia de reverso para uma mdia, seguindo-se, depois
de 1995, um perodo de baixas taxas de juro, baixa volatilidade e ausn-
cia de reverso para uma mdia. Outro exemplo a taxa de inao no
perodo 1974-2006 (basta vericar os nveis de inao e volatilidade nos
anos 70/80 e nos anos 90).
Para este tipo de fenmenos, os modelos comalteraes (estocsticas) de regime
(ou regime-switching) podem ser, no essencial, de dois tipos:
a mudana de regime funo de uma varivel observvel; so exem-
plos, modelos com variveis impulso (dummy), os modelos limiares ou
threshold AR (TAR), os modelos onde os coecientes associados s com-
ponentes AR so funes no lineares dos valores passados j (STAR,
smoothed transition AR), entre outros;
a mudana de regime no observada, incluindo-se, nesta classe, os mod-
elos onde os regimes so independentes entre si (como, por exemplo, os
modelos simple switching ou de Bernoulli) e os modelos onde existe de-
pendncia entre os regimes (como por exemplo, os modelos MS, Markov-
Switching).
Antes de entrarmos nos processos estocsticos no lineares, faz-se, na prxima
seco, uma breve incurso sobre os sistemas autnomos do tipo
y
t
= g (y
t1
)
(determinsticos). O estudo da estabilidade deste tipo de sistemas relevante para
um estudo mais aprofundado dos processos estocsticos do tipo j
t
= q (j
t1
) n
t
(ou, mais geralmente, j
t
= q (j
t1
, j
t2
, ..., j
tj
) n
t
), pois parte da dinmica
subjacente ao processo estocstico depende da funo q (ou g no caso multivari-
ado).
7.2. Estabilidade em Equaes s Diferenas Finitas Determinsticas
Nesta seco analisa-se o sistema autnomo
2
y
t
= g (y
t1
) onde y um vec-
tor de tipo :1 e g uma funo real
3
g : R
n
R
n
. O modelo determinstico
(pois no possui termo de erro e a condio inicial determinstica - i.e., con-
hecida).
2
Um sistema diz-se autnomo se a funo g no depende explicitamente de t (tempo).
3
O domnio de j poder ser o R
r
mas neste caso devemos exigir que o j (o) (suponha-se
que esta condio no se verica - ento poderia suceder que o e
1
= j () o e no seria
possvel agora continuar com
2
= j (
1
) = j (j ()) pois j () o).
7.2.1. Pontos Fixos e Estabilidade de Sistemas Lineares.
DEFINIO 7.2.1 (Ponto Fixo de )). Um vector y designado por ponto xo
de g se g ( y) = y, para todo o t.
No ponto xo o sistema dinmico discreto no varia (est em equilbrio). Com
efeito, se y
t1
= y e y um ponto xo, a variao da soluo, ^y
t
, nula, i.e.,
^y
t
= y
t
y
t1
= g (y
t1
) y
t1
= y y = 0.
Por exemplo, considere-se j
0
= 2 e a equao s diferenas nitas (EDF)
4
j
t
= (1,2) j
t1
1 (note-se : = 1). Iterando a equao fcil vericar que
j
1
= 2, j
2
= 2, ... Logo j = 2 o ponto xo de q (r) = (1,2) r1. Para calcular
o ponto xo de q basta resolver a equao (1,2) j 1 = j em ordem a j.
t
= 2j
t1
(1 j
t1
) . Tem-se q (r) = 2r(1 r) .
Os pontos xos (de q) calculam-se a partir da relao q ( j) = j, i.e., 2 j (1 j) =
j. Os pontos xos so portanto j = 0 e j = 1,2.
EXEMPLO 7.2.2. Considere-se o sistema no linear
_
j
1t
j
2t
_
=
_
j
2t1
j
2I1
j
1I1
_
.
Tem-se, portanto
g
__
r
1
r
2
__
=
_
r
2
a
2
a
1
_
com domnio
__
r
1
r
2
_
R
2
: r
1
,= 0
_
.
Determinem-se os pontos xos de q. Para o efeito, resolve-se g (x) = x, i.e.,
_
r
2
a
2
a
1
_
=
_
r
1
r
2
_
.
fcil vericar que o nico ponto xo
_
1
1
_
.
PROPOSIO 7.2.1. Seja o um intervalo fechado e q : o R uma funo
contnua. Se o _ q (o) ento q tem um ponto xo em o.
DEM. Ver Nicolau (2004).
Quando : = 1 e a EDF autnoma muito til o grco teia de aranha no
estudo da estabilidade. Para ilustrar a interpretao do grco representa-se na
gura 7.1 o grco teia de aranha associado equao j
t
= 0.j
t1
, com valor
inicial j
0
= 4 (ponto a). No momento 1 tem-se j
1
= 0. 4 = 2 (ponto / ou c).
4
O ramo da matemtica que estuda a dinmica de sistemas determsticos usa, por vezes, uma
linguagem um pouco diferente da que estamos habituados. Por exemplo, a equao
I
= c
I1
designada por equao s diferenas nitas homognas de primeira ordem linear. Mantemos a
designao equao s diferenas nitas ou sistema de equaes s diferenas nitas (consoante
o caso) para identicar a equao
I
= j (
I1
) .
-4 -2 2 4
-4
-2
2
4
a
b
c
d
e
Linha 45
f(x)
y
t
y
t-1
FIGURA 7.1. Grco Teia de Aranha do PVI j
t
= 0.j
t1
, j
0
= 4
FIGURA 7.2. Grco Teia de Aranha da Aplicao ) (r) = r
2
(esto traadas duas rbitas com valores inicias -1.1 e 0.9)
Este valor, j
1
= 2, pode ser interpretado como o valor inicial com respeito a j
2
;
assim, poderamos colocar j
1
= 2 no eixo das abcissas. Em alternativa, o valor
j
1
parte da linha de 45
0
(ponto c) e o procedimento repetido iterativamente.
Assim, no momento 2 tem-se j
2
= 0. 2 = 1 (ponto c) e assim sucessivamente.
O grco mostra que lim
to
j
t
= 0.
Na gura 7.2 representa-se o grco teia de aranha da EDF j
t
= j
2
t1
(o que
sucede quando o valor inicial se encontra no intervalo (1, ) ? E no intervalo
(0, 1)? E ainda no intervalo(1, 0))
Seja j
t
= j
t
(j
0
) a soluo da EDF (ou do sistema de EDF) j
t
= q (t, j
t1
) ,
dada a condio inicial j
0
(para simplicar admite-se, sem perda de generalidade,
que t
0
= 0). A expresso j
t
(j
0
) dene a soluo como uma funo explcita da
condio inicial j
0
. No caso da EDF autnomas usual considerar-se a notao
j
t
= q
t
(j
0
) em lugar de j
t
= j
t
(j
0
) onde
q
t
(r) := q(...q(q
. .
t vezes
(r))).
EXEMPLO 7.2.3. Se q (r) =
1
1a
, ento
q
2
(r) = q (q (r)) = q
_
1
1 r
_
=
1
1
1
1a
,
q
S
(r) = q (q (q (r))) = q
_
q
_
1
1 r
__
= q
_
1
1
1
1a
_
=
1
1
1
1
1
1+i
.
Dada a EDF j
t
=
1
1j
I1
, o valor j
S
dado j
0
= 1
q
S
(1) =
1
1
1
1
1
1+1
=
8
.
Naturalmente, podemos obter este valor considerando o procedimento iterativo,
j
1
=
1
1 1
=
1
2
, j
2
=
1
1
1
2
=
2
8
, j
S
=
1
1
2
S
=
8
.
A expresso q
t
(j
0
) representa o valor de j
t
dada a condio j
0
.
DEFINIO 7.2.2 (Estabilidade - Caso q : R R). O ponto xo j diz-se
estvel se para cada - 0 existe um c = c (t
0
, -) tal que, para cada qualquer
soluo j
t
(j
0
) a desigualdade [j
0
j[ _ c implica [j
t
(j
0
) j[ < - para todo o
t _ t
0
. O ponto xo j diz-se assimptoticamente estvel se estvel e se existe um
c
0
0 tal que a desigualdade [j
0
j[ _ c
0
implica [j
t
(j
0
) j[ 0 quando
t . O ponto xo j diz-se instvel se no estvel.
5
(A denio adapta-se facilmente ao caso multivariado - basta trocar [[ por
|| e ajustar as notaes). Grosso modo, um ponto xo j estvel se j
t
= j
t
(j
0
)
permanecer perto de j para todo o t sempre que j
0
se encontrar perto de j. O
ponto xo j assimptoticamente estvel se for estvel e toda a soluo inicializada
perto de j converge para j.
t
= cj
t1
c, com c ,= 0. Tem-se q (r) =
cr c. Resolvendo q ( j) = j, i.e., c j c = j conclui-se que o (nico) ponto xo
j = c, (1 c). No caso c = 1 no existe ponto xo (a equao r c = r
impossvel, com c ,= 0). A estabilidade do ponto xo j pode, no caso presente, ser
discutida directamente a partir q
t
(na generalidade dos casos no lineares no
possvel obter q
t
). Tem-se, com a condio inicial j
0
, j
t
= q
t
(j
0
) = j
0
c
t
c
1
I
1
.
Assim
q
t
(j
0
) j = j
0
c
t
c
1 c
t
1 c

c
1 c
= c
t
_
j
0
c
1 c
_
q
t
(j
0
) j
= [c[
t
j
0
c
1 c
= [c[
t
[j
0
j[ .
5
Se a EDF autnoma leia-se j
I
(
0
) em lugar de
I
(
0
) .
-0.5 -0.25 0.25 0.5 0.75 1
-0.4
-0.2
0.2
0.4
0.6
A B C
FIGURA 7.3. Grco Teia de Aranha da equao j
t
=
2j
t1
(1 j
t1
) (representados trs valores iniciais).
Impondo

q
t
(j
0
) j
< - vem [c[

t
[j
0
j[ < -. Se [c[ < 1 ento j es-
tvel. Basta considerar um c tal que [j
0
j[ _ c < -. Nestas condies tem-se
q
t
(j
0
) j
< - para todo o t 0. Se [c[ 1 o termo
q
t
(j
0
) j
tende para
o que signica que no existe um c 0 nos termos da denio de ponto xo
estvel; logo j instvel. Analise-se a estabilidade assimpttica. Tem-se para
c ,= 1
lim
to
q
t
(j
0
) = lim
to
_
j
0
c
t
c
1 c
t
1 c
_
=
_
c
1
= j se [c[ < 1
se [c[ 1
Assim, se [c[ < 1 o ponto xo j assimptoticamente estvel; se [c[ 1, j
instvel.
EXEMPLO 7.2.5. Retome-se o exemplo 7.2.1 (j
t
= 2j
t1
(1 j
t1
)). Vimos
que os pontos xos so j = 0 e j =
1
2
. Discute-se agora a estabilidade a partir do
grco teia de aranha - ver a gura 7.3. Esto representados trs valores iniciais.
fcil concluir que qualquer ponto que se encontre numa vizinhana do ponto xo
1/2 (por exemplo ponto A ou B) no s no se afasta de 1/2 como tambm converge
para j = 1,2. Este ponto xo portanto assimptoticamente estvel. O ponto xo
zero instvel. Basta observar o que sucede quando j inicializado no ponto C.
Considere-se um sistema de :equaes lineares y
t
= Ay
t1
com a condio
inicial j
0
e seja
r = max [`
i
[ : `
i
um valor prprio de A(i = 1, ..., :) . (7.1)
A estabilidade de um sistema de equaes lineares estabelecida na seguinte
PROPOSIO 7.2.2. (a) Se r < c < 1 ento existe uma constante C 0 tal
que
|y
t
| _ Cc
t
|y
0
|
-4
-2
0
2
4
6
8
10
12
0 1 2 3 4 5 6 7 8 9 10 11
y1
y2
FIGURA 7.4. Trajectrias j
1t
e j
2t
para t _ 0, para qualquer j
0
R. Alm disso verica-se lim
to
|y
t
| = 0.(b)
Se r 1 ento algumas solues do sistema tendem para . (c) Se r _ 1 e se
a multiplicidade algbrica de todos os valores prprios que vericam [`[ = 1 for
igual a um ento existe uma constante C 0 tal que |y
t
| _ C |y
0
| para t _ 0.
Notar que se ` nmero complexo ento [`[ = [c ,i[ =
_
c
2
,
2
.
Resulta da proposio anterior que o ponto xo j = 0 , assimptoticamente
estvel se r < 1, instvel se r 1, e estvel se r _ 1 e se a multiplicidade
algbrica de todos os valores prprios que vericam [`[ = 1 for igual a um.
EXEMPLO 7.2.6. Estude-se a estabilidade do sistema
_
j
1t
j
2t
_
=
_
1
0.2 1
__
j
1t1
j
2t1
_
.
Os valores prprios so
1
2
i. Logo r =
1
2
. Como r < 1 conclui-se que o ponto xo
y = 0 assimptoticamente estvel. Nas guras seguintes analisa-se gracamente
a dinmica do sistema admitindo y
0
= (10, 1)
t
. Na gura 7.4 apresentam-se as
trajectrias j
1t
e j
2t
. A gura 7.4 elucidativa quanto estabilidade do sistema.
Em ambos os casos se observa j
1t
0, j
2t
0 quanto t .
EXEMPLO 7.2.7. Considere-se o sistema de EDF
y
t
=
_
cos 0 son0
son0 cos 0
_
y
t1
.
Os valores prprios so ` = cos 0 i sin0 e [cos 0 i sin0[ = [cos 0 i sin0[ =
_
cos
2
0 sin
2
0 = 1. Como a multiplicidade algbrica de todos os valores prprios
que vericam [`[ = 1 igual a um conclui-se que o ponto xo j = 0 estvel.
7.2.2. Estabilidade de Sistemas No Lineares.
7.2.2.1. Linearizao. A proposio seguinte fornece um mtodo para anal-
isar a estabilidade assimpttica no caso escalar (EDF autnomas).
PROPOSIO 7.2.3. Suponha-se que q : RR tem derivada de primeira or-
dem contnua num intervalo aberto contendo o ponto xo j. Ento (a) se [q
t
( j)[ <
1, j assimptoticamente estvel; (b) se [q
t
( j)[ 1, j instvel.
DEM. (a) Dado que, por denio,
lim
a j
[q (r) q ( j)[
[r j[
= lim
a j
[q (r) j[
[r j[
=
q
t
( j)
ento existe uma vizinhana \

.
( j) de raio - 0, tal que, para [q
t
( j)[ < c < 1,
[q (r) j[ < c[r j[ , r \
.
( j) .
Resulta que r \
.
( j) = q (r) \
.
( j) (pela desigualdade anterior, constata-
se que q (r) est mais "perto"de j do que r est de j, por um factor de ordem
c < 1). imediato vericar que q (r) \
.
( j) = q
2
(r) \
.
( j) . Repetindo o
argumento conclui-se q
t
(r) \
.
( j) . Logo,
q
2
(r) j
= [q (q (r)) j[ < c[q (r) j[ < c

2
[r j[ .
Por induo, conclui-se
q
t
(r) j
< c
t
[r j[. Como c
t
0 segue-se que j
assimptoticamente estvel. (b) Utilizando argumentos idnticos conclui-se que
q
t
(r) se afasta cada vez mais de j medida que t .
EXEMPLO 7.2.8. Retome-se os exemplos 7.2.1 e 7.2.5. Comq (r) = 2r(1 r)
tem-se q
t
(r) = 2 4r e, portanto, pela proposio 7.2.3, o ponto xo 0 instvel
pois [q
t
(0)[ = 2 1 e o ponto 1/2 assimptoticamente estvel pois [q
t
(1,2)[ =
0 < 1.
Analise-se agora a estabilidade de sistemas de EDF. Uma forma de abordar a
estabilidade de sistemas de EDF consiste em linearizar g (x) em torno do ponto
xo y (o caso escalar apresentado atrs baseia-se tambm no mtodo da lineariza-
o). Suponha-se que g (x) possui derivadas de segunda ordem contnuas. Ento,
pela frmula de Taylor vem
g
i
(x) = q
i
( y)
0g
i
( y)
0x
T
(x y)
1
2
(x y)
T
0g
2
i
(z)
0x0x
T
(x y) , i = 1, ..., :
ou, mais compactamente,
g (x) = g ( y) g
t
( y) (x y) L(x) (7.2)
Note-se que g
t
( y) o Jacobiano de g no ponto y ( uma matriz de constantes).
Reescreva-se a equao (7.2) na forma
g (x) = Ax L(x)
onde
A = g
t
( y) =
_
_
_
_
0j
1
( y)
0x
1

0j
1
( y)
0x
r
.
.
.
.
.
.
.
.
.
0j
r
( y)
0x
1

0j
r
( y)
0x
r
_
_
_
_
, (7.3)
L(x) = g ( y) g
t
( y) y
1
2
_
_
_
_
(x y)
T 0j
2
1
(z)
0x0x
T
(x y)
.
.
.
(x y)
T 0j
2
r
(z)
0x0x
T
(x y)
_
_
_
_
(note-se que z varia com x). Tem-se agora:
PROPOSIO 7.2.4. Suponha-se que g : R
n
R
n
tem derivadas de segunda
ordem contnuas num conjunto aberto contendo o ponto xo y. Dado
r = max [`
i
[ : `
i
um valor prprio de A(i = 1, ..., :)
e A dada pela equao (7.3) tem-se, (a) se r < 1 ento y assimptoticamente
estvel; (b) se r 1 ento j instvel.
DEM. Ver Kelley e Peterson, (1991), p. 180.
Obviamente esta proposio generaliza a proposio 7.2.3.
EXEMPLO 7.2.9. Considere-se o seguinte modelo presa-predador,
j
1t
= (1 j) j
1t1
0.001
j
1t1
j
2t1
1 0.0001j
1t1
j
2t
= (1 c) j
2t1
0.00008
j
1t1
j
2t1
1 0.0001j
1t1
onde j
1t
e j
2t
representa, respectivamente, o nmero de presas e o nmero de
predadores no momento t, j a diferena entre a taxa de nascimento e a taxa de
mortalidade das presas e c a taxa de mortalidade dos predadores. Suponha-se
que j = 0.1 e c = 0.01. Tem-se
g (r
1
, r
2
) :=
_
q
1
(r
1
, r
2
)
q
2
(r
1
, r
2
)
_
=
_
1.1r
1
0.001
a
1
a
2
10.0001a
1
0.00r
2
0.00008
a
1
a
2
10.0001a
1
_
.
Os pontos xos resultam da resoluo do sistema g (r
1
, r
2
) = (r
1
, r
2
) . Obtm-se
dois pontos xos,
y
1
=
_
0
0
_
, y
2
=
_
844.828
108.448
_
.
Estude-se a estabilidade do ponto xo y
2
, recorrendo-se proposio 7.2.4. Para
o efeito determina-se
A = g
t
( y
2
) =
_
0j
1
( y
2
)
0x
1
0j
1
( y
2
)
0x
r
0j
r
( y
2
)
0x
1
0j
r
( y
2
)
0x
r
_
.
Depois de alguns clculos obtm-se
A =
_
1.008 0.8888
0.0020 1
_
.
-50
50
150
250
350
450
550
0 100 200 300 400 500 600 700
y1
y2
FIGURA 7.5. Trajectrias j
1t
e j
2t
(t = 0, 1, ..., 800)
Os valores prprios so `
1
, `
2
= 1.00167 0.0810466i. Donde
[`
1
[ = [1.00167 0.0810466i[ =
_
1.00167
2
0.0810466
2
= 1. 002,
[`
1
[ = [1.00167 0.0810466i[ =
_
1.00167
2
0.0810466
2
= 1. 002,
pelo que r = 1.002 1 e, portanto, o ponto xo j
2
instvel. A gura 7.5 ilustra
o comportamento dinmico do sistema.
7.2.2.2. Mtodo Directo de Liapunov. Veja-se agora o chamado Mtodo Di-
recto de Liapunov. Considere-se um sistema de EDF y
t
= g (y
t1
) com a
condio inicial y
0
e seja y um ponto xo de q. Considere-se uma funo real
\ de : variveis nas seguintes condies: \ contnua numa vizinhana \
.
( y) ,
\ (x) 0 se r ,= j em\
.
( j) e \ ( j) = 0. Uma funo nestas condies designa-
se por funo Liapunov. Dena-se
^\ (x) := \ (g (x)) \ (x)
em \
.
( y) (no confundir a funo \ com a vizinhana de . de raio -, \
.
(.)).
PROPOSIO 7.2.5 (Mtodo Directo de Liapunov). Seja y um ponto xo de
g e assuma-se que g contnua numa certa vizinhana de y. Se (a) ^\ (x) _ 0
para todo o x \
.
( y) ento a soluo y estvel; se (b) ^\ (x) < 0 para
todo o r \
.
( y) e x ,= y ento a soluo y assimptoticamente estvel; se (c)
^\ (x) 0 para todo o - 0 e x \
.
( y) e x ,= y ento a soluo y instvel.
Apresenta-se uma explicao heurstica do resultado (no caso escalar). Imagine-
se a funo \ (r) como uma distncia entre r e j com r \
.
( j) . Considere-se
0 < c < -. Por hiptese j
0
\
c
( j) e, como, \ (q (j
0
)) _ \ (j
0
) o ponto
j
1
= q (j
0
) no se afasta de j (j
1
no est mais distante de j do que j
0
est de
j). Logo j
1
\
c
( j) . Seguindo o mesmo raciocnio tem-se que \ (q (j
1
)) _
\ (j
1
) implica j
2
\
c
( j) . Iterando, conclui-se que j
t
\
c
( j) \
.
( j) .
Logo a soluo j estvel. Suponha-se agora a desigualdade estrita \ (q (r)) <
\ (r) . Por hiptese j
0
\
.
( j) e \ (q (j
0
)) < \ (j
0
) implica [q (j
0
) j[ <
c[j
0
j[, 0 < c < 1. Por seu lado, a desigualdade \ (q (j
1
)) < \ (j
1
) im-
plica [j
2
j[ = [q (j
1
) j[ < c[q (j
0
) j[ < c
2
[j
0
j[ . Iterando, conclui-se
[j
t
j[ < c
t
[q (j
0
) j[ 0 quando t .
t
= j
t1
j
S
t1
. O nico ponto xo j = 0.
A proposio 7.2.3 inconclusiva, pois com q (r) = r r
S
, tem-se [q
t
(0)[ = 1.
Considere-se a funo \ (r) = r
2
. Vem
^\ (r) =
_
r r
S
_
2
r
2
= r
6
2r
1
= r
1
_
r
2
2
_
< 0
no conjunto
_
r : [r[ <
_
2
_
= \
_
2
( j) . Logo o ponto xo j = 0 assimptotica-
mente estvel.
EXEMPLO 7.2.11. Retome-se o exemplo 7.2.7,
y
t
=
_
cos 0 son0
son0 cos 0
_
y
t1
com ponto xo,
y =
_
0
0
_
.
Dena-se
\
__
r
1
r
2
__
= r
2
1
r
2
2
.
Facilmente se verica \ ( y) = 0 e \ (x) 0 para x ,= y. Tem-se
^\ (x) = \
__
r
1
cos 0 r
2
son0
r
1
son0 r
2
cos 0
__
\
__
r
1
r
2
__
= (r
1
cos 0 r
2
son0)
2
(r
1
son0 r
2
cos 0)
2
r
2
1
r
2
2
= 0.
Consequentemente o ponto xo estvel.
7.2.2.3. Bacia do Escoadouro. Na literatura usual designar-se um ponto xo
assimptoticamente estvel como um escoadouro (sink) e um ponto xo instvel
como fonte (source). A designao escoadouro sugere que o sistema dinmico ini-
cializado numa vizinhana do escoadouro converge para o escoadouro. Utiliza-se
tambm a designao bacia do escoadouro (basin of the skin) para denir o con-
junto de pontos \ tal que se y
0
\ ento y
t
= g
t
(y
0
) y (onde y um es-
coadouro). Analiticamente escreve-se: \ ( y) =
_
y
0
R
n
: g
t
(y
0
) y
_
6
. No
exemplo 7.2.5, onde q (r) = 2r(1 r) , vimos que o ponto 1/2 um escoadouro:
qualquer ponto na vizinhana de 1/2 converge para 1/2. Uma inspeco da gura
7.3 sugere que a bacia do escoadouro o conjunto (0, 1) , i.e., \ (1,2) = (0, 1) .
Aproposio seguinte temaplicao no caso de EDF autnomas (no lineares).
PROPOSIO 7.2.6. Seja 1 = r : [q (r) j[ _ c [r j[ , 0 < c < 1 . Se
existe um -
1
0 tal que \
.
1
( j) 1 ento
j
t
= q
t
(j
0
) j
para todo o j
0
\
.
1
( j) .
6
No caso no autnomo deve ler-se W ( ) = |
0
R
n
:
I
(
0
) .
-0.5 0.5 1 1.5 2 2.5
-0.5
0.5
1
1.5
2
2.5
II
I
III IV
V
VI
f(x)
A B
FIGURA 7.6. Bacia do Escoadouro
A proposio 7.2.6 no fornece toda a bacia do escoadouro. Na gura 7.6
a funo q (r) , com ponto xo j = 1, est denida na regio V para r < 1 e
na regio III para r 1. Apenas os pontos r pertencentes ao intervalo (, 1)
vericam [q (r) j[ < [r j[ . Concretamente,
1 = r : [q (r) j[ < c [r j[ , 0 < c < 1 = (, 1)
mas no existe um - 0 tal que \
.
( j) = \
.
(1) 1 e, portanto, a proposio
7.2.6 no aplicvel. Tambm a proposio 7.2.3 no aplicvel, pois [q
t
(1)[ = 1
(admitindo que q
t
(r) existe numa vizinhana de 1). Verica-se, no entanto, por
simples inspeco grca, que o sistema dinmico denido por q (r) converge para
j = 1 se o valor inicial pertencer a (, 1) . Alm disso, qualquer ponto do intervalo
(1, 1) tem como aplicao um ponto de (, 1) . Ou seja, embora no se verique
[q (r) j[ < [r j[ quando r (1, 1) , os ponto de (1, 1) movem-se para
(, 1) onde aqui se tem [q (r) j[ < [r j[ para r (, 1) . Assim, a bacia do
escoadouro (, 1) ' (1, 1) ' 1 = (, 1) .
A discusso precedente sugere uma forma de se determinar a bacia do escoad-
ouro. Suponha-se que 1
1
um conjunto de pontos y
0
tais que g
t
(y
0
) y e
y
0
1
1
(este conjunto pode determinar-se atravs da proposio 7.2.6). Num
segundo passo determina-se o conjunto 1
2
= x : g (x) 1
1
e, por recorrncia,
1
i1
= x : g (x) 1
i
. Se em dado momento 1
I1
= 1
I
ento a bacia do
escoadouro dado pela unio dos conjuntos 1
t
i
:.
EXEMPLO 7.2.12. Considere-se q (r) =
_
8r r
S
_
,2 (gura 7.7). Os pon-
tos xos so 1, 0, 1. Analise-se o ponto 1. fcil vericar que 1
1
= (0, /) =
_
0, 1,2
_
1
_
17
__
\ (1) (a proposio 7.2.6 aplicvel: numa vizinhana
1
a e c
b
d
II
III
IV
V
I
VI
FIGURA 7.7. Bacia do Escoadouro da Aplicao ) (r) =
_
8r r
S
_
,2
do ponto 1, a funo q (r) encontra-se nas regies II e V; no entanto, a proposio
fornece um primeiro conjunto contido em 1
1
). Tem-se agora
1
2
= r : q (r) 1
1
= r : 0 < q (r) < / = (c, c) ' (/, d) \ (1)
onde c = 2, 1160, c =
_
8, d =
_
8. Este procedimento pode ser continuado
com 1
S
= r : q (r) 1
2
, 1
1
, etc.
EXEMPLO 7.2.13. Considere-se q (r) = lanr, ,2 < r < ,2. O ponto
xo j = 0 (pois q (0) = 0). Na gura 7.8 verica-se que a funo q (r) no
se encontra nem na regio II nem na regio V (neste caso concreto, qualquer que
seja o valor inicial, o sistema dinmico afasta-se cada vez mais de j = 0). Assim,
j = 0 no escoadouro.
EXEMPLO 7.2.14. Considere-se q (r) = 8r(1 r) . Verica-se que os pontos
xo so 0 e 2,8. Na gura 7.9 analisa-se o ponto xo 2,8 (tendo-se representado
para o efeito as curvas r e r2 j = r4,8). A proposio 7.2.3 no esclarece
a natureza do ponto xo j = 2,8 pois [q
t
(2,8)[ = 1. Tambm a proposio 7.2.6
no aplicvel pois embora 1 = r : [q (r) 2,8[ < [r 2,8[ = (0, 2,8) no
existe um - 0 tal que \
.
(2,8) 1. Tambm no se pode concluir imediata-
mente que o intervalo (0, 2,8) pertence bacia do escoadouro (verique-se isso
atravs de inspeco grca). Este exemplo mostra as limitaes das proposies
7.2.3 e 7.2.6. Pode-se provar que o ponto 2,8 no de facto um escoadouro
7
(i.e.
um ponto xo assimptoticamente estvel) pelo que no h lugar determinao da
bacia do escoadouro. Na gura representa-se a trajectria j
t
com t = 1, ..., 0.
Um resultado que ultrapassa, em certas circunstncias, as limitaes apontadas
s proposies 7.2.3 e 7.2.6 e, alm disso, directamente aplicvel a sistemas de
equaes s diferenas consiste no seguinte.
7
Prova-se que no existe um - 0 tal que ) (28 -) 28 28 )
2
(28 -) .
-1 -0.5 0.5 1
-1.5
-1
-0.5
0.5
1
1.5
I
II
III
IV
V
VI
FIGURA 7.8. q (r) = lg r
0.2 0.4 0.6 0.8 1
-0.5
0.5
1
1.5
I
II
III
IV
V
VI
FIGURA 7.9. q (r) = 8r(1 r)
PROPOSIO 7.2.7. Admitam-se as condies da proposio 7.2.5 e suponha-
se ^\ (x) < 0 para todo o x \
.
( y) e x ,= y. Se y
0
\
.
( y) ento g
t
(y
0
)
y quando t .
Logo \
.
( y) _ \ ( y) .
FIGURA 7.10. Trajectria de j
t
= 8j
t1
(1 j
t1
), j
0
= 0.
(t = 1, ..., 0)
j
1t
= j
2t1
j
2t1
_
j
2
1t1
j
2
2t1
_
j
2t
= j
1t1
j
1t1
_
j
2
1t1
j
2
2t1
_
.
Estude-se a estabilidade do ponto xo j = (0, 0)
T
e determine-se a respectiva
bacia do escoadouro. Para o efeito tome-se a funo \ (r
1
, r
2
) = r
2
1
r
2
2
. Vem
^\ (r) =
_
r
2
r
2
_
r
2
1
r
2
2
__
2
_
r
1
r
1
_
r
2
1
r
2
2
__
2
_
r
2
1
r
2
2
_
= ...
=
_
r
2
1
r
2
2
_
2
_
2
_
r
2
1
r
2
2
__
< 0
no conjunto
_
(r
1
, r
2
) :
_
r
2
1
r
2
2
<
_
2
_
= \
_
2
( j) _ \ ( j) .
EXEMPLO 7.2.16. Retome-se o exemplo 7.2.10, j
t
= j
t1
j
S
t1
. Resulta
bvio que \
_
2
( j) _ \ ( j) .
EXEMPLO 7.2.17. Retome-se o exemplo 7.2.12, j
t
=
_
8j
t1
j
2
t1
_
,2. Analise-
se a bacia do escoadouro do ponto j = 1 e, para o efeito, considere-se \ (r) =
(r 1)
2
. Tem-se
^\ (r) =
__
8r r
2
_
,2 1
_
2
(r 1)
2
=
0
4
r
2
r
8
2
r
S
1
4
r
1
=
1
4
(r 4) (r 1)
2
r.
A funo ^\ (r) est representada na gura 7.11, a qual permite concluir que
\
1
(1) = r : [r 1[ < 1 _ \ (1) . No exemplo 7.2.12 foi-se um pouco mais
longe. De facto, observou-se que \
1
(1) \ (1).
-4
-3
-2
-1
0
1
2
-0.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0
FIGURA 7.11. Grco da funo ^\ (r) =
1
1
(r 4) (r 1)
2
r
A terminar esta seco mostra-se que se um ponto pertence a uma certa bacia
de escoadouro ento esse ponto no pode pertencer a outra bacia de escoadouro.
Assim,
PROPOSIO 7.2.8. Se y
1
e y
2
so escoadouros e y
1
,= y
2
ento \ ( y
1
)
\ ( y
2
) = O.
DEM. Mostra-se que \ ( y
1
) \ ( y
2
) ,= O = y
1
= y
2
. Seja y
0
\ ( y
1
)
\ ( y
2
) . Ento para cada - 0 existe um :
1
N tal que t _ :
1
implica
_
_
g
t
(y
0
) y
1
_
_
< -,2 e existe um:
2
Ntal que t _ :
2
implica
_
_
g
t
(y
0
) y
2
_
_
<
-,2. Logo as duas desigualdades vericam-se simultaneamente para o maior dos
:
t
:, i.e. denindo :
S
= max :
1
, :
2
tem-se que t _ :
S
implica
_
_
g
t
(y
0
) y
1
_
_
<
-,2 e
_
_
g
t
(y
0
) y
2
_
_
< -,2. Utilizando a desigualdade triangular para t _ :
S
vem
| y
1
y
2
| =
_
_
y
1
g
t
(y
0
)
_
y
2
g
t
(y
0
)
__
_
_
_
_
y
1
g
t
(y
0
)
_
_
_
_
y
2
g
t
(y
0
)
_
_
<
-
2

-
2
= -.
Como a distncia entre y
1
e y
2
menor do que - para cada - 0, dever ter-se
y
1
= y
2
.
7.2.3. Pontos Peridicos.
7.2.3.1. Denies.
DEFINIO 7.2.3. Um vector R
n
um ponto peridico de perodo / se
g
I
() = (7.4)
e / o menor inteiro positivo tal que (7.4) se verica (i.e., g
c
() ,= para
: = 1, 2, ..., / 1). A rbita de valor inicial diz-se uma rbita peridica de
perodo /.
Note-se que se um ponto peridico de perodo 2 ento um ponto xo
de g
2
. O recproco no verdade. Por exemplo, um ponto xo de g
2
pode ser
tambm um ponto xo de g e, neste caso, de acordo com a denio, este ponto
tem perodo 1.
Considere-se uma rbita de valor inicial , i.e.,
_
, g () , g
2
() , ...
_
. Se
um ponto peridico de perodo 3, repete-se de trs em trs iteraes. Por exem-
plo,
_
, g () , g
2
() , , ...
_
. Mas g () e g
2
() tambm se repetem de trs em
trs iteraes,
_
.., , g () , q
2
() , , g () , g
2
() , ...
_
. Neste exemplo, su-
ciente identicar a rbita de perodo 8 atravs dos trs elementos
_
, g () , g
2
()
_
(se ponto xo de g e, portanto, ponto peridico de perodo 1, ento a rbita
peridica de perodo 1 constituda apenas pelo elemento ). Naturalmente,
L = g () e c = g
2
() so tambm pontos peridicos de perodo 3. A proposio
seguinte estabelece este resultado.
PROPOSIO 7.2.9. Seja um ponto peridico de g de perodo /. Ento
g () , g
2
() , ..., g
I1
()
so tambm pontos peridicos de perodo /.
DEM. Considere-se umponto genrico do conjunto
_
g () , g
2
() , ..., g
I1
()
_
,
i
= g
i
() , comi = 1, 2, ..., / 1. Mostra-se em primeiro lugar que
i
no um
ponto xo de g
c
com : < /, caso contrrio
i
no poderia ser candidato a ponto
peridico de perodo / (denio 7.2.3). Suponha-se no entanto que
i
ponto
xo de g
c
. Viria
g
c
(
i
) =
i
=g
c
_
g
i
()
_
= g
i
() =g
ci
() = g
i
()
o que signica que repete de : em : iteraes, ou seja que ponto xo de g
c
.
Esta concluso contradiz a hiptese de ser ponto peridico de perodo / : (i.e.,
a primeira vez que se repete aps / iteraes). Basta agora ver que
i
= g
i
()
ponto xo de g
I
. Vem
g
I
(
i
) = g
I
_
g
i
()
_
= g
i
_
g
I
()
_
= g
i
() =
i
.
EXEMPLO 7.2.18. Considere-se a equao j

t
= aj
t1
(1 j
t1
) . Tem-se
portanto q (r) = ar(1 r) . Investigue-se se existempontos peridicos de perodo
2. Determine-se q
2
(r)
q
2
(r) = q (q (r)) = a (q (r)) (1 q (r)) = a (ar(1 r)) (1 ar(1 r)) .
Poderamos tambm obter q
2
(r) considerando
j
t
= aj
t1
(1 j
t1
)
= a (aj
t2
(1 j
t2
)) (1 (aj
t2
(1 j
t2
)))
o que permitiria deduzir q
2
(r) = a (ar(1 r)) (1 ar(1 r)) . Para determi-
nar eventuais pontos peridicos resolve-se a equao q
2
(r) = r em ordem a r.
Factorizando q
2
(r) r obtm-se
r (1 a a r)
_
1 a a r a
2
r a
2
r
2
_
= 0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1 8 15 22 29 36 43
t
y
FIGURA 7.12. Trajectria de j
t
= 8.8j
t1
(1 j
t1
) , j
0
= 0.1
pelo que se conclui que os pontos xos de q
2
so
r
1
= 0, r
2
=
1 a
a
, r
S
=
1
2

1
2
a
1
2
_
(8 2a a
2
)
a
, (7.5)
r
1
=
1
2

1
2
a
1
2
_
(8 2a a
2
)
a
. (7.6)
Estes valores sero pontos peridicos de perodo 2 se no forem pontos xos de q.
Ora resolvendo
q (r) = r
sai j = 0 e j =
1o
o
. Retome-se os pontos xos apresentados em (7.5) e (7.6).
Conclui-se que os pontos 0 e (1 a) ,a no so pontos peridicos de perodo 2
pois eles so pontos xos de q (e, portanto so pontos peridicos de perodo 1).
Relativamente a r
S
conclui-se que
1
2

1
2
a
1
2
_
(8 2a a
2
)
a
=
1 a
a
se a = 1, e
1
2

1
2
a
1
2
_
(8 2a a
2
)
a
= 0
se a = 1. Logo r
S
ponto peridico de perodo 2 se a ,= 1 e a ,= 1. Seguindo o
mesmo raciocnio conclui-se que r
1
ponto peridico de perodo 2 se a ,= 8 e a ,=
1. Para concretizar suponha-se que a = 8.8. Tem-se j = 0, j =
1o
o
= .60607,
r
S
= .8286 e r
1
= .47048. Na gura 7.12 evidente que 0. 828 6, 0.47048
forma uma rbita de perodo 2.
Outra forma (embora pouco eciente) de conrmarmos as concluses emer-
gentes da gura 7.12 consiste em se calcular iterativamente a trajectria j. A
gura 7.13 fornece os valores de j
t
ao longo do tempo, com j
0
= 0.1. bvio, a
partir de certo valor de t (digamos, a partir de t = 20), que j
t
repete os valores
.8236 e .4794 de duas em duas iteraes.
tambm interessante conrmarmos que .8286 e .47048 so pontos peridico
de perodo 2 a partir do grco teia de aranha, gura 7.14.
t: 0 1 2 3 4 5 6 7 8 9 10 11 12 13
yt: 0.1000 0.2970 0.6890 0.7071 0.6835 0.7139 0.6740 0.7251 0.6577 0.7429 0.6303 0.7690 0.5863 0.8004
t: 14 15 16 17 18 19 20 21 22 23 24 25 26 27
yt: 0.5271 0.8226 0.4816 0.8239 0.4788 0.8235 0.4796 0.8236 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236
t: 28 29 30 31 32 33 34 35 36 37 38 39 40 41
yt: 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236
FIGURA 7.13. Sucesso j
t
= 8.8j
t1
(1 j
t1
) , j
0
= 0.1, t = 1, ..., 41
-0.5 -0.25 0.25 0.5 0.75 1
-0.4
-0.2
0.2
0.4
0.6
0.8
t
= 8.8j
t1
(1 j
t1
)
EXEMPLO 7.2.19. Retome-se o exemplo 7.2.2. Tem-se
g
2
(x) = g
_
g
__
r
1
r
2
___
= g
__
r
2
a
2
a
1
__
=
_
a
2
a
1
i
2
i
1
a
2
_
=
_
a
2
a
1
1
a
1
_
e
g
S
(r) = g
_
g
_
g
__
r
1
r
2
____
= g
__
a
2
a
1
1
a
1
__
=
_
_
1
a
1
1
i
1
i
2
i
1
_
_
=
_
1
a
1
1
a
2
_
.
Deixa-se como exrcito vericar que no existem ponto peridicos de perodo
2 e existem trs pontos peridicos de perodo 3.
Um modelo que pode gerar pontos peridico o modelo linear por troos
(ponto 7.4).
7.2.3.2. Estabilidade dos Pontos Peridicos. Tal como no caso dos pontos
xos de g, pontos peridicos podem ser estveis ou instveis. Intuitivamente, um
ponto peridico de perodo / estvel se qualquer trajectria iniciada numa vizin-
hana desse ponto no se afasta desse ponto de / em / iteraes, para todo o t (da
mesma forma se interpreta ponto peridico assimptoticamente estvel e instvel).
O facto essencial que um ponto peridico de g de perodo / um ponto xo de
g
I
. Desta forma, a denio de estabilidade para pontos peridicos pode basear-
se na denio 7.2.2, sendo que agora dever ler-se g
I
em lugar de g (g
t
dever
ler-se g
It
). Em geral so aplicveis as proposies precedentes, desde que se pro-
cedam s necessrias adaptaes. Por exemplo, a proposio 7.2.3 estabelece que
j assimptoticamente estvel se [q
t
( j)[ < 1 e instvel no caso contrrio. Se as
condies da proposio 7.2.3 se aplicarem, e fazendo /(r) = q
I
(r) , podemos
estabelecer que o ponto peridico j de perodo / assimptoticamente estvel se
[/
t
(j)[ < 1 e instvel no caso contrrio.
Vimos na proposio 7.2.9 que, se ponto peridico de perodo / ento
a aplicao g admite adicionalmente / 1 pontos peridicos. Se exibe uma
certa caracterstica qualitativa que concluses podemos tirar para os demais pontos
peridicos? A proposio e a demonstrao seguintes mostra que todos os pontos
peridicos partilham das mesmas propriedades qualitativas. Desta forma pode-se
falar de rbitas peridicas estveis e instveis (em alternativa a pontos peridicos
estveis e instveis).
PROPOSIO 7.2.10. Seja q uma aplicao de classe (
1
emRe seja j
1
, j
2
, ..., j
I
uma rbita peridica de perodo /. Ento j

1
, ..., j
I
assimptoticamente estvel
(escoadouro) se
q
t
(j
I
) ...q
t
(j
1
)
< 1
e instvel (fonte) se
q
t
(j
I
) ...q
t
(j
1
)
1.
Pode-se provar que se j
i
um ponto peridico assimptoticamente estvel (in-
stvel) da rbita j
1
, ...j
I
ento j
)
tambm um ponto peridico assimptotica-
mente estvel (instvel).
EXEMPLO 7.2.20. Considere-se a EDF j
t
= 8.r(1 r) . Utilizando-se um
programa de Matemtica obtiveram-se os seguintes resultados:
/ Pontos Fixos de q
I
(os pontos peridicos esto em negrito)
1 0, 0.71428
2 0, 0.71428, 0.42857, 0.85714
3 0, 0.71428
4 0, 0.71428, 0.4287, 0.8714, 0.3828, 0.50088, 0.82694, 0.87499
Analisa-se agora a estabilidade dos pontos peridicos na tabela seguinte.
/ Anlise da Estabil. dos Pontos Perid. (proposio 7.2.10)
1 [q
t
(0)[ = 8., [q
t
(0, 0.71428)[ = 1.
2

q
t
(0.4287) q
t
(0.8714)
t
= 1.2
3
4 [q
t
(0.8828) q
t
(0.0088) q
t
(0.82604) q
t
(0.87400)[ = 0.08
0.2 0.4 0.6 0.8 1
x
0.2
0.4
0.6
0.8
1
f
t
= 8.j
t1
(1 j
t1
)
Os resultados apresentados na tabela anterior podem tambm ser obtidos da
seguinte forma
_
q
2
(0.4287)
_
t
_
q
2
(0.8714)
_
t
= 1.2
_
q
1
(0.8828)
_
t
_
q
1
(0.0088)
_
t
_
q
1
(0.82604)
_
t
_
q
1
(0.87400)
_
t
= 0.08.
Naturalmente esta segunda alternativa bastante mais trabalhosa. Conclui-se que
todos os pontos peridicos de perodo / = 4 so assimptoticamente estveis; todos
os outros pontos em anlise so instveis. O grco 7.15 permite identicar um
comportamento peridico de perodo / = 4.
Tem interesse ainda observar o grco teia de aranha do modelo q
1
(r) - ver
gura 7.16. Observe-se (talvez com alguma diculdade) que a funo q
1
corta o
eixo de 45
c
oito vezes (considerando tambm o ponto zero). Este facto corrobora
a primeira tabela deste exemplo (ltima linha).
7.3. Processos No Lineares e Estacionaridade Estrita
Nesta seco, retomam-se alguns conceitos j abordados, relacionados com
a estacionaridade, e exploram-se novas denies que sero teis no estudo dos
processos no lineares. Concretamente, objectivo deste ponto estabelecer condies
sucientes para que umprocesso de Markov no linear seja ergdico e EE (recorde-
se a denio 4.4.6).
7.3.1. Processos Ergdicos e Estritamente Estacionrios. O ponto de par-
tida baseia-se na denio de processo de Markov: se j um processo de Markov
7.3. PROCESSOS NO LINEARES E ESTACIONARIDADE ESTRITA 169
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
x
y
FIGURA 7.16. Grco Teia de Aranha do Modelo q
1
(r)
ento, para estabelecer, no momento :, probabilidades sobre a evoluo futura do
processo, toda a informao anterior a : desnecessria se o estado do processo
no momento : for conhecido
8
. Formalmente,
DEFINIO 7.3.1. j um processo de Markov se
1 (j
t
< [ T
t1
) = 1 (j
t
< [ j
t1
)
onde T
t1
= j
1
, ..., j
t1
.
(Ocaso multivariado y adapta-se facilmente). Oprocesso AR(2), j
t
= c
1
j
t1
c
2
j
t2
n
t
, no de Markov pois
1 (j
t
< [ j
1
, ..., j
t1
) = 1 (j
t
< [ j
t2
, j
t1
) ,= 1 (j
t
< [ j
t1
) .
No entanto, possvel represent-lo na forma Markoviana. Considerem-se as mu-
danas de varivel
j
1,t
= j
t
, j
2,t
= j
t1
.
Assim,
j
1,t
= c
1
j
1,t1
c
2
j
2,t1
n
t
j
2,t
= j
1,t1
8
Considere-se, por exemplo, uma partcula suspensa num meio homogneo. Se no momento
c, a posio e a velocidade da partcula forem conhecidas, torna-se desnecessrio considerar toda
a trajectria anterior da partcula com vista a estabelecer a sua evoluo provvel a partir do mo-
mento c. Observe-se que no basta conhecer s a posio ou s a velocidade. Por vezes sucede que
determinado processo no de Markov, mas esse processo juntamente com outro pode denir um
processo de Markov. O exemplo que se apresenta a seguir (AR(2)) tambm mostra que possvel
obter a propriedade Markoviana atravs da expanso do espao de estados.
ou ainda
_
j
1,t
j
2,t
_
. .
y
I
=
_
c
1
c
2
1 0
_
. .
_
j
1,t1
j
2,t1
_
. .
y
I1
_
n
t
0
_
. .
u
I
,
y
t
= y
t1
u
t
.
O processo vectorial y
t
agora de Markov. Este procedimento generaliza-se
facilmente para o caso AR(p).
Tambm o processo no linear do tipo
j
t
= q (j
t1
, j
t2
, ..., j
tj
) n
t
onde n
t
uma sucesso de v.a. i.i.d. e independentes de j
tI
, / _ 1, admite
uma representao Markoviana. Com efeito, dena-se
y
t
= (j
t
, j
t1
, ..., j
tj1
)
t
, u
t
= (n
t
, 0, ..., 0)
t
e
x =(r
1
, r
2
, ..., r
j
)
t
, g (x) = (q (x) , r
1
, ..., r
j1
)
t
.
Segue-se que y um processo de Markov denido por
y
t
= g (y
t1
) u
t
.
Por exemplo, seja
j
t
= ccos (j
t1
) , son(j
t2
) n
t
.
Tem-se
y
t
=
_
j
t
j
t1
_
:=
_
j
1,t
j
2,t
_
e
_
j
1,t
j
2,t
_
. .
y
I
=
_
ccos (j
1,t1
) , son(j
2,t1
)
j
1,t1
_
. .
g(y
I1
)
_
n
t
0
_
. .
u
I
.
Para simplicar, na discusso que se segue trabalha-se com processos estocs-
ticos univariados Markovianos; contudo, est subjacente que se o processo j no
de Markov ser sempre possvel represent-lo na forma multivariada como um
processo de Markov.
A funo de distribuio condicional a : passos de um processo de Markov
1 (j
aI
< j[ j
I
)
(observe-se que desnecessrio escrever 1 (j
aI
< j[ T
I
) , pois j um processo
de Markov). Por seu lado, a funo densidade condicional (tambm designada por
densidade de transio), caso exista, dada por
)
a
(j[ r) =
01 (j
aI
< j[ j
I
)
0j
.
DEFINIO 7.3.2. j um processo homogneo se
1 (j
aI
< [ j
I
= r) = 1 (j
ac
< [ j
c
= r) , (: N)
para todo o / e : Z.
Se j um processo homogneo, para avaliar probabilidades condicionadas do
processo, no interessa o momento em que essas probabilidades so calculadas.
Por exemplo, no caso 1 (j
aI
< [ j
I
= r) as probabilidades so calculadas no
momento no / (ou com base na informao do momento /) e dizem respeito ao
intervalo de valores que j pode assumir no momento : /. Se j homogneo, o
momento ou instante / irrelevante; apenas interessa conhecer o hiato de tempo
: / / = : (para processos estacionrios de segunda ordem, exige-se a mesma
propriedade para a covarincia: Cov (j
aI
, j
I
) = (:) apenas dever depender
de : = : / /). Nestas circunstncias, tem-se por exemplo,
1 (j
10
< [ j
0
= r) = 1 (j
100
< [ j
90
= r) = 1 (j
120
< [ j
1210
= r) .
Se o processo j homogneo, toma-se para a funo de distribuio condicional a
: passos a expresso
9
1
a
(j[ r) := 1 (j
aI
< j[ j
I
= r) .
O exemplo 7.3.2 ilustra o conceito de homogeneidade. Convm, no entanto,
comear com o
j
t
= cj
t1
n
t
, [c[ < 1
onde n
t
um rudo branco
_
0, o
2
_
. Vamos obter )
t
(j[ r) (funo de densidade
condicional a t passos) e 1
t
(j[ r) (funo de distribuio condicional a t passos).
Comece-se por obter )
1
(j[ r) (esta funo habitualmente escrita simplesmente
na forma ) (j[ r)) e 1
1
(j[ r). Tem-se,
L
(j
t
[ j
t1
) =
L
(cj
t1
n
t
[ j
t1
) = cj
t1
Vai (j
t
[ j
t1
) =
L
_
(j
t
cj
t1
)
2
j
t1
_
=
L
_
n
2
t
j
t1
_
= o
2
Como j
t
[ j
t1
~
_
cj
t1
, o
2
_
resulta
)
1
(j[ j
t1
) =
1
_
2o
2
oxp
_
1
2o
2
(j cj
t1
)
2
_
,
1
1
(j[ j
t1
) =
_
j
o
)
1
(n[ j
t1
) dn.
Para obter
L
(j
t
[ j
0
) , Vai (j
t
[ j
0
) e )
t
(j[ j
0
) necessrio representar j
t
como
funo de j
0
. Tem-se
j
t
= cj
t1
n
t
= c(cj
t2
n
t1
) n
t
= c
2
j
t2
cn
t1
n
t
= ...
= c
t
j
0
c
t1
n
1
c
t2
n
2
... cn
t1
n
t
.
Tendo em conta as propriedades de n, conclui-se que j
t
, dada a condio j
0
, tem
distribuio condicional normal de parmetros
L
(j
t
[ j
0
) = c
t
j
0
9
A notao usada para 1
n
( [ r) , sublinha que se tem uma funo de transio a n passo (da o
ndice n), que a condio inicial apenas depende de r, e que o processo homogneo (caso contrrio
1
n
( [ r) deveria depender tambm do momento em que calculada).
e
Vai (j
t
[ j
0
) =
L
_
_
j
t
c
t
j
0
_
2
j
0
_
=
L
_
_
c
t1
n
1
c
t2
n
2
... cn
t1
n
t
_
2
j
0
_
= o
2
_
1 c
2
... c
2(t1)
_
(soma geomtrica)
= o
2
_
1 c
2t
1 c
2
_
.
Isto ,
j
t
[ j
0
~
_
c
t
j
0
, o
2
_
1 c
2t
1 c
2
__
,
)
t
(j[ j
0
) =
1
_
2 Vai (j
t
[ j
0
)
oxp
_
1
2 Vai (j
t
[ j
0
)
(j
L
(j
t
[ j
0
))
2
_
,
1
t
(j[ j
0
) =
_
j
o
)
t
(n[ j
0
) dn.
Para processos no lineares, conhece-se geralmente )
1
(j[ j
0
) (uma vez es-
pecicada a distribuio dos erros), mas no )
t
(j[ j
0
), para t 1.
EXEMPLO 7.3.2. Retome-se o exemplo 7.3.1. Facilmente se constata que
j
aI
[ j
I
= r ~
_
c
a
r, o
2
_
1 c
2a
1 c
2
__
j
ac
[ j
c
= r ~
_
c
a
r, o
2
_
1 c
2a
1 c
2
__
e, assim, o processo j homogneo.
Um processo em que pelo menos um dos momentos condicionais depende do
momento em que calculado (por exemplo,
L
(j
t
[ j
t1
) = j
t1
,t) no pode ser
certamente umprocesso homogneo. Ahomogeneidade uma condio necessria,
mas no suciente para garantir estacionaridade (estrita ou de segunda ordem). O
exemplo seguinte esclarece este ponto.
EXEMPLO 7.3.3. Seja j
t
= j
t1
n
t
, onde n
t
um rudo branco
_
0, o
2
_
.
Tem-se,
j
aI
= j
I

aI
i=I1
n
i
j
I
= r ~
_
r, o
2
:
_
j
tc
= j
c

ac
i=c1
n
i
j
c
= r ~
_
r, o
2
:
_
.
Logo o processo passeio aleatrio homogneo. No entanto, sabe-se que no
estacionrio.
Para processos de Markov homogneos, a equao de Chapman-Kolmogorov
(numa das suas vrias verses)
1
a
(j[ r) =
_
1
1
(j[ n) 1
a1
(dn[ r) .
Caso exista a fdp condicionada, a equao de Chapman-Kolmogorov pode tambm
ser escrita na forma
)
a
(j[ r) =
_
)
1
(j[ n) )
a1
(n[ r) dn. (7.7)
A denio de ergodicidade ( Harris)
10
que se apresenta a seguir envolve um
conceito de proximidade entre duas funes de distribuio, H e G, baseada na
norma de variao total |.| que, caso existam as funes densidades associadas a
H e G, dada por
|H G| =
_
[/(r) q (r)[ dr.
EXEMPLO 7.3.4. Seja q a fdp associada distribuio (0, 1) e /
a
a fdp
associada distribuio t (:) (t-Student, com : graus de liberdade). Para : xo,
a variao total |H
a
G| positiva, mas |H
a
G| 0 quando : . A
demonstrao a seguinte. Em primeiro lugar, faa-se
a
(r) = [/
a
(r) q (r)[ .
Como /
a
(r) converge uniformemente emRpara q (r), i.e., lim
ao
sup
aR
a
(r) =
0 (este resultado bem conhecido da estatstica e, normalmente, apresentado
numa forma mais fraca, lim
ao
/
a
(r) = q (r) , para cada r R), ento
a
(r)
converge uniformemente em R para zero, pelo que, o operador de limite pode tro-
car com o operador de integrao. Assim,
lim
ao
|H G
a
| = lim
ao
_
[/
a
(r) q (r)[ dr
_ lim
ao
_
sup
a
[/
a
(r) q (r)[ dr
=
_
lim
ao
sup
a
[/
a
(r) q (r)[ dr
= 0.
Considere-se o processo estocstico j com funo de distribuio condicional
a : passos dada por 1
a
(j[ r).
DEFINIO 7.3.3. Se existir uma funo de distribuio 1 e uma constante
j (0, 1) tal que
j
a
|1
a
(j[ r) 1 (j)| 0 (7.8)
para todo o j e o r, ento j ergdico se j = 1 e geometricamente ergdico se
j < 1. 1 a funo de distribuio estacionria.
10
A denio de ergodicidade varia bastante na literatura. Usaremos a denio que se designa
por ergodicidade Harris. Veja-se, por exemplo, Fan e Yao (2005).
Se a densidade )
a
(j[ r) existe, a denio acima pode ser apresentada da
seguinte forma: se existir uma funo de densidade ) e uma constante j (0, 1)
tal que
j
a
_
[)
a
(j[ r) ) (j)[ dj 0 (7.9)
para todo o r, ento j ergdico se j = 1 e geometricamente ergdico se j < 1.
) a funo de densidade estacionria.
A denio adoptada de ergodicidade Harris, permite efectivamente rela-
cionar a ergodicidade com estacionaridade estrita (Chan 1990, 1993), tal como
consta da
PROPOSIO 7.3.1. Suponha-se que j ergdico. Ento existe uma dis-
tribuio estacionria 1 tal que o processo j, inicializado com a distribuio 1,
EE.
DEM. Para simplicar, suponha-se que existe a densidade )
a
(j[ r) =
0
0j
1
a
(j[ r) .
Considere-se : em ambos os lados da equao (7.7). Como )
a
(j[ r)) (j)
converge para zero na norma ||, a equao (7.7) com :
) (j) =
_
)
1
(j[ n) ) (n) dn. (7.10)
Por hiptese, j
0
(valor inicial) tem densidade estacionria )
j
0
= ). Resulta de
(7.10) que j
1
tambm tem densidade estacionria ), pois
)
j
1
(j) =
_
)
1
(j[ n) )
j
0
(n) dn =
_
)
1
(j[ n) ) (n) dn = ) (j) .
Por induo, conclui-se que )
j
I
(j) = ) (j) qualquer que seja t. Por outro lado,
devido homogeneidade e propriedade de Markov, a densidade conjunta de
(j
a
, j
a1
, ..., j
1
, j
0
)
)
j
n
,j
n1
,...,j
1
,j
0
(r
a
, r
a1
, ..., r
1
, r
0
) = )
1
(r
t
[ r
t1
) )
1
(r
t1
[ r
t2
) ...)
j
0
(r
0
)
igual densidade conjunta de (j
aI
, j
aI1
, ..., j
I1
, j
I
)
)
j
n+I
,j
n+I1
,...,j
I+1
,j
I
(r
a
, r
a1
, ..., r
1
, r
0
) = )
1
(r
t
[ r
t1
) )
1
(r
t1
[ r
t2
) ...)
j
I
(r
0
) ,
pois )
1
(j[ r) no depende do momento em que calculada (apenas depende dos
argumentos j e r) e )
j
0
(r
0
) = )
j
I
(r
0
) = ) (r
0
).
Para processos nas condies da proposio anterior, a lei forte dos grandes
nmeros verica-se sempre:
PROPOSIO 7.3.2. Suponha-se
L
([/(j)[) < . Nas condies da proposio
7.3.1 verica-se
1
:
a
t=1
/(j
t
)
qc
L
(/(j)) ,
(qc: convergncia quase certa ou com probabilidade 1) qualquer que seja o valor
inicial do processo j.
Por exemplo, se j ergdico e EE e se
L
(c
j
I
) < , ento
1
:
a
t=1
c
j
I
qc
L
(c
j
)
(naturalmente tambm se tem convergncia em probabilidade). Note-se que o
processo pode no ser fracamente dependente no sentido da denio 4.4.7 - i.e.,
vericando-se a lei dos grandes nmeros de acordo coma proposio anterior, pode
no se garantir, ainda assim, a aplicao do teorema do limite central.
Outra propriedade interessante para processos estritamente estacionrios a
seguinte:
PROPOSIO 7.3.3. Seja q uma funo com domnio no espao de estados de
j. Se j
t
EE ento .
t
, denido por .
t
= q (j
t
, j
t1
, ...) , tambm EE.
A proposio anterior permite concluir, por exemplo, que se j
t
EE, en-
to os processos
_
j
2
t
_
, j
t
c
j
I1
, etc., so tambm estritamente estacionrios.
A proposio anterior no se aplica naturalmente a processos estacionrios de se-
gunda ordem. Para ilustrar, suponha-se que j umprocesso ESOsem4
c
momento.
Resulta que .
t
, onde . denido por .
t
= j
2
t
, no um processo ESO, pois
Vai (.
t
) no existe.
Em geral, difcil vericar directamente as equaes (7.8) e (7.9), a no ser
para casos relativamente simples, como o do exemplo que se apresenta a seguir.
Iremos ver, no entanto, que possvel, em certas circunstncias, provar-se (7.8) ou
(7.9) de forma indirecta, atravs de resultados auxiliares. Antes de entramos nesta
questo no ponto seguinte, veja-se um caso em que a aplicao directa de (7.9)
relativamente simples.
EXEMPLO 7.3.5. Retome-se o exemplo 7.3.1, mas use-se agora a densidade
condicional a : passos (poderia ser tambm a t passos). Conclumos que
j
a
[ j
0
= r ~
_
c
a
r, o
2
_
1 c
2a
1 c
2
__
)
a
(j[ r) =
1
_
2 Vai (j
a
[ r)
oxp
_
(j
a
L
(j
a
[ r))
2
2 Vai (j
a
[ r)
_
.
Note-se que
lim
ao
L
(j
a
[ r) = lim
ao
c
a
r = 0,
lim
ao
Vai (j
a
[ r) = lim
ao
o
2
_
1 c
2a
1 c
2
_
=
o
2
1 c
2
,
lim
ao
)
a
(j[ r) =
1
_
2
_
o
2
1
2
_
oxp
_
_
_
j
2
2
_
o
2
1
2
_
_
_
_
= ) (j) .
razovel admitir que ) (j) verica o limite j
a
_
[)
a
(j[ r) ) (j)[ dj 0.
Efectivamente, pode mostrar-se esse resultado e, nessas condies, j umprocesso
0
0.1
0.2
0.3
0.4
0.5
0.6
-5.0 -4.0 -3.0 -2.0 -1.0 0.0 1.0 2.0 3.0 4.0 5.0
Dist. Est n = 1 n = 2 n = 3 n = 8
FIGURA 7.17. Sucesso de funes
)
a
(j[ r = 2) , : = 1, 2, 8, 8 e distribuio estacionria
) (j)
EE, comdistribuio estacionria dada por ) (j) e momentos estacionrios
L
(j) =
0 e Vai (j) = o
2
,
_
1 c
2
_
.
Para exemplicar, considere-se r = 2, o
2
= 0.7 e c = 0.8. A distribuio
estacionria dada por
j ~
_
0,
0.7
1 0.8
2
_
= (0, 1.044) .
Se o processo for inicializado no valor r = 2, ao m de alguns perodos (dig-
amos : = 10), j
t
comporta-se como um processo j ~ (0, 1.044) . Por outras
palavras, um elemento retirado ao acaso da sucesso j
10
, j
11
, ... , por exemplo
j
100
, tem distribuio estacionria (0, 1.044) . Naturalmente, se o valor ante-
rior j
99
for observado e usarmos essa informao para prever j
100
, a distribuio
pertinente passa a ser a distribuio condicional habitual (a um passo). Na gura
7.17 mostra-se a convergncia da sucesso de funes )
a
(j[ r = 2) , : = 1, 2, 8, 8
para a distribuio estacionria ) (j) . A distribuio estacionria, que coincide
com a distribuio marginal do processo, relevante porque mostra o comporta-
mento geral do processo. D ainda uma medida do tempo de permanncia do
processo em cada um dos subintervalos do espao de estados. Para os valores
denidos para o e c, camos a saber a partir da inspeco da distribuio esta-
cionria que, por exemplo, j dicilmente sair do intervalo (, ) e que, durante
a maior parte do tempo, estar no intervalo (digamos) (2, 2) .
Termina-se esta seco notando que a densidade estacionria (caso exista) co-
incide com a densidade marginal quando o processo inicializado em condies
estacionrias.
7.3.2. Modelos No Lineares do tipo j
t
= q (j
t1
, j
t2
, ..., j
tj
) n
t
.
PROPOSIO 7.3.4. Considere-se o processo j denido por
j
t
= q (j
t1
, ..., j
tj
) n
t
onde q : R
j
R, n
t
uma sucesso de v.a. i.i.d. e independentes de j
tI
,
/ _ 1, com funo de densidade positiva e
L
(n
t
) = 0. O processo j geomet-
ricamente ergdico se qualquer uma das seguintes condies se vericar:
(a) q uma funo limitada em conjuntos limitados,
lim
|x|o
[q (x) (/
1
r
1
... /
j
r
j
)[
|x|
= 0
e as razes do polinmio 1 /
1
. ... /
j
.
j
esto fora do circulo unitrio.
(b) Existe uma constante ` (0, 1) e c tal que
[q (x)[ _ `max [r
1
[ , ..., [r
j
[ c.
(c) Existe uma constante j (0, 1) , c e a
i
_ 0 e a
1
... a
j
= 1 tal que
[q (x)[ _ j (a
1
[r
1
[ ... a
j
[r
j
[) c.
EXEMPLO 7.3.6. Considere-se o processo AR(2),
j
t
= c
1
j
t1
c
2
j
t2
n
t
onde n um rudo branco Gaussiano. A funo q naturalmente
q (r
1
, r
2
) = c
1
r
1
c
2
r
2
.
A condio (a) da proposio 7.3.4 verica-se se, com /
1
= c
1
e /
2
= c
2
, as
razes de 1 /
1
. /
2
.
2
estiverem fora do circulo unitrio. Esta , como se
sabe, a condio necessria e suciente para que o processo AR(2) seja ESO.
A proposio anterior vai mais longe: sob as condies estabelecidas, j EE.
EXEMPLO 7.3.7. Considere-se o processo
j
t
= c
j
2
t1
1 j
2
t1
n
t
onde n um rudo branco Gaussiano. Tem-se
q (r) =
cr
2
1 r
2
Como q (r) uma funo limitada em R, mais concretamente, [q (r)[ _ c <

c <
, conclui-se
[q (r)[ _ j [r[

c
para j (0, 1) . Vericam-se as condies (b) e (c) e, assim, j um processo
ergdico.
j
t
=
_
0.j
t1
n
t
se j
t1
< 0
0.j
t1
n
t
se j
t1
_ 0.
onde n um rudo branco Gaussiano. Este modelo pode ser reescrito na forma:
j
t
= c
t
j
t1
-
t
,
onde c
t
=
_
0.J
j
I1
<0
0.J
j
I1
0
_
. Tem-se
q (r) =
_
0.J
a<0
0.J
a0
_
r.
Vem
[q (r)[ _

0.J
a<0
0.J
a0
[r[
_ j [r[
com j = 0. (0, 1) . Assim, j um processo ergdico. Neste caso muito par-
ticular, j pode tambm escreve-se na forma j
t
= 0. [j
t1
[ -
t
e a aplicao da
proposio 7.3.4 imediata.
j
t
=
_
1 0.j
t1
n
t
j
t1
< 0
1 0.j
t1
n
t
j
t1
_ 0.
onde n um rudo branco Gaussiano. A funo q
q (r) = J
a<0
0.rJ
a<0
J
a0
0.rJ
a0
= J
a<0
J
a0

_
0.J
a<0
0.J
a0
_
r.
Assim,
[q (r)[ _ 1
0.J
a<0
0.J
a0
[r[
_ 1 0. [r[
e a proposio 7.3.4 aplica-se imediatamente com c = 1 e j = 0. (ou ` = 0.),
pelo que j um processo ergdico.
OBSERVAO 7.3.1. interessante observar que a condio que assegura
a estacionaridade estrita no mbito dos processos estocsticos (considere-se por
exemplo a proposio 7.3.4 condio (c)), assegura tambm a estabilidade assimp-
ttica no mbito das equaes s diferenas nitas determinsticas (veja-se o ponto
7.2), embora o contrrio no seja verdadeiro. Com efeito, seja [q (r)[ < j [r[
(proposio 7.3.4 condio (c)). Resulta,
[q (j
0
)[ _ j [j
0
[
q
(2)
(j
0
)
= [q (q (j
0
))[ _ j [q (j
0
)[ _ j
2
[j
0
[
...
q
(t)
(j
0
)
_ j
t
[j
0
[
e, portanto, j
t
= q
(t)
(j
0
) 0 quando t , independentemente do valor
inicial. Tem-se neste caso que o valor 0 um ponto assimptoticamente estvel
11
.
11
Na verdade, a denio menos exigente: o valor zero um ponto xo assimptoticamente
estvel se for estvel e existir um c
0
0 tal que a desigualdade [
0
[ c
0
implica
j
(I)
(
0
)
0
quando t o. Neste caso no necessrio que a condio inicial seja um valor qualquer: basta
que
0
se encontra perto do ponto xo zero.
7.3.3. Modelos No Lineares do tipo y
t
= A
t
y
t1
H
t
. Suponha-se que se
analisa o modelo AR com coeciente aleatrio,
j
t
= c(
t
) j
t1
n
t
(7.11)
onde
t
uma varivel aleatria. Os principais resultados apresentados na seco
anterior no se aplicam, pois a equao (7.11) no pode ser representada na forma
j
t
= q (j
t1
, j
t2
, ..., j
tj
) n
t
. A teoria assimpttica est especialmente desen-
volvida para a seguinte classe de modelos AR com coecientes aleatrios:
DEFINIO 7.3.4. Uma equao vectorial autoregressiva de dimenso d com
coecientes aleatrios uma equao da forma
y
t
= A
t
y
t1
H
t
(7.12)
onde (A
t
, H
t
) , t Z uma sucesso de matrizes i.i.d.
Na denio anterior (A
t
, H
t
) , t Z pode ser simplesmente um processo
estacionrio (condio menos exigente). Inmeros processos no lineares podem
ser representados na forma (7.12), como mostra o exemplo seguinte.
EXEMPLO 7.3.10. Considere-se o processo n
t
com heterocedasticidade condi-
cionada de ordem (2, 1) , (GARCH(2,1))
n
t
= o
t
-
t
o
2
t
= . c
1
n
2
t1
c
2
n
2
t2
,
1
o
2
t1
,
2
o
2
t2
, ., c
i
, ,
i
0.
Procure-se representar este processo na forma (7.12). Para o efeito, observe-se
que
o
2
t
= . c
1
o
2
t1
-
2
t1
c
2
o
2
t2
-
2
t2
,
1
o
2
t1
,
2
o
2
t2
= .
_
c
1
-
2
t1
,
1
_
o
2
t1
c
2
n
2
t2
,
2
o
2
t2
.
Tem-se
_
_
o
2
t
o
2
t1
n
2
t1
_
_
. .
y
I
=
_
_
c
1
-
2
t1
,
1
,
2
c
2
1 0 0
-
2
t1
0 0
_
_
. .
A
I
_
_
o
2
t1
o
2
t2
n
2
t2
_
_
. .
y
I1
_
_
.
0
0
_
_
. .
B
I
.
A matriz aleatria A
t
e o vector H
t
esto nas condies da denio 7.3.4.
A estacionaridade do processo (7.12) est discutida, por exemplo, em Brandt
(1986) e Basrak et al. (2002). O resultado principal dado pela
PROPOSIO 7.3.5. Assuma-se, no mbito da denio 7.3.4,
L
(log |A
1
|) <
0 e
L
_
log
|H
1
|
_
< (log
r = max (log r, 0)). Ento o processo denido

por (7.12) converge (com probabilidade um) e a sua soluo estritamente esta-
cionria.
Na proposio anterior, as condies de estacionaridade apenas envolvem A
1
e H
1
, e no toda a sucesso A
t
e H
t
, porque se admite que A
t
e H
t
so
sequncias i.i.d. e, portanto, a avaliao de um elemento qualquer da sucesso
suciente para estabelecer o resultado desejado.
Uma verso (ligeiramente) mais geral da proposio anterior apresentada
Basrak et al. (2002). Como habitualmente, |A| a norma da matriz ou vector A.
COROLRIO 7.3.1. No caso escalar, d = 1,
j
t
=
t
j
t1
1
t
,
onde (
t
, 1
t
) , t Z uma sucesso de vectores i.i.d., assuma-se _
L
(log [
1
[) <
0 e
L
_
log
[1
1
[
_
< . Ento j converge (com probabilidade um) e a sua soluo
estritamente estacionria.
EXEMPLO 7.3.11. Discuta-se a estacionaridade do processo
j
t
= cj
t1
n
t
,
onde n rudo branco Gaussiano. No contexto do corolrio 7.3.1 tem-se
t
= c, 1
t
= n
t
.
A condio
L
_
log
[1
1
[
_
< verica-se imediatamente, tendo em conta a dis-
tribuio assumida para n.
12
Relativamente outra condio, vem
L
(log [
1
[) =
L
(log [c[) = log [c[ .
Se log [c[ < 0, i.e., [c[ < 1 o processo EE.
EXEMPLO 7.3.12. Discuta-se a estacionaridade do processo
j
t
= c
jc
I
j
t1
n
t
(7.13)
onde j uma constante e c
t
e n
t
so rudos brancos Gaussianos com varincia
igual a 1, e independentes entre si. No contexto do corolrio 7.3.1 tem-se
t
= c
jc
I
, 1
t
= n
t
.
Como
t
uma sucesso v.a. i.i.d., a equao (7.13) respeita a denio 7.3.4
(e, assim, o corolrio 7.3.1 aplicvel). A condio
L
_
log
[1
1
[
_
< verica-
se imediatamente, tendo em conta a distribuio assumida para n. Relativamente
outra condio, vem
L
(log [
1
[) =
L
_
log c
jc
1
_
=
L
(j oc
1
) = j.
Se j < 0 ento o processo j EE.
EXEMPLO 7.3.13. Considere-se o processo n
t
com heterocedasticidade condi-
cionada de ordem (1, 1) , (GARCH(1,1))
n
t
= o
t
-
t
o
2
t
= . c
1
n
2
t1
,
1
o
2
t1
., c
1
, ,
1
0.
onde - um rudo branco EE e independente de n
tI
, / N. O processo o
2
t
pode
escrever-se na forma
o
2
t
= . c
1
o
2
t1
-
2
t1
,
1
o
2
t1
= .
_
c
1
-
2
t1
,
1
_
o
2
t1
.
Tem-se assim
t
=
_
c
1
-
2
t1
,
1
_
, 1
t
= 1 = ..
Verica-se que (
t
, 1) uma sucesso de v.a. positivas i.i.d. Para que o
2
t
ad-
mita uma soluo estritamente estacionria suciente (pode mostrar-se que
12
Se & ~ ` (0, 1) , ento L(log [&[) = 0.68. Pode mostrar-se que log [&[ funo densidade
de probabilidade 2c
e
2y
2
+
_
2.
tambm necessrio) que se veriquem as condies do corolrio 7.3.1, _
L
(log [
1
[) < 0 e
L
_
log
[1
1
[
_
< . A segunda condio verica-se imediata-
mente; a primeira estabelece
L
(log [
1
[) =
L
_
log
_
c
1
-
2
0
,
1
__
< 0. (7.14)
Nelson (1990) obteve esta condio
13
, mas sem recorrer proposio 7.3.5. Tem-
se assim que o
2
t
um processo EE. E quanto a n
t
Felizmente, no necessrio
estudar directamente n
t
, pois sabe-se que se o processo (
1t
,
2t
) EE, uma
qualquer funo (mensurvel) de
1t
e
2t
ainda estritamente estacionria. As-
sim, se
__
o
2
t
, -
t
__
EE, ento o processo n denido por n
t
= o
t
-
t
tambm
EE.
EXEMPLO 7.3.14. Retome-se o exemplo 7.3.10. Suponha-se que - um rudo
branco com distribuio (0, 1) . Considerando a norma
|A| = max
1ia
_
_
a
)=1
[a
i)
[
_
_
,
tem-se
log |A
1
| = log
_
_
_
_
_
_
_
_
_
_
c
1
-
2
0
,
1
,
2
c
2
1 0 0
-
2
0
0 0
_
_
_
_
_
_
_
_
o
_
_
= log max
_
c
1
-
2
0
,
1
[c
2
[ [,
2
[ , 1, [-
0
[
2
_
= max
_
log
_
c
1
-
2
0
,
1
[c
2
[ [,
2
[
_
, 0, log
_
[-
0
[
2
__
.
Como
L
_
log
_
[-
0
[
2
__
= 1.27086 < 0 e todos os parmetros so positivos, a
condio
L
(log |A
1
|) < 0 resume-se a
L
_
log
_
c
1
-
2
0
c
2
,
1
,
2
__
< 0.
No caso c
2
= ,
2
= 0, obtm-se a condio j estabelecida (7.14).
7.3.4. Modelos No Lineares do tipo y
t
= q (y
t1
, u
t
). Os modelos mais
gerais so do tipo y
t
= q (y
t1
, u
t
) . No ponto anterior, a funo g decompe-
se na forma A
t
y
t1
(xando A
t
, g linear no seu argumento) e no caso y
t
=
g (y
t1
) u
t
, anteriormente tratado, g, dado y
t1
, no depende de uma compo-
nente aleatria.
O prximo resultado envolve os conceitos de aperiodicidade e irredutibilidade.
Suponha-se que o espao de estados de j 1, 2, 8. Imagine-se que o processo
13
O valor esperado L
_
log
_
c
1
-
2
0
,
1
__
tem expresso conhecida, por exemplo, quando -
0
~
` (0, 1) . O programa Mathematica permite obter
L
_
log
_
c
1
-
2
0
,
1
__
= oif
_
_
,
2c
_
log
_
c
2
_
LuloiGunnu
,
HypoigoonofiicIFQ
_
|1, 1 ,
_
3
2
, 2
_
,
c
2o
_
c
.
A explicao destas funes pode ver-se no programa Mathematica.
tem incio no estado 1. Se j retorna ao estado 1 sempre em dois passos (por ex-
emplo, visita 2 e volta a 1, ou visita 3 e volta a 1) o processo no aperidico.
Irredutibilidade signica, grosso modo, que um processo pode visitar qualquer es-
tado qualquer que seja o estado em que se encontre.
Para processos comespao de estados contnuo, a seguinte proposio assegura
a irredutibilidade (Mokkadem, 1985):
PROPOSIO 7.3.6. Suponha-se que para qualquer conjunto R
.
com
medida de Lebesgue no nulo e qualquer conjunto compacto 1, existe um inteiro
t 0 tal que
inf
x1
1 (y
t
[ y
0
= x) 0. (7.15)
Ento o processo y irredutvel.
Dena-se |y
t
|
q
:=
L
(|y
t
|
q
)
1
q
.
PROPOSIO 7.3.7. Considere-se o processo multivariado y denido por
y
t
= q (y
t1
, u
t
)
onde u
t
uma sucesso de vectores i.i.d.. Suponha-se que y um processo
aperidico e irredutvel. Suponha que existem escalares 1 0, c (0, 1) e 0
tal que q est bem denida e contnua com respeito ao primeiro argumento e
|q (x, u
1
)|
q
< c |x| , |x| 1.
Ento j
t
geometricamente ergdico e EE.
EXEMPLO 7.3.15. Retome-se o exemplo 7.3.13,
o
2
t
= .
_
c
1
-
2
t1
,
1
_
o
2
t1
supondo - um rudo branco Gaussiano com varincia igual a 1. A proposio
7.3.5 a mais adequada para tratar este caso. No entanto, tambm 7.3.7 pode ser
invocada. O processo obviamente aperidico, tendo em conta a distribuio de -.
No fcil vericar-se (7.15), pois as probabilidades de transio a : passos no
so conhecidas. no entanto pacco assumir-se que o
2
t
, para algum t 0, pode
atingir qualquer conjunto , qualquer que seja a condio inicial. Assuma-se,
assim, que o
2
t
irredutvel. Tem-se,
q (r, n
1
) = .
_
c
1
-
2
1
,
1
_
r
e escolha-se, no contexto da proposio 7.3.7, = 1. Assim,
|q (r,-
1
)|
1
=
L
_
.
_
c
1
-
2
1
,
1
_
r
_
.
Em que circunstncias se verica
L
_
.
_
c
1
-
2
1
,
1
_
r
_
< c [r[ , [r[ 1
Para [r[ sucientemente grande, tal que [r[ 1, o valor de . irrelevante
14
.
Assuma-se assim . = 0. Vem
L
_
_
c
1
-
2
1
,
1
_
r
_
=
L
_
c
1
-
2
1
,
1
_
r < c [r[ , [r[ 1
14
Considere-se, por exemplo, [. 0.0Sr[ < 0.00 [r[ . Esta desigualdade no se verica para
todo o r R. No entanto, para qualquer valor de ., existe certamente um 1 tal que [r[ 1 =
[. 0.0Sr[ < 0.00 [r[ .
7.4. MODELO LIMIAR AUTOREGRESSIVO (THRESHOLD AR - TAR) 183
se e s se
L
_
c
1
-
2
1
,
1
_
< c (0, 1) . A condio de estacionaridade estrita
est encontrada:
L
_
c
1
-
2
1
,
1
_
< 1.
Atendendo a c
1
-
2
1
,
1
0 e
L
_
-
2
1
_
= 1, a condio pode reescrever-se na forma
L
_
c
1
-
2
1
,
1
_
= c
1
,
1
< 1. (7.16)
Esta condio no equivalente obtida no exemplo 7.3.13,
L
_
log
_
c
1
-
2
0
,
1
__
<
0 (as proposies 7.3.5 e 7.3.7, em geral, conduzem a condies sucientes, mas
no necessrias). Estas duas condies so discutidas no captulo 8.
Descrevemos nesta seco modelos no lineares de forma muito geral. Nas
duas seces seguintes focaremos dois modelos no lineares bastante populares na
literatura.
7.4. Modelo Limiar Autoregressivo (Threshold AR - TAR)
7.4.1. Introduo. Como argumentmos na introduo deste captulo, uma
classe importante de processos no lineares na mdia baseia-se na ideia de regime-
switching. Nesta seco apresentam-se vrios modelos onde a mudana de regime
depende de uma varivel observvel. Provavelmente o modelo mais conhecido
desta famlia (onde os regimes dependem de variveis observveis) o modelo
Threshold AR ou TAR. Para exemplicar, considere-se um modelo TAR com dois
regimes
j
t
=
_
c
10
c
11
j
t1
n
t

to
_
c
20
c
21
j
t1
n
t

to

(7.17)
onde o valor do limiar (threshold values),
to
a varivel limiar e d 0
um inteiro. No caso especial em que
to
= j
to
o modelo (7.17) designa-se por
Self-Exciting TAR ou SETAR ( o prprio processo j que determina a mudana de
regime).
A ideia principal do modelo pode ser exposta da seguinte forma. Se certo fen-
meno j no linear na mdia, ento incorrecto assumir que j se comporta linear-
mente em todo o seu domnio. A soluo que est implcita no modelo TAR con-
siste em assumir linearizaes diferenciadas, consoante o valor de j. Em lugar de
se ter uma aproximao linear global, tm-se vrias linearizaes emsub-intervalos
do espao de estados
15
. Por exemplo, no modelo (7.17), com
to
= j
t1
, pode
admitir-se que a representao linear c
10
c
11
j
t1
n
t
uma boa aproximao
15
A este respeito a frmula de Taylor instrutiva. Suponha-se que ) : R R possui derivada
contnua de primeira ordem. Pela frmula de Taylor tem-se ) (r) = ) (o) )
0
(o) (r o)
O
_
[r o[
2
_
. Esta frmula diz-nos que ) (r) pode ser arbitrariamente bem aproximada atravs da
expresso linear (em r) ) (o) )
0
(o) (r o). Note-se que o, ) (o) e )
0
(o) so constantes e o
erro envolvido na aproximao de ordem [r o[
2
. Se procuramos aproximar ) (r) quando r se
afasta de o a aproximao piora signicativamente, tendo em conta o erro envolvido O
_
[r o[
2
_
.
Assim, podemos usar a frmula de Taylor na forma linear, repetidamente, para vrios valores de o, e
assim obter boas aproximaes de ) em todo o seu domnio. este o princpio que est subjacente
ao modelo TAR.
para o comportamento de j
t
quando j
t1
< . Todavia, quando j
t1
sai do inter-
valo (, ) , j
t
passa a ser melhor caracterizado pelo segundo ramo da especi-
cao (7.17).
Outra interpretao do TAR sugerida pela seguinte representao equivalente
de (7.17):
j
t
=
_
c
10
J
q
Iu
c
11
J
q
Iu
j
t1
_
_
c
20
J
q
Iu
c
21
J
q
Iu
j
t1
_
n
t
.
=
_
c
10
J
q
Iu
c
20
J
q
Iu
_
. .
0
(j
I1
)
_
c
11
J
q
Iu
c
21
J
q
Iu
_
. .
1
(j
I1
)
j
t1
n
t
= c
0
(
to
) c
1
(
to
) j
t1
n
t
.
Observa-se, assim, que o modelo TAR pode ser interpretado como um processo
AR de coecientes aleatrios com dependncia em
to
.
7.4.2. Solues Peridicas. Considere-se o processo linear, j
t
= ccj
t1
n
t
, [c[ < 1. Recorde-se que o esqueleto da equao estocstica a correspondente
equao determinstica comn
t
= 0, i.e., j
t
= cc j
t1
. De acordo coma denio
7.2.1, o ponto xo da equao j
t
= q (j
t1
) o valor j tal que q ( j) = j. No caso
linear, q (r) = c cr, a soluo de q ( j) = j j = c, (1 c) . Recorda-se que
se j
t
for inicializado no ponto xo, j
t
permanece no valor do ponto xo para todo
o t . Com efeito, se j
t1
= j e j um ponto xo, a variao da soluo, ^j
t
,
nula, i.e., ^j
t
= j
t
j
t1
= q (j
t1
) j
t1
= j j = 0. Se a soluo no
inicializada numa vizinhana do ponto xo, mas [c[ < 1, ento j
t
tender para
j, quando t . Quando a equao linear (de primeira ordem) existe apenas
o ponto xo j = c, (1 c), que poder ser ou no assimptoticamente estvel
(dependendo do valor de c). Uma das caractersticas dos processos no lineares
o de admitirem esqueletos com vrios pontos xos e com periodicidade superior
a um. Esta possibilidade permite modelar dados que exibam solues peridicas
estveis.
Para concretizar considere-se o exemplo:
j
t
=
_
1 0.j
t1
n
t
j
t1
< 0
1 0.j
t1
n
t
j
t1
_ 0.
(7.18)
O esqueleto da equao
j
t
=
_
1 0. j
t1
, j
t1
< 0
1 0. j
t1
, j
t1
_ 0
(7.19)
e a funo q (r) representa-se na forma
q (r) =
_
1 0.r r < 0
1 0.r r _ 0.
(7.20)
-4 -2 2 4
-4
-2
2
4
1
5 . 0 1

=
t t
y y
1
5 . 0 1

+ =
t t
y y
FIGURA 7.18. Grco Teia de Aranha do modelo (7.19). Os val-
ores 0.4 e -1.2 so pontos peridicos de perodo 2
-4
-3
-2
-1
0
1
2
3
4
5
6
1 6 11 16 21 26 31
t
y
FIGURA 7.19. Trajectria de (7.20) com j
0
=
As guras 7.18 e 7.19 mostram que os valores 0.4 e -1.2 so pontos peridicos
16
de
perodo 2. Estes pontos so assimptoticamente estveis. Qualquer que seja o valor
de inicializao, a soluo j
t
atrada para a rbita 0.4, 1.2 .
No faz sentido falar-se em solues peridicas do modelo estocstico denido
em (7.18). A componente estocstica impede, de facto, que j
t
possa oscilar entre
os pontos 0.4 e -1.2. Todavia, o comportamento peridico subjacente ao esqueleto
est parcialmente presente no modelo estocstico, tal como mostra a gura 7.20,
16
possvel obter estes pontos resolvendo j (j (r)) = r em ordem a r.
FIGURA 7.20. Grco dos pares (j
t1
, j
t
) aps se ter gerado
uma trajectria do processo 7.18 (traam-se tambm as rectas
1 .r e 1 0.r)
onde se apresenta o grco scatter (i.e. o grco dos pares (j
t1
, j
t
)) depois de se
ter simulado uma trajectria.
Como o processo EE (veja-se o exemplo 7.3.9), pode tambm indagar-se
que tipo de distribuio estacionria dene o processo. A expresso analtica desta
distribuio desconhecida, mas pode estimar-se de vrias formas. Provavelmente
o procedimento mais simples consiste em gerar uma trajectria sucientemente
longa e, depois de se desprezarem os primeiros valores
17
(digamos os primeiros
10), estima-se a funo de densidade marginal ) (r) atravs do estimador
) (r) =
1
:
S
/
a
S
i=1
1
_
r j
i
/
_
(7.21)
onde / a bandwidth, :
S
o nmero de observaes simuladas usadas na esti-
mao e 1 , por exemplo, o Kernel (ou ncleo) Gaussiano. Sob certas condies
sabe-se que

) (r)
j
) (r) onde ) no mais do que a densidade estacionria.
Naturalmente, necessrio considerar vrios valores de r na expresso (7.21) para
se ter uma ideia do comportamento de ) no espao de estados da varivel. Como
:
S
est sob nosso controle, a funo ) pode ser estimada de forma arbitrariamente
precisa. Na gura 7.21 apresenta-se a densidade estacionria estimada

) (r) . A
existncia de duas modas acaba por no surpreender tendo em conta a estrutura
do esqueleto (recorde-se a existncia de dois pontos peridicos). J a assimetria
17
A justicao: o valor incial
0
, a partir da qual gerada a trajectria, no obtido em
condies estacionrias porque estas so desconhecidas.
FIGURA 7.21. Densidade Estacionria do processo (7.18) - esti-
mao baseada em 50000 observaes simuladas.
da distribuio no clara (pelo menos primeira vista). A probabilidade de j se
encontrar abaixo de zero cerca de 0.562 (

J
j
I
0
,:) e

L
(j) = 0.888.
O grco teia de aranha talvez possa explicar estes valores. Observe-se que na
estrutura determinstica, um valor negativo inferior a 2 seguido por outro valor
negativo, enquanto um valor positivo passa imediatamente a negativo. Este facto
explica por que razo a probabilidade de j se encontrar abaixo de zero superior a
0.5 e, de certa forma, tambm explica a existncia de uma mdia marginal negativa.
7.4.3. Estacionaridade. A estacionaridade estrita pode ser analisada no con-
texto das proposies apresentadas no ponto 7.3. Por exemplo, no modelo mais
geral
j
t
=
_
_
_
c
10
c
11
j
t1
... c
1j
j
tj
n
t
j
to
<
1
... ...
c
I0
c
I1
j
t1
... c
Ij
j
tj
n
t
j
to

I
se a condio max
1iI
j
)=1
c
)i
< 1 se vericar, ento o processo EE, aten-

dendo proposio 7.3.4. Esta condio apenas suciente, mas no necessria.
Como tal, pode ser demasiado exigente. Para certos modelos particulares so con-
hecidas as condies necessrias e sucientes. o caso do modelo
j
t
=
_
_
_
c
1
c
1
j
t1
n
t
j
to
<
1
c
2
c
2
j
t1
n
t

1
_ j
to
_
2
c
S
c
S
j
t1
n
t
j
to

2
(7.22)
PROPOSIO 7.4.1. O processo j
t
denido pelo sistema (7.22) EE sse
qualquer uma das seguintes condies se vericar:
i: c
1
< 1, c
S
< 1, c
1
c
S
< 1;
ii: c
1
= 1, c
S
< 1, c
1
0;
iii: c
1
< 1, c
S
= 1, c
S
< 0;
iv: c
1
= 1, c
S
= 1, c
S
< 0 < c
1
;
v: c
1
c
S
= 1, c
1
< 1, c
1
c
S
c
1
0;
Oresultado apresentado no envolve qualquer restrio sobre o regime 2. Mesmo
no caso de / regimes AR(1), o teorema acima continua a aplicar-se (neste caso o
regime 3 encarado como o ltimo regime).
7.4.4. Exemplo (Bounded Random Walk). Um caso muito interessante o
seguinte:
j
t
=
_
_
_
c
1
c
1
j
t1
n
t
j
t1
<
1
c
2
j
t1
n
t

1
_ j
t1
_
2
c
S
c
S
j
t1
n
t
j
t1

2
(7.23)
Assuma-se [c
1
[ < 1 e [c
S
[ < 1. Observe-se que o processo no regime 2 integrado
de ordem 1, i.e., exibe o comportamento de um random walk. No entanto j EE,
pela proposio 7.4.1.
Se 1 (
1
_ j
t
_
2
) uma probabilidade alta, ento durante a maior parte do
tempo j comporta-se como um random walk. Sempre que os limiares
2
ou
1
so
atingidos o processo passa a exibir reverso para uma certa mdia e, deste modo,
j globalmente estacionrio e, portanto, limitado em probabilidade (ou contrrio
do random walk). Na gura 7.22 apresenta-se uma trajectria simulada a partir do
processo
j
t
=
_
_
_
0.0j
t1
n
t
j
t1
< 8
j
t1
n
t
8 _ j
t1
_ 8
0.0j
t1
n
t
j
t1
8
(7.24)
onde n
t
uma sucesso de v.a. i.i.d. com distribuio
_
0, 0.2
2
_
.
Processos do tipo (7.24) confundem-se facilmente compasseios aleatrios. Por
esta razo, o teste Dickey-Fuller tende a no rejeitar a hiptese nula de raiz unitria
quando a alternativa um processo estacionrio do tipo (7.24); por outras palavras,
o teste Dickey-Fuller pouco potente contra alternativas do tipo (7.24). No con-
texto do modelo (7.23), pode mostrar-se que a potncia do teste Dickey-Fuller
diminui quando
1
baixo e
2
alto ou c
1
, c
2
< 1 so altos ou Vai (n
t
) baixa.
7.4.5. Estimao. Considere-se, sem perda de generalidade, o modelo com
dois regimes:
j
t
=
_
c
10
c
11
j
t1
... c
1j
j
tj
n
t

to
_
c
20
c
21
j
t1
... c
2j
j
tj
n
t

to

(7.25)
onde se assume que n
t
um rudo branco com Vai (n
t
) = o
2
. Os parmetros de-
sconhecidos so d, , o
2
e =
_

t
1

t
2
_
t
onde
i
=
_
c
i0
c
i1
... c
ij
_
t
.
Reescreva-se (7.25) na forma
j
t
=
_
c
10
c
11
j
t1
... c
1j
j
tj
_
J
q
Iu
_
c
20
c
21
j
t1
... c
2j
j
tj
_
J
q
Iu
n
t
.
FIGURA 7.22. Trajectria Simulada a partir do Processo (7.24)
Seja x
t
t
= (1, j
t1
, ..., j
tj
) . Observe-se que cada um dos ramos pode escrever-
se como
_
c
10
c
11
j
t1
... c
1j
j
tj
_
J
q
Iu
=
_
1 j
t1
... j
tj
_
. .
x
0
I
1
J
q
Iu
= x
t
t
1
J
q
Iu
_
c
20
c
21
j
t1
... c
2j
j
tj
_
J
q
Iu
=
_
1 j
t1
... j
tj
_
. .
x
0
I
2
J
q
Iu
= x
t
t
2
J
q
Iu
.
Assim, (7.25) pode ainda escrever-se na forma
j
t
= x
t
t
1
J
q
Iu
x
t
t
2
J
q
Iu
n
t
=
_
x
t
t
J
q
Iu
x
t
t
J
7
q
Iu
_
_

1
2
_
n
t
ou ainda, com x
t
()
t
=
_
x
t
t
J
q
Iu
x
t
t
J
7
q
Iu
_
j
t
= x
t
()
t
n
t
.
Se n
t
j
t
[ T
t1
~
_
x
t
()
t
, o
2
_
e o mtodo da mxima verosimilhana equivalente ao mtodo dos mnimos quadra-
dos condicionados. Assim, o estimador para , dado ,
`
() =
_
X()
t
X()
_
1
X() y (7.26)
onde X() a matriz das variveis explicativas endgenas desfasadas (dado ),
tendo por linha genrica o vector-linha x
t
()
t
e y o vector das observaes j
t
.
EXEMPLO 7.4.1. Considere
j
t
=
_
c
10
c
11
j
t1
n
t
se j
t1
_ 0.1
c
20
c
21
j
t1
n
t
se j
t1
0.1
Note-se que d = 1, = 0.1. Suponha que se observa
y
t
=
_
.2 .2 .1 . .8 .0
_
(na prtica no se tm to poucas observaes). Como se perde a primeira ob-
servao, devido estrutura autoregressiva do processo, o vector y a ser usado
efectivamente na estimao
y
t
=
_
j
2
j
S
j
1
j
j
6
_
=
_
.2 .1 . .8 .0
_
.
A matriz X() com = 0.1
X(0.1) =
_
_
J
j
1
.1
j
1
J
j
1
.1
J
j
1
.1
j
1
J
j
1
.1
J
j
2
.1
j
2
J
j
2
.1
J
j
2
.1
j
2
J
j
2
.1
J
j
3
.1
j
S
J
jS.1
J
j
3
.1
j
S
J
j
3
.1
J
j
4
.1
j
1
J
j
4
.1
J
j
4
.1
j
1
J
j
4
.1
J
j
5
.1
j
J
j
5
.1
J
j
5
.1
j
J
j
5
.1
_
_
=
_
_
0 0 1 .2
1 .2 0 0
1 .1 0 0
0 0 1 .
0 0 1 .8
_
_
.
Claro que o estimador
`
() depende de , que desconhecido. Como estimar
Seja
o
2
() =
a
t=1
_
j
t
x
t
()
t
`
()
_
2
:
a soma dos quadrados dos resduos. Supondo d conhecido, toma-se para estimativa
de o valor que minimiza o
2
() , i.e.,
= aig min
o
2
() . (7.27)
O conjunto I o espao do parmetro (todos os valores que pode assumir).
Claramente I = R. Como a derivada de o
2
() em ordem a no est denida,
o problema de estimao (7.27) no standard. Uma forma expedita de obter a
sua soluo consiste em fazer percorrer no conjunto I e, depois, seleccionar o
valor que minimiza o
2
() . Felizmente, a escolha dos valores relevantes para
relativamente pequena. Sejam j
(1)
, j
(2)
, ..., j
(a)
so as estatstica de ordem tais
que
j
(1)
_ j
(2)
_ ... _ j
(a)
.
Como o
2
() no se altera quando varia entre duas estatsticas de ordem, o prob-
lema de optimizao (7.27) equivalente a
= aig min
o
2
() ,

I =
_
j
(1)
, ..., j
(a)
_
(7.28)
ou seja, para obter basta percorrer no conjunto

I e seleccionar, depois aquele
que minimiza o
2
(). Na prtica, impe-se que cada regime possua pelo menos
uma certa fraco de observaes (efectivamente, no faz sentido, tomar = j
(1)
ou = j
(a)
). Assim, deve restringir-se o conjunto

I, passando a ser
_
j
[((a1))[
, ..., j
[((1)(a1))[
_
onde [.[ representa a parte inteira do nmero. Neste novo conjunto

I no fazem
parte as 100/ mais baixas nem as (1 ) 100/ mais altas.
Falta-nos ainda tratar a estimao de d, que tambm no standard tendo
em conta que d N. Como o
2
depende de d, escolhe-se d num certo conjunto
1 = 1, 2, ..., d
+
de forma a minimizar o
2
. Logo,
_
,

d
_
= aig min
`
,o1
o
2
(, d)
onde, agora,
o
2
(, d) = :
1
a
t=1
_
j
t
x
t
(, d)
t
`
(, d)
_
2
e
`
(, d) =
_
X(, d)
t
X(, d)
_
1
X(, d) y.
Em suma, os passos na estimao dos parmetros so o seguintes:
(1) para cada

I e para cada d 1, construir X(, d) e estimar
`
(, d)
e o
2
(, d);
(2) tomar para estimativa de e de d o par (, d) que minimiza o
2
(, d);
seja esse par dado por
_
,

d
_
.
(3) tomar para estimativa de , o valor
`
_
,

d
_
.
j
t
=
_
c
1
j
t1
n
t
se j
to
_
c
2
j
t1
n
t
se j
to

com Vai [n
t
[ = o
2
. Suponha que os resultados na fase da estimao so:
Valores de o
2
em funo de e d
d
|
1 2
-1 15.5 16
-0.7 12.4 13.5
-0.1 12.1 12.3
-.001 3.5 2.5
0.0 1.2 2.4
1.2 2.5 2.8
1.5 5.5 7
Resulta do quadro (veja o valor a negrito) que = 0,

d = 1 e o
2
= 1.2. Por
outras palavras
(0, 1) = aig min o
2
(, d) e min o
2
(0, 1) = 1.2.
Para ilustrar a matriz X(, d), suponha que os dois ltimos valores de j so
j
a1
= 1. e j
a
= 1.; ento a ltima linha da matriz X(, d)
x
a
_
,

d
_
t
=
_
j
a1
J
j
n1
0
j
a1
J
j
n1
0

=
_
0 1.

(o valor j
a
= 1. no entra na matriz X).
7.4.6. Inferncia. Pode mostrar-se que o estimador para d super-consistente,
isto , possui uma varincia proporcional a 1,:
c
com c 1 (os estimadores ha-
bituais possuem uma varincia proporcional a 1,:). A distribuio assimpttica
tambm conhecida (Hansen, 1997). Dada a super-consistncia de

d podemos,
para efeitos de inferncia estatstica sobre os demais parmetros, assumir que d
conhecido.
7.4.6.1. Inferncia sobre . Sob certas condies (incluindo estacionaridade
estrita) tem-se
_
:
_
`
( )
0
_
o
_
0, I (
0
)
1
_
, (7.29)
onde I (
0
) = o
2
L
_
x
t
(
0
) x
t
(
0
)
t
_
(
0
e
0
so, de acordo com a notao
habitual, os verdadeiros, mas desconhecidos valores dos parmetros e ). Supo-
mos, naturalmente, que um estimador consistente para
0
. A matriz I (
0
)
estimada consistentemente por
1
:
a
t=1
x
t
( ) x
t
( )
t
.
O resultado (7.29) indica-nos que, em grandes amostras, a inferncia estatstica
sobre os parmetros c
i)
conduz-se da forma habitual.
7.4.6.2. Inferncia sobre a existncia de Threshold. Uma questo importante
saber se o modelo TAR prefervel ao simples AR. Para o efeito, testa-se H
0
:
1
=
2
pois, sob esta hiptese, o TAR reduz-se ao AR. Aparentemente, o re-
sultado (7.29) permite ensaiar H
0
, no quadro do teste de Wald. Esta ideia incor-
recta, pois sob a hiptese nula o parmetro no identicvel. Este um problema
que ocorre tipicamente em modelos no lineares (veja-se, por exemplo, o modelo
Markov-switching, no ponto 7.5). Observe-se que, sob a hiptese nula, a funo de
verosimilhana deixa de depender do parmetro ( indiferente o valor que as-
sume)
18
. Nestas circunstncias, a matriz de informao singular e no possvel
usar os resultados assimptticos habituais.
Hansen (1997) sugere o seguinte procedimento:
(1) obter 1
a
= :
_
o
2
a
o
2
a
_
, o
2
a
onde o
2
a
a varincia dos erros de regresso
do modelo AR (sob H
0
) e o
2
a
resulta de (7.28);
(2) simular n
+
t
, t = 1, ..., : com distribuio i.i.d. (0, 1) ;
(3) j
+
t
= n
+
t
;
(4) fazer a regresso de j
+
t
sobre r
t
t
=
_
1 j
t1
... j
tj
_
e obter o
+2
a
(5) obter = aig min
o
+2
a
() onde o
+2
a
() resulta da regresso de j
+
t
sobre x
t
();
(6) obter 1
+
a
= :
_
o
+2
a
o
+2
a
_
, o
+2
a
(7) repetir os passos 2-6 1 vezes
(8) valor-p = percentagem de vezes (em 1) em que 1
+
a
_ 1
a
.
18
Veja-se mais um exemplo. No caso
I
= ,r
I
&
I
, r
I
0, ocorre uma situao similar com
1
0
: , = 0 ou com 1
0
: = 0. Por exemplo, sob a hiptese , = 0, desaparece da especicao;
como consequncia, a verosimilhana deixa de depender de . J o ensaio 1
0
: , = ,
0
com,
0
,= 0
no levanta problemas.
1
a
1 12.2
1.1 10.2
1.15 7.35
1.2 0
1.35 6.31
1.45 7.35
1.6 15
TABELA 1. Intervalo de Conana para o Threshold: Ilustrao
do mtodo de Hansen
A fundamentao do teste baseia-se na prova segundo a qual 1
+
a
possui a
mesma distribuio assimpttica de 1
a
, sob H
0
. Observe-se, com efeito, que 1
+
a
construda sob a hiptese de ausncia de threshold. Assim, existe indcio de vio-
lao da hiptese nula quando o
2
a
signicativamente superior a o
2
a
, de tal forma
que 1
a
tende a ser geralmente alto quando comparado com 1
+
a
. Nestas circunstn-
cias raramente ocorre 1
+
a
_ 1
a
(nas 1 simulaes) e o valor-p vem baixo.
7.4.6.3. Inferncia sobre o threshold. Seja
1
a
() = :
_
o
2
a
() o
2
a
( )
o
2
a
( )
_
. (7.30)
Sabe-se que (Hansen, 1997)
1
a
(
0
)
o
onde 1 ( _ r) =
_
1 c
a2
_
2
. Com base neste resultado, Hansen (1997) re-
comenda o seguinte procedimento para a construo de um intervalo de conana
para :
(1) Calcular 1
a
() para

I
(2) Determinar o conjunto C
c
=
_
: 1
a
() _
c
_
onde
c
o quantil da
distribuio de (inclui, portanto, todos os tais que 1
a
() menor ou
igual a
c
).
Como 1 (
0
C
c
) c (quando : ), o intervalo de conana a c100/
precisamente C
c
.
Usando a funo de distribuio de , tem-se
0.90
= .04,
0.9
= 7.8 e
0.99
= 10.0.
Ilustre-se o procedimento com o seguinte exemplo articial. Admita-se que se
observam os valores da tabela 1. Note-se que a estimativa para = 1.2 pois
1
a
(1.2) = 0. Tendo em conta que
0.9
= 7.8, o intervalo de conana para a
95% C
0.9
= : 1.1 _ _ 1.4 .
7.5. Modelo Markov-Switching
7.5.1. Introduo. Outro modelo importante baseado na ideia de regime switch-
ing o modelo Markov-Switching (MS). Nos modelos apresentados no ponto an-
terior a mudana de regime baseada em variveis observveis. No modelo MS a
mudana de regime no observvel.
Considere-se o modelo
j
t
= c
1
c
1
d
t
cj
t1
n
t
(7.31)
onde d
t
uma varivel dummy
d
t
=
_
1 se evento A ocorre
0 se o evento A no ocorre.
Sabemos exactamente quando o evento A ocorre. Por exemplo, o evento A pode
representar segunda-feira. Trata-se de um evento obviamente determinstico.
Suponhamos agora que A no observvel. Como modelar, estimar e prever j?
So estas as questes que abordaremos ao longo deste ponto.
Para trabalharmos com alguma generalidade, admita-se que esto denidos
regimes. Por exemplo, um modelo relativamente simples com dois regimes,
= 2,
j
t
=
_
c
1
cj
t1
n
t
se j
t
est no regime 1
c
1
c
1
cj
t1
n
t
se j
t
est no regime 2
(7.32)
O regime 1 pode estar associado, por exemplo, ao evento A no ocorre e o regime
2 A ocorre. Este modelo , em vrios aspectos, similar ao modelo (7.31); h, no
entanto, um diferena aprecivel: agora no se sabe quando que j est no regime
1 ou 2. Seja o
t
o regime em que o processo j se encontra no momento t (assim,
se o
t
= i, ento j
t
est no regime i). No modelo anterior, equao (7.32), o pode
assumir os valores o
t
= 1 ou o
t
= 2. A sucesso o
t
claramente um processo
estocstico com espao de estados (nito) 1 = 1, 2, ..., .
necessrio, naturalmente, especicar um modelo para o
t
. Admita-se 1 =
1, 2 . Se o valor que o assume emt nada tem a ver com o valor que o assume em
t1, t2, ..., ento o
t
uma sucesso de v.a. i.i.d. comdistribuio de Bernoulli
de parmetro j que pode ser identicado com o regime 1, isto , 1 (o
t
= 1) =
j. O processo j vai saltando entre os regimes 1 e 2 de forma independente de
acordo com a probabilidade j. Num dado momento t, j est no regime 1 com
probabilidade j (independentemente do regime anterior assumido). Na prtica, a
independncia entre os sucessivos valores de o
t
no apropriada para um grande
nmero de aplicaes. Por exemplo, suponha-se que j a taxa de crescimento do
produto. Admita-se ainda que j se comporta diferentemente consoante a economia
est em expanso ou em recesso. Temos, assim dois regimes o
t
= 1 (recesso),
o
t
= 2 (expanso). A sucesso o
t
no provavelmente independente: se a
economia, num certo momento, est em expanso (o
t1
= 2), mais provvel que
no momento seguinte a economia se encontre em expanso do que em recesso.
Formalmente,
1 (o
t
= 2[ o
t1
= 2) 1 (o
t
= 1[ o
t1
= 2) .
7.5. MODELO MARKOV-SWITCHING 195
Logo o
t
formado por uma sucesso de v.a. dependentes. Uma sucesso ou
trajectria de o, poder ser, por exemplo, 1, 1, 1, 1, 2, 2, 2, 2, 1, 1, 1, ... .
7.5.2. Cadeias de Markov em tempo discreto com espao de estados dis-
cretos nito. Um modelo conveniente para caracterizar o
t
, num cenrio de de-
pendncia temporal, a cadeia de Markov homognea em tempo discreto com
espao de estados discretos nito. A teoria das cadeias de Markov tem aplicaes
em muitas reas, como por exemplo, em modelos de inventrio, em gentica, em
las de espera, etc. Iremos apresentar as ideias principais.
Uma cadeia de Markov um processo de Markov no seguinte sentido:
1 (o
t
= ,[ o
t1
= i, ..., o
0
= i
0
) = 1 (o
t
= ,[ o
t1
= i)
isto , o
t
independente de o
t2
, o
tS
, ..., o
0
dado o
t1
.
Uma cadeia de Markov completamente caracterizada pela chamada matriz de
probabilidades de transio a um passo (ou simplesmente matriz de probabilidades
de transio) e, eventualmente, por uma condio inicial. No caso de dois regimes,
1 = 1, 2 , esta matriz dene-se da seguinte forma
I =
_
1 (o
t
= 1[ o
t1
= 1) 1 (o
t
= 2[ o
t1
= 1)
1 (o
t
= 1[ o
t1
= 2) 1 (o
t
= 2[ o
t1
= 2)
_
=
_
j
11
j
12
j
21
j
22
_
.
No caso geral ( regimes) tem-se
I =
_
_
_
j
11
j
1.
.
.
.
.
.
.
.
.
.
j
.1
j
..
_
_
_
.
A matriz 1 respeita as condies:
0 _ j
i)
_ 1, (i, , = 1, ..., ) ;

.
)=1
j
i)
= 1, (i = 1, ..., ) (as linhas soma 1).
EXEMPLO 7.5.1. Convencione-se que o
t
= 1 representa o estado economia
em recesso no momento t; o
t
= 2 representa o estado economia em expanso
no momento t. Suponha-se que a matriz de probabilidades de transio
I =
_
0.7 0.8
0.2 0.8
_
.
Se a economia est em expanso no perodo t 1, i.e., o
t1
= 2, a probabilidade
da economia se encontrar ainda em expanso no perodo t 0.8 e a probabilidade
de ela passar para recesso 0.2.
Podemos estar interessados em calcular uma probabilidade de transio a dois
passos, por exemplo,
1 (o
t
= 1[ o
t2
= 2) .
Neste caso, pela lei das probabilidades totais, vem com = 2
1 (o
t
= 1[ o
t2
= 2)
=
2
i=1
1 (o
t
= 1, o
t1
= i[ o
t2
= 2)
=
2
i=1
1 (o
t
= 1[ o
t1
= i, o
t2
= 2) 1 (o
t1
= i[ o
t2
= 2)
=
2
i=1
1 (o
t
= 1[ o
t1
= i) 1 (o
t1
= i[ o
t2
= 2)
= elemento (2, 1) da matriz 1
2
= 1 1.
Relativamente ao exemplo 7.5.1, calcule-se a matriz 1
2
. Tem-se:
_
0.7 0.8
0.2 0.8
__
0.7 0.8
0.2 0.8
_
=
_
0. 0.4
0.8 0.7
_
.
Assim, 1 (o
t
= 1[ o
t2
= 2) = 0.8 (elemento (2, 1) da matriz 1
2
).
O resultado geral dado pelas designadas equaes de Chapman-Kolmogorov:
1 (o
na
= ,[ o
0
= i) =
1
I=1
1 (o
n
= /[ o
0
= i) 1 (o
na
= /[ o
n
= ,) .
Deduz-se da expresso anterior que
1 (o
aI
= ,[ o
a
= i) = elemento (i, ,) da matriz 1
I
. (7.33)
Note-se ainda que no interessa o momento em que a probabilidade calcu-
lada. O que relevante o desfasamento temporal entre as variveis. Por exemplo,
1 (o
t
= 1[ o
tI
= 2) coincide com 1 (o
tI
= 1[ o
t
= 2). Esta propriedade re-
sulta de se ter uma matriz de probabilidades de transio que no depende de t.
Diz-se nestes casos que a matriz de probabilidades de transio homognea.
Emcertos problemas importante obter probabilidades relacionadas comeven-
tos a longo prazo. No exemplo 7.5.1, interessante saber a probabilidade da econo-
mia se encontrar em expanso (ou recesso) no longo prazo, dado que no momento
presente a economia se encontra em expanso. Formalmente, a questo
lim
ao
1 (o
ta
= 2[ o
t
= 2) . (7.34)
Tendo em conta a observao anterior, a probabilidade em questo corresponde ao
elemento (2, 2) da matriz limite
lim
ao
_
0.7 0.8
0.2 0.8
_
a
.
Observe-se
_
0.7 0.8
0.2 0.8
_
10
=
_
0.4000 0.0041
0.80061 0.60080
_
_
0.7 0.8
0.2 0.8
_
20
=
_
0.4 0.6
0.4 0.6
_
_
0.7 0.8
0.2 0.8
_
10
=
_
0.4 0.6
0.4 0.6
_
.
intuitivo admitir-se que
lim
ao
_
0.7 0.8
0.2 0.8
_
a
=
_
0.4 0.6
0.4 0.6
_
.
Logo lim1 (o
ta
= 2[ o
t
= 2) = 0.6, mas tambm lim1 (o
ta
= 2[ o
t
= 1) =
0.6 (quando : ). Isto , a probabilidade da economia se encontrar em expan-
so (ou recesso) no longo prazo independente do estado inicial, o que bastante
intuitivo (no longo prazo irrelevante saber se hoje a economia est ou no em
expanso).
Nem todas as cadeias de Markov admitem estas probabilidades limites. Sob
certas condies pode-se provar a
PROPOSIO 7.5.1. Se o recorrente
19
positiva aperidica com espao de es-
tados nito 1, 2, ...,
20
ento, o vector (linha) das probabilidades estacionrias
=
_

1

2

.
_
onde
i
= lim
ao
1 (o
ta
= i[ o
t
= ,) (para qualquer ,)
= 1 (o
t
= i) _ 0
satisfaz as equaes
= 1,
.
i=1
i
= 1.
i
; i = 1, 2, ..., a distribuio estacionria da cadeia o.
EXEMPLO 7.5.2. Considere-se o exemplo 7.5.1,
I =
_
0.7 0.8
0.2 0.8
_
.
O vector das probabilidades estacionrias pode ser determinar da seguinte forma:
_

1

2
_
=
_

1

2
_
_
0.7 0.8
0.2 0.8
_
_

1

2
_
=
_
0.7
1
0.2
2
0.8
1
0.8
2
_
19
Um regime ou estado i recorrente sse, depois de o processo se iniciar em i, a probabilidade
de retornar a i, ao m de algum tempo nito, igual a um. Se o contvel e se todos os estados
comunicam, ento todos os estados so recorrentes ou transientes (Taylor e Karlin, 1984).
20
O caso innito adapta-se facilmente.
Tem-se,
_
_
_
1
= 0.7
1
0.2
2
2
= 0.8
1
0.8
2
1

2
= 1
=
_
_
_
1
= 0.4
2
= 0.6
1

2
= 1.
_
j
11
1 j
11
1 j
22
j
22
_
, 0 < j
11
, j
22
< 1.
Pela proposio 7.5.1 fcil concluir que as probabilidades estacionrias so
dadas por
1
=
1 j
22
2 j
11
j
22
,
2
=
1 j
11
2 j
11
j
22
.
Retomando o exemplo 7.5.2, facilmente se obtm:
1
=
1 0.8
2 0.7 0.8
= 0.4,
2
=
1 0.7
2 0.7 0.8
= 0.6.
OBSERVAO 7.5.1. Um mtodo para determinar I
a
o seguinte. Como
se sabe, quando os vectores prprios de I so independentes verica-se I =
YAY
1
, onde Y a matriz dos vectores prprios de I e A a matriz diagonal
dos valores prprios. Ora se Y
1
vector prprio de I e `
1
o valor prprio
associado Y
1
, ento Y
1
ainda vector prprio de I
a
e `
a
1
o valor prprio
associado. Logo I
a
= YA
a
Y permite obter facilmente I
a
.
7.5.3. Modelos Markov-Switching. Seja j a varivel dependente. Um ex-
emplo de um modelo MS com dois regimes 1 = 1, 2 , por exemplo,
j
t
=
_
c
1
c
1
j
t1
o
1
-
t
se o
t
= 1
c
2
c
2
j
t1
o
2
-
t
se o
t
= 2
(7.35)
onde o
t
uma cadeia de Markov homognea (escondida ou latente por o
t
no ser
observvel) com matriz de probabilidades de transio
I =
_
j
11
j
12
j
21
j
22
_
.
Uma representao equivalente
j
t
= c
1
(c
2
c
1
) J
S
I
=2

_
c
1
(c
2
c
1
) J
S
I
=2
_
j
t1
_
o
1
(o
2
o
1
) J
S
I
=2t
_
-
t
.
Outra representao sugestiva:
j
t
= c (o
t
) c(o
t
) j
t1
o (o
t
) -
t
(7.36)
onde
c (o
t
) =
_
c
1
se o
t
= 1
c
2
se o
t
= 2
,
c(o
t
) =
_
c
1
se o
t
= 1
c
2
se o
t
= 2
, o (o
t
) =
_
o
1
se o
t
= 1
o
2
se o
t
= 2.
A representao (7.36) sugere que o modelo MS (7.35) pode ser escrito como um
processo AR(1) com coecientes aleatrios (vrios outros modelos no lineares
podem tambm ser representados como um AR(1) com coecientes aleatrios).
7.5.4. Funo densidade de probabilidade de j. Vamos caracterizar a fdp
) (j
t
[ T
t1
) que essencial no mbito da estimao, inferncia e previso.
Retome-se o modelo
j
t
=
_
c
1
c
1
j
t1
o
1
-
t
se o
t
= 1
c
2
c
2
j
t2
o
2
-
t
se o
t
= 2.
Se assumirmos -
t
~ (0, 1) ento as fdp condicionadas associadas aos regimes
1 e 2 ( = 2) so respectivamente
) (j
t
[ T
t1
, o
t
= 1) =
1
_
o
2
1
2
c
1
2
2
1
(j
I
c
1
1
j
I1
)
2
) (j
t
[ T
t1
, o
t
= 2) =
1
_
o
2
2
2
c
1
2
2
2
(j
I
c
2
2
j
I1
)
2
.
Como obter ) (j
t
[ T
t1
) Recordando a regra da probabilidade total
1 () =
i
1 ([ 1
i
) 1 (1
i
)
(ou )
a
(r) =

i
)
a[j
(r[ j
i
) )
j
(j
i
) no caso em que j uma v.a. discreta) tem-se
que fdp condicionada de j
) (j
t
[ T
t1
) = ) (j
t
[ T
t1
, o
t
= 1) 1 (o
t
= 1[ T
t1
)
) (j
t
[ T
t1
, o
t
= 2) 1 (o
t
= 2[ T
t1
)
=
_
o
2
1
2
_
12
c
1
2
2
1
(j
I
c
1
1
j
I1
)
2
1 (o
t
= 1[ T
t1
)
_
o
2
2
2
_
12
c
1
2
2
2
(j
I
c
2
2
j
I1
)
2
1 (o
t
= 2[ T
t1
) .
Se identicarmos, para simplicar, ) (j
t
[ T
t1
, o
t
= i) = )
it
tem-se
) (j
t
[ T
t1
) = )
1t
1 (o
t
= 1[ T
t1
) )
2t
1 (o
t
= 2[ T
t1
) .
Claro que 1 (o
t
= 1[ T
t1
) 1 (o
t
= 2[ T
t1
) = 1. interessante observar
que a fdp condicionada igual mdia ponderada das fdp condicionadas asso-
ciadas aos vrios regimes. Os ponderadores so naturalmente 1 (o
t
= 1[ T
t1
)
e 1 (o
t
= 1[ T
t1
) (e somam 1). Por exemplo, se num determinado momento,
1 (o
t
= 1[ T
t1
) muito alto (perto de 1) a funo ) (j
t
[ T
t1
) depender sobre-
tudo de )
1t
e pouco de )
2t
.
No caso geral com regimes, a expresso da fdp
) (j
t
[ T
t1
) =
.
i=1
)
it
1 (o
t
= i[ T
t1
) . (7.37)
7.5.5. Probabilidades Associadas aos Regimes. A expresso (7.37) envolve
as probabilidades 1 (o
t
= i[ T
t1
) , i = 1, 2, ..., que so necessrio caracteri-
zar.
7.5.5.1. Regimes Independentes. No caso mais simples em que o
t
uma
sucesso de v.a. independentes (no s dos seus valores passados e futuros como
tambm de T
t1
) tem-se
1 (o
t
= i[ T
t1
) = 1 (o
t
= i) = j
i
(7.38)
e, portanto,
) (j
t
[ T
t1
) =
.
i=1
)
it
j
i
.
Esta hiptese conhecida pelo menos desde 1972 com os trabalhos de Goldfeld e
Quandt, entre outros.
O caso de regimes independentes um caso particular da cadeia de Markov.
Notando que
1 (o
t
= i[ o
t1
= ,) = 1 (o
t
= i)
para qualquer i e , 1, conclui-se que este caso induz uma matriz de probabili-
dades de transio com colunas iguais,
I =
_
_
_
_
_
1 (o
t
= 1) 1 (o
t
= 2) 1 (o
t
= )
1 (o
t
= 1) 1 (o
t
= 2) 1 (o
t
= )
.
.
.
.
.
.
.
.
.
.
.
.
1 (o
t
= 1) 1 (o
t
= 2) 1 (o
t
= )
_
_
_
_
_
.
A probabilidade de atingir, por exemplo, o regime 1 sempre igual a 1 (o
t
= 1)
no importando o regime em que o se encontre no perodo anterior (ou seja, o
evento o
t
= 1 independente de o
t1
).
7.5.5.2. Regimes Seguem uma Cadeia de Markov. Sob esta hiptese, o
t
dado
o
t1
, no depende de T
t1
. Isto ,
1 (o
t
= i[ o
t1
= ,, T
t1
) = 1 (o
t
= i[ o
t1
= ,) = j
)i
. (7.39)
Tem-se, pela regra da probabilidade total, com = 2
1 (o
t
= 1[ T
t1
) = 1 (o
t
= 1[ o
t1
= 1, T
t1
) 1 (o
t1
= 1[ T
t1
)
1 (o
t
= 1[ o
t1
= 2, T
t1
) 1 (o
t1
= 2[ T
t1
)
= 1 (o
t
= 1[ o
t1
= 1) 1 (o
t1
= 1[ T
t1
)
1 (o
t
= 1[ o
t1
= 2) 1 (o
t1
= 2[ T
t1
)
= j
11
1 (o
t1
= 1[ T
t1
) j
21
1 (o
t1
= 2[ T
t1
) .
De uma forma geral,
1 (o
t
= i[ T
t1
) =
.
)=1
j
)1
1 (o
t1
= i[ T
t1
) (7.40)
Estas expresses envolvem uma estrutura recursiva que iremos expor a seguir.
Tendo em conta a expresso (7.40), calcule-se 1 (o
t1
= i[ T
t1
) . Observe-se,
em primeiro lugar, que
1 (o
t1
= 1[ T
t1
) = 1 (o
t1
= 1[ j
t1
, T
t2
) =
q (j
t1
, o
t1
= 1[ T
t2
)
) (j
t1
[ T
t2
)
.
A primeira igualdade verica-se por denio. A segunda envolve a regra
1 ([ 1, C) = 1 (, 1[ C) ,1 (1[ C) ,
sendo q a funo de probabilidade conjunta de (j
t1
, o
t1
) . Tem-se assim, pela
regra das probabilidades totais (com = 2)
1 (o
t1
= 1[ T
t1
) =
q (j
t1
, o
t1
= 1[ T
t2
)
) (j
t1
[ T
t2
)
=
) (j
t1
[ T
t2
, o
t1
= 1) 1 (o
t1
= 1[ T
t2
)
.
)=1
) (j
t1
[ T
t2
, o
t1
= ,) 1 (o
t1
= ,[ T
t2
)
. (7.41)
Para simplicar, dena-se
j
it
= 1 (o
t
= i[ T
t1
)
j
i,t1
= 1 (o
t1
= i[ T
t2
)
)
i,t1
= ) (j
t1
[ T
t2
, o
t1
= i) .
Em suma, com = 2, a expresso da fdp
) (j
t
[ T
t1
) = )
1t
j
1t
)
2t
j
2t
= )
1t
j
1t
)
2t
(1 j
1t
)
onde
j
1t
= j
11
1 (o
t1
= 1[ T
t1
) j
21
1 (o
t1
= 2[ T
t1
)
= j
11
1 (o
t1
= 1[ T
t1
) j
21
(1 1 (o
t1
= 1[ T
t1
))
= j
11
)
1,t1
j
1,t1
)
1,t1
j
1,t1
)
2,t1
(1 j
1,t1
)
(7.42a)
j
21
_
1
)
1,t1
j
1,t1
)
1,t1
j
1,t1
)
2,t1
(1 j
1,t1
)
_
. (7.42b)
Observe-se a estrutura recursiva: dadas as condies iniciais
)
1,0
, )
2,0
e j
1,0
,
obtm-se (para t = 1) j
1,1
e depois ) (j
1
[ T
0
) . Com os valores
)
1,1
, )
2,1
e j
1,1
obtm-se (para t = 2) j
1,2
e depois ) (j
2
[ T
1
) . O procedimento recursivo
repetido at se obter ) (j
a
[ T
a1
) .
7.5.5.3. Regimes dependentes de o
t1
e de T
t1
. Assume-se para simplicar
= 2. Sob esta hiptese a cadeia de Markov no homognea (varia ao longo do
tempo). Desta forma, as probabilidades
1 (o
t
= 1[ o
t1
= 1, T
t1
) e 1 (o
t
= 2[ o
t1
= 2, T
t1
)
dependem de T
t1
. Suponha-se, para simplicar, que estas probabilidades depen-
dem apenas de j
t1
. Uma forma de relacionarmos as probabilidades com j
t1
consiste, por exemplo, em formular uma representao probit para as probabili-
dades:
1 (o
t
= 1[ o
t1
= 1, T
t1
) = 1(c
0
c
1
j
t1
) ,
1 (o
t
= 2[ o
t1
= 2, T
t1
) = 1(,
0
,
1
j
t1
)
onde 1 a funo de distribuio normal (como usual na representao probit).
A matriz de probabilidades de transio agora
1
t
=
_
j
11t
j
12t
j
21t
j
22t
_
=
_
1(c
0
c
1
j
t1
) 1 1(c
0
c
1
j
t1
)
1 1(,
0
,
1
j
t1
) 1(,
0
,
1
j
t1
)
_
Oprocedimento anterior (ponto Regimes Seguemuma Cadeia de Markov) mantm-
se vlido, havendo apenas que substituir j
i)
por j
i)t
.
7.5.5.4. Regimes dependentes apenas de T
t1
. Assume-se para simplicar
= 2. Sob esta hiptese, o
t
dado T
t1
, no depende de o
t1
. Por exemplo,
suponha-se que o
t
depende de j
t1
. Desta forma, a probabilidade 1 (o
t
= i[ T
t1
)
pode ser estimada no quadro do modelo probit ou logit. Considerando a represen-
tao probit, tem-se
1 (o
t
= 1[ T
t1
) = 1(,
0
,
1
j
t1
) . (7.43)
Esta hiptese, mais restritiva do que a precedente, simplica consideravel-
mente a calculatria j que a funo densidade de probabilidade condicional pode
agora expressar-se simplesmente na forma
) (j
t
[ T
t1
) =
2
i=1
)
it
1 (o
t
= i[ T
t1
)
= )
1t
1(,
0
,
1
j
t1
) )
2t
(1 1(,
0
,
1
j
t1
)) .
7.5.6. Estacionaridade. Considere-se
j
t
=
_
_
_
c
1
c
11
j
t1
... c
1j
j
tj
n
t
se o
t
= 1
...
c
.
c
.1
j
t1
... c
.j
j
tj
n
t
se o
t
=
(7.44)
onde n
t
um rudo branco e o uma cadeia de Markov estacionria com vector
de probabilidades estacionrias (
1
,
2
) . O modelo anterior pode escrever-se na
forma
j
t
= c (o
t
) c
1
(o
t
) j
t1
... c
j
(o
t
) j
tj
n
t
ou ainda na forma Markoviana
_
_
_
_
_
_
_
j
t
j
t1
j
t2
.
.
.
j
tj1
_
_
_
_
_
_
_
. .
y
I
=
_
_
_
_
_
_
_
c
1
(o
t
) c
2
(o
t
) c
j
(o
t
)
1 0 0
0 1 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0
_
_
_
_
_
_
_
. .
A
I
_
_
_
_
_
_
_
j
t1
j
t2
j
tS
.
.
.
j
tj
_
_
_
_
_
_
_
. .
y
I1
_
_
_
_
_
_
c (o
t
) n
t
0
0
0
0
_
_
_
_
_
_
. .
C
I
.
(7.45)
Stelzer (2009) estabelece a seguinte
PROPOSIO 7.5.2. Considere-se o processo (7.44) na representao (7.45) e
assuma-se: n um processo EE,
L
_
log
|A
0
|
_
< ,
L
_
log
|C
0
|
_
< e
= lim
ao
1, (: 1)
L
_
log
|A
0
A
1
...A
t
|
_
< 0.
Ento j EE. Alm disso, se A
t
um processo EE ento
L
_
log
|A
0
|
_
< 0
implica < 0.
PROPOSIO 7.5.3. Considere-se j
t
= c (o
t
) c
1
(o
t
) j
t1
n
t
com dois
regimes = 2. Sejam
1
e
2
as probabilidades estacionrias da cadeia de
Markov o. Se n
t
umprocesso EE comsegundo momento nito e [c
11
[
1
[c
21
[
2
<
1 ento j EE.
DEM. Considerando a norma Euclidiana e a desigualdade de Jensen, tem-se
L
_
log
|C
0
|
_
=
L
_
log
_
c
2
(o
t
) n
2
t
_
=
1
2
L
_
log
_
c
2
(o
t
) n
2
t
__
_
1
2
log
_
L
_
c
2
(o
t
)
_
L
_
n
2
t
__
< .
Como a cadeia de Markov estritamente estacionria (temdistribuio estacionria
= (
1
,
2
), segue-se que A
t
um processo EE, pelo que basta vericar
L
_
log
|A
0
|
_
< 0. No caso em anlise a matriz A
0
reduz-se ao elemento
A
0
= c
1
(o
t
) . Tem-se
log [c
1
(o
t
)[ =
_
log [c
11
[ o
t
= 1
log [c
21
[ o
t
= 2
e, portanto,
L
_
log
|A0|
_
=
L
(log [c
1
(o
t
)[)
= 1 (o
t
= 1) log [c
11
[ 1 (o
t
= 2) log [c
21
[
=
1
log [c
11
[
2
log [c
21
[
= log ([c
11
[
1
[c
21
[
2
) .
Segue-se que [c
11
[
1
[c
21
[
2
< 1 implica
L
_
log
|A0|
_
< 0.
j
t
=
_
2j
t1
n
t
se o
t
= 1
0.6j
t1
n
t
se o
t
= 2
1 =
_
0.1 0.0
0.2 0.8
_
(7.46)
onde n
t
um processo rudo branco. Um processo AR(1) com coeciente c = 2
no s no estacionrio como explosivo (tende para mais innito em tempo
nito). No entanto, j
t
EE. Com efeito, a partir de 1 obtm-se
1
= 0.1818 e
2
= 1
1
= 0.8182 (conferir a proposio 7.5.1 e o exemplo 7.5.3). Por outro
lado, invocando a proposio 7.5.3, tem-se [c
11
[
1
[c
21
[
2
= 2
0.1S1S
0.6
0.S1S2
=
0.746 < 1. Logo j EE. Este resultado interessante. De facto poderamos pen-
sar que o comportamento explosivo de j
t
no regime 1 implicaria um processo no
estacionrio. Isto no sucede porque a probabilidade do sistema estar num dado
momento no regime estvel relativamente elevada. O processo pode, episodica-
mente, entrar no regime 1 e atingir valores extremamente elevados, mas num in-
tervalo de tempo relativamente curto o process reentra no regime 2 com probabil-
idade elevda, e o valor do processo retorna ao intervalo dos valores moderados
do processo (diramos ao centro de gravidade da distribuio estacionria). A
gura apresenta uma trajectria simulado do processo.
FIGURA 7.23. Simulao de uma trajectria do processo (7.46)
onde n
t
~ (0, 1) (10000 observaes)
No contexto dos modelos MS com heterocedasticidade condicional, Bauwens
et al. (2006) o seguinte modelo
j
t
=
_
_
_
c
1
o
1t
-
t
se o
t
= 1
...
c
.
o
.t
-
t
se o
t
=
onde
o
2
it
= .
i
c
i
n
2
t1
,
i
o
2
t1
.
Supe-se ainda que a cadeia o
t
depende de j
t1
,
1 (o
t
= i[ T
t1
) = j
it
_
j
2
t1
_
, i = 1, 2, ...,
Sem perda de generalidade, seleccione-se o regime 1 como sendo o regime es-
tvel, c
1
,
1
< 1. Bauwens et al. (2006) estabelecem a
PROPOSIO 7.5.4. Suponha-se: (a) -
t
uma sucesso de v.a. i.i.d. de
mdia zero e varincia um, com funo de densidade contnua em R; (b) c
i
0,
,
i
0, para i = 1, 2, ..., ; (c) c
1
,
1
< 1 e (d) j
1t
_
j
2
t1
_
0 e j
it
_
j
2
t1
_
1
quando j
2
t1
. Ento j EE.
A proposio assegura que o processo retorna ao regime estvel sempre que j
t
tende a assumir valores muito altos (alnea d)).
No caso especial em que as probabilidades so constantes, j
it
=
i
, vlido a
seguinte
PROPOSIO 7.5.5. Suponham-se vericadas as condies (a) e (b) da proposio
anterior. Se
.
)=1
)
_
,
)
c
)
_
< 1
ento EE.
7.5.7. Estimao e Inferncia. Comece-se por analisar o modelo (7.35) e
seja o vector dos parmetros a estimar. Como habitualmente, o estimador de
mxima verosimilhana dado por
`
a
= aig max
a
t=1
|
t
() , onde
|
t
() = log ) (j
t
[ T
t1
; ) = log ()
1t
j
1t
)
2t
(1 j
1t
)) .
Se os regimes so independentes, j
1t
dado pela equao (7.38); se seguem uma
cadeia de Markov, j
1t
dada por (7.42a).
Pode-se mostrar:
_
:
_
`
0
_
o
_
0, 1 (
0
)
1
_
onde 1 (
0
) a matriz de informao de Fisher. Verica-se 1 (
0
) = (
0
) =
1(
0
) onde
() =
L
_
0
2
|
t
()
00
t
_
, 1() =
L
_
0|
t
()
0
0|
t
()
0
t
_
.
Estimadores consistentes de e 1 so
a
=
1
:
a
t=1
0
2
|
t
_
`
a
_
00
t
j
(
0
)
1
a
=
1
:
a
t=1
0|
t
_
`
a
_
0
0|
t
_
`
a
_
0
t
j
1(
0
) .
Os ensaios individuais para os parmetros da mdia e da varincia condicional
(GARCH) podem ser feitos como habitualmente. Isto , podem basear-se no resul-
tado
0
i,a
o
~ (0
i
,
ii
)
onde 0
i
o parmetro (escalar) i, e
ii
o elemento ii da matriz 1 (0
0
)
1
,:.
No ensaio, um regime versus dois regimes, H
0
: c
1
= c
2
, c
1
= c
2
, o
1
= o
2
,
H
1
: H
0
falsa, a situao similar ao do ensaio H
0
:
1
=
2
no contexto do
modelo TAR: os testes assimptticos habituais (rcio de verosimilhanas, Wald e
multiplicador de Lagrange) no podem ser empregues. Sob a hiptese nula (um
regime) vrios parmetros no so identicveis (o score com respeito a estes
parmetros identicamente nulo e a matriz informao de Fisher resulta singular).
Uma forma de lidar com este tipo de ensaio no standard proposto por Davies
(1987), que obtm um limite superior para o nvel de signicncia do teste rcio
de verosimilhana quando parmetros apenas so identicveis sob a hipteses
alternativa:
1 (sup11 11
cbc
) _ 1
_
2
q
11
cbc
_
\.11
(q1)2
cbc
. oxp11
cbc
2
q2
(q2)
.
(7.47)
onde I a funo gama, 11
cbc
= 2
_
log 1
1
a
log 1
0
a
_
e 1
1
a
e 1
0
a
so os valores da
funo de log-verosimilhana sob H
1
e H
0
, respectivamente. Se a funo o rcio
de verosimilhanas admite um mximo global ento \ = 2
_
11
cbc
. Os passos
para implementar o teste no contexto do modelo (7.35) so os seguintes:
(1) Estimar o modelo AR(1) e obter 1
0
a
;
(2) Estimar o MS (7.35) e obter 1
1
a
;
(3) Calcular 11
cbc
, 1
_
2
q
11
cbc
_
, \, etc.;
(4) Calcular o limite superior de 1 (sup11 11
cbc
) usando a expresso
(7.47).
Suponhamos que se obtm 1 (sup11 11
cbc
) _ 0.02. Ento rejeita-se H0
ao nvel de signicncia de 5% pois o verdadeiro valor-p inferior a 0.02. Supon-
hamos que 1 (sup11 11
cbc
) _ 0.06. Nada se pode concluir ao nvel de sig-
nicncia de 5% pois o verdadeiro valor-p pode ser 0.04 ou 0.055. Tudo o que
sabemos que inferior a 0.06.
Outro teste, designado por teste-J, proposto por Garcia e Perron (1996) e
baseia-se na signicncia estatstica do parmetro c (teste-t) da regresso
A
t
= (1 c)

A
(1)
t
c

A
(2)
t
-
t
onde

A
(1)
t
e

A
(2)
t
so os previsores dos modelos com um e dois regimes, respecti-
vamente (o teste generaliza-se imediatamente ao caso em que

A
(1)
t
o previsor do
modelo com menos regimes). Assim, a rejeio de H
0
: c = 0 mostra evidncia a
favor do modelo com mais regimes.
7.5.8. Previso. Suponha-se que j segue um modelo MS com dois regimes e
esto disponveis em : observaes de j, j
1
, j
2
, ..., j
a
. Usando, como previsor
para j
aI
a funo
L
(j
aI
[ T
a
) , tem-se
L
(j
aI
[ T
a
) =
L
(j
aI
[ T
a
, o
aI
= 1) 1 (o
aI
= 1[ T
a
)
L
(j
aI
[ T
a
, o
aI
= 2) 1 (o
aI
= 2[ T
a
)
onde
L
(j
aI
[ T
a
, o
aI
= i) , como j vimos, a mdia condicional do regime i
(no contexto do modelo (7.35) tem-se
L
(j
aI
[ T
a
, o
aI
= 1) =
L
(c
1
c
1
j
aI1
[ T
a
)).
A probabilidade 1 (o
aI
= i[ T
a
) depende da hiptese que se tem sobre o. Se ad-
mitirmos que o segue uma cadeia de Markov, vem
1 (o
aI
= 1[ T
a
) =
2
i=1
1 (o
aI
= 1, o
a
= i[ T
a
)
=
2
i=1
1 (o
aI
= 1[ o
a
= i, T
a
) 1 (o
a
= i[ T
a
)
=
2
i=1
1 (o
aI
= 1[ o
a
= i) 1 (o
a
= i[ T
a
) .
Tendo em conta (7.33), resulta
1 (o
aI
= ,[ o
a
= i) = 1
I
i,)
= elemento (i, ,) da matriz 1
I
.
Mean log-likelihood -1.07420
Number of cases 628
Covariance of the parameters computed by the following method:
QML covariance matrix
Parameters Estimates Std. err. Gradient
------------------------------------------------------------------
c 0.0764 0.0394 0.0000
fhi 0.9878 0.0091 0.0000
sigma 0.0355 0.0052 0.0000
FIGURA 7.24. Resultados da estimao do modelo (7.49)
Finalmente, tendo em conta a equao (7.41),
1 (o
a
= i[ T
a
) =
) (j
a
[ o
a
= i, T
a1
) 1 (o
a
= i[ T
a1
)
.
)=1
) (j
a
[ o
a
= ,, T
a1
) 1 (o
a
= ,[ T
a1
)
.
7.5.9. Aplicao. Analisa-se a taxa de juros FED fund
21
(EUA) no perodo
Julho de 1954 a Outubro de 2006 (628 observaes mensais).
A literatura dos modelos de taxas de juro (a um factor) sugere que a volatil-
idade da taxa de juro depende do nvel da taxa de juro. Um dos modelos mais
usados em matemtica nanceira (tempo contnuo) o processo CIR (devido a
Cox, Ingersoll e Ross):
dr
t
= , (t r
t
) dt o
_
r
t
d\
t
, ,, t, o 0 (7.48)
onde r
t
a taxa de juro spot instantnea e \ o chamado processo de Wiener. To-
dos os parmetros podem ser estimados consistente e ecientemente pelo mtodo
da mxima verosimilhana. A discretizao do processo (i.e. a passagem para um
processo em tempo discreto que aproximadamente traduz a dinmica de (7.48))
simplica a anlise (embora no caso presente no seja necessrio). A discretizao
pelo esquema de Euler (supondo para simplicar que o hiato entre duas obser-
vaes consecutivas, ^, constante e igual a um) conduz ao modelo,
r
t
= c cr
t1
o
_
r
t1
-
t
(7.49)
onde c = ,t, c = (1 ,). Esta discretizao de Euler envolveu a troca de dr
t
por r
t
r
t1
, dt por ^ = 1, e d\
t
por
_
^-
t
. Estas trocas representam apenas
aproximaes e envolvem, por isso, erros.
Resultados preliminares mostram que existe forte presena de heterocedasti-
cidade e que a sua dinmica compatvel com a que est subjacente ao modelo
(7.49).
Aestimao dos parmetros do modelo (7.49), pelo mtodo da mxima verosim-
ilhana, assumindo normalidade, conduziu aos resultados que se apresentam na
gura 7.24.
21
ocialmente designada por Federal funds effective rate, com maturidade overnight.
Mean log-likelihood -0.767141
Number of cases 628
Covariance of the parameters computed by the following method:
Inverse of computed Hessian
Parameters Estimates Std. err. Gradient
------------------------------------------------------------------
c1 0.0937 0.0508 0.0000
fhi1 0.9848 0.0077 0.0000
sigma1 0.5497 0.0183 0.0000
c2 0.2100 0.1357 0.0000
fhi2 0.9697 0.0157 0.0000
sigma2 0.0866 0.0093 0.0000
p11 0.9976 0.0024 0.0000
p22 0.9912 0.0083 0.0000
FIGURA 7.25. Resultados da estimao do modelo (7.49)
Vrios autores tm sugerido a existncia de diferentes dinmicas ou regimes
no comportamento da taxa de juro (veja-se, por exemplo, Gray, 1996). Concre-
tamente, argumenta-se o seguinte: quando as taxas de juro so altas (anos 80) a
volatilidade alta e o processo exibe reverso para uma mdia de longo prazo;
quando as taxas de juro so baixas, a volatilidade baixa e observa-se ausncia de
reverso para uma mdia. Este argumento sugere a existncia de dois regimes: um
regime de altas taxas de juro e alta volatilidade e um regime de baixas taxas de juro
e baixa volatilidade. Depois de vrios ensaios seleccionou-se o seguinte modelo:
j
t
=
_
c
1
c
1
j
t1
o
1
-
t
se o
t
= 1
c
2
c
2
j
t1
o
2
_
j
t1
-
t
se o
t
= 2
(7.50)
cujos resultados de estimao, pelo mtodo da mxima verosimilhana, assumindo
normalidade, esto apresentados na gura 7.25.
A gura 7.26 apresenta a sucesso das probabilidades estimadas
_
1 (o
t
= 1[ T
t1
) ; t = 2, ..., :
_
.
Recorde-se que 1 (o
t
= 1[ T
t1
) a probabilidade de j se encontrar no regime
1 no momento t, dado T
t1
. Podemos observar, a partir da gura 7.26, que o
processo j se encontrou, com alta probabilidade, no regime 1 durante as dcadas
de 80 e 90. Durante os anos 2003-2005 o processo encontrou-se, com alta prob-
abilidade no regime 2. Em 2006, o processo no est totalmente em nenhum dos
regimes.
FIGURA 7.26. Taxa de juro e probabilidades 1 (o
t
= 1[ T
t1
) estimadas
CAPTULO 8
Modelao da Heterocedasticidade Condicionada - Caso
Univariado
8.1. Introduo
Vimos no captulo 3 que fortes variaes dos retornos so normalmente seguidas
de fortes variaes dos retornos em ambos os sentidos, e que baixas variaes dos
retornos so normalmente seguidas de baixas variaes dos retornos, tambm, em
ambos os sentidos (veja-se, por exemplo, a gura 3.17). Este facto estilizado in-
dica muito claramente que a volatilidade no constante ao longo do tempo. Uma
forma mais subtil de mostrar que a volatilidade no constante consiste em con-
statar que a srie dos quadrados dos resduos (ou mesmo os quadrados dos retornos)
autocorrelacionada.
8.1.1. Por que razo a volatilidade no constante?
Uma parte da volatilidade pode ser relacionada com a especulao. Em
certos modelos distingue-se duas classes de investidores: investidores
racionais que empurram o preo dos activos na direco do valor fun-
damental ou intrnseco da empresa (normalmente formalizado como o
valor actual dos uxos nanceiros que o investidor espera vir a receber
no futuro), e especuladores que baseiam as suas decises em informaes
estatsticas geradas pelo mercado, como por exemplo, os preos passados
e o volume de transaces. Quando a proporo de especuladores alta e
os sinais de mercado so interpretados de forma anloga pela maior parte
dos especuladores, formam-se tendncias fortes de compra ou de venda
que se reectem no preo e na volatilidade.
Episdios de extrema volatilidade ocorrem quando uma bolha especula-
tiva rebenta, i.e., quando depois de um perodo considervel de cresci-
mento dos preos, sucede uma repentina e inesperada quebra do mercado.
Estas bolhas especulativas esto normalmente associadas a uma nova
tecnologia (por exemplo, o boom da electrnica nos anos 60, da biotec-
nologia nos anos 80 ou da internet no m dos anos 90) ou a um novo
negcio (mais uma vez o caso da internet no m dos anos 90). Gera-se
um ambiente de euforia em torno dos ttulos associados a uma certa tec-
nologia e/ou negcio e emerge um comportamento irracional de grupo
totalmente desligado do valor intrnseco dos ttulos.
Graves crises econmicas e polticas tambm explicam momentos de alta
volatilidade.
211
212 8. MODELAO DA HETEROCEDASTICIDADE CONDICIONADA - CASO UNIVARIADO
Uma outra explicao (em certa medida complementar com as prece-
dentes) relaciona a volatilidade com a chegada de informao aos mer-
cados. Suponha-se, num cenrio ideal ou hipottico, que o mercado est
em equilbrio (no h utuao dos preos). Quando chega informao
ao mercado os agentes reavaliam as suas carteiras (perante a nova infor-
mao, deixam de ser ptimas); tendero, por conseguinte, a vender
ou a comprar activos at que se atinja um novo equilbrio. A aco de
comprar e vender ttulos tende a alterar os preos. A hiptese crucial
a de que a informao no chega de forma homognea e contnua ao
mercado. Quando a chegada de informao reduzida e pouco rele-
vante os mercados tendero a exibir baixa volatilidade; pelo contrrio,
quando a informao intensa e relevante, podero ocorrer perodos de
forte volatilidade. A informao relevante aqui deve ser entendida como
a informao que, de alguma forma, afecta a rendibilidade dos activos.
Por exemplo, a libertao de notcias relacionadas com inao, taxas de
juro, PIB, etc., geralmente tm impacto sobre a volatilidade e sobre os
preos.
Omodelo que se apresenta a seguir procura replicar o fenmeno de volatilidade
no constante a partir do conceito de chegada de informao. Seja
t
o nmero
de notcias no dia t. Quando uma notcia chega ao mercado supe-se que existe
uma reviso do preo de um certo activo. Essa reviso traduz-se numa variao
do preo numa quantidade aleatria dada por -
i,t
(i = 1, ...,
t
). Se existir uma
notcia (relevante) num certo dia t, o logaritmo do preo no dia t representado
por log 1
t
= log 1
t1
j -
1,t
; se existirem duas notcias o modelo passa a
ser representado por log 1
t
= log 1
t1
j -
1,t
-
2,t
(e assim sucessivamente).
Assuma-se que -
i,t
; i = 1, 2, ...,
t
uma sucesso de v.a. i.i.d. comdistribuio
_
0, o
2
_
e independentes de
t
. Tem-se assim que o retorno do activo dado por
r
t
= j
.
I
i=1
-
i,t
. (8.1)
Resulta do modelo que a varincia de r
t
dado
t
no constante, pois
Vai (r
t
[
t
= :
t
) = :
t
o
2
(de acordo com este modelo, quanto maior o nmero de notcias que chegam
ao mercado, maior a volatilidade). razovel admitir-se uma distribuio de
Poisson de parmetro ` para a v.a.
t
, i.e.,
t
~ 1 (`
t
). Podemos ainda renar o
modelo, incorporando persistncia em
t
, i.e. permitindo que
t
seja alto (baixo)
sempre que
t1
alto (baixo). Por outras palavras, o volume de informao tende
a ser alto (baixo) em perodos seguidos. Nestas circunstncias, passa a assumir-se
t
~ 1 (`
t
) com `
t
=
t1
1 (o nmero mdio de notcias no dia t igual
ao nmero de informaes do perodo anterior mais uma unidade) (adiciona-se
uma unidade para evitar que `
t
= 0 para algum t). Na gura 8.1 representa-
se uma trajectria simulada de (8.1) para j = 0, o = 0.001 e
t
~ 1 (`
t
) ,
`
t
=
t1
1. Podemos observar que a trajectria simulada replica algumas das
caractersticas tpicas das sries nanceiras.
8.1. INTRODUO 213
-0.025
-0.02
-0.015
-0.01
-0.005
0
0.005
0.01
0.015
0.02
0.025
0.03
1 101 201 301 401 501 601 701 801 901
t
FIGURA 8.1. Simulao de uma trajectria de r
t
, assumindo j =
0, o = 0.001 e
t
~ 1 (`
t
) onde `
t
=
t1
1.
Retome-se a equao (8.1). Esta equao sugere a especicao
r
t
= j n
t
, n
t
= o
t
-
t
.
O essencial nesta equao a ideia de que n
t
tem varincia condicional o
2
t
no
constante. Suponha-se de agora em diante que o
2
t
T
t1
-mensurvel (i.e., o
2
t
depende apenas de variveis observadas no momento t 1)
1
.
8.1.2. Processos Multiplicativos. Considere-se n
t
= o
t
-
t
e as seguintes hipte-
ses:
H1 -
t
L
(-
t
) = 0 e Vai (-
t
) = 1;
H2 -
t
independente de n
tI
, / N;
H3 o
t
T
t1
mensurvel.
Tem-se:
L
(n
t
[ T
t1
) =
L
(o
t
-
t
[ T
t1
) = o
t L
(-
t
[ T
t1
) = 0
Vai (n
t
[ T
t1
) =
L
_
n
2
t
T
t1
_
=
L
_
o
2
t
-
2
t
T
t1
_
= o
2
t
L
_
-
2
t
T
t1
_
= o
2
t
.
Assim, processos multiplicativos do tipo n
t
= o
t
-
t
, com o
t
no constante, so
processos heterocedsticos (varincia no constante). Este tipo de modelos es-
to presentes na abordagem tradicional da heterocedasticidade. Por exemplo, se
.
t1
0 exgena e n
t
= c.
t1
-
t
, ento a expresso Vai (n
t
[ .
t1
) = c
2
.
2
t1
no constante.
Processos estocsticos com heterocedasticidade condicional (HC) (varincia
no constante ao longo do tempo) so tambm denidos a partir de um processo
multiplicativo do tipo n
t
= o
t
-
t
mas, comparativamente ao caso tradicional, a
forma como o
2
t
especicado varia substancialmente, como veremos a seguir.
1
No exemplo anterior, o
2
I
= n
I
o
2
no T
I1
-mensurvel.
Que funo especicar para o
t
ou o
2
t
Vimos que uma das caractersticas das
sries nanceiras exibir volatility clustering: fortes variaes so normalmente
seguidas de fortes variaes em ambos os sentidos, devendo ocorrer, portanto,
Coii
_
n
2
t1
, n
2
t
_
0. Suponha-se, por um momento que n
t
representa a srie -
nanceira. Portanto, se n
2
t1
um valor alto (baixo), em mdia, n
2
t
ser tambm um
valor alto (baixo). Nestas circunstncias, faz sentido escrever o seguinte modelo
para o
2
t
:
o
2
t
= . c
1
n
2
t1
, . 0, c
1
_ 0. (8.2)
Com efeito, tem-se esquematicamente:
n
2
t1
alto =o
2
t
alto =n
2
t
alto (recorde-se n
t
= o
t
-
t
).
No caso clssico de heterocedasticidade, a varincia depende da evoluo de
uma ou mais variveis exgenas, determinadas fora do modelo (.
t1
no exemplo
anterior); no modelo de HC, a volatilidade o
2
t
uma varivel aleatria funo de
choques aleatrios determinada dinamicamente, a partir do prprio modelo:
n
2
t1
o
2
t
n
2
t
o
2
t1
...
Se n
t
encarado como uma v.a. residual do modelo
j
t
= j
t
n
t
fcil ver que a heterocedasticidade denida em n
t
transmitida a j
t
:
Vai (j
t
[ T
t1
) =
L
_
(j
t
j
t
)
2
T
t1
_
= Vai (n
t
[ T
t1
) = o
2
t
.
8.1.3. Distribuies de Caudas Pesada. Uma caracterstica muito importante
dos modelos de HC o de implicar (sob certas condies) distribuies marginais
leptocrticas. Retome-se o modelo n
t
= o
t
-
t
sob as hipteses H1-H3. Admita-se
ainda que o choque aleatrio -
t
tem distribuio (0, 1) . Tem-se
L
(n
t
) = 0
Vai (n
t
) =
L
_
n
2
t
_
=
L
_
o
2
t
_
L
_
n
S
t
_
= 0 =:/nc:c:: = 0.
Mostre-se que a distribuio marginal de n leptocrtica. Para o efeito, calcule-se
o coeciente de kurtosis de n,
/
&
=
L
_
n
1
t
_
L
_
n
2
t
_
2
e verique-se que /
&
8. Ora
L
_
n
1
t
_
=
L
_
o
1
t
-
1
t
_
=
L
_
o
1
t
_
L
_
-
1
t
_
=
L
_
_
o
2
t
_
2
_
L
_
-
1
t
_
L
_
o
2
t
_
2
L
_
-
1
t
_
=
L
_
n
2
t
_
2
L
_
-
1
t
_
=
L
_
n
2
t
_
2
8
pelo que
/
&
=
L
_
n
1
t
_
L
_
n
2
t
_
2

L
_
n
2
t
_
2
8
L
_
n
2
t
_
2
= 8.
8.1. INTRODUO 215
Este resultado sugere que um modelo de HC pode ser adequado para modelar re-
tornos, pois acomoda uma das caractersticas mais importantes das sries nan-
ceiras que a dos retornos seguirem uma distribuio leptocrtica.
8.1.4. O papel da Mdia Condicional e o Modelo de Heterocedasticidade
Condicionada. Vimos que fortes variaes de j so normalmente seguidas de
fortes variaes em ambos os sentidos. Teoricamente, este efeito pode ser mod-
elado atravs da mdia condicional. Esta seria a situao ideal. Se a mdia condi-
cional modelasse este efeito, conseguiramos prever razoavelmente as variaes de
j e, nestas circunstncias, no s o erro n
t
= j
t
j
t
seria baixo como tambm
a volatilidade de j poderia ser baixa e mesmo constante ao longo do perodo. No
entanto, vimos que a mdia condicional geralmente uma componente muito fraca
do modelo (recorde-se a questo dos mercados ecientes). Isto , se considerarmos
o modelo j
t
= j
t
n
t
, a mdia condicional j
t
(representada, por exemplo, por um
AR ou MA), uma componente pouco explicativa do modelo. Assim, quando j
2
t

alto, n
2
t
tambm alto (porque a mdia condicional no acompanha as utuaes
de j
t
) e, consequentemente, espera-se que n
2
t
esteja fortemente correlacionado com
n
2
t1
.
8.1.5. Vantagens dos modelos de Heterocedasticidade Condicionada. Antes
do artigo seminal de Engle (1982) as dependncias temporais nos momentos su-
periores a um eram tratadas como simples rudo. Engle mostrou que as dependn-
cias temporais do segundo momento, podem explicar razoavelmente a evoluo da
volatilidade ao longo do tempo. A volatilidade condicional (doravante volatilidade)
da srie pode ser identicada com a varincia condicional, o
2
t
, ou, simplesmente,
com o
t
(em princpio, prefervel identicar a volatilidade com o
t
, pois o
t
est na
escala da varivel).
Iremos ver que os modelos de HC permitem:
modelar a volatilidade (e as covarincias condicionais, no caso multivari-
ado); como se sabe, a volatilidade uma varivel fundamental na anlise
do risco de mercado, na construo de portfolios dinmicos, na valoriza-
o de opes, etc.;
estimar de forma mais eciente os parmetros denidos na mdia condi-
cional (por exemplo, se um processo ARMA exibir heterocedasticidade
condicional, a estimao conjunta dos parmetros da mdia e dos parmet-
ros da varincia permite estimar ecientemente os parmetros da mdia);
estabelecer intervalos de conana correctos para j. Isto , se j exibe
HC e esta negligenciada, os intervalos de previso para j so incorrec-
tos. Observe-se, com efeito, que os intervalos de conana dependem da
varincia do erro de previso e o erro de previso depende (entre outros
aspectos) da varincia (condicional) da v.a. residual.
8.2. Modelo ARCH
Considere-se o seguinte modelo
j
t
= j
t
n
t
,
j
t
=
L
(j
t
[ T
t1
) mdia condicional
n
t
= o
t
-
t
Assumam-se as hipteses H1-H3.
DEFINIO 8.2.1. n
t
segue ummodelo ARCH(q) (ou temrepresentao ARCH(q))
se
n
t
= o
t
-
t
o
2
t
= . c
1
n
2
t1
... c
q
n
2
tq
, . 0, c
i
_ 0
importante constatar que o
2
t
T
t1
.
Como a volatilidade exibe forte dependncia temporal, raramente se consid-
era = 1. Discute-se a seguir esta questo atravs de um exerccio de simulao.
Na gura 8.2 apresenta-se as trajectrias simuladas para o retorno (r
t
) e o
t
con-
siderando diferentes valores para os parmetros c
i
. O modelo simulado
r
t
= n
t
, (j
t
= 0)
n
t
= o
t
-
t
, -
t
RB Gaussiano com varincia 1 (8.3)
o
2
t
= . c
1
n
2
t1
... c
S
n
2
tS
.
Em todos os casos . = 1. Na gura 8.2 tem-se:
Painel (a) ARCH(0) c
1
= ... = c
S
= 0;
Painel (b) ARCH(1) c
1
= 0.8, c
2
= ... = c
S
= 0;
Painel (c) ARCH(3) c
1
= 0.8, c
2
= 0.8, c
S
= 0.2, c
1
= ... = c
S
= 0;
Painel (d) ARCH(8) c
1
= 0.2, c
2
= ... = c
S
= 0.1
Na gura 8.2 os grcos que mais elmente reproduzemo fenmeno de volatil-
ity clustering (volatilidades altas (baixas) so geralmente seguidas por volatilidades
altas (baixas)) e exibem alguma persistncia no comportamento da volatilidade (tal
como vimos nos pontos 3.2.2 e 3.2.3), correspondem aos painis (c) e (d). A sim-
ulao sugere que mais apropriado em aplicaes empricas considerar-se um
elevado (no obstante, veremos adiante que problemtico estimar-se um modelo
com elevado).
8.2.1. Dois Primeiros Momentos de n
t
. Como -
t
independente de n
tI
,
/ N, segue-se que o
2
t
(que uma funo de n
tI
, / N) independente de -
t
.
Logo,
L
(n
t
) =
L
(o
t
-
t
) =
L
(o
t
)
L
(-
t
) = 0,
Vai (n
t
) =
L
_
n
2
t
_
=
L
_
o
2
t
-
2
t
_
=
L
_
o
2
t
_
L
_
-
2
t
_
=
L
_
o
2
t
_
. (8.4)
8.2. MODELO ARCH 217
Panel (a)
-4
-2
0
2
4
retornos
0
5
10
15
20
volatilidade
r(t) sigma(t)
Panel (b)
-15
-10
-5
0
5
10
15
retornos
0
5
10
15
20
volatilidade
r(t) sigma(t)
Panel (c)
-15
-10
-5
0
5
10
15
retornos
0
5
10
15
20
volatilidade
r(t) sigma(t)
Panel (d)
-30
-20
-10
0
10
20
30
retornos
0
5
10
15
20
volatilidade
r(t) sigma(t)
FIGURA 8.2. Simulao de 4 trajectrias ARCH de acordo com
o modelo (8.3).
Por outro lado, como n
t
uma diferena de martingala, pois
L
([n
t
[) < e
L
(n
t
[ T
t1
) = 0, resulta pela proposio 4.4.1, que n
t
no autocorrelacionado,
i.e. Cov (n
t
, n
tI
) = 0.
8.2.2. Representao AR de um ARCH. Vimos, j por vrias ocasies, que
existem dependncias no segundo momento do processo. A representao autore-
gressiva do processo ARCH mostra exactamente esse aspecto. Tem-se,
o
2
t
= . c
1
n
2
t1
n
2
t
o
2
t
= . c
1
n
2
t1
n
2
t
n
2
t
= . c
1
n
2
t1
n
2
t
o
2
t
. .
I
n
2
t
= . c
1
n
2
t1

t
Como
L
(
t
[ T
t1
) =
L
_
n
2
t
o
2
t
T
t1
_
=
L
_
n
2
t
T
t1
_
o
2
t
= 0, conclui-
se pela denio 4.4.3, que
t
(admitindo que
L
([
t
[) < ) uma diferena
de martingala e, portanto, um processo no autocorrelacionado (
L
(
t
) = 0 e
Cov (
t
,
tI
) = 0). Logo, tem-se o importante resultado: se n
t
segue um modelo
ARCH(1) ento n
2
t
segue um processo AR(1). Esquematicamente:
n
t
~ ARCH(1) =n
2
t
~ AR(1).
Assim, o processo n
2
t
autocorrelacionado (se c
1
0) e apresenta as caractersti-
cas bsicas de um processo AR(1). De igual forma se conclui:
n
t
~ ARCH(q) =n
2
t
~ AR().
8.2.3. Estacionaridade de Segunda Ordem do ARCH(q). Estude-se a ESO
de n. Vimos que
L
(n
t
) e Cov (n
t
, n
tI
) so nitos e no dependem de t; s falta
estudar Vai (n
t
). Em que condies Vai (n
t
) =
L
_
n
2
t
_
no depende de t e nita?
Considere-se o ARCH(1) na sua representao autoregressiva:
n
2
t
= . c
1
n
2
t1

t
, c
1
_ 0.
Da estrutura autoregressiva conclui-se que a condio [c
1
[ < 1 (ou equivalente-
mente: a raiz do polinmio AR (1 c
1
1) = 0 , em mdulo, superior a um)
implica
L
_
n
2
t
_
= o
2
< . Se adicionarmos a esta condio, a restrio c
1
_ 0, a
condio de ESO passa a ser simplesmente,
0 _ c
1
< 1.
Se n um processo ESO vem
L
_
n
2
t
_
= . c
1 L
_
n
2
t1
_
L
_
n
2
t
_
= . c
1 L
_
n
2
t
_
=
L
_
n
2
t
_
=
.
1 c
1
Considere-se agora o ARCH(q) na sua representao autoregressiva:
n
2
t
= . c
1
n
2
t1
... c
q
n
2
tq

t
, c
i
_ 0.
Da estrutura autoregressiva conclui-se que, se as razes do polinmio AR
(1 c
1
1 ... c
q
1
q
) = 0,
estiverem todas fora do circulo unitrio (complexo), ento
L
_
n
2
t
_
= o
2
< . Se
adicionarmos a esta condio, as restries c
i
_ 0, a condio de ESO simplica-
se e, pode-se provar, igual a
c
1
c
2
... c
q
< 1, (c
i
_ 0).
Neste caso, depois de algumas contas, obtm-se
Vai (n
t
) =
L
_
n
2
t
_
=
.
1 (c
1
c
2
... c
q
)
.
OBSERVAO 8.2.1. Embora a expresso Vai (n
t
[ T
t1
) seja varivel, Vai (n
t
)
constante. Assim: n
t
condicionalmente heterocedstico (heterocedasticidade
condicional) mas em termos no condicionais ou marginais, n
t
homoceds-
tico. De forma anloga, tambm num processo estacionrio, a mdia condi-
cional varivel e a no condicional constante. Por exemplo, num processo
AR(1) estacionrio, a mdia condicional varivel ao longo do tempo e dada por
j
t
= c cj
t1
; no entanto, a mdia marginal c, (1 c) constante.
FAC de u^2
-0.1
0
0.1
0.2
0.3
0.4
0.5
1 5 9 13 17 21 25 29
FACP de u^2
-0.1
0
0.1
0.2
0.3
0.4
0.5
1 5 9 13 17 21 25 29
FIGURA 8.3. Simulou-se (: = 000) um ARCH(q). Qual a or-
dem de
8.2.4. FACe FACP de umn
2
t
e Identicao do Processo ARCH(q). Suponha-
se que o momento de ordem quatro de n nito no depende de t. A FAC de n
2
t

dada por
j
I
_
n
2
_
= j
I
=
Cov
_
n
2
t
, n
2
tI
_
_
Vai
_
n
2
t
_
Vai
_
n
2
tI
_
, Vai
_
n
2
t
_
=
L
_
n
1
t
_
L
_
n
2
t
_
2
Vimos que se n
t
segue um ARCH(q), ento n
2
t
segue um AR(q). Assim, a FAC
e a FACP tericas de n
2
exibem o comportamento tpico de um AR:
(FAC) j
I
no se anula e j
I
0;
(FACP) c
II
=
_
no se anula se / = 1, 2, ...,
0 se / = 1, 2, ...
Em particular, tem-se num ARCH(1):
j
I
= c
I
1
, / _ 1
c
11
= c e c
II
= 0, / _ 2.
OBSERVAO 8.2.2. Num ARCH(1) o 4
c
momento existe se 8c
2
1
< 1 i.e. se
c
1
< 0.774 e esta condio , na prtica, um pouco severa.
Passos para a identicao da ordem q de um processo ARCH(q)
(1) Estima-se o modelo j
t
= j
t
n
t
supondo o
2
t
constante;
(2) Obtm-se os resduos n
t
= j
t
j
t
, t = 1, ..., :;
(3) Calcula-se n
2
t
, t = 1, ..., :;
(4) Calcula-se a FAC e a FACP de n
2
t
e identica-se a ordem .
Na gura 8.3 simulou-se um ARCH(q) com : = 000 observaes. Qual a
ordem de
8.2.5. Caractersticas da Distribuio Marginal de n
t
. Suponha-se que -
t
um rudo branco Gaussiano (0, 1) . Ento a distribuio condicional de n
t

_
0, o
2
_
, i.e., n
t
= o
t
-
t
[ T
t1
~
_
0, o
2
t
_
. Sob certas condies, a distribuio
marginal de n
t
, ) (n
t
), dada pela expresso
) (n
t
) = lim
co
) (n
t
[ T
c
) .
Como na prtica no se consegue obter a expresso para o limite anterior, )
geralmente desconhecida; podemos ainda assim investigar algumas propriedades
de ) calculando alguns momentos:
L
(n
t
) = 0
Vai (n
t
) =
L
_
n
2
t
_
=
.
1 (c
1
... c
q
)
L
_
n
S
t
_
= 0 =:/nc:c:: = 0
/
&
=
L
_
n
1
t
_
L
_
n
2
t
_
2
/
.
= 8 (j vimos).
Tem-se a seguinte importante concluso: /
&
_ /
.
. A distribuio de n tem caudas
mais pesadas do que a distribuio de -. Se, como habitualmente, se assumir -
t
~
(0, 1) , ento a distribuio marginal de n leptocrtica! Note-se, em esquema:
n
t
[ T
t1
= o
t
-
t
[ T
t1
~
_
0, o
2
t
_
=n
t
~ 1i:t.1cjtoc nrtica.
Podemos obter uma expresso exacta para /
&
. Por exemplo, suponha-se n
t
~
ARCH(1), -
t
i.i.d.
~ (0, 1) e 8c
2
1
< 1. Deixa-se como exerccio mostrar que
L
_
n
1
t
_
= 8
L
_
o
1
t
_
,
L
_
o
1
t
_
=
.
2
(1 c
1
)
(1 c
1
)
_
1 8c
2
1
_,
/
&
=
L
_
n
1
t
_
L
_
n
2
t
_
2
=
8
_
1 c
2
1
_
1 8c
2
1
= 8
6c
2
1
1 8c
2
1
8.
Vimos que a distribuio de n tem caudas mais pesadas do que a distribuio
de -. A proposio seguinte caracteriza as caudas da distribuio marginal.
PROPOSIO 8.2.1. Seja n
t
= o
t
-
t
onde -
t
um rudo branco Gaussiano
(0, 1) e o
2
t
= . c
1
n
2
t1
. Suponha-se c
1
(0, 2c
) onde a constante de
Euler, 0.772. Seja i 0 a soluo nica da equao
c
i
1
L
_
7
2i
_
= 1 =
(2c
1
)
i
_
I
_
i
1
2
_
= 1 (8.5)
onde I a funo Gama e 7 ~ (0, 1) . Ento quando r , a probabilidade
1 (n
t
r) converge para
c
2
r
2i
, c 0.
A proposio 8.2.1 basicamente estabelece que as abas da fdp ) (r) de n
t
tm
caudas de Pareto (i.e., para r sucientemente grande 1 (n
t
r) - como funo
de r - e ) (r) apresentam um decaimento polinomial). Este resultado est de
acordo com os factos estilizados analisados no captulo 3. interessante vericar,
mais uma vez, que embora a distribuio condicional seja normal a distribuio
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
0
5
10
15
20
25
alfa 1
kurtosis
FIGURA 8.4. Valor de kurtosis como funo do parmetro c
1
,
associada a um ARCH(1)
marginal leptocrtica e apresenta caudas pesadas (light-value input causes heavy-
tailed output). O parmetro i obtm-se da resoluo da equao (8.5). No h, no
entanto, uma soluo explcita para i (em funo de c
1
) - a equao (8.5) deve
resolver-se numericamente.
Algumas concluses:
Embora n
t
seja um processo no autocorrelacionado, n
t
no uma
sucesso de variveis independentes (basta observar, por exemplo,
L
_
n
2
t
n
2
t1
_
,= 0 ou que
L
_
n
2
t
T
t1
_
depende de n
2
t1
);
Mesmo que n
t
seja condicionalmente Gaussiano a distribuio marginal
no Gaussiana. Em particular, se n
t
condicionalmente Gaussiano
ento a distribuio marginal leptocrtica.
8.2.6. Momentos e Distribuio de j. Seja
j
t
= j
t
n
t
n
t
= o
t
-
t
(assumem-se as hipteses habituais para -
t
). Deixa-se como exerccio vericar
que:
L
(j
t
[ T
t1
) = j
t
;
Vai (j
t
[ T
t1
) = o
2
t
;
Se -
t
Gaussiano ento j
t
[ T
t1
~
_
j
t
, o
2
t
_
;
L
(j
t
) =
L
(j
t
) ;
Vai (j
t
) = Vai (
L
(j
t
[ T
t1
))
L
(Vai (j
t
[ T
t1
)) = Vai (j
t
)
L
_
o
2
t
_
.
Retorno B
-4
-3
-2
-1
0
1
2
3
4
t
Retorno A
-4
-3
-2
-1
0
1
2
3
4
t
FIGURA 8.5. Qual o retorno mais voltil?
8.2.7. Volatilidade: Denies. A volatilidade condicional no momento t
(= o
t
) uma medida da magnitude das variaes (ou utuaes) no explicadas
dos preos no momento t. No entanto, como j
t
quase sempre uma componente
pouco explicativa de j (i.e. j
t
- 0, pelo menos para dados de frequncia alta
- dados semanais ou dirios) podemos dizer (sem grande margem de erro) que a
volatilidade condicional uma medida da magnitude das variaes (ou utuaes)
dos preos no momento t. Esta a denio usual de volatilidade do ponto de vista
das instituies nanceiras:
[. . . ] practitioners often refer to the termvolatility when speak-
ing of movements in nancial prices and rates. RiskMetrics
Um ttulo A pode exibir, comparativamente a um outro ttulo B, maior volatil-
idade condicional em certos momentos do tempo mas, globalmente A pode ser
menos voltil do que B. Nas guras 8.5 o retorno A exibe episdios de grande
volatilidade, mas B (globalmente) mais voltil (i.e. considerando o perodo todo).
Denimos volatilidade no condicional (ou marginal) como uma medida da
magnitude das variaes (ou utuaes) dos preos num hiato de tempo (meses ou
anos) (que no so explicadas). Pode ser medida atravs da estatstica
Vai (n
t
) =
a
t=1
n
t
2
:
.
ou se j
t
~ ARCH()
Vai (n
t
) =
.
1 ( c
1
... c
q
)
, (c
1
c
2
... c
q
< 1).
No exemplo acima, a volatilidade marginal de B maior do que a de A, embora B
exiba volatilidade constante.
8.3. Modelo GARCH
Tendo em conta a forte dependncia temporal da volatilidade, era usual, nas
primeiras aplicaes, considerar-se um ARCH de ordem elevada. Um ARCH
8.3. MODELO GARCH 223
de ordem elevada levanta problemas de estimao (mais concretamente, de con-
vergncia dos algoritmos de optimizao) e, no raras vezes obtm-se mximos
locais (e no globais, como desejvel). Como consequncia, alguns das estimati-
vas dos parmetros podem vir desprovidos de signicado (por exemplo, podem vir
negativos)
2
. Para superar este problema, foram tentadas vrias solues (a maio-
ria ad-hoc e sem muita relevncia). Contudo, a melhor soluo apareceu com o
modelo GARCH. Veremos adiante este aspecto.
DEFINIO 8.3.1. n
t
segue um modelo GARCH(p,q) (on tem representao
GARCH(p,q)) se
n
t
= o
t
-
t
o
2
t
= . c
1
n
2
t1
... c
q
n
2
tq
,
1
o
2
t1
.. ,
j
o
2
tj
. 0, c
i
_ 0, , _ 0 (ver no entanto a observao 8.3.1).
Surpreendentemente, o modelo mais simples GARCH(1,1), o
2
t
= .c
1
n
2
t1
,
1
o
2
t1
, veio a revelar-se suciente em muitas aplicaes.
8.3.1. GARCH(p,q) representa umARCH(). Considere-se o GARCH(p,q):
o
2
t
= . c
1
n
2
t1
... c
q
n
2
tq
,
1
o
2
t1
... ,
j
o
2
tj
o
2
t
= . (c
1
1 ... c
q
1
q
)
. .
(1)
n
2
t

_
,
1
1 ... ,
j
1
1
_
. .
1(1)
o
2
t
(1 1(1)) o
2
t
= . (1) n
2
t
.
Assim,
(1 1(1)) o
2
t
= . (1) n
2
t
o
2
t
=
.
1 1(1)

(1)
1 1(1)
n
2
t
=
.
1 1(1)
1(1) n
2
t
o
2
t
=
.
1 1(1)

_
d
1
1 d
2
1
2
...
_
n
2
t
=
.
1 1(1)

o
i=1
d
i
n
2
ti
.
Em suma, o modelo GARCH(p,q) pode ser representado como um ARCH():
o
2
t
=
.
1 ,
1
... ,
j
d
1
n
2
t1
d
2
n
2
t2
...
2
No mtodo dos mnimos quadrados (OLS) a estimao relativamente simples e imediata,
mesmo que o nmero de parmetros a estimar seja alto. Anal, o algoritmo de optimizao con-
verge numa nica iterao. J no mbito dos modelos ARCH a estimao mais complicada pois a
funo a minimizar altamente no linear e os estimadores no podem ser escritos atravs de uma
frmula fechada.
Os parmetros d
i
podem ser determinados pelo mtodo dos coecientes indetermi-
nados
3
ou a partir da frmula de Taylor (veja-se o exemplo seguinte).
EXEMPLO 8.3.1. Represente-se o GARCH(1,2) num ARCH(). Tem-se
o
2
t
= . c
1
n
2
t1
c
2
n
2
t2
,
1
o
2
t1
o
2
t
= .
_
c
1
1 c
2
1
2
_
. .
(1)
n
2
t
(,
1
1)
. .
1(1)
o
2
t
.
Assim, o GARCH(1,2) pode representar-se na forma
o
2
t
=
.
1 1(1)

(1)
1 1(1)
n
2
t
=
.
1 ,
1

c
1
1 c
2
1
2
1 ,
1
1
n
2
t
.
Podemos obter os primeiros termos do desenvolvimento em srie (de potncias de
1) de
c
1
1c
2
1
2
1o
1
1
no programa Mathematica atravs da instruo
Series[
c
1
1 c
2
1
2
1 ,
1
1
, L, 0, 7[.
O output do programa fornece:
c
1
1 c
2
1
2
1 ,
1
1
= c
1
1 (c
2
c
1
,
1
) 1
2
_
c
2
,
1
c
1
,
2
1
_
1
S
_
c
2
,
2
1
c
1
,
S
1
_
1
1
_
c
2
,
S
1
c
1
,
1
1
_
1
_
c
2
,
1
1
c
1
,
1
_
1
6
_
c
2
,
1
c
1
,
6
1
_
1
7
...
Assim,
d
1
= c
1
, d
2
= c
2
c
1
,
1
, d
S
= c
2
,
1
c
1
,
2
1
, ctc.
Em geral d
i
= ,
1
d
i1
, i = 8, 4...
OBSERVAO 8.3.1. A condio . 0, c
i
_ 0, , _ 0 certamente implica
o
2
t
0 mas no necessrio exigir tanto. Vimos atrs que o
2
t
=
.
11(1)

o
i=1
d
i
n
2
ti
. Logo, para se ter o
2
t
0 basta exigir
. 0 e d
i
_ 0, i = 1, 2, ...
Por exemplo, no GARCH(1,2) vimos:
d
1
= c
1
, d
2
= c
2
c
1
,
1
, d
i
= ,
1
d
i1
Assim, temos apenas de garantir
c
1
_ 0, ,
1
_ 0, c
2
_ c
1
,
1
(verique que os valores c
1
= 0.2, c
2
= 0.0, ,
1
= 0. so admissveis).
3
Considere-se
(1)
1 1(1)
= 1(1)
c
1
1 c
2
1
2
... c
q
1
q
1 ,
1
1 ... ,
1
T
= d
1
1 d
2
1
2
...
c
1
1 c
2
1
2
... c
q
1
q
=
_
d
1
1 d
2
1
2
...
_
_
1 ,
1
1 ... ,
1
T
_
.
A partir da ltima equao igualam-se os coecientes homlogos e resolvem-se as igualdades obtidas
em ordem a d
.
.
8.3. MODELO GARCH 225
8.3.2. Representao ARMA de um GARCH. Para simplicar considere-
se o GARCH(1,1): o
2
t
= . c
1
n
2
t1
,
1
o
2
t1
. Some-se a ambos os termos a
varivel n
2
t
:
n
2
t
o
2
t
= . c
1
n
2
t1
n
2
t
,
1
o
2
t1
,
isole-se n
2
t
no lado esquerdo da equao e simplique-se a equao at se obter o
ARMA implcito:
n
2
t
= . c
1
n
2
t1
,
1
o
2
t1
n
2
t
o
2
t
. .
I
= . c
1
n
2
t1
,
1
o
2
t1
,
1
n
2
t1
,
1
n
2
t1

t
= . (c
1
,
1
) n
2
t1
,
1
_
n
2
t1
o
2
t1
_
. .
I1
t
= . (c
1
,
1
) n
2
t1
,
1
t1

t
.
Como
L
(
t
) = 0 e Cov (
t
,
tI
) = 0 conclui-se: n
2
t
~ 1'(1, 1). No caso
geral pode-se mostrar
n
t
~ GARCH(p,q) =n
2
t
~ ARMA(max j, , j).
Por exemplo,
n
t
~ GARCH(1,2) =n
2
t
~ ARMA(2,1)
n
t
~ GARCH(2,1) =n
2
t
~ ARMA(2,2)
n
t
~ GARCH(2,2) =n
2
t
~ ARMA(2,2)
Em geral problemtico identicar o GARCH a partir das FAC e FACP de n
2
t
. Por
duas razes: 1) o GARCH implica uma estrutura ARMA para n
2
t
e, como se sabe,
no ARMA, nenhuma das funes de autocorrelao (FAC ou FACP) nula a partir
de certa ordem em diante (e, esta caracterstica que facilita a identicao das
ordens do AR ou do MA, mas no do ARMA); 2) no existe uma correspondncia
perfeita entre as estruturas ARMA e GARCH (por exemplo, um ARMA(2,2) para
n
2
t
pode ser um GARCH(2,1) ou um GARCH(2,2) para n
t
). Quer isto dizer que
as funes de autocorrelao no so interessantes nesta fase? De forma alguma,
por duas razes: 1) se FAC e a FACP de n
2
t
no apresentarem coecientes sig-
nicativos ento no existe efeito ARCH; 2) a existncia de vrios coecientes de
autocorrelao e de autocorrelao parcial signicativos indcio forte da presena
de efeitos ARCH
4
.
Como regra geral, no devemos usar o ARCH; o GARCH prefervel. A
identicao das ordens j e do GARCH faz-se na fase da estimao.
Estacionaridade de Segunda Ordem num GARCH(p,q)
Como se sabe
L
(n
t
) = Cov (n
t
, n
tI
) = 0, \/ N. Assim, para discutir a
ESO do processo n, basta analisar
L
_
n
2
t
_
.
4
Coecientes de autocorrelao de &
2
I
estatisticamente signicativos podem ainda dever-se a
um erro de especicao do modelo (veremos isso adiante) ou presena de outros modelos no
lineares, como por exemplo, o modelo bilinear.
Vimos
n
t
~ GARCH(p,q) =n
2
t
~ ARMA(max j, , j).
De facto, pode-se mostrar
n
2
t
= .
q
i=1
c
i
n
2
ti

j
i=1
,
i
n
2
ti
i=1
,
i
ti

t
= .
nnxj,q
i=1
(c
i
,
i
) n
2
ti
i=1
,
i
ti

t
= . ((1) 1(1)) n
2
ti
(1 1(1))
t
.
Tem-se assim
(1 (1) 1(1)) n
2
t
= . (1 1(1))
t
.
AESOde n
t
depende das razes do polinmio autoregressivo, (1 (1) 1(1)).
Concretamente, para que se tenha
L
_
n
2
t
_
= o
2
< necessrio e suciente que
as razes do polinmio autoregressivo estejam fora do circulo unitrio. Se adi-
cionarmos a esta condio, as restries c
i
_ 0 e ,
i
_ 0, a condio de ESO
simplica-se e, pode-se provar, igual a
q
i=1
c
i

j
i=1
,
i
< 1.
8.4. Modelo IGARCH
DEFINIO 8.4.1. n
t
segue um modelo IGARCH(p,q) (on tem representao
IGARCH(p,q)) se
n
t
= o
t
-
t
o
2
t
= . c
1
n
2
t1
... c
q
n
2
tq
,
1
o
2
t1
.. ,
j
o
2
tj
e
q
i=1
c
i

j
i=1
,
i
= 1
i.e., a soma dos parmetros c
t
: e ,
t
: igual a um.
Vamos analisar apenas o IGARCH(1,1): o
2
t
= . c
1
n
2
t1
,
1
o
2
t1
, onde
c
1
,
1
= 1. A designao Integrated GARCH resulta do facto de n
2
t
possuir uma
raiz unitria:
n
2
t
= . (c
1
,
1
)
. .
1
n
2
t1
,
1
t1

t
n
2
t
= . n
2
t1
,
1
t1

t
(1 1) n
2
t
= . ,
1
t1

t
(logo n
2
t
um ARIMA(0,1,1)). Nestas condies n
t
no ESO. Durante al-
gum tempo pensou-se que n
t
seria tambm no estacionrio em sentido estrito.
Daniel Nelson mostrou que um IGARCH poderia ser estritamente estacionrio
8.4. MODELO IGARCH 227
(EE). Concretamente mostrou: 1) a condio necessria e suciente para que n
t
seja EE
5
L
_
log
_
,
1
c
1
-
2
t
__
< 0;
2) e que esta condio acaba por ser menos exigente que a condio de ESO, c
1

,
1
< 1.
Se
L
_
log
_
,
1
c
1
-
2
t
__
< 0, ento a distribuio conjunta de (n
1
, n
2
, ..., n
I
)
igual distribuio conjunta de (n
t
, n
t1
, ..., n
tI
) para todo o t e / e, em par-
ticular, as funes densidade de probabilidade so constantes no tempo ) (n
t
) =
) (n
c
) , \t, :; pode-se ainda mostrar que o
2
t
uma varivel aleatria limitada em
probabilidade (no tende para , como primeira vista poderamos pensar) e
o
2
t
j
o
2
(.) (o
2
(.) uma v.a.) (embora no exista o segundo momento).
Vrios estudos mostram que os testes assimptticos habituais permanecem vli-
dos
6
. Para assentar ideias, suponha-se -
t
~ (0, 1) . Ento:
se c
1
,
1
< 1 =n
t
ESO;
se c
1
,
1
< 1 vem, pela desigualdade de Jensen,
L
_
log
_
,
1
c
1
-
2
t
__
_ log
L
_
,
1
c
1
-
2
t
_
= log (,
1
c
1
) < 0
e, portanto, c
1
,
1
< 1 =log
L
_
,
1
c
1
-
2
t
_
< 0; isto , se o processo
ESO ento tambm EE;
pode-se provar que c
1
,
1
= 1 =
L
_
log
_
,
1
c
1
-
2
t
__
< 0 (este
valor esperado pode ser calculado de forma exacta
7
). Como referimos,
o processo IGARCH EE. A condio de ESO acaba por ser mais exi-
gente do que a condio de EE. Aprimeira exige a existncia do momento
de segunda ordem enquanto EE exige que toda a estrutura probabilstica
(leia-se funo de distribuio nita) seja estvel ao longo do tempo, in-
dependentemente dos momentos serem nitos ou no.
L
_
log
_
,
1
c
1
-
2
t
__
< 0 ,=c
1
,
1
< 1
A gura 8.6 mostra trs regies no espao dos parmetros (c
1
, ,
1
). Na regio
_
(c
1
, ,
1
) R
2
: c
1
,
1
< 1,
L
_
log
_
, c-
2
__
< 0
_
o processo n
t
ESO e EE. Na regio
_
(c
1
, ,
1
) R
2
: c
1
,
1
1,
L
_
log
_
, c-
2
__
< 0
_
o processo n
t
no ESO mas EE. Na regio
_
(c
1
, ,
1
) R
2
: c
1
,
1
1,
L
_
log
_
, c-
2
__
0
_
o processo n
t
no ESO nem EE.
5
Na proposio 7.3.5 e exemplo 7.3.13 aborda-se, do ponto de vista terico, esta questo.
6
Esta concluso contrasta com o processos integrados na mdia, por exemplo do tipo,
I
=
I1
-
I
que, como se sabe, no so nem estacionrios de segunda ordem nem estritamente esta-
cionrios e onde os testes habituais no so vlidos.
7
Com efeito, a varivel aleatria Z = log
_
,
1
c
1
-
2
_
tem distribuio conhecida. Por exem-
plo, basta fazer uma transformao de varivel e atender ao facto de -
2
~
2
(1)
.
( ) [ ] 0 log
1
2
1
1 1
< +
< +
t
E

( ) [ ] 0 log
1
2
1
1 1
< +
> +
t
E

( ) [ ] 0 log
1
2
1
1 1
> +
> +
t
E

1
1
1 3
FIGURA 8.6. Regies no espao dos parmetros (c
1
, ,
1
) onde o
processo n
t
E2O e EE
8.4.1. Persistncia na Varincia. Certos processos exibem reverso para a
mdia; outros no (e.g. RW). usual chamar a estes ltimos processos persistentes
no sentido emque choques nas inovaes exercemumefeito persistente no nvel do
processo. Na literatura, variam no s as denies de persistncia como tambm
as ferramentas estatsticas usadas para a avaliar.
Considere-se por exemplo o AR(1)
j
t
= j(1 c) cj
t1
-
t
, n
t
rudo branco
Uma medida de persistncia pode basear-se em c. Se c = 1 o processo per-
sistente. Se [c[ < 1 no persistente. Poderamos ainda discutir nveis de per-
sistncia (quanto mais perto c estiver de 1 maior a persistncia). Na gura
8.7 mostram-se 4 trajectrias simuladas de j
t
= j(1 c) cj
t1
-
t
, (-
t
rudo
branco Gaussiano) para j = 100, j
0
= 80. Apenas c varia (tudo o resto igual,
incluindo as inovaes -
t
). Consideram-se os casos c = 0.1, c = 0.8, c = 0.08 e
c = 1. Procura-se vericar a velocidade da reverso do processo face sua mdia
de longo prazo (no caso c = 1 no existe mdia de longo prazo) dada uma condio
inicial j
0
= 80 relativamente afastada da mdia de longo prazo. Isto , tende ou
no o processo rapidamente para a sua mdia de longo prazo? A gura mostra que
quanto maior o valor do parmetro c mais lenta a reverso e, portanto, maior
o nvel de persistncia.
Existem outras medidas de persistncia. Por exemplo a half-life o valor de /
tal que
L
(j
tI
j[ T
t
) _
1
2
(j
t
j) , (supondo j
t
j)
Suponha-se que em t existe um desvio de j face sua mdia de longo prazo igual
a j
t
j. Questo: quantos perodos so necessrios para que metade desse desvio
f hi = 0.8
80
85
90
95
100
105
110
115
120
1 26 51 76 101 126 151 176
f hi = 0.1
80
85
90
95
100
105
110
115
120
1 26 51 76 101 126 151 176
f hi = 1
70
80
90
100
110
120
1 26 51 76 101 126 151 176
f hi = 0.98
80
85
90
95
100
105
110
115
120
1 26 51 76 101 126 151 176
FIGURA 8.7. Persistncia e o processo AR(1)
seja eliminado (em mdia)? Ou, em quanto tempo o processo elimina metade do
desvio j
t
j A resposta /.
Para exemplicar, considere-se o processo AR(1), j
t
= cj
t1
n
t
(note-se,
j = 0). Como se viu atrs
L
(j
tI
[ T
t
) = c
I
j
t
.
Assim, a half-life o valor de / tal que c
I
j
t
=
1
2
j
t
. Logo
c
I
j
t
=
1
2
j
t
=/ =
log (1,2)
log c
.
Se temos dados dirios (t = 1 corresponde a uma dia) e, por exemplo, c = 0.8,
ento / = log (1,2) , log (0.8) = 8.1 o nmero de dias necessrios para que,
em mdia, metade do desvio de j face sua mdia de longo prazo seja eliminado.
Valores altos de / indicam maior persistncia (o processo demora mais tempo a
eliminar desvios face mdia de longo prazo e, neste caso, o processo exibe uma
reverso para a mdia mais lenta). No caso c 1 = / e o processo
persistente. Obviamente, se
L
(j
tI
[ T
t
) no converge quando / o processo
j persistente.
Tradicionalmente, o conceito de persistncia aplica-se mdia do processo.
Com o GARCH surgiu a ideia da persistncia em varincia. Choques na varincia
so rapidamente eliminados e o
2
t
tende rapidamente para
L
_
o
2
t
_
ou, pelo contrrio,
os choques tm um efeito duradouro na varincia?
Podemos tambm denir uma half-life para a varincia. Trata-se do valor de /
tal que
L
_
o
2
tI
o
2
T
t
_
_
1
2
_
o
2
t
o
2
_
(supondo o
2
t
o
2
)
onde o
2
=
L
_
o
2
t
_
. Para exemplicar, considere-se o GARCH(1,1). Vem o
2
=
., (1 c
1
,
1
) e
L
_
o
2
tI
o
2
T
t
_
= (c
1
,
1
)
I
_
o
2
t
o
2
_
(este resultado mostra-se no captulo da previso). Assim a half-life o valor de /
tal que (c
1
,
1
)
I
_
o
2
t
o
2
_
=
1
2
_
o
2
t
o
2
_
. Logo
(c
1
,
1
)
I
_
o
2
t
o
2
_
=
1
2
_
o
2
t
o
2
_
=/ =
log (1,2)
log (c
1
,
1
)
.
Quando c
1
,
1
tende para 1, / tende para mais innito e o processo persistente
na varincia (ou a volatilidade persistente).
Uma das diculdades na anlise dos processos GARCHemgeral, e dos IGARCH
em particular, o de que certos processos podem ser persistentes num certo modo
de convergncia e no ser num outro modo de convergncia. Pode-se provar que
os IGARCH, embora persistentes de acordo com a medida
L
_
o
2
tI
o
2
T
t
_
no
so persistentes no modo de convergncia designado quase certamente ou com
probabilidade 1 (como notmos o
2
t
q.c.
o
2
(.) , i.e. o
2
t
converge quase certa-
mente para uma varivel aleatria, apesar de
L
_
o
2
t
_
no existir).
Em muitas aplicaes empricas observa-se que a estimativa para c
1
,
1
se
encontra muito perto de um, sugerindo que a volatilidade pode ser persistente (forte
dependncia temporal) e que Vai (j
t
) pode no existir. Este facto est de acordo
com os factos estilizados discutido no captulo 3.
Um modelo estacionrio mas em que a volatilidade exibe memria longa o
FIGARCH (GARCH fraccionrio).
8.4.2. Alteraes de Estrutura e o IGARCH. Modelos aparentemente IGARCH
podem tambm dever-se a alteraes de estrutura (tal como processos aparente-
mente do tipo j
t
= j
t1
n
t
podem dever-se a alteraes de estrutura). Por
exemplo, considere-se a seguinte simulao de Monte Carlo:
j
t
= n
t
, n
t
= o
t
-
t
, t = 1, 2, ..., 1000
o
2
t
= . cn
2
t1
,o
2
t1
, (8.6)
c = 0.1, , = 0.6, . =
_
0. t = 1, 2, ..., 00
1. t = 01, 02, ..., 1000
Este modelo foi simulado 500 vezes. Na gura 8.8 representa-se uma das 500
trajectrias simuladas.
Em cada simulao (ou trajectria simulada) estimaram-se os parmetros. Em-
bora o modelo simulado no seja claramente um IGARCH (note-se que c , =
0.7), concluiu-se que:
-8
-6
-4
-2
0
2
4
6
8
10
1 101 201 301 401 501 601 701 801 901
FIGURA 8.8. Uma trajectria simulada de acordo com o modelo 8.6
em 83% das simulaes a soma dos parmetros c

, esteve acima de
0.99;
em 99.6% das simulaes a soma dos parmetros c

, esteve acima de
0.95;
em todos os casos c

, esteve acima de 0.9.
Este exerccio de simulao ilustra o impacto de alteraes de estrutura sobre
os coecientes c e ,. A mensagem clara: num aplicao emprica, se c

,
estiver prximo de um, convm vericar se o modelo subjacente de facto um
IGARCH ou, pelo contrrio, se existem alteraes de estrutura que causem um
falso IGARCH . No obstante, quer se verique c , = 1 ou o caso de . no ser
constante ao longo da amostra, o processo subjacente sempre no estacionrio de
segunda ordem. No primeiro caso a varincia no nita; no segundo no con-
stante. Quebras de estrutura ocorrem frequentemente quando o perodo de anlise
muito extenso. Nestes casos, ou se modela a quebra de estrutura (em princpio
a melhor estratgia) ou se encurta o perodo de observao (se os objectivos da
aplicao emprica assim o permitirem).
8.4.3. EWMA(Exponential Weighted Moving Averages). Considere-se a seguinte
estimativa para a volatilidade no momento t
o
2
t
(/) =
1
/
I
i=1
j
2
ti
=
1
/
_
j
2
t1
j
2
t2
... j
2
tI
_
(supomos
L
(j
t
[ T
t1
) = 0).
Na gura 8.9 mostram-se vrias estimativas da volatilidade do ndice Dow
Jones ao longo do perodo, baseadas no estimador o
2
(/) para diferentes valores
de / (e.g., Vol30 = o
2
t
(80) , Vol60 = o
2
t
(60) , etc.)
O estimador o
2
t
(/) levanta as seguintes questes e objeces:
0
0.0001
0.0002
0.0003
0.0004
0.0005
0.0006
0.0007
J
a
n
-
8
9
J
u
n
-
9
0
N
o
v
-
9
1
A
p
r
-
9
3
S
e
p
-
9
4
F
e
b
-
9
6
J
u
l
-
9
7
D
e
c
-
9
8
M
a
y
-
0
0
O
c
t
-
0
1
M
a
r
-
0
3
A
u
g
-
0
4
J
a
n
-
0
6
Vol30
Vol60
Vol120
Vol240
FIGURA 8.9. Estimativas da volatilidade do ndice Dow Jones ao
longo do perodo, baseadas no estimador o
2
(/) para diferentes
valores de / (e.g., Vol30 = o
2
t
(80) , Vol60 = o
2
t
(60) , etc.)
qual o melhor valor de /? um pouco arbitrria a escolha de /;
o estimador o
2
t
(/) implica que todas as observaes no perodo (t /, t 1)
tmo mesmo peso na determinao do valor de o
2
t
(/) . Por exemplo, com
o
2
t
(240) =
1
240
210
i=1
j
2
ti
=
1
240
_
j
2
t1
j
2
t2
... j
2
t210
_
todas as observaes tm um peso de 1/240. No entanto, seria prefervel
dar mais peso s observaes mais recentes;
o estimador o
2
t
(/) implica que todas as observaes fora do perodo
(t /, t 1) tmpeso zero. Como consequncia, pode suceder o seguinte.
Se na janela amostral (t /, t 1) existir uma observao extrema, a
volatilidade sobrestimada; quando essa observao sai da janela amostra,
a volatilidade estimada cai depois abruptamente.
O estimador Exponential Weighted Moving Averages (EWMA, proposto pela
J.P. Morgan) resolve algumas das fragilidades dos estimador acima descrito, dando
mais peso s observaes mais recentes:
o
2
t
= (1 `)
o
i=1
`
i1
j
2
ti
, 0 < ` < 1
= (1 `)
_
j
2
t1
`j
2
t2
`
2
j
2
tS
...
_
.
Quanto mais alto for `, mais peso o estimador d s observaes mais antigas (o
decrscimo dos ponderadores , no entanto, sempre exponencial).
Os ponderadores, .
i
= (1 `) `
i
, somam 1,
o
i=1
.
i
= (1 `)
_
1 ` `
2
...
_
= 1
8.5. MODELO CGARCH 233
(recorde-se a soma de uma progresso geomtrica). Por exemplo, com ` = 0.
vem
o
2
t
= (1 `)
_
j
2
t1
`j
2
t2
`
2
j
2
tS
...
_
= 0.
_
j
2
t1
0.j
2
t2
0.2j
2
tS
0.12j
2
t1
...
_
.
A expresso de o
2
t
pode ser reescrita de uma forma mais sugestiva. Notando que
o
2
t1
= (1 `)
_
j
2
t2
`j
2
tS
`
2
j
2
t1
...
_
temos
o
2
t
= (1 `) j
2
t1
ò
2
t1
. (8.7)
Qual a relao entre o IGARCH e o EWMA? Considere-se um processo j
com mdia condicional igual a zero e com especicao IGARCH(1,1): j
t
= n
t
,
n
t
= o
t
-
t
. Vem
o
2
t
= . c
1
n
2
t1
,
1
o
2
t1
, c
1
,
1
= 1
= . (1 ,
1
) j
2
t1
,
1
o
2
t1
.
Se . = 0 conclui-se que um IGARCH(1,1) corresponde ao modelo EWMA. As-
sim, o modelo EWMA um caso muito particular do IGARCH.
8.5. Modelo CGARCH
Considere-se o GARCH(1,1):
o
2
t
= . c
1
n
2
t1
,
1
o
2
t1
= . c
1
_
n
2
t1
o
2
_
,
1
_
o
2
t1
o
2
_
c
1
o
2
,
1
o
2
= o
2
(1 c
1
,
1
) c
1
o
2
,
1
o
2
c
1
_
n
2
t1
o
2
_
,
1
_
o
2
t1
o
2
_
= o
2
c
1
_
n
2
t1
o
2
_
,
1
_
o
2
t1
o
2
_
Esta equao relaciona o
2
t
com a respectiva mdia de longo prazo e mostra como
se processa a dinmica de ajustamento de o
2
t
face constante o
2
.
O Component GARCH model (CGARCH) permite representar:
o
2
t
=
t
c
1
_
n
2
t1
t1
_
,
1
_
o
2
t1
t1
_
(8.8)
t
= o
2
j
_
t1
o
2
_
c
_
n
2
t1
o
2
t1
_
onde o
2
=
L
_
o
2
t
_
. O ajustamento de curto prazo de o
2
t
faz-se agora em relao
v.a.
t
, a qual tende, no longo prazo, para o
2
. A primeira equao designada
de componente transitria e a segunda equao de componente de longo prazo. O
modelo CGARCH um GARCH(2,2) com restries sobre os parmetros. Com
efeito, substituindo
t
=
o
2
(1 j) c
_
n
2
t1
o
2
t1
_
(1 j1)
na equao (8.8) vem
o
2
t
=
o
2
(1 j) c
_
n
2
t1
o
2
t1
_
(1 j1)
c
1
_
n
2
t1
o
2
(1 j) c
_
n
2
t2
o
2
t2
_
(1 j1)
_
,
1
_
o
2
t1
o
2
(1 j) c
_
n
2
t2
o
2
t2
_
(1 j1)
_
= ... =
= (1 c
1
,
1
) (1 j) o
2
(c
1
c) n
2
t1
(c
1
j (c
1
,
1
) c) n
2
t2
(,
1
c j) o
2
t1
((c
1
,
1
) c ,
1
j) o
2
t2
.
Atendendo condio de ESO do GARCH(p,q) fcil concluir que o processo
CGARCH ESO sse
j (1 c
1
,
1
) c
1
,
1
< 1.
Nestas circunstncias,
Vai (n
t
) =
(1 c
1
,
1
) (1 j) o
2
1 (j (1 c
1
,
1
) c
1
,
1
)
= o
2
.
A principal vantagem do CGARCH est na interpretao da dinmica de ajusta-
mento, e no necessariamente no ajustamento da varincia (um GARCH(2,2), sem
restries nos parmetros, ajusta melhor, i.e., o valor da funo de verosimilhana
no decresce).
O caso c = 0 sugere a presena de um GARCH(1,1). Com efeito, se c = 0,
vem
t
= o
2
j
_
t1
o
2
_
. Para simplicar, suponha-se que
0
= o
2
. Se
c = 0 =
t
= o
2
(verique!). No caso
0
,= o
2
tem-se
t
o
2
(se [j[ < 1).
Esta convergncia determinstica (a velocidade de ajustamento depende de j).
Em qualquer dos casos (
0
= o
2
ou
0
,= o
2
), e supondo [j[ < 1, tem-se, ao
m de algum tempo, um ajustamento dinmico, de acordo com o modelo o
2
t
=
o
2
c
1
_
n
2
t1
o
2
_
,
1
_
o
2
t1
o
2
_
. Assim, o caso c = 0, sugere a presena
de um GARCH(1,1).
O parmetro j est associado reverso de
t
para o
2
. Quanto mais alto (mais
prximo de um) mais lenta a velocidade de reverso e, portanto, maior o nvel
de persistncia na varincia condicional. Note-se que a reverso de o
2
t
para o
2
feita atravs de
t
, i.e., o
2
t

t
o
2
.
8.6. Modelo GJR-GARCH
O modelo GJR-GARCH devido a Glosten, Jagannathan e Runkle. Uma das
caractersticas das sries de retornos de ttulos o Leverage Effect (i.e. momentos
de maior volatilidade so despoletados por variaes negativas nos preos). Vi-
mos no ponto 3.2.4 que este efeito pode ser detectado atravs da medida (naive)
Cov
_
j
2
t
, j
t1
_
< 0. Veremos agora uma forma bastante mais eciente de estimar
esse efeito. Comece-se por observar que o modelo ARCH/GARCH apenas detecta
8.6. MODELO GJR-GARCH 235
0
2
4
6
8
10
12
-4 -3 -2 -1 0 1 2 3 4
u(t-1)
V
o
l
(
t
)
NIC GARCH
GJR-GARCH
FIGURA 8.10. NIC GARCH e GJR-GARCH para c
1
= 0.2,
,
1
= 0., . = 0.1,
1
= 0.4
o chamado efeito magnitude. Isto , a volatilidade s responde magnitude do
valor de n
t
. Em esquema:
n
2
t1
= o
2
t
(efeito magnitude)
Para modelar o efeito assimtrico necessrio que a volatilidade responda assimet-
ricamente ao sinal de n
t
. Mais precisamente, a volatilidade deve aumentar mais
quando n
t
< 0 (m notcia) do que quando n
t
0 (boa notcia).
O modelo GJR-GARCH (assim como o EGARCH, AARCH, etc.) modela no
s o efeito magnitude como tambm o efeito assimtrico. A especicao mais
simples (suciente para um grande nmero de aplicaes)
o
2
t
= . c
1
n
2
t1
,
1
o
2
t1

1
n
2
t1
J
&
I1
<0
,
J
&
I1
<0
=
_
1 se n
t1
< 0
0 se n
t1
_ 0.
De acordo com o efeito assimtrico devemos esperar
1
0. Como que o
2
t
varia
como resposta a uma variao em n
t1
Uma forma de visualizar esta relao
consiste em xar o
2
t1
= o
2
(varincia marginal) e depois traar o
2
t
como funo
de n
t1
. Este grco designa-se por news impact curve (NIC). NIC portanto uma
funo de n
t1
. No caso GARCH, tem-se
1C (n
t1
) = . ,
1
o
2
c
1
n
2
t1
= co::t. c
1
n
2
t1
(8.9)
e, no caso do modelo GJR-GARCH, a NIC
1C (n
t1
) = . ,
1
o
2
c
1
n
2
t1

1
n
2
t1
J
&
I1
<0
(8.10)
= co::t. c
1
n
2
t1

1
n
2
t1
J
&
I1
<0
Por exemplo, admita-se c
1
= 0.2, ,
1
= 0., . = 0.1,
1
= 0.4. Para estes
valores as NIC (8.9) e (8.10) esto representadas na gura 8.10. Como seria de
esperar, a NIC associada ao modelo (8.10) assimtrica e aba esquerda mais in-
clinada, traduzindo o facto de que a volatilidade comparativamente maior quando
n
t1
< 0.
Para ensaiar o efeito assimtrico podemos considerar o ensaio H
0
:
1
= 0
(atravs, por exemplo, do teste de Wald). Pode-se provar que a condio de ESO
(no caso em que a distribuio de - simtrica) c
1

1
,2 ,
1
< 1. Nesta
circunstncias,
Vai (n
t
) =
L
_
o
2
t
_
=
.
1 (c
1

1
,2 ,
1
)
Este modelo designado por TGARCH no EVIEWS.
8.7. Modelo GARCH-M
A teoria nanceira postula uma relao entre rendimento esperado e o risco
associado. Em geral deve-se esperar que os activos com maior risco estejam asso-
ciados aos activos com maior rendimento.
j
t
= c `q
_
o
2
t
_
n
t
, n
t
= o
t
-
t
, o
2
t
= . c
1
n
2
t1
,
1
o
2
t1
.
Especicaes mais utilizadas:
q
_
o
2
t
_
= o
t
, q
_
o
2
t
_
= log o
t
Dada a estreita relao entre os parmetros da mdia e da varincia condicional,
um erro de especicao da varincia condicional afecta a consistncia dos esti-
madores dos parmetros da mdia condicional.
8.8. Modelo de Heterocedasticidade Condicionada com Variveis
Explicativas
Considere-se um modelo GARCH(1,1) (poderia ser outro modelo qualquer)
com variveis explicativas:
j
t
= j
t
n
t
n
t
= o
t
-
t
o
2
t
= . c
1
n
2
t1
,
1
o
2
t1
q (r
t
)
onde a funo q tal que o
2
t
0 (com probabilidade 1). Que variveis poderemos
considerar para r
t
Vejamos alguns exemplos:
Dias da semana (ou qualquer outro efeito de calendrio):
o
2
t
= . c
1
n
2
t1
,
1
o
2
t1
c
1
o
t
c
2
T
t
c
S
Q
o
t
c
Q
&
t
onde o
t
= 1 se t uma segunda-feira, etc. (dever ter-se .minc
i

0 =o
2
t
0).
Ocorrncia de factos, notcias signicativas. Por exemplo
8
,
o
2
t
= . c
1
n
2
t1
,
1
o
2
t1
c
1
qood
t
c
2
/ad
t
8
A chamada armadilha das variveis articiais no ocorre no exemplo (embora parea) pois
as notcias podem ser boas, ms ou simplesmente no ocorrerem (e, neste caso, vem jood
I
=
/od
I
= 0).
8.9. ESTIMAO 237
qood
t
=
_
1 t = so divulgados resultados da empresa ABC acima do esperado
0 0
/ad
t
=
_
1 t = so divulgados resultados da empresa ABC abaixo do esperado
0 0
Variao do preo do crude.
Medida de volatilidade de outro activo/mercado
Volume de transaces:
o
2
t
= . c
1
n
2
t1
,
1
o
2
t1
c
1
o|
+
t1
onde o|
+
t1
pode ser especicada como o|
+
t1
=
c|
I1
o
roI
ou o|
+
t1
=
log (o|
t1
) ou o|
+
t1
= o|
t1
,o|
t2
, sendo o| o volume de transaces.
Observe-se que o volume de transaces pode ser considerado como uma
varivel proxy da varivel no observada chegada de informao.
Qualquer outra varivel (estacionria) que supostamente afecte a volatil-
idade.
No ponto 7.5.9 vimos que o modelo em tempo discreto, compatvel com o
processo CIR, em tempo contnuo, dr
t
= , (t r
t
) dt o
_
r
t
d\
t
conduz ao
modelo,
r
t
= c cr
t1
n
t
n
t
= o
t
-
t
o
2
t
= o
2
r
t1
Inspirados nesta especicao, certos autores modelam a taxa de juro em tempo
discreto combinando as caractersticas do GARCHcomas caractersticas do processo
de difuso (modelo CIR):
r
t
= c cr
t1
n
t
n
t
= o
t
-
t
o
2
t
= . c
1
n
2
t1
,o
2
t1
r
t1
.
O ensaio H
0
: = 0 vs. H
1
: 0 permite analisar se a nvel da taxa de juro
inuencia positivamente a volatilidade. Geralmente conclui-se 0. A gura
8.11 sugere (claramente) 0.
8.9. Estimao
Seja j
t
= j
t
n
t
onde n
t
= o
t
-
t
. Suponha-se que v.a. -
t
tem distribuio
conhecida (normal, t-Student ou outra) de mdia zero e varincia um. O vector dos
parmetros desconhecidos, , envolve parmetros denidos na mdia condicional
e na varincia condicional.
A mdia condicional j
t
pode depender de uma varivel r
t
(esta varivel pode
ser encarada tambm como um vector de variveis explicativas). Por exemplo,
0
2
4
6
8
10
12
14
16
18
J
a
n
-
5
4
M
a
y
-
5
6
S
e
p
-
5
8
J
a
n
-
6
1
M
a
y
-
6
3
S
e
p
-
6
5
J
a
n
-
6
8
M
a
y
-
7
0
S
e
p
-
7
2
J
a
n
-
7
5
M
a
y
-
7
7
S
e
p
-
7
9
J
a
n
-
8
2
M
a
y
-
8
4
S
e
p
-
8
6
J
a
n
-
8
9
M
a
y
-
9
1
S
e
p
-
9
3
J
a
n
-
9
6
M
a
y
-
9
8
S
e
p
-
0
0
J
a
n
-
0
3
M
a
y
-
0
5
FIGURA 8.11. Taxa de Juro (Bilhetes do Tesouro a 3 meses -EUA)
podemos ter,
j
t
=
0

1
r
t
c
1
j
t1
n
t
n
t
= o
t
-
t
, -
t
~ (0, 1)
o
2
t
= . c
1
n
2
t1
= (
0
,
1
, c
1
, ., c
1
)
t
.
A estimao do vector poderia ser feita da seguinte forma (tome-se como refer-
ncia o modelo acima apresentado):
Passo 1: Estimao OLS de
0
,
1
e c
1
com base na equao j
t
=
0

1
r
t
c
1
j
t1
n
t
.
Passo 2: A partir do passo 1, obtm-se os resduos n
2
t
. Como o
2
t
= .
c
1
n
2
t1
implica uma representao AR(1) para o
2
t
= .c
1
n
2
t1
, ou seja,
n
2
t
= .c
1
n
2
t1
t
(vejam-se os pontos 8.2.2 e 8.3.2), os parmetros .
e c
1
estimam-se a partir da equao n
2
t
= .c
1
n
2
t1
t
, considerando
o estimador OLS.
O procedimento acima descrito envolve estimadores consistentes mas alta-
mente inecientes, pois em ambos os casos os erros das equaes so heteroceds-
ticos (no caso da estimao . e c
1
, a situao particularmente grave, pois, pode
mostra-se,
t
tende a exibir forte heterocedasticidade).
O mtodo de estimao mais utilizado o mtodo da mxima verosimilhana
(o GMM tambm pode ser utilizado) que se descreve a seguir.
8.9.1. Estimador de Mxima Verosimilhana. Assuma-se que todos os parmet-
ros de interesse, includos em , apenas aparecem na densidade conjunta condi-
cional ) (
a
[ A
a
; ) , onde
a
= (j
a
, j
a1
, ..., j
1
) e A
a
= (r
a
, r
a1
, ..., r
1
) .
Para simplicar a exposio, admite-se (semperda de generalidade) que as condies
8.9. ESTIMAO 239
iniciais
0
so conhecidas. Tem-se assim, que a densidade relevante, para a esti-
mao de , ) (
a
[
0
, A
a
; ) .
PROPOSIO 8.9.1. Se j
t
condicionalmente independente de (r
a
, ..., r
t1
)
(: t) dado (
t1
, A
t
), i.e.,
) (j
t
[
t1
, A
a
) = ) (j
t
[
t1
, A
t
) ,
ento
) (
a
[
0
, A
a
; ) = ) (j
a
[
a1
, A
a
; ) ) (j
a1
[
a2
, A
a1
; )
... ) (j
1
[
0
, r
1
; )
=
a
t=1
) (j
t
[
t1
, A
t
; ) (8.11)
DEM. (esboo) Tem-se
) (
a
[
0
, A
a
; ) = ) (j
a
[
a1
, A
a
; ) ) (
a1
[
0
, A
a
; )
. .
(+)
(8.12)
Desenvolva-se a expresso (*):
) (
a1
[
0
, A
a
; ) = ) (j
a1
[
a2
, A
a
; ) ) (
a2
[
0
, A
a
; )
= ) (j
a1
[
a2
, A
a1
; )
. .
por hiptese
) (
a2
[
0
, A
a
; )
. .
(+)
(8.13)
Desenvolva-se a nova expresso (*):
) (
a2
[
0
, A
a
; ) = ) (j
a2
[
aS
, A
a
; ) ) (
aS
[
0
, A
a
; )
= ) (j
a2
[
aS
, A
a2
; )
. .
por hiptese
) (
aS
[
0
, A
a
; )
. .
(+)
(8.14)
Anova expresso (*) pode ser desenvolvida de forma similar. Coligindo as equaes
(8.12)-(8.14), obtm-se (8.11).
A hiptese denida na proposio anterior, estabelece que j
t
no depende
dos valores futuros r
t1
, r
t2
dado J
t
=
t1
' A
t
ou, por outras palavras, r
t
dado A
t1
no depende de
t1
(ou ainda, j no causa Granger r). Doravante
assume-se esta hiptese.
A funo de verosimilhana (supondo que as condies iniciais
0
so dadas)
1
a
() = ) (
a
[
0
, A
a
; ) =
a
t=1
) (j
t
[ J
t
; ) (8.15)
onde J
t
=
t1
'A
t
(na prtica, se a ordem mxima do desfasamento das variveis
denidas na mdia condicional for j, dever ler-se no produtrio, t = j 1 e
no t = 1; para simplicar, continue a assumir-se t = 1).
O estimador de mxima verosimilhana , como habitualmente,
`
a
= aig max
log 1
a
() = aig max
log
a
t=1
) (j
t
[ J
t
; ) = aig max
t=1
log ) (j
t
[ J
t
; ) .
Sob certas hipteses, incluindo, (j
t
, r
t
) um processo estacionrio e fracamente
dependente, o estimador de mxima verosimilhana consistente e assimptotica-
mente eciente. A sua distribuio dada por
_
:
_
`
0
_
o
_
0, 1 (
0
)
1
_
onde 1 (
0
) a matriz de informao de Fisher. Verica-se 1 (
0
) = (
0
) =
1(
0
) onde
() =
L
_
0
2
|
t
()
00
t
_
, 1() =
L
_
0|
t
()
0
0|
t
()
0
t
_
|
t
() = log ) (j
t
[ J
t
; ) .
Sob certas condies, e 1 podem ser estimados consistentemente por
a
=
1
:
a
t=1
0
2
|
t
_
`
a
_
00
t
j
(
0
)
1
a
=
1
:
a
t=1
0|
t
_
`
a
_
0
0|
t
_
`
a
_
0
t
j
1(
0
) .
A aplicao do mtodo da mxima verosimilhana exige (em princpio) o con-
hecimento da fdp condicional de j
t
dado J
t
; ou seja, necessrio conhecer-se
) (j
t
[ J
t
) . Num modelo de heterocedasticidade condicional do tipo j
t
= j
t
n
t
onde n
t
= o
t
-
t
, a fdp ) resulta imediatamente da distribuio dos erros -. Por
exemplo, suponha-se -
t
i.i.o
~ (0, 1) . Logo,
n
t
[ J
t
= o
t
-
t
[ J
t
~
_
0, o
2
t
_
= j
t
[ J
t
~
_
j
t
, o
2
t
_
.
e, portanto,
log ) (j
t
[ J
t
; ) =
1
2
log (2)
1
2
log o
2
t
()
1
2o
2
t
()
(j
t
j
t
())
2
. (8.16)
Implementao no programa EVIEWS
Considere-se, a ttulo de exemplo, o modelo
j
t
=
0

1
r
t
c
1
j
t1
n
t
n
t
= o
t
-
t
, -
t
~ (0, 1)
o
2
t
= . c
1
n
2
t1
c
1
n
2
t2
,
1
o
2
t1
c
0
:cq
t
co|n:c
t1
onde :cq
t
uma varivel dummy que assume 1 se t corresponde a uma segunda-
feira. Para estimar o modelo no EVIEWS, atravs do mtodo da mxima verosim-
ilhana, basta seleccionar estimate e depois ARCH"em method. Ver a gura
8.12.
Escolhendo 1 em Threshold order poderia estimar-se o GJR-GARCH.
Ecincia do Estimador de MV vs. Estimador OLS
8.9. ESTIMAO 241
FIGURA 8.12. Estimao do GARCH no EVIEWS
Considere-se o modelo de regresso linear
j
t
= x
t
t
n
t
, n
t
= -
t
o
t
, -
t
i.i.o
~ (0, 1)
onde x
t
t
=
_
1 r
1t
r
It
_
. Como n
t
no autocorrelacionado e mar-
ginalmente homocedstico resulta que o estimador OLS

a
= (X
t
X)
1
X
t
y
BLUE (best linear unbiased estimator). Signica que o melhor estimador? No.
O estimador de MV (no linear) para ,
`
a
, assimptoticamente mais eciente.
Pode-se provar que a matriz
Vai
_
a
_
Vai
_
`
a
_
semidenida positiva. Isto implica, em particular, que as varincias dos esti-
madores OLS so maiores ou iguais s correspondentes varincias dos estimadores
de mxima verosimilhana. Para conrmarmos esta ideia, simulou-se 1000 vezes
o modelo
j
t
= ,
1
,
2
r
t
n
t
, r
t
i.i.o
~ (0, 1) , t = 1, ..., 1000
,
1
= 10, ,
2
= ,
n
t
= -
t
o
t
, -
t
i.i.o
~ (0, 1)
o
2
t
= 0.0 0.2n
2
t1
0.7o
2
t1
Em cada simulao estimaram-se os ,
1
e ,
2
pelo mtodo OLS e pelo mtodo
da MV (usando este ltimo mtodo estimaram-se ainda os parmetros da varin-
cia condicional). Os resultados esto presentes na tabela 1. Por exemplo, o erro
,
1
,
2
(1) OLS (2) MV (1)/(2) (3) OLS (4) MV (3)/(4)
Erro Quad.Mdio 0.001 0.0006 1.667 0.0011 0.0006 1.833
TABELA 1. Ecincia do Estimador OLS vs. Estimador de MV
FIGURA 8.13. Distribuies do Estimadores OLS e de MV de ,
2
(obtidas a partir de uma simulao Monte Carlo)
quadrtico mdio do estimador OLS relativamente ao parmetro ,
1

1
1000
1000
i=1
_
,
(i)
1
10
_
2
e

,
(i)
1
a estimativa OLS para ,
1
obtida na i-sima simulao).
A tabela 1 sugere que o estimador ML substancialmente mais preciso do que
o estimador OLS. Com base nas 1000 estimativas OLS e de MV do parmetro
,
2
, apresenta-se na gura 8.13 as fdp estimadas (no parametricamente) dos esti-
madores OLS e de MV.
A gura 8.13 conrma a tabela 1: o estimador de MV mais eciente do que
o estimador OLS (i.e., mais preciso ou apresenta menor variabilidade). A gura
8.13 tambm sugere que ambos os estimadores so asimptoticamente centrados.
Prova-se (sob as condies usuais de regularidade) que o estimador de mx-
ima verosimilhana apresenta as propriedades habituais, isto , consistente, as-
simptoticamente eciente e tem distribuio assimpttica normal (como vimos). O
8.9. ESTIMAO 243
estimador OLS consistente para os parmetros da mdia condicional mas, como
vimos, no assimptoticamente eciente.
8.9.2. Estimador de Pseudo Mxima Verosimilhana. Na prtica, a dis-
tribuio de -
t
no conhecida. Podemos ainda assim supor, por exemplo, -
t
~
(0, 1) ou -
t
~ t (:)? A resposta armativa no seguinte sentido: mesmo que
a verdadeira distribuio seja desconhecida, podemos ainda assim trabalhar com
a hiptese -
t
~ (0, 1) ou -
t
~ t (:) e obter, sob certas condies, estimadores
consistentes. Seja
j
t
= j
t
(j
t1
, j
t2
, ..., r
t
, r
t1
, ...; ) n
t
n
t
= o
t
(n
t1
, n
t2
, ...; ) -
t
-
t
~ ?
Suponhamos que a verdadeira mas desconhecida fdp condicional de - ). O esti-
mador de mxima verosimilhana
`
a
= aig max
t=1
log ) (j
t
[ J
t
; )
no pode ser implementado, pois a funo ) desconhecida. O estimador de
pseudo mxima verosimilhana usa como pseudo verdadeira fdp a funo / (que
na generalidade dos casos diferente de )),
`
jn
a
= aig max
t=1
log /(j
t
[ r
t
, ...r
1
, j
t1
, j
t2
, ...j
1
; )
Sob certas condies, mesmo que / ,= ), o estimador de pseudo mxima verosim-
ilhana apresenta boas propriedades. As condies so:
/ pertence famlia das densidades exponenciais quadrticas (a normal e
a t-Student, entre muitas outras distribuies, pertencem a esta famlia);
_
j/(j[ J
t
) dj = j
t
(a mdia condicional est bem especicada);
_
(j j
t
)
2
/(j[ J
t
) dj = o
2
t
(a varincia condicional est bem especi-
cada).
Pode-se provar, sob estas condies:
`
jn
a
j
0
_
:
_
`
jn
a

0
_
o
_
0, A(
0
)
1
H(
0
) A(
0
)
1
_
Se, por acaso, a funo / a prpria funo ), i.e., ) = /, ento o estimador
de pseudo mxima verosimilhana o estimador de mxima verosimilhana e,
neste caso, tem-se A(
0
) = H(
0
) e, portanto, A(
0
)
1
H(
0
) A(
0
)
1
=
1
(
0
) .
Em suma, mesmo que a distribuio de -
t
no seja conhecida podemos su-
por, por exemplo, -
t
~ (0, 1) (ou -
t
~ 1 tal que a densidade / satisfaa as
condies estabelecidas), porque
`
jn
a
, ainda assim, um estimador consistente
(embora no assimptoticamente eciente) e tem distribuio assimpttica normal.
O nico cuidado adicional tomar como matriz de varincias-covarincias (as-
simpttica) a expresso
9
A(
0
)
1
H(
0
) A(
0
)
1
e no I (
0
)
1
.
8.9.3. Mtodo da Mxima Verosimilhana com Distribuies No Nor-
mais. No mbito do mtodo da mxima (ou da pseudo mxima) verosimilhana,
normalmente assume-se -
t
~ (0, 1). Contudo, verica-se habitualmente que
os resduos estandardizados, - = n
t
, o
t
apresentam um valor de kurtosis quase
sempre acima do valor 3, i.e., /
`.
8. Este resultado , at certo ponto, inesper-
ado. O que habitual ter-se /
` &
8. Quando n
t
so ponderados por o
t
seria
natural esperar-se uma reduo signicativa do valor da kurtosis pois os valores
muito altos e muito baixos de n
t
sero ponderados por valores altos de o
t
. Embora
ocorra uma reduo do valor da estatstica de kurtosis quando se passa de n
t
para
-
t
= n
t
, o
t
, normalmente observa-se ainda /
`.
8 (embora /
`.
< /
` &
). Assim,
tambm a distribuio condicional n
t
[ T
t1
(e no s a marginal) leptocrtica.
J vimos uma forma de lidar com este problema: basta tomar o estimador
de pseudo mxima verosimilhana. Uma alternativa consiste em formular uma
distribuio leptocrtica para -
t
tal que
L
(-
t
) = 0 e Vai (-
t
) = 1. importante
assegurar
L
(-
t
) = 0 e Vai (-
t
) = 1. Com efeito, suponha-se que Vai (-
t
) = `
2
,=
1. Vem ento Vai (n
t
[ T
t1
) = `
2
o
2
t
e deixamos de poder identicar a varincia
condicional como o
2
t
. Vejamos algumas distribuies habitualmente consideradas
na literatura.
Hiptese: -
t
~ t-Student(v)
A implementao desta distribuio envolve uma (pequena) diculdade: se
A ~ t-Student(v) ento Vai (A) = , ( 2) . Mas dever ter-se Vai (-
t
) = 1
(pois s assim Vai (n
t
[ T
t1
) = o
2
t
- caso contrrio ter-se- Vai (n
t
[ T
t1
) =
o
2
t
, ( 2)). A soluo simples. Basta reparametrizar a varivel:
-
t
= A
_
( 2) , =Vai (-
t
) = 1, /
.
= /
a
= 8
6
4
Considere-se assim a distribuio t-Student T(0,1) (de mdia zero e varincia 1):
q (r) =
1
_
( 2)
I
_
1
2
_
I
_
2
_
_
1
r
2
2
_
r+1
2
.
9
Esta opo no EVIEWS dada por heteroskedasticity consistent covariance (Bollerslev-
Wooldrige) no menu options da estimao.
8.9. ESTIMAO 245
Para aplicar o mtodo da mxima verosimilhana necessrio conhecer-se ) (j
t
[ J
t1
) .
Pode-se provar
10
) (j
t
[ J
t
) =
1
o
t
q
_
j
t
j
t
o
t
_
=
1
o
t
1
_
( 2)
I
_
1
2
_
I
_
2
_
_
_
_
1
_
j
I
j
I
o
I
_
2
2
_
_
_
r+1
2
.
Assim, o estimador de mxima verosimilhana
`
a
= aig max
a
t=1
|
t
() ,
( inclui ) onde
|
t
() = log ) (j
t
[ J
t
) = log
1
_
o
2
t
( 2)
I
_
1
2
_
I
_
2
_
_
_
_
1
_
j
I
j
I
o
I
_
2
2
_
_
_
r+1
2
=
1
2
log o
2
t

1
2
log
1
2
log ( 2)
log
I
_
1
2
_
I
_
2
_
1
2
log
_
1
1
2
(j
t
j
t
)
2
o
2
t
_
Hiptese: -
t
~ GED (Generalized Error Distribution)
Diz-se que -
t
tem distribuio GED se a sua fdp dada por
q (-
t
) =
oxp
_
1
2
.
I
A
_
`2
(11)(1)
, I funo Gama, ` =
_
2
2
I(1,)
I(8,)
Pode-se provar
L
(-
t
) = 0 e \ ar (-
t
) = 1. Se = 2 = distribuio normal
padronizada, se < 2 =g leptocrtica. Na gura 8.14 traa-se a q com = 1,2.
Considere-se, a ttulo de exemplo, o modelo
j
t
=
0

1
r
t
c
1
j
t1
n
t
n
t
= o
t
-
t
, -
t
~ t ()
o
2
t
= . c
1
n
2
t1
c
1
n
2
t2
,
1
o
2
t1
c
0
:cq
t
co|n:c
t1
10
Seja j (r) a fdp de - e G(r) =
_
i
1
j (r) dr a respectiva funo de distribuio. Qual a
fdp de
I
= j
I
o
I
-
I
condicionada a T
I1
, sabendo que (1) a fdp de -
I
dada pela funo j e
(2) j
I
e o
I
so conhecidos dado T
I1
(ou 1
I
)? Trata-se de um problema clssico de mudana de
variveis. Comece-se por analisar a funo de distribuio condicional
1 (
I
[ T
I1
) = 1 ( j
I
o
I
-
I
[ T
I1
) = 1
_
-
I

j
I
o
I
T
I1
_
= G
_
j
I
o
I
_
Logo, a fdp de
I
condicionada a T
I1
, pelo teorema da derivada da funo composta, dada pela
expresso
) ( [ T
I1
) =
d1 (
I
[ T
I1
)
d
= G
0
_
j
I
o
I
_
d
_
t
_
= j
_
j
I
o
I
_
1
o
I
.
-3 -2 -1 0 1 2 3
0.5
1.0
1.5
2.0
2.5
x
g(x)
FIGURA 8.14. Distribuio GED no caso = 1,2
onde :cq
t
uma varivel dummy que assume 1 se t corresponde a uma segunda-
feira. Para estimar o modelo no EVIEWS, atravs do mtodo da mxima verosim-
ilhana, basta seleccionar Students t em Error distribution. Ver a gura 8.9.3.
O output fornece tambm uma estimativa para o nmero de graus de liberdade da
distribuio t-Student. Esta estimativa interessante pois fornece informao sobre
o achatamento da distribuio condicional.
8.10. Ensaios Estatsticos
H basicamente dois momentos de interesse na realizao de ensaios estats-
ticos. Num primeiro momento, interessa vericar se existe evidncia do efeito
8.10. ENSAIOS ESTATSTICOS 247
ARCH. Posteriormente, depois da estimao, haver que analisar a adequabilidade
do modelo estimado.
8.10.1. Ensaios Pr-Estimao. Teste ARCH (teste multiplicador de La-
grange)
Considere-se
j
t
= j
t
n
t
n
t
= o
t
-
o
2
t
= . c
1
n
2
t1
... c
q
n
2
tq
.
Existe efeito ARCH se pelo menos um parmetro c
i
for diferente de zero. Se
todos forem zero, no existe efeito ARCH. Pode-se provar, sob a hiptese H
0
:
c
1
= c
2
= ... = c
q
= 0 que
:1
2
o
2
(q)
onde 1
2
o coeciente de determinao da regresso de n
2
t
sobre as variveis
_
1 n
2
t1
... n
2
tq
_
(8.17)
( n o resduo supondo o
2
t
constante). Suponha-se que elevado e a hiptese
nula rejeitada. Ento conveniente considerar o GARCH. Na verdade, pode-se
provar que o teste multiplicador de Lagrange do efeito GARCH baseia-se tambm
na regresso de n
2
t
sobre as variveis n
2
ti
.
Para a realizao do teste os passos so:
(1) Estima-se o modelo j
t
= j
t
n
t
supondo o
2
t
constante;
(2) obtm-se os resduos n
t
= j
t
j
t
, t = 1, ..., :; (resduos OLS, depois da
regresso OLS de j sobre as variveis explicativas, ou resduos ARMA);
(3) regresso OLS de n
2
t
sobre as variveis denidas em (8.17);
(4) obteno de 1
2
da equao anterior e clculo do valor-p
1
_
2
(q)
_ :1
2
_
.
FAC de n
2
t
Como se viu, a existncia de um processo GARCH implica a correlao das
variveis n
2
t
e n
2
tI
. O teste Ljung-Box assimptoticamente equivalente ao teste
ARCH. A sua hiptese nula H
0
: j
1
_
n
2
t
_
= ... = j
n
_
n
2
t
_
= 0, sendo j
i
_
n
2
t
_
o
coeciente de autocorrelao entre n
2
t
e n
2
ti
. Sob H
0
tem-se
Q = :(: 2)
n
i=1
1
: i
j
2
i
_
n
2
t
_
o
2
(nI)
onde / o nmero de parmetros estimados menos o termo constante. Evidncia
contra a hiptese nula sugere a existncia de um efeito ARCH.
ARCH Test:
F-statistic 23.58130 Probability 0.000000
Obs*R-squared 218.9822 Probability 0.000000
Test Equation:
Dependent Variable: RESID^2
C 5.64E-05 8.24E-06 6.840992 0.0000
RESID^2(-1) 0.183900 0.018517 9.931537 0.0000
RESID^2(-2) 0.058698 0.018824 3.118322 0.0018
RESID^2(-3) 0.019230 0.018745 1.025890 0.3050
RESID^2(-4) 0.040301 0.018739 2.150692 0.0316
RESID^2(-5) 0.004380 0.018741 0.233690 0.8152
RESID^2(-6) 0.036872 0.018741 1.967414 0.0492
RESID^2(-7) 0.032363 0.018739 1.727034 0.0843
RESID^2(-8) 0.109910 0.018745 5.863338 0.0000
RESID^2(-9) -0.020103 0.018824 -1.067965 0.2856
RESID^2(-10) 0.029723 0.018517 1.605224 0.1086
Log likelihood 18918.62 F-statistic 23.58130
FIGURA 8.15. Output do EVIEWS associado ao teste multipli-
cador de Lagrange H
0
: c
1
= c
2
= ... = c
10
= 0 (o p-value est
destacado)
O programa EVIEWS fornece o valor-p do teste multiplicador de Lagrange.
Para obter esse valor necessrio estimar primeiro o modelo sem efeito ARCH.
No exemplo a seguir (gura 8.15) considerou-se
j
t
= c 0n
t1
n
t
.
onde j so os retornos do PSI20 (Jan 93 a Out 04). O modelo foi estimado atravs
da instruo y c ma(1). Uma vez estimado o modelo, o programa EVIEWS oferece
a opo ARCH LM test... em view-Residual Tests. A gura 8.15 mostra que
o valor-p zero, pelo que existe forte evidncia contra a hiptese nula; por outras
palavras, existe forte evidncia da presena de efeito ARCH. O teste Ljung-Box
(ver a gura 8.16) corrobora as concluses do teste ARCH.
Existem muitos outros testes para ensaiar efeitos e modelos especcos (ver
por exemplo, Franses e van Dijk, 2000). Estes testes tm como objectivo sugerir
a especicao da estrutura de o
2
t
e, portanto, so realizados antes da fase da esti-
mao (nal) do modelo. Como alternativa, podemos discutir esses efeitos espec-
cos (por exemplo, efeito assimtrico) na fase da estimao, a partir dos ensaios
habituais de signicncia e dos critrios SC e AIC.
Por exemplo, suponha-se que se pretende ensaiar a presena do efeito as-
simtrico. Em alternativa aos testes apresentados em Franses e van Dijk (2000),
FIGURA 8.16. FAC de n
2
t
(e valores-p da estatstica Ljung-Box)
pode-se ensaiar a hiptese
1
= 0 (j na fase da estimao) no contexto do modelo
o
2
t
= .c
1
n
2
t1
,
1
o
2
t1
1
n
2
t1
J
&
I1
<0
, J
&
I1
<0
=
_
1 se n
t1
< 0
0 se n
t1
_ 0.
8.10.2. Ensaios Ps-Estimao. Depois do modelo estimado (pelo mtodo
da mxima (ou da pseudo) verosimilhana) h interesse em testar determinada su-
posio envolvendo os parmetros ou em analisar a adequabilidade do modelo. Os
trs testes assimptticos, rcio de verosimilhanas, multiplicador de Lagrange ou
teste de Wald, podem naturalmente ser usados. Uma aplicao do teste multipli-
cador de Lagrange foi j vista (teste ARCH).
Teste de Wald
O teste de Wald muito fcil de usar no programa EVIEWS. Veja-se primeiro
um esboo da teoria. J conclumos que
_
:
_
`
0
_
o
(0, Y
0
) (8.18)
onde
Y
0
=
_
I (
0
)
1
= A(
0
)
1
se
`
a
o est. de mxima verosimilhana
A(
0
)
1
H(
0
) A(
0
)
1
se
`
a
o est. de pseudo mxima verosimilhana
Suponha-se que se pretende ensaiar H
0
: H
0
= r onde H uma matriz de tipo
/ (recorde-se que um vector coluna de dimenso /) e r um escalar. Por
exemplo, se / = e H
0
: 0
1
20
= 8 tem-se = 1 e
0
1
20
= 8 =
_
0 0 0 1 2
_
. .
R
_
_
_
_
_
_
0
1
0
2
0
S
0
1
0
_
_
_
_
_
_
. .
= 8
..
v
.
Para obter a estatstica de teste associada a H
0
: H
0
= r considera-se, a partir de
(8.18),
_
:
_
H
`
a
r
_
o
_
0, HY
0
H
t
_
e, consequentemente
11
,
:
_
H
`
a
r
_
t _
HY
0
H
t
_
1
_
H
`
a
r
_
o
2
(q)
. (8.19)
O programa EVIEWS permite aplicar de forma muito fcil o teste de Wald. No
exemplo anterior, e depois de estimado o modelo GARCH, bastaria seleccionar
view-coefcient tests-Wald e depois escrever c(4)+2*c(5)=3. possvel
tambm ensaiar relaes no lineares entre os parmetros, como por exemplo,
c(4)^2+c(5)^2=1.
12
Testes individuais (por exemplo, do tipo H
0
: 0
2
= 0) baseiam-se na relao
`
a
o
~
_
0
,
`
Y
0
:
_
devido a (8.18) (para : nito mas sucientemente alto,
`
a
tem distribuio aproxi-
madamente igual a (
0
, Y
0
,:)). Assim, para ensaiar, por exemplo, H
0
: 0
2
= 0
considera-se o rcio-t
t
`
0
n,2
=

0
a,2
:c
_
0
a,2
_
com distribuio (0, 1) onde :c
_
0
a,2
_
o erro padro de

0
a,2
( a raiz quadrada
do elemento (2,2) da matriz
`
Y
0
,:). O programa EVIEWS fornece automatica-
mente os rcios-t.
Testes de Diagnstico
O modelo em anlise
j
t
= j
t
n
t
, n
t
= o
t
-
t
.
e as hipteses so
L
(-
t
) = 0, Vai (-
t
) = 1 (vericam-se sempre, por construo),
-
t
um processo diferena de martingala ou rudo branco e -
t
um processo
homocedstico.
11
Note-se que se A um vector aleatrio dimenso q 1 com distribuio ` (j, `) , ento
(r j)
0
`
1
(r j) ~
2
(q)
.
12
Neste caso no linear seria necessrio adaptar a estatstica de teste (8.19). Observe-se que
10
0
expressa uma relao linear.
Nestas circunstncia, se o modelo est bemespecicado, deve ter-se: -
t
deve
ser no autocorrelacionado e -
t
deve ser condicionalmente homocedstico.
Assim, se
(a): j , por exemplo, um ARMA e a mdia condicional no captar esta
estrutura, os processos n
t
e -
t
exibiro autocorrelao;
(b): de igual forma, se j segue um GARCH e a varincia condicional no
captar esta estrutura -
2
t
= n
2
t
,o
2
t
exibir autocorrelao;
(c): nalmente, se - segue uma distribuio leptocrtica ento /
`.
8.
Para analisar (a) e (b), devemos:
(1) estimar um modelo ARMAX+GARCH;
(2) obter os resduos n
t
;
(3) obter os resduos estandardizados -
t
= n
t
, o
t
;
(4) (Anlise da questo (a)). Efectuar o teste Ljung-Box tomando como
hiptese nula, H
0
: j
1
(-
t
) = ... = j
n
(-
t
) = 0 (j
i
(-
t
) o coeciente de
autocorrelao entre -
t
e -
ti
) e estatstica de teste
Q = :(: 2)
n
i=1
1
: i
j
2
i
(-
t
)
o
2
(nI)
onde / o nmero de parmetros ARe MAestimados. Evidncia contra a
hiptese nula sugere que -
t
autocorrelacionado. Neste caso necessrio
rever a especicao da mdia condicional.
(5) (Anlise da questo (b)). Efectuar o teste Ljung-Box tomando como
hiptese nula, H
0
: j
1
_
-
2
t
_
= ... = j
n
_
-
2
t
_
= 0 (j
i
_
-
2
t
_
o coeciente
de autocorrelao entre -
2
t
e -
2
ti
) e estatstica de teste
Q = :(: 2)
n
i=1
1
: i
j
2
i
_
-
2
t
_
o
2
(nI)
onde / o nmero de parmetros estimados (McLeod e Li, 1983, sug-
ere que / pode ser apenas o nmero de parmetros dinmicos estimados
na varincia condicional; por exemplo, 2 no GARCH(1,1)). Evidncia
contra a hiptese nula sugere que -
2
t
autocorrelacionado. Neste caso
necessrio rever a especicao da varincia condicional.
Taylor (2005), p. 258, aponta outros procedimentos alternativos.
Teste Alternativo
Uma forma alternativa de analisar a questo (b) atrs referida consiste em veri-
car a presena de efeitos ARCH remanescentes atravs da especicao (Franses
e van Dijk, 2000, e Lundbergh e Tersvirta, 2002):
j
t
= j
t
n
t
n
t
= o
t
-
t
-
t
= c
t
_
1
1
-
2
t1
...
n
-
2
tn
Sob H
0
:
1
=
2
= ... =
n
= 0 (no existem efeitos ARCH remanescentes),
tem-se
:1
2
o
2
(n)
onde 1
2
o coeciente de determinao da regresso de -
2
t
sobre as variveis
_
1 -
2
t1
... -
2
tn
r
t
_
onde
r
t
=
1
o
t
0 o
2
t
0j
t
e j
t
o vector de parmetros especicados em o
2
t
. Calcule-se
0o
2
I
0j
0
no caso o
2
t
=
. c
1
n
2
t1
,
1
o
2
t1
. Tem-se
0o
2
t
0j
t
=
0o
2
t
0
_
. c
1
,
1
_ =
_
0o
2
I
0.
0o
2
I
0c
1
0o
2
I
0o
1
_
.
Suponha-se
0o
2
0
0.
= 0. Vem
0o
2
t
0.
= 1 ,
1
0o
2
t1
0.
= 1 ,
1
_
1 ,
1
0o
2
t2
0.
_
= ... =
= 1 ,
1
,
2
1
... ,
t1
1
=
t
i=1
,
i1
1
=
1
,
1
1
_
,
t
1
1
_
.
Deixa-se como exerccio vericar que
0o
2
t
0j
t
=
_
t
i=1
,
i1
1
t
i=1
,
i1
1
n
2
ti

t
i=1
,
i1
1
o
2
ti
_
.
Nota: O programa EVIEWS esquece o vector r
t
. Como consequncia, o
valor da estatstica :1
2
apurado no EVIEWS depois da estimao ARCH/GARCH
est subestimado e, assim, a probabilidade 1 (rejeitar H0[ H1 verdadeira) vem
baixa. Tenderemos a concluir quase sempre que o modelo est bem especi-
cado, mesmo nos casos em que ainda existem efeitos ARCH remanescentes. No
EVIEWS, bem mais simples considerar o teste Ljung-Box (aplicado a -
2
t
).
8.11. Previso
A previso no contexto do modelo ARCH/GARCH envolve habitualmente a
previso de j
t
e de o
2
t
. Todavia, em vrias aplicaes, como por exemplo, esti-
mao do risco de mercado, construo de portfolios dinmicos, valorizao de
opes, etc., a previso da volatilidade mais importante do que a previso de j
t
.
Vamos analisar a previso de j
t
e de o
2
t
e estabelecer os respectivos interva-
los de conana (ICs) ou de previso. Concretamente, temos um modelo do tipo
ARMA+GARCH, baseado em : observaes, j
1
, j
2
, ..., j
a
e procura-se,
prever j
a1
, j
a2
, ...;
estabelecer ICs para j
a1
, j
a2
, ...;
prever o
2
a1
, o
2
a2
, ...;
8.11. PREVISO 253
estabelecer ICs para o
2
a1
, o
2
a2
, ...;
8.11.1. Previso da Varincia Condicional. Vimos que o previsor comEQM
mnimo para j
aI
(dada a informao em T
a
)
L
(j
aI
[ T
a
) . De igual forma, o
previsor comEQMmnimo para o
2
aI
(dada a informao emT
a
) (naturalmente)
L
_
o
2
aI
T
a
_
.
Note-se que
L
_
n
2
aI
T
a
_
=
L
_
o
2
aI
-
2
aI
T
a
_
=
L
_
o
2
aI
T
a
_
. Para fa-
cilitar a notao considere-se o
2
aI,a
:=
L
_
o
2
aI
T
a
_
. Vejam-se os exemplos
seguintes.
8.11.1.1. Modelo ARCH(1) o
2
t
= . c
1
n
2
t1
. Previso a um passo / = 1
Como o
2
a1
= . c
1
n
2
a
tem-se
o
2
a1,a
=
L
_
. c
1
n
2
a
T
a
_
= . c
1
n
2
a
(na prtica, como o
2
a1,a
desconhecido deve considerar-se o
2
a1,a
= . c
1
n
2
a
).
Como o
2
a2
= . c
1
n
2
a1
tem-se
o
2
a2,a
=
L
_
. c
1
n
2
a1
T
a
_
= . c
1 L
_
n
2
a1
T
a
_
= . c
1 L
_
o
2
a1
T
a
_
= . c
1
o
2
a1,a
Podemos ainda escrever o
2
a2,a
como funo do valor n
2
a
. Basta substituir na ex-
presso anterior, o
2
a1,a
por . c
1
n
2
a
. Vem
o
2
a2,a
= . c
1
o
2
a1,a
= . c
1
_
. c
1
n
2
a
_
= . (1 c) c
2
1
n
2
a
Previso a / passos
o
2
aI,a
=
L
_
. c
1
n
2
aI1
T
a
_
= . c
1 L
_
n
2
aI1
T
a
_
= . c
1 L
_
o
2
aI1
T
a
_
= . c
1
o
2
aI1,a
.
Tal como anteriormente, podemos escrever o
2
aI,a
como funo de n
2
a
. Pode-se
provar que
o
2
aI,a
= . c
1
o
2
aI1,a
= .
1 c
I
1
1 c
1
c
I
1
n
2
a
Se 0 _ c
1
< 1, conclui-se
o
2
aI,a

.
1 c
1
= Vai (n
t
) (quando / ).
O caso c
1
= 1 analisado adiante, no contexto do GARCH.
8.11.1.2. Modelo GARCH(1,1) o
2
t
= . c
1
n
2
t1
,
1
o
2
t1
. Previso a um
passo / = 1
Como o
2
a1
= . c
1
n
2
a
,
1
o
2
a
tem-se
o
2
a1,a
=
L
_
. c
1
n
2
a
,
1
o
2
a
T
a
_
= . c
1
n
2
a
,
1
o
2
a
(na prtica, como o
2
a1,a
desconhecido deve considerar-se o
2
a1,a
= . c
1
n
2
a
,
1
o
2
a
).
Como o
2
a2
= . c
1
n
2
a1
,
1
o
2
a1
tem-se
o
2
a2,a
=
L
_
. c
1
n
2
a1
,
1
o
2
a1
T
a
_
= . c
1 L
_
n
2
a1
T
a
_
,
1
L
_
o
2
a1
T
a
_
= . (c
1
,
1
) o
2
a1,a
Previso a / passos
o
2
aI,a
=
L
_
. c
1
n
2
aI1
,
1
o
2
aI1
T
a
_
= . c
1 L
_
n
2
aI1
T
a
_
,
1
L
_
o
2
aI1
T
a
_
= . (c
1
,
1
) o
2
aI1,a
Um pouco semelhana do que zemos para a previso no ARCH, a expresso
o
2
aI,a
= . (c
1
,
1
) o
2
aI1,a
(8.20)
pode ser reescrita, como funo de n
2
a
e o
2
a
. Pode-se provar que a soluo da
equao (8.20), sob a condio 0 _ c
1
,
1
< 1 (e dada a condio inicial
o
2
a1,a
= . c
1
n
2
a
,
1
o
2
a
)
o
2
aI,a
=
.
_
1 (c
1
,
1
)
I
_
1 c
1
,
1
(c
1
,
1
)
I1
_
c
1
n
2
a
,
1
o
2
a
_
.
Assim, no caso c
1
,
1
< 1, tem-se
o
2
aI,a

.
1 c
1
,
1
= Vai (n
t
) (quando / ).
No caso c
1
,
1
= 1 (IGARCH(1,1)) vem
o
2
a2,a
= . o
2
a1,a
o
2
aS,a
= . o
2
a2,a
= .
_
. o
2
a1,a
_
= 2. o
2
a1,a
...
o
2
aI,a
= (/ 1) . o
2
a1,a
e, portanto,
o
2
aI,a
= o
2
a1,a
, se . = 0
o
2
aI,a
, se . 0 (quando / ).
8.11. PREVISO 255
Para alm da estimao pontual de o
2
aI,a
, h interesse tambm em estabelecer
ICs. Esta questo tratada no ponto 8.11.3.
8.11.2. A Previso da Varivel Dependente j. Qualquer que seja o modelo
para j, o previsor de j
aI
com EQM mnimo, baseia-se, como vimos, no valor
esperado condicionado de j. Assim, a previso pontual de j
aI
no envolve qual-
quer novidade face ao que foi j exposto no ponto 6.6. Todavia, a estimao por
intervalos deve agora reectir a presena de heterocedasticidade condicional. Seja
(|
1
, |
2
) o IC a (1 c) 100/ associado a j
aI
, i.e, |
1
e |
2
so tais que
1 (|
1
< j
aI
< |
2
[ T
a
) = 1 c =
1
_
|
1
L
(j
aI
[ T
a
)
_
Vai (j
aI
[ T
a
)
<
j
a1
L
(j
aI
[ T
a
)
_
Vai (j
aI
[ T
a
)
<
|
2
L
(j
aI
[ T
a
)
_
Vai (j
aI
[ T
a
)
T
a
_
= 1 c.
Seja 7
aI
= (j
aI
L
(j
aI
[ T
a
)) ,
_
Vai (j
aI
[ T
a
) e
1c2
o quantil de
ordem 1 c,2 da distribuio da v.a. 7
aI
[ T
a
. Como tambm se tem
1
_
1c2
< 7
aI
<
1c2
T
a
_
= 1 c
(supondo que a distribuio de 7[ T
a
simtrica) conclui-se
|
1
L
(j
aI
[ T
a
)
_
Vai (j
aI
[ T
a
)
=
1c2
e
|
2
L
(j
aI
[ T
a
)
_
Vai (j
aI
[ T
a
)
=
1c2
.
Resolvendo estas igualdades em ordem a |
1
e a |
2
,
|
1
=
L
(j
aI
[ T
a
)
1c2
_
Vai (j
aI
[ T
a
),
|
2
=
L
(j
aI
[ T
a
)
1c2
_
Vai (j
aI
[ T
a
)
obtm-se o seguinte IC
13
a (1 c) 100/ para j
aI
:
L
(j
aI
[ T
a
)
1c2
_
Vai (j
aI
[ T
a
)
Por exemplo, assuma-se que j
aI
[ T
a
temdistribuio (
L
(j
aI
[ T
a
) , Vai (j
aI
[ T
a
))
e, portanto, 7
aI
[ T
a
~ (0, 1). Nestas condies, o IC a 95% para j
aI

L
(j
aI
[ T
a
) 1.06
_
Vai (j
aI
[ T
a
).
Infelizmente esta expresso s est correcta para / = 1. O problema o de que
j
aI
[ T
a
para / 1 no tem geralmente distribuio normal na presena de
efeitos ARCH/GARCH, mesmo que as inovaes -
t
sejam Gaussianas e, portanto,
mesmo que j
a1
[ T
a
tenha distribuio normal. No ponto 8.11.3 apresentamos um
procedimento de bootstrap que permite obter IC correctos para j
aI
, com / _ 1.
Outro caso de interesse o da previso de longo prazo. Se o processo ESO (e
ergdico), a previso de j
t
e de o
2
t
no longo prazo, i.e. quando t , respec-
tivamente,
L
(j) = lim
Io L
(j
aI
[ 1
a
) e Vai (j) = lim
Io
Vai (j
aI
[ 1
a
)
13
Note-se que \ui (
n+I
[ T
n
) = \ui ( c
n
(I)[ T
n
) onde c
n
(I) =
n+I
L(
n+I
[ T
n
)
o erro de previso a I passos. Assim, o IC (1 c) 100% pode ser tambm apresentado da seguinte
forma:
L(
n+I
[ T
n
) q
1o2
_
\ui ( c
n
(I)[ T
n
).
(tratam-se anal dos momentos marginais da distribuio de j). OICa (1 c) 100/
para a previso de longo prazo de j , desta forma,
L
(j)
1c2
_
Vai (j)
onde
1c2
o quantil de ordem 1 c,2 da distribuio marginal de j. Este
quantil pode ser estimado a partir da distribuio emprica da sucesso de valores
observados j
1
, ..., j
a
.
Analise-se nesta seco apenas a previso a um passo e deixe-se o caso da
previso a / 1 passos para o ponto 8.11.3
EXEMPLO 8.11.1. Considere-se o modelo AR(1)+GARCH(1,1)
j
t
= c cj
t1
n
t
,
o
2
t
= . c
1
n
2
t1
,
1
o
2
t1
.
Se n
t
[ T
t1
~
_
0, o
2
t
_
ento um IC a 95% para j
a1

L
(j
aI
[ T
a
) 1.06
_
Vai (j
aI
[ T
a
)
ou seja
c cj
a
1.06
_
. c
1
n
2
a
,
1
o
2
a
.
8.11.2.1. Modelo de Regresso. Considere-se o modelo de regresso
j
t
= x
t
t
n
t
onde x
t
t
um vector linha de dimenso / e vector coluna de dimenso /. Supo-
mos que n e X so independentes e ainda que n
t
[ T
t1
~
_
0, o
2
t
_
. O previsor
de j
a1
de EQM mnimo
L
(j
a1
[ T
a
, x
a1
) = x
t
a1
Por que razo o valor esperado condicionado tambm a x

a1
A razo a
seguinte: a previso de j no momento : 1 depende de x
a1
, e, portanto, x
a1
tem de ser conhecido. Na prtica, s em casos muito especiais se conhece x
a1
no
momento : (mesmo assim, podemos estar interessados em prever j
a1
admitindo
um dado cenrio ou hiptese para x
a1
).
Assim, um IC para j
a1
a 95%
x
t
a1
1.06
_
Vai (j
a1
[ T
a
) =x
t
a1
1.06o
a1,a
.
Analise-se agora uma questo que normalmente descurada no mbito das sries
temporais (mas no na rea da econometria). O intervalo de previso acima estab-
elecido assume que conhecido. Ao substituirmos pela respectiva estimativa,
introduz-se uma nova fonte de variabilidade, que deve ser incorporada no inter-
valo de previso. Para se ter em conta a variabilidade de
`
, necessrio obter a
distribuio da varivel j
a1
x
t
a1
`
. A representao
j
a1
x
t
a1
`
= x
t
a1
n
a1
x
t
a1
`
= n
a1
x
t
a1
_

`
_
= c
a
(1)
permite concluir que j
a1
x
t
a1
`
tem distribuio normal de mdia
L
(c
a
(1)[ T
a
, x
a1
) = 0
8.11. PREVISO 257
e varincia
Vai (c
a
(1)[ T
a
, X) = Vai
_
x
t
a1
_

`
_
n
a1
T
a
, x
a1
_
= x
t
a1
Vai
__

`
T
a
, x
a1
_
x
a1

L
_
n
2
a1
T
a
, x
a1
_
= x
t
a1
Vai
_
`
_
x
a1
o
2
a1,a
(assumindo-se
L
(n
a1
[ X) = 0). Considerando (1 c) 100/ = 0/ tem-se
1 (|
1
< j
aI
< |
2
[ T
a
) = 0.0 =
1
_
|
1
x
t
a1
`
_
Vai (c
a
(1)[ T
a
, x
a1
)
<
j
a1
x
t
a1
`
_
Vai (c
a
(1)[ T
a
, x
a1
)
<
|
2
x
t
a1
`
_
Vai (c
a
(1)[ T
a
, x
a1
)
T
a
_
= 0.0.
Obtm-se assim o seguinte IC a 0/ para j
a1
:
x
t
a1
`
1.06
_
x
t
a1
Vai
_
`
_
x
a1
o
2
a1,a
. (8.21)
Para amostra grandes podemos continuar a usar a aproximao x
t
a1
`
1.06 o
a
dado que x
t
a1
Vai
_
`
_
x
a1
aproximadamente proporcional a 1,: e, portanto,
tende para zero assimptoticamente (por outras palavras, uma quantidade pe-
quena quando comparada com o
2
a1,a
).
8.11.3. Intervalos de Conana para j e para a Volatilidade baseados em
Boostrap. Vimos at agora as seguintes questes:
intervalos de conana para j
a1
;
previso de o
2
t
para os perodos : 1, : 2, ...;
Estas questes so relativamente simples tratar. J a obteno de intervalos
de conana para j
aI
, / 1 e para o
2
aI
, / _ 1 problemtica, pois no
so conhecidas as distribuies de interesse. Estas questes resolvem-se de forma
muito satisfatria recorrendo ao bootstrap.
Para exemplicar considere-se o modelo
_
_
_
j
t
= c cj
t1
n
t
n
t
= o
t
-
t
o
2
t
= . cn
2
t1
,o
2
t1
.
(8.22)
onde - tem distribuio desconhecida de mdia nula e varincia um. O algoritmo
o seguinte:
(1) Estimar o modelo (8.22) e obter
-
t
, t = 1, ..., : , onde -
t
=
n
t
o
t
o
2
=
.
1 c
,
, j =
c
1
c
`
=
_
c,
c, ., c,
,
_
t
(2) Simular o modelo
_
_
_
j
+
t
= c

cj
+
t1
n
+
t
n
+
t
= o
+
t
-
+
t
o
+2
t
= . cn
+2
t1

,o
+2
t1
(8.23)
com os seguintes valores iniciais: o
+2
0
= o
2
e j
+
0
= j. Os valores de -
+
t
so retirados aleatoriamente com reposio do conjunto -
1
, ..., -
a
.
(3) Estimar o modelo (8.23) e obter as seguintes previses:
_
j
+
aI
= c
+

c
+
j
+
aI1
o
+2
aI
= .
+
c
+
n
+2
aI1

,
+
o
+2
aI1
Note-se que
`
+
=
_
c
+
,
c
+
, .
+
, c
+
,
,
+
_
t
o vector das estimativas obtidas
no contexto do modelo simulado (8.23).
(4) Repetir os passos 2 e 3 1 vezes. Com este procedimento obtm-se as
seguintes sries:
_
j
+(1)
a)
, j
+(2)
a)
, ..., j
+(1)
a)
_
, , = 1, ..., /,
_
o
+2 (1)
a)
, o
+2 (2)
a)
, ..., o
+2 (1)
a)
_
, , = 1, ..., /.
(5) Um intervalo de previso a (1 c) 100/ para j
a)

_
o
2
,
1
o
2
_
onde
o
2
e
1
o
2
so os quantis empricos da amostra
_
j
+(1)
a)
, j
+(2)
a)
, ..., j
+(1)
a)
_
.
(6) Um intervalo de previso a (1 c) 100/ para o
2
a)

_
o
2
,
1
o
2
_
onde agora
o
2
e
1
o
2
so os quantis empricos da amostra
_
o
+2 (1)
a)
, o
+2 (2)
a)
, ..., o
+2 (1)
a)
_
.
Com o passo 3 incorpora-se a variabilidade do estimador de
`
na construo
dos ICs (esta ideia idntica que conduz a considerar o valor x
t
a1
Vai
_
`
_
x
a1
na expresso 8.21). Para mais pormenores veja-se Pascuala et al. (2006).
8.12. PROBLEMA DOS ERROS DE ESPECIFICAO NA MDIA CONDICIONAL 259
8.12. Problema dos Erros de Especicao na Mdia Condicional
Considere o modelo
j
t
= j
t
n
t
,
L
_
n
2
t
T
t1
_
= o
2
constante
Em aplicaes desconhece-se a verdadeira funo j
t
. Suponha-se que se prope
(erradamente) para a mdia condicional a especicao :
t
,= j
t
. Ou seja prope-
se
j
t
= :
t

t
,
onde
t
tomada como a v.a. residual. Nestas condies pode existir um efeito
ARCH esprio.
Para exemplicar, suponha-se que o verdadeiro processo
j
t
= c cj
t1
n
t
, n
t
RB Gaussiano
_
0, o
2
_
Por erro de especicao supe-se :
t
= c. Nestas condies existe um efeito
ARCH esprio. O modelo considerado (erradamente)
j
t
= c
t
,
t
= cj
t1
n
t
onde
t
tomada como a v.a. residual. Ora
2
t
= (cj
t1
n
t
)
2
= c
2
j
2
t1
n
2
t
2cj
t1
n
t
= c
2
(c
t1
)
2
n
2
t
2cj
t1
n
t
= c
2
c
2
c
2
2c
t1
c
2
2
t1
n
2
t
2cj
t1
n
t
.
Tomando o valor esperado condicional e reagrupando os termos vem:
L
_
2
t
T
t1
_
= c
+
1
c
+
2
t1
c
2
2
t1
.
Signica que
t
exibe um efeito do tipo ARCH, apesar do modelo inicial ser condi-
cionalmente homocedstico.
Considere-se agora um caso mais geral.
Modelo Verdadeiro : j
t
= j
t
n
t
,
Modelo Especicado Incorrectamente : j
t
= :
t

t
,
com :
t
,= j
t
. Tem-se
t
= j
t
:
t
n
t
. Como j
t
e :
t
pertencem a T
t1
e
L
(n
t
[ T
t1
) = 0 vem
L
_
2
t
T
t1
_
=
L
_
(j
t
:
t
n
t
)
2
T
t1
_
=
L
_
(j
t
:
t
)
2
2 (j
t
:
t
) n
t
n
2
t
T
t1
_
=
L
_
(j
t
:
t
)
2
T
t1
_
L
_
n
2
t
T
t1
_
.
Se
L
_
n
2
t
T
t1
_
= o
2
ento a varincia condicional de
t
,
L
_
2
t
T
t1
_
,
no constante, pois
L
_
(j
t
:
t
)
2
T
t1
_
no constante.
Se
L
_
n
2
t
T
t1
_
= o
2
t
ento a varincia condicional associada ao modelo
incorrecto j
t
= :
t

t
ser superior verdadeira varincia condicional
o
2
t
. Com efeito,
L
_
2
t
T
t1
_
=
L
_
(j
t
:
t
)
2
T
t1
_
o
2
t
.
A concluso deste ponto bvia: importante especicar bem a mdia
condicional.
Como nota nal registe-se que, na prtica, a mdia condicional que especi-
camos
L
_
j
t
[ T
+
t1
_
onde T
+
t1
o nosso conjunto de informao, necessari-
amente limitado, e no o conjunto de todos os acontecimentos . \ que geram
j no momento t 1. Como resultado a mdia condicional que especicamente
envolve quase sempre erros de especicao. A existncia do efeito ARCH pode
dever-se ou acentua-se na presena desses erros de especicao. interessante
observar Engle (1982): the ARCH regression model is an approximation to a
more complex regression which has no-ARCH disturbances. The ARCH speci-
cation might then picking up the effect of variables omitted from the estimated
model. The existence of an ARCH effect would be interpreted as evidence of mis-
specication.
8.13. Modelos No Lineares na Mdia combinados com o GARCH
8.13.1. Modelo Limiar Autoregressivo com Heterocedasticidade Condi-
cionada. O modelo TAR tal como foi apresentado na seco 7.4 no apropriado
para sries temporais nanceiras, pois assume que a varincia condicional con-
stante ao longo do tempo. Podemos, no entanto, generalizar o TAR de forma a
acomodar heterocedasticidade condicionada. Se admitirmos o caso mais geral em
que o padro de heterocedasticidade se distingue consoante o regime, o modelo a
considerar, com dois regimes e um desfasamento (veja-se Gospodinov, 2005)
j
t
= (c
10
c
11
j
t1
) J
q
Iu
(c
20
c
21
j
t1
) J
q
Iu
n
t
. (8.24)
onde n
t
= o
t
-
t
e -
t
uma sucesso de v.a. i.i.d. de mdia zero e varincia um e
o
2
t
=
_
.
1
c
1
n
2
t1
,
1
o
2
t1
_
J
q
Iu

_
.
2
c
2
n
2
t1
,
2
o
2
t1
_
J
q
Iu
.
(8.25)
Aborda-se a seguir a estimao do modelo. Suponha-se que - um rudo branco
Gaussiano. Assim,
j
t
[ T
t1
~
_
j
t
, o
2
t
_
onde j
t
= (c
10
c
11
j
t1
) J
q
Iu
(c
20
c
21
j
t1
) J
q
Iu
e o
2
t
dado
pela equao (8.25). Seja o vector de todos parmetros do modelo com excepo
de .A funo log-verosimilhana vem
log 1
a
(, ) =
a
t=1
log ) (j
t
[ T
t1
; , )
log ) (j
t
[ J
t
; , ) =
1
2
log (2)
1
2
log o
2
t
(, )
1
2o
2
t
(, )
(j
t
j
t
(, ))
2
.
O problema de optimizao max
a
t=1
log ) (j
t
[ T
t1
; , ) no standard, pois
a derivada de log 1
a
(, ) em ordem a no existe. O princpio do mtodo de
8.13. MODELOS NO LINEARES NA MDIA COMBINADOS COM O GARCH 261
Parmetro Estimativa Erro Padro
c 0.0478 0.0075
c 0.2332 0.0112
. 0.0118 0.0015
c 0.1111 0.0073
, 0.8812 0.0074
Log-Veros.= 11480.8
TABELA 2. Resultados da estimao do modelo AR+GARCH
mxima verosimilhana mantm-se, todavia: necessrio maximizar a funo em
ordem aos parmetros. A estimao dos parmetros processa-se da seguinte forma:
(1) Escolha-se um valor para no conjunto

I (sobre o conjunto

I veja-se o
ponto 7.4.5). Seja
+
esse valor.
(2) Resolva-se o problema de optimizao max
log 1
a
(,
+
) em ordem a
; seja
`
a
(
+
) o valor que maximiza 1
a
(,
+
) (dado
+
), i.e.,
`
a
(
+
) =
aig max
0
log 1
a
(0,
+
) .
(3) Registe-se o valor de log 1
a
_
`
a
(
+
) ,
+
_
.
(4) Repitam-se os passos 1-3 at se exaurir o conjunto

I.
(5) A estimativa para aquela que maximiza a funo de verosimilhana;
seja
a
esse valor.
(6) A estimativa para , naturalmente,
`
a
(
a
) .
EXEMPLO 8.13.1. Considere o retorno dirio em percentagem, j
t
= 100
log (1
t
,1
t1
), associados ao ndice NASDAQ, no perodo 5-02-1971 a 13-10-
2006 (9006 observaes). Na tabela 2 apresentam-se os resultados da estimao
do modelo AR(1)+GARCH(1,1).
De seguida, estimou-se o modelo SETAR (8.24)-(8.25), com
to
= j
t1
.
Seguiram-se os seis passos do procedimento descrito atrs. Obteve-se
a
= 0.86
(trata-se do valor que maximiza a funo de log-verosimilhana log 1
a
(, )). A
gura 8.17 mostra o valor de log 1
a
como funo de (observe-se que
a
=
0.86 maximiza log 1
a
). Para o valor
a
estimado, obtiveram-se os resultados
que constam da tabela 3. O primeiro regime modela os retornos quando estes esto
em queda, mais precisamente, quando o retorno anterior inferior a 0.86/. A
mdia marginal deste regime .1718, (1 .068) = .182/. Tendo em conta
este valor, h tendncia para o processo sair do regime 1, mantendo, ainda assim,
uma rendibilidade negativa. Talvez o dado mais signicativo a forte persistncia
da volatilidade neste regime, associada a valores altos de volatilidade (n
1
n
2
).
Este resultado est de acordo com os factos estilizados habitualmente observa-
dos em dados nanceiros, segundo os quais, a volatilidade tende a ser superior
quando as cotaes esto a descer. A volatilidade associada ao regime 1 pode ser
identicada como a m volatilidade, i.e., aquela que est ligada queda dos
preos.
8.13.2. Modelo Markov-Switching comHeterocedasticidade Condicionada.
Vimos na seco 7.5 que a separao das dinmicas do processo em estudo em
FIGURA 8.17. Valor da mximo da funo log-Verosimilhana
como funo do parmetro . Estimativa de : 0.88816
Parmetro Estimativa Erro Padro
c
10
-0.1718 0.0312
c
11
0.0563 0.0310
.
1
0.0233 0.0075
c
1
0.0982 0.0097
,
1
0.9776 0.0152
c
20
0.0426 0.0099
c
21
0.2384 0.0177
.
2
0.0175 0.0024
c
2
0.0733 0.0073
,
2
0.8575 0.0093
Log-Veros.= 11844.
TABELA 3. Resultados da estimao do modelo SETAR+GARCH
dois ou mais regimes permite, na maior parte dos casos, obter diferentes valores
para o
i
(veja-se o modelo (7.35)). Signica isto que os erros so heterocedsti-
cos. No entanto, possvel ir um pouco mais longe se admitirmos, mesmo em
cada regime, erros heterocedsticos. Em sries nanceiras, o modelo (7.35) pode
mostrar-se insuciente para modelar a volatilidade tpica das sries nanceiras. O
caminho est assim indicado: necessrio admitir, em cada regime, uma especi-
cao dinmica para a volatilidade. Entendeu-se inicialmente (e.g. Hamilton)
que os modelos Markov-switching com efeitos GARCH eram intratveis e im-
possveis de serem estimados, devido dependncia da varincia condicional de
toda a trajectria passada (em ltima anlise, a estrutura que se admitia para um
Markov-Switching com regimes obrigaria posteriormente a expandir o nmero
8.A. ESTABILIDADE DE EDF E A ESTACIONARIDADE (CASO MODELO ARCH) 263
de regimes para
a
sendo : o nmero de observaes). Gray (1996) props um
modelo que resolve a dependncia da varincia condicional de toda a trajectria
passada.
O modelo MS+GARCH com dois regimes
j
t
=
_
c
1
c
1
j
t1
o
1t
-
t
se o
t
= 1
c
2
c
2
j
t2
o
2t
-
t
se o
t
= 2
onde o
it
seguem a representao sugerida por Gray(1996),
o
2
it
= .
i
c
i
n
2
t1
,o
2
t1
, (8.26)
sendo
n
t
= j
t
L
(j
t
[ T
t1
) , o
2
t
= Vai (j
t
[ T
t1
) .
Pode mostrar-se que o problema da dependncia da varincia condicional surge
quando se dene o
2
it
como funo de n
i,t1
(erro no perodo t 1 associado ao
regime i) e de o
2
i,t1
. A especicao (8.26) evita esse problema; observe-se que
o
2
it
depende n
t1
e o
2
t1
.
Momentos de j
Determinem-se os momentos do processo. Seja j
it
=
L
(j
t
[ T
t1
, o
t
= i) .
No contexto do modelo (7.35) tem-se:
L
(j
t
[ T
t1
, o
t
= 1) = c
1
c
1
j
t1
,
L
(j
t
[ T
t1
, o
t
= 2) = c
2
c
2
j
t1
.
Tem-se
j
t
=
L
(j
t
[ T
t1
)
=
L
(j
t
[ T
t1
, o
t
= 1) 1 (o
t
= 1[ T
t1
)
L
(j
t
[ T
t1
, o
t
= 2) 1 (o
t
= 2[ T
t1
)
= j
1t
j
1t
j
2t
j
1t
.
L
(j
t
[ T
t1
) , portanto, a mdia ponderada dos valores esperados condicionais
dos regimes 1 e 2. Por outro lado,
o
2
t
= Vai (j
t
[ T
t1
) =
L
_
j
2
t
T
t1
_
(
L
(j
t
[ T
t1
))
2
=
L
_
j
2
t
T
t1
, o
t
= 2
_
1 (o
t
= 1[ T
t1
)
L
_
j
2
t
T
t1
, o
t
= 2
_
1 (o
t
= 2[ T
t1
) j
2
t
=
_
j
2
1t
o
2
1t
_
j
1t

_
j
2
2t
o
2
2t
_
j
2t
j
2
t
.
8.A. Estabilidade de EDF e a Estacionaridade (Caso modelo ARCH)
Apresenta-se uma abordagem alternativa para analisar a ESO. A ideia tomar,
num primeiro passo, os valores esperados marginais como funo de t, e vericar
depois em que condies esses valores esperados no dependem de t. Considere-se
o ARCH(1). Como se sabe neste caso tem-se
L
_
n
2
t
_
. .
j
I
= . c
1L
_
n
2
t1
_
. .
j
I1
, i.e.
j
t
= . c
1
j
t1
O ponto xo da equao s diferenas nitas (EDF)
14
, j
t
= . c
1
j
t1
,
.
1 c
1
.
Este ponto assimptoticamente estvel se [c
1
[ < 1; alm disso, se a condio
inicial
.
1c
1
ento j
t
=
.
1c
1
, \t. Quando a condio inicial j
0
,=
.
1c
1
pode-se provar que a soluo da EDF j
t
= . c
1
j
t1

j
t
= .
_
1 c
t
1
_
1 c
1
c
t
1
j
0
(Soluo)
Se [c
1
[ < 1 =
j
t
= .
_
1 c
t
1
_
1 c
1
c
t
1
j
0

.
1 c
1
Se a condio inicial no igual soluo de longo prazo,
.
1c
1
, o processo n
t

assimptoticamente estacionrio (ou ESO se o processo teve incio num passado
remoto). Em suma, se c
1
< 1 (por hiptese c
1
_ 0) (e a condio inicial for
., (1 c
1
)) ento
L
_
n
2
t
_
=
.
1 c
1
, \t
e o processo n
t
ESO.
No caso ARCH(2), tem-se o
2
t
= .c
1
n
2
t1
c
2
n
2
t2
, . 0, c
1
_ 0, c
2
_ 0.
Assim,
Vai (n
t
) =
L
_
n
2
t
_
=
L
_
o
2
t
_
=
L
_
. c
1
n
2
t1
c
2
n
2
t2
_
= . c
1 L
_
n
2
t1
_
c
2 L
_
n
2
t2
_
Donde
L
_
n
2
t
_
. .
j
I
= . c
1L
_
n
2
t1
_
. .
j
I1
c
2L
_
n
2
t2
_
. .
j
I2
, i.e.
j
t
= . c
1
j
t1
c
2
j
t2
_
1 c
1
1 c
2
1
2
_
j
t
= .
Pode-se provar que j
t
converge se as razes de
_
1 c
1
1 c
2
1
2
_
estiverem fora
do circulo unitrio, i.e.,
c
1
c
2
< 1, c
2
c
1
< 1, 1 < c
2
< 1.
Como c
1
_ 0, c
2
_ 0, a nica condio que precisamos de vericar c
1

c
2
< 1. Nestas condies, se j
0
=
.
1(c
1
c
2
)
e c
1
c
2
< 1 o processo n ESO
e
L
_
n
2
t
_
= . c
1 L
_
n
2
t
_
c
2 L
_
n
2
t
_
=
L
_
n
2
t
_
=
.
1 (c
1
c
2
)
.
14
Ver a denio de ponto xo na seco 7.2.
CAPTULO 9
Modelao da Heterocedasticidade Condicionada - Caso
Multivariado
9.1. Introduo
Vimos no ponto 3.2.6 que muitas sries nanceiras (por exemplo, ndices bol-
sistas ou cotaes de aces) apresentam co-movimentos de rendibilidade e volatil-
idade, isto , quando a rendibilidade e a volatilidade de uma srie aumenta (diminui),
a rendibilidade e a volatilidade das outras tende, em geral, a aumentar (diminuir).
Aestimao destes co-movimentos de rendibilidade e volatilidade deve ser nat-
uralmente feita no quadro da estimao multivariada (por multivariada entendemos
vrias equaes). Esta anlise relevante, por exemplo, no mbito da seleco de
portfolios, da gesto do risco, etc. Permite tambm discutir questes do tipo:
como se transmite a volatilidade de um mercado aos demais mercados?
qual a magnitude do impacto da volatilidade de um mercado sobre outro?
os mercados globais inuenciam a volatilidade de outros mercados (re-
gionais ou nacionais) sem serem por eles inuenciados (contagiados)?
A volatilidade de um activo transmite-se a outro directamente (atravs
da sua varincia condicional) ou indirectamente (atravs das covarincias
condicionais)?
Como se comportam as correlaes condicionais? So variveis ao longo
do tempo? Tendem a aumentar ou a diminuir em perodos de alta volatil-
idade e instabilidade dos mercados?
Para tratar estas questes vai considerar-se um modelo genrico, envolvendo
: equaes:
j
1t
= j
1t
n
1t
,
...
j
nt
= j
nt
n
nt
onde j
it
:=
L
(j
it
[ T
t1
) para i = 1, ..., :. Para usarmos uma notao mais
compacta, denam-se os seguintes vectores-coluna : dimensionais:
y
t
=
_
_
_
j
1t
.
.
.
j
nt
_
_
_
,
t
=
_
_
_
j
1t
.
.
.
j
nt
_
_
_
, u
t
=
_
_
_
n
1t
.
.
.
n
nt
_
_
_
.
De forma compacta, o modelo pode representar-se na forma
y
t
=
t
u
t
.
265
266 9. MODELAO DA HETEROCEDASTICIDADE CONDICIONADA - CASO MULTIVARIADO
A mdia condicional
t
no aqui relevante, mas pode supor-se que y
t
bem
modelado por um VARMA (vector ARMA, ou mesmo vector ARMAX). Tem-se
um modelo de heterocedasticidade condicional multivariado se u
t
um processo
multiplicativo do tipo,
u
t
= H
12
t
"
t
onde "
t
um vector de v.a. i.i.d. (condicionalmente homocedstico) tal que
L
("
t
) = 0, Vai ("
t
) = I
n
(matriz identidade de ordem :)
e H
t
uma matriz quadrada de ordem :, simtrica, denida positiva e T
t1
men-
survel (T
t
a o-algebra gerada por (y
t
, y
t1
, ..)). A notao H
12
t
merece alguns
comentrios. A menos que H
t
seja uma matriz diagonal, H
12
t
no representa
naturalmente a raiz quadrada dos elementos de H
t
. H
12
t
uma matriz quadrada
ordem : tal que H
12
t
_
H
12
t
_
t
= H
t
. A matriz H
12
t
pode ser obtida utilizando a
factorizao de Cholesky.
Dadas as hipteses, tem-se
Vai (y
t
[ T
t1
) = Vai (u
t
[ T
t1
) =
L
_
u
t
u
t
t
T
t1
_
= H
12
t
Vai ("
t
[ T
t1
)
. .
\ni("
I
)=I
r
_
H
12
t
_
t
= H
t
.
9.2. Densidade e Verosimilhana
Para simplicar a exposio assuma-se normalidade dos erros: "
t
~ (0, I
n
) .
Nestas circunstncias, tem-se a seguinte relao:
"
t
~ (0, I
n
) = u
t
[ T
t1
~ (0, H
t
) = y
t
[ T
t1
~ (
t
, H
t
) .
Assim, a densidade conjunta condicional de y
t

) (y
t
[ T
t1
) = (2)
n2
[H
t
[
12
oxp
_
1
2
(y
t
t
)
t
H
1
t
(y
t
t
)
_
.
A funo log-verosimilhana ento
log 1
a
() =
a
t=1
log ) (y
t
[ T
t1
)
=
::
2
log (2)
1
2
a
t=1
log [H
t
[
1
2
a
t=1
(y
t
t
)
t
H
1
t
(y
t
t
)
=
::
2
log (2)
1
2
a
t=1
log [H
t
()[ (9.1)
1
2
a
t=1
(y
t
t
())
t
H
1
t
() (y
t
t
())
(a ltima equao destaca a dependncia face a ). No caso univariado (i.e. : =
1), vem H
t
= o
2
t
e log ) (j
t
[ T
t1
) dada pela equao (8.16).
9.3. MODELO VECH (OU VEC) 267
Nesta fase necessrio denir uma hiptese sobre a estrutura de
t
e de H
t
. A
mdia condicional
t
pode ser denida atravs de um VAR(1) (vector autoregres-
sivo) ou VARMA(1,1) (vector ARMA), etc. No abordaremos aqui a especicao
da mdia condicional. Neste captulo estamos interessados sobretudo na especi-
cao de H
t
. Nos pontos seguintes discutiremos possveis especicao para H
t
.
9.3. Modelo VECH (ou VEC)
necessrio, em primeiro lugar, introduzir o operador voch. Considere-se, por
exemplo,
A =
_
_
a
11 a
12
a
1S
a
21
a
22 a
2S
a
S1
a
S2
a
SS
_
_
.
O operador voch selecciona os elementos abaixo da diagonal principal (elementos
dentro dos quadrados) e passa-os para um vector-coluna:
voch(A) =
_
_
_
_
_
_
_
_
a
11
a
21
a
22
a
S1
a
S2
a
SS
_
_
_
_
_
_
_
_
.
Obviamente que no se perde informao com esta operao se A uma matriz
(real) simtrica, hiptese que doravante se assume, sempre que se empregar tal
operador.
O modelo VECH (ou VEC) (Engle e Kroner, 1995) prope uma estrutura
GARCH(p,q) multivariada. No caso GARCH(1,1), a matriz H
t
tal que
voch(H
t
) = vA
1
voch
_
u
t1
u
t
t1
_
H
1
voch(H
t1
) . (9.2)
No caso : = 2 (processo bivariado) e GARCH(1,1) a expresso (9.2) toma a
forma
voch(H
t
) =
_
_
/
11,t
/
12,t
/
22,t
_
_
=
_
_
n
11
n
12
n
22
_
_
_
_
c
11
c
12
c
1S
c
21
c
22
c
2S
c
S1
c
S2
c
SS
_
_
_
_
n
2
1,t1
n
1,t1
n
2,t1
n
2
2,t1
_
_
_
_
,
11
,
12
,
1S
,
21
,
22
,
2S
,
S1
,
S2
,
SS
_
_
_
_
/
11,t1
/
12,t1
/
22,t1
_
_
(/
11,t
:= o
2
1t
, /
t,22
:= o
2
2t
, /
12,t
:= o
t12
). Note-se, por exemplo, que a covarincia
condicionada /
12,t
:=
L
(n
1t
n
2t
[ T
t1
) igual a
n
12
c
21
n
2
1,t1
c
2S
n
2
2,t1
c
22
n
1,t1
n
2,t1
,
21
/
11,t1
,
22
/
12,t1
,
2S
/
22,t1
(9.3)
: (:(: 1) ,2) (1 (:(: 1)))
2 21
3 78
4 210
TABELA 1. Nmero de parmetros a estimar no VEC
Como subproduto do mtodo, obtm-se as correlaes condicionais entre os
retornos
1
j
i),t
=
/
i),t
_
/
ii,t
/
)),t
, i, , = 1, ..., :.
A condio de ESO no caso GARCH(1,1) a seguinte: u
t
ESO se todos
os valores prprios de A
1
H
1
forem em mdulo menores do que um (i.e., sse
as razes em ` de [A
1
H
1
Ì[ forem em mdulo menores do que um)
2
. Nestas
condies:
L
_
voch
_
u
t
u
t
t
__
=
L
(voch(H
t
)) = (I A
1
H
1
)
1
v.
A principal vantagem do modelo VEC a sua grande exibilidade, pois per-
mite que todos os elementos de H
t
dependam de todos os produtos cruzados de
voch
_
u
t1
u
t
t1
_
e de todos os elementos de H
t1
. No entanto, as suas desvanta-
gens superam largamente as suas vantagens. As duas principais desvantagens do
modelo VEC so as seguintes:
Onmero de parmetros a estimar excessivamente alto. No GARCH(1,1)
multivariado com : equaes, o nmero de parmetros a estimar
(:(: 1) ,2) (1 (:(: 1))) (veja-se a tabela 1)
3
.
Por denio a matriz H
t
deve ser denida positiva, mas no fcil
garantir isso a partir das matrizes A e H. Se H
t
no denida posi-
tiva, possvel, por exemplo, obter coecientes de correlao superiores
a um e/ou varincias negativas (i.e. j
i),t
1 ou /
t,ii
< 0).
Estas duas desvantagens acabam por limitar, de facto, a aplicao do modelo.
Mesmo no caso : = 2 tm-se 21 parmetros (tabela 1). Estimar 21 parmet-
ros usando o OLS fcil (desde que o nmero de graus de liberdade assim o
permita). Mas estimar 21 parmetros maximizando a funo log-verosimilhana
1
indiferente identicar j
.,I
como as correlaes condicionais entre os retornos ou entre os
erros, pois, por denio, j
.,I
= Coii (
.I
,
I
[ T
I1
) = Coii ( &
.I
, &
I
[ T
I1
) . J as correlaes
marginais no so necessariamente iguais, isto , em geral, tem-se Coii (
.I
,
I
) ,= Coii (&
.I
, &
I
).
2
Com efeito, pode-se provar que
L( voch(H
I
)[ T
0
) =
_
I(A
1
B
1
) ... (A
1
B
1
)
I1
_
w(A
1
B
1
)
I
voch(H
1
)
sendo voch(H
1
) T
0
). Se (A
1
B
1
)
I
0 (quando t o) ento L( voch (H
I
)[ T
0
) converge
para o momento estacionrio L(voch(H
I
)) = (I(A
1
B
1
))
1
. Ora, (A
1
B
1
)
I
0 sse os
valores prprios de A
1
B
1
so em mdulo menores do que 1.
3
Com efeito, note-se que A
1
e B
1
so matrizes quadradas de ordem i(i 1) 2 e o
vector w possui i(i 1) 2 elementos. Assim, o nmero total de elementos a estimar
2 (i(i 1) 2)
2
i(i 1) 2 = (i(i 1) 2) (1 (i(i 1))) .
9.3. MODELO VECH (OU VEC) 269
(9.1) extremamente difcil. Frequentemente, implementa-se o modelo VEC im-
pondo vrias restries de nulidade sobre A
1
e H
1
, como podemos ver no exemplo
seguinte.
EXEMPLO 9.3.1. Existem efeitos de rendimento e de volatilidade do PSI20 que
possam ser antecipados atravs do Dow Jones (DJ)? Seja j
1t
e j
2t
o retorno dirio
associado, respectivamente, aos ndices, PSI20 e DJ. Para reduzir o nmero de
parmetros a estimar, as variveis j
1t
e j
2t
foram previamente centradas (e, como
consequncia, os termos constantes das equaes foram eliminados). Depois de
vrios ensaios, deniu-se o seguinte modelo
_
j
1t
j
2t
_
=
_
c
11
c
12
0 c
22
__
j
1,t1
j
2,t1
_
H
12
"
t
onde
voch(H
t
) =
_
_
/
11,t
/
12,t
/
22,t
_
_
=
_
_
0
0
n
22
_
_
_
_
c
11
0 c
1S
0 0 0
0 0 c
SS
_
_
_
_
n
2
1,t1
n
1,t1
n
2,t1
n
2
2,t1
_
_
_
_
,
11
0 0
0 0 0
0 0 ,
SS
_
_
_
_
/
11,t1
/
12,t1
/
22,t1
_
_
_
_
o|
t1
0
0
_
_
(o| uma medida do volume de transaces do mercado portugus). Todas as
matrizes quadradas so triangulares superiores, porque se assume que o DJ in-
uencia o PSI20 e no existem efeitos de feedback (o PSI20 no inuencia o DJ).
Usando os dados no perodo 31/12/92 a 15/03/99 (1496 observaes) obteve-se,
j
1t
= .2848
(.02S)
j
1t1
.1480
(.02S)
j
2t1
, j
2t
= .078
(.02S)
j
2t1
/
1t
= .8182
(.0166)
n
2
1t1
.0466
(.011)
n
2
2t1
.608
(.019)
/
1t1
.024
(.0062)
o|
t1
/
2t
= 1.2 10
6
(.210
7
)
.0008
(.019)
n
2
2t1
.807
(.0227)
/
2t1
, /
12,t
= 0.
Assim,
`
A
1
=
_
_
.8182 0 .0466
0 0 0
0 0 .0008
_
_
,
`
H
1
=
_
_
.608 0 0
0 0 0
0 0 .807
_
_
Os valores prprios (estimados) da matriz
`
A
1
`
H
1
so 0.087, 0.018, 0 . Conclui-
se: (1) O comportamento do ndice DJ afecta signicativamente o comportamento
do PSI20, quer em termos de rendimento quer em termos de volatilidade; (2)
ganhos do DJ afectam favoravelmente o PSI20; (3) aumentos ou diminuies de
volatilidade do DJ afectam no mesmo sentido o PSI20; (4) os valores prprios
respeitam a condio de ESO (note-se, todavia, que esto sujeitos a variabilidade
amostral). As concluses (1)-(3) so vlidas, naturalmente, no muito curto prazo
(um, dois dias). As possibilidades de ganho so muito reduzidas, pois grande parte
das variaes dos ndices no so explicadas (alta volatilidade). Como nota nal
registe-se que a hiptese /
12,t
= 0 no plausvel, pois implica que as correlaes
condicionais so zero. Ora a literatura mostra que as correlaes condicionais en-
tre ndices bolsistas quase sempre signicativa.
9.4. Modelo Diagonal VECH
Podem obter-se modelos VECH com menos parmetros impondo que as ma-
trizes A
1
e H
1
sejam diagonais. Por exemplo, no caso : = 2, vem
voch(H
t
) =
_
_
/
11,t
/
12,t
/
22,t
_
_
=
_
_
n
11
n
12
n
22
_
_
_
_
c
11
0 0
0 c
22
0
0 0 c
SS
_
_
_
_
n
2
1,t1
n
1,t1
n
2,t1
n
2
2,t1
_
_
_
_
,
11
0 0
0 ,
22
0
0 0 ,
SS
_
_
_
_
/
11,t1
/
12,t1
/
22,t1
_
_
(este princpio aplica-se naturalmente no caso de modelos multivariados GARCH(p,q)).
Com matrizes A
1
e H
1
diagonais pode optar por escrever o modelo diagonal
VECH na forma equivalente
H
t
= ! a
1
u
t1
u
t
t1
L
1
H
t1
onde !, a
1
e L
1
so matrizes simtricas de tipo : : e o produto de
Hadamard
4
. Por exemplo, no caso : = 2, o modelo anterior escreve-se
_
/
11,t
/
12,t
/
12,t
/
22,t
_
=
_
n
11
n
12
n
12
n
22
_
_
a
11
a
12
a
12
a
22
_
_
n
2
1,t1
n
1,t1
n
2,t1
n
1,t1
n
2,t1
n
2
2,t1
_
_
/
11
/
12
/
12
/
22
_
_
/
11,t1
/
12,t1
/
12,t1
/
22,t1
_
onde a
11
= c
11
, a
12
= c
22
, a
22
= c
SS
, etc. Note-se, portanto, que
/
11,t
= .
11
a
11
n
2
1,t1
/
11
/
11,t1
/
12,t
= .
12
a
12
n
1,t1
n
2,t1
/
12
/
12,t1
/
22,t
= .
22
a
22
n
2
2,t1
/
22
/
22,t1
.
A vantagem do modelo em anlise face ao modelo VECH a de reduzir o
nmero de parmetros a estimar. Num modelo multivariado GARCH(1,1) com
: equaes, o nmero total de parmetros a estimar no modelo Diagonal VECH
de apenas 8:(: 1) ,2. Todavia h uma desvantagem face ao VECH. Para
ilustrar este ponto considere-se o caso : = 2. No modelo Diagonal VECH fcil
vericar que /
ii,t
s depende dos termos n
2
i,t1
e /
ii,t1
, e /
12,t
s depende dos ter-
mos n
1,t1
n
2,t1
e /
12,t1
. Desta forma, a especicao Diagonal VECH elimina
a possibilidade de interaco entre as diferentes varincias e covarincias condi-
cionais. Por outro lado, a matriz H
t
, por construo, no resulta denida positiva.
4
Dadas duas matrizes A =(o
.
)
rr
e B =(/
.
)
rr
, o produto Hadamard dene-se como
A B =(o
.
/
.
)
rr
. Por exemplo,
_
1 2
8 4
_
_
6
7 S
_
=
_
12
21 82
_
.
9.5. MODELO BEKK 271
H vrias formas de ultrapassar este ltimo problema no mbito da especicao
Diagonal VECH. Uma possibilidade consiste em reespecicar o modelo na forma
H
t
= !
1
( !
1
)
t
a
1
(a
1
)
t
u
t1
u
t
t1

L
1
_
L
1
_
t
H
t1
com ! = !
1
( !
1
)
t
, a
1
= a
1
(a
1
)
t
e L
1
=

L
1
_
L
1
_
t
e !
1
, a
1
e

L
1
so matrizes
quadradas de ordem :. As matrizes !, a
1
e L
1
assim construdas implicam uma
matriz H
t
denida positiva. Esta forma de denir o modelo resulta claro com o
seguinte exemplo univariado. Suponha-se que os parmetros ,
0
e ,
1
do modelo
j
t
= ,
0
,
1
r
t
n
t
tm de ser positivos. Podemos impor essa restrio estimando
j
t
=

,
2
0

,
2
1
r
t
n
t
e assumindo que ,
0
=

,
2
0
e ,
1
=

,
2
1
. Desta forma ,
0
e
,
1
vm sempre positivos quaisquer que sejam os valores de

,
0
e

,
1
. Em termos
matriciais, o produto a
1
(a
1
)
t
resulta sempre numa matriz semidenida positiva, e
o produto de Hadamard a
1
(a
1
)
t
u
t1
u
t
t1
= oiag (u
t1
) a
1
(a
1
)
t
oiag (u
t1
) ,
por denio, uma matriz semidenida positiva (ou denida positiva se a
1
tiver car-
acterstica :). Vrias verses deste modelo so estimadas pelo software EVIEWS
6.
Um modelo ainda mais restritivo (mas que usado com algum sucesso na mod-
elao de sistemas com muitas equaes) foi desenvolvido pela J.P. Morgan. Ba-
sicamente usa o princpio exponentially weighted moving average (EWMA) para
captar a dinmica das varincias e covarincias condicionais,
/
i),t
= (1 `) n
i,t1
n
),t1
`/
i),t1
.
O modelo EWMA, no caso : = 2, tem a seguinte representao VECH:
_
_
/
11,t
/
12,t
/
22,t
_
_
=
_
_
1 ` 0 0
0 1 ` 0
0 0 1 `
_
_
_
_
n
2
1,t1
n
1,t1
n
2,t1
n
2
2,t1
_
_
_
_
` 0 0
0 ` 0
0 0 `
_
_
_
_
/
11,t1
/
12,t1
/
22,t1
_
_
.
Existe uma reduo dramtica do nmero de parmetros a estimar (passamos para
apenas 1, qualquer que seja o nmero de equaes do modelo).
9.5. Modelo BEKK
O modelo BEKK (devido a Baba, Engle, Kroner e Kraft; veja-se Engle et al.
1993) assegura por construo que H
t
denida positiva. No caso mais simples
BEEK(1,1), a matriz de varincias-covarincias condicionais igual a
H
t
= VA
t
1
_
u
t1
u
t
t1
_
A
1
H
t
1
H
t1
H
1
onde V, A
1
e H
1
so matrizes de tipo : :, com V simtrica e denida
positiva. H
t
denida positiva por construo pois V denida positiva e os
demais termos esto expressos como formas quadrticas denidas positivas. No
FIGURA 9.1. Simulao do modelo BEKK (: = 2).
caso : = 2 tem-se
H
t
=
_
n
11
n
12
n
12
n
22
_
_
c
11
c
12
c
21
c
22
_
t
_
n
2
1,t1
n
1,t1
n
2,t1
n
1,t1
n
2,t1
n
2
2,t1
__
c
11
c
12
c
21
c
22
_
_
,
11
,
12
,
21
,
22
_
t
_
/
11,t1
/
12,t1
/
12,t1
/
22,t1
__
,
11
,
12
,
21
,
22
_
.
Depois de algumas contas, pode-se concluir, por exemplo, que:
/
11,t
= n
11
c
2
11
n
2
1,t1
c
12
c
21
n
2
2,t1
c
11
c
12
n
1,t1
n
2,t1
c
11
c
21
n
1,t1
n
2,t1
,
2
11
/
11,t1
,
11
,
12
/
12,t1
,
11
,
21
/
12,t1
,
12
,
21
/
22,t1
.
Com o modelo BEKK h ainda uma reduo de nmero de parmetros a estimar:
passam agora a existir
_
: :
2
_
,2. Na gura seguinte mostra-se uma simulao
com dois activos.
9.6. Modelo de Correlaes Condicionais Constantes
O modelo VEC sem restries (quase) impossvel de ser implementado. O
modelo BEKK envolve ainda muitos parmetros e a maximizao da funo de
verosimilhana extremamente difcil para :moderadamente elevado. A hiptese
de Bollerslev (1990) consiste em admitir correlaes condicionais constantes (i.e.
9.6. MODELO DE CORRELAES CONDICIONAIS CONSTANTES 273
VEC BEEK Correl.Const.
: (:(: 1) ,2) (1 (:(: 1)))
nn
2
2
8:
1
2
:(:1)
2 21 11 7
3 78 24 12
TABELA 2. Nmero de parmetros a estimar
iguais s correlaes marginais): j
i),t
= j
i)
. Esta hiptese reduz signicativa-
mente o nmero de parmetros a estimar. Tem-se
j
i)
= j
i),t
=
/
i),t
_
o
2
it
o
2
)t
=/
t,i)
= j
i)
o
it
o
)t
.
Logo
H
t
=
_
_
_
_
_
o
2
1t
j
12
o
1t
o
2t
j
1n
o
1t
o
nt
j
12
o
1t
o
2t
o
2
2t
j
2n
o
2t
o
nt
.
.
.
.
.
.
.
.
.
.
.
.
j
1n
o
1t
o
nt
j
2n
o
2t
o
nt
o
2
nt
_
_
_
_
_
=
_
_
_
_
_
o
1t
0 0
0 o
2t
0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 o
nt
_
_
_
_
_
. .
D
I
_
_
_
_
_
1 j
12
j
1n
j
12
1 j
2n
.
.
.
.
.
.
.
.
.
.
.
.
j
1n
j
2n
1
_
_
_
_
_
. .
R
_
_
_
_
_
o
1t
0 0
0 o
2t
0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 o
nt
_
_
_
_
_
. .
D
I
= D
t
HD
t
.
Supondo que o
2
it
= .
i
c
i
n
2
i,t1
,
i
o
2
i,t1
, cada elemento o
2
it
envolve 3
parmetros. Por outro lado, a matriz H envolve :(:1) ,2 parmetros. Na
tabela 2 comparam-se os modelos VEC, BEEK e de correlaes constantes (na
verso GARCH(1,1).
No s o nmero de parmetros a estimar menor como tambm a maximiza-
o da funo de log-verosimilhana mais fcil. Retome-se a equao (9.1):
log 1
a
() =
::
2
log (2)
1
2
a
t=1
log [H
t
[
1
2
a
t=1
(y
t
t
)
t
H
1
t
(y
t
t
) .
Pode-se simplicar esta expresso atendendo aos seguintes resultados:
H
t
= D
t
HD
t
,
log [H
t
[ = log [D
t
HD
t
[ = log [D
t
[ log [H[ log [D
t
[ = 2 log [D
t
[ log [H[ ,
(y
t
t
)
t
H
1
t
(y
t
t
) = (y
t
t
)
t
D
1
t
H
1
D
1
t
(y
t
t
) = v
t
t
H
1
v
t
.
Observe-se que v
t
representa o vector das variveis aleatrias estandardizadas:
v
t
t
= (y
t
t
)
t
D
1
t
=
_
y
1I
1I
o
1I
y
2I
2I
o
2I

y
rI
rI
o
rI
_
.
Assim,
log 1
a
() =
::
2
log (2)
a
t=1
log [D
t
[
:
2
log [H[
1
2
a
t=1
v
t
t
H
1
v
t
.
Podemos simplicar log 1
a
() se substituirmos H pela expresso que representa
a soluo da equao matricial 0 log 1
a
() ,0H = 0. Pode-se provar que tal
soluo
H =
a
t=1
v
t
v
t
t
:
.
Afuno log-verosimilhana que assimse obtmdesigna-se funo log-verosimilhana
concentrada:
log 1
a
() = co::t.
a
t=1
log [D
t
[
:
2
log
a
t=1
v
t
v
t
t
:
1
2
a
t=1
v
t
t
_
a
t=1
v
t
t
v
t
:
_
1
v
t
.
Sabendo log [D
t
[ = log (o
1t
... o
nt
) , e utilizando-se mais algumas propriedades
elementares do clculo matricial, a expresso da funo log-verosimilhana pode
ainda apresentar-se na forma simplicada:
log 1
a
() = co::t.
a
t=1
log (o
1t
... o
nt
)
:
2
log
t=1
v
t
v
t
t
.
Note-se que [
a
t=1
v
t
v
t
t
[ naturalmente o determinante de
a
t=1
v
t
v
t
t
. Nos mode-
los VEC e BEEK, necessrio inverter a matriz H
t
para cada t e para cada iterao
do algoritmo de maximizao. Esta diculdade superada com o presente mod-
elo. A principal desvantagem do modelo em anlise o de assumir correlaes
condicionais constantes.
9.7. Modelo Triangular
9.7.1. Introduo e Formalizao do Modelo. O modelo que designamos
de triangular inspirado em Christiansen (2007).
Em certas aplicaes admissvel supor que a mdia de j
1t
condicionada a
T
j
1
t1
= j
1,t1
, j
1,t2
, ... no depende de T
j
2
t1
= j
2,t1
, j
2,t2
, ... , i.e.,
L
_
j
1t
[ T
j
1
t1
' T
j
2
t1
_
=
L
_
j
1t
[ T
j
1
t1
_
.
Diz-se, nestes casos, que j
2
no causa Granger j
1
. Para concretizar, suponha-se
que j
1t
o retorno do NASDAQ e j
2t
o retorno do PSI20. Dadas as dimenses
relativas dos mercados, no faz sentido, supor-se que j
1
(NASDAQ) dado todo o
seu passado, possa ser inuenciado pelos valores atrasados de j
2
(PSI20). Tam-
bm em termos de volatilidade, idntica conjectura pode ser estabelecida, i.e., a
varincia de j
1t
condicionada em T
j
1
t1
no depende dos valores passados de j
2
,
T
j
2
t1
. No entanto, j
2
(PSI20) dado T
j
2
t1
pode depender de T
j
1
t1
(valores passados
do NASDAQ).
Para processos j
1
e j
2
comas caractersticas acima descritas, possvel denirem-
se processos multivariados simplicados.
9.7. MODELO TRIANGULAR 275
Para se ilustrar o modelo, considere-se o processo y = (j
1
, j
2
, j
S
) e suponham-
se as seguintes relaes: j
1
j
2
j
S
onde j
1
j
2
signica j
1
inu-
encia j
2
dado T
j
2
t1
e j
2
no inuencia j
1
dado T
j
1
t1
. Suponha-se ainda que y
segue um processo VAR(1) (vector autoregressivo de ordem 1). Sob a hiptese
j
1
j
2
j
S
e VAR(1), o processo y tem a seguinte representao:
_
_
j
1t
j
2t
j
St
_
_
=
_
_
c
1
c
2
c
S
_
_
_
_
c
11
0 0
c
21
c
22
0
c
S1
c
S2
c
SS
_
_
_
_
j
1,t1
j
2,t1
j
S,t1
_
_
_
_
n
1t
n
2t
n
St
_
_
. (9.5)
Amatriz dos coecientes autoregressivos triangular, porque na mdia condicional
j
1,t
apenas depende de j
1,t1
, j
2t
depende de j
1,t1
e j
2,t1
e j
St
depende de
j
1,t1
, j
2,t1
e j
S,t1
.
Como denir a estrutura de dependncias do segundo momento condicional,
continuando a assumir a relao j
1
j
2
j
S
Uma forma simples e que facilita
extraordinariamente a estimao do modelo, consiste em admitir que
_
_
_
n
1t
= c
1t
n
2t
= ac
1t
c
2t
n
St
= /c
1t
cc
2t
c
St
=
_
_
n
1t
n
2t
n
St
_
_
. .
u
I
=
_
_
1 0 0
a 1 0
/ c 1
_
_
. .
_
_
c
1t
c
2t
c
St
_
_
. .
e
I
onde se admite que (c
1t
, c
2t
, c
St
) so independentes entre si, e c
it
[ T
t1
~
_
0, o
2
it
_
,
o
2
it
= .
i
c
i
c
2
i,t1
,
i
o
2
i,t1
. Observe-se que n
2t
depende de c
2t
(efeitos idiossin-
crsicos) e ainda dos choques idiossincrsicos da primeira equao. Por seu turno,
n
St
depende de c
St
(efeitos idiossincrsicos) e ainda dos choques idiossincrsicos
da primeira e da segunda equao. A volatilidade que decorre dos efeitos no
idiossincrsicos designa-se de volatility spillover.
A designao modelo triangular agora bvia: a equao matricial (9.5)
representa-se na forma,
y
t
= c dy
t1
+e
t
(9.6)
sendo 1 e w matrizes triangulares inferiores. Naturalmente que se perde a relao
j
1
j
2
j
S
, se as matrizes 1 e w no forem triangulares inferiores.
Dadas as hiptese sobre o vector e
t
, dena-se
X
t
:= Vai (e
t
[ T
t1
) =
_
_
o
2
1,t
0 0
0 o
2
2,t
0
0 0 o
2
S,t
_
_
.
Tendo em conta o
2
it
= .
i
c
i
c
2
i,t1
,
i
o
2
i,t1
, tem-se
X
t
=
_
_
.
1
0 0
0 .
2
0
0 0 .
S
_
_
_
_
c
1
c
2
1,t1
0 0
0 c
2
c
2
2,t1
0
0 0 c
S
c
2
S,t1
_
_
_
_
,
1
o
2
1,t1
0 0
0 ,
2
o
2
2,t1
0
0 0 ,
S
o
2
S,t1
_
_
=
_
_
.
1
0 0
0 .
2
0
0 0 .
S
_
_
_
_
c
1
0 0
0 c
2
0
0 0 c
S
_
_
. .
A
_
_
c
2
1,t1
c
1,t1
c
2,t1
c
1,t1
c
S,t1
c
1,t1
c
2,t1
c
2
2,t1
c
2,t1
c
S,t1
c
1,t1
c
S,t1
c
2,t1
c
S,t1
c
2
S,t1
_
_
. .
e
I1
e
0
I1
_
_
,
1
0 0
0 ,
2
0
0 0 ,
S
_
_
. .
B
_
_
o
2
1,t1
0 0
0 o
2
2,t1
0
0 0 o
2
S,t1
_
_
. .
I1
= VA e
t1
e
t
t1
H X
t1
onde o produto de Hadamard e A e H so matrizes diagonais, tendo como
elementos genricos c
i
e ,
i
, respectivamente.
Para se estudar a relao entre Vai (e
t
[ T
t1
) (= X
t
) e Vai (u
t
[ T
t1
) (= H
t
)
comece-se por observar que
u
t
= +e
t
,
e
t
= +
1
u
t
,
e
t
e
t
t
= +
1
u
t
u
t
t
_
+
1
_
t
.
e, portanto,
H
t
= Vai (u
t
[ T
t1
) = Vai (+e
t
[ T
t1
) = +Vai (e
t
[ T
t1
) +
t
= +X
t
+
t
.
Desta ltima relao (i.e., H
t
= +X
t
+
t
), sai X
t
= +
1
H
t
_
+
1
_
t
. Em suma,
H
t
= +X
t
+
t
= +V+
t
+
_
A e
t1
e
t
t1
_
+
t
+(H X
t1
) +
t
= +V+
t
+
_
A +
1
u
t1
u
t
t1
_
+
1
_
t
_
+
t
+
_
H +
1
H
t1
_
+
1
_
t
_
+
t
.
Esta ltima relao escreve H
t
como funo dos termos n
i,t1
n
),t1
e /
i),t1
.
Expandindo a expresso anterior e depois de clculos simples mas fastidiosos
obtm-se, por exemplo,
/
22,t
= a
2
.
1
.
2
a
2
(c
1
c
2
) n
2
1,t1
2ac
2
n
1,t1
n
2,t1
a
2
(,
1
,
2
) /
11,t1
2a,
2
/
12,t1
,
2
/
22,t1
(todas as expresses /
i),t
podem ser assim obtidas).
tambm interessante obter H
t
como funo das expresses o
2
i,t
:
H
t
= +X
t
+
t
=
_
_
1 0 0
a 1 0
/ c 1
_
_
_
_
o
2
1,t
0 0
0 o
2
2,t
0
0 0 o
2
S,t
_
_
_
_
1 a /
0 1 c
0 0 1
_
_
=
_
_
o
2
1,t
ao
2
1,t
/o
2
1,t
ao
2
1,t
a
2
o
2
1,t
o
2
2,t
a/o
2
1,t
co
2
2,t
/o
2
1,t
a/o
2
1,t
co
2
2,t
/
2
o
2
1,t
c
2
o
2
2,t
o
2
S,t
_
_
. (9.7)
A partir de (9.7), deduzem-se tambm os coecientes de correlao condicionados:
j
12,t
=
ao
2
1,t
_
o
2
1,t
_
a
2
o
2
1,t
o
2
2,t
=
ao
1,t
_
a
2
o
2
1,t
o
2
2,t
j
1S,t
=
/o
2
1,t
_
o
2
1,t
_
/
2
o
2
1,t
c
2
o
2
2,t
o
2
S,t
=
/o
1,t
_
/
2
o
2
1,t
c
2
o
2
2,t
o
2
S,t
j
2S,t
=
a/o
2
1,t
co
2
2,t
_
a
2
o
2
1,t
o
2
2,t
_
/
2
o
2
1,t
c
2
o
2
2,t
o
2
S,t
.
Os sinais dos coecientes a, / e c so decisivos nos sinais dos coecientes de
correlao condicionados.
OBSERVAO 9.7.1. Tendo emconta as relao Voc (1C) = (1
t
) Voc (C)
e Voc ( 1) = oiag (Voc ()) Voc (1) onde o produto de Kronecker e oiag
denido como
oiag
__
r
1
r
2
__
=
_
r
1
0
0 r
2
_
,
possvel reescrever H
t
usando o operador Voc. Depois de algumas contas,
obtm-se
Voc (H
t
) =

V

AVoc
_
u
t1
u
t
t1
_

HVoc (H
t1
) (9.8)
onde
V = (++) Voc (V) ,
A = (++) oiag (Voc (A))

_
+
1
+
1
_
,
H = (++) oiag (Voc (H))

_
+
1
+
1
_
.
Como a equao (9.8) est basicamente na forma da equao (9.2) deduz-se que
a condio de ESO do processo u
t
estabelece que todos os valores prprios de
A

H sejam, em mdulo, menores do que um. Pode-se provar que os valores
prprios de

A

H so 0, 0, 0, 0, 0, 0, c
1
,
1
, c
2
,
S
, c
S
,
S
. Logo, dado
c
i
, ,
i
_ 0, o processo ESO sse c
i
,
i
< 1, i = 1, 2, 8. Conclui-se que a
condio de segunda ordem coincide com a do processo e
t
.
9.7.2. Estimao. Considere a representao y
t
= c dy
t1
+e
t
(equao
(9.6)), isto ,
j
1t
= c
1
c
11
j
1,t1
c
1t
(9.9)
j
2t
= c
2
c
21
j
1,t1
c
22
j
2,t1
ac
1t
c
2t
(9.10)
j
St
= c
S
c
S1
j
1,t1
c
S2
j
2,t1
c
SS
j
S,t1
/c
1t
cc
2t
c
St
(9.11)
onde c
it
[ T
t1
~
_
0, o
2
it
_
, o
2
it
= .
i
c
i
c
2
i,t1
,
i
o
2
i,t1
. A estimao do
modelo pode ser conduzida da seguinte forma:
(1) Estimar a equao (9.9), pelo mtodo da mxima verosimilhana, e obter
os resduos c
1t
.
(2) Substituir, na equao (9.10), c
1t
por c
1t
e estimar o modelo. Obter os
resduos c
2t
.
(3) Substituir, na equao (9.11), c
1t
por c
1t
e c
2t
por c
2t
e estimar o modelo.
Estuda-se a seguir a verosimilhana associada ao modelo em anlise. A funo
log-verosimilhana dada pela expresso (9.1). Tendo em conta a estrutura tri-
angular do modelo possvel simplicar a log-verosimilhana e decomp-la em
trs parcelas, como se mostra a seguir. Observe-se, em primeiro lugar,
(y
t
t
)
t
H
1
t
(y
t
t
) = u
t
t
_
+
t
_
1
X
1
t
+
1
u
t
=
1
o
2
1t
n
2
1t

1
o
2
2t
(n
2t
an
1t
)
2
1
o
2
St
(n
St
(/ ac) n
1t
cn
2t
)
2
log [H
t
[ = log
+X
t
+
t
= log
_
[+[
2
[X
t
[
_
= log
_
[+[
2
_
log ([X
t
[) = log (1) log
_
o
2
1t
o
2
2t
o
2
St
_
= log
_
o
2
1t
_
log
_
o
2
2t
_
log
_
o
2
St
_
(/ ac) n
1t
cn
2t
= /c
1t
cc
2t
.
Tem-se assim,
log 1
a
() =
::
2
log (2)
1
2
a
t=1
log [H
t
[
1
2
a
t=1
(y
t
t
)
t
H
1
t
(y
t
t
) .
=
::
2
log (2)
1
2
a
t=1
_
log
_
o
2
1t
_
log
_
o
2
2t
_
log
_
o
2
St
__
(9.12)
1
2
a
t=1
_
1
o
2
1t
n
2
1t

1
o
2
2t
(n
2t
an
1t
)
2
(9.13)
1
o
2
St
(n
St
(/ ac) n
1t
cn
2t
)
2
_
(9.14)
=
::
2
log (2)
1
2
a
t=1
_
log
_
o
2
1t
_
log
_
o
2
2t
_
log
_
o
2
St
__
1
2
a
t=1
_
1
o
2
1t
n
2
1t

1
o
2
2t
(n
2t
ac
1t
)
2
1
o
2
St
(n
St
/c
1t
cc
2t
)
2
_
=
::
2
log (2)
_
1
2
a
t=1
log
_
o
2
1t
_
1
2
a
t=1
1
o
2
1t
n
2
1t
_
. .
log 1
n,1
1
2
a
t=1
log
_
o
2
2t
_
1
2
a
t=1
1
o
2
2t
(n
2t
ac
1t
)
2
_
. .
log 1
n,2
_
1
2
a
t=1
log
_
o
2
St
_
1
2
a
t=1
1
o
2
St
(n
St
/c
1t
cc
2t
)
2
_
. .
log 1
n,3
= log 1
a,1
log 1
a,2
log 1
a,S
A decomposio log 1
a
() = log 1
a,1
log 1
a,2
log 1
a,S
, mostra que a es-
timao pode ser feita consistentemente de acordo com os passos acima indicados.
A primeira parcela, log 1
a,1
, s depende do vector
1
= (c
1
, c
11
, .
1
, c
1
, ,
1
)
t
.
Estes parmetros so estimados de forma consistente e eciente maximizando
(apenas) log 1
a,1
(trata-se, portanto, da estimao, pelos mtodos habituais, da
equao (9.9)). A segunda parcela, log 1
a,2
, depende do vector,
2
= (c
2
, c
21
, c
22
, .
2
, c
2
, ,
2
, a)
t
e ainda de
1
, atravs dos erros c
1t
. A estimao de
2
atravs da maximizao
de log 1
a,2
pode ser feita de forma consistente, mas no eciente, substituindo
os erros c
1t
por c
1t
. A estimao consistente pois c
1t
baseiam-se no
estimador consistente
`
1
, obtido no primeiro passo. Claro que a maximizao
de log 1
a,2
corresponde estimao da equao (9.10), pelos mtodos habitu-
ais ((com c
1t
em lugar de c
1t
). Este raciocnio aplica-se de forma anloga
a log 1
a,S
.
Como nota nal, observe-se que a estimao do modelo pode ser totalmente
eciente se a maximizao de log 1
a
for simultnea (conram-se as equaes
(9.12)-(9.14)). Como se sabe, o problema da maximizao de log 1
a
, entre out-
ros, o dos valores iniciais dos parmetros a estimar. Este problema mitigado no
presente contexto: basta fornecer como valores iniciais as estimativas obtidas na
estimao em trs passos, acima apresentada.
9.7.3. Testes e Rcios de Varincia. Considere-se novamente
_
_
_
n
1t
= c
1t
n
2t
= ac
1t
c
2t
n
St
= /c
1t
cc
2t
c
St
,
_
_
_
/
11,t
= o
2
1t
/
22,t
= a
2
o
2
1t
o
2
2t
/
SS,t
= /
2
o
2
1t
c
2
o
2
2t
o
2
St
.
Observmos que n
2t
depende de c
2t
(efeitos idiossincrsicos) e ainda dos choques
idiossincrsicos da primeira equao. Por seu turno, n
St
depende de c
St
(efeitos
idiossincrsicos) e ainda dos choques idiossincrsicos da primeira e da segunda
equao. Como referimos, a volatilidade que decorre dos efeitos no idiossincrsi-
cos designa-se de volatility spillover. Desta forma, existem efeitos de volatility
spillover do mercado 1 para o mercado 2 se a ,= 0 e dos mercados 1 e 2 para o
mercado 3 se / ,= 0 e c ,= 0.
Pode-se ainda obter informao sobre a evoluo da transmisso da volatili-
dade ao longo do tempo atravs de rcios de volatilidade. Seja 1\
i,)
t
a proporo
da varincia do mercado , que causada pelo efeito de volatility spillover do mer-
cado i (efeito do mercado i para ,, i ,). Tem-se
1\
1,2
t
=
a
2
o
2
1t
/
22,t
,
1\
1,S
t
=
/
2
o
2
1t
/
SS,t
1\
2,S
t
=
c
2
o
2
2t
/
SS,t
.
Por exemplo, 1\
2,S
t
representa a proporo da varincia condicional do mercado
3 que causada pelo efeito volatility spillover do mercado 2.
9.7.4. Exemplo. Pinto (2010) analisou a transmisso de volatilidade do mer-
cado Norte-Americano (US) para o mercado Europeu (EU) e, em particular, as
repercusses destes dois mercados no mercado Portugus (PT), atravs de ummod-
elo triangular. O perodo analisado foi 4 de Janeiro de 1993 a 4 de Setembro de
2009. As variveis em anlise so: r
1t
- retorno do SP500, r
2t
- retorno do DJ
Euro 50 e r
St
- retorno do PSI 20. Nas guras 9.2 a 9.4 apresentam-se os modelos
estimados (na verso mais simples).
fcil constatar que existe evidncia estatstica de efeitos de volatility spillover
do mercado US para o mercado EU ( a = 0.201 e rejeita-se a hiptese a ,= 0
com valor-p = 0 - ver gura 9.3) e dos mercados US e EU para o mercado PT
(
/ = 0.288, c = 0.4066 e rejeitam-se as hipteses / ,= 0 e c ,= 0 - ver gura 9.4).

Dependent Variable: R1
Method: ML - ARCH
Sample (adjusted): 6/01/1993 4/09/2009
Variable Coefficient Std. Error z-Statistic Prob.
C 0.052202 0.013247 3.940658 0.0001
R1(-1) -0.017161 0.017808 -0.963644 0.3352
Variance Equation
C 0.007049 0.001077 6.546092 0.0000
RESID(-1)^2 0.066257 0.004820 13.74617 0.0000
GARCH(-1) 0.929667 0.005114 181.7812 0.0000
FIGURA 9.2. Estimao, primeiro passo - ver equao (9.9)
Method: ML - ARCH
Sample (adjusted): 6/01/1993 4/09/2009
C 0.052704 0.013123 4.016235 0.0001
R1(-1) 0.449084 0.019369 23.18547 0.0000
R2(-1) -0.179191 0.015456 -11.59382 0.0000
RES1 0.552914 0.015972 34.61746 0.0000
Variance Equation
C 0.009916 0.002944 3.367632 0.0008
RESID(-1)^2 0.068232 0.010502 6.497201 0.0000
GARCH(-1) 0.923938 0.010928 84.55149 0.0000
FIGURA 9.3. Estimao, segundo passo - ver equao (9.10)
Method: ML - ARCH
Sample (adjusted): 6/01/1993 4/09/2009
C 0.043610 0.010837 4.024173 0.0001
R1(-1) 0.222423 0.010966 20.28223 0.0000
R2(-1) -0.093210 0.012230 -7.621611 0.0000
R3(-1) 0.143101 0.016376 8.738563 0.0000
RES1 0.233364 0.007759 30.07544 0.0000
RES2 0.406663 0.008429 48.24352 0.0000
Variance Equation
C 0.027709 0.002862 9.681126 0.0000
RESID(-1)^2 0.158430 0.009900 16.00381 0.0000
GARCH(-1) 0.815877 0.010650 76.60615 0.0000
FIGURA 9.4. Estimao, terceiro passo - ver equao (9.11)
.1
.2
.3
.4
.5
.6
.7
.8
.9
94 96 98 00 02 04 06 08
PT-EU PT-US EU-US
FIGURA 9.5. Coecientes de Correlao Condicional
Na gura 9.5 apresentam-se os coecientes de correlao condicionados (val-
ores mdios mensais). Podem ser retiradas algumas concluses:
As correlaes condicionadas entre os mercados US e EU e entre os mer-
cados EU e PT so, em mdia, relativamente fortes.
A correlao menos expressiva, mas signicativa, entre o mercado US
e o mercado PT, embora se assista ao longo do perodo a um aumento
dessa correlao.
Tendo em conta que as correlaes so positivas, os retornos tendem a
utuar na mesma direco; por outro lado, verica-se uma tendncia de
crescimento das correlaes, ou seja, uma tendncia crescente de interli-
gao entre os diferentes mercados.
Alguns dos valores mais altos dos coecientes de correlao coincidem
com algumas crises nanceiras
5
. Este facto particularmente notrio
com a crise do subprime de 2008.
Na gura 9.6 analisa-se a transmisso da volatilidade dos mercados EU e
US para o mercado PT atravs dos rcios de volatilidade. So considerados os
5
As principais crises nanceiras no perodo em anlise so as seguintes: Recesso do Japo,
1991; Crise do Mxico, 1994/1995; Bolha Dot.com, 2000; Crise de 2001 (ataque s Twin Towers);
Crise da Argentina, 2002; Crise do Subprime, 2007/2008.
0.0
0.2
0.4
0.6
0.8
1.0
94 96 98 00 02 04 06 08
RV_EU RV_PT RV_US
FIGURA 9.6. Rcios de Volatilidade
seguintes rcios
1\ _lo
t
= 1\
1,S
t
=

/
2
o
2
1t
/
SS,t
,
1\ _1l
t
= 1\
2,S
t
=
c
2
o
2
2t
/
SS,t
,
1\ _1T
t
= 1 1\ _lo
t
1\ _1l
t
.
Podem ser retiradas algumas concluses:
A volatilidade do mercado PT decorre em larga medida do seu prprio
mercado (efeito idiossincrtico), embora este efeito tenha a vindo a diminuir
ao longo do tempo. Por outras palavras, o efeito de volatilidade spillover
dos mercados EU e US sobre o mercado PT tem vindo a aumentar ao
longo do tempo.
O efeito de volatilidade spillover do mercado EU (para o mercado PT)
geralmente mais forte do que o do mercado US. No entanto, no perodo da
crise do subprime, o mercado US transmitiu mais volatilidade ao mercado
PT do que o mercado EU.
Nos perodos de crise o efeito idiossincrtico tende em geral a diminuir.
Observe-se por exemplo, as crise de 2000 (das dot.com), de 2001 e de
2008.
Verica-se uma tendncia de crescimento do rcio de volatilidade US
para o mercado PT.
9.8. GARCH Ortogonal
semelhana do modelo triangular, a principal vantagem do GARCH or-
togonal a de podermos estimar um GARCH multivariado atravs de GARCHs
univariados.
Seja y
t
= (j
1t
, j
2t
, ..., j
nt
)
t
o vector das observaes no momento t (t =
1, ..., :). Se quisermos normalizar as variveis consideramos
r
it
=
j
it
L
(j
it
)
o
i
.
(substituir
L
(j
it
) e o
i
pelos respectivos momentos da amostra, caso os parmet-
ros sejam desconhecidos). Logo
L
(r
it
) = 0 e Vai (r
it
) = 1. Para simplicar
suponhase
L
(j
it
) = 0. Nestas condies podemos escrever
y
t
=
_
_
_
_
_
o
1
0 0
0 o
2
0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 o
n
_
_
_
_
_
. .
_
_
_
_
_
r
1t
r
2t
.
.
.
r
nt
_
_
_
_
_
. .
a
I
= Xx
t
.
Suponha-se que possvel encontrar matrizes I
t
de tipo :1 e Vde tipo ::
nas seguintes condies:
x
t
= VI
t
I
t
I
t
t
diagonal. (9.15)
Suponha-se que V no aleatrio dado T
t1
. Vem
Cov (y
t
[ T
t1
) = Cov (Xx
t
[ T
t1
)
=
L
_
Xx
t
x
t
t
X
T
t1
_
= X
L
_
x
t
x
t
t
T
t1
_
X
= X
L
_
VI
t
I
t
t
V
t
T
t1
_
X
= XV
L
_
I
t
I
t
t
T
t1
_
V
t
X
Tendo em conta (9.15) vem
L
_
I
t
I
t
t
T
t1
_
=
_
_
_
_
_
L
_
1
2
t1
T
t1
_
0 0
0
L
_
1
2
2t
T
t1
_
0
.
.
.
.
.
.
.
.
.
.
.
.
0 0
L
_
1
2
nt
T
t1
_
_
_
_
_
_
.
Vantagemda especicao Cov (y
t
[ T
t1
) = XV
L
(I
t
I
t
t
[ T
t1
) V
t
X? Supondo
que se conhecem as matrizes e V, modelar Cov (y
t
[ T
t1
) equivale a mode-
lar apenas as varincias condicionais de 1
it
. No temos que nos preocupar com a
modelao das covarincias condicionais! Alm disso Cov (y
t
[ T
t1
) denida
positiva, por construo.
Obter a matriz V
9.8. GARCH ORTOGONAL 285
Seja Xa matriz das observaes estandardizadas, X =
_
x
1
x
2
x
n
_
de tipo : : (por exemplo, x
1
representa o vector das observaes estandard-
izadas da varivel 1) e
`
Y =
X
t
X
:
.
\ a matriz de correlaes de j
t
. Por exemplo, o elemento (1, 2) de \
x
t
1
x
2
:
=
a
t=1
r
1t
r
2t
:
=
a
t=1
j
1I
!(j
1I
)
o
1
j
2I
!(j
2I
)
o
2
:
=
1
a
a
t=1
(j
1t
L
(j
1t
)) (j
2t
L
(j
2t
))
o
1
o
2
.
Considerar
x
t
1
x
2
:
=
1
a
a
t=1
(j
1t
j
1
) (j
2t
j
2
)
o
1
o
2
se os momentos
L
(j
1t
),
L
(j
2t
), o
1
e o
2
forem desconhecidos.
Como se sabe, se V
i
vector prprio de \ e `
i
o valor prprio associado a
V
i
ento
`
YV
i
= `
i
V
i
, i = 1, ..., :
Compactamente
`
YV = VA
onde V =
_
V
1
... V
n
_
a matriz dos vectores prprios associada a Y
e A =oiag (`
1
, ..., `
n
) . Note-se que V
t
V = I (
`
Y simtrica, logo possvel
obter V tal que V
t
V = I ). Como
X = IV
t
=I = X
_
V
t
_
1
= XV
tem-se
I
t
I = V
t
X
t
XV
= :V
t
`
YV
= :V
t
VA
= :A.
Portanto, se V a matriz dos vectores prprios associada a Y ento I
t
I uma
matriz diagonal.
Passos:
(1) Estandardizar Y e obter X. Estimar
X =
_
_
_
_
_
o
1
0 0
0 o
2
0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 o
n
_
_
_
_
_
, o
i
=
_
Vai (j
it
)
(2) Calcular
`
Y = X
t
X,:.
(3) Calcular os vector prprios (V) de
`
Y.
(4) Obter I = XV.
FIGURA 9.7. Aplicao (rendabilidade do ndice de mercado:
NASDAQ; INDUSTRIAL, COMPUTER)
(5) Modelar separadamente as coluna de I atravs de um GARCH.
(6) Para cada t considerar
Cov (y
t
[ T
t1
) = XV
L
_
I
t
I
t
t
T
t1
_
V
t
X.
Modelao de Sistemas de Grande Dimenso
possvel reduzir a calculatria considerando apenas certos vectores de I = XV
- estes vectores designam-se de componentes principais. Para explicar esta ideia,
considere-se
I
t
I
:
= A (9.16)
Logo A pode ser considerado uma estimativa da matriz de varincias-covarincias
de I. Como
I =
_
I
1
... I
n
_
tem-se
I
t
I =
_
_
_
_
_
I
t
1
I
1
0 0
0 I
t
2
I
2
0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 I
t
n
I
n
_
_
_
_
_
9.8. GARCH ORTOGONAL 287
e, atendendo a (9.16), conclui-se que a varincia da componente principal i igual
a
I
t
i
I
i
:
= `
i
.
Por outro lado, atendendo a X = IV
t
, tem-se
X
t
X
:
=
VI
t
IV
t
:
= VAV
t
.
Em suma, a proporo da variao total de X que explicada pela i-sima com-
ponente principal `
i
,
n
)=1
`
i
= `
i
,:. Quanto maior for `
i
mais peso tem a
i-sima componente principal na explicao da variao total de X. As compo-
nentes principais cujos valores prprios so muitos baixos podem ser descartados.
Na prtica procede-se assim:
ordenam-se os valores prprios por ordem descendente , i.e. `
1
`
2

...
ordenam-se os vectores prprios de acordo com os valores prprios orde-
nados, i.e., a primeira coluna de V, V
1
, o vector prprio associado a
`
1
, a segunda coluna de V
2
o vector prprio associado a `
2
, etc.
Em lugar de se trabalhar com V trabalha-se com uma submatriz de V, seja
V
+
essa matriz, constituda pelas primeiras / colunas. Como resultado passa-se a
ter apenas as / componentes principais mais signicativas:
I
+
= XV
+
que tem dimenso : /. Nestas circunstncias necessrio modelar apenas estas
/ componentes principais. Assim,
Cov (y
t
[ T
t1
) - XV
+
L
_
I
+
t
(I
+
t
)
t
T
t1
_
(V
+
)
t
X
e
L
_
I
+
t
(I
+
t
)
t
T
t1
_
=
_
_
_
_
_
L
_
1
2
1t
T
t1
_
0 0
0
L
_
1
2
2t
T
t1
_
0
.
.
.
.
.
.
.
.
.
.
.
.
0 0
L
_
1
2
tI
T
t1
_
_
_
_
_
_
.
(I
+
t
a linha t da matriz I
+
).
Passos:
(1) Estandardizar Y e obter X. Estimar
X =
_
_
_
_
_
o
1
0 0
0 o
2
0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 o
n
_
_
_
_
_
, o
i
=
_
Vai (j
it
)
(2) Calcular
`
Y = X
t
X,:.
(3) Calcular os valores prprios e vector prprios de
`
Y (ordenam-se os val-
ores prprios por ordem descendente , i.e. `
1
`
2
...e ordenam-se os
vectores prprios de acordo com os valores prprios ordenados).
(4) A partir do passo 3 obter V
+
e I
+
= XV
+
.
(5) Modelar separadamente coluna de I
+
atravs de um GARCH.
(6) Para cada t considerar
Cov (y
t
[ T
t1
) - XV
+
L
_
I
+
t
(I
+
t
)
t
T
t1
_
(V
+
)
t
X.
9.9. Testes de Diagnstico
Nos vrios modelos, a hiptese de partida u
t
[ T
t1
~ (0, H
t
) ou, de
forma equivalente, u
t
= H
12
t
"
t
onde "
t
~ (0, I
n
) . Se o modelo estiver cor-
rectamente especicado, "
t
deve ser uma sucesso de vectores i.i.d., com matriz
de varincias-covarincias (contempornea) dada por I
n
. Naturalmente que "
t

desconhecido, mas pode ser estimado da seguinte forma
`"
t
=
`
H
12
t
` u
t
.
`"
t
o vector dos resduos estandardizados (e ` u
t
o vector dos resduos). A matriz
`
H
12
t
pode obter-se a partir da decomposio Cholesky, seguindo os seguintes
passos. 1) Dado
`
H
t
, obter uma matriz triangular
`
H
12
t
, usando a decomposio
de Cholesky, i.e., obter uma matriz
`
H
12
t
tal que
`
H
t
=
`
H
12
t
_
`
H
12
t
_
t
; 2) Inverter
`
H
12
t
. Por exemplo, considere-se um sistema de duas equaes (: = 2)
H
t
=
_
o
2
1t
o
12,t
o
12,t
o
2
2t
_
=
_
o
2
1t
j
t
o
1t
o
2t
j
t
o
1t
o
2t
o
2
2t
_
.
A decomposio de Cholesky fornece
H
12
t
=
_
o
1t
0
j
t
o
2t
o
2t
_
1 j
2
t
_
.
(verique que o produto H
12
t
_
H
12
t
_
t
H
t
). Assim,
H
12
t
=
_
1
o
1I
0
j
I
o
1I
_
1j
2
I
1
o
2I
_
1j
2
I
_
.
(Deixa-se como exerccio mostrar que
L
("
t
) = 0 e Vai ("
t
) = Vai
_
H
12
t
u
t
_
=
I
a
). Desta forma (continuando o exemplo) a expresso `"
t
=
`
H
12
t
` u
t
vale
_
-
1t
-
2t
_
=
_
1
` o
1I
0
` j
I
` o
1I
_
1` j
2
I
1
` o
2I
_
1j
2
I
_
_
n
1t
n
2t
_
=
_
` &
1I
` o
1I
` &
2I
` o
2I
_
1` j
2
I
` &
1I
` j
I
` o
1I
_
1` j
2
I
_
.
Vrios testes podem ser invocados. Para avaliar se os efeitos de heterocedas-
ticidades esto convenientemente modelados, Engle (2002) sugere o seguinte pro-
cedimento. Primeiro passo: regresso de -
2
1t
sobre as seguintes variveis (para
alm de um termo constante):
9.9. TESTES DE DIAGNSTICO 289
resduos quadrticos -
2
i,tI
, com i = 1, ..., : e / = 1, ..., 1 (1 desfasa-
mentos) e
termos cruzados -
i,tI
-
),tI
, com i, , = 1, ..., : e / = 1, ..., 1.
Por exemplo no caso : = 2 e 1 = 1, a regresso envolveria as seguintes
variveis:
_
1, -
2
1t1
, -
2
2t1
, -
1,t1
-
2,t1
_
.
Segundo passo: teste F de nulidade de todos os parmetros com excepo do termo
independente. Se existir evidncia estatstica contra a hiptese nula, podemos sus-
peitar que a matriz H
t
no foi convenientemente modelada. Nos passos seguintes
repete-se o procedimento, tomando sucessivamente -
2
i,t
i = 2, ..., : como varivel
dependente na regresso auxiliar.
Naturalmente conveniente vericar tambm se `"
t
um rudo branco. O
procedimento anterior pode ser repetido substituindo os resduos estandardizados
ao quadrado simplesmente pelos resduos estandardizados e eliminando os termos
cruzados.
Parte 3
Aplicaes
CAPTULO 10
Ecincia do Mercado de Capitais
10.1. Introduo e Denies
O mercado de capitais diz-se eciente se os preos dos produtos nanceiros
reectirem toda a informao disponvel. Quando libertada uma informao rel-
evante (por exemplo, um anncio de distribuio de dividendos de valor superior
ao esperado, um anncio de fuses ou aquisies, etc.) num mercado eciente os
agentes reagem imediatamente comprando ou vendendo de acordo com a infor-
mao e os preos ajustam-se imediatamente.
Num mercado eciente, supe-se que os agentes interpretam correctamente a
informao. Caso contrrio o preo pode no se ajustar rapidamente e abrem-se
oportunidades para a realizao de rendibilidades anormais. Por exemplo, um in-
vestidor que compre imediatamente aces aps a divulgao de uma boa notcia
pode obter um retorno anormal se o preo de mercado se ajustar lentamente in-
formao disponvel. Com efeito, bastar ao investidor vender as aces depois do
preo se ajustar a um nvel mais alto.
difcil imaginar um mercado completamente eciente em todos os perodos
de tempo. Pode suceder que em certos momentos e face a determinadas notcias
o mercado apresente inecincias que podem ser exploradas. Faz tambm sentido
admitir que existem mercados mais ecientes do que outros (mercados emergentes
tendem a ser menos ecientes).
A ecincia dos mercados est intimamente relacionada com a informao
disponvel. Fama (1970) props trs formas de ecincia consoante a natureza da
informao disponvel:
um mercado eciente na forma fraca se os preos dos ttulos reec-
tirem toda a informao sobre os preos passados; como consequncia,
as cotaes passadas no podem ser utilizadas para obter rentabilidades
anormais;
ummercado eciente na forma semi-forte se os preos dos ttulos reec-
tirem toda a informao disponvel ao pblico; a informao disponvel
ao pblico inclui os preos passados, situao econmica e nanceira
da empresa e, em geral, toda a informao no condencial que o pblico
em geral pode aceder;
um mercado eciente na forma forte se os preos dos ttulos reectirem
toda a informao disponvel, pblica e privada; a informao privada
conhecida apenas dos gestores da empresa.
293
294 10. EFICINCIA DO MERCADO DE CAPITAIS
A hiptese dos mercados ecientes admite que todas as informaes relevantes
esto disponveis (a baixo custo) e que as cotaes reectem o conjunto dessas
informaes. Desta forma, no possvel com base na informao disponvel,
obter ganhos persistentes acima do retorno normal; se o mercado ineciente,
os preos no traduzem o seu valor justo ou valor intrnseco e possvel obter
rendibilidades anormais.
A questo que normalmente se coloca consiste em saber se possvel obter
rendibilidades anormais de forma persistente utilizando uma estratgia de investi-
mento. Uma forma para analisar esta questo consiste em comparar a rendibilidade
que se obtm a partir de uma certa estratgia de investimento com a rendibilidade
normal ou esperada deduzida em funo de um modelo de equilbrio como o
CAPM ou APT. Outra metodologia baseia-se em saber se os retornos so ou no
previsveis. Esta anlise pode ser conduzida a partir de um modelo do tipo
r
t
= ) (x
t1
) n
t
onde x
t1
um vector de variveis cujos valores so conhecidos no momento t1.
Assim, r
t
previsvel se x
t1
explicar r
t
(por outras palavras, r
t
previsvel se
L
(r
t
[ T
t1
) ,=
L
(r
t
)). O vector x
t1
pode incluir r
t1
ou fundamental vari-
ables como por exemplo, variveis nanceiras (treasury bill rates, bonds returns,
dividend yield (dividendo por aco/cotao), price-earning ratios (cotao/lucro),
etc.) ou variveis macroeconmicas (produto, inao, etc.).
10.2. Teste Ecincia Fraca de Mercado
Analisa-se se possvel obter rendibilidades anormais de forma persistente
utilizando uma estratgia de investimento baseada apenas nos preos passados.
Para simplicar admita-se que o retorno normal,
L
(r
t
) = j 0 con-
stante. Se o mercado eciente ento indiferente usar ou no usar a informao
disponvel T
t1
para prever r
t
e, desta forma tem-se
L
(r
t
[ T
t1
) =
L
(r
t
) . (10.1)
Note-se que
L
(r
t
) representa a previso de r
t
no baseada em qualquer informao
especca, a no ser nas caractersticas gerais do processo. Pelo contrrio, se
L
(r
t
[ T
t1
) ,=
L
(r
t
)
ento, a informao disponvel T
t1
relevante para prever os retornos futuros.
Nestas circunstncias, existe alguma informao sobre a tendncia provvel de
r
t
, e ser possvel, em princpio, obter rentabilidades anormais, usando a infor-
mao disponvel T
t1
.
A equao (10.1) pode ser violada de inmeras formas. Por exemplo, r
t
pode
ser autocorrelacionado ou r
t
pode ser uma funo no linear de r
t1
(se r
t
seguir
um qualquer dos modelos discutidos anteriormente, como por exemplo, o modelo
Markov-Switching ou o Limiar Autoregressivo, a equao (10.1) violada). As
regras de compra e venda baseadas na anlise tcnica baseiam-se tambm em
relaes no lineares entre os preos correntes e os seus valores passados, ou sejam,
supem que a igualdade (10.1) violada.
10.2. TESTE EFICINCIA FRACA DE MERCADO 295
Certos autores formalizam o modelo de mercado eciente estabelecendo que o
preo ou o logaritmo do preo um passeio aleatrio
1
,
log 1
t
= log 1
t1
n
t
sendo n
t
um processo rudo branco ou, em termos mais gerais, uma diferena de
martingala. Esta formalizao implica (10.1) e ainda que log 1
t
uma martingala,
L
(log 1
t
[ T
t1
) = log 1
t1
.
Esta formalizao contra intuitiva pois assume que o valor esperado do retorno
zero (
L
(r
t
) = 0) e, portanto, que o prmio de risco negativo. Todavia, se o
retorno for convenientemente ajustado ao risco, a propriedade de martingala deve
vericar-se (vejam-se as referncias em Campbell et al., 1997, pg. 31).
Um modelo mais natural e compatvel com (10.1) o modelo de passeio
aleatrio com deriva (positiva),
log 1
t
= c log 1
t1
n
t
, c 0.
Considerando r
t
= log 1
t
log 1
t1
, o modelo de passeio aleatrio com deriva
equivalente a r
t
= c n
t
e, portanto,
L
(r
v
[ T
t1
) =
L
(r
t
) = c.
10.2.1. Testes de Autocorrelao. Analise-se o exemplo seguinte.
EXEMPLO 10.2.1. Suponha-se r
t
= c cr
t1
n
t
, [c[ < 1, onde n
t
um
rudo branco. Ento
L
(r
t
) =
c
1 c
,
L
(r
t
[ T
t1
) = c cr
t1
e a equao (10.1) violada. Note-se tambm que r autocorrelacionado.
Um teste ecincia fraca dos mercados consiste, por exemplo, em ensaiar
H
0
: j
1
= ... = j
n
= 0 atravs da estatstica
Q = :(: 2)
n
I=1
1
: /
j
2
I
o
2
(n)
A rejeio de H
0
pode sugerir inecincia de mercado, mas no a implica neces-
sariamente. Comefeito, pode suceder que a rejeio de H
0
se faa comcoecientes
de autocorrelao demasiadamente baixos para oferecerem qualquer possibilidade
de ganhos anormais, depois de deduzidos os custos transaco. Seria necessrio
investigar se a estrutura de autocorrelao detectada implicaria uma rendibilidade
superior a um portfolio de referncia. Por outro lado, a no rejeio de H
0
no im-
plica aceitao da ecincia da forma fraca porque pode suceder que
L
(r
t
[ T
t1
)
seja uma funo no linear de T
t1
com fraca dependncia linear.
1
A rigor um impossibilidade o preo ser um passeio aleatrio,
1
I
= 1
I1
&
I
uma vez que 1
I
, neste modelo, no limitado em probabilidade. Isto signica que pode assumir
valores negativos com probabilidade um quando t tende para o. De facto, prova-se que 1
I
visita os
estados oe oinnitas vezes quando t o. Como os preos no podem ser negativos, por
denio, o preo no pode ser um passeio aleatrio.
10.2.2. Regras de Compra e Venda e a Anlise Tcnica. Uma forma pop-
ular entre traders and nancial professionals de denir regras de compra e venda
assenta na chamada anlise tcnica. A anlise tcnica baseia-se num conjunto de
indicadores estatsticos gerados pelo mercado, tais como preos e volume, visando
estabelecer regras de compra e venda de activos cotados em bolsa
2
. A general-
idade dos indicadores procura detectar tendncias de subida ou descida das co-
taes. Analisam-se trs regras de compra e venda (provavelmente as mais uti-
lizadas e conhecidas, mas existem muitas outras regras) e discutem-se procedimen-
tos economtricos destinados a aferir a qualidade das regras. A previsibilidade as-
sociada s regras de compra e venda no signica necessariamente inecincia de
mercado. Para argumentar que um mercado ineciente necessrio demonstrar
que a regra de investimento seleccionada superior a um porfolio de referncia.
10.2.2.1. Regra Mdia Mvel. Seja
'
t
(/) =
1
t
1
t1
... 1
tI1
/
uma mdia mvel (MM) de ordem / da varivel 1, no momento t. A estatstica
'
t
(/) fornece uma medida de tendncia local de 1. Quanto maior for / mais
informao atrasada a mdia mvel contm e, tambm, mais alisada a tendncia.
Pelo contrrio, se / baixo, a estatstica '
t
(/) fornece apenas a tendncia recente
de 1. Dena-se assim a MM de curto prazo, '
t
(c) , onde c uma valor baixo
e a MM de longo prazo, '
t
(|) onde | um valor alto. Tipicamente, para dados
dirios, c e | so escolhido nos intervalos, 1 _ c _ e 0 _ | _ 20. Do confronto
entre a MM de curto e longo prazo argumenta-se que possvel projectar uma
tendncia futura de 1. Mais concretamente, se '
t
(c) '
t
(|) , os preos mais
recentes esto mais altos do que os preos mais antigos. Isto sugere que os preos
seguem uma tendncia positiva. A regra prescreve uma compra para o perodo
t 1. Se as duas mdias so aproximadamente iguais, a tendncia futura sobre
os preos no clara, e neste caso no h lugar a compra ou venda. Esta regra
pode ser melhorada, estabelecendo um sinal de compra ou venda apenas quando a
diferena entre '
t
(c) e '
t
(|) for signicativa, digamos acima de um certo limiar
1 (bandwidth). Assim, as regras de compra e venda para o dia t 1, passariam
a ser: comprar se '
t
(c) '
t
(|) 1; vender se '
t
(c) < '
t
(|) 1 e no
transaccionar se ['
t
(c) '
t
(|)[ _ 1.
Na gura 10.1 ilustra-se a regra mdia mvel ao NASDAQ composite (Jan-05
a Mar-06). Fixou-se c = 10 e | = 0. Em princpio deveriamos escolher um valor
de c entre 1 e 5; todavia, a escolha c = 10 permite identicar melhor gracamente
a mdia mvel '
t
(10) (com c _ a srie '
t
(c) praticamente no se distingue,
gracamente, de 1).
10.2.2.2. Regra Canal. semelhana da regra mdia mvel, tambm esta
regra se baseia numa hiptese sobre a evoluo futura da tendncia dos preos.
Antev-se uma subida ou descida dos preos com base na comparao entre o
2
A abordagem fundamental analysis, ao contrrio, estabele regras de compra e venda com base
em factores nanceiros e econmicos. Por exemplo, analisam-se variveis nanceiras (treasury
bill rates, bonds returns, dividend yield (dividendo por aco/cotao), price-earning ratios (co-
tao/lucro), etc.) ou macroeconmicas (produto, inao, etc.).
NASDAQ composite
1780
1880
1980
2080
2180
2280
2380
Jan-05 Mar-05 May-05 Jul-05 Sep-05 Nov-05 Jan-06
P
MM curta
MM longa
comprar = 1, vender = 0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
FIGURA 10.1. Regra Mdia Mvel - Aplicao ao NASDAQ
composite Jan-05 a Mar-06
valor actual do preo 1
t
e o valor mnimo ou mximo atingido pelos preos nos
ltimos 1 dias. Sejam,
:
t1
= min(1
t1
, 1
t2
, ..., 1
t1
) ,
'
t1
= max (1
t1
, 1
t2
, ..., 1
t1
)
respectivamente os valores mnimo e mximo atingidos pelos preos nos ltimos
1 dias. A ideia a seguinte: se no dia t houve uma indicao de compra e 1
t

signicativamente superior a :
t1
ento antev-se uma tendncia de crescimento
dos preos e a indicao deve ser de compra; de igual forma, se no dia t houve uma
indicao de venda e 1
t
signicativamente inferior a '
t1
ento antev-se uma
tendncia de queda dos preos e a indicao deve ser de venda. Diz-se que 1
t

signicativamente superior (inferior) a '
t1
se 1
t
(1 1) '
t1
(respecti-
vamente 1
t
< (1 1) '
t1
) e 1 um parmetro positivo (bandwidth), calibrado
com base na experincia passada. Formalmente, as regras canal de compra e venda
esto apresentadas na tabela 1.
Na gura 10.2 ilustra-se a regra canal ao NASDAQ composite (Jan-05 a Mar-
06). Fixou-se 1 = 0 e 1 = 0.
10.2.2.3. Regra Modelo ARMA. Seja j
t1,t
a previso do retorno para o mo-
mento t 1 dado T
t
, baseado num certo modelo ARMA. Na tabela 2 denem-se
as regras de compra e venda. A posio (1,1) na tabela 2, estabelece o seguinte:
se no perodo t houve uma indicao de compra e j
t1,t
0 ento antecipa-se
t 1
t
Comprar Vender Neutro
Comprar 1
t
(1 1) :
t1
1
t
< (1 1) :
t1
outros casos
Vender 1
t
(1 1) '
t1
1
t
< (1 1) '
t1
outros casos
Neutro 1
t
(1 1) '
t1
1
t
< (1 1) :
t1
outros casos
TABELA 1. Regras de Compra e Venda Baseadas no procedi-
mento Canal
NASDAQ composite
1780
1880
1980
2080
2180
2280
2380
comprar = 1, vender = 0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
FIGURA 10.2. Regra Canal - Aplicao ao NASDAQ composite
Jan-05 a Mar-06
uma tendncia de subida dos preos e a indicao de compra para o perodo t 1
. A posio (2,1) estabelece o seguinte: se no perodo t houve uma indicao de
venda e j
t1,t
1 ento a indicao de compra para o perodo t 1. O perodo
t 1 de compra apenas se a previso do retorno for sucientemente alta, dig-
amos, acima de 1 0. Se j
t1,t
0 mas j
t1,t
< 1 entende-se que no existe
indicao sucientemente clara de compra dado que no perodo anterior o dia foi
de venda e, nestas circunstncias, o dia considerado neutro, isto , no h lugar a
venda ou compra. As demais clulas interpretam-se de forma similar.
Oparmetro 1 pode ser estimado combase na informao passada: selecciona-
se o valor que maximiza o lucro.
t 1
t
Comprar Vender Neutro
Comprar j
t1,t
0 j
t1,t
< 1 outros casos
Vender j
t1,t
1 j
t1,t
< 0 outros casos
Neutro j
t1,t
1 j
t1,t
< 1 outros casos
TABELA 2. Regras de Compra e Venda Baseadas num ARMA
10.2.2.4. Medidas de Previsibilidade. Embora as duas primeiras regras atrs
apresentadas envolvam preos, as medidas de previsibilidade, por exigirem a apli-
cao do teorema do limite central e a lei dos grandes nmeros, so construdas a
partir dos retornos, dado que estes so (em princpio) processos estacionrios.
Considere-se um certa regra de compra e venda e dena-se, C o conjunto dos
ndices t onde h um sinal de compra para o perodo seguinte, t1, e \ o conjunto
dos ndices t onde h umsinal de venda para o perodo seguinte, t1. Por exemplo,
se nos dias 3, 7 e 9 h sinais de compra para os respectivos perodos seguintes, e
nos dias 6 e 11 h sinais de venda para os perodos seguintes ento, C = 8, 7, 0
e \ = 6, 11 . Seja :
C
o cardinal de C, :
\
o cardinal de \ (no exemplo dado
:
C
= 8 e :
\
= 2),
r
C
=
1
:
C
tC
r
t1
a mdia emprica dos retornos em que houve um sinal de compra e
r
\
=
1
:
\
t\
r
t1
a mdia emprica dos retornos em que houve um sinal de venda.
Se a regra de compra e venda informativa ento
L
(r
t1
[ t C) ,=
L
(r
t1
[ t \ )
i.e., o valor esperado dos retornos depende da informao de compra ou venda e,
por isso, os dois valores esperados so diferentes. Se, pelo contrrio,
L
(r
t1
[ t C) =
L
(r
t1
[ t \ ) ento o comportamento dos retornos no perodo t 1 no reecte
a expectativa de subida ou descida dos preos, dada pela regra de compra e venda.
Numa regra informativa devemos esperar
L
(r
t1
[ t C)
L
(r
t1
[ t \ ) ,
i.e., o sinal de compra (venda) est associado a uma expectativa de subida (descida)
sustentada dos preos.
Temos vrias formas de testar se uma regra de compra e venda informativa.
Uma possibilidade consiste em realizar o teste diferena de mdia. Admitindo
que os retornos so i.i.d., tem-se que, sob a hiptese nula, H
0
:
L
(r
t1
[ t C) =
L
(r
t1
[ t \ ) a estatstica
. =
r
C
r
\
_
` o
2
C
a
C

` o
2
1
a
1
(10.2)
tem distribuio assimpttica (0, 1) .
Um teste prefervel que no exige independncia dos retornos e pode acomodar
autocorrelao e heterocedasticidade dos erros consiste na anlise da signicncia
do parmetro ,
1
na regresso
r
t
= ,
0
,
1
J
t1,C
,
2
J
t1,.
n
t
(10.3)
(com erros padro robustos) onde J
t,C
e J
t,.
so variveis dummies; J
t,C
assume
o valor 1 quando no perodo t houve uma indicao de compra e J
t,.
que assume
o valor 1 quando no perodo t houve uma indicao neutra. O chamado grupo
base consiste na indicao de venda. Da equao (10.3) tem-se
L
(r
t1
[ t C) = ,
0
,
1
,
L
(r
t1
[ t \ ) = ,
0
e, portanto, se ,
1
= 0 ento
L
(r
t1
[ t C) =
L
(r
t1
[ t \ ) . Pelo contrrio, se
,
1
0 ento
L
(r
t1
[ t C)
L
(r
t1
[ t \ ) . Deve-se ento realizar o ensaio
H
0
: ,
1
= 0 vs. H
1
: , 0.
10.3. Teste Ecincia Semi-Forte de Mercado
Analisa-se se possvel obter rendibilidades anormais de forma persistente
utilizando uma estratgia de investimento baseada nos preos passados e na infor-
mao pblica disponvel.
Seja J
t
= T
t
' T
A
t
onde T
A
t
o conjunto de toda a informao pblica
disponvel, como por exemplo, balanos, relatrios da empresa, notcias divulga-
dos pela empresa, etc. Se o mercado eciente no sentido semi-forte ento
indiferente usar ou no usar a informao disponvel J
t1
para prever r
t
e, desta
forma tem-se
L
(r
t
[ J
t1
) =
L
(r
t
)
Pelo contrrio, se
L
(r
t
[ J
t1
) ,=
L
(r
t
)
ento, a informao disponvel J
t
relevante para prever os retornos futuros. Nes-
tas circunstncias, existe alguma informao sobre a tendncia provvel de r
t
,
e ser possvel, em princpio, obter rentabilidades anormais, usando a informao
disponvel J
t
.
Existem inmeros procedimentos e conjuntos de informao J
t
usados para
testar a ecincia (semi-forte) de mercado. A literatura tem estudado (entre muitos
outros) os seguintes tpicos:
Efeito do tamanho da empresa. A questo : apresentaro as empresas
pequenas, em termos da sua capitalizao de mercado, rendibilidades m-
dias superiores s empresas grandes, com nvel de risco semelhante?
Reaco do mercado chegada de informao. Este tpico importante
na anlise da ecincia e analisado em detalhe na seco 10.3.1.
Valor de mercado versus valor contabilstico. Entende-se que um valor
de mercado baixo face ao valor contabilstico pode indicar, em certas
circunstncias, que as aces esto subavaliadas.
10.3. TESTE EFICINCIA SEMI-FORTE DE MERCADO 301
Rcio preo/lucro ou price-earnings ratio (P/E). Valores baixos signi-
cam que as aces da empresa em anlise so transaccionados a um preo
relativamente baixo face ao valor dos lucros e, portanto, a cotao da em-
presa poder estar barata;
Impacto de outras variveis nanceiras como por exemplo, taxas de juro
de obrigaes de tesouro, dividendos por aco (dividend yield), etc.
Impacto de variveis econmicas, como por exemplo, produto, inao,
etc.
Impacto de outras anomalias mercado, como por exemplo, efeito dos
dias da semana, efeito de m-de-semana, m de ano, etc. (efeitos de
calendrio - algumas destes tpicos foram j abordados na seco 3.1.6).
Se o objectivo analisar a ecincia do mercado (e, de certa forma a previsi-
bilidade dos retornos) com base na varivel r (e.g. taxa de juro) a varivel r dever
entrar no modelo de regresso com um ou mais desfasamentos. S assim possvel
testar a previsibilidade de r. O modelo seria assim do tipo
r
t
= c ,r
t1
n
t
.
Pode at suceder que o modelo r
t
= c,r
t
n
t
(comr
t
e no comr
t1
) produza
umajustamento superior; mas neste caso o modelo no pode testar a previsibilidade
de r com base em r (note-se de passagem que este ltimo modelo o CAPM se r
t
a rendibilidade de mercado). Para se obterem rendibilidades anormais com base
num modelo de previso necessrio saber, com alguma antecipao, a tendncia
futura dos preos (e da r entrar desfasado no modelo).
10.3.1. Reaco do Mercado Chegada de Informao . Se o mercado
totalmente eciente os activos respondem imediatamente chegada de informao
relevante ao mercado. A informao relevante poder ser informao especca
sobre a empresa, como por exemplo, o anncio de lucros ou dividendos, o anncio
de fuses e aquisies, etc. Poder tambm ser o anncio de medidas de poltica
econmica ou outros eventos que tenham impacto sobre a rendibilidades dos ac-
tivos nanceiros.
A questo , portanto, bvia: trata-se de identicar as informaes similares
relevantes e vericar se na vizinhana da data da divulgao da notcia as rendibil-
idades apresentaram um comportamento anormal.
Para simplicar divida-se o estudo do impacto da chegada da informao sobre
as rendibilidades em duas reas: A) impacto de notcias similares sobre um con-
junto de empresas e B) impacto de notcias similares sobre uma empresa especca.
No caso A) comea-se por recolher uma amostra de empresas que estiveram ex-
postas a anncios no antecipados e observam-se as rendibilidades anormais na
vizinhana das datas dos anncios. A rendibilidade anormal, ra, do activo i no
perodo t
ra
t,i
= r
t,i
rendibilidade esperada do activo i no momento t.
sendo r
t,i
o retorno do activo i no momento t. Como avaliar a rendibilidade es-
perada do activo i no momento t A abordagem habitual consiste em tomar um
modelo de equilbrio como o CAPM ou a APT. Tomando o CAPM vem
ra
t,i
= r
t,i
_
c
i

,
i
r
n,t
_
onde r
n,t
a rendibilidade do mercado no momento t. Sejam
ra
t
=
.
i=1
ra
t,i
, :
2
t
=
.
i=1
(ra
t,i
ra
t
)
2
1
,
respectivamente, a mdia e a varincia emprica seccional das rendibilidades anor-
mais das empresas na data t. Estas estatsticas podem ser calculadas para qualquer
t, mas tem sobretudo interesse analisar ra
t
e :
2
t
para t numa vizinhana do ann-
cio. Convencionando que o anncio ocorre na data 0 e xando uma janela temporal
de d perodos para antes e depois do anncio, ra
t
e :
2
t
podem ser calculadas para
t = d, ..., 1, 0, 1, ...d.
Suponha-se que divulgada uma notcia boa, como por exemplo, um ann-
cio de dividendos acima do esperado. Se as rendibilidades anormais se concen-
tram em t = 0 no podemos rejeitar a hiptese de o mercado ser eciente. Pelo
contrrio, se existirem rendibilidades anormais apenas para t 0 podero existir
indcios de inecincia, sobretudo se t medido em dias. Em geral prefervel
usarem-se dados intra-dirios, por exemplo, perodos de 5, 10 ou 15 minutos.
possvel aprofundar a anlise construindo uma sucesso ra
t
para todas as
observaes disponveis (e no apenas na vizinhana da data do anncio). Com
este procedimento possvel comparar ra
t
nos perodos vizinhos e no vizinhos
do anncio, por exemplo, analisando a signicncia de ,
2
na regresso,
ra
t
= ,
0
,
1
J
0,t
,
2
J
1,t
n
t
.
onde J
0,t
e J
1,t
so variveis dummies. J
0,t
assume o valor 1 quando t corresponde
data de anncio e J
1,t
assume o valor 1 quando t corresponde a uma data imedi-
atamente a seguir data de anncio . Se ,
2
signicante ento possvel que o
mercado seja ineciente (ou no totalmente eciente). Se, pelo contrrio, apenas
,
1
signicante ento o impacto do anncio concentra-se no perodo do anncio e
no h razes para rejeitar a hiptese de ecincia. A anlise poder ser mais na,
adicionando-se mais variveis dummies.
Se o objectivo avaliar o impacto de notcias similares sobre uma empresa
especca - caso B) - o procedimento mais simples consiste em formular a equao
de regresso
r
t
= ,
0
,
1
J
0,t
,
2
J
1,t
,
S
r
n,t
n
t
. (10.4)
A introduo da varivel r
n,t
importante porque permite isolar o efeito do ann-
cio do efeito de mercado. Com efeito, suponha-se que o anncio tem impacto
sobre a rendibilidade do mercado. Como a rendibilidade do mercado est correla-
cionado com a rendibilidade da aco em anlise, o anncio acaba por inuenciar
a rendibilidade da aco atravs do comportamento global do mercado. Um mod-
elo de regresso sem a varivel r
n,t
no permite isolar o efeito do anncio sobre
a empresa. Por exemplo, neste modelo mais reduzido, se o parmetro ,
2
vem
diferente de zero no se sabe se ,
2
,= 0 se deve ao efeito retardado do anncio
sobre a empresa ou ao efeito do mercado sobre a empresa induzido pelo anncio.
10.3. TESTE EFICINCIA SEMI-FORTE DE MERCADO 303
Pode haver outra razo para introduzir r
n,t
. Suponha-se que os anncios coinci-
dem com movimentos de alta do mercado. Se r
n,t
no est no modelo os anncios
no podem distinguir-se dos movimentos de alta.
CAPTULO 11
Seleco de Portfolios
Vai analisar-se o problema da determinao dos pesos ptimos de uma carteira
constituda por : activos com risco e um activo sem risco por parte de um in-
vestidor individual. Os resultados principais devem-se a Markowitz (prmio Nobel
1990), James Tobin (prmio Nobel 1981) e William Sharpe (prmio Nobel 1990).
O objectivo deste captulo consiste em apresentar a teoria bsica e ilustrar o prob-
lema da determinao dos pesos ptimos a partir de momentos marginais e condi-
cionais da distribuio dos retornos.
Os modelos de heterocedastiocidade multivariada so particularmente teis
quando os pesos ptimos se baseiam em momentos condicionais.
11.1. Portfolio Baseado em Momentos Marginais
Assumem-se as seguintes hipteses:
(1) Os retornos seguem uma distribuio marginal normal multivariada;
(2) As correlaes entre os retornos so xas ao longo do tempo;
(3) O investidor racional, tem averso ao risco, usa toda a informao
disponvel e procura o mximo lucro, para um determinado nvel de risco;
(4) No existem custos de transaco;
(5) O investidor price taker, isto , no tem capacidade de inuenciar os
preos;
(6) O investidor pode emprestar e pedir emprestado sem restries;
(7) Todos os activos podem ser convenientemente fraccionados.
11.1.1. Todos os Activos Envolvem Risco. Para alm das hipteses anteri-
ores suponha-se que no existe o activo sem risco, i.e., todos os activos envolvem
risco.
Estabelea-se a seguinte notao:
vector dos retornos: r
t
= (1
1t
, ..., 1
nt
)
t
;
vector do valor esperado dos retornos: = (
L
(1
1t
) , ...,
L
(1
nt
))
t
;
matriz das varincias-covarincias dos retornos: Vai (r
t
) = H;
vector dos pesos da carteira: ! = (.
1
, ..., .
n
)
t
;
retorno do portfolio: 1
jt
=
n
i=1
.
i
1
it
= !
t
r
t
valor esperado do portfolio:
L
(1
jt
) =
L
(!
t
r
t
) = !
t
305
306 11. SELECO DE PORTFOLIOS
Varincia do portfolio o
2
j
= Vai (1
jt
) = Vai (!
t
r
t
) = !
t
Vai (r
t
) ! =
!
t
H!.
Naturalmente que
n
i=1
.
i
= 1 =!
t
1 = 1 onde 1 (a negrito) representa um
vector-coluna de 1s. Para simplicar, assume-se que todos os activos envolvem
risco e que alguns pesos .
i
(mas no todos) podem ser negativos. Na teoria -
nanceira um peso pode ser negativo quando h lugar a uma venda a descoberto ou
short selling
1
. Esta hiptese simplica o problema de optimizao.
Em condies normais, qualquer investidor procura dois objectivos antagni-
cos: maximizar o lucro (ou valor do retorno) e minimizar o risco. Os objectivos so
contraditrios porque, em geral, os activos com maior (menor) retorno (em mdia)
so os que possuem maior (menor) variabilidade. Para conciliar estes objectivos,
pode-se, por exemplo, (i) xar um valor para o retorno esperado do portfolio e,
para esse valor, procurar os activos com a menor variabilidade possvel; ou (ii)
xar um valor para o risco do portfolio (varincia) e, depois, procurar os activos
com o maior retorno esperado possvel.
Suponha-se que se opta pelo procedimento (i). O problema de optimizao
ento
_
min
.
.
Vai (1
jt
)
s.a
L
(1
jt
) = j
j
e

n
i=1
.
i
= 1
=
_
min
.
.
!
t
H!
s.a !
t
= j
j
e !
t
1 = 1
(11.1)
Considere-se a funo Lagrangeana,
1(!) = !
t
H! `
1
_
j
j
!
t
_
`
2
_
1 !
t
1
_
(`
1
e `
2
so os multiplicadores de Lagrange). Resolvendo o sistema, que se obtm
a partir das condies de primeira ordem (01,0! = 0, !
t
= j
j
e !
t
1 = 1), e
notando que 1 uma funo convexa
2
, obtm-se a soluo do problema de opti-
mizao:
!
+
= !
+
_
j
j
_
= gj
j
L (11.2)
onde
g =
,
c
H
1
1
c
c
H
1
, L =
c
H
1
c
c
H
1
1,
c =
t
H
1
1, , =
t
H
1
, = 1
t
H
1
1, c = , c
2
,
1 =(1, 1, ..., 1)
t
.
A expresso !
+
_
j
j
_
mostra que os pesos ptimos dependem de j
j
(fosse denido
outro valor para j
j
, e os pesos ptimos seriam outros).
1
Venda a descoberto ocorre quando se vende umactivo nanceiro ou derivado que no se possui,
esperando que o preo caia para depois compr-lo e lucrar na transao. O mecanismo o seguinte:
o agente A pede (digamos) uma aco a B e promete-lhe todo o rendimento subjacente ao ttulo. A
vende imediatamente a aco a C; mais tarde, A compra no mercado a aco para a devolver a B. Se
o preo da aco cair, esta operao vantajosa para A.
2
A funo !
0
H! estritamente convexa se Hfor uma matriz denida positiva (hiptese pac-
ca). As funes `
1
_
j
!
0
_
e `
2
(1 !
0
1) so convexas por serem lineares (funes lineares
so, por denio, cncavas e convexas).
11.1. PORTFOLIO BASEADO EM MOMENTOS MARGINAIS 307
Resulta que a varincia mnima associada ao retorno j
j

o
2
j
= Y
j
_
j
j
_
= !
+t
H!
+
.
O problema (ii) equivalente ao problema (i) no seguinte sentido. Suponha-se
que se xa Y
j
_
j
j
_
como restrio e se procura maximizar o retorno, i.e.
_
max
.
.
L
(1
jt
)
s.a Vai (1
jt
) = Y
j
_
j
j
_
e

n
i=1
.
i
= 1.
Ento, pode-se provar, a soluo deste problema optimizao precisamente j
j
.
Desta forma basta estudar o problema formulado na equao (11.1).
Na prtica os valores esperados e Hso desconhecidos. necessrio estim-
los a partir dos valores observados. Supondo que r
t
um processo estacionrio
fracamente dependente, e H podem ser estimados usando os seguintes esti-
madores consistentes:
` =
_
_
_
r
1
.
.
.
r
n
_
_
_
,
`
H =
_
/
i)
_
i,)=1,..,n
onde

/
i)
o elemento (i, ,) da matriz
`
H, dado por
/
i)
=
1
:
a
t=1
(r
it
r
i
) (r
)t
r
)
) .
EXEMPLO 11.1.1. Considere-se um portfolio constitudo pelas aces A1, A2
e A3. Vai ser tomada uma deciso de investimento no valor de 1 milho de Euros. A
questo : quanto comprar de cada um desses activos? Com base em observaes
dirias suponha-se que se obtm
3
:
` =
_
_
.22
6.0
.08
_
_ `
H =
_
_
1.40 0.084 0.46
0.084 2.008 1.0416
0.46 1.0416 1.26
_
_
.
As rendibilidades esto anualizadas e em percentagem. Suponha-se que se pre-
tende obter um retorno esperado do portfolio de j
j
= .8. Usando a expresso
(11.2) obtm-se
` !
+
(.8) = ` gj
j
`
L =
_
_
0.176
0.104
0.720
_
_
.
Desta forma, a varincia mnima do portfolio associado rendibilidade .8
Y
jt
(.8) = ` !
+t
H` !
+
=
_
0.176 0.104 0.72
_
_
_
1.40 0.084 0.46
0.084 2.008 1.0416
0.46 1.0416 1.26
_
_
_
_
0.176
0.104
0.720
_
_
= 1.08.
3
Estimativas baseadas nos retornos dos ndices SP500, DowJones e PSI20, no perodo
04/01/1993-04/09/2009.
O vector de pesos ptimo associado combinao
_
o
j
, j
j
_
=
__
1.08, .8
_
diz-
nos que a composio do portfolio deve ser de 17.6% de A1, 10.4% de A2 e 72%
de A3.
No exemplo anterior o investidor pode estar interessado em analisar outras
combinaes de retorno versus risco (mnimo). Desta forma, podemos xar outros
valores para j
j
e, assim, obter as correspondentes varincias mnimas do portfolio.
No exemplo anterior, j
j
pode variar entre 5.22 e 6.05. Faa-se uma grelha de
valores para j
j
, por exemplo, escrevam-se 100 valores equidistantes para j
j
no
intervalo [.22; 6.0[ e obtenham-se as correspondentes varincias mnimas:
j
j
\
j
_
j
j
_
.
.
.
.
.
.
.8 1.08
.
.
.
.
.
.
6.0 1.82
O grco denido pelos pares ordenados
__
\
j
_
j
j
_
, j
j
_
onde j
j
maior ou
igual ao retorno associado varincia mnima de todos os portfolios designa-se
por fronteira eciente. Na gura 11.1 traam-se todos os pontos
__
\
j
_
j
j
_
, j
j
_
.
O ponto A representa o par ordenado
__
\
j
(j
nin
), j
nin
_
onde \
j
(j
nin
) o valor
da varincia mnima de todos os portfolios e j
nin
o retorno esperado associado
(tambm mnimo). A fronteira eciente dada pelo segmento AB. O ponto C no
faz parte da fronteira eciente, pois existe um ponto D com igual varincia mas re-
torno esperado superior. Assim, s os pontos sobre a curva AB so relevantes para
o investidor e, por isso, no grco denido pelos pares ordenados
__
\
j
_
j
j
_
, j
j
_
s interessam os pontos onde j
j
maior ou igual ao valor da ordenada do ponto
A. O investidor deve agora decidir qual o par
__
\
j
_
j
j
_
, j
j
_
sobre a curva AB
que mais lhe interessa, tendo em conta a sua maior ou menor averso ao risco. Se
for avesso ao risco tender a escolher um par
__
\
j
_
j
j
_
, j
j
_
mais prximo do
ponto A; se tiver maior apetncia pelo risco tender a escolher uma soluo mais
prxima do ponto B. Continuando o exemplo anterior, suponha-se que a combi-
nao preferida do investidor
_
o
j
, j
j
_
=
__
1.08, .8
_
. Tendo em conta que o
vector de pesos ! =(0.176, 0.104, 0.72)
t
, o investimento de 1 milho de Euros
seria ento alocado da seguinte forma: 176000 Euros em A1, 104000 em A2 e
720000 em A3.
A fronteira eciente dada pelo segmento AB uma funo no linear. Esta
concluso imediata tendo em conta a representao paramtrica da funo:
_
_
\
j
_
j
j
_
, j
j
_
=
_
_
_
gj
j
L
_
t
H
_
gj
j
L
_
, j
j
_
=
__
c
0
c
1
j
j
c
2
j
2
j
, j
j
_
.
Se c
0
= c
1
= 0 a funo seria linear.
Como determinar analiticamente o valor da varincia mnima de todos os port-
folios ecientes? Trata-se, anal, de determinar as coordenadas do ponto =
11.1. PORTFOLIO BASEADO EM MOMENTOS MARGINAIS 309
FIGURA 11.1. Fronteira Eciente: Curva AB
__
Y
j
(j
nin
), j
nin
_
da gura 11.1. Para o efeito resolve-se o problema de opti-
mizao livre
d\
j
_
j
j
_
dj
j
=
d (!
+t
H!
+
)
dj
j
= 0,
cuja soluo
j
nin
=
g
t
HL
L
t
Hg
.
Inserindo este valor em \
j
() obtm-se
\
j
(j
nin
) = g
t
Hg
(g
t
HL)
2
L
t
HL
Aplicando estas frmula aos valores do exemplo anterior obtm-se j
nin
= .68 e
\
j
(j
nin
) = 0.010.
11.1.2. Modelo com Activo Sem Risco. O porfolio inclui agora o activo sem
risco (por exemplo, obrigaes e os ttulos do Tesouro
4
). Tem rendibilidade certa
j
)
(e, por isso, tem varincia e covarincias nulas com os demais activos). A
rendibilidade do portfolio agora !
t
(1 !
t
1) j
)
. O problema de optimizao
passa a ser
_
min
.
.
!
t
H!
s.a !
t
(1 !
t
1) j
)
= j
j
.
Note-se que os pesos !
t
1, (1 !
t
1) , somam um. A matriz H mantm-se natu-
ralmente inalterada e, por isso, a funo objectivo a mesma. Apenas as restries
4
Naturalmente, em condies normais, o estado no entra em falncia. No h portanto risco
de incumprimento. Mas preciso notar que as obrigaes e os ttulos do Tesouro tm o risco da taxa
de juro (risco da taxa de juro subir e do preo dos ttulos descer).
so modicadas. Pode-se provar que a soluo
!
+
_
j
j
_
= c
_
j
j
_
!,
c
_
j
j
_
=
j
j
j
)
_
j
)
1
_
t
H
1
_
j
)
1
_, ! = H
1
_
j
)
1
_
.
Resulta que a varincia mnima associada ao retorno j
j

Y
j
_
j
j
_
= !
+t
H!
+
=
_
c
_
j
j
_
!
_
t
Hc
_
j
j
_
! =c
_
j
j
_
2
!
t
H !.
Nesta formulao a composio da carteira dos activos com risco xa, dado
j
)
, qualquer que seja o valor j
j
. Com efeito, !
+
proporcional a ! e a constante
de proporcionalidade c
_
j
j
_
. Por exemplo, suponha-se que se tem dois activos
com risco e ! =(0.8, 0.6)
t
. Ento dado o valor de j
)
, o nmero de aces do
activo 2 sempre o dobro do activo 1, qualquer que seja o valor que queiramos
para a rendibilidade do portfolio.
A observao anterior sugere que o valor do portfolio pode ser dado como
uma combinao linear de um portfolio constitudo apenas por activos de risco e o
activo sem risco. Este portfolio, constitudo apenas por activos de risco, designa-
se por tangency portfolio. Os pesos deste portfolio no podero ser exactamente
dados por ! dado que os pesos !
t
i
: no somam um. Assim dena-se
!
T
=
!
n
i=1
!
i
=
!
!
t
1
.
Note-se agora que a soma dos pesos do vector !
T
somam um e ! = !
T
!
t
1.
Podemos assim escrever
!
+
= c
_
j
j
_
! =c
_
j
j
_
!
t
1!
T
= a!
T
, a = c
_
j
j
_
!
t
1.
O retorno do portfolio pode ser escrito como uma combinao linear entre o
retorno do tangency portfolio, j
T
e o retorno do activo sem risco, j
)
:
j
j
= !
+t
_
1 !
+t
1
_
j
)
= a!
t
T
(1a)j
)
= aj
T
(1 a) j
)
.
Por seu lado a varincia do portfolio pode tambm ser escrita em funo de !
T
:
Y
j
_
j
j
_
= !
+t
H!
+
= a!
t
T
Ha!
T
= a
2
!
t
T
H!
T
= a
2
o
2
T
e o desvio padro do portfolio o
j
= ao
T
A fronteira eciente linear no espao
_
o
j
, j
j
_
. Com efeito, usando algumas
expresses j deduzidas, tem-se
_
o
j
, j
j
_
=
_
ao
T
, aj
T
(1 a) j
)
_
.
Esta representao paramtrica da fronteira eciente permite deduzir
o
j
= ao
T
=a =
o
j
o
T
e, substituindo o valor de a em j
j
= aj
T
(1 a) j
)
, resulta que a fronteira
eciente no espao
_
o
j
, j
j
_
dada pela recta (na forma reduzida)
j
j
= j
)
:o
j
, : =
j
T
j
)
o
T
.
11.2. PORTFOLIO BASEADO EM MOMENTOS CONDICIONAIS 311
FIGURA 11.2. Fronteira Eciente de um Portfolio com Activo
Sem Risco (Recta)
Na gura 11.2 a fronteira eciente representada pela recta bT, i.e. j
j
= j
)
:o
j
.
O declive da recta : = (a /) ,c (na gura a representa j
T
, / representa j
)
e c
representa o
T
. O valor : designado por rcio de Sharpe.
11.2. Portfolio Baseado em Momentos Condicionais
O problema de optimizao de um portfolio baseado nos dois primeiros mo-
mentos marginais da distribuio dos retornos implica que a deciso de inves-
timento se mantm xa ao longo do tempo, pois se o processo dos retornos
estacionrio, como se admite na fase da estimao dos parmetros, os momentos
Vai (1
jt
) e
L
(1
jt
) so constantes ao longo tempo e, por isso, a soluo ptima
sempre a mesma, quaisquer que sejam as condies de mercado. Naturalmente,
nenhum gestor de fundos segue esta estratgia de investimento, mesmo que as suas
decises se baseiem nos princpios do portfolio denido no ponto precedente. Na
prtica podem estimar ` e
`
H usando mdias mveis ou alisamentos exponenciais
para desprezarem a informao antiga e actualizarem os parmetros e H com
informao mais recente. Desta forma os peso .
i
podem variar ao longo do tempo,
e as decises de investimento podem ajustar-se de acordo com as condies de
mercado. Mas a percepo de que as condies de mercado se alteram ao longo do
tempo exige uma abordagem diferente.
Uma deciso de investimento tomada no momento t 1, resulta da avaliao
das condies de mercado e, em geral, da informao disponvel no momento t1.
Esta deciso tomada no perodo t 1 pode naturalmente alterar-se no momento t,
se as condies de mercado e a informao disponvel em t se alterarem tambm.
Desta forma, a seleco dos activos deve basear-se em momentos condicionais e
no em momentos marginais. Recorde-se que as melhores previses dos retornos e
da volatilidade para o perodo t, dada toda a informao disponvel at ao momento
t 1, so dadas pelos dois primeiros momentos condicionais. A determinao dos
pesos ptimos usando momentos condicionais assenta na ideia de que o portfolio
pode ajustar-se continuamente ao longo do tempo em funo das condies de mer-
cado. Esta abordagem tem ainda a vantagem de contornar as crticas que se fazem
s duas primeiras hipteses denidas na seco anterior (os retornos seguem uma
distribuio marginal normal multivariada, e as correlaes entre os retornos so
xas ao longo do tempo). Como se sabe, no quadro de um modelo baseado em mo-
mentos condicionais variveis, no s a distribuio marginal no (em condies
muito gerais) normal, como tambm as correlaes (condicionais) podem ser var-
iveis ao longo do tempo.
Na formulao que a seguir apresentaremos, a deciso de investimento tomada
no momento t 1, baseada numa suposio sobre o comportamento dos retornos
esperados e do risco envolvido no momento t. Na verdade as perdas ou ganhos
que eventualmente ocorram vo concretizar-se no momento t. por esta razo que
os momentos condicionais envolvem variveis aleatrias no momento t, dada a
informao disponvel em t 1.
Estabelea-se a seguinte notao:
vector do valor esperado condicional dos retornos:
t
= (
L
(1
1t
[ T
t1
) , ...,
L
(1
nt
[ T
t1
))
t
;
matriz das varincias-covarincias condicionais dos retornos: Vai (r
t
[ T
t1
) =
H
t
;
vector dos pesos da carteira no momento t: !
t
= (.
1t
, ..., .
nt
)
t
;
retorno do portfolio:
1
jt
=
n
i=1
.
it
1
it
= !
t
t
r
t
;
valor esperado condicional do portfolio:
L
(1
jt
[ T
t1
) =
L
_
!
t
t
r
t
T
t1
_
= !
t
t
t
;
Varincia condicional do portfolio
Y
jt
= Vai (1
jt
[ T
t1
) = Vai
_
!
t
t
r
t
T
t1
_
= !
t
t
Vai (r
t
[ T
t1
) !
t
= !
t
t
H
t
!
t
.
Os principais resultados foram j obtidos nos pontos precedentes. Substituindo
os momentos marginais pelos momentos condicionais tm-se os seguintes resulta-
dos:
Pesos ptimos de um portfolio sem o activo sem risco, dado um determi-
nado nvel de retorno j
j,t
:
!
+
t
= !
+
t
_
j
j,t
_
= g
t
j
j,t
L
t
11.2. PORTFOLIO BASEADO EM MOMENTOS CONDICIONAIS 313
onde
g
t
=
,
t
c
t
H
1
t
1
c
t
c
t
H
1
t
, L
t
=
t
c
t
H
1
t

t
c
t
c
t
H
1
t
1
c
t
=
t
t
H
1
t
1, ,
t
=
t
t
H
1
t

t
,
t
= 1
t
t
H
1
t
1, c
t
= ,
t
t
c
2
t
,
1 =(1, 1, ..., 1)
t
.
Pesos ptimos de um portfolio com o activo sem risco, dado um determi-
nado nvel de retorno j
j,t
:
!
+
_
j
j,t
_
= c
_
j
j,t
_
!
t
,
c
_
j
j
_
=
j
j,t
j
)
_
t
j
)
1
_
t
H
1
t
_
t
j
)
1
_, !
t
= H
1
t
_
t
j
)
1
_
.
A fronteira eciente no espao
_
o
j
, j
j
_
com o activo sem risco
j
j,t
= j
)
:
t
o
j,t
, :
t
=
j
T,t
j
)
o
T,t
.
Este rcio de Sharpe depende de t, pois, em ltima anlise, depende de
t
e H
t
.
Se o horizonte do investimento fosse / perodos e admitssemos que no have-
ria lugar a alteraes do portfolio durante o perodo do investimento, os momentos
condicionais relevantes passariam a ser
L
(r
tI
[ T
t
) , Vai (r
tI
[T
t
) .
Quando o horizonte de previso elevado, os momentos condicionais so, em
condies ergdicas, aproximadamente iguais aos momentos marginais.
Naturalmente os valores esperados condicionais
t
e H
t
so desconhecidos.
necessrio estim-los, por exemplo, a partir de um modelo GARCH multivariado.
CAPTULO 12
Risco de Mercado e o Valor em Risco
12.1. Introduo
Em resposta aos desastres nanceiros ocorridos no passado recente, a gesto
do risco sofreu uma revoluo nos ltimos anos. O valor em risco ou Value at
Risk (VaR) iniciou essa revoluo e tem ganho reconhecimento como medida fun-
damental na anlise e na gesto do risco de mercado das instituies nanceiras.
Presentemente, muitas instituies reportam medidas de risco relacionadas com o
VaR para o pblico em geral e, em certos casos, tambm para agncias reguladoras.
Por exemplo, os bancos comerciais esto sujeitos a requisitos mnimos de capital
para cobrirem o seu risco de crdito e de mercado. O Acordo Basilia II estabelece
taxas de segurana baseadas em modelos VaR.
A literatura nanceira enumera vrios tipos de risco, como por exemplo, risco
de mercado, risco de crdito, risco de liquidez, risco operacional (associado ao
risco de fraude, erros de transaco e de apreamento, etc.) e risco sistmico (as-
sociado, por exemplo, a situaes de incumprimento devido a reaces em cadeia).
Neste captulo aborda-se o risco de mercado, isto , o risco associado s variaes
(inesperadas) de preos e taxas e algumas metodologias de mensurao desse risco.
Para introduzir o VaR instrutivo, em primeiro lugar, pensar-se em anlise de
cenrios. Neste tipo de anlise, formulam-se vrios resultados possveis de acordo
com a informao disponvel e, quando tal possvel, atribuem-se probabilidades
aos diversos cenrios. Em geral, d-se especial ateno aos piores cenrios pois
so estes que maior impacto tm sobre o funcionamento normal da organizao.
Para avaliar os piores cenrios, podemos comear por formular a questo:
Qual a perda mxima que a organizao pode sofrer num certo perodo de
tempo?. A resposta no particularmente informativa, pois a perda mxima
signica perder tudo (com probabilidade praticamente nula). Se reformularmos
ligeiramente a questo, obtemos a medida VaR: Quanto que podemos perder
com probabilidade c 0 num certo perodo de tempo?. Impe-se que c seja no
nulo mas razoavelmente pequeno com vista a avaliar os eventos que embora raros
podem ocorrer e afectar o funcionamento normal da organizao. VaR portanto a
perda que pode ocorrer num lapso de tempo determinado, com certa probabilidade
c, supondo que o portfolio no gerido durante o perodo de anlise. Em termos
probabilsticos, o VaR o quantil de ordemc (em mdulo)
1
da distribuio terica
de ganhos e perdas. Para concretizar, seja ^\
aI
:= \
aI
\
a
a variao do
1
O quantil de ordem c < 0.0 da distribuio de ganhos e perdas um valor negativo. Para
que o VaR represente efectivamente uma perda, considera-se esse quantil em valor absoluto.
315
316 12. RISCO DE MERCADO E O VALOR EM RISCO
valor do capital investido no gerido durante o horizonte de risco de / dias. Por
exemplo, considere-se a compra de 200,000 aces
2
de um ttulo no perodo : ,
ao preo de 1
a
= Euros. O investimento de \
a
= 200, 000 = 1, 000, 000
Euros. Suponha-se que no momento :/ o preo do ttulo passa para 1
aI
= .
Euros. A variao do capital de ^\
aI
= 1, 100, 000 1, 000, 000 = 100, 000.
O retorno (em tempo discreto) 1
aI
= (1
aI
1
a
) ,1
a
= 0.1. impor-
tante notar que o retorno pode tambm ser obtido atravs da expresso 1
aI
=
^\
aI
,\
a
.
3
Pode supor-se que \
t
observado no perodo t = 1, 2, ..., :, mas no
em:1, :2, ... Os valores que \ vier a assumir no perodo :1, :2, ..., :/
dizem respeito ao perodo de investimento e, portanto, \
aI
, desconhecido para
/ _ 1.
O VaR a 100c/ baseado na distribuio marginal de ganhos e perdas o valor
VaR tal que
1 (^\
aI
< \ a1) = c.
Por seu turno, o VaR a 100c/ baseado na distribuio condicional o valor VaR
tal que
1 (^\
aI
< \ a1[ T
a
) = c.
O VaR (condicional) uma medida que depende explicitamente de :, / e c e, por-
tanto, pode ser escrita como \ a1
a,aI,c
. A estimao do VaR envolve princpios
e procedimentos at certo ponto similares com a da previso de ^\
aI
. Em ambos
os casos, a lei de probabilidades relevante a distribuio condicional de ^\
aI
dado T
a
, i.e., ) ([ T
a
) . Com efeito, o previsor ptimo para ^\
aI
dado T
a
(de
acordo com o critrio do EQM) corresponde ao primeiro momento da distribuio
) ([ T
a
), i.e.,
L
(^\
aI
[ T
a
) . Por seu turno, o \ a1
a,aI,c
o quantil de ordem
c da distribuio de ) ([ T
a
). Em ambos os casos, as quantidades de interesse so
parmetros da distribuio ) ([ T
a
) .
Uma vantagem do VaR a de poder agregar numa nica medida diferentes
tipos de risco. Pelo contrrio, as medidas tradicionais de risco no so agregveis.
Revejam-se algumas medidas tradicionais de risco.
O risco associado com uma obrigao do tesouro o risco da taxa de juro e
a medida tradicional deste risco a durao (medida de volatilidade do preo da
obrigao face a variaes da taxa de rendimento at maturidade). O principal
risco associado com obrigaes emitidas por entidades particulares o risco de
incumprimento (default risk), o qual pode ser medido atravs de um sistema de
rakings, disponibilizados em vrios casos por agncias de crdito. Para portfolios
de aces o risco normalmente avaliado atravs da volatilidade do portfolio, que
funo das volatilidades individuais e das correlaes entre os diferentes activos.
O risco de taxa de cmbio tipicamente inclui spreads e volatilidades das taxas de
cmbio. Os risco associados a swaps e opes tambm est sujeito a um tratamento
especial.
2
Seguimos a notao anglo-saxnica: a vrgula separa os milhares.
3
Este facto relevante, pelo seguinte. Como iremos ver mais frente uma das abordagens
possveis ao VaR consiste em modelar parametricamente o processo |.\
I
. Ora este processo
quase sempre no estacionrio. Para conrmar este facto, veja-se a gura 6.9, no ponto 6.3.2, onde
se exibe uma trajectria tpica de .\
I
. Desta forma, usando a relao 1
n+I
= .\
n+I
\
n
, pode-se
modelar .\
n+I
via retornos, que geralmente um processo estacionrio.
12.2. ABORDAGEM NO PARAMTRICA 317
Em geral, as medidas tradicionais de risco no podem ser agregadas numa
nica medida (por exemplo, a durao de uma obrigao no pode ser comparada
com a volatilidade de um portfolio). Pelo contrrio, uma das grandes vantagens da
metodologia VaR a de poder agregar diferentes tipos de risco numa nica intuitiva
medida de risco.
Para simplicar admite-se inicialmente que o portfolio constitudo por apenas
um activo.
12.2. Abordagem No Paramtrica
Seja
^\
a1
=
^\
a1
\
a
\
a
= 1
a1
\
a
variao do capital ao m de um perodo. Por denio tem-se
1 (^\
a1
< \ a1
a,a1,c
[ T
a
) = c
ou, equivalentemente,
1 (1
a1
\
a
< \ a1
a,a1,c
[ T
a
) = c,
1
_
1
a1
<
\ a1
a,a1,c
\
a
T
a
_
= c,
1
_
1
a1
<
1
c
T
a
_
= c.
Resulta \ a1
a,a1,c
=
1
c
\
a
onde
1
c
o quantil de ordem c da distribuio de
1
a1
dado T
a
.
Se assumirmos
1
_
1
a1
<
1
c
T
a
_
= 1
_
1
a1
<
1
c
_
o VaR pode estimado a partir da expresso
[
\ a1
a,a1,c
=
1
c
\
a
onde
1
c
o quantil emprico de ordem c da srie de retornos 1
t
4
. Observe-se
que nenhuma hiptese estabelecida sobre a distribuio (marginal) dos retornos -
da a designao de abordagem no paramtrica.
No caso / 1, considera-se
^\
aI
=
^\
aI
\
a
\
a
= 1
aI
(/) \
a
Para determinar \ a1
a,aI,c
resolve-se a expresso
1 (^\
aI
< \ a1
a,aI,c
[ T
a
) = c
4
Na literatura existem diferentes frmulas para calcular o quantil emprico de ordem c. Usare-
mos a seguinte conveno: o quantil emprico ` q
T
o
corresponde estatstica de ordem [nc[ , sendo
[r[ o inteiro de r. Por exemplo, na amostra de dimenso n = 6, |1, 4, 2, 7, 1, 0 , as estatsticas
de ordem so:
(1)
= 0,
(2)
= 1,
(3)
= 2,
(4)
= 4,
(5)
= 7,
(6)
= 1. O quantil de ordem
c = 0.0 a estatstica de ordem [0.0 6[ = , isto ,
(5)
= 7.
em ordem a \ a1
a,aI,c
ou, equivalentemente, resolve-se a expresso
1 (1
aI
(/) \
a
< \ a1
a,aI,c
[ T
a
) = c
1
_
1
aI
(/) <
\ a1
a,aI,c
\
a
T
a
_
= c
1
_
1
aI
(/) <
1
c
T
a
_
= c
em ordem a
1
c
e obtm-se depois \ a1
a,a1,c
=
1
c
\
a
. Se assumirmos
1 (1
aI
(/) <
c
[ T
a
) = 1 (1
aI
(/) <
c
)
o VaR pode estimado a partir da expresso
[
\ a1
a,aI,c
=
1
c
\
a
onde
1
c
o quantil emprico de ordemc da srie de retornos 1
aI
(/) , : = 1, 2, ....
Naturalmente, o VaR pode ser obtido a partir directamente da distribuio em-
prica das variaes de capital ^\
aI
, : = 1, 2, ... . Neste caso viria
[
\ a1
a,aI,c
=

.\
c
, onde
.\
c
o quantil emprico de ordemc da srie ^\
aI
, : = 1, 2, ....
Se a anlise incide sobre um portfolio linear, na construo da srie histrica
dos retornos
1
j,t
= .
1
1
1,t
.
2
1
2,t
... .
a
1
a,t
,
onde .
i
so os pesos do capital investido no activo i (
a
i=1
.
i
= 1), os pesos
devem permanecer xos durante todo o perodo histrico.
A abordagem no paramtrica embora tenha a vantagem de ser simples, sofre
dos seguinte problemas:
Embora a distribuio no esteja especicada (por isso mesmo que
o procedimento se designa por no paramtrico) assume-se (incorrecta-
mente) que a distribuio relevante para obter o VaR a distribuio mar-
ginal de 1
aI
e no a distribuio condicional. Mas o VaR est associado
a uma previso dos retornos dada (obviamente) a informao disponvel
T
a
e, por isso, a distribuio condicional que nos interessa. Assim,
mesmo que no perodo : se registe, por exemplo, alta volatilidade e per-
das acentuadas, essa informao negligenciada para obter o VaR.
Quando c muito baixo por exemplo c = 0.01 ou inferior o estimador

1
c
muito impreciso. A justicao terica dada pelo seguinte resul-
tado assimpttico. Suponha-se que A
t
, t = 1, ..., : uma sucesso de
variveis i.i.d. com funo distribuio 1 e funo densidade de proba-
bilidade ) e seja
c
= inf r : 1 (r) _ c . O quantil emprico
c
(isto,
a estatstica de ordem [:c[) tem distribuio assimpttica dada por
_
:(
c
c
)
o
_
0,
c(1 c)
() (
c
))
2
_
.
A varincia assimpttica de
c
explode quando a fdp no ponto valor
c
, ) (
c
) , aproximadamente zero. Isto sucede quando
c
um valor
extremo (i.e., muito afastado do centro da distribuio), isto , quando c
um valor muito baixo, perto de zero, (ou muito alto, perto de 1). Em
12.3. ABORDAGEM PARAMTRICA 319
suma, a varincia do quantil emprico alta nas abas e baixa no centro da
distribuio.
At onde coligir os dados? Considerar todo o passado disponvel? Ou s
o passado recente? Esta questo mais relevante neste procedimento do
que em outros, pois a metodologia exposta atribui o mesmo peso a todas
as observaes. Normalmente considera-se o passado recente pois dados
muito antigos podem no reectir a dinmica do processo no presente e
no futuro imediato (ser relevante atribuir importncia ao crash de 1929-
31 para obter o VaR num futuro prximo?). Por outro lado, tambm no
convm denir janelas de observaes muitas curtas pois a ecincia do
estimador do quantil de ordem c pode ser severamente afectada, sobre-
tudo quando c muito baixo. Vrios estudos indicam como razovel
considerar-se os ltimos dois ou trs anos de observaes.
12.3. Abordagem Paramtrica
Considere-se novamente a expresso para o caso / = 1:
^\
a1
=
^\
a1
\
a
\
a
= 1
a1
\
a
r
a1
\
a
.
Esta expresso mostra que a distribuio condicional de r
a1
\
a
apenas depende da
distribuio de r
a1
(no momento :, \
a
conhecido). Podemos assim concentrar-
nos apenas sobre a distribuio de r
a1
. Assuma-se r
a1
[ T
a
~ 1
_
j
a1
, o
2
a1
_
onde 1 uma distribuio qualquer de mdia j
a
e varincia o
2
a
. Tem-se
1 (^\
a1
< \ a1
a,a1,c
[ T
a
) = c
1
_
r
a1
<
\ a1
a,a1,c
\
a
T
a
_
= c.
Estandardizando r
a1
, isto , considerando
7
a1
=
r
a1
j
a1
o
a1
vem
1
_
7
a1
<

\ o1
n,n+1,o
\
n
j
a1
o
a1
T
a
_
= c (12.1)
\ o1
\
n
j
a1
o
a1
=
Z
c
= \ a1
a,a1,c
=
_
j
a1

Z
c
o
a1
_
\
a
(12.2)
(
Z
c
o quantil de ordem c da distribuio da varivel 7
a1
).
No caso / 1 tem-se
^\
aI
=
^\
aI
\
a
\
a
- (r
a1
r
a2
... r
aI
) \
a
, r
ai
= log (1
ai
,1
ai1
)
= r
aI
(/) \
a
.
No por mero acaso que se passa de ^\
aI
para r
aI
(/) \
a
. A ideia obter
a distribuio de ^\
aI
a partir da distribuio de r
aI
(/) . Claro que, formal-
mente, ^\
aI
igual a 1
aI
(/) \
a
(onde 1
aI
(/) so os retornos discretos
multi-perodos). O problema com esta relao decorre do facto da distribuio de
1
aI
(/) ser geralmente difcil de tratar.
Para determinar \ a1
a,aI,c
considera-se
1 (r
aI
(/) \
a
< \ a1
a,aI,c
[ T
a
) = c
1
_
r
aI
(/) <
\ a1
a,aI,c
\
a
T
a
_
= c
e, estandardizando
5
r
aI
(/), i.e.,
7
aI
=
r
aI
(/)
L
(r
aI
(/)[ T
a
)
_
Vai (r
aI
[ T
a
)
vem
1
_
7
aI
<

\ o1
n,n+I,o
\
n

L
(r
aI
(/)[ T
a
)
_
Vai (r
aI
[ T
a
)
T
a
_
= c.
Conclui-se
\ o1
n,n+I,o
\
n

L
(r
aI
(/)[ T
a
)
_
Vai (r
aI
(/)[ T
a
)
=
Z
c
= \ a1
a,aI,c
=
_
L
(r
aI
(/)[ T
a
)
Z
c
_
Vai (r
aI
(/)[ T
a
)
_
\
a
(12.3)
Estas frmulas gerais sero agora adaptadas a casos mais simples.
12.3.1. Modelo Gaussiano Simples. O caso mais simples consiste em as-
sumir
r
t
= j n
t
, (12.4)
onde n
t
umrudo branco Gaussiano, n
t
~
_
0, o
2
_
. Assim, r
a1
~
_
j, o
2
_
.
No caso / = 1, tem-se, pela frmula (12.2)
\ a1
a,a1,c
=
_
j
Z
c
o
_
\
a
onde
Z
c
o quantil de ordem c da distribuio (0, 1) (observe-se que a varivel
7
a1
na expresso (12.1) tem distribuio (0, 1)). No caso / 1 necessrio
deduzir-se a distribuio condicional de r
aI
(/). Como, por hiptese, r
aI
(/)
no depende T
a
, a distribuio condicional coincide com a distribuio marginal.
Pelas propriedades habituais da distribuio normal vemr
aI
(/) = r
a1
r
a2
... r
aI
~
_
/j, /o
2
_
. Assim,
L
(r
aI
(/)[ T
a
) =
L
(r
aI
(/)) = /j
Vai (r
aI
(/)[ T
a
) = Vai (r
aI
(/)) = /o
2
5
Admitindo que faz sentido a estandardizazo. Veremos que no caso geral a distribuio de
W
n+I
desconhecida.
e, portanto, pela aplicao da frmula (12.3), vem
\ a1
a,aI,c
=
_
/j
_
/o
Z
c
_
\
a
.
Se j = 0 deduz-se \ a1
a,aI,c
=
_
/\ a1
a,a1,c
12.3.2. Modelo RiskMetrics. As hipteses de normalidade e varincia condi-
cional constante, assumidas no modelo anterior, so, como se sabe, bastante limita-
tivas. Um modelo relativamente simples, mas assumindo varincia condicional no
constante corresponde ao modelo RiskMetrics desenvolvido pela J.P. Morgan para
o clculo do VaR. A metodologia baseia-se no modelo EWMA (equao (8.7)):
r
t
= o
t
-
t
, o
2
t
= (1 `) r
2
t1
ò
2
t1
onde -
t
um rudo branco de mdia nula e varincia 1. O modelo assenta na
hiptese IGARCH(1,1) com termo constante nulo, . = 0, e mdia condicional
nula, j
t
= 0. Para obter \ a1
a,aI,c
aplica-se uma vez mais a frmula (12.3).
Para o efeito estude-se a distribuio condicional de r
aI
(/) . Comece-se por ver-
icar que
L
(r
ai
[ T
a
) = 0,
L
_
o
2
ai
T
a
_
= o
2
a
(Ver previso IGARCH, ponto 8.11.1).
Logo, tendo em conta que
L
(r
t
r
ti
) = 0, vem
L
(r
aI
(/)[ T
a
) = 0
Vai (r
aI
(/)[ T
a
) = Vai (r
a1
... r
aI
[ T
a
)
= Vai (r
a1
[ T
a
) ... Vai (r
aI
[ T
a
)
=
L
_
o
2
a1
T
a
_
...
L
_
o
2
aI
T
a
_
= /o
2
a
.
So conhecidos os dois primeiros momentos. Falta conhecer-se a lei de probabili-
dade de r
aI
(/) . Assuma-se que r
aI
(/)[ T
a
temdistribuio aproximadamente
normal
6
r
aI
(/)[ T
a
o
~ (
L
(r
aI
(/)[ T
a
) , Vai (r
aI
(/)[ T
a
)) .
Pela frmula (12.3) vem
\ a1
a,aI,c
=
_
Z
c
_
/o
a
_
\
a
onde
Z
c
o quantil de ordem c da distribuio (0, 1) .
Naturalmente outras distribuies podem ser consideradas. Note-se nalmente
\ a1
a,aI,c
=
_
/\ a1
a,a1,c
.
12.3.3. Modelo ARMA-GARCH. Assuma-se agora
c
j
(1) r
t
= j 0
q
(1) n
t
n
t
= o
t
-
t
, n
t
~ GARCH.
Tal como no caso anterior, temos de obter a distribuio de r
aI
(/)[ T
a
. Tem-
se
L
(r
aI
(/)[ T
a
) = j
a1,a
... j
aI,a
onde j
ai,a
=
L
(r
ai
[ T
a
) a previso de r para o momento : i dada a
informao disponvel no momento :. Para obter Vai (r
aI
(/)[ T
a
) comece-se
por observar que
Vai (r
aI
(/)[ T
a
) =
L
_
_
r
a1
... r
aI
_
j
a1,a
... j
aI,a
__
2
T
a
_
=
L
_
(c
a
(1) ... c
a
(/))
2
T
a
_
(12.5)
6
A distribuio de v
n+I
(I)[ T
n
geralmente desconhecida. Mesmo no caso em que v
n+1
[ T
n
tem distribuio normal, v
n+.
[ T
n
para i = 2, 8, ... no tem distibuio normal. Relembre-se que,
sob certas condies, a distribuio de v
n+.
[ T
n
quando i o converge para a distribuio
marginal que geralmente diferente da distribuio condicional. Pode-se mostrar que a funo de
distribuio de v
n+I
(I)[ T
n

1
n,I
(r) =
_
r
n
(I)i
) ( v
n+I
(I)[ T
n+I1
)
I1
.=1
) ( v
n+.
[ T
n+.1
) dv
n+1
...dv
n+I
.
Esta expresso s conhecida no caso I = 1. Para I 1 a expresso anterior intratvel. Neste
caso a fdp v
n+I
(I)[ T
n
pode considerar-se desconhecida (Tsay (2001), cap.7 conclui erradamente
que -
n
~ Normal = v
n+I
(I)[ T
n
~ Normal). Apesar destas observaes, podemos assumir
v
n+I
(I)[ T
n
- ` (L( v
n+I
(I)[ T
n
) , \ui ( v
n+I
(I)[ T
n
))
por duas razes:
se I = 1 e - ~ ` (0, 1) , v
n+I
(I)[ T
n
ter certamente distribuio normal. A dis-
tribuio de v
n+I
(I)[ T
n
no caso I = 2 ou I = 8 no dever, em princpio, afastar-se
muito da distribuio normal;
com I alto e supondo v estacionrio e fracamente dependente, pode-se invocar o teo-
rema do limite central. Com efeito v
n+I
(I)[ T
n
_
\ui ( v
n+I
(I)[ T
n
) uma soma
normalizada que, sob certas condies, converge em distribuio para Z ~ ` (0, 1).
Vimos no ponto 6.6.4 que
c
a
(/) = c
0
n
aI
c
1
n
aI1
... c
I1
n
a1
=
I1
)=0
c
)
n
aI)
.
Como
c
a
(1) = n
a1
,
c
a
(2) = n
a2
c
1
n
a1
,
...,
c
a
(/) = n
aI
c
1
n
aI1
... c
I1
n
a1
resulta
c
a
(1) ... c
a
(/) = n
a1
(n
a2
c
1
n
a1
) ...
I1
)=0
c
)
n
aI)
= n
aI
(1 c
1
) n
aI1
...
_
_
I1
)=0
c
)
_
_
n
a1
.
Como n
t
um RB vem
Vai (r
aI
(/)[ T
a
) =
L
_
(c
a
(1) ... c
a
(/))
2
T
a
_
= Vai (n
aI
[ T
a
) (1 c
1
)
2
Vai (n
aI1
[ T
a
)
...
_
_
I1
)=0
c
)
_
_
2
Vai (n
a1
[ T
a
) . (12.6)
Falta conhecer-se a lei de probabilidade de r
aI
(/) . Sob a hiptese
r
aI
(/)[ T
a
o
~ (
L
(r
aI
(/)[ T
a
) , Vai (r
aI
(/)[ T
a
))
e atendendo frmula (12.3) vem
\ a1
a,aI,c
=
_
L
(r
aI
(/)[ T
a
)
Z
c
_
Vai (r
aI
(/)[ T
a
)
_
\
a
onde
L
(r
aI
(/)[ T
a
) e Vai (r
aI
(/)[ T
a
) so dados pelas expresses (12.5) e
(12.6).
EXEMPLO 12.3.1. Considere-se o modelo
r
t
= o
t
-
t
, o
2
t
= . c
1
r
2
t1
,
1
o
2
t1
.
Tendo em conta que
o
2
aI,a
=
.
1 c
1
,
1
(c
1
,
1
)
I1
_
c
1
r
2
a
,
1
o
2
a
_
, (n
a
= r
a
)
resulta
Vai (r
aI
(/)[ T
a
)
= Vai (n
aI
[ T
a
) Vai (n
aI1
[ T
a
) ... Vai (n
a1
[ T
a
)
=
I
I=1
o
2
aI,a
=
I
I=1
_
.
1 c
1
,
1
(c
1
,
1
)
I1
_
c
1
r
2
a
,
1
o
2
a
_
_
=
1
1 c
1
,
1
_
/.
_
c
1
r
2
a
,
1
o
2
a
_
_
(c
1
,
1
)
I
1
__
.
Tem-se
r
aI
(/)[ T
a
~ (0, Vai (r
aI
(/)[ T
a
))
e
\ a1
a,aI,c
=
_
Z
c
_
1
1 c
1
,
1
_
/. (c
1
r
2
a
,
1
o
2
a
)
_
(c
1
,
1
)
I
1
__
_
\
a
.
EXEMPLO 12.3.2. Na tabela seguinte apresentam-se os resultados da esti-
mao GARCH dos retornos do Dow Jones (28317 observaes dirias).
Dependent Variable: retornos do Dow JOnes
Method: ML - ARCH
Included observations: 28317 after adjusting endpoints
Coefficient Std. Error z-Statistic Prob.
C 0.000416 4.54E-05 9.155216 0.0000
Variance Equation
C 1.17E-06 5.17E-08 22.67097 0.0000
ARCH(1) 0.085080 0.001263 67.38911 0.0000
GARCH(1) 0.905903 0.001542 587.6203 0.0000
R-squared -0.000450 Mean dependent var 0.000188
Adjusted R-squared -0.000556 S.D. dependent var 0.010753
Log likelihood 94026.27 Durbin-Watson stat 1.921149
Sabe-se que r
a
= 0.0101, o
2
a
= 0.00014.
Dado que o modelo envolve um termo constante c, o \ a1
a,aI,c
estimado,
supondo \
a
= 1, corresponde expresso
c/
Z
c
_
1
1 c
1
,
1
_
/ .
_
c
1
n
2
a

,
1
o
2
a
_
_
_
c
1

,
1
_
I
1
__
onde n
a
= r
a
c = 0.01010.000416 = .0101. Na gura 12.1 representa-se
o \ a1 para c = 0.01 e para c = 0.0 em funo de /.
0 1 2 3 4 5 6 7 8 9 10
0.00
0.05
0.10
0.15
h
VaR
FIGURA 12.1. Value at Risk como funo de /. \ a1
aI,a,0.01
trao grosso; \ a1
aI,a,0.0
trao no.
EXEMPLO 12.3.3. Considere-se o modelo
r
t
= c cr
t1
n
t
, n
t
= o
t
-
t
(12.8)
o
2
t
= . n
2
t1
J
&
I1
<0
,o
2
t1
. (12.9)
Tem-se,
L
(r
aI
(/)[ T
a
) = j
a1,a
... j
aI,a
.
Tendo em conta a estrutura AR(1), vem pela equao (6.17),
j
aI,a
= c
1 c
I
1 c
c
I
j
a
.
Assim,
L
(r
aI
(/)[ T
a
) =
_
c
1 c
1
1 c
c
1
j
a
_
...
_
c
1 c
I
1 c
c
I
j
a
_
=
j
a
(1 c) c
_
1 c
I
_
c
_
/(1 c) c
_
1 c
I
__
(1 c)
2
Por outro lado, para calcular Vai (r
aI
(/)[ T
a
) necessrio obter c
i
(conra-
se (12.6)). Como se sabe, c
)
so os coecientes que resultam da equao c (1) =
c
1
j
(1) 0 (1) (veja-se a equao (6.20)). No caso AR(1) facilmente se conclui que
c (1) = 1 c1 ... c
I
1
I
..., pelo que c
i
= c
i
. A aplicao da frmula
(12.6) envolve tambm Vai (n
aI
[ T
a
) := o
2
aI,a
que necessrio estabelecer.
Para o modelo denido em (12.9) tem-se,
o
2
a1,a
= . n
2
a
J
&
n
<0
,o
2
a
o
2
a2,a
= . (,2 ,) o
2
a1,a
...
o
2
aI,a
= . ,
+
o
2
aI1,a
, ,
+
= ,2 ,.
Resolvendo iterativamente o
2
aI,a
como funo de o
2
a1,a
facilmente se conclui
que
o
2
aI,a
=
.
1 ,
+
,
I1
+
_
o
2
a1,a
.
1 ,
+
_
.
A equao (12.6), para o modelo em anlise, escreve-se agora da seguinte forma
Vai (r
aI
(/)[ T
a
) =
I
I=1
_
_
_
_
II
)=0
c
)
_
_
2
_
.
1 ,
+
,
I1
+
_
o
2
a1,a
.
1 ,
+
__
_
_
.
O valor de Vai (r
aI
(/)[ T
a
), dado pelo programa Mathematica, igual a
1
(1 c)
2
(1 ,
+
)
_
/.
c
_
1 c
I
_ _
2 c c
1I
_
1 c
2
o
2
a1,a
_
1 ,
I
+
_
.
_
1 ,
I
+
_
1 ,
+

_
. o
2
a1,a
(,
+
1)
_
_
_
_
_
c
22I
_
_
o
2
_
I
1
_
c
2
,
+
2
c
1I
_
_
o
_
I
1
_
c ,
+
_
_
_
_
_
_
_
_
.
12.4. Generalizao: Portfolio com : Activos
Obtenha-se agora o VaR supondo que o portfolio constitudo por : aces.
Para simplicar assuma-se que
r
t
= (1
1t
, ..., 1
nt
)
t
T
t1
~ (
t
, H
t
)
onde
t
:=
L
(r
t
[ T
t1
) e Vai (r
t
[ T
t1
) := H
t
. No momento : o portfolio
vale \
a
, por exemplo, uma alocao de 1 milho de Euros no ttulo 1 e 2 milhes
no ttulo 2, traduz-se por um investimento no valor de \
a
= 3 milhes, sendo
.
1
= 1,8 desse valor investido no ttulo 1 e .
2
= 2,8 investido no ttulo 2. A
obteno do VaR similar ao do caso de um portfolio com apenas 1 activo:
1 (^\
a1
< \ a1
a,a1,c
[ T
a
) = c
1
_
^\
a1
\
a
\
a
< \ a1
a,a1,c
T
a
_
= c
1
_
1
j,a1
<
\ a1
a,a1,c
\
a
T
a
_
= c.
Estandardizando 1
j,a1
, isto , considerando
7
a1
=
1
j,a1
L
(1
j,a1
[ T
a
)
_
Vai (1
j,a1
[ T
a
)
12.5. ABORDAGEM PELA TEORIA DOS VALORES EXTREMOS 327
vem
1
_
7
a1
<

\ o1
n,n+1,o
\
n

L
(1
j,a1
[ T
a
)
_
Vai (1
j,a1
[ T
a
)
T
a
_
= c
\ o1
n,n+1,o
\
n

L
(1
j,a1
[ T
a
)
_
Vai (1
j,a1
[ T
a
)
=
Z
c
=\ a1
a,a1,c
=
_
L
(1
j,a1
[ T
a
)
Z
c
_
Vai (1
j,a1
[ T
a
)
_
\
a
Tendo em conta que 1
j,a1
=

n
i=1
.
i
1
i,a1
= !
t
r
a1
, tem-se 1
j,a1
=
L
(1
j,a1
[ T
a
) = !
t
a1
e Vai (1
j,a1
[ T
a
) = !
t
H
a1
! e, nalmente
\ a1
a,a1,c
=
_
!
t
a1

.
c
_
!
t
H
a1
!
_
\
a
onde
.
c
o quantil de ordem c da distribuio (0, 1) .
EXEMPLO 12.4.1. Considere-se um portfolio, no momento :, constitudo por
de 1 milho de Euros no ttulo 1 e 2 milhes no ttulo 2. Admita-se a seguinte
distribuio
_
1
1,a1
1
2,a1
_
T
a
~
__
0
0
_
,
_
0.01 0.002
0.002 0.00
__
.
Tem-se para c = 0.0
\ a1
a,a1,c
= 1.64
_
_
1,8 2,8
_
_
0.01 0.002
0.002 0.00
__
1,8
2,8
_
8 = 0.82 milhes.
O valor em risco com uma probabilidade de 0.05 para um horizonte temporal de
/ = 1 perodo de cerca de 0.32 milhes de euros.
Se considerssemos os dois activos separadamente teramos:
\ a1 do ttulo 1 = 1.64
_
0.01 1 = 0.164
\ a1 do ttulo 2 = 1.64
_
0.00 2 = 0.282.
Observa-se que a soma dos VaR individuais, 0.164 0.282 = 0.806, maior do
que o VaR do portfolio.
12.5. Abordagem pela Teoria dos valores Extremos
A teoria dos valores extremos um ramo da estatstica que se preocupa essen-
cialmente com o comportamento probabilstico dos valores extremos da amostra
e, portanto, centra a sua anlise nas caudas da distribuio. Esta anlise impor-
tante em todos os fenmenos em que a ocorrncia de valores muitos altos e muitos
baixos relevante, como por exemplo, ocorrncia de cheias, furaces, recordes
desportivos, etc. A teoria dos valores extremos tem tambm sido aplicada na ac-
tividade seguradora e, mais recentemente, nas rea das nanas, no clculo do
VaR.
Recorde-se a abordagem no paramtrica. Vimos que o VaR pode estimado a
partir da expresso
[
\ a1
a,a1,c
=
v
c
\
a
(12.10)
onde
v
c
o quantil emprico de ordem c da srie de retornos 1
t
(tambm pode-
ria ser a partir de r
t
). Como referimos no ponto 12.2, a estimativa
c
muito
imprecisa quando c muito baixo (ou muito alto). Como iremos ver a teoria dos
valores extremos tem uma resposta para este problema. O objectivo deste ponto
obter uma estimativa para
o
via teoria dos valores extremos.
12.5.1. Introduo Teoria e Estimao. VaR Marginal. A teoria dos val-
ores extremos trata habitualmente os eventos extremos que ocorrem na aba direita
da distribuio. Seguiremos esta lgica na introduo e, depois, por analogia, fo-
caremos a aba esquerda que a relevante para o clculo do VaR. O leitor poder
consultar o livro de Franke et. al (2008) para mais pormenores sobre a teoria.
Seja j
t
; i = 1, 2, ..., : uma sucesso de v.a. i.i.d. e '
a
= max j
1
, j
2
, ..., j
a
o mximo da amostra. Pode-se provar que se existirem constantes normalizadoras

c
a
0, d
a
R e uma distribuio no degenerada H (isto , que no atribui toda
a massa de probabilidade a um nico ponto) tal que c
1
a
('
a
d
a
)
o
H, ento
H da forma
H
(r) = oxp
_
(1 r)
1
_
, 1 r 0, ,= 0.
Nestas circunstncias, para : sucientemente grande, tem-se 1
_
c
1
a
('
a
d
a
) _ r
_
(r) (ou, 1 ('

a
_ r) H
_
aA
c
_
para algum ` R e c 0). O caso = 0
deve ser interpretado no seguinte sentido: H
0
(r) = lim
0
H
(r) = c
c
i
. H
designado na literatura por Generalised Extreme Value distribution (GEV)
Quando o resultado anterior se verica para a v.a. j, com funo de dis-
tribuio 1 e distribuio limite H, diz-se que 1 pertence ao domnio mximo
de atraco da distribuio H e, neste caso, escreve-se 1 T
A
(H).
A metodologia de estimao que iremos apresentar, intitulada POT (peaks-
over-threshold), assenta na seguinte proposio:
PROPOSIO 12.5.1. Suponha-se que j
t
uma sucesso de v.a. com funo
de distribuio 1. Ento as seguintes proposies so equivalentes: 1) 1
T
A
(H); 2) para alguma funo , : R
,
lim
&a
T
sup
0<a<a
T
&
1
&
(r) G
,o(&)
(r)
= 0 (12.11)
onde
r
1
= supr R : 1 (r) < 1 _
1
&
(r) = 1 (j n _ r[ j n)
G
,o
(r) =
_
1
_
1
a
o
_
1
, 1
a
o
0, r 0 se ,= 0
1 c
a
, r _ 0 se = 0.
G
,o
a funo de distribuio generalizada de Pareto e 1
&
(r) a designada
excess distribuition function. A equao (12.11) basicamente estabelece que (na
classe das funes 1 tais que 1 T
A
(H)), para valores altos de n, 1
&
aprox-
imadamente igual a G
,o
e, portanto, uma estimativa para 1
&
pode basear-se em
G
,o
(sempre que n relativamente alto). Tendo em conta que, por denio,
1 1
&
(r) = 1 (j n _ r[ j n) =
1 1 (r n)
1 1 (n)
segue-se (considerando o primeiro e o terceiro termo da expresso anterior)
1 1 (r n) = (1 1 (n)) (1 1
&
(r))
ou (fazendo a substituio de r n por r, passando agora r a ser denido por
r n),
1 1 (r) = (1 1 (n)) (1 1
&
(r n)) , n < r < . (12.12)
Esta relao juntamente com (12.11) constitui o essencial do mtodo que se expe
para a estimao do VaR. Como 1 e consequentemente 1
&
so funes desconheci-
das, a expresso do lado direito de (12.12) pode ser estimada da seguinte forma
_
1

1 (n)
__
1

1
&
(r n)
_
onde,
1

1 (n) =
1
:
a
)=1
J
j
&
=
(n)
:
,

1
&
(r n) =

G
`
,
`
o
(r n) .
A estimativa do lado direito de (12.12)
_
1

1 (n)
__
1

1
&
(r n)
_
=
(n)
:
_
1

G
`
,
`
o
(r n)
_
=
(n)
:
_
1

r n
,
_
1
`
.
Substitua-se na expresso (12.12), r por
c
:
1 1 (
c
) =
(n)
:
_
1

c
n
,
_
1
`
1 c =
(n)
:
_
1

c
n
,
_
1
`
.
Resolvendo esta equao para
c
obtm-se

c
= n

,
_
_
:
(n)
(1 c)
_
1
_
. (12.14)
Se c no for um valor muito alto (perto de 1) podemos usar para estimativa
de
c
a estatstica de ordem [:c[ . Vimos, no entanto, que se c for um valor muito
alto a varincia assimpttica deste quantil emprico aproxima-se de mais innito.
Nestas circunstncias, a teoria dos valor extremos tem uma soluo que consiste
em estimar
c
pela expresso (12.14).
Existem ainda trs questes por analisar: 1) Como estimar e ,; 2) como
escolher n e 3) como obter o VaR?
Estimao de e ,
Sejam j
(1)
, j
(2)
, ..., j
(a)
as estatsticas de ordem tais que
j
(1)
_ j
(2)
_ ... _ j
(.(&))
_ ... _ j
(a)
e 1
i
= j
(i)
n (nota: j
(1)
o valor mximo, j
(2)
o segundo valor mais alto
etc.; relembra-se o leitor que usmos j
(1)
para o mnimo, j
(2)
para o segundo mais
baixo, etc. Resulta da notao que j
(1)
= j
(a)
, j
(a)
= j
(1)
, etc.). Para estimar
e , dado que (n) = : xo, assume-se que 1
1
, 1
2
, ..., 1
n
uma sucesso de
v.a. i.i.d. com distribuio G
,o
(j) ( 0) . Logo, a funo log-verosimilhana
log 1
n
(, ,[ 1
1
, 1
2
, ..., 1
n
, (n) = :) = :log ,
_
1
1
_
n
)=1
log
_
1

,
1
)
_
.
(12.15)
Os estimadores de mxima verosimilhana

e

, obtm-se a partir da maximizao
de log 1
n
. Pode-se provar que, para 1,2 e :
_
:
_

`
o
o
1
_
o
_
_
0
0
_
,
_
(1 )
2
(1 )
(1 ) 2 (1 )
_
1
_
.
Como escolher n
Quando n muito alto o valor de (n) baixo (signica que o nmero de ob-
servaes efectivamente usadas na estimao baixo) e a varincia do estimador
tende a ser alta. Quando n baixo, a aproximao para 1
&
(r) , usando a dis-
tribuio G
,o
(r) tender a ser pobre e, como consequncia o estimador
c
pode
vir fortemente enviesado.
Para ajudar na escolha de n considera-se o seguinte resultado: se 7 ~ G
,o
e
0 _ < 1, ento the average excess function linear:
c (n) =
L
(7 n[ 7 n) =
,
1

1
n, n _ 0, 0 _ < 1.
Este resultado sugere seleccionar o limiar n de forma que a funo estimada para
c (n) , c
a
() , para os valores _ n seja (aproximadamente) linear. Pode-se provar
que
c
a
(n) =
1
(n)
a
)=1
max (j
)
n) , 0 .
Para vericar se c
a
() (aproximadamente) linear pode-se analisar no plano o
grco dos pontos
_
j
(I)
, c
a
_
j
(I)
__
onde j
(1)
, j
(2)
, ..., j
(a)
so as estatsticas de
ordem tais que
j
(1)
_ j
(2)
_ ... _ j
(a)
.
Devido alta variabilidade de c
a
_
j
(I)
_
quando / alto, recomenda-se a eliminao
desses pontos na anlise grca.
Como obter o VaR?
Como focmos a cauda direita da distribuio (e a que interessa a esquerda)
assume-se j
t
= r
t
. Assim, se
c
o quantil de ordem c associada varivel j,
ento
v
c
=
c
com c = 1 c, o quantil de ordem c associado varivel r.
Pela equao (12.10), uma estimativa para o VaR
\ a1 =
v
c
\
a
=
c
\
a
, c = 1 c.
Para obter o VaR a c100/ pode-se seguir os seguintes passos:
(1) Denir j
t
= r
t
;
(2) Denir c = 1 c;
(3) Seleccionar n;
(4) Obter
_
,
_
, maximizando (12.15);
(5) Calcular
c
usando a equao (12.14);
(6) Obter o \ a1 =
c
\
a
12.5.2. VaR Condicional. O ponto anterior assentou na hiptese de r
t
ser
uma sucesso de v.a. i.i.d. Esta hiptese irrealista. O VaR calculado sob esta
hiptese no reecte a volatilidade corrente no momento : (seria de esperar o VaR
aumentasse quando no momento : a volatilidade alta). McNeil e Frey (2000)
propem uma abordagem condicional do VaR no mbito da teoria dos valores ex-
tremos. A ideia assenta no modelo ARMA-GARCH r
t
= j
t
o
t
-
t
. Se o mod-
elo estiver bem especicado ser de esperar que -
t
se comporte aproximadamente
como uma sucesso de v.a. i.i.d. Como os resultados principais da teoria dos val-
ores extremos se aplicam a sequncias i.i.d., prefervel aplic-los sucesso -
t
do que directamente a r
t
, pois esta sucesso no geralmente i.i.d., devido
presena de volatilidade no constante.
Seja
.
c
o quantil da distribuio de -
t
obtido seguindo a metodologia do ponto
anterior. Tem-se assim,
1 (-
a1
<
.
c
[ T
a
) = c
1
_
r
a1
j
a1
o
a1
<
.
c
T
a
_
= c
1
_
r
a1
< j
a1

.
c
o
a1
T
a
_
= c.
Em suma, uma vez apurado
.
c
, o quantil da distribuio condicional de r
a1
vem
igual a
v
c
= j
a1

.
c
o
a1
.
Como -
t
no observado, toma-se
-
t
=
r
t
j
t
o
t
onde j
t
e o
t
so estimativas da mdia e da varincia condicional baseadas em
estimadores consistentes. Finalmente,

v
c
= j
a1

`.
c
o
a1
.
12.6. Avaliao do VaR (Backtesting)
Neste ponto avalia-se a qualidade da estimativa proposta para o VaR. Esta
avaliao importante por vrias razes. As empresas (sobretudo bancos) que
usam o VaR so pressionadas interna e externamente (por directores, auditores,
reguladores, investidores) para produzirem VaR precisos. Um VaR preciso fun-
damental na gesto e controle do risco e na alocao de capital. Por essa razo
essencial que empresa teste regularmente as suas medidas de risco, na linha das
recomendaes adoptadas em acordo internacionais. Por outro lado, embora a
denio de VaR seja muito precisa e objectiva, existem diferentes mtodos de es-
timao do VaR, que produzem diferentes estimativas (algumas bastante dspares);
por isso, importante identicar a melhor abordagem para o problema concreto
em anlise.
Christoffersen e Diebold (2000) analisam a qualidade e a preciso dos inter-
valos de conana produzidos para uma certa srie. Parte da metodologia pode
ser adaptada na anlise da qualidade do VaR. Seja
[
\ a1
t,t1,c
uma estimativa para
o VaR a c100/ para o perodo t baseado na informao t 1. Sendo este VaR
construdo no perodo t 1 no se sabe, antecipadamente, se no perodo t se tem
ou no ^\
t
<
[
\ a1
t,t1,c
. Intuitivamente, natural esperar que a desigualdade
^\
t
<
[
\ a1
t,t1,c
, com t a variar, ocorra c100/ das vezes. Considere-se o
evento aleatrio,
1
t
=
_
1 se ^\
t
< \ a1
t,t1,c
ou r
t
<
\ o1
I,I1,o
\
I1
0 no caso contrrio.
Diz-se que a previso do VaR produz uma cobertura marginal correcta (correct
uncondicional coverage) se
1 (1
t
= 1) = c =
L
(1
t
) = c.
Se esta condio se verica ento em c100/ dos casos dever observar-se ^\
t
<
\ a1
t,t1,c
. exactamente este raciocnio que se estabelece a priori quando se
procura denir o VaR a c100/. Interessa depois saber se, na prtica, essa de-
sigualdade se verica efectivamente em c100/ das vezes. Esta condio , nat-
uralmente, necessria mas no suciente para identicar uma medida VaR como
apropriada. Suponha-se, como habitualmente nas sries nanceiras, que se tem o
fenmeno de volatility clustering. Momentos de alta (baixa) volatilidade so segui-
dos por momentos de alta (baixa) volatilidade. Nestas circunstncias, o VaR deve
ser alto nos momentos de alta volatilidade e baixo nos momentos de baixa volatil-
idade. Se o \ a1
t,t1,c
no reecte o fenmeno de volatility clustering (nem em
termos gerais as propriedades da distribuio condicional) ento o VaR tender a
falhar como medida de risco em perodos consecutivos. Um VaR assim denido
traz a seguinte implicao sobre 1
t
: em momentos de alta volatilidade os 1
t
:
tendem a repetir-se (por exemplo, 1
t
= 1, 1
t1
= 1, 1
t2
= 1, etc.), pois ten-
der a observar-se em perodos seguidos ^\
t
< \ a1
t,t1,c
e, em momentos de
baixa volatilidade, uma repetio de 0
t
:. Ou seja a sucesso 1
t
tender a apresentar
12.6. AVALIAO DO VAR (BACKTESTING) 333
dependncia temporal (ser autocorrelacionada). Mesmo neste caso, de autocorre-
lao de 1
t
, poder ter-se
L
(1
t
) = c. Por esta razo a cobertura marginal embora
necessria no suciente para identicar o VaR como uma medida precisa.
Diz-se que a previso do VaR produz uma cobertura condicional correcta (cor-
rect condicional coverage) se
1 (1
t
= 1[ T
t1
) = c =
L
(1
t
[ T
t1
) = c.
Esta condio implica ausncia de autocorrelao, pois, tendo em conta a lei do
valor esperado iterado,
Cov (1
t
, 1
tI
)
=
L
(1
t
1
tI
)
L
(1
t
)
L
(1
tI
)
=
L
(1
tI L
(1
t
[ T
tI
))
L
(
L
(1[ T
t1
))
L
(
L
(1
tI
[ T
tI1
))
=
L
(1
tI L
(
L
(1
t
[ T
t1
)[ T
tI
))
L
(
L
(1[ T
t1
))
L
(
L
(1
tI
[ T
tI1
))
=
L
(1
tI L
(c[ T
tI
))
L
(c)
L
(c) = c
L
(1
tI
) c
2
= 0.
Existem vrias formas de testar a cobertura marginal e condicional. Por exemplo,
se 1
t
uma sucesso de v.a. i.i.d. e
L
(1
t
) = c, ento ambas as coberturas so
vlidas. Outra possibilidade consiste em analisar somente a cobertura condicional
pois, pela lei do valor esperado iterado, tem-se, com vimos atrs,
L
(1
t
[ T
t1
) = c =
L
(1
t
) =
L
(
L
(1
t
[ T
t1
)) =
L
(c) = c.
Analise-se o teste de independncia de 1
t
. Uma possibilidade neste sentido
baseia-se no runs test. Procede-se da seguinte forma. Seja A o nmero sequn-
cias seguidas de 1
t
: ou 0
t
: (A o nmero de runs)
7
. Por exemplo, na sucesso
0, 0, 1, 1, 1, 0, 0, 0, 0, 1, 0 temos A = . Sejam :
0
e :
1
o nmero de zeros e uns,
respectivamente, e : = :
0
:
1
a dimenso da amostra. O nmero A fornece
informao sobre se a amostra aleatria ou no. Se ocorrem poucas sequncias
de 1
t
: ou 0
t
:, como no exemplo,
0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1 , (A = 2)
h indicao de dependncia temporal na sucesso. Se ocorrem demasiadas se-
quncias, como no exemplo,
1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1 (A = 18)
tambm podemos suspeitar algum tipo de dependncia temporal (utuaes ccli-
cas de perodo curto). Sob a hiptese, H
0
: 1
t
uma sucesso de v.a. indepen-
dentes, a distribuio de A dado :
0
e :
1
conhecida. Quando :
0
20 ou :
1
20
mais conveniente usar-se o resultado assimpttico. Sob H
0
tem-se
7 =
A
L
(A)
_
Vai (A)
o
(0, 1)
7
O nmero mximo que A pode assumir
nux A =
_
2 nin |n
0
, n
1
se n
0
= n
1
2 nin |n
0
, n
1
1 se n
0
,= n
1
.
onde
L
(A) =
2:
0
:
1
:
1
Vai (A) =
2:
0
:
1
(2:
0
:
1
:)
:
2
(: 1)
.
O teste bilateral (afastamento hiptese nula pode dever-se quando A alto ou
baixo). Rejeita-se H
0
se a probabilidade 1 ([7[ [.
cbc
[) estiver abaixo do nvel
de signicncia xado.
Se a hiptese H
0
no pode ser rejeitada pelos dados, pode-se assumir que 1
t
uma sucesso de v.a. i.i.d. com distribuio de Bernoulli de parmetro

L
(1
t
) .
Interessa agora investigar a cobertura marginal, i.e. se
L
(1
t
) coincide com c. Seja
o
a
=
a
i=1
1
i
= :
1
a soma dos 1
t
: que, como se sabe, tem distribuio Binomial
de parmetros (:,
L
(1
t
)) . Sob a hiptese
H
0
:
L
(1
t
) = c
a estatstica de teste (rcio de verosimilhanas)
1\ = 2 log
1(c[ H
0
)
1( c)
= 2 log
c
a
1
(1 c)
a
0
c
a
1
(1 c)
a
0
tem distribuio assimpttica
2
(1)
. c o estimador de mxima verosimilhana,
c = :
1
,: e c a probabilidade previamente xada para o VaR (por exemplo,
c = 0.01 ou c = 0.0).
EXEMPLO 12.6.1. Suponha-se que numa amostra de 800 observaes foi cal-
culado o VaR a 5% (c = 0.0). Observou-se :
0
= 70, :
1
= 0, A = 00
(na amostra a desigualdade ^\
t
< \ a1
t,t1,c
vericou-se 50 vezes). Haver
razes para pensar que o VaR a 5 % inapropriado? Considere-se primeiro a
hiptese, H
0
: 1
t
uma sucesso de v.a. independentes. Tem-se:
.
cbc
=
00
_
2a
0
a
1
a
1
_
_
2a
0
a
1
(2a
0
a
1
a)
a
2
(a1)
=
00 04.7
8.208
= 1.48.
Como o valor-p 1 ([7[ 1.48) 0.1 relativamente alto no se rejeita H
0
.
Considere-se agora H
0
:
L
(1
t
) = 0.0. Tem-se c = :
1
,: = 0.062 e
1\
cbc
= 2 log
0.0
a
1
(1 0.0)
a
0
c
a
1
(1 c)
a
0
= 2.447.
Como o valor-p 1
_
2
(1)
2.477
_
0.118 relativamente alto no se rejeita H
0
.
Assim, existe evidncia de que o VaR estimado uma medida adequada.
Se 1
t
segue uma cadeia de Markov (em tempo discreto, com espao de estado
0, 1), o teste run pode apresentar baixa potncia
8
, isto , se o usamos o teste run
quando 1
t
segue uma cadeia de Markov, a probabilidade de rejeitar independncia
pode ser baixa.
8
A potncia de um teste a probabilidade de rejeitar 1
0
dado que 1
1
verdadeira.
12.6. AVALIAO DO VAR (BACKTESTING) 335
Suponha-se que 1
t
segue uma cadeia de Markov com a seguinte matriz de
probabilidades de transio
I =
_
1 j
01
j
01
1 j
11
j
11
_
onde j
i)
= 1 (1
t
= ,[ 1
t1
= i) . S no caso muito particular j
01
= j
11
, 1
t

uma sucesso de v.a. i.i.d. (com distribuio de Bernoulli). Com efeito, sob a
hiptese de independncia,
j
01
= 1 (1
t
= 1[ 1
t1
= 0) = 1 (1
t
= 1[ 1
t1
= 1) = j
11
ou seja, a probabilidade de 1
t
= 1 no depende do valor assumido por 1 no perodo
anterior (e, pode provar, tambm no depende da histria passada de 1). Nesta
condies 1
t
no autocorrelacionado
9
. Imagine-se, pelo contrrio, a seguinte
matriz de probabilidades,
_
0.8 0.2
0.1 0.0
_
.
Calcule-se a probabilidade de 1
t
= 1. Se 1
t1
= 1 a probabilidade de 1
t
= 1
0.9, mas se 1
t1
= 0 a probabilidade de 1 passar para o estado 1 de apenas 0.2.
Observa-se, portanto, forte dependncia temporal na sucesso 1
t
.
Para ensaiar independncia, a hiptese nula mantm-se no essencial como
no teste runs test, H
0
: 1
t
uma sucesso de v.a. independentes ou seja H
0
:
j
01
= j
11
. Para a avaliarmos o rcio de verosimilhanas necessrio obter-se,
em primeiro lugar, a funo de verosimilhana associada a sucesso 1
1
, ..., 1
a
;
facilmente se conclui que
1(j
i)
) = (1 j
01
)
a
00
j
a
01
01
(1 j
11
)
a
10
j
a
11
11
,
onde :
i)
o nmero de vezes em que 1 passou de i para ,. As estimativas de
mxima verosimilhana de j
i)
obtm-se facilmente a partir de 1(j
i)
) ,
j
01
= :
01
,:, j
11
= :
11
,:.
Por outro lado, sob H
0
: j
01
= j
11
(substitua-se j
01
e j
11
por j
1
)
1\ = 2 log
1(j
i)
[ H
0
)
1( j
i)
)
= 2 log
(1 j
1
)
a
00
a
10
j
a
01
a
11
1
(1 j
01
)
a
00
j
a
01
01
(1 j
11
)
a
10
j
a
11
11
o
2
(1)
onde j
1
= (:
01
:
11
) ,:. Uma variante interessante deste teste consiste em
tomar como hiptese nula H
0
: j
01
= j
11
= c (no s se testa a independncia
como tambm a cobertura marginal,
L
(1
t
) = c). Com se tm agora duas restries
impostas em H
0
(j
01
= j
11
, j
01
= c), a estatstica de teste
1\ = 2 log
(1 c)
a
00
a
10
c
a
01
a
11
(1 j
01
)
a
00
j
a
01
01
(1 j
11
)
a
10
j
a
11
11
o
2
(2)
.
A vantagem deste teste do ponto de vista prtico clara: de uma vez s, ensaia-se
a cobertura marginal e condicional.
Estes testes, baseados no modelo da cadeia de Markov sofrem no entanto de
uma limitao: baseiam-se em dependncias de primeira ordem. Ora, pode suceder
9
Pode-se provar que Coii (1
I
, 1
I1
) = j
11
j
01
. Logo se j
11
= j
01
a correlao entre 1
I
e
1
I1
nula. Nestas condies pode-se tambm provar que Coii (1
I
, 1
II
) = 0, para I N.
que 1
t
dado 1
t1
dependa ainda de 1
t2
. Neste caso, os testes baseados no modelo
da cadeia de Markov, podem perder bastante potncia.
Clements e Taylor (2003) generalizam a abordagem anterior. A hiptese
L
(1
t
[ T
t1
) = c sugere que 1
t
dado T
t1
apenas depende de uma constante, c.
Assim, se 1
t
depende de alguma varivel T
t1
mensurvel, a hiptese
L
(1
t
[ T
t1
) =
c deve ser rejeitada. Para testar a possibilidade de 1
t
depender de alguma varivel
T
t1
mensurvel, uma possibilidade consiste em fazer uma regresso de 1
t
sobre
as variveis denidas emT
t1
(como por exemplo, 1
t1
, 1
t2
, ..., variveis dummy
reportadas a t 1, t 2, etc., retornos, etc.),
1
t
= c
0

I
i=1
c
i
1
ti
x
t
t1
n
t
onde x
t
t1
um vector 1:de variveis T
t1
mensurveis (que de alguma forma
podem estar parcialmente correlacionadas com 1
t
) e um vector de parmetros
: 1. A hiptese de correcta cobertura marginal e condicional envolve o ensaio
H
0
: c
1
= 0, ..., c
I
= 0, , = 0, c
0
= c. Naturalmente a estatstica 1 pode ser
usada. Tendo em conta a natureza da varivel 1, em princpio seria mais apropriado
uma regresso binria. No entanto, Sarma et al. (2003) refere que na presena
de forte assimetria dos dados (mais de 95% ou 99% dos dados so 0s ou 1s) a
regresso binria envolve problemas tcnicos. Para grande amostras o estimador
OLS apropriado.
Bibliograa
[1] Basrak, B., R. Davis e T. Mikosch (2002). Regular variation of GARCH processes. Stochastic
Processes and their Applications 99(1), pp. 95-115.
[2] Bauwens, L., A. Preminger e J. Rombouts (2006). Regime switching GARCH models. D-
partement des Sciences Economiques Working Paper 2006-6.
[3] Bollerslev, T. (1986). Generalized Autoregressive Conditional Heteroskedasticity. Journal of
Econometrics 31(3), pp. 307-327.
[4] Bollerslev, T. (1988). A Capital Asset Pricing Model with Time-Varying Covariances. Journal
of Political Economy 96 (1), pp. 116131.
[5] Bollerslev, T. (1990). Modeling the Coherence in Short-run Nominal Exchange Rates: A Multi-
variate Generalized ARCH Model. The Review of Economics and Statistics 72(3), pp. 498-505.
[6] Bougerol, P., N. Picard (1992). Stationarity of GARCH processes and some nonnegative time
series. Journal of Econometrics 52, 115-127
[7] Brandt, A. (1986). The stochastic equation Y
n+1
=
n
Y
n
1
n
with stationary coefcients.
Advanced in Applied Probability 18, pp. 211-220.
[8] Christiansen, C. (2007). Volatility-Spillover Effects in European Bond Markets. European Fi-
nancial Management, 13 (5), pp. 923-948.
[9] Christoffersen, P. e F. Diebold (2000). How Relevant is Volatility Forecasting for Financial Risk
Management? Review of Economics and Statistics 82(1), pp. 12-22
[10] Clark, P., (1973), A Subordinated Stochastic Process Model with Finite Variance for Specula-
tive Process, Econometrica 41.
[11] Clements, M. e N. Taylor (2003). Evaluating prediction intervals for high-frequency data. Jour-
nal of Applied Econometrics 18, pp. 445-456.
[12] Davies, (1987). Hypothesis testing when a nuisance parameter is present only under the alter-
native. Biometrika 74, pp. 33-43.
[13] Dimson E., P. Marsh e M. Staunton (2002). Triumph of the Optimists:101 Years of Global
Investment Returns, Princeton University Press.
[14] Engle R. (1982). Autoregressive Conditional Heteroscedasticity with Estimates of the Variance
of United Kingdom Ination. Econometrica 50 pp. 987-1007.
[15] Engle R. (2001). Financial Econometrics - a New Discipline with new Methods. Journal of
Econometrics 100, pp. 53-56.
[16] Engle, R. (2002). Dynamic Conditional Correlation: A Simple Class of Multivariate General-
ized Autoregressive Conditional Heteroskedasticity Models. Journal of Business & Economic
Statistics, 20(3), pp. 339-50.
[17] Fama, E. (1970). Efcient Capital Markets: A Review of Theory and Empirical Work. Journal
of Finance 25 (2), pp. 383-417.
[18] Engle R. e K. Kroner (1995). Multivariate Simultaneous Generalized ARCH. Econometric The-
ory 11, pp. 122-150.
[19] Fan, J. e Q. Yao (2005), Nonlinear Time Series, Springer Series in Statistics, New York.
[20] Franke, J., W. Hardle e C. Hafner (2008). Statistics of Financial Markets: An Introduction, 2
a
ed., Springer, Berlin Heidelberg New-York.
[21] Franses, P. e van Dijk, D. (2000). Nonlinear Time Series Models in Empirical Finance, Cam-
bridge University Press, Cambridge.
[22] Garcia, R. e P. Perron (1996). An analysis of the real interest rate under regime shifts. Review
of Economics and Statistics 78, pp. 111-25.
[23] Gospodinov, N. (2005). Testing For Threshold Nonlinearity in Short-Term Interest Rates. Jour-
nal of Financial Econometrics, 3(3), pp. 344-371.
337
338 BIBLIOGRAFIA
[24] Gouriroux C., Monfort A., (1995a), Statistics and Econometric Models, Vol. I, Cambridge
University Press.
[25] Gouriroux C., Monfort A., (1995b), Statistics and Econometric Models, Vol. II, Cambridge
University Press.
[26] Gouriroux C., Monfort A., (1996), Simulation-Based Econometric Methods, Core Lectures,
Oxford.
[27] Gray, S., (1996). Modeling the Conditional Distribution of Interest Rates as a Regime-
Switching Process. Journal of Financial Economics, 42(1), pp. 27-62.
[28] Groeneveld, R.A. e G. Meeden (1984). Measuring skewness and kurtosis. The Statistician, 33,
pp. 391-399.
[29] Hansen B. (1997). Inference in TAR Models. Studies in Nonlinear Dynamics & Econometrics,
2(1).
[30] Kearns, P. e A. Pagan (1997). Estimating the Density Tail Index for Financial Time Series.
Review of Economics and Statistics 79, pp. 171-175.
[31] Kelly W. and A. Peterson (1991). Difference Equations: An Introduction with Applications.
Academic Press, New York.
[32] Lamoureaux G., Lastrapes C., (1990). Persistence in Variance, Structural Changes, and
GARCH Model, Journal of Business and Economic Statistics 8.
[33] Lundbergh, S. e T. Tersvirta (2002). Evaluating GARCH models. Journal of Econometrics
110(2), pp. 417-435 .
[34] McNeil, A. e R. Frey (2000). Estimation of Tail-Related Risk Measures for Heteroscedastic
Financial Time Series: an Extreme Value Approach. Journal of Empirical Finance 7, pp. 271-
300.
[35] Mokkadem, A. (1985). Le Modle Non Linaire AR(1) Gnral. Ergodicit et Ergodicit
Gometrique. Comptes Rendues Academie Scientique Paris 301(I), pp. 889-892.
[36] Morgan J., (1996). RiskMetrics Technical Document, Part II: Statistics of Financial MarketRe-
turns, 4th edition, New York.
[37] Murteira, B. (1990). Probabilidades e Estatstica, Vol. I e II. Mc Graw-Hill.
[38] Murteira, B.., D. Muller, K. Turkman (1993). Anlise de Sucesses Cronolgicas, McGraw-
Hill, Lisboa.
[39] Nelson, D. (1990). Stationarity and persistence in the GARCH(1,1) model. Econometric Theory
6, pp. 318-334.
[40] Nicolau, J. (2004). Equaes Diferenciais & Equaes s Diferenas, Texto de Apoio n
o
28,
CEMAPRE-ISEG/UTL.
[41] Nicolau, J. (2008). Processos Estocsticos Aplicados s Finanas. Boletim Da Sociedade Por-
tuguesa de Estatstica, pp. 35-42.
[42] Pascuala L. , J. Romob e E. Ruiz (2006). Bootstrap Prediction for Returns and Volatilities in
GARCH models. Computational Statistics & Data Analysis, 50(9), pp. 2293-2312.
[43] Pinto, S. (2010), Transmisso de Volatilidade nos Mercados Financeiros durante Perodos de
Crises, Tese de Mestrado em Matemtica Financeira, ISEG/UTL.
[44] Stelzer, R. (2009). On Markov-Switching Arma Processes? Stationarity, Existence of Moments,
and Geometric Ergodicity. Econometric Theory, 25(1), pp. 43-62.
[45] Taylor S., (1994), Modeling Stochastic Volatility: A Review and Comparative Study, Mathe-
matical Finance4, 183-204.
[46] Taylor, H. e S. Karlin (1984). An Introduction to Stochastic Modeling. Academic Press, New
York.
[47] Taylor S. (1986). Modelling Financial Time Series, John Wiley & Sons.
[48] Taylor S. (2005). Asset Price Dynamics, Volatility, and Prediction, Princeton University Press.
[49] Tong H. (1990). Non-Linear Time Series - A Dynamical System Approach, Oxford Statistical
Science Series, 6.
[50] Wooldridge, J. (1994). Estimation and Inference for Dependent Processes, in Handbook of
Econometrics, Vol. 4 , pp. 2641-2700., edited by Engle R.F. and McFadden D.L. Elsevier Sci-
ence B.V. , Amsterdam.

A Post I La Series Tempora Is

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

A Post I La Series Tempora Is

Diunggah oleh

Hak Cipta:

Format Tersedia

Modelao de Sries Temporais Financeiras

. Isto signica que se poderia considerar uma sucesso de

, investido em 1. Desta forma, o valor do

, tal que, aplicada a um investimento 1

que resolve a equao

como incgnita, facilmente se obtm

, tal que, apli-

que resolve a equao

como incgnita, facilmente se obtm

como funo de r. Tendo em conta

= r e que tem a vantagem de fornecer

= r . Por outro lado,

:/ negativa se as variaes negativas fortes forem

:/ negativa. Observe-se ainda que

/, considere-se a gura 3.1. Pode-se observar que varincia da srie j

(.) uma trajectria ou realizao do processo.

) usa a informao disponvel no momento

0, a densidade desloca-se um pouco na direco de j

. Todavia, como j reverte para zero, mais

) embora se desloque na direco de j

, continua a atribuir massa de

DEFINIO 4.4.4. n um processo passeio aleatrio (random walk ou RW)

no tem distribuio t-Student

(da trabalhar-se sobretudo com a especicao

= 0.01,0.004 = 2. c = 2.02 no se rejeita H0 ao nvel de

como tambm, sob H

for maior do que o quantil

j) , o possa ter distribuio aproximadamente (0, 1) para amostras

j) , o no tmcertamente distribuio (0, 1) . Se (j

Assim se E2O devemos ter \ui (

< o. Logo devemos exigir

< o condio necessria para que seja estacionrio. Nestas condies

< - vem [c[

< - para todo o t 0. Se [c[ 1 o termo

ento existe uma vizinhana \

= [q (q (r)) j[ < c[q (r) j[ < c

EXEMPLO 7.2.18. Considere-se a equao j

uma rbita peridica de perodo /. Ento j

r = max (log r, 0)). Ento o processo denido

< 1 se vericar, ento o processo EE, aten-

Por que razo o valor esperado condicionado tambm a x

V = (++) Voc (V) ,

A = (++) oiag (Voc (A))

H = (++) oiag (Voc (H))

/ = 0.288, c = 0.4066 e rejeitam-se as hipteses / ,= 0 e c ,= 0 - ver gura 9.4).

o mximo da amostra. Pode-se provar que se existirem constantes normalizadoras

(r) (ou, 1 ('

uma sucesso de v.a. i.i.d. com distribuio de Bernoulli de parmetro

Anda mungkin juga menyukai