ANDRÉ PANARIELLO
SÃO PAULO
2016
ANDRÉ PANARIELLO
Área de concentração:
Finanças Quantitativas.
Orientador:
Prof. Dr. Juan Carlos Ruilova Terán
SÃO PAULO
2016
Panariello, André.
Trading por Arbitragem Estatística / André Panariello – 2016.
45 f.
CDU 336.764.2
ANDRÉ PANARIELLO
Área de concentração:
Finanças Quantitativas.
Banca Examinadora:
Este trabalho propõe uma ferramenta para detectar oportunidades de arbitragem esta-
tística (AE) em um par específico de ações no mercado brasileiro. A técnica baseia-se
na construção de um ativo sintético que apresente característica de reversão à média. Os
forecasts serão realizados em forma de densidade de probabilidade condicional, elaborada
com base em técnicas econométricas como processos autoregressivos (AR) e variância con-
dicional dos resíduos (GARCH). Será criado um sistema de trading capaz de se aproveitar
das discrepâncias de preços observadas através da dinâmica do ativo sintético. A abor-
dagem considerará preços em intervalos de um minuto e posições tomadas com ordens
limitadas e a mercado. Ainda serão considerados custos de transação e análise do P&L
para os casos abordados.
Keywords: Statistical Arbitrage. Pairs trading. Synthetic asset. Trading system. AR.
Forecast. GARCH
Lista de ilustrações
1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2 Preliminares teóricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.1 Estimação dos Parâmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2 Critérios de Informação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.3 Séries Temporais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3.1 Estacionariedade . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3.2 Ruído Branco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4 Processo Autorregressivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4.1 Previsão em um Processo AR . . . . . . . . . . . . . . . . . . . . . 18
2.4.2 Variância da previsão . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.4.3 Intervalo de Confiança da previsão . . . . . . . . . . . . . . . . . . 18
2.5 GARCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
4.1 Construção do modelo avaliado . . . . . . . . . . . . . . . . . . . . . . . . 27
4.2 Operações com ordens limitadas . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2.1 Operações sem custos de transação . . . . . . . . . . . . . . . . . . 36
4.2.2 Operações com custos de transação . . . . . . . . . . . . . . . . . . 39
4.3 Operações com ordens a mercado . . . . . . . . . . . . . . . . . . . . . . . 40
5 Considerações finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
12
1 Introdução
Desde a década de 1980, com o que pode ter sido o surgimento da arbitragem
estatística, muitos traders tentam até os dias de hoje encontrar um modelo que possa
lucrar com as chamadas distorções de preços no mercado financeiro. Em sua definição,
a arbitragem estatística (AE) é a existência de uma discrepância estatística no valor
esperado de um ou mais ativos. (AE) também pode ser classificada como uma estratégia
que busca se aproveitar das anomalias momentâneas nos preços dos ativos financeiros.
Uma maneira de se aplicar a arbitragem estatística é buscar distorções de preços entre
pares de ações, onde os pares podem ser formados por ações da mesma companhia (ON
versus PN), ações do mesmo setor (intra-setorial), ações de setores distintos (inter-setorial)
ou até mesmo ações versus índices. A esse tipo de estratégia foi atribuído o nome de pairs
trading. Atualmente, o método de pairs trading é muito utilizado por investidores, bancos
e fundos quantitativos no Brasil e principalmente no exterior.
Conforme (VIDYAMURTHY, 2004), a história mais citadada sobre o que poderia
ter sido a primeira abordagem estatística de pairs trading nasceu em Wall Street e foi
introduzida por um trader chamado Nunzio Tartaglia, que trabalhava no banco Morgan
Stanley em meados da década de 1980. Tartaglia formou um grupo de matemáticos, físi-
cos e cientistas da computação com o objetivo de desenvolver estratégias de arbitragem
estatística usando modelos que conseguissem prever a dinâmica das anomalias de preços.
As estratégias desenvolvidas pelo grupo foram automatizadas ao nível que poderiam gerar
operações de forma mecanizada e serem executadas perfeitamente através de sistemas de
negociação automatizados. Uma das técnicas de negociação empregadas envolvia tradings
com pares de ações, conforme mencionado. O processo envolvia identificar pares de ações
em que os preços apresentavam movimentos similares. Quando era identificada uma ano-
malia nessa relação, montava-se uma posição com a ideia de que a anomalia se corrigiria.
Tartaglia e seu grupo empregaram a estratégia de pairs trading com grande sucesso ao
longo de 1987. Apesar do grupo ter se desmontado em 1989, a estratégia de pairs trading
se tornou cada vez mais popular entre traders individuais, investidores institucionais e
hedge-funds.
As metodologias de análise em pairs trading mais usuais são a correlação e cointe-
gração, que buscam identificar e testar relações de curto e longo prazo, respectivamente.
O início dos estudos sobre a correlação entre séries temporais foi introduzido por (YULE,
1926), que atacou o problema entre duas simples variáveis harmônicas em função do tempo.
Mais tarde, em 1987, Robert F. Engle e C. W. J. Granger formalizaram a abordagem de
cointegração vetorial em (ENGLE; GRANGER, 1987). O trabalho baseou-se na conexão
de um processo média-móvel, autoregressivo e representação de correção de erros para
Capítulo 1. Introdução 13
sistemas cointegrados com o intuito de desenvolver e analisar testes para séries cointegra-
das. Essas pesquisas foram primordiais para o desenvolvimento de técnicas baseadas em
cointegração para arbitragem estatística em pairs trading, evidenciado por (BOSSAERTS,
1988).
No mercado brasileiro, (CALDEIRA, 2011) utilizou a abordagem de cointegração
em diversos pares de ações. O estudo objetivou primeiramente identificar quais pares de
ações poderiam ser alvos de uma estratégia de pairs trading. Após isso, o alvo foi replicar
o modelo de Ornstein-Uhlembeck e calcular o spread para realizar as simulações dos
tradings. O estudo mostrou rentabilidade expressiva ao longo de três anos, volatilidade
e correlação baixa em comparação ao mercado. (PUCCIARELLI, 2014) utilizou uma
abordagem de cointegração dinâmica no tempo também em alguns pares de ações baseado
no artigo (TRIANTAFYLLOPOULOS; MONTANA, 2011) que, diferentemente, utilizou
uma equação de observação com parâmetros α e β constantes no tempo.
(KABASHIMA, 2005) buscou pré-selecionar os pares de ações no mercado brasi-
leiro por meio da correlação, após isso, foi utilizado o teste de Dickey-Fuller aumentado
(ADF) para verificar a existência de raiz unitária da série de resíduo da combinação li-
near do logaritmo dos preços. Em linha, (LONGO, 2008) utilizou o teste Johansen para a
formação dos pares a serem testados e construiu um ativo sintético para assegurar a esta-
cionariedade dos preços. Por sua vez, (BRITO, 2011) seguiu os mesmo passos, entretanto,
aplicou a estratégia de cointegração em dados intradiários com frequência de 15 em 15
minutos em pares de ações negociadas no mercado brasileiro e comparou sua performance
em relação ao ativo livre de risco (CDI).
Outra modelagem bastante difundida na arbitragem estatística é a análise de com-
ponentes principais (PCA), que busca fazer uma transformação ortogonal de variáveis
correlacionadas em valores linearmente independentes. (AVELLANEDA; LEE, 2010) apli-
cam a metodologia em ETFs negociados no mercado americano e analisam o sharpe-ratio
da estratégia em diferentes períodos, incluindo a crise de liquidez em 2007. A análise com-
parou um portfólio formado por 15 ETFs para representar as flutuações de mercado. Em
média, 40% a 60% da variância nos retornos das ações são explicadas pelas componentes
geradas. Com o mesmo intuito, (FERREIRA; VIEIRA, 2011) aplicou o PCA e modelou a
reversão à média como um processo de Ornstein-Uhlenbeck para maximizar uma função
utilidade de um dado agente e, com isso, montar uma estratégia de pairs trading que
considere uma maior aversão à risco dado um aumento na variância do ativo sintético
modelado.
Com a evolução dos estudos na arbitragem estatística, a aplicação de redes neurais
nos modelos lineares têm sido batante frequente e, é o que propõe (MEDEIROS; VEIGA;
PEDREIRA, 2001) em sua modelagem sobre as taxas de juros. O objetivo foi testar e
modelar a não-linearidade nas séries temporais de taxas de juros em alguns meses. A ideia
Capítulo 1. Introdução 14
foi aplicar duas alternativas não-lineares, uma rede neural estimada com regularização
Bayesiana e a outra com o chamado coeficiente neural autoregressivo de transição suave.
Sua conclusão tenta explicar qual é o tamanho da relevância da não-linearidade nas séries
temporais que, resumidamente têm sua importância em alguns períodos específicos, tais
como no início e fim da amostra.
Nessa linha, uma outra possível técnica seria obter a discrepância de preços entre
os pares de ações e modelá-la como um ativo sintético, que tenha a característica de
reversão à média e usar modelos de séries temporais para tentar descrever sua dinâmica.
Em 2006, (THOMAIDIS; KONDAKIS; DOUNIAS, 2006) publicaram um artigo
que propõe uma ferramenta inteligente combinada a métodos estatísticos para detectar
possíveis distorções nos preços de pares de ações. A modelagem preliminar trata da obten-
ção de um ativo sintético por meio de algumas formulações, que tenha a característica de
reversão à média. Após isso, foi construído um modelo para descrever a sua dinâmica com
base em inteligência artificial e um processo que descreva a variância do seu ruído. Com
a obtenção dessa dinâmica, são construídos intervalos de confiança para a montagem das
posições no ativo sintético.
O objetivo deste trabalho é propor uma ferramenta para detectar oportunidades de
arbitragem estatística (AE) em um par específico de ações no mercado brasileiro. A técnica
baseia-se em construir um ativo sintético no mesmo molde proposto por (THOMAIDIS;
KONDAKIS; DOUNIAS, 2006) e modelá-lo com os mesmos mecanismos estatísticos com
exceção da rede neural, nele formulada, e aplicá-lo a um par de ações no mercado brasileiro
em high frequence. O trabalho ainda contemplará a inserção de custos de transação de
forma a tentar deixá-lo mais próximo da realidade.
Este trabalho está organizado conforme descrito a seguir. Primeiramente, no ca-
pítulo 2, apresentam-se brevemente os conceitos teóricos utilizados para a elaboração do
modelo. No capítulo 3, descreve-se a metodologia adotada para a construção do ativo
sintético, estimação, especificação do modelo e desenvolvimento do sistema de trading. Já
no capítulo 4, discutem-se os resultados de toda metodologia proposta no capítulo ante-
rior, assim como a performance do algoritmo e P&L da estratégia ao longo do intervalo
proposto. Por fim, no capítulo 5, apresentam-se as conclusões acerca dos resultados e
indicações de possíveis extensões do trabalho.
15
2 Preliminares teóricas
L(θ) = fθ (y1 , . . . , yn ), θ ∈ Θ.
2k
− ln(L)
AIC =
n
onde k é o número de parâmetros no modelo, L é o ponto máximo da função de verossi-
milhança e 2k
n
é chamado de penalty factor. Conforme a sua formulação, o critério AIC
impõe uma maior penalização por conta da adição de um regressor a mais no modelo.
Quando comparados 2 ou mais modelos, o com menor valor é preferível.
Similarmente, o Bayesian Information Criterion (BIC) é definido como:
BIC = −2 ln L + k ln(n)
Aqui, L é o ponto máximo da função de verossimilhança, k é o número de parâmetros
inclusos no modelo e n é o número de observações, ou de forma equivalente, o tamanho
da amostra. Da mesma forma, o BIC penaliza o modelo com maior número de regressores,
no caso proposto, maior número de lags. Também é preferível o modelo com o menor
resultado.
2.3.1 Estacionariedade
Uma série temporal é estacionária se algumas de suas propriedades estatísticas
se mantiverem constantes ao longo do tempo. Ou seja, se a série for cortada em dois
intervalos, tanto a média quanto a covariância dos dois intervalos serão praticamente
iguais. Mais precisamente, uma série temporal Zt é dita estritamente estacionária (forte)
se a função de distribuição conjunta de {Zt , . . . , Ztm } e {Zt1+k , . . . , Ztm+k } são iguais para
m inteiro positivo, ou seja, iguais para qualquer período no tempo de duração igual.
Uma série é dita estacionária de segunda ordem (fraca), se:
E [Zt ] = µ
E[(Zt − µ)2 ] < ∞
E[(Zt − µ)(γt−k − µ)] = γk, a depender do tamanho de k.
empiricamente. Para o caso proposto neste trabalho, será utilizada a hipótese de estacio-
nariedade de segunda ordem.
∑
p
E[Zt |zt−1 ] = ϕo + ϕ′ Zt−i (2.2)
i=1
∑
ϕo e pi=1 ϕ′ são parâmetros a serem estimados. Este processo é considerado esta-
cionário, assim como ϵt também o é. Abaixo, algumas propriedades:
∑
p
Zt = ϕo + ϕ′ Zt−i + ϵt (2.3)
i=1
conforme (HEIJ et al., 2004), 2.3 pode ser interpretada como um modelo de re-
gressão linear. As variáveis explicativas da regressão consistem nos lags imediatamente
Capítulo 2. Preliminares teóricas 18
∑
p
Zbt+h = ϕo + ϕ′ Zt+1−p (2.4)
i=1
O erro na previsão é dado por Zt+1 − Zbt+h = ϵt+1 e a variância do erro na previsão
é σ 2 . Lembramos que h representa uma escolha de quantos passos à frente desejamos
prever.
Chamado de erro quadrático médio, para um passo a frente, se tem o erro da pre-
visão igual à inovação ϵn+1 . Da mesma forma, o processo de inovação também é chamado
de processo de predição dos erros. A variância da previsão cresce conforme o tamanho de
h aumenta, o que é natural dado que as observações passadas contém mais informações
para um futuro imediato do que para um futuro muito distante. Para um h tendendo a
infinito, a variância da previsão converge para a variância do processo do próprio Zt , ou
seja, no longo prazo toda informação sobre o passado, eventualmente, desaparece. Isto
porque a correlação de um processo estacionário converge para zero quando k tende a in-
finito, então, a informação do passado é não-correlacionada para um futuro infinitamente
longe.
cia (1 − α), ou para uma melhor ilustração, 95% em um intervalo de previsão para Zt+h
é dado por:
√ √
Zbt+h − 1, 64 M SE(h) ≤ Zt+h ≤ Zb t+h + 1, 64 M SE(h) (2.6)
2.5 GARCH
Até o momento, o processo de inovação ϵt foi considerado como se tivesse uma
variância constante σ 2 . Essa hipótese não é tão realística, dado que pode existir efeito
dos lags na variância condicional σ 2 = V ar(Zt |zt−1 ) para as séries temporais. Como o
conceito de variância é uma medida de risco ou incerteza nos valores futuros de uma
variável, esta torna-se uma ferramenta de suma importância para as decisões econômicas
ou financeiras. Ao se trabalhar com uma variância dependente do tempo σt2 , um dos
modelos que exemplifica a diferença entre variância condicional e não-condicional é o
chamado de ARCH (Autoregressive Conditional Heteroskedasticity) que considera, apenas,
o efeito dos lags dos termos de erros anteriores. Conforme (STATISTICS, 1992), uma
generalização do modelo ARCH pode ser chamada de GARCH (Generalized Autoregressive
Conditional Heteroskedasticity), que em sua forma geral, GARCH(p, q) pode ser escrito,
conforme abaixo:
ϵt |It−1 ∼ N (0, σt2 )
∑
p ∑
q
σt2 = αo + 2
αi σt−i + βi ϵ2t−i (2.7)
i=1 i=1
que chamaremos aqui de ativo sintético, apresente reversão à média com distribuição
N (0, σt2 ), com variância σt2 finita e dependente do tempo.
A exigência pela reversão à média se impõe para garantir que as discrepâncias even-
tualmente tendam para zero e não cresçam indefinidamente pois, caso contrário, ficaria
impossível controlar a exposição ao risco do portfólio em negociação. Podemos interpretar
ω como sendo as proporções reais de cada ativo a ser mantida no portfólio em negociação,
Capítulo 3. Identificação de discrepâncias na precificação de ativos 21
com
yi = x,i β + εi , i = 1, . . . , n
estratégia de arbitragem descrita acima não é livre de risco; embora lucrativa no longo
prazo, o lucro imediato depende fortemente do preço de mercado retornar para os seus
"padrões normais ou históricos"em um prazo curto de tempo. Geralmente, uma reversão
à média fraca tem maior probabilidade de ser observada em momentos adversos do ativo
sintético.
O problema com tudo isto é que uma regressão simples de um ativo em função do
outro não apresenta reversão à média, como mostra (THOMAIDIS; KONDAKIS; DOU-
NIAS, 2006). Numa abordagem alternativa proposta também em (THOMAIDIS; KON-
DAKIS; DOUNIAS, 2006), vamos procurar controlar a não-estacionariedade do ativo sin-
tético adotando um esquema adaptativo no qual os coeficientes da combinação que define
Zt são periodicamente recalculados. Nesta abordagem, vamos considerar a discrepância
de preços (ativo sintético) como sendo dada por:
1. Especificação do modelo.
∑
p
Zt = ϕo + ϕ′ Zt−i + εt (3.3)
i=1
onde ϕo ∈ R, Zt = (Zt−1 , Zt−2 , . . . , Zt−n ) ∈ Rn×1 , εt é o resíduo ou o choque aleatório e
ϕ ∈ Rn×1 . Conforme (GUJARATI, 2009) um AR(p) é um modelo linear para séries tem-
porais que inclui não só os valores atuais, mas também os passados (lags) como variáveis
explicativas.
Capítulo 3. Identificação de discrepâncias na precificação de ativos 23
2k
AIC = − ln(L)
n
BIC = −2 ln L + k ln(n)
∑
p ∑
q
σt2 = αo + 2
αi σt−i + βi ε2t−i
i=1 i=1
Zbt+h
L,α
= Zbt+h − (1 − α)σbt+h (3.4)
Zbt+h
H,α
= Zbt+h + (1 − α)σbt+h (3.5)
• Se Zt < Zbt+h
L,α
, monta-se uma posição comprada no ativo sintético3 ;
• Se Zt > Zbt+h
H,α
, monta-se uma posição vendida no ativo sintético4 ;
(i) Não há nenhuma posição montada e o sistema de decisões indica que é hora de
montar posição;
(ii) Há posição montada e o sistema de decisões indica que é hora de desmontar a posição e
auferir o lucro ou prejuízo. Como não há posição montada, procede-se como descrito
em (i).
3
Longing no ativo sintético significa comprar 1 unidade de X2 e vender βt ações de X1 .
4
Shorting no ativo sintético significa vender 1 unidade de X2 e comprar βt ações de X1 .
26
4 Resultados
W em 10, 30 e 60. Assim, a construção do ativo sintético será feita com base nos preços
do par de ações de 10, 30 e 60 minutos.
Com o tamanho de W definido, inicia-se o cálculo do coenficiente βt , conforme a
Figura 3, que corresponde a uma média do quociente entre X2,j
X1,j
, onde j = t − W + 1, . . . , t.
suas médias, o efeito de um ruído mais forte no preço do ativo sintético permanece por
mais tempo ao longo de sua evolução.
Com o ativo sintético construído, é preciso verificar sua reversão à média antes de
sua modelagem. Para isso, utilizaremos o teste de Phillips-Perron.
Conforme a Tabela 1, todas as estatísticas do teste rejeitam para valores altos o
valor crítico de 5%, ou seja, rejeitando a hipótese nula de unicidade da raiz. Sendo assim,
pode-se trabalhar com a hipótese de que o ativo sintético possui reversão à média. Para
fins de simplificação, o ativo sintético que considera a janela W = 10 obteve o valor mais
alto de rejeição da hipótese nula, ou seja, apresenta um índice maior de reversão à média.
O ativo sintético calculado com a janela W = 10 apresenta um tempo médio de 3 minutos
para reverter à sua média. Neste caso, a partir desse ponto, todos os cálculos e análises
serão feitos com o ativo sintético construído com a janela de comprimento W = 10.
Com a hipótese formulada anteriormente, podemos dar início a modelagem do
ativo sintético, conforme descrito no capítulo 3 que descreve a especificação e estimação
do modelo. A principio, foram estimados os modelos autoregressivos com três lags, AR(1),
AR(2) e AR(3). Nessa fase, o intuito é definir qual é o número ótimo de lags para a
Capítulo 4. Resultados 30
serem incluídos no modelo GARCH(p, q). Para isso, definimos um conjunto de modelos
para serem comparados entre si, dentre estes, ARCH(1), GARCH(1,1) e GARCH(1,2):
Com os modelos especificados, conforme Tabela 4, e antes de performar a análise
dos critérios de informação, é interessante olhar o gráfico de autocorrelação da variância
do ativo sintético Zt , conforme a Figura 6.
• O sistema utilizará uma janela móvel de 1000 minutos de preços das ações para a
calibragem do modelo;
Figura 12 – Preços por fechamento de minuto Bid and Ask - 04/01/2016 até 23/02/2016
Figura 13 – Log-Retornos Acumulados dos preços Bid and Ask de PETR3 e PETR4 -
04/01/2016 até 23/02/2016
Figura 14 – Sistema de Trading formado pelo ativo sintético e pelas bandas de trading -
04/01/2016 até 11/01/2016
utilizou a premissa de que todas as ordens seriam executas assim que as fossem enviadas.
Um dos princiapis problemas ao trabalhar com dados em alta-frequência é justamente
efetivar ambas as ordens instantaneamente. Outro problema é o volume a ser operado,
já que se este for muito grande, pode-se afetar o preço dos papéis aumentando a proba-
blidade de não ter a ordem efetivada. Pelo lado oposto, trabalhar com um volume muito
pequeno faria com que o lucro apresenta-se queda, o que não compensaria a depender dos
custos de transação.
Considerando o período inteiro em que o sistema operou de 08/01/2016 às 11h40min
até o dia 23/02/2016 às 15h, foram montadas 476 posições sendo de compra ou venda
do ativo sintético. Foram contabilizados 238 trades concluídos. Desses 238, apenas, 21
auferiram prejuízo, ou seja, 9% da amostra de trades. Em linha, pode-se analisar a Figura
15 que mostra o P&L do sistema no período completo.
• 0% de rebate;
• 0% de aluguel. Todas as posições são encerradas no fim de cada dia pelo último
preço disponível.
Pela Figura 17, pode-se observar o P&L acumulado por trade efetuado. Neste caso,
o sistema identificou as mesmas discrepâncias e efetuou as mesmas operações do modelo
anterior. Entretanto, o P&L com a inserção dos custos caiu drasticamente para 6,6%,
uma queda de aproximadamente 81% em comparação com o modelo sem a incorporação
dos custos. Em algumas ocasiões, principalmente ao efetuar os primeiros trades, o P&L
acumulado ficou negativo e só a partir do 35o trade que voltou a gerar lucro.
Na Figura 18, tem-se o boxplot e histograma com a abordagem sem e com cus-
tos de transação. A análise mostra que a distribuição que considera os custos teve um
deslocamento de 0,1% para a esquerda. Como em alguns trades o lucro era quase nulo,
a inserção dos custos fez com que 72 resultassem em prejuízo, representando 30,3% da
amostra. Operar em alta-frequência exige um dispêndio financeiro alto com os custos,
principalmente quando considerado um nível alto de corretagem.
Capítulo 4. Resultados 40
Figura 18 – Histograma e Boxplot do P&L por trade sem e com custos de transação -
08/01/2016 até 23/02/2016
Figura 19 – P&L Acum. do Sistema de Trading com ordens a mercado - 08/01/2016 até
23/02/2016
se aproveita das discrepâncias de preços entre o par de ações por menor que sejam, neste
caso, efetuar as ordens a mercado torna o modelo inutilizável. Naturalmente, visto que
nesses casos, não há oportunidades de arbitragem. Essa é uma decisão importante para o
sistema automático de identificações de oportunidades de arbitragem.
42
5 Considerações finais
Este trabalho teve como objetivo construir uma ferramenta para identificação de
oportunidades de arbitragem estatística (AE) em pairs trading e aplicá-la ao mercado
brasileiro. Essa abordagem baseou-se na construção de um ativo sintético que tivesse a
natureza de reversão à média. Após isso, foram conduzidas previsões na forma de den-
sidade de probabilidade condicional, formando intervalos de confiança. Ainda houve a
inclusão de custos de transação para deixar o modelo mais próximo da realidade.
Os resultados da aplicação com ordens limitadas mostraram-se satisfatórios para
a detecção de possíveis oportunidades de arbitragem, e mesmo após a inclusão dos custos,
o modelo obteve um bom retorno acumulado. Entretanto, sua aplicabilidade ao mundo
real ainda é altamente questionável principalmente pelos níveis de custos e discrepâncias
vistas no mercado. Os resultados com custos de transação mostraram queda no P&L de
mais de 80% quando comparado ao modelo sem custos. Para o segundo caso, o modelo
tem a característica de se aproveitar de pequenas discrepâncias entre os preços das ações.
Neste caso, o volume a ser operado é extremamente relevante, já que um volume muito
expressivo em relação ao operado por minuto poderia tornar o modelo um market maker,
o que iria totalmente contra a abordagem proposta. Apesar dos testes considerarem o
Bid and Ask spread, outro possível impacto realizado pelo volume seria a não efetivação
das posições dentro da frequência estipulada, o que seria equivalente ao desajuste do
β calculado e poderia desencadear em uma pane no sistema de trading. Por sua vez,
considerar o envio das ordens a mercado como candidato à solução para o problema de
falha sistêmica implica em tornar o modelo inutilizável.
Quanto ao back-testing realizado, apesar de ter-se utilizado quase 8000 sequências
de preços, o intervalo de tempo coberto foram apenas 30 dias úteis. Dessa forma, a apli-
cabilidade ainda é questionável já que pode não ter-se capturado momentos em que o
par de ativos não reverte à média. O problema de se realizar back-testings em janelas
temporais maiores é que o algoritmo requer um tempo considerável para a estimação a
cada previsão realizada. O modelo ainda trabalha com um erro de especificação ao longo
de todo o seu teste, já que foi especificado com base em uma amostra de 1000 preços
iniciais e considerado constante ao longo de todo o back-testing.
Como sugestão de trabalhos futuros, o modelo poderia não desmontar as posições
que acarretassem em prejuízo gerados pela inclusão dos custos ou pela abordagem de
ordens a mercado. Essa modificação poderia apresentar resultados mais interessantes em
termos de performance, já que reduziria a quantidade de trades realizados ao longo do
tempo. Outra possível solução para o critério dos custos e pela efetividade das posições
Capítulo 5. Considerações finais 43
Referências
ZHANG, G.; PATUWO, B. E.; HU, M. Y. Forecasting with artificial neural networks::
The state of the art. International journal of forecasting, Elsevier, v. 14, n. 1, p. 35–62,
1998.