silvarjf@gmail.com
Resumo Este artigo descreve um modelo para previso dificultam a criao de modelos precisos de
de resultados esportivos baseado em Redes Neurais e previso.
Sistemas Classificadores. O sistema construdo aplicado
para dados gerados pela fantasy league de futebol Cartola Alguns trabalhos na rea focam na previso
F.C. O modelo tenta contornar caractersticas do problema de resultados para fantasy leagues [2]. Fantasy
que dificultam a previso precisa de resultados. leagues oferecem um contexto propcio
aplicao de minerao de dados, por
Keywords evolutionary algorithms, ensemble classifiers,
neural networks, football prediction.
disponibilizarem algumas estatsticas
atualizadas sobre jogadores, e focarem em
1. Introduo aspectos tcnicos, menos suscetveis a variao
A crescente disponibilidade de dados e o ao longo do tempo. Este trabalho descreve um
aumento do poder computacional tem tornado modelo que tenta prever pontuaes de atletas
popular a aplicao de tcnicas de anlise para o fantasy league Cartola F.C.
estatstica em contextos esportivos. A minerao
de dados pode ajudar tcnicos a avaliar 2. Cartola F.C.
performance de atletas, planejar estratgias e O Cartola F.C. a maior fantasy league do
descobrir talentos. Brasil. A cada rodada do Campeonato Brasileiro
Algumas tcnicas de minerao de dados de Futebol, usurios do sistema escolhem 11
tem sido aplicadas com sucesso tambm para a atletas para compor a sua equipe. Ao final da
previso de resultados [1]. Entretanto, alguns rodada, cada atleta recebe uma pontuao de
esportes, especialmente o futebol, apresentam acordo com a sua performance na rodada, e o
desafios adicionais para esse tipo de abordagem. usurio recebe uma pontuao de acordo com a
O excesso de variveis que influenciam o equipe escolhida. As pontuaes dos atletas so
resultado de uma partida de futebol, o carter definidas com base em parmetros pr-
dinmico do desempenho dos times e a definidos, mostrados na tabela 1.
dificuldade de modelar aspectos sutis do esporte
Antes de cada rodada, os usurios tem anlise estatstica, o algoritmo ReliefF mostra os
disposio as estatsticas das rodadas anteriores scouts que mais influenciam a pontuao futura
para cada jogador, o preo de cada jogador, de um jogador. Os scouts so mostrados na
calculado de acordo com as performances Tabela 2 e condizem com o esperado
anteriores, e um campo Status, que indica os intuitivamente.
jogadores que provavelmente vo atuar. A rede foi treinada usando o mtodo de
Levenberg-Marquardt, separando 15% dos
3. Proposta dados para efetuar a validao cruzada e 15%
A proposta deste trabalho usar uma rede dos dados para testes. A rede resultante tem 30
neural MLP para relacionar os atributos neurnios na camada intermediria. O
oferecidos pelo sistema do Cartola F.C antes da histograma dos erros mostrado na figura 1 e os
rodada do Campeonato Brasileiro s pontuaes erros de treinamento so mostrados na tabela 3.
finais de cada jogador aps a rodada. Alm dos
dados oferecidos pelo site, sero utilizadas as
mdias dos scouts dos jogadores adversrios
como atributos para a rede. Dessa forma, a rede
neural tentar se adaptar no s ao histrico do
jogador em questo, mas s caractersticas do
adversrio.
Os dados utilizados sero os do
Campeonato Brasileiro de 2015 [3]. A rede
neural ser treinada com os dados at a 8a
rodada, somente para os atletas que atuaram
nessas rodadas, e o seu desempenho ser
avaliado de acordo com o Erro Quadrtico
Mdio de previso para as rodadas restantes.
Para reduzir o tempo de processamento do
problema, a dimensionalidade ser limitada a 30
atributos. Os 30 atributos mais relevantes sero Figura 1: Histograma dos erros de treinamento da rede
selecionados usando o algoritmo ReliefF. Os neural
neurnios da camada intermediria tero funo EQM
de ativao sigmoidal e o nmero de neurnios
Treinamento 15.7
ser determinado pelo melhor valor do EQM de
Validao 18.9
validao.
Teste 20.0
4. Resultados Preliminares Tabela 3: EQM's de treinamento