SO PAULO
2003
ndice
Lista de Figuras ______________________________________________________ v
Lista de Tabelas ______________________________________________________ vi
Lista de Siglas ______________________________________________________ vii
CAPTULO I O PROBLEMA DE PESQUISA____________________________ 1
1.
Introduo ______________________________________________________ 1
2.
3.
4.
Questes de Pesquisa______________________________________________ 7
5.
1.2.
Tcnicas de Previso_______________________________________________ 27
1.3.
27
29
29
30
32
32
33
40
2.
11
11
15
16
18
19
21
24
26
47
50
53
55
57
2.2.
2.3.
2.4.
ii
2.4.1.
2.4.2.
2.4.3.
2.4.4.
2.5.
3.
67
70
70
71
3.2.
2.
Modelo de Pesquisa________________________________________________ 81
Contextualizao da Pesquisa______________________________________ 84
1.1.
2.
3.
4.
4.2.
4.3.
5.
6.
7.
89
89
90
91
92
93
94
95
95
95
5.2.
5.3.
6.2.
6.3.
6.4.
7.1.
7.2.
7.3.
2.
3.
iv
Lista de Figuras
Figura 1 Abordagens de previso de vendas com uso de dados agregados_____________ 4
Figura 2 Abordagens de previso de vendas com uso de dados individuais e modelagem de
sries temporais ____________________________________________________________ 5
Figura 3 - Abordagens de previso de vendas com uso de dados individuais e modelagem
causal ____________________________________________________________________ 5
Figura 4 - Abordagem da presente pesquisa ______________________________________ 6
Figura 5 - Framework para anlise de mtodos de previso (WINKLHOFER et al., 1996) 10
Figura 6 - Taxonomia das tcnicas de previso __________________________________ 20
Figura 7 - Modelo de inferncia bayesiana ______________________________________ 31
Figura 8 Deciso de compra baseada nos conceitos de valor e compostos de marketing _ 48
Figura 9 Classificao dos tipos de varejo segundo sua amplitude e profundidade
(PARENTE, 2000) _________________________________________________________ 51
Figura 10 Amplitude, profundidade e atratividade das diferentes categorias (PARENTE,
2000)____________________________________________________________________ 53
Figura 11 Relacionamentos entre produtos substitutos e complementares de um ou mais
centros de interesse ________________________________________________________ 56
Figura 12 Estatstica convencional X Minerao de Dados________________________ 60
Figura 13 Consolidao de dados em um Data Warehouse ________________________ 62
Figura 14 Data Warehouse como repositrio para anlises de dados________________ 63
Figura 15 O ciclo virtuoso de data mining (BERRY & LINOFF, 1997, modificado)_____ 66
Figura 16 Esquema de funcionamento de cada n em uma rede neural artificial _______ 72
Figura 17 Modelo da Pesquisa ______________________________________________ 82
Figura 18 Metodologia conduzida para a Pesquisa ______________________________ 83
Figura 19 Relacionamentos entre produtos detectados nas anlises do cesto de compras 97
Figura 20 Boxplot do total de vendas semanal por setor, indicando a presena de muitos
outliers _________________________________________________________________ 100
Figura 21 Mdias de vendas semanais por setor, indicando forte sazonalidade e picos de
vendas __________________________________________________________________ 101
Figura 22 Histograma da disperso dos erros, na escala da varivel prevista ________ 113
Figura 23 Grfico de vendas previstas X vendas reais___________________________ 114
Figura 24 Histograma da varivel Estoque sem transformaes ________________ 134
Figura 25 Boxplot da varivel Estoque sem transformaes ____________________ 135
Figura 26 - Histograma da varivel Estoque aps a transformao Z = log x _______ 136
Figura 27 - Boxplot da varivel Estoque aps a transformao Z = log x___________ 136
Figura 28 Grfico scatterplot entre Estoque_log e Grade_log ________________ 141
Figura 29 Grfico scatterplot entre Mostruario_log e Preo_pot______________ 141
Figura 30 Grfico scatterplot entre Classe_distribuicao e Classe _____________ 142
Figura 31 Grfico scatterplot entre Estoque_log e Vendas_log _______________ 142
Figura 32 Grfico scatterplot entre Pprazo e Vendas_log ___________________ 143
Figura 33 Grfico de autocorrelao da varivel Vendas_log __________________ 143
Lista de Tabelas
Tabela 1 - Classificao das tcnicas de previso quantitativas segundo o nvel de agregao
dos dados (ROBERTS, 1998) _________________________________________________ 11
Tabela 2 Exemplos de comparao de desempenho das tcnicas de previso na literatura 27
Tabela 3 Comparao de desempenho da tcnica de redes neurais artificiais frente a outras
tcnicas estatsticas ________________________________________________________ 79
Tabela 4 Resultados da anlise do cesto de compras por produto, abordados por transao
________________________________________________________________________ 89
Tabela 5 - Resultados da anlise do cesto de compras por linha de produto, abordados por
transao ________________________________________________________________ 89
Tabela 6 - Resultados da anlise do cesto de compras por setor, abordados por transao 90
Tabela 7 Exemplos de regras da anlise do cesto de compras abordado por transao, com
uso de taxonomias entre os produtos ___________________________________________ 91
Tabela 8 - Resultados da anlise do cesto de compras por produto, abordados por cliente 93
Tabela 9 - Resultados da anlise do cesto de compras por linha de produto, abordados por
cliente ___________________________________________________________________ 94
Tabela 10 Lista de Linhas de Produtos relacionadas resultados preliminares ________ 95
Tabela 11 - Lista de Linhas de Produtos relacionadas _____________________________ 96
Tabela 12 Centro de interesse detectado ______________________________________ 98
Tabela 13 Principais variveis independentes usadas nos modelos de previso semanal _ 99
Tabela 14 Transformaes aplicadas aos dados _______________________________ 102
Tabela 15 Correlaes significativas detectadas entre as variveis independentes ____ 103
Tabela 16 - Correlaes significativas entre as variveis independentes e a varivel
dependente ______________________________________________________________ 103
Tabela 17 Autocorrelaes e correlaes parciais verificadas ____________________ 104
Tabela 18 Resultados das redes 1 e 2, comparando os efeitos das transformaes nos dados
_______________________________________________________________________ 105
Tabela 19 - Resultados da rede neural 6, sem a presena da varivel Grade ________ 106
Tabela 20 - Resultados da rede neural 10, com as entradas numricas normalizadas e
padronizadas ____________________________________________________________ 107
Tabela 21 - Resultados da rede neural 26, com incorporao das vendas na semana anterior
e missing values preenchidos ________________________________________________ 110
Tabela 22 - Resultados da rede neural 108, com incorporao do total de vendas de produtos
substitutos (missing values preenchidos) _______________________________________ 111
Tabela 23 Resumo das redes neurais geradas e performance obtidas _______________ 112
Tabela 24 Capacidade preditiva do Modelo Baseado em Redes Neurais (rede 108)____ 112
Tabela 25 Capacidade preditiva da previso naive no ajustada __________________ 115
Tabela 26 Equaes de regresso linear geradas ______________________________ 115
Tabela 27 Capacidade preditiva das equaes de regresso linear_________________ 115
Tabela 28 Performance comparativa das redes neurais__________________________ 116
vi
Lista de Siglas
ARIMA Autoregressive Integrated Moving Averages, ou mtodos auto-regressivos
MAPE Mean Absolute Percentage Error, ou Erro Percentual Absoluto Mdio
MSE Mean Square Error, ou Erro Quadrado Mdio
RMSE Root Mean Square Error, ou Raiz do Erro Quadrado Mdio
SKU Stock Keeping Unit, ou Identificador nico do Produto
vii
nvel de preos ou aes de marketing planejadas devem ser levadas em considerao nas
previses.
As previses variam quanto sua aplicao em nveis agregados (como na economia)
ou para um componente especfico (como para uma companhia individual). Tambm diferem
quanto ao horizonte de previso curto, mdio ou longo prazo so conceitos flexveis, que
variam conforme a aplicao. Previses de vendas podem ser construdas para toda a
companhia, para produtos ou grupo de produtos particulares, para regies geogrficas ou
territrios de vendas especficos, para clientes particulares, ou para combinaes dos
elementos citados.
Este trabalho est focado no processo acima descrito, de gerao de previses de
demanda para tomada de decises no varejo. A preocupao central desta pesquisa na
explorao de uma metodologia baseada em tcnicas de minerao de dados para
identificao de relacionamentos entre a demanda de diversos produtos e os fatores de maior
influncia destas. Vislumbrando estes relacionamentos com maior clareza, o gestor fica mais
habilitado tomada de decises acertadas no gerenciamento de vendas e outras atividades
conseqentes, como gerenciamento de estoques, de fluxo de caixa e outros.
Para que o gestor possa tomar decises bastante especficas, os dados utilizados devem
ser o mais atomizados (individuais) possvel, gerando previses com grande nvel de
detalhamento, porm pequeno horizonte futuro. A metodologia explorada busca ser til,
portanto, para tomada de decises operacionais no varejo e no estratgicas, de longo
prazo. Situaes tpicas do setor varejista como: o que acontece com a demanda e o lucro de
minha loja se aumentar o preo da linha de produtos X?, ou meu concorrente cortou preos
da ordem de 30%; qual a melhor medida a ser tomada? podem ser vislumbradas e as
possveis solues endereadas com o uso de uma metodologia de prospeco de cenrios
como a aqui proposta.
Previses de curto prazo so empregadas para auxiliar decises que devem ser feitas
num futuro prximo, como a determinao do nvel de inventrio, nmero de funcionrios e
produo necessrios, capital de giro, suprimentos a serem adquiridos, entre outras. Por outro
lado, em situaes onde o impacto das decises tomadas pode influenciar a posio da
companhia nos prximos anos, previses de longo prazo so requeridas. Tais situaes podem
envolver decises a respeito da construo de uma nova fbrica, a entrada em novos
mercados, exportar ou no seus produtos, modernizar as operaes, entre outras.
3
Q
Modelo de Previso de
vendas agregadas
Demanda total da
corporao
(agregada)
TANG et al., 1991; LUXHOJ et al., 1996; ANSUJ et al., 1996; KUO & XUE, 1998; SPEDDING & CHAN, 2000
Dados de entrada:
1.Sries temporais
de Q1, Q2, ... , Qn
(demanda de
cada produto no
tempo)
Q1
Q2
Q3
Qn
Modelos de Previso de
vendas individual
BARASH & MITCHELL, 1998; GORDON, 1998; ALIBAIG & LILLY, 1999
Figura 2 Abordagens de previso de vendas com uso de dados individuais e modelagem de sries
temporais
Dados de entrada:
2.Variveis
explicativas da
demanda
(modelo causal)
A
B
C
Z
Modelos de Previso de
vendas individual
MENTZER & KENT, 1999; SUBRAHMANYAN, 2000
Figura 3 - Abordagens de previso de vendas com uso de dados individuais e modelagem causal
Dados de entrada:
2.Variveis
explicativas da
demanda
(modelo causal)
A
B
C
Z
Modelo de Previso de
vendas individual, para
um grupo de produtos
relacionados (centro de
interesse)
Demanda prevista
para cada produto
Como mostrado na figura acima, este trabalho visa investigar o relacionamento entre
produtos afins na previso de vendas individual de produtos, e, atravs da adoo de um
modelo causal, averiguar como esta previso pode ser utilizada para auxlio tomada de
decises no varejo.
O problema de investigao pode ser centrado na seguinte questo:
6
3. Objetivos da Pesquisa
O objetivo geral desta pesquisa explorar a possibilidade de usar uma metodologia
capaz de identificar padres de relacionamento teis na previso de vendas individual no
varejo, com o uso do processo de minerao de dados. Essas previses devem abordar grande
parte das decises de curto prazo enfrentadas no cotidiano do gestor da loja, num nvel
aprofundado detalhado quanto a produtos de decises. O objetivo explorar um modelo
de previso de demanda para os produtos visando identificar um composto de marketing
adequado (preos, produtos e promoes).
Os seguintes objetivos especficos podem ser destacados:
Explorar a tcnica de redes neurais artificiais para a criao de modelos de
previso de vendas individualizadas no varejo.
Desenvolver uma rede neural artificial para previso de vendas capaz de
detectar relacionamentos entre variveis que impactam no volume de vendas
de uma loja ou cadeia de lojas, de forma detalhada (por produto).
4. Questes de Pesquisa
Durante o desenvolvimento da metodologia de criao de modelos para previso de
demanda, pretende-se explorar as seguintes questes:
Como tratar os dados de vendas de maneira atomizada sem agregaes e de
forma sistemtica para serem utilizados em um processo de minerao de
dados. Em outras palavras, como realizar a coleta, filtragem, limpeza e
transformaes necessrias a um adequado pr-processamento de dados para
criao de modelos, em se tratando de dados no agregados?
possvel utilizar as informaes a respeito dos centros de interesse de um
grupo de produtos em modelos de previso? Em caso afirmativo, esse
5. Delimitaes da Pesquisa
Esta pesquisa est focada em anlises de dados de vendas no varejo, e, portanto, no
trata de problemas referentes demanda em servios, na indstria primria ou mesmo outros
elementos da cadeia de distribuio que no seja aquele de distribuio ao consumidor final.
Outra delimitao importante diz respeito ao horizonte de previso: como os modelos
gerados tratam de dados extremamente atomizados, sua utilizao em horizontes amplos
torna-se invivel. A princpio, apenas decises operacionais do composto de marketing num
horizonte de curto prazo so consideradas.
No preocupao deste estudo, tambm, a comparao direta entre modelos de
previso de vendas. Os modelos gerados foram confrontados com outras modelagens apenas
para efeito de confirmao de sua capacidade preditiva mnima. A preocupao central deste
trabalho com a metodologia utilizada para deteco de relacionamentos entre as variveis
que afetam a demanda no varejo, a fim de dar uma melhor compreenso da realidade em que
a loja est sujeita por meio de uma previso de vendas causal mais acertada.
1.1.
Questes metodolgicas
Propsito/uso da previso
Analistas
Usurios
Fontes de dados
Horizonte de tempo e freqncia das previses
Recursos dedicados
Nvel de agregao das previses
Questes de avaliao
Apresentao dos resultados aos
gestores
Reviso e uso de julgamento subjetivo
Padres de avaliao
Performance
Problemas e melhorias
Nvel agregado
economtricos
de
mercado (III)
(IV)
Tabela 1 - Classificao das tcnicas de previso quantitativas segundo o nvel de agregao dos dados
(ROBERTS, 1998)
11
Equao I: n(t ) =
dN (t )
q
= p.[m N (t )] + .N (t ).[m N (t )]
dt
m
serem alcanadas, ou seja, previso de vendas com planejamento de vendas (FILDES &
HASTINGS, 1994), o que gera freqentemente mudanas nos resultados das previses por
motivos externos, como motivaes polticas e estratgicas da organizao (PETERSON,
1993).
O estudo de PETERSON (1993) vai mais alm, concluindo que grandes firmas de
varejo utilizam tcnicas de previso de vendas com maior freqncia que os pequenos
varejistas, resultado confirmado por PETERSON & JUN (1999), que mostraram que entre as
empresas grandes, 100% afirma preparar previses ao menos uma vez por ano, nmero este
que cai para 93,2% entre as empresas pequenas. As freqncias de preparao das previses
so segundo os autores, nesta ordem: anual (a mais comum), quadrimestral, semestral e
mensal (a menos comum), resultado compatvel com aqueles obtidos por CERULLO &
AVILA (1975) e WHITE (1986).
Quanto ao horizonte de tempo utilizado nas previses, h pouco consenso entre os
autores, tanto no que se refere ao desempenho das tcnicas quanto s prprias definies de
curto, mdio e longo prazos. Estudos j foram conduzidos para previses com horizonte de
tempo de um dia (SAKAI et al., 1999) at 25 anos (NAYLOR, 1981). Os estudos
relacionados ao horizonte de tempo e freqncia das previses confirmam, no entanto, a
proposio de WHITE (1986), de que as companhias utilizam a freqncia que melhor se
adapta aos seus produtos, mercado e mtodo de operao. No h uma freqncia de previso
ideal.
Fontes de dados
Uma expresso comum entre os analistas e estatsticos , em ingls, Garbage In,
Garbage Out, ou entra lixo, sai lixo. Ela expressa bem o sentido de que nenhum modelo
capaz de gerar boas previses sem a presena de dados confiveis e, principalmente, que
representem o problema em questo. O problema reside no fato de que os sistemas voltados
operao da empresa nem sempre enfatizam a presena de dados limpos e confiveis.
Algumas vezes, os dados disponveis no so adequados ao que se quer prever; por exemplo,
na previso de demanda, muitas vezes s se dispe de dados de entregas, e estas no so uma
boa representao do fenmeno de interesse a demanda.
A presena de dados confiveis e que representem o fenmeno estudado , segundo
BROWN (1963), um dos fatores de maior ganho em acurcia. Normalmente, demanda-se um
grande esforo de modelagem para um pequeno ganho de acurcia, porm dados que melhor
representem o problema geram grandes ganhos, muitas vezes com pouco esforo.
Para a preparao de previses tanto agregadas como individuais diversas fontes
de dados podem ser utilizadas. Normalmente, elas so divididas em dois grandes grupos de
fontes: internas e externas (WINKLHOFER et al., 1996).
Fontes internas de dados so aquelas, como o prprio nome diz, internas companhia,
e muitas vezes esto armazenadas em diversas bases de dados nos departamentos ou setores
da empresa. Para ter uma fonte interna de dados macia, necessrio manter um registro de
todas as atividades do composto de marketing, incluindo modificaes realizadas nos
produtos, promoes, polticas internas, mudanas ambientais e da concorrncia, j que
modelos quantitativos podem utilizar todos esses dados, muitas vezes com ganhos de acurcia
aliados a pouco esforo adicional para coleta de tais informaes. Os dados internos podem
ter origem nos canais de venda da companhia, como dados histricos de vendas; em
informaes coletadas com a fora de vendas (quantitativas e qualitativas); em dados dos
centros de distribuio e dos pontos de venda final. Naturalmente, estes ltimos so os mais
indicados para previses de venda, j que refletem a demanda real dos produtos, sem
distores devido a reposies de estoque, devolues, diferenas de tempo entre distribuio
e demanda final, entre outras.
As fontes externas de dados mais utilizadas so aquelas que dizem respeito aos fatores
macroeconmicos que possam influenciar nas previses, como ndices governamentais,
tendncias poltico-econmicas, estatsticas financeiras e scio-econmicas. Tambm
18
comum a compra de bases de dados externas para se obter dados da concorrncia, dados
econmicos e do setor, promoes, tendncias de preos, de lanamento de produtos e
tecnolgicas, entre outros.
freqente a presena de distores nos dados disponveis, que podem ter vrias
origens, entre elas (GEURTS & WHITLARK, 1996):
Presena de outliers. Podem ser resultado de aes de marketing
extraordinrias, ou fenmenos externos com efeito apenas sobre alguns pontos da srie
(de curta durao). Normalmente, a ao de outliers de difcil deteco pelos
modelos.
Presena de cotas de venda. Os vendedores manipulam suas vendas para
atingir as cotas, e muitas vezes prorrogam as vendas para ficar mais fcil atingir as
cotas do prximo perodo, ou realizam promoes agressivas para atingir as metas do
perodo. Este fenmeno conhecido como game playing.
Sries de dados contaminadas com dados de fenmenos concorrentes, como o
caso da demanda representada pelas entregas ou produo, ao invs de vendas
propriamente ditas. Nestes casos as previses tero acurcia invariavelmente baixa, e a
nica soluo tentar aproximar os dados do que se quer estudar de fato. Por exemplo,
pode-se inserir o valor de pedidos atrasados ou adiantados a fim de aproximar os
dados de entregas da demanda verdadeira.
Vendas gerenciadas por contas. As contas podem no representar a demanda
real, uma vez que tambm esto sujeitas ao game playing.
Estratgias para fugir de taxas e impostos, como a produo acelerada no
ltimo ms do ano. Estas devem ser detectadas e amenizadas.
Polticas empresariais diversas, por questes legais, de marketing ou outras.
primeiramente de acordo com sua abordagem conceitual, em seguida por sua metodologia de
coleta e tratamento dos dados, e finalmente distinguindo as diferentes tcnicas de anlise de
dados dentro de cada abordagem.
A figura a seguir mostra a taxonomia das tcnicas de previso proposta (a caixa em
destaque sinaliza a categoria de modelos foco desta pesquisa):
Tcnicas Exploratrias
Tcnicas de Grupo
Qualitativas
Modelos Bayesianos
Mtodos de Suavizao
Averaging: mdia, tcnicas naive, moving average,
double moving averag.
Exponencial: exponential smoothing, ARRSES,
double exponential smoothing de um e dois
parmetros, triple exponential smoothing de um e
trs parmetros.
Anlises de Sries Temporais
Mtodos de Decomposio
Decomposio clssica, Decomposio Censo II.
Mtodos Auto-regressivos (ARIMA)
Modelos baseados em Redes Neurais
Quantitativas
Modelos de Regresso
Tcnicas Causais
Modelos Economtricos
Modelos baseados em Redes Neurais
ME. Mean Error, ou Erro Mdio, a medida mais simples de erro das previses,
definida como o somatrio dos erros (erro total) dividido pelo nmero de
observaes realizadas.
n
Equao II: ME =
i =1
MAE. Mean Absolute Error, ou Erro Absoluto Mdio, o erro mdio tomado em
termos absolutos, para que um erro positivo no seja anulado por outro negativo.
n
i =1
MSE. Mean Square Error, ou Erro Quadrado Mdio, foi definido com a mesma
finalidade de no anular os erros durante sua somatria.
n
Equao IV: ME =
i =1
i =1
Xi Fi
Xi
n
AE. Absolute Error, ou Erro Absoluto, o erro total acumulado, somado de forma
absoluta (com o uso do mdulo do erro).
SSE. Sum of Squared Erros, ou Soma Quadrada dos Erros, o total quadrado dos
erros verificados. Ou seja, representa o MSE sem a medida da mdia.
RMSE. Root Mean Square Error, ou Raiz do Erro Quadrado Mdio, tomado a
partir da raiz do MSE, para que a medida volte unidade original.
YTD MAPE. a medida do MAPE para o ltimo ano corrido, isto , para as
ltimas 52 semanas ou 12 meses at o momento, dependendo da freqncia
tomada.
A escolha do critrio a ser utilizado para medir a acurcia dos modelos no arbitrria
ela deve ser feita baseada nas caractersticas do problema e das medidas citadas. Um dos
mtodos mais utilizados o MSE, por ser um estimador no enviesado. Porm este e
tambm sua raiz, RMSE so largamente afetados por outliers: grandes e possivelmente
raros erros. Caso ocorram picos de erros, e o objetivo seja ter um modelo buscando acurcia
ao longo do tempo, este critrio deve ser desconsiderado. A medida do MAPE pode ser a
melhor medida nestes casos, por ser computada por medidas absolutas (e no quadradas) e em
porcentagem do valor previsto. Outra vantagem da MAPE ter uma viso da amplitude do
25
erro: por exemplo, dizer que um modelo teve erro mdio de 8% (MAPE) fornece mais
informaes do que dizer que seu MSE foi de 361, ou que seu MAE foi 147. No caso de se ter
como objetivo um modelo de previso que respeite limites de erro mximo, a medida do
MAE pode ser a mais indicada, assim como as medidas de AE e APE (HARDIE et al., 1998).
qualitativas
(LUXHOJ
et
al.,
1996;
ALIBAIG
&
LILLY,
1999;
Tcnicas
(LAWRENCE et Tcnicas
al., 2000)
qualitativas X
naive no
ajustada
Estudo
Concluses
(SPEDDING &
CHAN, 2000)
Modelagem
bayesiana X
ARIMA
(BIDARKOTA,
1998)
Diferentes
mtodos
autoregressivos,
uni e
bivariados
(NEWBOLD &
GRANGER,
1977)
Sries
temporais e
ARIMA
(MAKRIDAKIS, Sries
1982)
temporais
1.2.
Tcnicas de Previso
27
Uma concluso presente em vrios estudos indica que, em geral, as empresas parecem
estar mais vontade com essas tcnicas que com mtodos quantitativos (WHEELWRIGHT &
CLARKE, 1976; MCHUGH & SPARKES, 1983; MENTZER & COX, 1984; FILDES &
HASTINGS, 1994). Contudo, um estudo recente conduzido por SANDERS & MANRODT
(1994) sinaliza que a familiaridade com mtodos quantitativos crescente em sua pesquisa
76% dos respondentes afirmaram possuir familiaridade com pelo menos uma tcnica
quantitativa para previso de vendas, contra 61% obtidos no estudo de MENTZER & COX
(1984).
Talvez essa familiaridade com mtodos qualitativos seja devido ao fato de eles serem
mais simples, e algumas vezes at intuitivos; fazendo com que sejam os mtodos mais
utilizados nas empresas (SANDERS & MANDRODT, 1994; PETERSON & JUN, 1999). De
fato, facilidade de uso e capacidade de incorporar a experincia do gestor so os principais
argumentos utilizados para justificar o uso intensivo de tcnicas de julgamento subjetivo nas
previses, em detrimento de tcnicas quantitativas (WINKLHOFER et al., 1996).
Entretanto, diversos estudos mostraram que os mtodos qualitativos oferecem baixa
acurcia, e no raro, as previses subjetivas geram grandes erros, ocasionando distrbios no
planejamento e resultado final das operaes corporativas (LUXHOJ et al., 1996; ALIBAIG
& LILLY, 1999; SUBRAHMANYAN, 1998; SUBRAHMANYAN, 2000; LAWRENCE et
al., 2000).
LAWRENCE et al. (2000) sugerem alguns motivos pelos quais as previses
subjetivas, apesar de serem muitas vezes realizadas por analistas experientes e com
informaes contextuais do mercado, no possuem boa performance:
Excesso de dados a serem consideradas pelo analista, fazendo com que ele ignore ou
d pesos errados s informaes contextuais recebidas.
Perturbaes recentes na srie temporal podem ser entendidas pelo analista como um
sinal de tendncia, confundindo a interpretao das informaes contextuais.
28
Dada a baixa capacidade preditiva das tcnicas qualitativas, esta pesquisa est focada
em mtodos quantitativos de previso, e, portanto, apenas apresenta brevemente algumas das
tcnicas qualitativas mais utilizadas, sem detalhar seu funcionamento.
Tcnicas Exploratrias
Aqui esto classificadas todas as tcnicas qualitativas de explorao de dados e
desenvolvimento de cenrios. No h grande formalidade na aplicao destes mtodos, por
isso as variaes so incontveis.
Algumas das tcnicas mais comuns e sistematizadas so:
Pesquisas de mercado. Pesquisas e testes de mercado so instrumentos de
previso teis especialmente quando dados histricos no estiverem
disponveis ou no forem confiveis. O lanamento de um novo produto o
exemplo clssico. As desvantagens incluem baixa acurcia, alto custo e tempo
dispensado.
Mtodo Pert-modificado. Mtodo baseado em estimativas otimista, pessimista
e realista dos acontecimentos futuros. s estimativas so associadas
probabilidades
de
acontecimento,
que
so
posteriormente
avaliadas.
Tcnicas de Grupo
Constituem tcnicas de previso onde as concluses so essencialmente provindas de
anlises de mais de um especialista ou analista. As contribuies podem provir de: executivos
da empresa, equipe de vendas, clientes e outros especialistas da rea. A maior parte desses
29
mtodos utiliza tcnicas estatsticas, com maior ou menor intensidade, para combinar as
informaes provindas dos diversos especialistas.
As tcnicas mais utilizadas so:
Tcnica Delphi. Baseada em questionrios enviados para especialistas, que so
revisados at que se chegue em consensos.
Diagnstico de expectativas. Baseado em pesquisas de opinies de um jri
executivo; utilizado principalmente para deteco de novas tendncias, e para
combinar opinies sobre previses quantitativas previamente calculadas.
Composio da fora de vendas. Uma fonte importante de dados qualitativos
a fora de vendas de uma empresa. A percepo de futuro da equipe de vendas
de particular importncia quando a demanda tiver um padro com muitos
picos e vales (MOON & MENTZER, 1999). Existem duas condies primrias
onde o uso da fora de vendas faz sentido na previso de vendas: (1) os
vendedores tm bom discernimento das mudanas no padro da demanda e
conhecimento profundo de seus clientes; e (2) os vendedores conhecem bem as
probabilidades de garantir grandes vendas. A demanda de armamentos de
guerra um bom exemplo de situao onde a modelagem matemtica
virtualmente impossvel, mas a equipe de vendas tem boa expectativa do
comportamento futuro da demanda.
seja: P( A) = P( A B ) + P A B
)()
P( A) = P( A | B )P (B ) + P A | B P B
30
P( A | B )
P ( A)
P( A | B )P(B )
)()
P( A | B ) + P A | B P B
a qual o Teorema de Bayes. Ele pode ser entendido como uma forma de
transformar uma probabilidade a priori P(B) em uma probabilidade a posteriori
P(B|A). Convencionou-se, ento, em denominar as abordagens que utilizam informao a
priori sobre um problema particular, combinando-a com resultados estatsticos, de bayesianas.
Dados
Informao a priori
Dados
Inferncia
Clssica
Concluso
estatstica
Inferncia
Bayesiana
Concluso
estatstica
A informao a priori a ser utilizada pode ser um resultado estatstico anterior, ou,
mais freqentemente, reflexo do conhecimento do especialista ou analista.
Uma das grandes vantagens de se utilizar a abordagem bayesiana, alm da
possibilidade de melhorar a acurcia com o uso de informao a priori, a anlise de forma
seqencial que ela permite. Ou seja, informao obtida em uma anlise pode ser utilizada
como informao a priori em uma nova anlise, quando novos dados estiverem disponveis.
Assim, a segunda amostragem utilizada como dados, enquanto os resultados da primeira
anlise so utilizados como informao a priori. Esta metodologia bastante utilizada em
problemas de previso: os dados atuais so combinados com a previso anterior (esta ltima
como informao a priori) para obter novas previses. Tambm o conhecimento de
especialistas pode ser utilizado como informao a priori nas previses.
31
32
Single exponential smoothing. Aplicao da Equao VII uma nica vez para cada
perodo previsto.
36
37
Mtodos de Decomposio
Ao contrrio das tcnicas de suavizao, que tentam distinguir entre os padres e os
erros nos dados atravs de uma medida mdia de valores anteriores, as tcnicas de
decomposio buscam separar os componentes que possam estar presentes nos dados. Os
componentes usualmente citados na literatura so:
Tendncia (T). Envolve a expectativa de crescimento ou decaimento em um perodo
longo de tempo. Por exemplo, apesar de apresentar altos e baixos, o ndice do Produto
Interno Bruto (PIB) de um pas desenvolvido tende a aumentar com o tempo.
Sazonalidade (I). Flutuaes peridicas de comprimento constante. Muitas variveis
econmicas possuem forte padro anual, semestral ou trimestral, e outras variveis
podem ter sazonalidades quaisquer. Pode-se verificar facilmente um aquecimento da
economia prximo ao fim do ano, por exemplo.
Componente cclico (C). Padres oscilatrios, desconectados de comportamentos
sazonais repetitivos. No so necessariamente regulares, mas seguem um certo padro
ao longo do tempo, geralmente relacionado ao comportamento macroeconmico.
Componente irregular (). Agrega a multitude de fatores que influenciam o
comportamento de uma srie real, e cujo padro parece ser imprevisvel.
Os modelos de decomposio supem que se pode escrever o padro dos dados como:
Equao VIII: Y = F(tendncia, ciclo, sazonalidade) +
38
Auto-regresso refere-se utilizao da tcnica estatstica de regresso sem o uso de variveis exgenas, mas
sim da prpria varivel dependente em diferentes perodos de tempo: Yt = b0 + b1Yt-1 + b2Yt-2 + ... + bkYt-k + et.
Assim, o pressuposto de independncia dos termos de erro formulado na teoria estatstica imediatamente
violado, por isso a obteno de resultados satisfatrios no garantida, e s feita em termos empricos.
2
H uma certa confuso ocasionada pela nomenclatura utilizada no mtodo ARIMA. Duas so as possveis
ambigidades: 1) o termo Integrated no nome da tcnica na verdade refere-se ao processo de diferenciao da
srie de dados (e no integrao); 2) o termo moving averages tem neste mtodo um significado diferente
daquele usado nos mtodos de suavizao aqui ele refere-se srie de termos de erro em diferentes perodos de
tempo considerados (Yt = a + b1et-1 + b2et-2 + ... + bket-k + et).
39
Tcnicas Causais
As tcnicas de previso baseadas em anlises de sries temporais so especialmente
teis quando h pouco conhecimento sobre a teoria envolvida no processo investigado. Por
exemplo, se houver total desconhecimento dos fatores que influenciam a demanda de um
determinado produto, ou se estes fatores no puderem ser mensurados, ento o uso de uma
tcnica de anlise de sries temporais pode ser a mais adequada.
Porm o uso dessa abordagem resulta em previses no explicativas, e
conseqentemente o gestor no capaz de realizar simulaes sobre o comportamento da
varivel de interesse com mudanas em outros fatores, especialmente sobre aqueles aos quais
ele tem controle. Por exemplo, a demanda de um produto claramente influenciada pelo
preo praticado, e este preo um fator que est sob controle do gestor. Habilitar o gestor a
simular o comportamento da demanda com mudanas no preo fornecer a ele uma
ferramenta de apoio deciso, o que um passo alm de uma simples ferramenta de previso
de vendas.
As tcnicas de previso causais buscam descrever matematicamente as relaes de
causa e efeito entre a varivel que est sendo medida e seus fatores constituintes
(explicativos). Um modelo causal, como o descrito por uma equao de regresso, tem a
vantagem de permitir ao tomador de decises explorar como mudanas nas variveis
explicativas alteram a sada prevista.
Esta pesquisa est focada na gerao de uma ferramenta de apoio deciso no varejo,
e, portanto, as tcnicas de previso causais que habilitam a gerao de cenrios de vendas a
partir de mudanas no composto de marketing so aquelas de maior preocupao neste
trabalho.
Modelos de Regresso
Freqentemente, o relacionamento entre duas ou mais variveis de interesse pode ser
bem modelado atravs de uma equao matemtica. O processo de adaptao de uma equao
matemtica a um fenmeno envolvendo duas ou mais variveis, de forma que uma delas seja
dependente das demais, chamado de regresso. Ele gera modelos matemticos que buscam
representar a relao de causa e efeito entre as variveis consideradas.
Se existir uma associao entre duas variveis quaisquer, diz-se que h covarincia
positiva (ou negativa). Se no h associao entre as variveis, a covarincia nula.
40
Entretanto, este valor depende da unidade de medida das variveis. Para superar esta restrio,
foi definida a correlao, que uma medida pura, independente de escala. O coeficiente de
correlao definido como a covarincia dividida pelo produto dos desvios padres
individuais:
Equao IX: =
Cov( X , Y )
=
xy
E [( X x )(Y y )]
E ( X x ) (Y y )
2
onde: -1 1
Quanto maior o coeficiente de correlao (em mdulo), mais forte a associao entre
as variveis. Todas as tcnicas de regresso so baseadas na idia de associao entre as
variveis, demonstrada estatisticamente atravs da correlao.
A tcnica mais simples de regresso a Regresso Linear, que modela o
relacionamento entre uma varivel dependente Y e uma varivel independente X de forma
linear. Assim:
Equao X: Y = + X +
Seleo para frente. Comea com um modelo sem variveis, testando uma de cada
vez e selecionando aquele com maior F estatstico (da anlise de componentes
principais). O processo recomea, adicionando mais uma varivel, e mantendo aquela
pr-selecionada.
Eliminao para trs. Funciona de maneira oposta seleo para frente: comea
com um modelo com todas as possveis k variveis e retirada aquela com menor F,
recomeando o processo.
& HOOLEY (1995) mostraram que a anlise de regresso a tcnica estatstica mais utilizada
nas empresas europias, sendo utilizada por cerca de 18% dos respondentes. A popularidade
das tcnicas de regresso deve-se a pelo menos dois fatores, segundo GROSS & PETERSON
(1983):
1. So de fcil compreenso, mesmo para aqueles sem profundos conhecimentos
matemticos ou estatsticos.
2. Resultam em boa acurcia para a maior parte das aplicaes.
43
Modelos Economtricos
Assim como a regresso linear simples um caso especial da regresso mltipla, esta
ltima pode ser vista como um caso especial da modelagem economtrica. Os modelos
economtricos envolvem vrias equaes de regresso, com mais de uma varivel
dependente. Vale ressaltar que alguns autores usam o termo economtrico para qualquer
modelo de regresso, seja simples, mltiplo ou de vrias equaes. Na verdade, as tcnicas
economtricas surgiram efetivamente para prever ndices econmicos, como o prprio nome
diz, e foram posteriormente adaptadas para previses microeconmicas.
A anlise de regresso assume que cada uma das variveis independentes seja
determinada por fatores externos, exgenos ao sistema. Este pressuposto nem sempre
45
1.3.
produtos e servios para atender a uma necessidade pessoal do consumidor final. O varejista
desempenha o elo de ligao entre o consumidor e o produtor ou atacadista.
O setor varejista vem atravessando intensas transformaes ao longo das ltimas
dcadas, assumindo importncia relativa crescente no Brasil e no Mundo (PARENTE, 2000).
Uma das transformaes mais visveis o aumento do poder do varejo observado no Mundo
Ocidental. Viu-se surgirem grandes conglomerados varejistas, muitas vezes com atuao
multinacional. Prova disso o nmero crescente de varejistas que figuram na relao de
maiores empresas do Brasil. Tal fenmeno mudou a relao de poder fornecedor-varejista,
fazendo com que o varejista ganhe poder de barganha. Grandes cadeias de varejo tm hoje
fora suficiente para impor condies de fornecimento (quantidades e freqncias), forma de
abastecimento e pagamento, e at mesmo procedimentos de gesto logstica.
O surgimento e fortalecimento das marcas prprias produtos comercializados com a
marca do varejista, exclusivamente em suas lojas outro exemplo da mudana no
relacionamento varejo-indstria. Alm disso, crescente a polarizao entre grandes e
46
pequenos varejistas. Os grandes varejistas assumiram uma posio de varejo de massa, que
operam em grande parte do territrio nacional, desenvolvem sofisticados sistemas logsticos e
de informaes de marketing, e exercem forte poder de barganha junto aos fornecedores. J os
pequenos varejistas, que no detm o poder de barganha dos grandes, no so capazes de
oferecer preos to competitivos, e para sobreviver atuam em mercados restritos ou optam por
uma estratgia de especializao, aprofundando-se no atendimento de necessidades
especficas em certos segmentos de mercado.
O aumento da concorrncia no varejo acompanhou aquele verificado em outros
setores, porm com uma caracterstica peculiar: ele agora se d no somente entre empresas
que operam no mesmo formato, mas tambm entre diferentes tipos de varejistas. Ou seja,
diferentes tipos de varejo vendem as mesmas categorias de produto, aumentando as opes de
compra do consumidor final. As padarias, por exemplo, hoje tm como concorrentes no s
outras padarias, mas tambm hipermercados, supermercados e lojas de convenincia.
Finalmente, o surgimento e ampliao das vendas realizadas sem o uso de lojas
mudaram a realidade do varejo no mundo todo. Vendas atravs da televiso, por catlogo,
atravs de mquinas automticas e principalmente pela Internet registram contnua expanso,
e oferecem desafios crescentes de planejamento e execuo aos gestores do varejo.
Composto de
marketing da
concorrncia
Valor
Deciso
de compra
48
49
palavras, so produtos que orbitam ao redor de algum interesse especfico do consumidor. Por
definio, todo produto est necessariamente dentro de um ou mais centros de interesse, e,
existindo um mnimo de dois produtos em um centro de interesse, eles so necessariamente
relacionados de alguma forma.
A problemtica existente na determinao do conjunto de produtos a ser oferecido
reflete as duas dimenses fundamentais que as norteiam: 1) a amplitude ou extenso, que se
refere quantidade de centros de interesse distintos atendidos pela loja, e 2) a profundidade,
que se refere ao nmero de produtos diferentes existentes dentro de cada centro de interesse:
quanto maior a profundidade, maior a sortidade de produtos disponveis. Tomando por
exemplo o caso do centro de interesse que inclui queijos e derivados, uma loja especializada
em queijos possui conjunto de produtos pouco extenso (pode atender somente a este centro de
interesse), porm aprofundado, j que dispe de tipos variados de queijos. J um
supermercado tem a caracterstica de ser generalista, ou seja, com conjunto de produtos
extenso, mas pouco profundo sua seo de queijos ser provavelmente menor que a loja
citada, porm ele atende a muitos outros centros de interesse. Finalmente, um hipermercado
pode ter conjunto de produtos ao mesmo tempo extenso e profundo, e no exemplo citado
oferecer grande variedade de queijos, alm de muitos outros grupos de produtos.
A figura a seguir exemplifica alguns tipos de varejo de acordo com a amplitude e
Amplitude
Hipermercado
Loja de departamento
Supermercado
Mercado
Padaria
Loja de convenincia
Aougue
Loja especializada
Profundidade
Figura 9 Classificao dos tipos de varejo segundo sua amplitude e profundidade (PARENTE, 2000)
51
52
Amplitude
Destino
Rotina
Ocasional
Maior atratividade
Convenincia
Menor atratividade
Profundidade
53
alto volume de vendas, mas sim por meio da elevada margem bruta por produto que pratica.
Esta poltica normalmente adotada quando:
servios prestados;
Q
(Equao XII)
P
Elasticidades cruzadas
A elasticidade cruzada reflete como a variao do preo de um produto afeta o
comportamento de outros produtos (PARENTE, 2000). portanto a relao entre a variao
da quantidade demandada do produto A e a variao do preo do produto B (correlao preodemanda):
Elasticidade cruzada =
Qa
(Equao XIII)
Pb
55
Centro de Interesse
Centro de Interesse
S1
S3
P1
P2
P3
S4
S2
P6
P4
P7
P8
P5
P12
P9 P10 P11
Como ilustrado na figura, alguns produtos podem fazer parte de mais de um centro de
interesse simultaneamente, j que atendem a necessidades distintas para o consumidor (P6, P7
e P8). Entretanto, tais produtos continuam a formar um grupo coeso de substitutos (S3). Uma
cadeira de pano, por exemplo, pode servir como cadeira de praia ou cadeira de pesca, dois
interesses bem distintos. Para cada um desses centros de interesse, os produtos
complementares so diferentes: por exemplo guarda-sol no primeiro e vara de pescar no
segundo. Todas as cadeiras de pano vistas como equivalentes para o consumidor, contudo,
formam um mesmo grupo de produtos substitutos.
56
foras que pressionaram o avano desta tecnologia podem ser divididas em (PEACOCK,
1998a):
minerao de dados s pode amadurecer durante os anos 90 devido aos seguintes fatores:
Os dados esto sendo produzidos. Minerao de dados s faz sentido quando existir
grandes volumes de dados.
59
Pequenas amostras
Amostras bem comportadas
Dados estticos
Dados quantitativos
Produz resultados
contundentes a partir de
anlises aprofundadas
Conhecimento
acion
acionvel
Minerao de Dados
2.1.
um banco de dados a ser explorado, o que levanta algumas questes como: Quais as variveis
relevantes? Qual o volume de dados necessrio? Onde esto os dados? Qual o custo para obtlos?
De maneira geral, os dados podem ser coletados interna ou externamente
organizao. Dados externos so de difcil obteno e de qualidade suspeita, uma vez que no
60
podem ser auditados pela prpria organizao. Portanto, uma origem importante dos dados
seno a nica a coleta feita pelos sistemas operacionais da empresa aqueles que
controlam sua operao diria, como sistemas de ponto de venda, sistemas transacionais, e
geradores de relatrios operacionais. Tais sistemas podem acumular dados diversos como
informaes dos clientes, dos produtos, de vendas, e mant-los em formato altamente
atomizado, guardando todos os detalhes sobre as operaes realizadas.
Formam-se assim grandes bases de dados histricas, que geralmente tm de ser
trabalhadas a fim de que possam ser exploradas convenientemente. Normalmente, os dados
existentes no foram coletados com o propsito especfico de realizar anlises exploratrias e
de minerao, mas apenas para suportar os processos de negcio operacionais. Isto pode levar
a dados de baixa qualidade, valores ausentes e dados enviesados, que reduzem a
aplicabilidade dos resultados encontrados. Um dos objetivos da aplicao de tcnicas
avanadas de minerao de dados justamente desenvolver um modelo vlido mesmo se
utilizando dados sujos (HAND, 1998).
Uma questo comum diz respeito quantidade de dados necessria para a realizao
de minerao de dados. Uma resposta freqente para esta questo a de que as atividades de
minerao de dados requerem enormes quantidades de dados. FEELDERS et al. (2000)
lembram, entretanto, que:
Uma vez que o problema foi adequadamente especificado, apenas uma pequena parte
de uma base de dados altamente heterognea necessria.
61
Transaes operacionais
Bases de Dados
operacionais
Data Warehouse
Anlises de dados
62
Data Warehouse
63
2.2.
genricos dos processos de minerao de dados. Os objetivos mais citados so: sumarizao
(descrio e visualizao), previso, classificao, segmentao e anlise de ligaes ou
associaes (PEACOCK, 1998a; BERRY & LINOFF, 1997). Algumas destas tarefas so
melhor abordadas de maneira top-down, atravs de teste de hipteses. Outras so melhor
abordadas de maneira botton-up, atravs de tcnicas de descoberta de conhecimento (KDD).
Os principais objetivos visados com a minerao de dados so:
1. Previso. Lida com comportamentos futuros, conforme detalhado na seo O
Problema de Previso de Vendas. Todas as tcnicas utilizadas para classificao
podem ser usadas com sucesso para previses, formulando-se os modelos com base
em dados histricos, onde a varivel a ser prevista conhecida (BERRY & LINOFF,
1997). Alguns autores separam esta tarefa daquela de estimao, onde o elemento
tempo no est necessariamente presente pode-se estimar variveis como renda,
altura, nmero de filhos, balano da conta corrente ou a probabilidade de responder a
uma campanha publicitria.
2. Sumarizao e Descrio. Visa aumentar o grau de compreenso sobre um fenmeno
complexo, representado por grande quantidade de dados de difcil compreenso,
atravs da sumarizao destes dados. Utiliza basicamente tcnicas estatsticas
descritivas, e ferramentas de visualizao grficas. Estas ltimas de visualizao
grfica automtica a partir de dados e anlises simples so consideradas essenciais,
dadas as caractersticas inerentes ao ser humano de dificuldade em interpretar dados
numricos aliada enorme facilidade em interpretar informaes visuais (GARGANO
& RAGGAD, 1999).
3. Classificao. , segundo BERRY & LINOFF (1997), o trabalho mais comum.
Consiste em examinar as caractersticas de um objeto e tentar coloc-lo dentro de uma
srie de classes pr-definidas. A construo de um modelo de classificao consiste na
anlise das caractersticas de elementos previamente classificados, para que se possa
aprender a classificar novas observaes.
4. Segmentao. Segmentao a atividade de separar em grupos homogneos uma
populao heterognea. Os grupos de registros semelhantes so chamados de clusters,
64
por isto estas tcnicas tambm so conhecidas por tcnicas de clustering. A diferena
entre segmentao e classificao que, nesta ltima, as classes so pr-definidas,
enquanto durante uma segmentao elas so dinamicamente criadas com base na
similaridade entre os elementos. O objetivo identificar grupos semelhantes de
registros, para tratar um grupo populacional como grupos com qualidades distintas.
Assim, as aes sobre o mercado podem ser realizadas de maneira dirigida, focando
esforos em pontos onde a resposta mais favorvel.
5. Agrupamento por Afinidade. usado para determinar afinidades ou ligaes entre
objetos. A aplicao clssica a determinao de quais produtos vendem em conjunto
em um supermercado tambm chamada de anlise de cesto de compras para dispor
ou promover itens de maneira a incentivar a compra de produtos afins. Consiste
basicamente na gerao de probabilidades de compra conjunta: quem compra o
produto A tem X% de chances de tambm comprar o produto B.
2.3.
1- Identificao do problema
3- Ao sobre o problema
Figura 15 O ciclo virtuoso de data mining (BERRY & LINOFF, 1997, modificado)
66
2.4.
relaes de causa e efeito propriamente ditas. Outro problema visvel desta tcnica que o
nmero de possibilidades cresce exponencialmente com o aumento no nmero de itens.
Um dos principais usos das tcnicas de induo de regras o agrupamento de produtos
por afinidade, ou, em sua denominao mais comum, a anlise do cesto de compras. A anlise
do cesto de compras utilizada para encontrar grupos de itens que ocorrem simultaneamente
(e em que ordem) em transaes. As informaes coletadas so usualmente utilizadas no
planejamento do layout de lojas, na elaborao de promoes de produtos conjuntos,
agrupamento de produtos, comparao de vendas entre lojas ou entre perodos com
promoes, detectar sazonalidades etc. Quando as transaes no so annimas, as anlises
podem utilizar o fator tempo como um elemento, para agrupar produtos adquiridos por um
mesmo consumidor ao longo do tempo.
O processo de anlise do cesto de compras consiste em:
1. Escolher os itens. Para tanto comum realizar uma taxonomia dos itens a fim de
generaliz-los propriamente. Usualmente, so analisados inicialmente os itens
genricos em hierarquia superior, como segmentos ou linhas de produtos.
Posteriormente, podem ser analisados os itens mais especficos (atomizados),
geralmente com o uso de apenas uma amostra dos dados. O nvel de generalizao
entre os produtos, dentro da taxonomia existente, pode variar. A freqncia com que
os itens aparecem tambm indicativa da generalizao necessria produtos que
raramente vendem devem ser agrupados para que sua freqncia aumente, e viceversa. Por exemplo, se h muitos registros de coca-cola, este produto pode ser
analisado de forma atomizada, enquanto a baixa demanda por outras marcas
concorrentes pode forar seu agrupamento na categoria refrigerantes de cola.
2. Gerar as regras atravs da contagem de ocorrncia simultnea dos produtos.
3. Analisar as regras interessantes, uma vez que podem ser geradas milhares de
combinaes diferentes, muitas delas inexplicveis ou bvias.
Algumas vezes faz-se necessria a gerao de itens virtuais, ou seja, que no
aparecem na taxonomia original. Por exemplo, uma marca especfica pode aparecer em
produtos bem distintos, e um item virtual indicando sua presena pode ser til para detectar
relacionamentos nas vendas dos produtos dessa marca. Outros exemplos tpicos so
informaes sobre as transaes se foi paga em dinheiro, cheque ou carto, qual era o dia
68
da semana, entre outros. A incluso de itens virtuais deve ser limitada, contudo, a itens
acionveis aqueles que geram regras teis corporao.
Outro tipo de regra que pode ser gerada so as regras de dissociao, que funcionam
como as regras de associao, porm possuem o conector no, alm do conector e, como
por exemplo a regra se A e no B ento C. Corre-se, contudo, o risco de gerar inmeras
regras do tipo se no A e no B ento no C, que no so regras acionveis. Assim,
comum testar regras dissociativas apenas com os itens mais freqentes.
Durante o processo de anlise, os fatores mais importantes para monitorar a qualidade
das regras criadas so (BERRY & LINOFF, 1997):
2.5.
E1
S
En
72
Como ilustrado na Figura 16, cada n recebe um ou mais valores de entrada (E1 ... En),
que so combinados em um nico valor com o uso de diferentes pesos para cada entrada; e
transformam-no em um valor de sada (S) atravs de uma funo de ativao. Uma das
funes de ativao mais usadas a funo logstica (PETRON, 1999), que pode ser escrita
como:
Equao XIV: F ( x) =
1
1 + e x
3.1.
uma das tcnicas de minerao de dados mais utilizadas, largamente empregada em tarefas
de classificao e previso, alm de poderem ser aplicadas gerao de conhecimento
indireto (na forma de mapas auto-organizveis). Neste trabalho, utilizaram-se as redes neurais
para previso de vendas; sua escolha como tcnica de modelagem baseou-se em algumas
caractersticas decisivas reportadas na literatura, mostradas a seguir.
De acordo com BAETS & VENUGOPAL (1994), as redes neurais so robustas e
tolerantes a falhas, graas ao seu paralelismo (a contribuio dada por um nico elemento de
processamento no to importante). Isto a torna uma tcnica bastante indicada para uso na
minerao de dados, onde nem sempre os dados disponveis so confiveis.
Diversos autores mostraram a capacidade das redes neurais em lidar com estruturas de
dados no-lineares (LUXHOJ et al., 1996; ZHANG et al., 1998). Esta uma caracterstica
primordial, j que, de acordo com BAETS & VENUGOPAL (1994), os problemas em
74
marketing sempre lidam com dados como vendas e preos, onde as sries de dados esto
inseparavelmente ligadas a pontos de inflexo, tendncias e no-linearidades. Muitas vezes os
dados podem ser at mesmo caticos (THALL, 1992; HIBBERT & WILKINSON, 1994) e
mesmo nesta condio podem ser previstos com preciso por uma rede neural, como
demonstraram LAPEDES & FARBER (1987).
Com o uso de redes neurais, um conhecimento a priori da relao entre as variveis
no requerido, j que elas so auto-adaptativas (BAETS & VENUGOPAL, 1994; ZHANG
et al., 1998; WRAY et al., 1994). Ou seja, elas so capazes de gerar modelos no lineares sem
um conhecimento prvio sobre os relacionamentos entre as variveis de entrada e sada,
podendo ser portanto mais genricas e flexveis que metodologias estatsticas tradicionais.
Tome-se como exemplo uma modelagem feita atravs de regresso: a estipulao da estrutura
dos dados (de segundo ou terceiro grau, por exemplo), assim como a determinao de uma
varivel dependente e de uma ou mais variveis independentes, so necessrios a priori, para
que o modelo matemtico possa ser gerado.
J com o uso de redes neurais, os relacionamentos (relao de dependncia) entre as
variveis so detectados automaticamente. Podem at mesmo ignorar variveis que no
contribuem nas previses, o que permite que algumas experimentaes possam ser feitas sem
prejuzo para o modelo resultante (CHURCH & CURRAM, 1996). Como conseqncia, um
melhor resultado esperado quando o relacionamento entre as variveis no aderente ao
modelo assumido, e quando h forte interdependncia entre os fatores.
Pode-se provar tambm que uma rede neural com uma camada oculta capaz de
aproximar qualquer funo contnua, com a preciso que se desejar (ZHANG et al., 1998).
Uma rede neural pode tambm mimificar uma srie temporal qualquer, como mostraram
ANSUJ et al. (1996).
Alm disso, relaes de multicolinearidade so automaticamente descobertas e
assimiladas pela rede de relacionamentos (WRAY et al., 1994). Segundo os autores, a
performance das redes neurais no depreciada por relaes de multicolinearidade, como
acontece com a regresso. Condies fora da normalidade, violao de hipteses, pontos de
alta influncia e transformaes tambm so bem assimiladas pelas redes neurais.
As vantagens das redes neurais que levaram sua escolha como mtodo de
modelagem para previso de vendas, conforme reportadas na literatura citada acima, podem
ser resumidas da seguinte forma:
75
So inerentemente no-lineares.
3.2.
76
A tabela a seguir mostra alguns exemplos na literatura onde o desempenho das redes
neurais foi melhor e/ou pior que outras tcnicas analisadas:
77
Autor
Estudo
Concluses
ALMEIDA & Compararam as tcnicas de regresso logstica e Os resultados mostraram que as redes neurais podem
SIQUEIRA, redes neurais na previso de falncia de bancos ser aplicadas com sucesso na previso de falncia,
1996
brasileiros.
apesar de no superarem significativamente outras
tcnicas estatsticas.
78
ZHANG,
1994
NELSON
al., 1994
Tabela 3 Comparao de desempenho da tcnica de redes neurais artificiais frente a outras tcnicas
estatsticas
79
80
2. Desenvolvimento da Pesquisa
A metodologia de pesquisa seguiu os seguintes passos para a elaborao do modelo de
previso de vendas:
1. Obteno dos dados de vendas atomizadas no varejo;
2. Seleo e limpeza dos dados;
3. Anlise do cesto de compras para seleo de um grupo de produtos
relacionados entre si. A determinao de um grupo de produtos estreitamente
relacionados tambm serviu para responder a uma das questes de pesquisa
levantadas: esta informao pode auxiliar na capacidade preditiva dos modelos
de previso baseados em redes neurais?;
4. Tratamento e preparao dos dados para modelagem atravs de redes neurais;
5. Gerao dos modelos baseados em redes neurais, testando-se diferentes
combinaes de topologia e variveis de entrada. selecionada a rede neural
com maior acurcia (menor erro nas previses);
6. Comparao do desempenho medindo-se a acurcia alcanada dentro e fora
dos dados de treinamento. Para comparao relativa dos seus resultados, a
rede com maior acurcia foi confrontada com as modelagens naive e de
regresso linear. Tais comparaes foram escolhidas por serem tcnicas
bastante utilizadas para determinao da capacidade preditiva mnima de
modelos de previso (MAKRIDAKIS et al., 1983), e amplamente utilizadas na
prtica pelas empresas (HUSSEY & HOOLEY, 1995).
2.1.
Modelo de Pesquisa
A figura a seguir resume o processo de anlise de dados executado.
81
Vendas
histricas
individualizadas
Variveis do
composto de
marketing
5. Gerao de modelos
baseados em redes neurais
6. Comparao com outras
modelagens
Conforme mostrado no modelo acima, a pesquisa foi conduzida por meio da gerao
de redes neurais artificiais que pudessem prever o comportamento das vendas no nvel
individualizado, tomando como entrada variveis explicativas da demanda a prpria
demanda histrica, e as variveis do composto de marketing agrupadas de acordo com um
conjunto de produtos inter-relacionados pertencentes a um mesmo centro de interesse
selecionados atravs da tcnica de anlise do cesto de compras.
O processo completo pode ser observado na figura a seguir, que detalha os passos 1 a
6 descritos anteriormente e resumidos na Figura 17.
82
Todos os produtos:
Anlise por Transaes (compra casada)
Anlise por Clientes (compra ao longo do tempo)
83
1.1.
atual da EMPRESA, foi aplicado um questionrio aos diretores geral, de vendas e de logstica,
e aos responsveis pelas reas de compras e vendas. O questionrio descrito no ANEXO A
visou essencialmente descobrir como executada a funo de previso dentro da
EMPRESA, e se esta funo vista com uniformidade dentro da empresa.
De acordo com as respostas dadas, a previso realizada pela EMPRESA de duas
formas distintas, e com dois objetivos, por departamentos diferentes. Existe uma previso de
vendas agregada, formulada pela diretoria da empresa anualmente, com base nos resultados
anteriores e expectativas para os prximos meses, especialmente macroeconmicas e de
desempenho da empresa. Essa previso serve de base para tomada de decises estratgicas,
como a abertura ou fechamentos de lojas, ou incremento em linhas de produtos. aferida e
recalculada mensalmente. Existe, entretanto, outra previso de vendas, num nvel operacional,
que utilizada basicamente no planejamento de compras, e de responsabilidade dos gerentes
de produto, que so alimentados por dados dos compradores. Os compradores respondem pela
previso (e conseqentemente pelos pedidos de compra), sendo subordinados pela rea de
Logstica.
A previso agregada feita anualmente de forma totalmente qualitativa, tomando-se
como base nmeros do ano anterior e a percepo dos gestores. J a previso detalhada
realizada por produto, utilizando-se a tcnica naive simples com a mdia das vendas dos
84
Todas as anlises estatsticas e plotagem de grficos foram realizadas utilizando-se o pacote estatstico SPSS
11.0.
86
registro na tabela correspondente, juros negativos, estoque sem registro ou negativo, ausncia
de classificao de produto, entre outros.
Ao final desta etapa, obteve-se um banco de dados unificado e livre de inconsistncias,
contendo informaes sobre todas as vendas realizadas em apenas uma loja, as quais
totalizaram 279.149 transaes, constitudas por vendas de 8.106 produtos de 558 marcas
distintas.
Todas as anlises foram realizadas com o uso do sistema de minerao de dados IBM Intelligent Miner 6.1.
87
4.1.
srie da nota fiscal e nota fiscal concatenados, a fim de se obter um identificador nico
para cada transao, um identificador do ticket de venda. Uma mesma transao que tem
conseqentemente a mesma nota fiscal pode conter mais de um produto; aqueles produtos
que so vendidos juntos com maior freqncia devem, naturalmente, ter maior relao entre
si.
As seguintes dimenses foram tomadas na anlise do cesto de compras por transao:
Lift
11.4000
0.1538
59.0900
0.0009
11.2300
0.0828
70.0000
0.0006
538.0500
0.0946
66.6700
0.0006
12.6700
Rule Head
[VENT ARNO30]
==> [PANELA PR
CLOCK]
[VENT
==> [PANELA PR
ARNO30(0,08KW/H]
CLOCK]
[PANELA AV
==> [PANELA AV
NIGRO]
NIGRO]
[VENT MALLORY ==> [PANELA PR
110]
CLOCK]
Tabela 4 Resultados da anlise do cesto de compras por produto, abordados por transao
Confidence(%)
Lift
26.3200
42.8600
Rule
Support*Confidence
0.0020
0.0003
0.7688
0.0710
0.0710
37.5000
0.0003
25.3700 +
3.9300 +
47.6800 +
Ventiladores
Acessrios para
videogames
Bolas de jogar
Rule Head
==>
==>
Panelas
Videogames
==>
Brinquedos
Tabela 5 - Resultados da anlise do cesto de compras por linha de produto, abordados por transao
Outras regras foram geradas pelo software utilizado, mas como seu tipo neutro e a melhoria diferente de 1, as
regras no podem ser consideradas vlidas e foram excludas. O mesmo procedimento foi efetuado em anlises
semelhantes.
89
Type
Rule Body
0.0118
50.0000
0.0001
3.6000
0.0118
20.0000
0.0000
0.9000
0.0355
8.3300
0.0000
10.5200
Telefonia +
Acessrios de lazer
diversos
Decorao, cozinha e
outros + Cama, mesa,
banho e malas
Utilidades
domsticas +
Produtos de lazer
diversos
Aparelhos de som
Rule Head
==>
==>
Roupas e acessrios
para crianas
==>
Decorao, cozinha
e outros
==>
Eletro-eletrnicos e
acessrios
Tabela 6 - Resultados da anlise do cesto de compras por setor, abordados por transao
Os resultados indicam que a anlise por setor no parece ser ideal, dado o grande
nmero de produtos (aparentemente no relacionados) dentro de um mesmo setor, fazendo
com que as regras obtidas no sejam fortes. Possivelmente, uma reorganizao dos setores,
visando a colocao de produtos relacionados dentro de um mesmo setor, traria resultados
consistentes com as anlises por produto e por linha de produto.
90
Rule
Lift
Support*
Confidence
Rule Body
Rule Head
0.4613
60.0000
0.0028
0.7688
26.3200
0.0020
5.0000
0.1538
59.0900
0.0946
66.6700
0.0710
42.8600
==>
[PANELA PR CLOCK]
em ==>
[PANELA PR CLOCK]
0.0009
11.2300 [VENT
==>
ARNO30(0,08KW
/H]
[PANELA PR CLOCK]
0.0006
12.6700 [VENT
MALLORY 110]
[PANELA PR CLOCK]
0.0003
47.6800 Acessrios
videogames
Ventiladores
geral
==>
para ==>
Videogames
Tabela 7 Exemplos de regras da anlise do cesto de compras abordado por transao, com uso de
taxonomias entre os produtos
91
4.2.
compras casadas e quando as faz ao longo do tempo, j era esperado que a anlise do cesto de
compras por clientes no trouxesse os mesmos resultados que a anlise por transaes.
Com a criao dos identificadores nicos dos clientes, as compras realizadas por um
mesmo cliente ao longo do tempo foram computadas pelo sistema de minerao de dados
como pertencentes a uma mesma transao, e assim as anlises do cesto de compras por
clientes puderam ser conduzidas, levando-se em considerao as mesmas dimenses das
anlises anteriores.
Confidence
(%)
51.5200
0.2067
25.5800
0.0005
2.2100
0.1315
35.0000
0.0005
3.0300
0.0752
57.1400
0.0004
4.9400
0.0939
45.4500
0.0004
3.9300
0.0564
75.0000
0.0004
665.2500
0.0564
50.0000
0.0003
665.2500
0.0564
50.0000
0.0003
102.3500
0.0939
26.3200
0.0002
4.5500
0.0564
42.8600
0.0002
10.2300
0.0564
42.8600
0.0002
3.7100
0.0752
25.0000
0.0002
57.8500
0.0564
30.0000
0.0002
114.0400
0.0564
27.2700
0.0002
6.5100
0.0564
27.2700
0.0002
2.3600
0.0564
25.0000
0.0001
51.1700
0.0564
25.0000
0.0001
27.7200
Rule Body
[CANECA
OXFORD]
[TEL PADRAO
CHAVE IBR]
[MOT BAND TT
GATINHA]
[POP MAG TOY
MC LAREN]
[TAPETE J
SERRANO]
[SUPORTE
GALZERANO]
[BANH BABY
PLASUTIL]
[BOLA VIN PIU
PIU]
[BIC ERG
VITALLI]
[VIDEO GAME
DYNACOM]
[PT RS
SCHMIDT]
[CJ ARROZ
ATHENAS TRA]
[CJ COPOS
CISPER]
[POP LON JUN
PEAOGUGU]
[POP ROS CAM
CEBOLINH]
[EDUC EL PAU
CARIMBOS]
[PROCES
WALITA 110]
Rule Head
==>
[CANECA OXFORD]
==>
[TEL PADRAO
CHAVE IBR]
[TEL PADRAO
CHAVE IBR]
[TEL PADRAO
CHAVE IBR]
[TEL PADRAO
CHAVE IBR]
[BANH BABY
PLASUTIL]
[SUPORTE
GALZERANO]
[BOLA VIN VOLLEY]
==>
==>
==>
==>
==>
==>
==>
==>
==>
==>
==>
==>
==>
==>
==>
[LIQ WAL
1(0,250KWH)]
[FERRO B&D
V1(1,20KWH]
[TEL PADRAO
CHAVE IBR]
[CJ MASSA ATHENAS
TRA]
[JARRA CISPER]
[FERRO B&D
V1(1,20KWH]
[TEL PADRAO
CHAVE IBR]
[EDUC EL PAU
CARIMBOS]
[LIQ WAL
1(0,350KWH)]
Tabela 8 - Resultados da anlise do cesto de compras por produto, abordados por cliente
93
Confidence
(%)
Type Rule
Support*
Confidence
Lift
Rule Body
0.0939
83.3300
0.0008
5.9200
Ferros de passar
==>
Telefonia
0.0752
100.0000
0.0008
32.2500
Liquidificadores +
Batedeiras
==>
Liquidificadores
0.0752
100.0000
0.0008
6.6400
Processadores +
Batedeiras
==>
Processadores
0.1691
39.1300
0.0007
2.6000
Videogames
==>
Ferros de passar
0.0752
66.6700
0.0005
4.7400
Panelas + Brinquedos
==>
Telefonia
0.0939
50.0000
0.0005
3.3200
Telefonia
==>
Liquidificadores
0.0564
75.0000
0.0004
==>
Mesas
0.0564
75.0000
0.0004
4.9800
Liquidificadores
==>
Ferros de passar
0.0564
60.0000
0.0003
4.2600
Ferros de passar +
Brinquedos
==>
Telefonia
0.0939
35.7100
0.0003
6.7900
Brinquedos
==>
Brinquedos
0.0564
50.0000
0.0003
5.0900
Ferros de passar
==>
Brinquedos
0.0752
28.5700
0.0002
5.4100
Telefonia +
Processadores
==>
Ferros de passar
0.0564
33.3300
0.0002
Banheiras
0.0564
33.3300
0.0002
3.0200
Brinquedos
Cadeira de beb
Rule Head
==>
Tabela 9 - Resultados da anlise do cesto de compras por linha de produto, abordados por cliente
94
95
4.3.
Para esta nova fase de testes, apenas os produtos pertencentes s linhas de produtos
aparentemente relacionadas listadas na Tabela 10 foram considerados. Todos os
registros dos demais produtos foram descartados.
A idia central por trs desta confirmao de resultados que separando-se os
produtos com alguma afinidade previamente selecionados, e conduzindo-se uma anlise do
cesto de compras apenas com tais produtos, a freqncia de observao das regras deve ser
aumentada, j que os demais produtos foram descartados do universo analisado. Assim,
aumenta-se o suporte das regras, e possvel notar com mais ateno os relacionamentos mais
recorrentes.
Todas as anlises anteriores foram repetidas: anlises orientadas por transao e por
cliente, com base nos produtos, linhas de produtos e setores, e nas taxonomias
correspondentes. Os resultados confirmaram a maior parte das regras levantadas
anteriormente, sendo que as seguintes linhas de produtos apresentam os relacionamentos mais
fortes:
Linhas de Produtos
Ventiladores
Processadores
Liquidificadores
Ferros de passar
Batedeiras
Videogames
Acessrios para videogames
Tapetes
Mesa
Criado mudo
Telefonia
Pratos
Panelas
Brinquedos diversos
previses, foi realizada uma inspeo visual na Figura 19, buscando por produtos que, apesar
de relacionados entre si, no formam um grupo coeso com a maioria dos produtos
relacionados.
A inspeo visual mostrou que as seguintes linhas de produtos esto conectadas,
formando um grupo coeso e conseqentemente um centro de interesse aparente:
Linhas de Produtos
Ventiladores
Processadores
Liquidificadores
Ferros de passar
Batedeiras
Telefonia
Panelas
Brinquedos diversos
Cdigo
204
212
217
219
237
1300
1443
1805, 1810, 1817,
1826, 1838
semana considerada. Por exemplo, foram tomadas as mdias dos preos praticados por
produto ao longo da semana, os juros mdios por produto foram calculados de acordo com as
prestaes da venda, e assim por diante. Um novo banco de dados foi ento formado, e seu
dicionrio consta do ANEXO C.
Em resumo, as variveis independentes disponveis pela EMPRESA eram:
Varivel
Semana
PrecoMedioSemanal
JurosMedioSemanal
Pprazo
Id_produto, Produto, Linha, Setor,
Id_marca
Classe, Classe_distribuicao
Comissao
Estoque, Estoque_dias,
Reposio_dias, Mostruario, Grade
Campanha, Camapanha_agressiva,
Veiculaes
Utilizao
Varivel de tempo, contabilizando as semanas seqencialmente. A
contagem inicia-se em 01/11/1998, considerada como semana 1. A
ltima semana, que se inicia no dia 26/05/2002, a semana 187.
Mdia de preo praticado por produto, durante a semana
correspondente.
Taxa de juros mdia praticada por produto, durante a semana
correspondente.
Porcentagem de vendas realizadas prazo na semana anterior.
Variveis de identificao do produto.
A EMPRESA adota duas classificaes distintas para um mesmo
produto: uma baseada no giro do produto, e outra baseada no tipo de
compra/distribuio a que ele est submetido. Ambas, entretanto,
identificam parmetros de alta, mdia ou baixa venda, venda sob
encomenda, venda sem mostrurio, venda direta do fornecedor, e
produto fora de linha.
Indica se o produto entra na comisso dos vendedores na semana
correspondente.
Representam a disponibilidade do produto, seja em estoque, em
mostrurio, ou em prazo de entrega/reposio.
Variveis que medem o esforo promocional efetuado na semana. Para
esforos corporativos, todos os produtos receberam o mesmo valor para
a varivel Campanha no perodo correspondente; as campanhas
agressivas focaram apenas alguns grupos de produtos; enquanto
Veiculacoes mede a exposio das campanhas na mdia.
Foram testadas variveis com lag de tempo para aquelas onde se
detectou correlaes horizontais.
99
1000
800
36
75
600
166
50
56
22
400
162
122
114
62
10
12
114
25
TOTAL7
200
34
69
80
181
1
6
166
54
3
80
14
10
176
7
8
69
80
166
44
59
122
3
8
1
103
80
114
58
0
64
102
79
62
132
26
7
23
60
7
79
19
14
112
63
7
2
114
9
6
4
148
8
80
2
7
70
7
79
150
170
21
184
84
80
62
122
118
24
22
58
20
152
71
6
8
27
183
60
174
70
131
37
46
149
25
164
0
1
64
88
62
45
15
78
73
21
54
72
67
47
16
38
24
74
52
61
167
163
89
79
153
12
6
165
102
82
25
143
44
83
101
26
7
114
59
91
100
11
65
157
158
9
57
5
8
36
17
28
22
103
184
68
81
32
171
168
9
3
42
115
93
19
27
35
172
66
112
60
97
88
37
84
98
2
7
1
71
181
116
38
124
23
183
53
14
33
43
39
120
47
3
125
4
34
31
118
62
59
18
29
49
99
51
179
170
90
58
132
166
92
82
111
144
50
46
114
57
113
161
176
101
26
45
85
2
5
08
03
5
7
98
115
40
44
89
67
121
103
122
102
56
65
41
69
75
27
106
48
109
186
148
87
8
10
83
134
169
1
124
184
174
11
12
157
80
116
182
1
3
84
61
183
25
171
86
127
39
73
81
177
163
26
76
62
54
63
49
36
58
55
53
50
51
52
48
62
64
57
56
60
37
47
59
69
66
61
65
41
44
39
66
68
42
74
84
40
43
5
8
83
45
41
48
75
67
46
11
78
72
22
23
9
7
25
93
27
15
82
73
85
36
0
6
38
84
87
80
10
92
27
52
135
28
183
131
8
132
164
163
153
12
80
58
161
14
88
63
122
174
6
7
13
11
81
19
148
3
184
175
1
1
170
171
160
8
4
54
174
168
92
114
9
11
54
2
118
145
162
9
66
48
56
7
80
33
30
141
150
35
179
36
60
135
127
112
29
169
144
134
159
173
34
152
146
142
158
98
87
166
65
119
151
37
50
8
60
8
7
112
8
62
49
59
60
1
8
49
12
60
112
164
6
7
49
0
164
4
60
102
9
6
8
0
49
153
59
112
5
164
60
102
50
154
9
1
8
64
49
58
102
60
112
50
5
8
101
164
9
1
7
49
154
163
64
12
58
111
50
112
59
8
6
102
164
54
53
4
1
7
60
101
49
154
9
12
5
165
0
152
110
8
105
174
51
12
80
92
5
50
63
27
112
8
101
59
153
7
58
164
122
1
6
154
113
165
60
102
111
163
62
0
64
13
55
01
02
83
10
9
175
4
48
103
57
170
49
104
61
162
9
65
63
54
14
16
127
93
155
64
174
19
65
25
98
142
82
70
90
105
47
56
181
69
179
89
117
17
109
152
37
13
15
110
72
38
18
185
8
1
53
12
11
11
100
33
173
73
75
71
171
125
87
88
92
145
55
120
147
28
66
116
178
180
123
160
24
144
8
165
6
134
36
164
102
154
111
153
132
136
67
81
40
41
23
20
51
168
118
184
186
176
177
84
135
5
60
58
59
157
101
7
1
2
112
54
53
163
50
62
113
5
0
2
39
02
-200
N=
4523
758
1001
6277
13
14
18
SETOR
Figura 20 Boxplot do total de vendas semanal por setor, indicando a presena de muitos outliers
A Figura 20, por exemplo, mostra o total de produtos vendidos numa mesma semana,
separados por setor. No eixo horizontal, v-se os quatro setores selecionados (setor 2, setor
13, setor 14 e setor 18), com o total de registros em cada setor. Como pode ser observado na
figura, no so evidenciados os quartis usuais do grfico boxplot; ao invs disso, o que se v
so muitos outliers (mostrados como nmeros correspondentes s semanas em que
ocorreram), e uma mdia de vendas semanal por produto prxima de zero.
Tambm foram traados grficos lineares de vendas semanais e mensais por linha e
setor. Os grficos mostraram que h forte sazonalidade, e os picos de vendas so muito
expressivos, conforme pode ser visto na Figura 21. A figura mostra as vendas mdias
semanais por setor da EMPRESA, cada setor representado por uma cor diferente. Como pode
ser visto em algumas semanas (como no fim do ano, nas semanas 49 a 52) ocorrem picos de
vendas acentuados em todos os setores, porm os picos diferem de um setor para o outro, o
mesmo se repetindo para as linhas de produtos analisadas.
100
7000
6000
5000
4000
SETOR
3000
Sum TOTAL7
2
2000
13
1000
14
18
1
7
4
13
10
16
19
25
22
31
28
37
34
40
43
49
46
52
Semana_ano
Figura 21 Mdias de vendas semanais por setor, indicando forte sazonalidade e picos de vendas
5.1.
Transformaes Realizadas
Vrios autores mostraram que os padres nos dados cuja distribuio difere muito da
Plotagem no tempo;
101
Todas
as
variveis,
com
exceo
de
JurosMedioSemanal,
apresentaram
Varivel
Estoque
Estoque_dias
Transformao
Z = log x
Reposicao_dias
Mostruario
Grade
Total7
PrecoMedioSemanal
Pprazo
JurosMedioSemanal
Nenhuma
Z = log x
Z = log x
Z = log x
Z = x0,2
Nenhuma
Nenhuma
Z=
1
x2
Nova varivel
Estoque_log
Estoque_dias-2
Testar original?
N
S
Mostruario_log
Grade_log
Vendas_log
Preco_pot
S
n
n
n
5.2.
Testes de Correlaes
Foram realizados testes de correlao entre todas as variveis independentes a serem
utilizadas, a fim de visualizar aquelas com maior impacto para a modelagem e estabelecer
uma linha mestra para a seleo das variveis a serem testadas nos modelos baseados em
redes neurais.
A matriz de correlao entre as variveis independentes mostrou forte relacionamento
entre:
102
Correlao Pearson
0,590
-0,459
0,556
Nvel significncia
0,01
0,01
0,01
Como as correlaes Pearson so altas (maiores que 0,4 em mdulo), nos modelos
criados foi tentada a retirada de uma das variveis relacionadas. Isso torna a modelagem mais
simples e com maior capacidade de extrapolao, e supe-se que no ocasione perda de
capacidade preditiva e (GROSS & PETERSON, 1983).
J as correlaes entre as variveis independentes e a varivel dependente (total de
vendas na semana) resultaram em apenas duas correlaes estatisticamente significativas:
Varivel independente
Estoque_log
Pprazo
5.3.
duas variveis. Entretanto, no basta analisar apenas as correlaes das variveis num dado
instante numa determinada semana, como o caso desta pesquisa. Uma varivel pode ter
impacto em outra apenas depois de determinado perodo de tempo, ou seja, sua mudana ou
ocorrncia pode afetar as vendas aps determinado perodo (lag) de tempo.
A fim de detectar possveis associaes com lag de tempo, faz-se necessrio o estudo
das autocorrelaes correlao da varivel dependente com ela mesma e das correlaes
com lag de tempo correlaes das variveis independentes com as vendas, sendo as
primeiras tomadas com lag de tempo.
As correlaes parciais com o total de vendas na semana foram computadas para todas
as variveis, sendo obtidos os seguintes resultados estatisticamente significativos:
103
Varivel
Grade
Estoque
PrecoMedio
JurosMedio
Vendas
Todos os modelos foram gerados com o uso do software de criao de redes neurais artificiais Megaputer
PolyAnalyst 4.5, que gera redes Perceptron multicamadas.
104
rede j treinada, pode-se utiliz-la para prever outros conjuntos de dados, verificando sua real
performance.
A primeira modelagem realizada foi dirigida somente avaliao das transformaes
utilizadas. Duas redes foram construdas, tomando como entrada as mesmas variveis, porm,
na primeira rede as entradas foram tomadas como variveis literais (sem transformao),
enquanto na segunda, elas foram transformadas como mostrado na Tabela 14. As redes foram
construdas utilizando-se todos os dados disponveis os softwares modernos de redes
neurais j separam os dados em grupos de treinamento e validao para previso com
prazo de uma semana.
Os resultados mostraram claramente os benefcios advindos das transformaes
aplicadas aos dados, como mostra a Tabela 18. A rede 1 sem transformaes obteve
Erro Quadrado Mdio (MSE) superior, e ajuste aos dados de treinamento sensivelmente
inferior rede 2 com todas as entradas numricas transformadas. Todos os modelos
gerados a partir de ento utilizaram como entradas as variveis transformadas.
Rede
Variveis de entrada
Varivel
Prevista
Ns
Camadas
R2
Venda7
0,2194 17,5000
0,6052 1,9306
MSE7
Tabela 18 Resultados das redes 1 e 2, comparando os efeitos das transformaes nos dados
6.1.
O erro MSE teve foi ajustado varivel original, para fins de comparao na mesma unidade de medida.
105
Rede
Variveis de entrada
Ns
Camadas
R2
MSE
0,6127 1,9187
106
de produtos), j que a diferena entre o previsto e o real foi tomada numa varivel
transformada (logartmica, no caso).
Alm das transformaes visando melhoria no comportamento das variveis de
entrada, alguns autores sugerem tambm o procedimento de padronizao das entradas
(WRAY et al., 1994), como forma de deixar todas as variveis numa mesma ordem de
grandeza, o que, dadas as caractersticas inerentes forma de treinamento e operao das
redes neurais, tende a melhorar seu desempenho. Outros dois modelos foram ento gerados,
para:
Varivel
Prevista
Ns
10
Camadas
R2
MSE
0,6176 1,9108
Tabela 20 - Resultados da rede neural 10, com as entradas numricas normalizadas e padronizadas
6.2.
No houve resultados positivos nos modelos gerados com o uso dos lags
cruzados. Eles foram ento descartados.
4. Incorporao de dados de promoo (esforo de marketing):
Varivel
Prevista
Rede
Variveis de entrada
Ns
26
Camadas
R2
MSE
0,6585 1,8441
Tabela 21 - Resultados da rede neural 26, com incorporao das vendas na semana anterior e missing
values preenchidos
6.3.
Diferena de preo entre o produto e a mdia de todo o centro de interesse (rede 87).
110
Idem, com preenchimento de missing values assumindo o ltimo valor existente (redes
106 a 141).
Os resultados mostraram uma grande melhora das redes ao se utilizar a informao de
total de vendas dos produtos substitutos (pertencentes a uma mesma linha de produtos, e,
portanto, produtos concorrentes diretos), ao mesmo tempo em que no houve melhoria
quando da utilizao dos preos mdios nem das diferenas de preos. A rede neural 108,
cujos resultados so mostrados a seguir, comprova que a incorporao de informaes a
respeito de produtos inter-relacionados pode trazer benefcios na previso de vendas com uso
de redes neurais artificiais.
Varivel
Prevista
Rede
Variveis de entrada
Ns
108
Camadas
R2
MSE
0,7164 1,7457
Tabela 22 - Resultados da rede neural 108, com incorporao do total de vendas de produtos
substitutos (missing values preenchidos)
6.4.
neurais artificiais at o momento (rede 108), no conjunto de dados disponvel, foi aquele
obtido com:
111
Redes
1~4
Testes realizados
Comparao entre entradas transformadas
e no transformadas
Teste de retirada de variveis
correlacionadas
Comparao entre entradas padronizadas
e no padronizadas
Incorporao de novas variveis para
representar: sazonalidade,
autocorrelaes das vendas, correlaes
com lags de tempo, dados promocionais
Incorporao de informaes agregadas
sobre o centro de interesse
5~9
10 ~ 11
12 ~ 78
79 ~ 141
Melhor rede
2 Todas as entradas
transformadas
6 Retirada isolada da
varivel Grade
10 Entradas numricas
padronizadas entre 0 e 1
26 Incorporao das vendas
na semana anterior
(autocorrelao com lag de 1
semana)
108 Incorporao do total de
vendas de produtos substitutos
(missing values preenchidos)
1,7457
O Modelo 108 foi tomado ento como referncia, para medio de capacidade
preditiva frente a dados desconhecidos e frente a outras modelagens. A fim de se avaliar a
capacidade preditiva do modelo baseado em redes neurais, o conjunto de dados foi dividido
em dois grupos:
1. Grupo de criao do modelo, constitudo internamente por registros de
treinamento e validao (automaticamente separados pelo software de
minerao de dados). Para criao do modelo, foram utilizados os registros de
Novembro de 1998 a Maio de 2001, num total de 135 semanas consecutivas,
sempre prevendo para uma semana frente.
2. Grupo de avaliao externo, simulando a utilizao real do modelo de previso
em dados desconhecidos, nunca apresentados rede neural. Os registros
subseqentes semana 135 (Maio de 2001 a Junho de 2002), totalizando 3140
casos, foram usados para pr prova a capacidade preditiva do modelo gerado.
Aps a criao da rede com o conjunto de dados reduzidos, a mesma foi testada frente
aos registros desconhecidos, e os resultados obtidos foram transformados de volta unidade
de medida original, com a retirada da padronizao, normalizao e funo logartma,
alcanando assim a previso de quantos produtos sero vendidos, semana a semana, por SKU.
Os resultados geraram uma nova medida de erro, uma vez que agora esto tomados por
unidades de produtos vendidos.
Modelo
Rede 108
Rede 108
Dados
Dados de criao (at semana 135)
Dados de validao (a partir da semana 136)
MSE
55,84
108,12
RMSE
10,33
10,40
MAPE
31,61%
41,21%
112
De acordo com a Tabela 24, o modelo baseado em redes neurais erra em sua previso
de vendas, em mdia, um total de 10,4 unidades de produto para previso de uma semana
frente, o que corresponde a um erro mdio percentual de 41,21%.
Se a modelagem for eficiente (capaz de aprender com os erros do passado), no deve
haver correlao em srie entre os erros de um perodo para outro (PUTSIS, 1998). Os testes
de autocorrelao e autocorrelao parcial no mostraram autocorrelao nos erros, indicando
que o modelo eficiente. Se a modelagem for no-enviesada, haver um padro consistente
de erros para mais e para menos, e conseqentemente a distribuio dos erros deve ter uma
forma prxima da normal (LAWRENCE et al., 2000). O modelo gerado parece tambm
respeitar esta premissa, como pode ser visto na Figura 22.
A Figura 23 mostra a performance da Rede 108 ao tentar prever as vendas das
semanas posteriores 135, que no foram utilizadas para treinamento da rede.
800
600
400
200
Std. Dev = .13
Mean = -.02
N = 3141.00
.6
.5
.4
.3
.2
.1
.0
0
0
-.1
-.2
-.3
-.4
-.5
ERRO
Figura 22 Histograma da disperso dos erros, na escala da varivel prevista
113
70
Previsto = real
60
Previso
50
40
30
20
10
0
0
10
20
30
40
50
60
70
Venda real
7.1.
conhecido como sendo a previso para o prximo perodo, sem considerar a sazonalidade da
varivel dependente. A comparao com a previso naive uma referncia comum
encontrada na literatura a fim de medir o ganho de performance ao se adotar modelagens mais
sofisticadas (LAWRENCE et al., 2000). tambm importante j que o mtodo de previso
atualmente utilizado na EMPRESA onde os dados foram tomados.
Observou-se que a modelagem baseada em redes neurais artificiais obteve
desempenho cerca de 54% superior previso naive, tomando-se por base a raiz do erro
quadrado mdio (RMSE), e 64% superior se for considerado o erro mdio percentual
(MAPE), ponderando os resultados para os dados de validao.
114
Modelo
Naive
Naive
Dados
Dados de criao (at semana 135)
Dados de validao (a partir da semana 136)
MSE
133,98
506.44
RMSE
11,58
22,50
MAPE
126,24%
116.09%
7.2.
isso tambm uma boa referncia comparativa para avaliao do desempenho das redes
neurais na previso de vendas atomizada. Para esta regresso, foram utilizadas as mesmas
variveis do Modelo 108, que obteve a melhor capacidade preditiva dentre aqueles testados. O
procedimento de tratamento e separao tambm seguiu aquele do Modelo 108, com a
utilizao de dados normalizados e padronizados, e separao em dois grupos de dados: dados
de criao at a semana 135 e avaliao do desempenho com dados da semana 136 semana
187.
O software utilizado para a regresso8 gera, a partir da matriz de correlaes, vrias
equaes de regresso, utilizando como variveis independentes apenas aquelas com maior
impacto no modelo, selecionadas atravs do mtodo stepwise. Foi gerado um total de 5
equaes de regresso vlidas, mostradas abaixo:
Equao
1
2
3
4
5
Variveis Independentes
Vendas da linha de produtos
Vendas da linha de produtos, porcentagem de vendas a prazo
Vendas da linha de produtos, porcentagem de vendas a prazo, Vendas no perodo anterior
Vendas da linha de produtos, porcentagem de vendas a prazo, Vendas no perodo anterior, Estoque
Vendas da linha de produtos, porcentagem de vendas a prazo, Vendas no perodo anterior, Estoque,
Prazo de reposio
MSE
283,65
271,26
264,58
248,29
189,03
RMSE
16,84
16,47
16,27
15,76
13,75
MAPE
79,52%
58,05%
51,97%
50,15%
49,10%
115
7.3.
tcnicas de previso naive e regresso linear, mostrando que as redes neurais obtiveram erros
menores que as demais modelagens, seja qual for a medida de erro adotada.
Tcnica de Previso
Naive no ajustada
Regresso linear equao 5
Redes neurais rede 108
MSE
506.44
189,03
108,12
RMSE
22,50
13,75
10,40
MAPE
116.09 %
49,10 %
41,21 %
116
CAPTULO V - CONCLUSES
1. Resultados Alcanados
Este trabalho investigou acerca da possibilidade de utilizao de redes neurais
artificiais para previso de vendas de produtos no nvel atomizado. O objetivo geral foi o
estabelecimento de uma metodologia capaz de identificar padres de relacionamento teis na
previso de vendas individual no varejo. Tais relacionamentos, uma vez assimilados por um
modelo de previso causal, permitem ao gestor a identificao do composto de marketing
adequado (preo, produtos e promoo), atravs da visualizao do impacto nas vendas a
partir de simulaes de mudanas no composto de marketing.
Durante o trabalho de reviso bibliogrfica, observou-se que muitos autores j
estudaram a previso de demanda agregada para toda corporao utilizando diversas
tcnicas de previso e modelagem de dados, e prevendo em diferentes horizontes de tempo
(TANG et al., 1991; LUXHOJ et al., 1996; ANSUJ et al., 1996; KUO & XUE, 1998;
SPEDDING & CHAN, 2000, entre outros). Tais estudos mostraram que a previso
quantitativa pode ser bem sucedida tanto numa abordagem de sries temporais quando a
nica entrada a prpria informao da venda, em diferentes lags de tempo quanto numa
abordagem causal quando variveis explicativas da demanda so usadas como entrada. As
previses so usualmente consideradas como bem sucedidas quando oferecem melhoria
considervel se comparadas com a previso naive, que considera que as vendas no prximo
perodo sero iguais quelas verificadas no perodo anterior.
Alguns autores tambm j investigaram a previso de demanda no nvel individual de
produtos, porm tais estudos voltaram-se modelagem das vendas de apenas um produto, seja
numa abordagem de sries de tempo (BARASH & MITCHELL, 1998; GORDON, 1998;
ALIBAIG & LILLY, 1999) ou causal (MENTZER & KENT, 1999; SUBRAHMANYAN,
2000). Sendo assim, tais modelos so incapazes de detectar os relacionamentos entre os
produtos, os quais mostraram-se importantes nos estudos (no voltados previso) de BENAKIVA & GERSHENFELD (1998) e GUADAGNI & LITTLE (1998).
Os trabalhos citados ajudaram no delineamento da presente pesquisa, mostrando que
havia uma lacuna para o desenvolvimento de uma previso de vendas no nvel individual que
levasse em conta o relacionamento entre diversos produtos. Duas tcnicas foram selecionadas
117
118
121
Referncias Bibliogrficas
ACZEL, Amir D., 1993. Complete Business Statistics. Irwin Homewood, IL, 2a. ed.
ALIBAIG, Shahbaz; LILLY, Bryan, 1999. Updating your forecasting system: Wisconsin
tissue's experience. The Journal of Business Forecasting Methods & Systems, Fall, v. 18, n.
3, pgs. 13-18.
ALMEIDA, Fernando Carvalho de, 1993. L'Evaluation des risques de dfaillance des
enterprises partir des rseaux de neurones insrs dans les systmes d'aide la
dcision. Tese de doutorado apresentada Universit Pierre Mends France de Grenoble,
Ecole Suprieure des Affaires.
ALMEIDA, Fernando Carvalho de, 1995. Desvendando o uso de redes neurais em
problemas de Administrao de Empresas. Revista Administrao de Empresas, v.35, n.1,
Jan-Fev, pgs 40-55, So Paulo.
ALMEIDA, Fernando Carvalho de; SIQUEIRA, Jos de Oliveira, 1996. Comparao entre
regresso logstica e redes neurais na previso de falncia de bancos brasileiros. Jornadas
de Classificao e Anlise de Dados, n. 4, pgs. 1-10, Lisboa.
ANSUJ, A. P.; CAMARGO, M.E.; RADHARAMANAN, R.; PETRY, D.G., 1996. Sales
forecasting using time series and neural networks. Computers and Industrial Engineering,
Elsevier Science Ltda., v. 31, n. 1/2, pgs. 421-425.
BAETS, Walter R.J.; VENUGOPAL, V., 1994. Neural Networks and Statistical
Techniques in Marketing Research: A Conceptual Comparison. Marketing Intelligence &
Planning, MCb University Press, v. 12, n. 7, pgs. 30-38.
BARASH, Mark; MITCHELL, Donald H., 1998. Account based forecasting at Nabisco
biscuit company. Journal of Business Forecasting, n. 31, Summer.
BASS, Frank M., 1969. A New Product Growth Model for Consumer Durables.
Management Science, n. 15, Janeiro, pgs. 215-227.
BEN-AKIVA, M.; GERSHENFELD, Shari, 1998. Multi-featured Products and Services:
Analysing Princing and Bundling Strategies. Jounal of Forecasting, John Wiley & Sons, n.
17, pgs. 175-196.
BERRY, Michael J. A.; LINOFF, Gordon, 1997. Data Mining Techniques for Marketing,
Sales and Customer Support. John Wiley & Sons, Inc., 1a. ed.
BIDARKOTA, P. V., 1998. The comparative forecast performance of univariate and
multivariate models: an application to real interest rate forecasting. International Journal
of Forecasting, Elsevier Science B.V., n. 14, pgs. 457468.
BOX, G. E. P.; JENKINS, G. M. Time-Series Analysis, Forecasting and Control. Ed. San
Francisco: Holden-Day, 1976.
BRENTNALL, G. J.; PICKSLEY, J. D, 1999. Bayesian modeling enhances supply chain
forecasting and planning. The Journal of Business Forecasting Methods & Systems, Fall, v.
18, n. 3, pgs. 19-23.
BROWN, R. Goodell, 1959. Statistical Forecasting for Inventory Control. The Maple
Press Company, New York, 1a. ed.
BROWN, R. Goodell, 1963. Smoothing, forecasting and prediction of discrete time series.
Prentice-Hall, Englewood Cliffs, N.J.
122
CERULLO, M.J.; AVILA, A., 1975. Sales Forecasting Practices: a survey. Managerial
Planning, n. 24, pgs. 33-39.
CHAKRABORTY, K.; MEHROTRA, K; MOHAN, C. K, 1992. Forecasting the behaviour
of multivariate time series using neural networks. Neural Networks, v. 5, n. 6, pgs. 961970.
CHANG, P.T., 1997. Fuzzy seasonality forecasting. Fuzzy Sets and Systems, Elsevier
Science B.V., n. 90, pgs. 1-10.
CHASE, Charles W. Jr., 1996. What you need to know when building a sales forecasting
system. The Journal of Business Forecasting Methods & Systems, Fall, v. 15, n. 3, pgs. 2-23.
CHASE, Charles W. Jr., 1999. Sales forecasting at the dawn of the new millennium. The
Journal of Business Forecasting Methods & Systems, Fall, v. 18, n. 3, pgs. 2-5.
CHURCH, Keith B.; CURRAM, Stephen, 1996. Forecasting consumer's expenditure: A
comparison between econometric and neural network models. International Journal of
Forecasting, Elsevier Science B. V. n. 12, pgs. 255-267.
CURLEY, M. Louise; SILK, Leonard S., 1970. A primer on business forecasting, with a
guide to sources of business data. Random House, New York, 1a. ed.
DAGANZO Carlos, 1979. Multinomial probit: The Theory and its Application to
Demand Forecasting. Academic Press, New York, 1a. ed.
DE VILLE, Barry, 1996. Predictive Models in Market Research. Marketing Research, v. 8,
n. 2, pgs. 43-45.
DIAS, George P. P., 2002. Proposta De Processo De Previso De Vendas Para Bens De
Consumo. Dissertao de Mestrado apresentada Escola Politcnica da Universidade de So
Paulo.
DOYLE, A. Conan, 2002. The Adventure of the Dancing Men. In: The Return of Sherlock
Holmes,
ed.
IndyPublish.com.
Disponvel
em
<http://www.bakerstreet221b.de/canon/danc.htm>. Publicado pela primeira vez na Colliers
Weekly, Dez. 1903.
DRURY, D. H., 1990. Issues in forecasting management. Management International
Review, v. 30, pgs. 317-329.
DUTTA, Siddhartha; AMARAVADI, Chandra S; SAMADDAR, Subhashish, 1995.
Intelligent marketing information systems: computerized intelligence for marketing
decision making. Marketing Intelligence & Planning, University Press Limited; v. 13, n. 2,
pgs. 4-13.
ENGEL, J. F.; BLACKWELL, R. D.; MINIARD, P. W., 1993. Consumer behavior. Ed.
Dryden Press, Hinsdale.
FEELDERS, A.; DANIELS, H.; HOLSHEIMER, M., 2000. Methodological and practical
aspects of data mining. Information and Management, Elsevier Science B. V., n. 37, pgs.
271-281.
FILDES, Robert; BOTTOMLEY, Paul A., 1998. The Role of Prices in Models of
Innovation Diffusion. Journal of Forecasting, John Wiley & Sons, n. 17, pgs. 539-555.
FILDES, Roberts; Hastings, R., 1994. The organization and improvement of market
forecasting. Journal of Operational Research Society, v. 45, pgs. 1-16.
123
FOURT, L. A.; WOODLOCK, J. W., 1960. Early prediction of market sucess of grocery
products. Journal of Marketing, n. 25, Outubro, pgs. 31-38.
GARGANO, Michael L.; RAGGAD, Bel G., 1999. Data mining - a powerful information
creating tool. OCLC Systems and Services, MCB University Press, v. 15, n. 2, pgs. 81-90.
GAYLE, Sanfort, 2003. The Marriage of Market Basket Analysis to Predictive Modeling.
SAS Institute White Paper, SAS Institute Inc. Disponvel em <http://www.sas.com.br>.
Acessado em Janeiro de 2003.
GEURTS, Michael D.; WHITLARK, David, 1996. Improving sales forecasts by improving
the input data. The Journal of Business Forecasting Methods & Systems, Fall, v. 15, n. 3.
15-18.
GORDON, Rich, 1998. A role for the forecasting function. The Journal of Business
Forecasting Methods & Systems, Winter, v. 16, n. 4, pgs. 3-7.
GRAY, Paul, 1997. Data Warehouses, OLAP, Data Mining, and the New DSS. Claremont
Graduate University Program in information Science, ISDSS'97, pgs. 7-24.
GROSS, Charles W.; PETERSON, Robin T., 1983. Business forecasting. Houghton Mifflin
Co., Boston, 2a. ed.
GUADAGNI, P. M.; LITTLE, J. D. C., 1998. When and What to Buy: a Nested Logit
Model of Coffee Purchase. Journal of Forecasting, John Wiley & Sons, v. 17.
HAND, D. J., 1998. Data Mining: Statistics and More? The American Statistician, Maio,
v.52, n.2, pgs. 112-118.
HANKE, John E.; REITSCH, Arthur G, 1995. Business Forecasting. Ed. Prentice Hall,
Englewood Cliffs, NJ, 5a. ed.
HANSSENS, D. M.; PARSONS, J. L.; SCHULTZ, R. L., 1990. Market Response Models:
Econometric and Time Series Analysis. Ed. Kluwer, Boston.
HARDIE, Bruce G. S.; FADER, Peter S.; WISNIEWSKI, Michael, 1998. An Empirical
Comparison of New Product Trial Forecasting Methods. Journal of Forecasting, John
Wiley & Sons, London, n. 17, pgs. 209-229.
HEELER, R. M.; HUSTAD, T. P., 1980. Problems in predicting new products growth for
consumer durables. Management Science, n. 26, Outubro, pgs. 1007-1020.
HIBBERT, Brynn; WILKINSON, Ian F., 1994. Chaos Theory and the Dynamics of
Marketing Systems. Journal of Academy of Marketing Science, Academy of Marketing
Science, v. 22, n. 3, pgs. 218-233.
HUSSEY, Michael; HOOLEY, Graham, 1995. The diffusion of quantitative methods into
marketing management. Journal of Marketing Practice: Applied Marketing Science, MCB
University Press, v. 1, n. 4, pgs. 13-31.
IMMON, W. H., 1997. Como construir o Data Warehouse. Campinas.
KIRK, Jerome; MILLER, Marc L, 1988. Reliability and Validity in Qualitative Research.
Sage University Paper Series on Qualitative Research Methods, v. 1, Sage Publications,
California.
124
MENTZER, J. T.; COX Jr., J. E., 1984. Familiarity, application and performance of Sales
forecasting techniques. Journal of Forecasting, n. 3, pgs. 27-36.
MENTZER, John T., 1999. The impact of forecasting on return on shareholders's value.
The Journal of Business Forecasting Methods & Systems, Fall, v. 18, n. 3, pgs. 8-12.
MENTZER, John T.; KENT, John L., 1999. Forecasting demand in the Longaberger
Company. Marketing Management, Summer, v. 8, n. 2, pgs. 46-50, Chicago.
MOON, Mark A.; MENTZER, John T., 1999. Improving salesforce forecasting. The
Journal of Business Forecasting Methods & Systems, Summer, v. 18, n. 2, pgs. 7-12.
NAYLOR, T.H., 1981. Experience with corporate econometric models: a survey. Business
Economics, n. 16, pgs. 79-83.
NELSON, M.; O'CONNOR, M.; HILL, T.; REMUS, B., 1994. Can neural networks be
applied to time series forecasting and learn seasonal patterns: An empirical
investigation. Proceedings of the Twenty seventh Annual Hawaii International Conference on
System Sciences, pgs. 649-655.
NEWBOLD, Paul, 1995. Statistics for Business & Economics. Prentice-Hall, Inc.
Englewood Cliffs, N.J., 4a. ed.
PAN, J.; NICHOLS, D. R.; JOY, O., 1977. Sales Forecasting Practices of Large U.S.
industrial firms. Financial Management, n. 6, pgs. 72-77.
PARENTE, Juracy, 1997. Gerenciamento de categorias. Revista SuperHiper, pgs. 230-234,
Abril.
PARENTE, Juracy, 2000. Varejo no Brasil: Gesto e Estratgia. Ed. Atlas, So Paulo.
PARK, J.; SANDBERG, I. W., 1991. Universal approximation using radial basis function
networks. Neural Computation, v. 3, pgs. 246-257.
PEACOCK, Peter R., 1998a. Data Mining in Marketing: Part 1 The revolution is upon
us, so choose your weapons carefully. Marketing Management, Winter, pgs. 9-18.
PEACOCK, Peter R., 1998b. Data Mining in Marketing: Part 2 Dig deep to unearth
knowledge inherent in databases. Marketing Management, Spring, pgs. 15-25.
PETERSON, R.T., 1993. Forecasting practices in retail industry. Journal of Business
Forecasting, n. 12, pgs. 11-14.
PETERSON, Robin T.; JUN, Minjoon, 1999. Forecasting sales in wholesale industry. The
Journal of Business Forecasting Methods & Systems, Summer, v. 18, n. 2, pgs. 15-18.
PETRON, E., 1999. Stuttgart Neural Network Simulator. Linux Journal, Julho, pgs. 4448.
PIDD, Michael, 1998. Modelagem Empresarial: ferramentas para Tomada de Deciso.
Ed. Bookman, Porto Alegre, RS.
POWERS, Anthony, 1988. Using Discrete Choice Models with Experimental Design Data
to Forecast Consumer Demand for a Unique Cultural Event. The Journal of Consumer
Research, v. 10, Dezembro, pgs. 6-9.
PUTSIS Jr., Willian P., 1998. Parameter Variation and New Product Diffusion. Journal of
Forecasting, John Wiley & Sons, n. 17, pgs. 231-257.
ROBERTS, John, 1998. Marketing Approaches to Forecasting Problems. Journal of
Forecasting, John Wiley & Sons, n. 17, pgs.169-174.
126
ROSATI, Anna Maria, 1996. Forecasting at Segix, Italia: A pharmaceutical company. The
Journal of Business Forecasting Methods & Systems, Fall, v. 15, n. 3, pgs. 7-9.
SAKAI, Hidekata; NAKAJIMA, Hideki; YASUDA, Masashi; HIGASHIHARA, Minoru;
OOSUMI, Masato, 1999. Development of a fuzzy sales forecasting system for vending
machines. Computers & Industrial Engineering, Elsevier Science Ltda., n. 36, pgs. 427-449.
SANDERS, N. R., 1992. Corporate forecasting practices in the manufacturing industry.
Production and Inventory Management, n. 33, pgs. 54-57.
SANDERS, N. R.; MANRODT, K., 1994. Forecasting practices in US corporations:
survey results. Interfaces, v. 24, pgs. 92-100.
SAS, 1996. Data Mining with the SAS System: From Data to Business Advantage. SAS
Institute White Paper, SAS Institute Inc. Disponvel em <http://www.sas.com.br>. Acessado
em Janeiro de 2001.
SAS, 1998. Finfing the Solution to Data Mining. SAS Institute White Paper, SAS Institute
Inc. Disponvel em <http://www.sas.com.br>. Acessado em Janeiro de 2001.
SPEDDING, T. A.; CHAN, K. K., 2000. Forecasting demand and inventory management
using Bayesian time series. Integrated Manufacturing Systems, MCB University Press, v. 11,
n. 5, pgs. 331-339.
SPSS, 1999. Data Mining with Confidence. Disponvel em <http://www.spss.com>.
Acessado em Fevereiro de 2001.
SUBRAHMANYAN, Saroja, 1998 An exploratory empirical study on how pricing and
inventory decisions are made in a simulated environment. Research paper Series, Faculty
of Business Administration, National University of Singapure, Maio, RPS, pgs. 98-123.
SUBRAHMANYAN, Saroja, 2000. Using quantitative models for setting retail prices.
Journal of Product and Brand Management, MCB University Press, v. 9, n. 5, pgs. 304-320.
TAMASCHKE, Rick; BUTTERY, Alan, 1995. Marketing decision support systems in a
small trading nation: an Australian case study. Marketing Intelligence & Planning, MCB
University Press Limited, v. 13, n. 2, pgs. 14-28.
TANG, Z.; Almeida, C.; FISHWICK, P. A, 1991. Time series forecasting using neural
networks vs. Box-Jenkins methodology. Simulation Council, v. 57, n. 5, pgs. 303-310.
THALL, N., 1992. Neural Forecasts: A Retail Sales Booster. Discount Merchandiser, v. 32,
n. 10, pgs. 41-42.
TUKEY, J. W.; HOAGLIN, D. C.; MOSTELLER, F., 1983. Anlise exploratria de dados:
tcnicas robustas. Ed. Salamandra, Lisboa.
VOLKERT, J.; ESPAHBODI, P.; ESPAHBODI, H., 1995. Early Identification of Firms
Requiring Debt Restructuring. The Journal of Business Forecasting, Fall, v. 14, n.3.
WHEELRIGHT, Steven C.; CLARKE, D. G., 1976. Corporate forecasting: promise and
reality. Harvard Business Review, v. 54, pgs. 40-64.
WHITE, H. R., 1986. Sales Forecasting: timesaving and profitmaking strategies that
work. Scott, Foresman and Company, London.
WILSON, M.; DAUBECK, H. G., 1989. Marketing managers evaluate forecasting
models. Journal of Business Forecasting, n. 8, pgs. 19-22.
127
128
129
Tipo
SMALLINT
INTEGER
DATE
DECIMAL
DECIMAL
SMALLINT
DECIMAL
INTEGER
NF_NUMERO
NF_SERIE
INTEGER
CHARACTER
Descrio
Identificador da filial que registrou a venda.
Nmero do carto do cliente que realizou a compra.
Data da compra.
Valor dado como entrada ( vista) para a compra.
Valor total da compra, em reais.
Quantidade de prestaes da compra.
Valor de cada prestao.
Identificador do credirio realizado, serve para identificar a
compra.
Nmero da nota fiscal de venda.
Srie da nota fiscal de venda.
Estoque
Contm snapshots das posies de estoque das filiais. Serve para saber quando um
produto no estava disponvel para venda numa data especfica por falta de estoque.
Nome
FILIAL
SETOR
LINHA
PRODUTO
QUANTIDADE
DATA_BASE
MOSTRUARIO
GRADE
Tipo
SMALLINT
SMALLINT
SMALLINT
INTEGER
INTEGER
DATE
SMALLINT
SMALLINT
VENDA_FIS_ULT_07
VENDA_FIS_ULT_30
SMALLINT
SMALLINT
Descrio
Identificador da filial que registrou a venda.
Identificador do setor relacionado ao produto.
Identificador da linha relacionada ao produto.
Identificador do produto.
Quantidade em estoque na filial.
Data da posio de estoque.
Quantidade de itens do produto em mostrurio.
Quantidade de itens do produto especificada para ser mantida
na filial.
Unidades vendidas do produto nos ltimos 7 dias.
Unidades vendidas do produto nos ltimos 30 dias.
Linhas
Cadastra as linhas de produtos comercializadas por toda a rede.
Nome
SETOR
LINHA
DESCRICAO
CONTAGEM
Tipo
SMALLINT
INTEGER
CHARACTER
INTEGER
Descrio
Identificador do setor relacionado linha de produtos.
Identificador da linha de produtos.
Descrio da linha de produtos.
Nmero de produtos comercializados dentro da linha
especfica, em junho de 2002.
130
LinhasXLoja
Cadastra as linhas de produtos comercializadas em cada loja.
Nome
FILIAL
LINHA
Tipo
SMALLINT
INTEGER
Descrio
Identificador da filial.
Identificador da linha de produto que a loja comercializa.
Lojas
Cadastro das lojas ativas em Junho de 2002.
Nome
FILIAL
REGIO
DESCRIO
AREA
TIPO
Tipo
SMALLINT
SMALLINT
CHARACTER
INTEGER
CHARACTER
DEPOSITO
CL
SMALLINT
CHARACTER
VEND
SMALLINT
Descrio
Identificador da filial.
Identificador do regio relacionada filial.
Nome e identificao da filial.
rea ocupada pela filial, em metros quadrados.
Tipo de filial. Pode assumir os seguintes valores: C
loja convencional, e E loja eletrnica.
Identificador do depsito que atende a loja.
Classe de loja. Pode assumir os seguintes valores: C
loja convencional, E loja eletrnica, e S loja
de shopping.
Nmero de vendedores da filial.
Prod_mov
Contm todas as vendas efetuadas nas filiais selecionadas.
Nome
PRODUTO
FILIAL
Tipo
INTEGER
SMALLINT
MOVIMENTO_DATA
DOCUMENTO
NOTA_FISCAL_SERIE
MOVIMENTO_QTD
DOCUMENTO_TIPO
DATE
INTEGER
SMALLINT
SMALLINT
SMALLINT
PRECO
CUSTO_TECNICO
CUSTO_GERENCIAL
VENDEDOR_NUMERO
DECIMAL
DECIMAL
DECIMAL
INTEGER
CARTAO
NOTA_FISCAL
ICMS
ENTRA_MARGEM
INTEGER
INTEGER
DECIMAL
CHARACTER
PRODUTO_VALIDADE
DATE
Descrio
Identificador do produto vendido.
Identificador da loja onde foi efetuada a
venda.
Data da venda.
Nmero do documento apresentado.
Srie da nota fiscal de venda.
Unidades vendidas do produto.
Mostra se foi venda vista ou a prazo. Pode
assumir os seguintes valores: 16 venda a
vista; e 12 venda a prazo.
Preo unitrio do produto vendido.
Custo tcnico considerado para o produto.
Custo gerencial considerado para o produto.
Identificador do vendedor que realizou a
venda.
Nmero do carto que identifica o cliente.
Nmero da nota fiscal.
Valor do ICMS cobrado.
Identifica se o produto entra nas comisses
do vendedor. Pode assumir os seguintes
valores: S SIM; N NO; e B
brinde/bonificao (indireta).
Data de validade do produto.
131
SETOR
LINHA
SLIP
SMALLINT
SMALLINT
INTEGER
SLIP_SERIE
CHARACTER
Produtos
Cadastro de todos os produtos comercializados.
Nome
PRODUTO
FORNECEDOR
DESCRICAO
CLASSE
Tipo
INTEGER
INTEGER
CHARACTER
CHARACTER
ESTOQUE
INTEGER
REPOSICAO
INTEGER
MOSTRUARIO
INTEGER
FANTASIA
CLAS_DISTRIBUICAO
CHARACTER
CHARACTER
SETOR
LINHA
INTEGER
INTEGER
Descrio
Identificador do produto.
Identificador do fornecedor do produto.
Descrio abreviada do produto.
Classificao do produto. Pode assumir os
seguintes valores: 0, A, B, D, E, F, J, L, M, S,
W.
Estoque planejado (ideal) do produto, em
dias.
Quantidade de reposio planejada (ideal) do
produto (mnimo de compra), em dias.
Nmero total de produtos em mostrurio na
rede.
Nome fantasia do fornecedor do produto.
Classificao do produto. Pode assumir os
seguintes valores: ?, A, B, C, E, F, G, M, S,
W.
Identificador do setor relacionado ao produto
Identificador da linha relacionada ao produto
132
Tipo
INT
NVARCHAR (50)
SMALLINT
Setor
Linha
Id_marca
Classe
SMALLINT
SMALLINT
SMALLINT
Classe_distribuicao
SMALLINT
Estoque
INTEGER
Estoque_dias
Reposicao_dias
INTEGER
INTEGER
Mostruario
Grade
INTEGER
INTEGER
Total7
Semana
INTEGER
INTEGER
PrecoMedioSemanal
REAL
JurosMedioSemanal
REAL
Pprazo
REAL
Descrio
Identificador do produto vendido.
Descrio do produto vendido.
Identifica se o produto entra nas comisses do vendedor.
Pode assumir os seguintes valores: 0 vendedor no
recebe comisso sobre o produto; 1 vendedor recebe
comisso sobre a venda; e 2 vendedor recebe
brinde/bonificao (comisso indireta).
Identificador do setor relacionado ao produto.
Identificador da linha relacionada ao produto.
Identificador do fornecedor do produto.
Classificao do produto. Pode assumir os seguintes
valores: 0 (0 missing?), 1 (A), 2 (B), 3 (D), 4 (E), 5 (F), 6
(J), 7 (L), 8 (M), 9 (S), 10 (W).
Classificao do produto segundo o critrio de distribuio.
Pode assumir os seguintes valores: 0 (missing), 1 (A), 2
(B), 3 (C), 4 (E), 5 (F), 6 (G), 7 (S), 8 (W).
Quantidade em estoque na loja, tomada a data do incio do
ms.
Estoque planejado (ideal) do produto, em dias.
Quantidade de reposio planejada (ideal) do produto
(mnimo de compra), em dias.
Quantidade de itens do produto em mostrurio.
Quantidade de itens do produto especificada para ser
mantida na filial.
Unidades vendidas do produto na semana.
Identificao da semana correspondente. Assume valores de
1 (semana de 01/11/1998) a 187 (semana de 27/05/2002).
Mdia de preo praticado nas vendas do produto durante a
semana correspondente.
Mdia de taxa de juros composto praticado nas vendas a
prazo do produto na semana correspondente.
Porcentagem das vendas que foram realizadas a prazo na
semana anterior.
133
3000
2000
1000
Std. Dev = 22,08
Mean = 12,9
N = 4366,00
0
5,
470,0
455,0
420,0
405,0
370,0
355,0
320,0
305,0
270,0
255,0
220,0
205,0
170,0
155,0
120,0
10,0
75,0
50,0
250
0,
ESTOQUE
134
600
500
738
755
756
757
400
300
5535
5536
5537
5538
5539
200
ESTOQUE
100
683
680
681
682
679
483
484
675
676
677
678
672
673
674
750
751
752
753
754
3762
3763
3764
3765
3766
3767
1350
1351
1352
1353
1354
1356
1341
1342
1343
1344
1345
1346
1347
1348
1349
1391
1392
1393
1394
2278
2299
2390
2391
2392
2393
2394
2395
2396
2397
2767
2768
2769
2770
2386
2387
2388
2389
2381
2382
2383
2384
2385
2511
2512
2513
2514
3758
3759
3760
3761
3437
3438
3439
3440
3441
3442
4013
4014
4015
4016
4017
3414
3411
3412
3413
3809
3867
3868
3913
3914
4271
4269
4270
4266
4267
4268
4261
4262
4263
4264
4265
5541
5531
5532
5533
5534
5530
5583
5584
5585
5586
5578
5579
5580
5581
5582
5573
5574
5575
5576
5577
5567
5568
5569
5570
5571
5572
5562
5563
5564
5565
5566
5557
5558
5559
5560
5561
5552
5553
5554
5555
5556
5547
5548
5549
5550
5551
7429
7430
7426
7427
7428
6816
6814
6815
7765
7766
7767
7768
7574
7575
7576
7577
7726
7727
7728
7729
8435
6855
6856
7849
7850
7851
8459
8460
6852
6853
6854
6727
6728
7272
7273
7274
7275
6725
6726
7848
6562
6563
6564
6569
6570
8432
8433
8434
7268
7269
7270
7271
8186
8187
10138
10139
10140
10653
10649
10650
10651
10652
10253
10254
10255
10256
10257
10811
10382
10383
10384
10385
10809
10810
10230
10231
10232
10248
10249
10250
10251
10252
10807
10808
10378
10379
10380
10381
10228
10229
11615
11616
11617
11649
11640
11934
11628
11629
11639
10915
12031
12029
12030
11583
11584
11585
11586
12028
12040
12041
12042
12027
11625
11626
11627
11637
11638
10968
10967
11294
11295
11296
11624
11636
12026
12039
11292
11293
11932
-100
N = 374
338
204
486
516
217
212
97
437
237
219
13
755
1805
1443
361
530
1817
1810
459
1838
1826
LINHA
Apesar do grfico disperso versus nvel mostrar a transformao raiz como ideal,
outras transformaes foram tentadas e a que melhor ajustou os dados foi a transformao log
x.
Transformao Z = log x
Nova varivel Estoque_log
135
700
600
500
400
300
200
Std. Dev = ,43
100
Mean = ,93
N = 4033,00
0
2,
2,
2,
1,
1,
1,
1,
50
25
00
75
50
25
00
5
,7
0
,5
5
,2
00
0,
Estoque_log
3,0
738
755
756
757
2,5
5535
5536
5537
5538
5539
3762
3763
3764
3765
3766
3767
2,0
11615
11616
11617
11649
11934
11628
11629
11639
11640
1350
1351
1352
1353
1354
1356
1,5
LOGESTOQ
1,0
,5
1691
1509
1451
1104
1008
1007
1006
1005
1508
1507
1506
1505
1504
1503
1502
1501
1500
1362
1361
1360
1103
1004
1003
1002
1439
1102
1101
1001
1000
0,0
4057
4056
4055
4054
3996
2892
2891
2890
2889
2888
2623
2622
2621
2620
2619
2612
2007
1994
1993
1992
1962
1959
1821
1820
1819
4002
4001
4000
3999
3829
3828
3827
3826
3315
3314
3114
3113
3112
3111
3110
3109
3108
3107
3106
3105
3104
3103
3102
-,5
N = 358
325
204
457
493
217
212
90
411
237
219
13
665
1805
1443
341
465
1817
1810
415
1838
1826
LINHA
O mesmo procedimento foi adotada para todas as variveis numricas, como mostrado
a seguir.
136
Estoque_dias
Resultado do grfico disperso versus nvel:
Equao linear ajustada y = 2,7411x - 2,7196
Valor de b
3
Transformao sugerida
1
Z= 2
Neste caso a transformao resultou em melhoria aparente dos dados; porm esta
melhoria no foi profunda. Outras transformaes foram tentadas, sem sucesso. Uma nova
varivel foi criada com a transformao sugerida, porm ambas foram testadas nos modelos
criados.
Transformao
Nova varivel
Z=
1
x2
Estoque_dias-2
Reposicao_dias
Resultado do grfico disperso versus nvel:
Equao linear ajustada y = -0,0845x + 0,0845
Valor de b
0
Transformao sugerida nenhuma
Mostruario
Resultado do grfico disperso versus nvel:
Equao linear ajustada y = 0,7087x + 0,3868
Valor de b
0,7
Transformao sugerida Z = x0,3
Neste caso a transformao resultou em melhoria aparente dos dados; porm esta
melhoria no foi profunda. Outras transformaes foram tentadas, sendo a que melhor
adaptou os dados a transformao logartma.
Transformao Z = log x
Nova varivel Mostruario_log
137
Grade
Resultado do grfico disperso versus nvel:
Equao linear ajustada y = 0,9232x + 0,4442
Valor de b
1
Transformao sugerida Z = log x
Total7
Resultado do grfico disperso versus nvel:
Equao linear ajustada y = 1,1243x + 0,0695
Valor de b
1
Transformao sugerida Z = log x
PrecoMedioSemanal
Resultado do grfico disperso versus nvel:
Equao linear ajustada y = 0,794x + 0,1608
Valor de b
0,8
Transformao sugerida Z = x0,2
A transformao sugerida mostrou ser a que melhor ajusta os dados, mesmo tentandose outras transformaes, como a logartma.
Transformao Z = x0,2
Nova varivel Preco_pot
Pprazo
Resultado do grfico disperso versus nvel:
Equao linear ajustada y = -0,0646x + 1,7929
Valor de b
0
Transformao sugerida nenhuma
ID_MARCA
CLASSE
Classe_distri
buicao
Reposicao_d
ias
SEMANA
JurosMedioS
emanal
PPRAZO
Pearson
Correlation
Sig. (2tailed)
N
Pearson
Correlation
Sig. (2tailed)
N
Pearson
Correlation
Sig. (2tailed)
N
Pearson
Correlation
Sig. (2tailed)
N
Pearson
Correlation
Sig. (2tailed)
N
Pearson
Correlation
Sig. (2tailed)
N
Pearson
Correlation
Sig. (2tailed)
N
Pearson
Correlation
Preco_
pot
,033
,033
-,001
,000
,916
,001
,510
,000
,808
,000
,000
,262
,937
,690
,000
,000
12559
,033
12559
1
12559
,120
12559
,074
12559
-,118
12559
-,067
12559
-,002
12559
-,012
4033
,072
12559
-,046
2352
-,103
1249
,080
12559
,051
12559
,163
,000
,000
,000
,000
,000
,859
,177
,000
,000
,000
,005
,000
,000
12559
-,001
12559
,120
12559
1
12559
,556
12559
-,143
12559
-,265
12559
-,012
12559
,145
4033
-,041
12559
,072
2352
-,222
1249
,265
12559
-,190
12559
,040
,916
,000
,000
,000
,000
,195
,000
,010
,000
,000
,000
,000
,000
12559
-,030
12559
,074
12559
,556
12559
1
12559
-,116
12559
-,304
12559
,024
12559
,133
4033
-,119
12559
,047
2352
,177
1249
-,193
12559
-,197
12559
-,168
,001
,000
,000
,000
,000
,007
,000
,000
,000
,000
,000
,000
,000
12559
,006
12559
-,118
12559
-,143
12559
-,116
12559
1
12559
,018
12559
-,002
12559
-,118
4033
,213
12559
-,011
2352
,236
1249
,033
12559
,223
12559
-,047
,510
,000
,000
,000
,038
,838
,000
,000
,202
,000
,245
,000
,000
12559
-,034
12559
-,067
12559
-,265
12559
-,304
12559
,018
12559
1
12559
-,050
12559
,042
4033
-,019
12559
-,005
2352
-,062
1249
-,008
12559
-,020
12559
,073
,000
,000
,000
,000
,038
,000
,000
,216
,553
,003
,773
,026
,000
12559
-,002
12559
-,002
12559
-,012
12559
,024
12559
-,002
12559
-,050
12559
1
12559
-,005
4033
,019
12559
,004
2352
,022
1249
,098
12559
-,029
12559
-,119
,808
,859
,195
,007
,838
,000
,562
,222
,670
,295
,001
,001
,000
12559
-,040
12559
-,012
12559
,145
12559
,133
12559
-,118
12559
,042
12559
-,005
12559
1
4033
-,279
12559
,032
2352
-,148
1249
-,059
12559
-,648
12559
,122
139
Estoque_log
Estoque_dia
s-2
Mostruario_l
og
Grade_log
Vendas_log
Preco_pot
Sig. (2tailed)
N
Pearson
Correlation
Sig. (2tailed)
N
Pearson
Correlation
Sig. (2tailed)
N
Pearson
Correlation
Sig. (2tailed)
N
Pearson
Correlation
Sig. (2tailed)
N
Pearson
Correlation
Sig. (2tailed)
N
Pearson
Correlation
Sig. (2tailed)
N
,000
,177
,000
,000
,000
,000
,562
,000
,000
,000
,037
,000
,000
12559
,059
12559
,072
12559
-,041
12559
-,119
12559
,213
12559
-,019
12559
,019
12559
-,279
4033
1
12559
-,036
2352
,076
1249
,590
12559
,439
12559
-,058
,000
,000
,010
,000
,000
,216
,222
,000
,022
,000
,000
,000
,000
4033
,010
4033
-,046
4033
,072
4033
,047
4033
-,011
4033
-,005
4033
,004
4033
,032
4033
-,036
4033
1
2143
,044
1218
,125
4033
-,048
4033
-,060
,262
,000
,000
,000
,202
,553
,670
,000
,022
,034
,000
,000
,000
12559
-,002
12559
-,103
12559
-,222
12559
,177
12559
,236
12559
-,062
12559
,022
12559
-,148
4033
,076
12559
,044
2352
1
1249
-,032
12559
,143
12559
-,459
,937
,000
,000
,000
,000
,003
,295
,000
,000
,034
,272
,000
,000
2352
-,011
2352
,080
2352
,265
2352
-,193
2352
,033
2352
-,008
2352
,098
2352
-,059
2143
,590
2352
,125
2352
-,032
1149
1
2352
,219
2352
-,271
,690
,005
,000
,000
,245
,773
,001
,037
,000
,000
,272
,000
,000
1249
,033
1249
,051
1249
-,190
1249
-,197
1249
,223
1249
-,020
1249
-,029
1249
-,648
1218
,439
1249
-,048
1149
,143
1249
,219
1249
1
1249
-,033
,000
,000
,000
,000
,000
,026
,001
,000
,000
,000
,000
,000
,000
12559
,033
12559
,163
12559
,040
12559
-,168
12559
-,047
12559
,073
12559
-,119
12559
,122
4033
-,058
12559
-,060
2352
-,459
1249
-,271
12559
-,033
12559
1
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
12559
12559
12559
12559
12559
12559
12559
12559
4033
12559
2352
1249
12559
12559
140
2,5
2,0
1,5
1,0
SETOR
Estoque_log
,5
18
0,0
14
-,5
-,5
0,0
,5
1,0
1,5
2,0
2,5
Grade_log
1,5
1,0
Mostruario_log
,5
SETOR
0,0
18
14
2
-,5
1,0
1,5
2,0
2,5
3,0
3,5
Preco_pot
141
SETOR
18
14
CLASSE
13
2
0
-1
Classe_distribuicao
2,5
2,0
1,5
1,0
SETOR
Vendas_log
,5
18
0,0
14
2
-,5
-,5
0,0
,5
1,0
1,5
2,0
2,5
3,0
Estoque_log
142
2,5
2,0
1,5
1,0
SETOR
Vendas_log
,5
18
14
0,0
13
2
-,5
-20
20
40
60
80
100
120
PPRAZO
TOTAL7_1
1,0
,5
Partial ACF
0,0
-,5
Confidence Limits
Coefficient
-1,0
52
49
46
43
40
37
34
31
28
25
22
19
16
13
10
7
4
1
Lag Number
143