Anda di halaman 1dari 11

Sistema de Anlise de Comportamento de Clientes Baseado

em Rede Neural Artificial


Thamires Charbaje de Oliveira1, Maury Meirelles Gouva Jr.2
1

Instituto de Cincias Exatas e Informtica


2
Instituto Politcnico

Pontifcia Universidade Catlica de Minas Gerais


Belo Horizonte, Brasil
1

tamycharbaje@yahoo.com.br, 2maury@pucminas.br

Abstract. Computerizing the commercial sector provides features that boost


sales and attract new customers. However, the large amount of information
stored in databases must be handled intelligently; otherwise, companies will
have difficulty in using the information they hold. Analyzing and predicting
customer behavior from large databases are tasks which require methods to
become more and more efficient. This paper presents a method for analyzing
the behavior of a beverage distributors customers which is based on a neural
network. The purpose is to classify the type of customer automatically based
on his/her purchase history. The results of experiments with several neural
network topologies showed that the proposed method is efficient, because it
presented an acceptable error rate.
Resumo. A informatizao dos setores comerciais trs agilidades que
favorecem as vendas e a captao de novos clientes. Entretanto, a grande
quantidade de informaes armazenadas nos bancos de dados deve ser
tratada de forma inteligente; caso contrrio, as empresas tero dificuldades
para aproveitar suas informaes. Analisar e prever o comportamento de
clientes em uma grande base de dados so tarefas que requerem mtodos
cada vez mais eficientes. Este trabalho prope um mtodo para anlise de
comportamento de clientes de uma distribuidora de bebidas baseado em redes
neurais. A proposta classificar de forma automtica o tipo de cliente,
baseado no seu histrico de compras. Os resultados de experimentos com
vrias topologias de redes neurais mostraram que o mtodo eficiente, pois
apresentou uma taxa de acerto aceitvel.

1. Introduo
As organizaes contemporneas vm exigindo cada vez mais recursos tecnolgicos
para anlise das informaes nas tomadas de decises. Premidos pela necessidade de
tomar decises em um tempo cada vez mais curto, os executivos precisam dispor de
informaes rpidas e precisas que lhes sirvam de suporte. Com essa necessidade surgiu
o conceito de Business Intelligence (CARVALHO, 2001).
Os sistemas de Bussiness Intelligence (BI) tm como caracterstica procurar
relaes de causa e efeito, extrair e explorar informaes contidas em grandes bancos de
dados. A inteligncia do negcio est associada a proporcionar vantagem competitiva s

organizaes com informaes que assumem papel fundamental no sucesso dos


investimentos (CARVALHO, 2001).
Um sistema de BI envolve ferramentas que realizem anlises preditivas, como,
por exemplo, Data Mining que alm de buscar interpretao dos dados existentes visa
fundamentalmente inferir e generalizar possveis fatos e correlaes no percebidas nem
facilmente deduzidas por analistas (PASSARI, 2003).
Data Mining o processo de selecionar informao de grandes bancos de dados
em busca de padres escondidos e informao preditiva utilizando algoritmos de
aprendizagem ou classificao baseados em redes neurais, anlise estatstica,
modelagem e mquinas de aprendizagem (ELMASRI; NAVATHE, 2002). Os mtodos
de data mining podem, a partir de um conjunto de dados, identificar ocorrncias e
similaridades, associar eventos ou prever o comportamento de uma determinada
varivel (CARVALHO, 2001). Dentre as reas estratgicas que mais tm explorado o
uso de data mining encontramos o marketing, as vendas, finanas a manufatura e sade
(GOLDSCHMIDT; PASSOS, 2005).
A partir da definio dos objetivos e da avaliao dos dados, possvel escolher
o mtodo de data mining que ser utilizado. Quando objetiva-se, por exemplo, analisar
questes relativas ao comportamento de certas variveis, pode-se utilizar redes neurais.
Trata-se de uma estrutura formada por unidades de processamento, ou neurnios,
funcionalmente muito simples, mas que por serem altamente interconectados, formam
um sistema de processamento maciamente paralelo que pode ser utilizado para tarefas
como reconhecimento de padres e aproximao de funes (PASSARI, 2003). As RN
so tcnicas que fornecem mtodos de aprendizagem, pois so conduzidas a partir de
amostragens de testes. Com esses mtodos de aprendizagem, respostas a novas entradas,
inditas, podem ser interpoladas a partir das amostras conhecidas (PASSARI, 2003).
Nas ltimas dcadas, com a alta competio empresarial, clientes mudam de
empresas com mais frequncia. O data mining pode ser utilizado para verificar por que
os clientes trocam uma empresa por outra; pode-se localizar ofertas e oferecer vantagens
para evitar a fuga de clientes; ou mesmo localizar clientes que podem sair da empresa
sem representar prejuzo (CARVALHO, 2001).
No mercado de bebidas, por exemplo, o surgimento de novas marcas e
fabricantes abalam a garantia de manter o cliente fiel, exigindo das organizaes um
estudo ttico e estratgico do mercado. No ramo de distribuio de bebidas, um sistema
de BI pode avaliar a viabilidade mercadolgica e gerir todas as informaes ao nvel
gerencial, adquirindo vantagem competitiva para adquirir mercado e consumidores.
Essa anlise envolve o estudo de informaes que, se devidamente tratadas, podem
gerar resultados de significativa relevncia para a proposio, elaborao e/ou avaliao
dos mais diversos processos.
Este trabalho prope um sistema baseado em data mining para solucionar o
problema de inatividade dos clientes em uma distribuidora de bebidas, que normalmente
desconhece a inatividade dos seus clientes, pois os relatrios de positivao apontam
que apenas 50% dos clientes cadastrados so atendidos por ms. Assim, a empresa no
consegue avaliar o motivo que a leva a no conseguir atender todos os clientes.
Ao analisar os dados histricos da empresa, pode-se identificar o cliente que
deixou de ser tornar ativo. A avaliao dos resultados deve indicar a origem do

problema, podendo ser relacionado ao vendedor responsvel ao giro do produto


comercializado, ou at mesmo logstica comercial que interfere no tempo de entrega
do produto.
O restante deste artigo est estruturado como segue. Na Seo 2, apresentado o
mecanismo e operao comercial da empresa. A Seo 3 contempla o modelo proposto,
com o critrio e caractersticas de classificao e polticas comerciais da distribuidora de
bebidas. A anlise detalhada deste trabalho ocorre na Seo 4, no estudo experimental
com os testes, resultados, interpretaes e definies. Por fim, as consideraes finais
deste trabalho so apresentadas na Seo 5.

2. Mecanismo Operacional de Uma Distribuidora de Bebidas


Nas ltimas dcadas, com a alta competio empresarial, clientes mudam de empresas
com mais frequncia devido a vrios fatores, como preo, qualidade, promoes, dentre
outros. Assim, o Bussiness Intelligence pode ser utilizado para verificar o motivo desse
comportamento, localizando ofertas e oferecendo vantagens para evitar a fuga de
clientes, ou mesmo localizando clientes que possam sair da empresa sem representar
prejuzo. mais fcil manter um cliente do que adquirir um novo (CARVALHO, 2001).
Uma empresa do mercado de refrigerantes em Minas Gerais tem como objetivo
expandir e consolidar sua atuao no interior. Identificou-se nessa empresa h
necessidade de integrar informaes aos negcios para maximizar seus resultados, isto
, alm de aumentar o nmero de clientes deve-se mant-los fiis.
No setor comercial dessa empresa, as metas de cada equipe so definidas pelo
corpo diretor em funo do crescimento sem um estudo prvio de crescimento de
mercado e perspectivas dos consumidores. Assim, a cada incio de perodo inicia-se
uma busca desenfreada para atingir as metas, sem identificar se as vendas sero para
novos ou para velhos clientes. A carncia de informaes acerca do acompanhamento
dos clientes reflete em perda de potencial do setor comercial e consequente abertura
para concorrncia.
Entende-se que nem sempre o cliente que possui mais frequncia de pedidos o
melhor cliente, pois h tratamentos comerciais e contratos de bonificaes que
interferem nesta avaliao. Por exemplo, um cliente realiza pedidos toda semana, mas
h desconto financeiro que diminui a margem de lucro da empresa. Por outro lado, um
outro cliente que realiza pedidos a cada vinte dias sem descontos ou benefcios
proporciona uma margem de lucro maior.
Atualmente, no h critrios para acompanhamento de clientes nessa
distribuidora de bebidas. Diante de uma anlise do pedido, o analista de crdito que
deseja conhecer o ltimo pedido de um cliente precisa gerar um relatrio de vendas na
hora da aprovao do pedido. Esse tratamento manual vulnervel a erros e atrasa a
rotina diria do funcionrio. Considerando que a distribuidora de bebidas possui um
fluxo de pedido dirio de aproximadamente 1.000 pedidos, o analista provavelmente
deixar de criticar alguns pedidos da maneira correta.
Com critrios de perfil comercial definidos para cada cliente, o mtodo proposto
poupar tarefas manuais, proporcionando confiana para aes comerciais, como
promoo de vendas, e financeiras, como anlise de limite de crdito. Conhecer o
cliente fundamental para estimul-lo a comprar mais. Com uma base de dados

consolidada e atualizada diariamente, a distribuidora de bebidas poder usufruir


informaes de seus clientes para implantar algumas rotinas, como sugestes de pedidos
e acompanhamento de estoque. Como benefcio direto, a distribuidora de bebidas
conhecer o perfil comercial de cada cliente, poder reestruturar as rotinas de visitas e
rotas dos vendedores com mais frequncia. Assim, os custos sero reduzidos e os
recursos disponveis sero otimizados.

3. Anlise de Comportamento de Clientes Baseado em Rede Neural


O modelo proposto tem como objetivo automatizar a anlise de comportamento de
clientes de uma distribuidora de bebidas a partir da sua base de dados. Os resultados das
atividades dos clientes so estimados por uma rede neural feedforward multicamadas
(HAYKIN, 2001).
Os relatrios de vendas da distribuidora de bebidas mostram que apenas 25 mil
dos 50 mil clientes cadastrados so atendidos por ms, i.e., apenas 50% dos clientes so
ativos. A empresa no consegue identificar o motivo que a leva a no conseguir atender
todos os clientes, e ainda sofre com rupturas, i.e., h uma interrupo na relao
comercial entre a empresa e o cliente. Sem a informao do comportamento dos seus
clientes, a empresa opera no escuro e no consegue avaliar sua participao no mercado.
A distribuidora de bebidas disponibiliza uma rota com N clientes por vendedor.
O objetivo saber quantos desses clientes esto ativos ou compram em perodos
regulares. Sem as informaes das atividades de seus clientes, a distribuidora no
consegue atuar com metas justas para atender o mercado de acordo com suas
necessidades. necessrio, ainda, avaliar se os recursos (PDA, telefone, combustvel,
etc.) disponibilizados para atender uma determinada rota possuem retornos desejados.
Aproveitando a capacidade de classificao de uma rede neural, pode-se definir
o potencial de compra de um determinado cliente a partir de exemplos de
comportamentos passados. A avaliao dos resultados deve indicar a origem do
problema vendedor responsvel pelo giro do produto comercializado ou a logstica
comercial que interfere no tempo de entrega do produto.
Utilizando uma base extrada do banco de dados da distribuidora de bebidas,
inicia-se a tarefa de organizao e classificao dos dados. A Figura 1 mostra alguns
exemplos de registros utilizados para a anlise, que utilizou os campos valor do item
comercializado, preo mdio do item, data da ltima compra, em dias, tipo de negcio e
tipo de cliente.
No mtodo proposto, a funo da rede neural classificar o tipo de cliente, em
funo do nmero de dias sem efetuar nenhuma compra e do tipo de negcio efetuado.
Portanto, a rede neural possui duas entradas nmero de dias sem compras e tipo de
negcio e uma sada tipo de cliente. Para essa tarefa, as vendas e os clientes de cada
registro so classificados simbolicamente. Em seguida, o registro normalizado para ser
apresentado rede neural no treinamento. Finalmente, aps o treinamento, a rede neural
est apta para classificar os clientes da distribuidora de bebidas. As prximas subsees
descrevem os passos do mtodo proposto.

Figura 1. Tabela da base de dados: registros de vendas e classificaes

3.1. Classificao da venda


Para classificar a venda, no campo tipo de negcio, adotou-se como referncia o preo
mdio e o valor de venda do item. Dentro dos procedimentos comerciais da
distribuidora de bebidas, o vendedor possui uma margem de negociao de at 3% do
preo mdio do item. Assim, a venda pode ser classificada como:
Mau negcio: se o valor de venda do item for inferior ao seu valor mnimo de
negociao. Entende-se como um mau negcio quando a margem de negociao
ultrapassa 3%;
Venda padro: se o valor de venda do item for maior ou igual ao seu valor
mnimo de negociao e menor ou igual ao seu preo mdio. Entende-se como venda
padro quando o item negociado dentro da margem de negociao de 3%; ou
Bom negcio: se o valor de venda do item for maior do que o seu preo
mdio. Entende-se como um bom negcio quando o valor do item for negociado acima
do seu preo mdio.
3.2 Classificao do Cliente
A classificao do cliente, no campo tipo de cliente, tem como referncia o tipo da
venda e a data da compra quantidade de dias de 1o de janeiro at 31 de dezembro de
2010. A frequncia de compra do cliente deve ser de no mximo 30 dias para ser um
cliente regular (pela poltica de rotas o cliente visitado e deve ser positivado toda
semana). A tolerncia mxima de 60 dias; se dentro desse perodo o cliente no foi
positivado, ele um cliente suscetvel ruptura. Assim, o cliente pode ser classificado
como:
timo cliente: se a data da compra for inferior ou igual a 30 dias e o tipo da
venda for bom negcio;
Bom cliente: se a data da compra for inferior a 30 dias e o tipo da venda for
venda padro; ou se a data da compra for superior a 30 dias e menor ou igual a 60 dias e
a venda for bom negcio ou venda padro;
Mau cliente: se a data da compra for inferior a 30 dias e o tipo da venda for
mau negcio; ou se a data da compra for superior a 30 dias e menor ou igual a 60 dias e
a venda for mau negcio; ou se a data da compra for superior a 60 dias.

3.3. Normalizao dos Dados


A Tabela 1 apresenta os rtulos utilizados para a normalizao da base de treinamento
da rede neural. Foram utilizados trs valores para os padres de negcio e cliente.
Tabela 1. Rtulos padronizados das classificaes
Valor Simblico
MAU NEGCIO
MAU CLIENTE
VENDA PADRO
BOM CLIENTE
BOM NEGCIO
TIMO CLIENTE

Valor Numrico
0.0
0.5
1.0

A Tabela 2 mostra os dados da base de vendas, aps a normalizao, para o


treinamento da rede neural. As duas primeiras colunas so as entradas da rede neural, a
ltima coluna a sada, isto , a classificao do tipo de cliente.
Tabela 2. Base de treinamento da rede neural

4. Estudo Experimental
Para o desenvolvimento do modelo de anlise de comportamento de clientes foi
utilizada uma rede neural feedforward multicamadas com apenas uma camada oculta e o
algoritmo backpropagation (RUMELHART; HINTON; WILLIAMS, 1986) para seu
treinamento. A base de dados da empresa possui 325.470 registros de venda de todo o
ano de 2010. Foram utilizados 2.195 registros como exemplos de comportamento dos
clientes para composio da base de treinamento da rede neural, divididos como segue:
1.141 exemplos para treinamento;
541 exemplos para validao; e
513 exemplos para teste.

Para encontrar a melhor configurao da rede neural, foram executados quatro


treinamentos com topologias de 10, 20, 30 e 50 neurnios na camada oculta. Para cada
treinamento, foram executadas 1.000 pocas. A taxa de aprendizagem foi fixada em 0,5
e o fator de momento em 0,01. No treinamento, a configurao de pesos sinpticos
escolhida foi aquela que produziu o menor erro quadrtico mdio (EQM) da base de
validao durante o treinamento, i.e., a configurao que se supe ter a melhor
capacidade de generalizao. Em seguida, calculou-se o erro quadrtico mdio (EQM)
da base de teste. Se esse erro de teste fosse menor que 0,1 (10%), a rede neural estaria
aprovada no treinamento; caso contrrio, repetir-se-ia o treinamento com novos
parmetros, e.g., diferentes pesos iniciais e/ou taxa de aprendizagem.
A Figura 2 mostra os erros de treinamento e validao das quatro topologias das
redes neurais treinadas. Em quase todos os casos, os erros de treinamento, em azul,
declinaram rapidamente e se mantiveram em valores baixos durante todo o treinamento.
Apenas no treinamento da rede neural com topologia de 50 neurnios ocultos, Figura
2(d), houve oscilao do erro de treinamento. Os erros de validao, em verde, das redes
neurais com topologias de 10 e 20 neurnios ocultos, Figuras 2(a) e 2(b), foram os mais
estveis, sendo que a ltima topologia teve um EQM significativamente menor que as
demais. Conclui-se que, considerando estabilidade e magnitude do EQM, a rede neural
com topologia de 20 neurnios ocultos, Figura 2(b), obteve o melhor desempenho no
treinamento.

Figura 2(a). Topologia com 10 neurnios ocultos

Figura 2(c). Topologia com 30 neurnios ocultos

Figura 2(b). Topologia com 20 neurnios ocultos

Figura 2(d). Topologia com 50 neurnios ocultos

Figura 2. Erros de treinamento e validao das quatro topologias das redes neurais

A Figura 3 mostra os grficos de barras dos erros absolutos da base de teste das
quatro redes neurais treinadas. Esses erros simulam a rede neural operando uma
situao real, onde as entradas representam padres no apresentados no treinamento.
Na Figura 3(b), observa-se que com a rede neural com topologia de 20 neurnios
ocultos o maior erro de teste absoluto no atinge 0,4, e que a maioria dos erros
concentra-se entre 0 e 0,05. Nas topologias com 10 e 30 neurnios na camada oculta,
Figuras 3(a) e 3(c), os erros absolutos tambm concentram-se em uma faixa de valores

baixos, entre 0 e 0,3, mas tiveram erros prximos ou iguais a 1. A topologia com 50
neurnios na camada oculta, Figura 3(d), teve o pior desempenho com a base de teste,
com muitos erros absolutos variando entre 0 e 0,45.

Figura 3(a). Topologia com 10 neurnios ocultos

Figura 3(b). Topologia com 20 neurnios ocultos


ocultos

Figura 3(c). Topologia com 30 neurnios ocultos

Figura 3(d). Topologia com 50 neurnios ocultos

Figura 3. Erro com os exemplos da base de teste

Para todas as redes neurais treinadas, foram produzidos histogramas para avaliar
a frequncia dos erros absolutos na base de teste, como mostra a Figura 4. Observa-se
que todas as topologias tiveram a maioria das ocorrncias abaixo de 0,05. A topologia
com 20 neurnios ocultos, Figura 4(b), foi a que teve a maior distribuio dos erros
absolutos; entretanto, a maior densidade, 219 exemplos da base de teste ou 42,7% do
total, foi de erros absolutos muito prximos de 0. Essa mesma topologia teve cerca de
90% dos erros de teste menores que 0,05.

Figura 4(a). Topologia com 10 neurnios ocultos

Figura 4(c). Topologia com 30 neurnios ocultos

Figura 4(b). Topologia com 20 neurnios ocultos

Figura 4(d). Topologia com 50 neurnios ocultos

Figura 4. Histograma dos erros de teste das quatro topologias das redes neurais

Finalmente, a Tabela 3 mostra resultados estatsticos das quatro redes neurais na


base de teste. Em geral, todas as topologias chegaram a resultados estatsticos
satisfatrios, mas a topologia que apresentou o melhor desempenho foi aquela com 20
neurnios na camada oculta. Essa topologia obteve os menores EQM, desvio padro e
erros mnimo e mximo. Conclui-se que a rede neural com topologia de 20 neurnios
alcanou o melhor desempenho e, portanto, a escolhida para a implantao. No
treinamento, a topologia com 20 neurnios ocultos teve os menores e mais estveis
EQMs de treinamento e validao. No teste da rede neural, utilizando uma base com
513 exemplos, a topologia com 20 neurnios ocultos teve tambm o melhor
desempenho. Os erros absolutos, Figura 3(b), foram os menores com essa topologia, a
maioria deles variando entre 0 e 0,05, e o maior deles igual a 0,4. No histograma, Figura
4(b), observou-se que a topologia com 20 neurnios ocultos concentrou
aproximadamente 90% dos erros absolutos em at 0,05 (5%).

Tabela 3. Tabela de resultados dos testes das topologias


Teste

Neurnios
Ocultos

EQM

Desvio
Padro

10

0.064348

0.107748

0.000000

1.000000

20

0.050104

0.081755

0.000000

0.372500

30

0.061059

0.110728

0.000000

1.000000

50

0.070615

0.144924

0.000000

1.000000

Menor Erro Maior Erro

A partir dos resultados da topologia escolhida, com 20 neurnios na camada


oculta, pode-se estimar que, em uma base com 50 mil registros, 2.500 clientes sero
classificados de maneira equivocada. Esse nmero, considerando o cenrio atual, onde
no h uma poltica de anlise de comportamento de clientes, pode ser considerado
muito satisfatrio.

5. Concluses
Este trabalho desenvolveu um mtodo para automatizar a anlise de comportamento de
clientes de uma distribuidora de bebidas. A metodologia, que utilizou conceitos de
Business Intelligence, foi baseada em redes neurais.
A partir de uma metodologia de treinamento e teste de redes neurais, foram
realizados alguns experimentos com uma base de pedidos de todo o ano de 2010. Foram
testadas quatro topologias de redes neurais com 10, 20, 30 e 50 neurnios na camada
oculta. A topologia escolhida foi aquela com 20 neurnios ocultos, pois apresentou o
melhor desempenho de treinamento e os melhores resultados estatsticos com a base de
teste caracterizando melhor capacidade de generalizao. A topologia com 20
neurnios ocultos obteve a curva do erro de treinamento mais estvel e os menores erros
de validao. As demais topologias, em especial aquelas com 30 e 50 neurnios ocultos,
apresentaram curvas do erro de validao mais instveis.
Utilizando a metodologia proposta, a distribuidora de bebidas conhecer melhor
o perfil de seus clientes e estar apta a operar no mercado de maneira eficiente,
buscando a fidelidade dos seus clientes. Alm de aumentar o faturamento da empresa, a
anlise de pedidos se tornar mais confivel e otimizada. As rotas dos vendedores
podero ser avaliadas de acordo com sua rentabilidade, proporcionando distribuidora
um melhor conhecimento da sua participao no mercado.

Referncias Bibliogrficas
CARVALHO, Lus Alfredo Vidal. Data Mining, a minerao de dados no
marketing; medicina, economia, engenharia e administrao. 1a. ed. So Paulo,
2001.
ELMASRI, R.; Navathe, S.B. Sistemas de banco de dados: fundamentos e
aplicaes. 3. ed. Rio de Janeiro:LTC, 2002.
FREIMAN, J. P.; PAMPLONA, E. de O. Redes neurais artificiais na previso do
valor de commodity do agronegcio. In: Encuentro Internacional de Finanzas, 5,
Santiago, Chile, 2005.

GOLDSCHMIDT, Ronaldo; PASSOS, Emmanuel Lopes. Data mining: um guia


prtico: conceitos, tcnicas, ferramentas, orientaes e aplicaes. Rio de
Janeiro:Elsevier, 2005.
HAYKIN, Simon. Redes Neurais: princpios e prtica. Porto Alegre:Bookman, 2001.
LAZZAROTTO, Lissandra; OLIVEIRA, Alcione; LAZZAROTTO, Joelsio. Aspectos
Tericos do data mining e aplicaes da redes neurais em previses de preos
agropecurios.
PASSARI, A. F. L. Explorao de dados atomizados para previses de vendas no
varejo utilizando redes neurais. So Paulo:USP, 2003. (Dissertao de Mestrado).
RUMELHART, D.; HINTON, G; WILLIAMS, R. Learning Internal Representations
by Error Propagation. Parallel Distributed Processing: Explorations in the
Microstructure of Cognition. Cambridge: MIT Press. 1986.
SMITH, K. A.; GUPTA, J. N. D. Neural networks in business: techniques and
applications for the operations researcher. Computers & Operations Research,
1023-1044. Set. 2000.
THOM, Antnio Carlos Gay. Redes neurais uma ferramenta para KDD e Data
Mining.

Anda mungkin juga menyukai