Director (a):
Doctor, GUSTAVO A. JUNCA R.
Lnea de Investigacin:
Trabajo de profundizacin en el anlisis de variables del comportamiento del agente
Agradecimientos
Gracias a Dios porque nos permite entender y reconocer que en la investigacin y en la
educacin est el futuro de la humanidad. Debemos propender por la creacin de redes
de innovacin, informacin y conocimiento al servicio de la sociedad que permitan la
resolucin de problemas, faciliten nuestra convivencia y mejoren nuestra calidad de vida.
Resumen y Abstract
VII
Resumen
La Gestin del Riesgo de Crdito requiere de soluciones que provean la capacidad de una
total administracin de los riesgos en todo el ciclo de adquisicin y retencin del cliente,
garantizando que se apunta a los clientes ms rentables. El mercado de crdito presenta
imperfecciones debido a la asimetra en la informacin que posee la entidad financiera y
la que posee el cliente. Apoyadas en la tecnologa y el desarrollo de herramientas de
propsito especfico, las organizaciones son capaces de optimizar el valor total de sus
clientes, reduciendo sustancialmente los gastos de funcionamiento y las prdidas.
Las redes neuronales artificiales (RNA) se emplean debido a su capacidad para adaptarse
o aprender, generalizar u organizar datos y pueden ser entrenadas para anticipar y
reconocer el comportamiento de las variables en un conjunto complejo de informacin. Es
por esto, que a travs del empleo de modelos analticos predictivos neuronales en las
etapas de preventa y postventa de un servicio, las organizaciones pueden apoyar su
proceso de toma de decisiones sobre si los nuevos y/o actuales clientes pueden presentar
un riesgo de no pago o de fraude, en forma gil, oportuna y segura.
Palabras clave: riesgo crediticio, redes neuronales, analtica, modelos analticos,
informacin asimtrica, seleccin adversa, riesgo moral
Abstract
The Credit Risk Management requires solutions that provide the ability to complete risk
management throughout the cycle of customer acquisition and retention, ensuring that
targets the most profitable customers. The credit market has imperfections due to the
asymmetry of information held by the financial institution and the customer owns.
Supported in technology and development tools, organizations are able to optimize the
total value of its customers, reducing operating costs and losses.
Artificial neural networks (ANN) are used due to their ability to adapt or learn, generalize or
organize data and can be trained to anticipate and recognize the behavior of the variables
VIII
in a complex set of information. It is for this reason that through the use of neural predictive
analytical models in the stages of pre- and after-sales service, organizations can support
your decision making process on whether new and / or existing customers may present a
risk of not payment or fraud, in a quick, timely and secure
Contenido
IX
Contenido
Pg.
Resumen ....................................................................................................................... VII
1.
Introduccin ............................................................................................................. 1
2.
3.
4.
5.
6.
7.
A.
F.
Contenido
XI
1. Introduccin
Los trabajos sobre las imperfecciones del mercado de crdito han sido enfocados hacia
las consecuencias que tiene la informacin asimtrica entre las personas que solicitan un
prstamo y las entidades que prestan el dinero. Es probable que los clientes estn mejor
informados que los bancos en lo que hace referencia a la forma como adelantan sus
inversiones, en qu y cmo gastan su dinero, y los pagos que realmente hacen en cada
uno de sus proyectos y la manera cmo avanza la ejecucin de los mismos. Es claro que
esta informacin, actualizada, puede no estar al alcance de los Bancos.
La Gestin del Riesgo de Crdito requiere de soluciones que provean la capacidad de una
total administracin de los riesgos en todo el ciclo de adquisicin y retencin del cliente,
garantizando que se apunta a los clientes ms rentables, los cuales son aceptados,
monitoreados y analizados desde el inicio del servicio hasta el proceso de recaudacin de
pagos y/o recuperacin de la cartera. Un significativo y creciente problema actual para las
organizaciones financieras y de servicios, es la prdida de ingreso a travs de deuda
incobrable (es decir, el no pago por bienes y servicios recibidos) cuyo carcter aleatorio
Introduccin
Existen muchas y variadas tcnicas para la medicin del riesgo de crdito basadas en
simples clculos o en elaborados y sofisticados esquemas metodolgicos que utilizan
simulaciones dinmicas. Sin importar la tcnica utilizada, estos mtodos intentan
representar la forma como varia la capacidad, oportunidad y cumplimiento de los pagos de
los clientes y los efectos que estas variaciones tienen en el comportamiento y desempeo
de las organizaciones del sector financiero.
Introduccin
La presente investigacin tiene como objetivo general definir, disear, elaborar y presentar
un modelo para la evaluacin del riesgo crediticio utilizando tcnicas estadsticas,
probabilsticas y economtricas apoyadas en modelos de redes neuronales. Este objetivo
se lograr a travs del anlisis de los mecanismos para la evaluacin del riesgo financiero
y la utilizacin de modelos de redes neuronales que permitan la definicin de una
metodologa que aproxime dichas tcnicas y facilite la gestin del riesgo de crdito. Por
ltimo, se realizar una aplicacin del modelo analizando algunas muestras de informacin
del sector financiero colombiano y finalmente, se har una propuesta de otras aplicaciones
de la metodologa. De esta forma, los objetivos especficos son:
Definir una metodologa que aproxime las tcnicas probabilsticas y economtricas con
los modelos de redes neuronales
Akerlof en su artculo "The Market for Lemons: Quality Uncertainty and the Market
Mechanism", 1970, estudi el mercado de autos usados, dividindolo en dos tipos, los de
buena calidad y los de baja calidad. l concluye que existe una asimetra en este mercado
porque el vendedor del auto conoce la calidad de su vehculo, mientras que el comprador,
slo observa el precio al que se vende, pero desconoce el estado real del vehculo y lo que
le ha pasado. Esto dificulta enormemente la posibilidad de los intercambios. Si existiesen
dos mercados uno de los autos de alta calidad y otro de "cacharros" sus precios seran
diferentes y los consumidores elegiran el tipo de vehculo deseado segn sus
preferencias. El problema comienza cuando existe un solo mercado para todos los
vehculos. Si los compradores no pueden saber a priori qu tipo de automvil es cada uno,
se formar un precio medio entre ambos tipos de autos. Los vendedores de autos de alta
calidad tendern a salir del mercado, quedando solo los "cacharros" en el mercado. Los
consumidores recalcularn entonces las probabilidades de encontrar un auto bueno y sus
ofertas sern cada vez menores. Ante esta nueva cada de la demanda, los autos de alta
calidad continan saliendo del mercado hasta que slo los peores autos queden en l. En
conclusin, Akerlof demostr que cuando los vendedores tienen mejor informacin que los
compradores puede ocurrir que slo los bienes de poca calidad lleguen al mercado. Qu
tipo de automvil esperara una persona conseguir cuando compra un auto usado? Quin
tiene ms incentivo para vender su auto, aqul que tiene uno bueno o aqul que tiene uno
malo? Naturalmente quien tiene uno malo. As las cosas, el demandante espera que la
calidad promedio de un auto usado sea baja y por ello su disposicin a pagar por l,
tambin es baja. Esto lleva a que quien tiene un buen auto no desee venderlo a un bajo
precio y a que la parte no informada, o sea el comprador, negocie exactamente con la
gente que no debe. En situaciones como sta se dice que la parte no informada obtiene
una seleccin adversa de las partes informadas.
(pblica) se podra sacar al conjunto de la poblacin pobre y joven y que ellos mismos
cubrieran sus gastos en salud, que resultara problemtico desde un punto de vista
distributivo.
El riesgo moral (Moral Hazard) se basa en que, ante la firma de un contrato, que luego de
firmado no puede ser modificado, a causa de la informacin incompleta de una de las
partes, resulte perjudicado por el comportamiento de la otra (es decir mentir para cerrar
el contrato). Por ejemplo, los desempleados que cobran el seguro de desempleo tendran
menos ambicin para encontrar un nuevo puesto de trabajo (o reduccin pragmtica de la
disposicin al buen rendimiento). Tambin en este caso pueden reducirse las ofertas
privadas de seguros.
En 2001 los economistas, Joseph Stiglitz, George Akerlof y Michael Spence, recibieron el
Premio Nobel de Economa por sus anlisis de los mercados con informacin asimtrica.
Ellos sentaron las bases de una teora sobre los mercados y su relacin con la informacin
asimtrica. Sus teoras constituyeron las bases de la informacin econmica moderna, y
han tenido posteriores aplicaciones sobre anlisis de mercados. Explicaron de qu
manera, la falta de informacin dificulta el desarrollo de los pases pobres y que, los
desajustes en los mercados de algunos pases eran imputables a una mala circulacin de
la informacin [Akerlof, G.,1970] (cita referida en The New Keynesian Economics [18]),
de esta manera relacionaron la carencia de informacin y los mercados financieros. El uso
del concepto de informacin asimtrica por estos autores, propici en la disciplina
econmica un nuevo inters por el anlisis de los mercados financieros y permite, en la
actualidad, entender mucho mejor sus imperfecciones. Otros destacados economistas
como Kenneth Arrow, William Vickrey y James Mirrlees tambin han hecho importantes
aportes al tema de la informacin asimtrica. Dos dcadas antes que los premios Nobel
de economa del ao 2001 sentaran las bases de esta teora sobre los mercados y su
relacin con la informacin asimtrica, James Coleman (1988) y Robert Burt (1992)
expusieron su modelo de informacin incompleta en la construccin del capital social.
informacin descentralizada en las organizaciones, de forma tal que stas puedan utilizar
el conocimiento continuamente. La perspectiva de Coleman sobre el capital social se
concentra en los riesgos asociados a la informacin incompleta, argumentando que las
redes con cierre (redes en las cuales todos estn conectados de tal forma que es posible
pasar la informacin a los otros, siendo sta directamente proporcional a la densidad de la
red) generan transmisin del conocimiento. La informacin asimtrica significa que alguien
sabe algo que la otra persona no sabe y con ello puede ganar dinero. La mayora de los
mercados y actividades funcionan en base a la informacin asimtrica.
Un agente inmobiliario le puede vender una casa porque l conoce al vendedor y Usted
no.
Un abogado le puede vender sus servicios o un mdico cobrarle por curarlo porque
ellos saben cosas que Usted no sabe.
Alguien le vende camisas porque l sabe fabricarlas y Usted no o porque l sabe dnde
se consiguen y Usted no.
Las entidades financieras desempean un papel clave en la asignacin del crdito y en las
decisiones de inversin reales intentando reducir la asimetra de informacin sobre la
calidad del proyecto y el problema de la seleccin adversa de los prestatarios. Es claro que
esto tiene repercusiones en la estructura del mercado de capitales y en forma directa afecta
a las entidades de crdito. Por lo general las entidades financieras tienden a racionar el
crdito, negndolo, en lugar de incrementar las tasas de inters. En un principio se estim
que los bancos racionaban los crditos si enfrentaban rigideces en los tipos de inters,
luego, los problemas de seleccin adversa y de riesgo moral introducidos por el hecho de
tener informacin asimtrica justifican una tasa de inters mxima a partir de la cual no es
atractivo para el prestamista otorgar un crdito. Al superar este nivel de tasa se puede
presentar la seleccin adversa de solicitantes de crdito con proyectos seguros y hacer
que el grupo de solicitantes restantes sea ms riesgoso. La tendencia es que los
prestatarios escogen proyectos ms arriesgados si las tasas de inters suben debido a
que esto afecta sus flujos de caja, de hecho el proyecto genera menos ingresos. Las
entidades financieras alcanzan un rendimiento mximo a una tasa de inters ptima.
10
de retorno del proyecto. Esto es, inicialmente la informacin es simtrica pero al final pasa
a ser asimtrica. El prestatario podra afirmar que su retorno no es el esperado y que no
est en posibilidad de devolver la totalidad del prstamo. La existencia de este riesgo moral
lleva al banco a incurrir en costos adicionales (i.e., de control) o a tomar decisiones de
incrementar la tasa de inters lo cual aumenta la probabilidad de insolvencia. Algunos
estudios han concluido que la seleccin adversa y el riesgo moral hacen que las garantas
elevadas se relacionen con los prestatarios ms riesgosos. No obstante, otros estudios
concluyen que el nivel de garanta est negativamente correlacionado con el nivel de riesgo
del prestatario. En un entorno dinmico, el riesgo moral puede ser suavizado a travs de
la definicin de varios contratos que dependen del comportamiento de pago del prestatario.
Algunas investigaciones macroeconmicas de los mercados de crdito han demostrado
que este tipo de informacin asimtrica puede tener una gran variedad de consecuencias
importantes a nivel microeconmico: pueden llevar al equilibrio del racionamiento del
crdito, pueden explicar por qu los contratos en los mercados de crdito en ciertas
ocasiones adquieren la forma de contratos de deuda, pueden proveer una explicacin de
la intermediacin financiera y pueden crear ineficiencias que hacen que el gobierno deba
intervenir. Tanto la microeconoma como la macroeconoma son importantes para analizar
y explicar las imperfecciones del mercado de crdito. La macroeconoma ha orientado sus
esfuerzos en dos direcciones:
1.- En los modelos tradicionales, las polticas de restriccin monetaria afectan la demanda
agregada reduciendo el inventario de dinero y elevando las tasas de inters para disminuir
el circulante en el mercado. Altas tasas de inters causan que los clientes reduzcan sus
compras. Investigaciones sobre las imperfecciones del mercado de crdito separan en dos
ese tema: a) El rol especial del dinero a travs de la reduccin de las reservas en los
bancos, de forma tal que las polticas monetarias pueden impactar directamente la
capacidad de los bancos para prestar dinero. De igual forma, los mecanismos de
transmisin pueden operar en parte a travs del impacto directo en los prstamos de los
bancos. b) Algunos autores manifiestan que el racionamiento de crdito es un tema central
y clave como mecanismo de transmisin. Si los bancos son importantes en la
determinacin de la demanda agregada entonces los choques en el proceso de
intermediacin afectarn la demanda. La reduccin en los prstamos se logra mediante el
incremento de las tasas de inters o a travs de su racionamiento.
11
2.- Algunos autores han demostrado cmo las imperfecciones del mercado financiero
pueden amplificar los efectos de los disturbios e introducir nuevos mecanismos de
propagacin en la economa. Mientras menor sea la expansin financiera o mayor sea la
probabilidad de quiebra, ms importante sern las imperfecciones en los mercados de
crdito. La correlacin entre las medidas agregadas de crdito y la actividad real es tan
alta y estable en el tiempo como la correlacin entre el dinero y la produccin. Las medidas
de los disturbios en los mercados financieros predicen adecuadamente la real actividad
econmica, tal es el caso de la Gran Depresin. Estos hechos estilizados acerca del ciclo
de los negocios son ms consistentes con las teoras enfocadas en las imperfecciones del
mercado de capitales que con las teoras tradicionales.
El 14 de Octubre de 2013, Portafolio.com hace referencia a los estudios realizados por
Eugene Fama, Lars Peter Hansen y Robert Shiller quienes ganaron el Nobel De Economa
2013 por investigaciones que han mejorado el pronstico de los precios de activos a largo
plazo, desarrollado nuevos mtodos para el estudio de las tendencias en los mercados de
activos y contribuido a la conformacin de ndices en mercados burstiles. La Real
Academia reconoci sus esfuerzos por pronosticar el comportamiento de los precios de
activos financieros, aunque desde perspectivas opuestas. Lars Peter Hansen ha
construido modelos economtricos que buscan pronosticar el precio de activos (como las
acciones en la Bolsa) y es cercano a los conceptos de Fama.
Robert J. Shiller estableci a principios de los 80 una hiptesis contraria, demostrando que
la actuacin de los inversionistas responde a patrones no racionales pero eventualmente
pronosticables. El artculo cita que la Real Academia sostiene que: "No hay manera de
predecir el precio de las acciones y bonos en los prximos das o semanas, pero es muy
posible prever el curso amplio de estos precios durante perodos ms largos, como los
prximos tres a cinco aos". El Dr. Shiller ayud a crear un indicador de precios de
viviendas en Estados Unidos que es seguido de cerca por el mercado. Fama, ha sido
llamado el padre de las finanzas modernas y es conocido por investigaciones que muestran
que algunos grupos de acciones tienden a tener un rendimiento mejor que el promedio en
el tiempo.
12
manifiesto una serie de regularidades importantes que nos ayudan a generar una mejor
explicacin". (Elmundo.es 14/10/13)
13
La asignacin del mercado no est siendo eficiente. Para este modelo se asume que la
informacin es asimtrica. Si no existe informacin asimtrica entonces P = por lo tanto
14
(r) = E ( P | R > Pr )
(1)
L
1
1
C
x
B
B
A
r0
r1
rx
L
B
r1 ry
15
p0
p1
. La razn
p1 / po
es
16
L
L
L
B
B
Figura 3 - Colapso en el
Mercado de Crdito
L B
Figura 4 - Incremento
en Tasa
El gobierno juega un papel clave en la asignacin del crdito para los mercados sin
restricciones. Una condicin necesaria para que el gobierno intervenga es la
heterogeneidad no observable entre los deudores con respecto a la probabilidad de
quiebra. A veces es necesario que el gobierno elimine algunos riesgos del sector privado
garantizando ciertos arreglos financieros o actuando como prestador de ltima instancia.
El equilibrio del mercado de prstamos debe ser caracterizado por el racionamiento del
crdito. Los bancos prestamistas estn preocupados por la tasa de inters que reciben y
el riesgo del prstamo en cuanto a su cumplimiento de pago. La tasa de inters puede
afectar este riesgo en dos sentidos: ordenamiento potencial de los prestamistas (seleccin
17
adversa) y afectar las acciones de los prestamistas (incentivos). Los dos efectos son
derivados de la informacin imperfecta residual de los mercados de prstamos luego que
los bancos han evaluado las solicitudes de crdito. Cuando la tasa de inters (precio)
afecta la naturaleza de la operacin el mercado no se podra equilibrar.
La seleccin adversa de tasas de inters se complica ya que cada cliente tiene diferentes
probabilidades de pago. El banco tiene un retorno esperado que depende de esta
probabilidad de cumplimiento (o incumplimiento 1 p) por lo que desea conocer quienes
tienen ms posibilidad para pagar y para esto utiliza algunas tcnicas de deteccin y
anlisis (screening). Una tcnica es la misma tasa de inters que el cliente est dispuesto
a pagar. Mientras ms alta sea la tasa se tendr un peor escenario de riesgo. Al cliente
no le interesa realmente el valor de la tasa y muy probablemente es porque l mismo siente
que su probabilidad de pago es baja. Si las tasas se incrementan entonces el riesgo
promedio tambin subir haciendo que el banco tenga menores utilidades. Esto no solo
ocurre con la tasa de inters, el cambio en cualquiera de las condiciones del prstamo
puede afectar el comportamiento del cliente en el pago. Altas tasas de inters podran
causar que las empresas disminuyan la probabilidad de xito de los proyectos en los cuales
estn invirtiendo los dineros que han prestado, su flujo de caja se vera afectado al tener
que pagar altos intereses y no poder cubrir los costos de los proyectos. Es claro que el
banco no puede controlar las acciones del cliente por lo que intenta definir todas las
condiciones en el contrato para inducir al cliente hacia el comportamiento que el banco
necesita y filtrar (escoger) aquellos clientes con bajo riesgo. El banco intentar definir una
tasa ptima que le permita maximizar el retorno esperado. Tanto la demanda de
prstamos como la oferta de los fondos estn en funcin de la tasa de inters. El banco no
debera prestar por encima de la tasa ptima.
Existen otras condiciones del crdito adems de la tasa de inters. Estas son: el monto del
crdito y el valor de la garanta. Un incremento en las garantas podra reducir el retorno
esperado por el Banco. Podra no ser de utilidad incrementar el valor de la garanta cuando
el banco tiene una gran demanda de crdito. Por otro lado, algunos estudios demuestran
como la probabilidad de default de un cliente se incrementa cuando el valor a
desembolsar aumenta. El racionamiento de crdito se presenta en dos situaciones: a) a
pesar que los clientes parecen ser iguales, a unos se les presta y a otros no. A estos
ltimos no se les prestara ni siquiera subindoles la tasa de inters. b) cierto grupo de
18
1.- La tasa de inters puede ser usada como una herramienta de evaluacin de crdito.
Cada compaa tiene una distribucin de probabilidad de retorno diferente. es un
proyecto y R su retorno. Si F(R, ) es la funcin de distribucin y f(R, ) es la funcin de
densidad, para un inters ^r, existe un valor crtico ^ para el cual un cliente pide prestado
a un banco sii > ^. La posibilidad de no pago se presenta si C + R <= B(1 + ^r), donde
C es la garanta, R el retorno, B el valor desembolsado y ^r la tasa de inters. El retorno
neto
del
cliente
es
(R,^r)=max(R-(1+^r)B;-C)
el
retorno
del
banco
es
por debajo de la tasa a la cual los clientes no aplicaran al crdito, se incrementa. Por otro
lado, el retorno esperado de un crdito para un banco se reduce en funcin del riesgo del
prstamo.
Estas son las premisas: el cliente posee un patrimonio dado, tanto el cliente como el banco
tienen un riesgo neutro, la oferta de fondos de un banco no est afectada por la tasa de
inters que estos aplican a sus clientes, se conoce el costo del proyecto y ste es
indivisible. Si existe un nmero discreto de clientes potenciales con un diferente, la media
de (^r) no ser una funcin montona de ^r. Esta es una condicin suficiente para que la
seleccin adversa se dirija hacia una funcin no montona de la media de (^r). Si la media
de (^r) tiene una moda interior, existen funciones de oferta de fondos de tal manera que
el equilibrio competitivo implica el racionamiento del crdito.
La demanda de fondos depende de ^r y la oferta de . La demanda de prstamos es una
funcin decreciente de la tasa de inters, L(D). La oferta L(S) es una funcin creciente de
. La demanda de fondos en ^r* excede la oferta de fondos en ^r*. El exceso de demanda
est dado por Z. En r(m) la demanda es igual a la oferta pero r(m) no es una tasa de
19
equilibrio. Si la media de (^r) tiene varias modas, el equilibrio del mercado puede ser
caracterizado por una o dos tasas de inters.
Algunos clientes son ms aversos al riesgo que otros. Estas diferencias se reflejan cuando
los clientes seleccionan un proyecto afectando la tasa de inters ptima del banco. Altas
tasas de inters pueden hacer inviables los proyectos con bajo retorno medio pero no
afectarn los proyectos riesgosos. El retorno medio del banco es ms bajo en los proyectos
riesgosos.
20
Por qu los bancos no reducen la relacin deuda-patrimonio de sus clientes? Existen tres
implicaciones de incrementar los requerimientos de garanta de los prstamos: financiar
pequeos proyectos, incrementar el riesgo de los prstamos y, los clientes potenciales
tienen diferentes patrimonios y sus proyectos requieren la misma inversin. Los
requerimientos de garanta tienen efectos de seleccin adversa (informacin asimtrica) y
pueden llevar a un nivel ptimo interior del banco. Se asume que todos los clientes son
aversos al riesgo y tienen una misma funcin de utilidad U(W), U>0, U<0, pero diferente
riqueza inicial Wo. p(R) es la probabilidad de xito, siendo R el retorno. El Banco no tiene
la capacidad de conocer los detalles de la forma cmo evoluciona tanto la riqueza como
los proyectos del cliente. El contrato {C,^r} acta como un mecanismo de evaluacin y
anlisis: existen dos valores crticos de Wo, ^Wo y ^^Wo, tal que si se reduce la aversin
absoluta al riesgo, todos los clientes con riqueza ^Wo<Wo< ^^Wo aplicarn a los
prstamos. Si existe una aversin absoluta al riesgo, los individuos ms ricos tomaran los
proyectos ms riesgosos: dR/dWo > 0. Las garantas incrementan el retorno del banco
para cualquier cliente dado: dp/dC > 0. Existe un efecto adverso al incrementar los
requerimientos de colateral: dWo/dC > 0. De igual forma, existe un efecto adverso en los
incentivos ya que el banco tiene un control limitado sobre las acciones de los clientes.
Incrementar el valor prestado a un cliente puede hacer que en un futuro el banco tenga
que volver a incrementar este valor.
En un grupo de clientes similares algunos podran recibir un prstamo y otros no. Los
clientes potenciales a los que se les niega un prstamo no estaran en posibilidad de recibir
el prstamo as manifiesten su deseo de pagar a una tasa mayor o entregar una garanta
mayor a la requerida por el banco. Incrementar la tasa de inters o las garantas puede
incrementar el riesgo en el portafolio de prstamos del banco y de esta manera reducir sus
utilidades. Las restricciones crediticias limitan el nmero de prstamos que el banco
desembolsar ms que limitar el tamao de los prstamos o hacer que la tasa de inters
cargada se incremente en funcin del valor del prstamo.
21
La ley de la oferta y la demanda no es de hecho una ley y no debe ser vista como una
asuncin necesaria dentro del anlisis de competencia. Es ms el resultado generado por
las asunciones de que los precios no tienen ordenamiento ni efectos por incentivos. El
resultado usual de la teora econmica, que los precios limpian el mercado, es un modelo
especfico y no es una propiedad general de los mercados el racionamiento del crdito y
del desempleo no son fantasmas son una realidad.
22
El riesgo de crdito consiste en la posibilidad del incumplimiento del pago, bien sea para
una transaccin puntual o cualquier momento futuro de la obligacin. Tradicionalmente, sin
embargo, el riesgo de crdito se considera como riesgo de precumplimiento. A travs de
diferentes tcnicas, metodologas y herramientas es posible construir la distribucin de
probabilidad de las prdidas de crdito de una cartera determinada basados en el posible
incumplimiento de los distintos crditos de la cartera. Los principales impulsores de riesgo
de la cartera de crdito son las correlaciones entre los valores predeterminados.
La siguiente figura presenta el modelo general del Proceso de Crdito dividido en 5 fases:
desarrollo de negocios (venta o colocacin), anlisis y decisin, desembolso y registro de
garantas, gestin de cartera y cobranza (recuperacin de cartera).
23
Desde mediados del siglo pasado, el criterio utilizado para establecer la capacidad de pago
de un cliente y poder otorgarle un crdito ha sido el flujo de caja. Las unidades de crdito
deben asegurar que los riesgos se mantengan en niveles razonables que permitan una
buena rentabilidad. Estas debern determinar el riesgo que significar para la institucin
otorgar un determinado crdito y para ello es necesario conocer y analizar la informacin
cualitativa y cuantitativa de los clientes que permita calcular con exactitud la capacidad de
pago. A su vez, deber contar con estudios de mercado y sectoriales y lo ms importante,
crear sistemas estndares de evaluacin de crditos. Todo crdito debe pasar por una
etapa de evaluacin previa, el anlisis de crdito no pretende acabar con el 100% de la
incertidumbre del futuro, sino reducirla. Es necesario considerar el comportamiento pasado
del cliente en todos los sectores de la economa (si se cuenta con esta informacin) por lo
que la decisin crediticia se toma teniendo en cuenta los antecedentes histricos y
presentes. El cliente realiza una solicitud de crdito en la que especifica sus requerimientos
y/o necesidades (plazo, tipo de amortizacin, periodos de gracia, valores residuales, tasa
de inters, fondos, objeto, la forma de pago, etc.). Es necesario estar en continuo
seguimiento del crdito ya que la economa del cliente puede variar de un momento a otro
y el banco no est en la capacidad de conocer esta situacin a priori.
24
Entre otros los riesgos y las variables a considerar son: viabilidad de retorno del crdito,
probabilidad de prdida, capacidad financiera, mantenimiento de valor de la moneda,
fluctuaciones de las tasas de inters, plazos, mercado, tecnologa, eficiencia (costos),
abastecimiento, cobranza, direccin o capacidad gerencial, manejo de anticipos, no
renovacin de fuente productiva, situacin patrimonial y/o atrasos continuos en pago de
capital e intereses. De igual forma, es preciso tener en cuenta las variables
macroeconmicas que afectan a un pas, tales como polticas de incentivo a importaciones
o exportaciones, polticas tributarias, costo del dinero, movimiento de capital, poltica
monetaria, precios internacionales, conflictos internacionales, inflacin, crecimiento
econmico, pobreza y subdesarrollo, dependencia de otros pases, desarrollo social de un
pas, huelgas sindicales o problemas sociales, procesos democrticos de elecciones, etc.
Usualmente los riesgos de crdito y de mercado se miden por separado. El riesgo de
crdito se origina en el hecho de que la contraparte (cliente) no pueda cumplir con sus
obligaciones o pagos por mltiples razones. En el nivel ms bsico, implica el riesgo de no
pago de los activos, tales como un prstamo, obligacin, o alguna otra garanta o contrato.
Cuando se negocia un activo, como es el caso de un bono corporativo, de alguna forma el
riesgo de mercado tambin refleja un riesgo de crdito. Algunas de las variaciones del
precio pueden obedecer a los movimientos en los tipos de inters libres de riesgo, que es
el riesgo de mercado puro. El resto va a reflejar la evolucin de la percepcin del mercado
sobre la probabilidad de incumplimiento. Por lo tanto, para los activos negociados no existe
una clara delimitacin del riesgo de crdito y de mercado lo que conlleva a una clasificacin
arbitraria. [16]. El siguiente cuadro muestra los diferentes riesgos que afrontan las
entidades financieras: [24].
25
El acuerdo Basilea II de 1999, tiene como objetivo principal que los requerimientos de
capital sean ms sensibles al riesgo, promoviendo tambin la utilizacin de modelos
internos para la medicin del mismo. Una de las principales ventajas de este acuerdo es
el incentivo que se genera al desarrollo de prcticas de gestin de riesgos ms sofisticadas
por parte de las instituciones financieras. Para determinar el riesgo de crdito, Basilea II
incorpora la posibilidad de optar entre dos mtodos para calcularlo: mtodo estndar y
mtodo de calificaciones internas IRB (Internal Rating Based). En el primero, el cual ya
estaba contenido en el acuerdo anterior y fue modificado sensiblemente, los bancos deben
clasificar sus exposiciones al riesgo de crdito en categoras supervisoras en funcin de
las caractersticas observables de dichas exposiciones. Se establecen ponderaciones de
riesgo fijas que corresponden a cada categora y se utilizan las calificaciones externas para
diferenciar las ponderaciones. El mtodo IRB, por su parte, descansa en clculos internos
de las instituciones para medir el riesgo de crdito. Las exigencias de capital se determinan
26
combinando datos cuantitativos proporcionados por los bancos con frmulas especificadas
por el Comit de Basilea. [5]
Las crisis econmicas estn originadas por la combinacin de mltiples variables. El sector
financiero no es ajeno a los impactos que sobre otros sectores de la economa se
presentan ocasionando un efecto en cadena o domin que afecta las finanzas de los
pases y de las empresas. La tasa de inters, los productos y servicios e incluso la
globalizacin misma son factores que afectan el apalancamiento, los riesgos de liquidez y
de crdito ya que pueden causar un endeudamiento excesivo y la sobrevaloracin de
activos. Una primera reaccin de los gobiernos es la disminucin de las tasas a travs de
su poltica monetaria intentando disminuir el impacto en la cada de la demanda y del
consumo. A partir del 2009, la economa intenta recuperar la confianza y el dinamismo del
sector privado reformando el sistema financiero internacional y local adoptando aquellas
polticas internacionales necesarias para hacer ms slido el sector financiero colombiano.
27
En lo que hace referencia al estudio de esta tesis, el acuerdo de Basilea III aumenta la
exigencia con respecto al capital regulatorio que tiene que mantener una entidad financiera
para estar en la capacidad de responder a riesgos que se materializan y causan prdidas.
Las entidades financieras propenden por tener negocios menos riesgosos ya que al
comprometer recursos en ellos, en trminos de su cartera crediticia, stas deben tener ms
capital para cubrir posibles prdidas. Las nuevas reglas reducen el riesgo moral (moral
hazard) de asumir riesgos demasiado elevados disminuyendo as el riesgo crdito de una
entidad. [42]
28
Tras las reformas de principios de la dcada de 1990, hubo una explosin de crdito en
Colombia durante el periodo de 1993-1996. Sin embargo, la disponibilidad de crdito se
comprimi considerablemente durante la crisis financiera de 1998-1999. A partir de 2005
ha repuntado disminuyendo el volumen de prstamos morosos. Los bancos juegan un
papel importante tanto en los mercados de crdito al consumo como comercial en
Colombia, aunque en aos recientes han estado enfrentando una mayor competencia de
otras instituciones financieras, sobretodo en el segmento de crdito al consumo. Los
segmentos de crdito de consumo y comercial han mostrado un crecimiento constante a
lo largo de los ltimos aos, el crdito hipotecario sigue disminuyendo. [37]
La SFC ha considerado los impactos que tuvo BASILEA III frente a la medicin del riesgo
de crdito con el objeto de evitar situaciones adversas o negativas sobre el sistema
29
financiero. En 2011 la Asobancaria realiz una revisin de los principales aspectos a tener
en cuenta [42].:
Los nuevos indicadores de Basilea III garantizando que la medicin del riesgo crdito
en las entidades considere las variables adecuadas y arroje resultados confiables.
La regulacin actual del pas no cuenta con todos los lmites que propone Basilea, a
excepcin de:
o
Manejo del riesgo de crdito a travs del ciclo de vida del cliente
Aseguramiento de los procesos que permiten que todos los ingresos generados sean
correctamente facturados o contabilizados
30
31
32
33
irrecuperable. La existencia e idoneidad de las garantas que respaldan los crditos son
un factor determinante a considerar en este contexto.
Al cierre de 2010, el sector financiero Colombiano estaba compuesto por 57 instituciones
o entidades financieras: 23 bancos comerciales, 4 corporaciones financieras, 22
compaas de financiamiento comercial y 8 cooperativas de carcter financiero. Se prev
que el perfeccionamiento del sector continuar a corto y largo plazo a travs de fusiones y
adquisiciones. La crisis financiera de 1998-1999 condujo a la consolidacin del sector
financiero privado en tres grupos domsticos y algunos grupos de propiedad extranjera
que dominan la industria de servicios financieros. Los dos conglomerados financieros ms
grandes, Grupo Sarmiento Angulo (Grupo Aval) y Grupo Empresarial Antioqueo
(BanColombia), controlaban el 39.6 por ciento de los activos financieros del pas a
diciembre de 2003. Todos los bancos privados principales tienen grandes intereses de
capital en uno o ms almacenes de depsito, compaas financieras, corporaciones de
ahorro y vivienda, compaas fiduciarias, de fondos de retiro o arrendamiento. Los bancos
comerciales tpicamente tambin proveen servicios bancarios al menudeo a clientes
individuales, incluyendo hipotecas, prstamos al consumo y tarjetas de crdito. Los bancos
hipotecarios proveen crdito para la construccin o adquisicin de viviendas nuevas o
usadas. Los bancos cooperativos (anteriormente Cajas de Ahorro) proveen financiamiento
a los clientes que depositan un monto mnimo para recibir prstamos para educacin,
salud, vivienda y bienes de consumo. Las corporaciones financieras (CFs), fungen como
bancos de inversin, dando servicio a las necesidades de las finanzas corporativas. Otras
instituciones de otorgamiento de crdito de los sectores financiero y no financiero
relevantes son: las compaas arrendadoras, las compaas de financiamiento comercial,
las compaas de factoraje y los proveedores de crdito no financiero en donde se incluyen
los supermercados y otras tiendas de aparatos electrnicos al menudeo. [36]
En el sector de prstamos comerciales, hay crdito a corto plazo disponible para las
compaas de buena reputacin a travs de los bancos comerciales y las CFCs, pero la
demanda de prstamos supera la oferta. Las decisiones crediticias en Colombia estn
basadas en la rentabilidad del cliente o el grado al cual la empresa ya usa los servicios del
banco. Los intereses suelen pagarse por adelantado y normalmente se requieren balances
de compensacin. Se usan las lneas de sobregiro para financiar desequilibrios de flujo de
caja a corto plazo.
34
El 2010 se caracteriz por una importante reactivacin del crdito. Al cierre del ao, la
cartera bruta ascendi a $175.90 billones, superior en $25.33 billones frente a lo registrado
en diciembre de 2009. Este incremento es destacable si se compara con el aumento del
saldo entre diciembre de 2008 y 2009, el cual fue de $3.40 billones. La distribucin
porcentual de los diferentes tipos de crdito es: Comercial 63,8%, Consumo 27,4%,
Vivienda 6,4% y Microcrdito 2,4% (Composicin de la cartera bruta a Diciembre de 2010).
En trminos absolutos y relativos, el incremento en el saldo de la cartera durante el ao
2011 obedeci principalmente al dinamismo que mostraron las modalidades comercial y
de consumo. El saldo de la cartera comercial inici un proceso de crecimiento sostenido
desde comienzos de 2010, comportamiento acorde con los principales indicadores de la
economa colombiana, los cuales mostraron un importante dinamismo durante el ao,
especialmente los de produccin industrial y de comercio al por menor. As mismo, la
cartera de consumo mantuvo tambin durante 2010 un comportamiento positivo,
consistente con la tendencia del consumo de los hogares, que registr un crecimiento
nominal anual en el tercer trimestre de 2010 de 7.39%, cifra superior a la observada en el
mismo periodo del ao anterior (4.26%). [35]
35
Las RNA hacen parte del campo de la computacin biolgica y pueden ser usadas en la
prediccin, clasificacin y solucin de problemas complejos en diferentes reas de
conocimiento. Las RNA son sistemas con la capacidad de aprender a travs de un
entrenamiento, tambin conocido como la interpretacin que ellas hacen de la informacin
que est entrando al sistema.
Las RNA son modelos que permiten construir sistemas de procesamiento de informacin
paralelo, distribuido y adaptativo que pueden presentar un cierto comportamiento
inteligente. [22]. Las RNA simulan o intentan simular el funcionamiento de las neuronas
biolgicas. La siguiente figura representa la estructura de una neurona biolgica:
38
de
programas
de
computacin
que
procesan
reglas
de
decisin.
39
que realiza cualquier cmputo y al estar desarrollado con funciones lgicas se puede
concluir que todo problema computacional se resuelve a travs de funciones booleanas
[Hopcroff 1984] (cita referida en Redes Neuronales y Sistemas Difusos [23]).
Adicionalmente, se puede decir que las redes neuronales tienen la capacidad de resolver
cualquier problema computacional. Los problemas que requieren un extenso algoritmo o
que precisan almacenar un gran nmero de datos, aprovechan mejor la estructura de una
red neuronal. Por lo tanto, un ordenador resulta ms eficiente en la ejecucin de tareas
aritmticas y lgicas, pero una RNA resolver mejor problemas que deban tratar con
grandes bases de datos que almacenan importantes volmenes de informacin como lo
son el reconocimiento de patrones en ambiente natural. [23]
Los modelos analticos predictivos neuronales pueden ser desarrollados utilizando datos
especficos ms que datos genricos, factor esencial que los hace muy precisos. Se
utilizan los datos histricos, con resultados conocidos, para "entrenar" la computadora
neuronal con el fin de aprender patrones y caractersticas dentro de los datos, por ejemplo,
la edad, las ganancias, el tiempo en el trabajo, etc. Estos patrones son utilizados para crear
modelos que puedan diferenciar, por ejemplo, entre: el fraude y aplicaciones genuinas, el
riesgo de crdito y los solicitantes con capacidad crediticia, o entre esos clientes que
posiblemente permanecern leales y aquellos que posiblemente se cambiarn a otra
compaa.
Por otro lado, los modelos de comportamiento se utilizan para perfilar lo que podra hacer
o no un cliente. Los perfiles nicos son aprendidos automticamente y mantenidos para
cada cliente, los cuales evolucionan para reflejar cualquier cambio en el comportamiento
normal, de este modo cualquier actividad anmala e inusual es fcilmente reconocida. Los
modelos de comportamiento se pueden configurar para un ptimo rendimiento y ofrecen
la facilidad de adaptarse a la realimentacin permitiendo que la solucin aprenda del
resultado
de
las
investigaciones.
Adems,
los
modelos
de
comportamiento
constantemente adaptan los perfiles de los clientes para reflejar los cambios graduales del
comportamiento en el tiempo. Esto mejora el rendimiento garantizando que los perfiles
nunca envejezcan y representen, siempre con exactitud, el comportamiento normal de los
clientes.
40
Las RNA se estn utilizando, tanto de forma individual, como unidas a otros mtodos en
mltiples campos, como pueden ser la Ingeniera, Fsica y Biologa. Dentro del campo
econmico, estn siendo usadas en prediccin y clasificacin, siendo respectivamente el
perceptrn multicapa y los mapas auto-organizativos, los tipos de redes ms utilizadas
41
magnitudes econmicas, casi todos los trabajos, se centran en los mercados financieros:
tipos de inters, tipos de cambio, ndices burstiles de distintos pases. [1]
Colombia ha tenido la oportunidad de contar con varios estudios que utilizan las redes
neuronales para el manejo de grandes volmenes de informacin. Los profesionales ms
interesados en esta materia han sido los Ingenieros de Sistemas. Una de las industrias
que posee varios ejemplos de su aplicabilidad es la del Petrleo en donde se ha
desarrollado software para generar y entrenar redes neuronales, con el fin de aplicarla a
la solucin de algunos problemas comunes encontrados en esa industria. Estos problemas
son de gran complejidad y requieren de un manejo matemtico dispendioso que al usar
mtodos tradicionales no se obtienen los mejores resultados. Las redes neuronales han
mostrado ser una alternativa eficiente en la solucin de problemas donde es necesario
correlacionar parmetros y la industria de los hidrocarburos las ha utilizado en diferentes
reas.
En Colombia se han adelantado algunos estudios que permiten aplicar las RNA a los
problemas de ndole econmico y anlisis financiero. Un ejemplo es el trabajo realizado
con el fin de estudiar la relacin no lineal entre el dinero y la inflacin en Colombia a travs
de una red neuronal artificial, utilizando informacin mensual de la variacin del IPC y del
agregado monetario M3, desde enero de 1982 hasta febrero de 2005. [2]. De igual forma,
la Subgerencia de Estudios Econmicos del Banco de la Repblica elabor en 2002 un
trabajo sobre La inflacin en Colombia: una aproximacin desde las redes neuronales. [19].
En 2009 se desarroll la evaluacin de pronstico de una red neuronal sobre el PIB en
Colombia por parte del Banco de la Repblica. [44]
A finales del siglo pasado, las redes neuronales facilitaron la prediccin de las crisis
financieras y los sistemas borrosos permitieron aconsejar si un crdito poda concederse
o no. Estas nuevas tecnologas permiten incorporar inteligencia en los sistemas de
procesamiento y anlisis de informacin y an ms, en el corto plazo soportarn la
construccin de mquinas que emulan la capacidad humana de toma de decisiones en
entornos imprecisos, plagados de incertidumbre y cuyo principal objetivo ser acercarse a
la verdad. Adicionalmente, permiten pasar rpidamente desde el muestreo, la observacin
y el anlisis a la transformacin y sntesis de la informacin. A travs de la sinergia de sus
42
Aunque no ser del alcance de este estudio, es preciso mencionar que en paralelo al
desarrollo de las RNA, tambin ha crecido el inters y utilizacin de la lgica borrosa y
sistemas difusos basados en clculos de reglas si-entonces (variable lingstica) que
permiten modelar el comportamiento de sistemas sin recurrir a ecuaciones diferenciales
explotando los niveles o rangos de tolerancia. Un sistema borroso experto permite
incorporar inteligencia en dispositivos pequeos (i.e., componentes electrnicos,
electrodomsticos, video cmaras, robtica, etc.).
43
La prediccin de cotizaciones burstiles hace uso de RNA que pretende encontrar una
funcin que relaciona mltiples variables de entrada con los valores de cotizacin actuales.
La Adalina se viene utilizando como filtro adaptativo para cancelar el ruido en la transmisin
de seales, esto es, suprimir el eco en las comunicaciones telefnicas por satlite. Las
RNA pueden ser aplicadas a los procesos de control de la calidad donde se evala si
determinado producto cumple o no con las especificaciones demandadas. De igual forma,
han sido aplicadas en la prediccin de la demanda, anlisis econmicos e incluso en la
robtica. De esta forma, las RNA tienen diferentes aplicabilidades en un amplio rango de
segmentos industriales. Estos son algunos ejemplos de industrias que utilizan las redes
neuronales y sus aplicaciones:
INDUSTRIA
ARQUEOLOGIA
BANCA (Modelos)
TARJETAS DE CREDITO
DEFENSA
CIENCIAS AMBIENTALES
FINANZAS E INVERSIONES
(Modelos)
SABORES Y FRAGANCIAS
DEFENSA CIVIL
SEGUROS/REASEGUROS
MANUFACTURA
MERCADEO
APLICACIN EJEMPLO
Identificacin y fechado de huesos y artefactos
Suscripcin de prstamos
Calificacin crediticia
Deteccin de transacciones fraudulentas
Comportamiento de compra
Identificacin de objetivos
Prediccin de corrientes areas y martimas
Calidad del aire y del agua
Prediccin de inversiones
Fluctuacin de monedas
Prediccin de sabores de cervezas y vinos
Identificacin de terroristas potenciales
Suscripcin de plizas
Estimacin de reservas por prdidas
Control de calidad y Six Sigma
Prospeccin precisa de objetivos
Calificacin y comparacin de mtodos y campaas
de mercadeo
Diagnstico de tumores y tejidos
Diagnstico de ataques cardacos
Anlisis de cenizas de plantas carbonferas
44
INDUSTRIA
FARMACEUTICA
PSICOLOGIA
BIENES RAICES
INVESTIGACION CIENTIFICA
TELECOMUNICACIONES
TRANSPORTE
SERVICIOS PUBLICOS
ROBOTICA
INDUSTRIA ESPACIAL
PRODUCCION Y
MANUFACTURA
LENGUAGE Y TRADUCCION
APLICACIN EJEMPLO
Prediccin del precio de la energa
Estimacin de reservas petrolferas
Efectividad de nuevos frmacos
Prediccin de comportamientos criminales y
psicticos
Valuacin de bienes inmuebles
Identificacin de especmenes
Secuenciacin de protenas
Deteccin de fallas en lneas de redes
Mantenimiento de carreteras
Control del trfico
Bloqueo de vas y sistemas de enrutamiento
Deteccin de fallas en redes de energa
Control de trayectoria
Sistemas de visin
Alto desempeo en vuelos con piloto automtico y
vuelos no tripulados
Simuladores de vuelo
Componentes de deteccin de fallas en los vuelos
Procesos de control de manufactura
Mquinas y procesos de diagnstico
Identificacin en tiempo real de partculas
Reconocimiento y comprensin del lenguaje
Existen empresas que han desarrollado aplicaciones de redes neuronales para calcular la
evaluacin de crditos (Credit Scoring) y tambin para calcular el riesgo hipotecario. Otras
empresas utilizan las redes neuronales para asegurar sus procesos automatizados de
concesin de prstamos hipotecarios con un 84% de xito en dicho proceso. [21]
Las redes neuronales artificiales pueden aplicarse en anlisis de los patrones generados,
debido a su confiabilidad y pertinencia para la evaluacin de riesgos financieros. Estas
permiten con base en los descriptores generar o inferir nuevo conocimiento, la buena
eleccin de los descriptores garantiza la efectividad de la respuesta suministrada por una
red neuronal artificial. [27]
Las RNA son un sistema para el tratamiento de informacin y se han convertido en una
herramienta de anlisis para abordar situaciones financieras que incluso pueden llegar a
incluir la automatizacin de procesos operativos y la evaluacin del riesgo. Las RNA
45
46
tcnicas
paramtricas,
determinsticas
estocsticas,
presentan
algunos
47
Para los agentes econmicos conocer el posible comportamiento futuro de las variables
macroeconmicas es fundamental. Esto le permite al Gobierno planear su presupuesto y
al Banco Central definir su poltica monetaria. De igual forma, le ayuda a las entidades
financieras a definir su estrategia con base en la estimacin de los recursos que requerir
la economa para su desarrollo, esto es por ejemplo, cuanto capital de trabajo requerirn
las empresas para implementar sus proyectos de inversin.
48
49
Las redes neuronales artificiales (artificial neural systems) pueden modelar un sistema
nervioso o un fenmeno cognitivo, y aprender a partir de ejemplos utilizando computacin
paralela, distribuida y adaptativa. Estos sistemas imitan la estructura fsica del cerebro con
el objeto de reproducir algunas de sus capacidades. Las tecnologas neuronales y borrosas
pueden ser utilizadas en la resolucin de tareas relacionadas con el procesamiento de
seales y el reconocimiento de patrones. La misma naturaleza presenta una solucin: el
procesamiento auto-organizado fruto de la interaccin de un gran nmero de procesadores
elementales. En este mismo sentido, la naturaleza descubri que la codificacin en forma
50
wij
x j t
i tendr un
presinptica j y postsintica
negativo a inhibirla.
wij , x j t
w x
pesos) hi t wij , x j t
ij
(2)
f i ai t 1, h j t
de la neurona
ai t 1
y de su potencial postsinptico
51
La salida actual
yi t
de la neurona
F x x
yi t Fi f i ai t 1, wij , x j t (3)
yi t f i wij x j i (4)
j
52
aquella cuyas neuronas proporcionan la respuesta de la red neuronal. Una capa oculta es
aquella que no tiene una conexin directa con el entorno, es decir, que no se conecta a
rganos sensores ni efectores. Este tipo de capa proporciona a la red neuronal grados de
libertad adicionales, gracias a los cuales puede encontrar representaciones internas
correspondientes a determinados rasgos del entorno, proporcionando una mayor riqueza
computacional.[4]
ESTRUCTURA (ARQUITECTURA) DE LAS RNAS
53
1)
xi
2)
wij
3)
i, j
de los nodos
i y j
del nodo
Los modos de operacin de los sistemas neuronales son recuerdo o ejecucin y
aprendizaje o entrenamiento los cuales permiten realizar un procesamiento o cmputo
basndose en un conjunto de patrones de aprendizaje. Cuando los parmetros libres de
la red son ajustados usando un proceso de estimulacin por el entorno se dice que la red
neuronal tiene un proceso de aprendizaje. En otras palabras, el proceso de aprendizaje,
que usualmente es iterativo, consiste en determinar un conjunto de pesos sinpticos que
permita a la red realizar un procesamiento deseado bajo el rendimiento esperado. Los tipos
de aprendizaje bsicos en las redes son:
Los algoritmos de aprendizaje utilizan mtodos iterativos para minimizar una funcin de
coste que pueden causar problemas de convergencia que permite comprobar si la
arquitectura de la red y su regla de aprendizaje resuelven el problema. No es necesario
alcanzar un error pequeo en el aprendizaje ya que esto es costoso en tiempo y recursos
de procesamiento, se sugiere mejor llegar a una buena generalizacin. Las redes con
realimentacin son sistemas dinmicos no lineales que requieren parmetros que
aseguren la convergencia en la respuesta.
54
yi wij x j
(5)
j 1
preciso deducir los algoritmos de aprendizaje a partir de cierto criterio a optimizar lo que
se traduce en un procedimiento para alcanzar un conjunto de pesos ptimo que resuelva
un problema dado. Se propone el error cuadrtico medio como criterio para medir el
rendimiento de la red.
El perceptrn simple, modelo unidireccional, fue introducido por Rosenblatt en 1959. Est
compuesto por dos capas de neuronas: sensorial o de entradas y otra de salida (con
funcin de activacin tipo escaln uso de umbral).
Puede ser usado como clasificador o para representar funciones booleanas (salidas
binarias). El perceptrn es un dispositivo entrenable que permite determinar pesos
sinpticos que clasifican un conjunto de patrones a partir de un conjunto de ejemplos. Una
55
neurona tipo perceptrn representa un discriminador lineal por lo que no puede representar
la clase de funciones no separables linealmente. Pero esta limitacin puede solucionarse
a travs de la inclusin de ms capas en la arquitectura con lo que se tendr un perceptrn
multicapa. [23]
patrones x ;1
wi t 1 wi t / 2.x t i yi
Si se tiene que
/ 2
entonces
(7)
wi t .x t i yi
(8)
La Adalina (ADAptive Linear Neuron) propuesta por Widrow en 1959 utiliza una neurona
de respuesta lineal cuyas entradas pueden ser continuas e incorpora un parmetro
adicional que representa un umbral proporcionando un grado de libertad adicional.
n
yi t wij x j i , i,1 i m
(9)
j 1
56
La operacin de un MLP con una capa oculta y neuronas de salida lineal puede aproximar
hasta el nivel deseado una funcin continua en un intervalo convirtindose as en el
aproximador universal de funciones. Se puede expresar como:
i
Con
que es
57
el potencial
postsinptico o local. Se parte del error cuadrtico medio como funcin de costo:
E w ji , j , w kj ,
'
'
k
1 / 2
j t k f j w' kj y j ' k
(11)
wkj'
w ji
' k
y umbrales
3.- Calcular el incremento total actual de los pesos
4.- Actualizar pesos y umbrales
5.- Calcular el error actual
wkj' , w ji
E w ji , j , w' kj , k' ; t : t 1
y los umbrales
(14)
58
Las Redes Neuronales Probabilsticas (RNP) han sido utilizadas para la clasificacin y
agrupamiento de informacin. Estas redes se enmarcan dentro de los denominados
sistemas expertos o aplicaciones que simulan el proceso de anlisis y resolucin de
problemas que tendra un experto en un campo determinado. Las RNP tienen dos
objetivos: 1) estimar las distribuciones de probabilidad condicionadas a partir de un
conjunto de datos disponibles utilizando un mtodo de aprendizaje, y 2) generar nuevo
conocimiento a travs de tcnicas de propagacin. [6]
Las RNP pertenecen a las redes de funcin de base radial o RBF (por sus siglas en ingls:
Radial Basis Function). Las redes RBF estn compuestas por tres capas (generalmente).
La clasificacin se realiza a travs del anlisis de similitudes que guarda la informacin de
cada registro o patrn de entrada con el vector de entrenamiento. Los rasgos similares son
establecidos en la capa oculta donde sus neuronas estn encargadas de calcular la
distancia euclidea entre el vector de entrada
xi
y el vector de pesos
wj
o centroide. [40]
La representacin matemtica de la funcin radial que aplican las neuronas ocultas sobre
el vector de entrada viene definida por:
n
2
pi
ij
b pj exp i1
2 2
(15)
59
Como se mencion anteriormente, las redes neuronales probabilsticas (RNP) pueden ser
utilizadas para problemas de clasificacin de datos. En el proceso utilizado para problemas
de regresin se realiza un ajuste de pesos teniendo en cuenta el error presentado. Ahora
bien, para el proceso de clasificacin no se realiza ningn ajuste de pesos y slo los
patrones de salida son determinados mediante la comparacin y el clculo de distancias.
Funciona as: cuando una entrada es presentada, la primera capa calcula las distancias
desde el vector de entrada a los vectores de entrada entrenados y produce un vector cuyos
elementos indican cuan cercana est la entrada respecto a la entrada entrenada. La
segunda capa suma estas contribuciones para cada clase de entrada y produce con ellas
un vector de salida con las probabilidades. Finalmente, una funcin de transferencia en la
salida de la segunda capa del tipo competitiva coge la mxima de estas probabilidades y
produce un 1 para esa clase y cero para las dems. [13]
60
El modelo neuronal de mapas de caractersticas auto-organizados o SOFM (SelfOrganizing Feauture Maps) intenta reproducir la representacin de la informacin como lo
hace la corteza cerebral, la cual organiza espacialmente dicha representacin. Los SOFM
son conocidos como los mapas de Kohonen y son bastante eficaces en la clasificacin de
patrones, cuantificacin vectorial, reduccin de dimensiones, extraccin de rasgos,
monitoreo de procesos, anlisis exploratorio, visualizacin y minera de datos [Kohonen
1997] (cita referida en Redes Neuronales y Sistemas Difusos [23]). Las neuronas se
organizan en una arquitectura unidireccional de dos capas: 1) capa de entrada o sensorial
con m neuronas, 2) capa de procesamiento que forma el mapa de rasgos con nx x ny
neuronas que operan en paralelo.
61
Teuvo Kohonen introduce en las redes competitivas la funcin de vecindad creando los
mapas de rasgos auto-organizados o SOFM (Self-Ornanizing Feature Maps). Como en las
redes neuronales auto-organizadas, en los SOFM se declara una neurona ganadora. Esta
es la que tiene una distancia menor entre sus pesos sinpticos y el vector de datos de
entrada. Pero ahora, tiene, adems, una funcin de vecindad. Esta funcin define el
entorno alrededor de la neurona ganadora, y en la fase de aprendizaje se actualizan tanto
los pesos de la neurona ganadora como los pesos de las neuronas pertenecientes a la
vecindad. [12]
Las relaciones entre las neuronas prximas en el mapa son analizadas mediante una
funcin de vecindad que define el entorno alrededor de la neurona ganadora. Por lo tanto,
las neuronas prximas se sintonizan con patrones similares reflejando en el mapa una
imagen de la topologa del espacio de entrada. Los mapas auto-organizados (SOFM)
realizan la proyeccin no lineal de un espacio multidimensional de entrada sobre un
espacio discrecional de salida. La funcin de vecindad mejora el ritmo de convergencia y
permite que el sistema sea ms robusto ante variaciones en los valores iniciales de los
pesos.
El proceso de aprendizaje de los mapas auto-organizados (SOFM) consiste inicialmente
en una ordenacin global y luego un ajuste fino o especializacin de las neuronas. Este es
un ejemplo de un algoritmo auto-organizado [Martn del Brio y Sanz Molina 1993, Kohonen
1990] (cita referida en Redes Neuronales y Sistemas Difusos [23]):
1.- Inicializacin de los pesos sinpticos
wijk
xt
p x
wij
i i, j
entre
d 2 Wij , X wijk xk
(16)
k 1
g g1, g 2
(17)
62
Siendo
el ritmo de aprendizaje,
h.
la funcin de vecindad
xi
dxi
F t , x1, x2, ..., xn, (18)
dt
63
V
0, xi (19)
i 1 xi
n
El modelo de Hopfield fue el punto de partida para que las RNA renacieran con fuerza.
Este modelo est basado en la definicin de una funcin de energa de la red y utiliza
modelos de la fsica estadstica. Su arquitectura consiste de una sola capa donde las
neuronas (similares a las del perceptrn) estn conectadas entre s, un elemento de umbral
con entradas x j
y salidas
de las entradas ponderada con los pesos sinpticos menos el umbral, corresponde al
potencial postsinptico calculado por la neurona
hi t wij x j t i
(20)
Para obtener la salida digital de la neurona se aplica al potencial local una funcin de tipo
escaln
f .
yi t f hi t f wij x j t i xi t 1
j
(21)
Los esquemas de actualizacin o dinmicas pueden ser asncronos o modo serie (en un
instante t solo una neurona actualiza su estado) y sncronos o modo paralelo (en un
instante t varias neuronas actualizan su estado).
La red de Hopfield opera como una memoria auto-asociativa por lo que puede eliminar o
filtrar el ruido en patrones. El estado estable de la red puede ser un mnimo local de la
funcin de energa. La red almacena o memoriza estos resultados (mnimos locales) y en
esto consiste su esquema de aprendizaje. La regla de aprendizaje deber encontrar el
conjunto de pesos sinpticos W y que la funcin de energa tenga esos patrones como
mnimos locales (estados estables).
5.- Cuadro resumen de Modelos y Clasificacin de RNAs
64
MODELOS DE RNAS
DISEADOR
AO
Bernard Widrow
1960
Prediccin
Bi-Directional Associative
Memory (BAM) Networks
Bart Kosko
1987
Asociacin
Ackley, Hinton y
Sejnowski
1985
Asociacin
Brain-State-in a Box
James Anderson
Cascade-Correlation-Networks
Fahhman y Lebiere
1990
Asociacin
Counter-Propagation
Hecht-Nielsen
1987
Clasificacin
Jacobb
1988
Clasificacin
Neural
Semiconductor Inc.
1990
Prediccin
Pao
1989
Clasificacin
Hamming Networks
Lippman
1987
Asociacin
Hopfield Networks
Hopfield
1982
Optimizacin
Kohonen
1988
Clasificacin
Red Clasificadora.
Perceptron Networks
Rosenblatt
1950
Prediccin
Adaline y Madaline
Adaptive Resonance Theory
Networks (ART)
Back-Propagation
CARACTERISTICAS
Tcnicas de Adaptacin para el Reconocimiento de
Patrones.
Carpenter,
Reconocimiento de Patrones y Modelo del
1960-86 Conceptualizacin
Grossberg
Sistema Neuronal. Concepto de Resonancia
Solucin a las limitaciones de su red predecesora
Rumelhart y Parker
1985 Clasificacin
el Perceptron.
Maytas y Solis
TIPO
1970-86 Asociacin
1965-81 Clasificacin
Spetcht
1988
Asociacin
Clasificacin
Recirculation Networks
Hinton y McClelland
1988
Filtrado
Kohonen
Spatio-Temporal-Pattern
Recognition (SPR)
Grossberg
Conceptualizacin
1979-82
Aprendizaje sin supervisin.
Clasificacin
Red clasificadora Invariante en el espacio y
1960-70 Asociacin
tiempo.
65
66
67
La metodologa propuesta en este trabajo investigativo est compuesta por seis etapas
principales que llevan a la construccin, implementacin y ejecucin del modelo, para
finalizar con el anlisis de los resultados. Estas seis etapas son:
1)
2)
68
datos tenga un mejor desempeo. Se sugiere utilizar tcnicas sencillas y reconocidas como
transformaciones lineales. La seleccin del conjunto de datos y la forma como van a ser
obtenidos (cules son las fuentes de informacin) es una actividad que permite la
identificacin de las variables financieras crticas para el anlisis y la definicin del conjunto
de datos que ser utilizado para el proceso de entrenamiento y aprendizaje de la red.
Tambin es necesario recopilar los datos que eviten un sobre-aprendizaje de la red y
aquellos que sern usados para obtener y validar los resultados finales. Para el caso de
estudio, el numeral 6.2. del captulo 6 hace referencia a esta segunda etapa. La seleccin
de los datos (cantidad, tipo, valor, etc.) es clave, el modelo requiere que los parmetros y
el orden en que los datos entran al sistema sean adecuadamente definidos, esto ayuda a
que la red aprenda en forma efectiva.
3)
informacin con que se cuente, se selecciona y configura la RNA. Como se ha visto existen
diferentes tipos de RNA que se pueden adecuar segn la complejidad del problema. En
este paso tambin se define la arquitectura de la red que corresponde a su topologa y/o
estructura (i.e., nmero de capas internas), luego se procede con la creacin de la red y
posteriormente con su configuracin. La estructuracin de la RNA se debe entender como
la definicin y construccin de la arquitectura de la red. Este punto se detalla ms adelante
en los numerales 5.2. y 5.3. de ste captulo.
4)
69
5)
De igual forma, se debe codificar los datos de salida y asegurar que estos valores se
encuentran en un rango o intervalo definido lo cual se puede realizar a travs de una
funcin de activacin para la capa de salida (i.e., softmax). En esta etapa se establece la
forma como sern evaluados los errores para determinar cules son las mejores
ponderaciones. As mismo, se realiza los ajustes por supervisin y el afinamiento de los
pesos para continuar fortaleciendo el proceso de aprendizaje de la red. Adicionalmente, se
realiza el entrenamiento (de nuevo), la validacin y la prueba. Es preciso definir la forma
como se medir la precisin al realizar las pruebas, en los mapas auto-organizados se
sugiere utilizar el enfoque el ganador se lleva todo. El captulo 6 en el numeral 6.4. se
hace referencia a esta etapa.
6)
Anlisis de los resultados: revisin detallada de las salidas de la red. Anlisis de los
resultados para estructurar los argumentos que soportarn el proceso de toma de decisin
y las conclusiones.
DESCRIPCIN DE LA METODOLOGIA
70
Para clasificar los buenos y los malos se ha decidido utilizar los modelos de RNA Autoorganizadas (SOM) para el anlisis del comportamiento de pago y las RNA Probabilsticas
para la evaluacin de crdito. Estas redes permiten desarrollar sistemas para solucionar
71
este tipo de problemas y operan a travs de un mnimo de tres capas: entrada, intermedia
(oculta) y de salida.
El til comportamiento de las RNA al aprender, reconocer y aplicar relaciones entre objetos
les otorga un gran poder en el desarrollo de tcnicas de prediccin y clasificacin de la
informacin. Sus principales caractersticas son: auto-organizacin y adaptabilidad, y,
procesamiento no lineal y en paralelo (alta interconectividad).
No obstante lo anterior, los modelos de RNA supervisadas tambin pueden ser utilizados
para la clasificacin de patrones y/o informacin. (Ver Anexo 5.-)
72
La construccin de una Red Neuronal Artificial pasa por varias etapas: [9]
1.
2.
parmetros necesarios para la definicin de los pesos de la conexin entre las neuronas
4.
Para las RNA Auto-organizadas y las RNA Probabilsticas se establece una arquitectura
jerrquica de tres capas: una capa de entrada que recibe la informacin del exterior (datos
de entrada), una capa oculta con entradas y salidas al interior del sistema, y por ltimo,
una capa de salida que proporciona los resultados de la red. Tener una arquitectura
multicapa le facilita a la red un aprendizaje por parejas de datos asociando la informacin
del dato de entrada con un ejemplo y el dato de salida, es por esta razn que las RNA
multicapa son tiles para la clasificacin de patrones y la aproximacin de funciones ya
que aprenden las relaciones, incluso no lineales complejas, que existen entre los datos de
entrada y de salida. [39]
73
oculta es aquella que no tiene una conexin directa con el entorno. Este tipo de capa
proporciona a la red neuronal grados de libertad adicionales, gracias a los cuales puede
encontrar representaciones internas correspondientes a determinados rasgos del entorno,
proporcionando una mayor eficiencia computacional. Por ltimo, una capa de salida cuyas
neuronas proporcionan la respuesta de la red neuronal.
La definicin del proceso de aprendizaje consiste en asignar los pesos especficos de los
datos de entrada, esto implica la seleccin de informacin adecuada segn el problema a
resolver y evitar el sobre-aprendizaje. Esto se logra mediante el uso de indicadores de
error los cuales operan a travs de la comparacin de las salidas de la red contra las
salidas deseadas (valor ptimo o umbral) llegando, por ejemplo, a un mnimo en el error
cuadrtico, que es la tcnica de comprobacin seleccionada.
Una vez la red neuronal se ha entrenado y las ponderaciones estn ajustadas es probable
que se requiera la utilizacin de alguna tcnica de reduccin que ajuste el tamao de la
red en un nivel adecuado y ptimo. A esta actividad se le denomina pruning o podado de
la red cuyo principal objetivo es llegar hasta cierto nivel en el proceso de entrenamiento
para eliminar los pesos que no aportan en la operacin de la red. Conocer desde un
principio el nmero de neuronas y capas que necesitar la red no es sencillo. En la medida
en que son realizados los ajustes y el afinamiento de los parmetros, el error se va
disminuyendo y la red arroja resultados confiables y seguros.
74
pueden utilizar como puntos de referencia para evaluar los algoritmos ms complejos. Esta
interaccin permite a los investigadores desarrollar nuevas tcnicas mediante la
construccin de y la reutilizacin de software existente, lo que reduce el esfuerzo requerido
y aumentando la robustez y la facilidad de uso de las nuevas herramientas.
Como se mencion, las redes neuronales artificiales presentan como desventaja ser
consideradas cajas negras debido a que el entendimiento completo de las interrelaciones
internas generadas entre las entradas, las salidas y las neuronas ocultas es bastante
complejo. Shachmurove Y. (2002) seala este hecho como una indeterminacin
observacional que surge por la forma como las RNA se auto organizan, lo cual complica la
determinacin o estimacin de las relaciones en las capas ocultas. No obstante, esta
consideracin ha disminuido en la ltima dcada. Como seala Nisbet R., Elder J. y Miner
G. (2009), estudios recientes estn abriendo la caja negra en gran medida por el estudio
del efecto o contribucin que cada variable de entrada presenta sobre la salida a la luz del
anlisis de sensibilidad. Esta serie de avances est dando lugar a que en la actualidad se
hable ms bien de cajas grises ya que las RNA modernas, a partir de ciertas tcnicas,
pueden proveer una medida de importancia o significancia de las diferentes variables de
entrada utilizadas para construir la red, lo cual permite apreciar ciertos detalles sobre la
operativa interna de clculo. [45]
75
76
tipo competitivo, en donde no se posee una funcin de salida objetivo y permite realizar
anlisis de conglomerados (clusters) proyectando un espacio multidimensional de entrada
sobre otro de dimensin mucho menor (bidimensional) de salida. Cada patrn de entrada
se asocia a la neurona de salida cuyo vector de referencia o vector prototipo de pesos es
el ms parecido. El criterio de similitud ms utilizado es la distancia eucldea (ver punto 3.
del numeral 4.3. en el captulo 4.). Los patrones de entrada se agrupan en zonas y los que
quedan situados prximos entre s son los patrones que presentan caractersticas en
comn respecto a las variables de entrada. [40]
En el proceso de aprendizaje una red SOM descubre por s misma rasgos comunes,
regularidades, correlaciones o categoras en los datos de entrada y los incorpora en su
estructura interna de conexiones. Las neuronas se organizan en funcin de los estmulos
(datos de entrada) procedentes del exterior. En el aprendizaje competitivo las neuronas
compiten unas con otras con el fin de llevar a cabo una tarea dada. Slo una de las
neuronas de salida se activa y al final del procesamiento solo una queda como vencedora
(activada) y las dems anuladas (perdedoras). El objetivo de este aprendizaje es
categorizar los datos que se introducen en la red. Las clases o categoras deben ser
creadas por la propia red, puesto que se trata de un aprendizaje no supervisado, a travs
de las correlaciones entre los datos de entrada.[40]
77
establece el radio o rango de vecindad el cual determina el nmero de neuronas que sern
consideradas como vecinas. Por lo general se usa un radio de vecindad = 1. A cada
neurona se le asignan diferentes pesos W segn el nmero de dimensiones o indicadores
que se vayan a utilizar, de esta forma se tiene una correspondencia uno a uno entre el
peso y la dimensin. La funcin de vecindad determina cuales son las neuronas vecinas
que se van a activar.
El mtodo sugerido para el anlisis del comportamiento de pago usando variables del
estado de los crditos o prstamos es el siguiente:
1.- Seleccin de los datos y anlisis preliminar de la forma cmo se relacionan los datos
ndices. Establecer rasgos que hacen que un crdito se parezca a otro, cul es el peso que
los hace parecer. Para el caso de estudio es preciso preguntarse: De qu depende la tasa
de morosidad?
2.- Formacin de conglomerados mediante el anlisis clustering. Establecer cules son
los datos comunes y los valores que comparten. Por sus caractersticas y atributos las
neuronas se agrupan solas.
3.- Establecer qu tanto aporta una variable o ndice utilizando el anlisis de planos de
componentes, cada ndice es una dimensin. Es necesario verificar mltiples planos para
determinar qu relacin existe entre las variables. Si existen variables que no tienen
relacin, es preciso descartarlas. Un crdito es un punto en el espacio bidimensional. El
anlisis de componentes principales se usa para reducir la dimensionalidad de un conjunto
de datos a travs de la determinacin de las causas de su variabilidad. Esta tcnica busca
la proyeccin segn la cual los datos queden mejor representados en trminos de mnimos
cuadrados y es empleada en anlisis exploratorio de datos y en la construccin de modelos
predictivos.
78
79
La particularidad de las RBF reside en que las neuronas ocultas operan en base a la
distancia eucldea que separa el vector de entrada respecto al vector de pesos que cada
una almacena (denominado centroide), a esta cantidad se le aplica una funcin radial con
forma gaussiana similar al modelo de regresin kernel. La capa de salida realiza una
combinacin lineal de las activaciones de las neuronas ocultas. Las RBF permiten realizar
modelados de sistemas no lineales arbitrarios y tambin son considerados como
aproximadores universales de funciones requiriendo menos tiempo para su entrenamiento.
Tiene dos fases en su aprendizaje [40]:
1)
80
los pesos de conexin entre las neuronas ocultas y las de salida se obtienen
Cuando se presenta una entrada, la primera capa calcula las distancias desde el vector de
entrada hasta los vectores de entrada de entrenamiento y se produce un vector cuyos
elementos indican lo cerca que la entrada est a una entrada de entrenamiento. La
segunda capa consolida las contribuciones para cada clase de entrada y produce la salida
como un vector de probabilidades. Por ltimo, una funcin competitiva de transferencia en
la salida de la segunda capa toma el mximo de estas probabilidades y produce un 1 para
esa clase y un 0 para las otras clases.
Se trata de considerar que existen pares de vectores de entrada que sern comparados
contra un vector objetivo que tiene
capas, cada vector de entrada est asociado con una de las clases.
es el nmero de
81
Se asignan a la matriz Targets los vectores objetivos. Cada vector tiene un 1 solamente
en la fila asociada con la clase particular de entrada, y ceros en las dems posiciones. La
funcin ind2vec se usa para crear los vectores apropiados y permite convertir en ndices
los vectores objetivos. La multiplicacin de la matriz Targets por suma los elementos de
debido a cada una de las n clases de entradas. Para el caso de estudio, dos clases:
buenos y malos. Finalmente, la funcin de transferencia de la segunda capa competitiva,
produce un 1 que corresponde al elemento ms grande de n2, y ceros en las dems
posiciones. La red ha clasificado el vector de la entrada en una clase especfica de , porque
esa clase tena la probabilidad mxima de ser correcta.
En el punto 2 del numeral 6.4. del captulo 6 se muestra y explica en detalle los pasos
(algoritmo) para la construccin de esta solucin utilizando la herramienta MATLAB.
82
6. Informacin y Resultados
6.1 Recopilacin de la informacin para la aplicacin del
modelo
La actividad crediticia implica riesgo y por tanto requiere prudencia en quien vaya a
conceder crdito y tomar las mayores precauciones, a fin de evitar la prdida de los dineros
prestados. La principal precaucin consiste en conocer el perfil de riesgo del futuro deudor.
Los bureau de crdito y/o centrales de riesgo, son empresas que administran y consolidan
informacin en forma transparente y permiten agilizar el proceso de evaluacin del riesgo
y asignacin de crditos. En Colombia existen dos entidades dedicadas a prestar estos
servicios: La CIFIN y DataCrdito.
DataCrdito es una central de riesgo que recopila (recibe, almacena, procesa y suministra)
informacin de la forma como las personas y las compaas han cumplido sus obligaciones
con entidades financieras, cooperativas o con almacenes y empresas del sector real, sobre
la situacin crediticia general e histrica, positiva y negativa de los clientes de cada entidad,
la cual puede ser compartida si existe previa autorizacin escrita y voluntaria del usuario,
83
formando as la historia de crdito de una persona natural o jurdica. Esa historia sirve para
que las entidades (bancos, cooperativas, almacenes, etc.) puedan decidir en conjunto con
otros elementos de informacin si otorgan crdito o prestan sus servicios. La Historia de
Crdito es solo una de las herramientas de anlisis que utilizan estas empresas para tomar
decisiones. Es as como con una misma Historia de Crdito, una solicitud puede ser
aprobada por una entidad y negada por otra.
El objetivo particular de este trabajo es predecir la probabilidad de que los crditos caigan
en mora y determinar los factores que afectan esta probabilidad. Se ha seleccionado una
base de datos con cerca de 132 mil crditos de diferente tipo: 105,077 Tarjetas de Crdito
(personales y corporativas) y 26,544 prstamos de consumo y comercial. Esta muestra
corresponde a la totalidad de los registros de los crditos al cierre del ao 2011 de una de
las entidades financieras de Colombia. El tratamiento de la informacin para los crditos
de consumo y los crditos comerciales es diferente. Esto se hace fundamentalmente
porque su destinacin y manejo contable centro de las entidades financieras se hace con
base en las regulaciones establecidas por la Superintendencia Financiera de Colombia
SFC.
84
En lo que hace referencia a las tarjetas de crdito han sido seleccionadas las siguientes
variables: la franquicia (Visa, Master Card o si el crdito es rotativo o tiene un cupo
revolvente que puede volverse a utilizar en la medida en que se va liberando o pagando),
el segmento o tipo de tarjeta (clasificado segn el tipo de cliente), la unidad de negocio
(personal o empresarial), el saldo en mora, el saldo total de la tarjeta, los das en mora, el
tipo de bloqueo de la tarjeta, el cupo total asignado a la tarjeta, un clasificador de a cuntos
salarios mnimos legales vigentes corresponde el cupo total de cada tarjeta.
Tambin pueden ser usadas otras variables como la experiencia del prestatario, medida
como el nmero de crditos previos y como el nmero de meses que han transcurrido
desde el primer crdito, el historial de morosidad, el sector econmico (CIIU), que permite
clasificar a los clientes segn su actividad econmica, y las garantas que respaldan el
prstamo en caso de incumplimiento.
85
86
crear y definir las variables usando vectores (cada una de las columnas representa
una variable)
convertir las columnas en filas y poder utilizar la RNA. Cuando se utiliza la funcin newff
para la creacin de la red neuronal se tiene por defecto tansig para las capas ocultas y
salida lineal por defecto
ejecutar este proceso hasta que los resultados sean similares a la funcin de
entrada.
NOTA: existen otras herramientas como SPSS o MODELER que tambin pueden ser
usadas para el desarrollo e implementacin de este tipo de modelos. [32]
87
88
Teniendo en cuenta los saldos pendientes por pagar de las tarjetas, el 67,4% del saldo
est al da, el 17,4% se encuentra en mora de hasta 180 das y el 15,2% del saldo est en
tarjetas con mora mayor a 180 das. Las tarjetas asignadas a personas naturales tienen
un 91,2% de los saldos facturados mientras que el 8,8% est en las tarjetas empresariales.
El 95% de las tarjetas empresariales se encuentra al da mientras que tan solo el 65% de
las tarjetas de personas naturales est al da. El promedio del capital en mora para las
tarjeras empresariales en $5460.000 y para las tarjetas personales es $515.000. El
89
EMPRESARIAL
$
$
$
$
$
$
$
900
4.914,00
10.237,60
5.459.730,00
11.375.000,00
547,60
48.176.551,00
83.273.309,00
PERSONAL
$
$
$
$
$
$
$
104177
53.645,00
106.591,00
514.942,00
1.023.175,00
43,60
1.197.067,00
1.792.677,00
90
temporales (en el tiempo) son bastante tiles sobre todo si se trata de investigaciones o
estudios que como en nuestro caso requieren de proyecciones y/o predicciones del
comportamiento futuro de las variables. Existen formas sencillas de normalizar la
informacin utilizando una simple codificacin de los datos, por ejemplo, en el caso del BIN
o identificador de las tarjetas de crdito se puede asignar un nmero de 1 a N que
correspondan a cada BIN. Es importante entender los datos y como se relacionan entre s.
Para realizar una simulacin rpida, sencilla y eficaz, se decidi solo tomar las tarjetas de
crdito empresariales. Al aplicar un Mapa Autoorganizado SOM a los datos de entrada,
la red neuronal agrupa y clasifica la informacin segn sus caractersticas y empieza a
encontrar cuales son los grupos que guardan similitud y cules no. Es preciso reconocer e
identificar cules son las variables representativas que causan, con mayor fuerza, que
unos registros estn ms cerca que otros. Para esto, fueron realizadas varias simulaciones
con diferentes dimensiones para las matrices (ver Anexo 1.-). Para una de las
simulaciones, la red neuronal se escogi de dimensiones 4X4, lo que implica tener una red
de 16 neuronas. Es posible realizar simulaciones con ms dimensiones pero, dado el
nmero total de registros a analizar (874), este dimensionamiento de 4X4 se considera
adecuado. De igual forma, se puede ensayar varias topologas y diferentes conjuntos de
datos con miras a entender los grupos que pueden ser de alto riesgo. Se observa cmo
las simulaciones con los mapas autoorganizados SOM hacen que el agrupamiento y
distribucin de los datos se realice en forma natural a travs del anlisis de componentes.
Adems, esta tcnica permite reducir las dimensionalidades (ACP). (ver Anexo 5.-)
Los planos de pesos de las variables de entrada del modelo auto-organizado muestran la
relacin que existe entre los pesos de las variables de entrada de una neurona con sus
vecinas. Estos planos de pesos tambin son conocidos como los planos de componente.
Los colores ms claros representan los pesos ms grandes y los colores ms oscuros
representan los pesos ms pequeos. Las neuronas rojas representan conexiones
positivas y fuertes y las negras significa que no existe conexin o relacin alguna. Si el
patrn de conexiones de dos entradas es similar, se puede asumir que las entradas estn
altamente correlacionadas (ver Anexo 1.- Figuras 1.3 y 4.1).
Como se observa en la cuarta corrida, al usar una red con 25 neuronas en su capa de
salida se aprecia con mayor detalle las relaciones fuertes (neuronas rojas y naranja). Las
91
entradas una (1) y cinco (5) que corresponden al Cdigo de la tarjeta y al Cupo
Normalizado respectivamente, son las variables mejor correlacionadas (ver Anexo 1.Figura 4.1).
La siguiente grfica muestra la capa del mapa auto-organizado, cada neurona representa
el nmero de vectores entrada que han sido clasificados en esa neurona (el tamao de la
zona azul es proporcional a la cantidad de vectores entrada para facilitar el entendimiento
del lector de esta informacin). Para la primera corrida, el 70% de los datos se agrupan en
las neuronas 1, 3, 6, 9, 11, 24 y 44. Existe una alta dispersin en la distribucin de los
datos en las neuronas lo cual lleva a concluir que no estn uniformemente distribuidas.
92
La definicin del nmero de capas y la cantidad de neuronas es clave para llegar a una
solucin rpida y consistente. El proceso de entrenamiento y aprendizaje de la red es
fundamental para conocer la forma como se debe acotar el problema y llegar a la solucin
del mismo con un nmero de iteraciones adecuado. En la medida en que se avanza en el
anlisis, se llega incluso al detalle de saber cul es la informacin que cada neurona ha
agrupado. Por ejemplo, es necesario revisar qu caractersticas tienen las empresas que
caen en las neuronas 13, 14, 15 y 16 (ver Anexo 1.-, Figura 2.4.), si pertenecen al mismo
sector industrial o si manejan cupos similares de crdito o si compran las mismas materias
primas. Estudios han comprobado que cuando un sector de la economa es golpeado por
algn evento econmico o financiero, las empresas de dicho sector se ven afectadas en
su productividad y por ende en su capacidad de pago. Es precisamente esto lo que muestra
la red, cules son los grupos con mayores ndices de morosidad y la relacin que las dems
variables guardan con este ndice.
En el Anexo 1.- Red Neuronal para Clasificacin con SOM, se muestra cuatro corridas
(ejecuciones) del modelo utilizando la tcnica de mapas auto-organizados (SOM Self
Organised Map). Estas corridas reflejan como una red de dimensiones 4X4 optimiza el
desempeo para el ordenamiento y la agrupacin de los registros de las tarjetas de crdito
empresariales. En la medida en que se aumenta las dimensiones se empieza a observar
que algunas neuronas no contienen registros cuyas similitudes permiten agruparlos. En
este sentido, se perdera rendimiento por parte de la red neuronal y no se lograra el
objetivo de eliminar la dimensionalidad de los datos.
93
Esta divisin permite que la red neuronal optimice su operacin y llegue a mejores y ms
rpidos resultados explotando todo su potencial.
El Anexo 1.- muestra las grficas de los histogramas de las variables de inters una vez
realizadas las normalizaciones del caso. Adicionalmente, se explica cmo es la distribucin
porcentual por neurona.
94
Las redes neuronales probabilsticas (RNP) pueden ser utilizadas para problemas de
clasificacin. Cuando una entrada es presentada, la primera capa calcula las distancias
desde el vector de entrada a los vectores de entrada entrenados y produce un vector cuyos
elementos indican cuan cerca est la entrada con respecto a la neurona entrenada. La
segunda capa suma estas contribuciones para cada clase de entrada y produce con ellas
un vector de salida con las probabilidades. Finalmente, una funcin de transferencia en la
salida de la segunda capa del tipo competitiva coge la mxima de estas probabilidades y
produce un 1 para esa clase y cero para las dems. [13]
Las columnas de la matriz de entrada son: tipo y nmero de identificacin, sexo, edad,
ciudad, ingresos, sector, fecha del desembolso, plazo en meses, fecha final, monto
desembolsado, moneda, saldo de la deuda, tasa efectiva, plus (puntos adicionales sobre
una tasa de referencia), tasa nominal y nmero de cuenta.
95
4.
parmetros son la matriz de entrada y la matriz T_Correctos Esta funcin tambin tiene
la propiedad de entrenar la red.
5.
Para la fase de prueba, se ejecuta una simulacin travs de la funcin sim con
matriz Targets, que contiene los valores objetivo, contra el resultado de la salida de la
simulacin (prueba) de la red RNP.
7.
obstante es preciso tener en cuenta el costo necesario para introducir nuevos patrones
ejemplo a la red pues esto va en detrimento de la eficacia de la red.
Una vez entrenada la RNP y culminado su proceso de aprendizaje, puede ser utilizada con
la informacin bien sea de los crdito a aprobar o en su defecto de los prstamos para los
cuales se quiere determinar si entrarn en mora o no. Esta informacin se carga a travs
de una matriz con la misma informacin de entrada con la que se entren la RNP. De esta
forma, la red neuronal determinar cules de los registros son o no sujetos de crdito y/o
cuales tienen una alta probabilidad de ser morosos en el corto plazo. En este sentido lo
que la RNP est permitiendo es clasificar y al mismo tiempo predecir, con base en el
comportamiento y los datos de entrada, cul ser el estado futuro de los prstamos.
7. Conclusiones y reflexiones
7.1 Conclusiones
El problema del agente est en la seleccin adversa debido a la informacin asimtrica.
Los bancos pretenden, a travs de los modelos de crdito, filtrar y seleccionar aquellos
clientes que van a tener un buen comportamiento en el pago de sus obligaciones. Los
bancos quisieran tener a los mejores clientes y han descubierto que los modelos
tradicionales no tienen procesos de aprendizaje y por lo general son fijos en el tiempo,
impidiendo as que exista un cambio flexible segn la dinmica de los negocios, los
procesos de segmentacin de los clientes y el crecimiento o decrecimiento en las
necesidades de fondos de los clientes. Es preciso evitar o impedir que la gente (los
clientes) encuentre nuevas formas de engaar a los modelos de forma tal que sean
aprobados crditos que no deberan.
98
Las Redes Neuronales Artificiales (RNA) son ideales para manejar grandes cantidades de
datos y reconocer patrones dentro de informacin compleja, vaga o incompleta y no
estructurada. Una red neuronal artificial guarda la informacin casi de la misma forma como
lo hace el cerebro humano, esto es, cada segmento de dato est interrelacionado con
todos y cada uno de los otros segmentos de los datos. Esto facilita la identificacin de las
tendencias significativas y predictivas y de los patrones dentro de los datos, y el destacar
las anomalas que pueden detectar o anticipar los riesgos. Se aconseja la utilizacin de
RNA en los modelos de evaluacin de riesgo crediticio bsicamente por sus propiedades
como aproximadores o estimadores universales y por su nivel de confiabilidad en los
modelos predictivos para los cuales importa ms el resultado que el proceso mismo de
clasificacin. Las RNA son herramientas de gestin eficaces y de gran alcance que
permiten construir modelos que apoyan el proceso de toma de decisiones en los sistemas
de evaluacin del riesgo de crdito.
Conclusiones y reflexiones
99
s est interesado en conocer la relacin existente entre los pesos o valores de activacin
de las neuronas en la capa oculta con los datos de entrada. En esta lnea, los
investigadores han realizado trabajos que confirman las bondades de las RNA a la vez que
permiten entender y comprender la naturaleza de las representaciones internas que
realizan para solucionar y dar respuesta al problema planteado. Adicionalmente, entender
cules variables aportan en la solucin y cules no, tiene un efecto importante en el
desempeo de la red (convergencia de los pesos) a la vez que se reduce la dimensin del
espacio de entrada.
Algunos investigadores consideran que se ha recurrido a las RNA ante el fracaso del
anlisis clsico de las series temporales para el clculo de predicciones a corto plazo en
mercados financieros. No obstante, para la prediccin de quiebra de empresas se ha
obtenido mejores resultados utilizando tanto la red de propagacin hacia atrs, como
mapas auto-organizados. En cuanto a los problemas de clasificacin, las redes
representan una alternativa al anlisis de conglomerados (cluster) y se utilizan
fundamentalmente los mapas auto-organizados.
100
utilizacin de las RNA continuar teniendo una gran acogida debido a su comprobado
potencial para solucionar problemas multivariables y no lineales simulando situaciones
reales de la industria financiera y de los negocios en general.
Las redes neuronales probabilsticas utilizan internamente funciones de base radial lo cual
se traduce en una ventaja sobre las redes multicapa que poseen algoritmos pesados y
lentos debido a que basan sus clculos en tcnicas de propagacin hacia atrs. Se prev
que mediante el uso de mquinas de soporte vectorial se pueda mejorar el desempeo y
los resultados que hasta ahora se han obtenido con las redes neuronales.
7.2 Reflexiones
El anlisis de grandes volmenes de informacin es la base para el proceso de toma de
decisiones en cualquier organizacin. La explosin de los datos tiene dos acercamientos,
por un lado hace referencia al volumen o cantidad. Esto es, cada da se producen cientos
de millones de bytes no solo en datos estructurados (se conoce claramente qu significa
cada dato) sino tambin en datos no estructurados, como la informacin que se est
generando da a da en las redes sociales, a travs del correo electrnico o los sistemas
de mensajera y chat, o el intercambio de informacin mediante los dispositivos mviles.
El segundo acercamiento es la forma como se pueden explotar esos datos (estructurados
y no estructurados) para que las organizaciones aprendan del comportamiento de la
informacin de sus clientes, productos y servicios, incluso en los casos en que no cuentan
con esta informacin en sus bases de datos. Es evidente que el cambio en los datos
demogrficos de las personas, por ejemplo, cambios en la direccin, el telfono, el correo
electrnico, el empleador, el cargo, etc. para personas naturales, y el cambio en las ventas,
los ingresos, los gastos, la apertura de nuevas oficinas, el nmero de empleados, etc. para
Conclusiones y reflexiones
101
personas jurdicas, afectan las decisiones que las organizaciones deben tomar con
respecto a la gestin del riesgo de crdito y en general para todos los procesos. Todo
cambio debe ser tenido en cuenta tanto para la clasificacin como para la prediccin de lo
que puede ocurrir con el cliente en el futuro cercano a nivel de nuevas ventas o un mayor
control. En los ltimos aos ha surgido el concepto de Big Data que bsicamente encierra
el tratamiento de grandes volmenes de informacin, que puede ser accedida a gran
velocidad produciendo resultados en forma eficiente y oportuna. Sin lugar a dudas las RNA
permitirn y facilitarn el manejo de toda esta informacin con el fin de solucionar, entre
otros, los problemas de asimetra en el mercado de crdito y sus productos.
Las RNA pueden ser usadas como complemento a los modelos estadsticos y
economtricos ampliamente conocidos y utilizados. Estas no pretenden reemplazar y/o
eliminar la utilizacin de otros modelos, pero lo que s es claro es que tanto la academia
con el sector privado y pblico, deben continuar trabajando en la promocin de la utilizacin
y aprovechamiento de las capacidades y bondades de las RNA, pasando de un aspecto
meramente terico a una prctica diaria para la solucin de problemas del mundo real. Las
RNA se han estructurado de forma tal que al combinar modelos como el anlisis factorial
y el anlisis de componentes principales logran mejorar su desempeo para llegar a
mejores soluciones ms rpido. Es necesario continuar trabajando en la optimizacin de
los modelos de forma tal que se mejore la eficiencia y consistencia de los resultados. El
sobreaprendizaje y el reentrenamiento son dos grandes temas a cuidar y controlar en la
utilizacin de las RNA. Los datos reales deben ser considerados para retroalimentar a la
red peridicamente de forma tal que sus resultados sean ms certeros en cada momento.
102
En lnea con el anlisis del comportamiento de pago de los clientes es posible predecir
aquellos que en el siguiente periodo van a entrar en mora o van dejar de pagar o incumplir
en sus pagos. Una de las tcnicas ms usadas es la prediccin a travs de las series de
tiempo. La prediccin es una clase de filtro dinmico en el cual los valores pasados o
histricos de una o varias series de tiempo son usados para predecir valores futuros (i.e.,
acciones, bonos o instrumentos financieros). Los modelos predictivos tambin son usados
en los sistemas de identificacin en los que se pueden construir modelos dinmicos que
permiten el anlisis, simulacin, monitoreo y control de los sistemas fsicos (i.e., procesos
de produccin o manufactura, procesos qumicos, sistemas robticos o aeroespaciales).
Es evidente que las polticas del gobierno, en nuestro caso el Banco de la Repblica,
impactan la dinmica del crdito y financiacin en el pas. Los usuarios del crdito ya estn
empezando a percibir los efectos del ajuste de las tasas de inters que hace un ao hizo
el Bando de la Repblica, pues el costo de los prstamos se ha incrementado. [El Tiempo,
06/02/2012]. La tasa de usura tiene un efecto sobre todo en los crditos de consumo y las
tarjetas de crdito. Es probable que el Emisor (BR) continu realizando ajustes a la tasa
con el fin de evitar que la economa se recaliente y prevenir que el crdito se desborde,
claramente una poltica de racionamiento del crdito caracterizada por costos ms
elevados y requisitos ms estrictos para conceder los prstamos ya que se advierte una
disminucin en el ritmo del crecimiento econmico y la reduccin en la capacidad de pago
de los colombianos. La cartera hipotecaria no ser ajena a esta situacin, el incremento
de las tasas tambin afectar el crecimiento del sector inmobiliario y el desarrollo de la
actividad constructora aumentando el problema del dficit habitacional del pas.
Conclusiones y reflexiones
103
Por ltimo, las organizaciones de talla mundial que han logrado superar estas tres etapas:
correctiva o reactiva, preventiva y predictiva, ahora se encuentran trabajando en tcnicas
y procesos proactivos que no solo reparan y/o anticipan anomalas, fallas o
comportamientos no deseados, sino que estn retroalimentando sus procedimientos a
travs de un proceso de mejoramiento continuo. Esto significa que los procesos aprenden
y generan sus propias mejoras utilizando herramientas con la capacidad de entender su
entorno y aprender del mismo. Es otras palabras, son organizaciones inteligentes que
aprenden y mejoran continuamente.
104
Anlisis del comportamiento de los usuarios en las redes sociales (i.e., Google,
Anlisis del comportamiento de los clientes en los portales web de las empresas.
Reconocer el tipo de informacin que est requiriendo el cliente a travs del entendimiento
detallado de su forma de navegar en los portales
creacin de escenarios en los que se pueden simular y escoger las mejores alternativas
de inversin para el lanzamiento de nuevos productos y/o servicios
Apoyo a los procesos de innovacin para la definicin de producto y/o servicios que
anticipan las necesidades de los clientes mediante el anlisis de las intenciones de compra
o las consultas de informacin en las redes sociales o en los portales de internet
de los semforos de manera que el volumen del flujo vehicular sea el que determine y
controle este proceso (gestin de la demanda).
(FIGURA 1.1)
106
FIGURA 1.2 Est grfica muestra la distancia entre las neuronas vecinas y sus
conexiones en el modelo auto-organizado. Los hexgonos azules corresponden a cada
una de las neuronas. Cada neurona tiene 6 vecinos (forma hexagonal de la neurona). Los
pesos representan el especio neuronal. Las lneas rojas son los conectores entre las
neuronas vecinas. Los colores que rodean las lneas rojas (conectores) representan la
distancia entre las neuronas. Los colores oscuros representan grandes distancias
(separacin considerable entre las neuronas). Si el color que rodea la lnea roja (conector)
es negro la distancia es mayor por lo tanto la relacin entre esas dos neuronas es dbil.
De otro lado, si el color es claro, amarillo, es ms fuerte su relacin, lo cual significa que
las neuronas estn muy cerca. Los datos que estn en la regin amarilla tienen unas
caractersticas similares. En contraposicin, las regiones oscuras representan grupos de
datos con caractersticas dismiles.
(FIGURA 1.2)
FIGURA 1.3 Planos de pesos de las variables de entrada del modelo auto-organizado.
La figura muestra la relacin que existe entre los pesos de las variables de entrada de una
neurona con sus vecinas. Estos planos de pesos tambin son conocidos como los planos
de componente. Los colores ms claros representan los pesos ms grandes y los colores
ms oscuros representan los pesos ms pequeos. Las neuronas rojas representan
conexiones positivas y fuertes y las negras significa que no existe conexin o relacin
alguna. Si el patrn de conexiones de dos entradas es similar, se puede asumir que las
entradas estn altamente correlacionadas.
Anexo
107
(FIGURA 1.3)
Las variables o parmetros de entrada (1) BIN, (2) Mes, (3) Ao y (11) Rango de SMLV
son las que presentan conexiones positivas y fuertes. Las neuronas amarillas agrupan
registros con caractersticas similares. Por el contrario, las neuronas negras agrupan
registros con caractersticas dismiles.
Las entradas 4, 5, 8 y 9 tienen un patrn similar con relaciones de pesos pequeos. Las
distancias entre las neuronas se calculan a partir de sus posiciones con una funcin de
distancia.
FIGURA 1.4 Hits en el modelo auto-organizado. Esta grfica muestra la capa del mapa
auto-organizado, cada neurona representa el nmero de vectores entrada que han sido
clasificados en esa neurona (el tamao de la zona azul es proporcional a las cantidades
de vectores entradas para facilitar el entendimiento del lector de esta informacin). El 70%
de los datos se agrupan en las neuronas 1, 3, 6, 9, 11, 24 y 44. Existe una alta dispersin
en la distribucin de los datos en las neuronas lo cual lleva a concluir que no estn
uniformemente distribuidas.
108
(FIGURA 1.5)
FIGURA 1.6 Posiciones de los pesos en el modelo auto-organizado. Los puntos verdes
representan los vectores entrada y muestran cmo el SOM clasifica el espacio de entradas.
(FIGURA 1.6)
Anexo
109
(FIGURA 2.1)
FIGURA 2.2 Est grfica muestra la distancia entre las neuronas vecinas y sus
conexiones en el modelo auto-organizado. Cada neurona tiene 6 vecinos. Los pesos
representan el especio neuronal. Entre ms amarillo es ms fuerte su relacin. Si es negro
la distancia es mayor por lo tanto su relacin es dbil. Los datos que estn en la regin
amarilla tienen unas caractersticas similares. En contraposicin, las regiones oscuras
representan grupos de datos con caractersticas dismiles.
110
(FIGURA 2.2)
FIGURA 2.3 Planos de variables de entrada del modelo auto-organizado. Muestra la
relacin que existe entre los pesos de las variables de entrada de una neurona con sus
vecinas. Las neuronas rojas representan conexiones positivas y fuertes y las negras
significa que no existe conexin o relacin alguna.
(FIGURA 2.3)
Las variables o parmetros de entrada (2) Codificacin normalizada del rango de das de
mora, (4) BIN, (5) Cupo normalizado segn rango de salarios mnimos legales vigentes y
(8) Rango de das de mora son las que presentan conexiones positivas y fuertes.
FIGURA 2.4 Hits en el modelo auto-organizado. Esta grfica muestra la capa del mapa
auto-organizado, cada neurona representa el nmero de vectores entrada que han sido
clasificados en esa neurona (el tamao de la zona azul es proporcional a la cantidades de
vectores entradas para facilitar el entendimiento del lector de esta informacin). El 80% de
los datos se agrupan en las neuronas 13, 14, 15 y 16.
Anexo
111
(FIGURA 2.4)
(FIGURA 2.5)
112
FIGURA 2.6 Posiciones de los pesos en el modelo auto-organizado. Los puntos verdes
representan los vectores entrada y muestran cmo el SOM clasifica el espacio de entradas.
(FIGURA 2.6)
3.- TERCERA CORRIDA
Para la tercera corrida se usa la base de datos de tarjetas de crdito empresariales (874
tarjetas) utilizando los datos normalizados de las columnas: (1) Cdigo de la tarjeta representa el segmento de clientes, (2) Valor en Mora, (3) Codificacin normalizada del
rango de das de mora, (4) Valor del Pago Mnimo, (5) Cupo normalizado segn rango de
salarios mnimos legales vigentes y una red SOM de 16 neuronas.
FIGURA 3.1 Red Neuronal Mapa Auto-Organizado (red de dimensin 4X4 16
neuronas en la capa de salida y 5 parmetros de entrada para el entrenamiento de la red
neuronal)
(FIGURA 3.1)
FIGURA 3.2 Como se mencion, la neuronas de color amarillo representan las relaciones
ms fuertes. Si es negro la distancia es mayor por lo tanto su relacin es dbil. Los datos
Anexo
113
(FIGURA 3.2)
Input 1: Cdigo de la tarjeta - representa el segmento de clientes. La mayora de neuronas
(amarillas) agrupan registros con caractersticas similares.
Input 2: Valor en Mora. La mayora de neuronas (negras) agrupan registros con
caractersticas disimiles.
Input 3: Codificacin normalizada del rango de das de mora
Input 4: Valor del Pago Mnimo. La mayora de neuronas (negras) agrupan registros con
caractersticas disimiles.
Input 5: Cupo normalizado segn rango de salarios mnimos legales vigentes. La mayora
de neuronas (amarillas) agrupan registros con caractersticas similares.
FIGURA 3.3 Hits en el modelo auto-organizado. Esta grfica muestra la capa del mapa
auto-organizado, cada neurona representa el nmero de vectores entrada que han sido
clasificados en esa neurona (el tamao de la zona azul es proporcional a las cantidades
de vectores entradas para facilitar el entendimiento del usuario). Cerca del 70% de los
114
(FIGURA 3.3)
4.- CUARTA CORRIDA
En la cuarta (ltima) corrida se usa la misma base de datos y variables de entrada pero se
cambia la red neuronal a dimensiones 5 X 5, esto es tener una red con 25 neuronas en su
capa de salida.
Figura 4.1 Al usar una red con 25 neuronas en su capa de salida se aprecia con mayor
detalle las relaciones fuertes (neuronas rojas y naranja). Las entradas una (1) y cinco (5)
que corresponden al Cdigo de la tarjeta y al Cupo Normalizado respectivamente, son las
variables mejor correlacionadas.
(FIGURA 4.1)
Anexo
115
Figura 4.2 Para esta corrida la mayora de los registros se ubican en las neuronas 16, 21
y 22. Tres neuronas no contienen registros: 10, 19 y 24. Las neuronas 3, 9, 20 y 25 tan
solo contienen 14 registros en total. Si se aumenta el nmero de neuronas estos resultados
van a ser ms comunes, lo que se traduce en tener un gran nmero de neuronas que no
sirven para clasificar los registros de entrada y por lo tanto se est alejando de una solucin
ptima y usando ms recursos de computacin en forma innecesaria. Se evidencia una
fuerte relacin en la zona amarilla y si es negro la distancia es mayor por lo tanto su relacin
es dbil. Los datos que estn en la regin amarilla tienen unas caractersticas similares.
(FIGURA 4.2)
Mientras ms neuronas se incorporan a la red su poder de clasificacin se va perdiendo y
los datos de entrada son repartidos indistintamente entre las neuronas. Es por esto que
a pesar de tener una mayor claridad en la forma como se relacionan los datos se va
perdiendo la clasificacin de los mismos. Se sugiere tener un balance adecuado entre el
nmero de variables o datos de entrada y la cantidad de neuronas tanto en la capa oculta
(si se est utilizando) como en la capa de salida.
116
Las columnas de la matriz de entrada son: tipo y nmero de identificacin, sexo, edad,
ciudad, ingresos, sector, fecha del desembolso, plazo en meses, fecha final, monto
desembolsado, moneda, saldo de la deuda, tasa efectiva, plus (puntos adicionales sobre
una tasa de referencia), tasa nominal y nmero de cuenta.
Anexo
117
La siguiente figura muestra la arquitectura de la red con 22 variables de entrada para los
9.314 registros seleccionados. La red tiene una capa intermedia con 2 niveles y una capa
de salida con 2 neuronas.
118
Definir el vector que contiene los valores objetivo y la matriz con "UNOS" en los
sitios correctos
NOTA: estos son los parmetros por defecto de MATLAB para la definicin de la red
neuronal probabilstica:
Otros mtodos
o
Anexo
119
% **********************************************
% * Resolucin de un problema de clustering
% * usando mapas auto-organizados - SOM
*
*
% **********************************************
%
% Entrada o lectura de datos de una matriz de excel: TC EVAL EMPRES
%
% BIN = Cdigo de la tarjeta - representa el segmento de clientes
% ASFFFH = Fecha de Mora (MES y ANIO)
% ASFMOR = Valor en Mora
% ASFPMN = Valor del Pago Mnimo
% ESTEMO = Rango de das de mora
% MORA = Codificacin normalizada del rango de das de mora
% MAELPE = Cdigo de Bloqueo de la Tarjeta
% MAEV01 = Cupo total de la tarjeta
% MAESEM = Estados de Mora
% SMLV = Cupo normalizado segn rango de salarios mnimos legales vigentes
% Esta es la estructura del archivo .txt que proviene de un
% EXCEL con dichas columnas
% NOTA: se puede crear un workspace el cual puede ser utilizado
% para cargar los datos de una corrida general
120
clear all
close all
tc_eval = importdata('TC EVAL EMPRES.TXT', ',', 1)
Anexo
% Prueba de la Red
outputs = net(inputs);
% Vista de la Red
%view(net)
j=1
121
122
for i=1:length(classes)
if classes(i)==1
grupo1(j,:)=data(i,:);
j=j+1;
end
end
Anexo
clear grupo1
i=1
j=1
for i=1:length(classes)
if classes(i)==1
grupo1(j,:)=data(i,:);
j=j+1;
end
123
124
end
*
*
% **********************************************
%
% Variables usadas para el analisis:
%
Anexo
% Vista de la Red
view(netp)
125
126
Anexo
127
MATLAB posee un mdulo para la gestin de las redes neuronales que permite y facilita
el diseo, implementacin, visualizacin y simulacin de estas redes. Las redes neuronales
se utilizan para aplicaciones en las que el anlisis formal es difcil, tales como el
reconocimiento de patrones y de identificacin del sistema no lineal y el control. La caja de
herramientas es compatible con redes feedforward, redes de base radial, redes dinmicas,
mapas auto-organizados y otros paradigmas de red probados.
Las redes neuronales son entrenadas para realizar funciones complejas en diversos
mbitos, como el reconocimiento de patrones, la identificacin, la clasificacin, el habla, la
visin y los sistemas de control. Las redes neuronales pueden ser entrenadas para resolver
problemas que son difciles para los sistemas convencionales. La caja de herramientas
provista por MATLAB enfatiza el uso de redes neuronales para la solucin de problemas
complejos en donde intervienen grandes volmenes de datos en la ingeniera, procesos
financieros y de produccin, y en otras aplicaciones prcticas.
Caractersticas principales:
1. Diseo, entrenamiento y simulacin de la red neuronal
2. Reconocimiento de patrones, agrupacin (clasificacin) y herramientas para la
afinacin y ajuste de los datos
3. Redes supervisadas incluyendo feedforward, base radial, LVQ, tiempo de retardo
4. Redes no supervisadas, incluyendo mapas auto-organizados y capas competitivas
5. Preprocesamiento y postprocesamiento para mejorar la eficacia de la formacin de
redes y la evaluacin del desempeo
6. Representacin de red modular para la gestin y la visualizacin de redes de
tamao arbitrario
7. Posee rutinas para mejorar la generalizacin para evitar sobreajuste
8. Bloques de Simulink para la construccin y evaluacin de redes neuronales y
bloques avanzadas para aplicaciones de sistemas de control
128
El diseo de las redes neuronales puede estar fundamentado en pasos estndar para
solucionar problemas en cuatro reas de aplicacin: la funcin de ajuste, reconocimiento
de patrones, la agrupacin (clasificacin) y el anlisis de series de tiempo. Se sugiere
seguir siete pasos principales en el flujo de trabajo de cualquiera de estos problemas.
1. Recopilacin de datos puede incluir normalizacin y estandarizacin de los datos
2. Creacin de la red
3. Configuracin de la red
4. Inicializacin de los pesos y sesgos
5. Formacin de la red
6. Validacin de la red
7. Utilizacin y ajustes de la red
MATLAB ofrece una caja de herramientas para el mejor aprovechamiento de las redes
neuronales a travs de funciones para el diseo, inicializacin, simulacin y entrenamiento
de los modelos neuronales de uso ms extendido en la actualidad: perceptrn, redes
lineales, redes de retropropagacin, redes de base radial, aprendizaje asociativo y
competitivo, aplicaciones autoorganizativas, aprendizaje de cuantizacin vectorial, redes
de Elman y redes de Hopfield.
El usuario est en la capacidad de efectuar el diseo de arquitecturas complejas haciendo
uso de las funciones y procedimientos escritos para MATLAB combinndolos con los
modelos que ya estn proporcionados por defecto en la caja de herramientas.
Adicionalmente, el usuario puede definir sus propias funciones de transferencia e
inicializacin, reglas de aprendizaje, funciones de entrenamiento y estimacin de error para
usarlas posteriormente con las funciones bsicas.
Con el objeto de estudiar la convergencia y estabilidad de los algoritmos de aprendizaje,
se sugiere apoyarse en las facilidades y prestaciones grficas de MATLAB para el estudio
del comportamiento de las redes: visualizacin grfica de la matriz de pesos y vector de
desplazamiento mediante diagramas de Hinton, representacin de errores a lo largo del
entrenamiento, mapas de superficie de error en funcin de pesos y vector de
desplazamiento, etc.
Las herramientas de MATLAB pueden ser usadas para la valoracin e implementacin de
diseos neuronales en la industria y sobre todo en educacin e investigacin. Las
aplicaciones bsicas se enmarcan dentro del campo de la industria aeroespacial y
automocin
(simulacin,
sistemas
de
control,
autopilotaje),
banca,
defensa
Anexo
129
130
E.
ANEXO 5.- RED SUPERVISADA
(COMPLEMENTO AL MARCO
TEORICO)
Es posible utilizar las RNA supervisadas ya que como se mencion anteriormente sirven
como herramientas para predecir tendencias o en la clasificacin de conjuntos de datos.
Las RNA supervisadas son un conjunto de algoritmos matemticos que encuentran las
relaciones no lineales para un conjunto de informacin determinada. La neurona recibe
informacin que debe ser ponderada mediante unos pesos segn su importancia con
respecto al resto de la informacin. Luego se aplica la Regla de Propagacin que consiste
en multiplicar cada informacin por su peso y calcular la sumatoria de estos resultados
(suma conocida como el potencial sinptico)
N
H i t X j *WJ
j 1
Siendo
Wj
Xj
x xi ,..., xn
y 1 .
donde
Xi R ,
Anexo
131
^ 0 y y
L y, y
1y y^
Esto es llamado prdida cero-uno que representa una forma de cuantificar el costo de un
error en la clasificacin (i.e., costo real econmico asociado con un error).
La siguiente funcin de riesgo representa la cantidad a ser minimizada desde el punto de
vista del banco
Rh
L y, hxP x, y dxdy
XY
XY
Remp h
1
L yi , hxi
l xi , yi S
R
de aprendizaje ser encontrar un vector * que minimice
adicional de Pxy .
El problema de aprendizaje
1
L yi , hxi ;
l xi , yi S
132
Generalizacin
R * R l
El principio de seleccin de
generalizacin del error puede ser limitada con probabilidad 1 si l tiende al infinito. Esto
es debido a la ley de los grandes nmeros (LLN).
R es la expectativa de prdida de
Remp
es la media de la prdida de
wi dado
por
zi x * wi .
La funcin de
z 1
exp i 2
En esta capa existe una unidad que cumple la tarea de sumar las salidas de las unidades
de vectores de la clase respectiva. Al sumar dichas salidas se est haciendo una
aproximacin a la funcin de densidad estimada correspondiente a cada clase. La ltima
capa contiene un nodo, el cual se encarga de implementar la regla de decisin. Es posible
utilizar este tipo de red para problemas de clasificacin. Cuando se presenta una entrada,
la primera capa calcula distancias desde el vector de entrada hasta los vectores de
entrenamiento de entrada, y produce un vector cuyos elementos indican qu tan prxima
est la entrada a una entrada de entrenamiento. La segunda capa suma estas
contribuciones para que cada clase de entradas produzca la salida de la red como un
vector de probabilidades. Finalmente, una funcin de transferencia competitiva ubicada en
la salida de la segunda capa escoge el mximo de estas probabilidades y produce un 1
para esa clase y un 0 para las otras clases. Las clases se conocen de antemano cuando
se trata de un vector de entrenamiento.
Anexo
133
F.
ANEXO 6.- TECNICAS PARA
REDUCCION DE LA
DIMENSIONALIDAD
Anlisis de Componentes Principales (ACP)
El anlisis de componentes principales se usa para reducir la dimensionalidad de un
conjunto de datos a travs de la determinacin de las causas de su variabilidad. Esta
tcnica busca la proyeccin segn la cual los datos queden mejor representados en
trminos de mnimos cuadrados y es empleada en anlisis exploratorio de datos y en la
construccin de modelos predictivos.
ACP es una tcnica matemtica lineal que reduce la dimensionalidad de un conjunto de
datos sin que se pierda demasiada informacin y suele clasificarse como una tcnica
multivariante. Intuitivamente la tcnica sirve para hallar las causas de la variabilidad de un
conjunto de datos y ordenarlas por importancia. Esta tcnica busca la proyeccin segn la
cual los datos queden mejor representados en trminos de mnimos cuadrados y se
emplea sobre todo en anlisis exploratorio de datos y para construir modelos predictivos.
Una de las ventajas de esta tcnica para reducir la dimensionalidad de un grupo de datos,
es que retiene aquellas caractersticas del conjunto de datos que contribuyen ms a su
varianza, manteniendo un orden de bajo nivel de los componentes principales e ignorando
los de alto nivel.
El Anlisis de Componentes Principales (ACP) fue inicialmente desarrollado por Pearson
a finales del siglo XIX y posteriormente estudiado por Hotelling en los aos 30 del siglo XX.
Sin embargo, hasta la aparicin de los ordenadores no se empezaron a popularizar.[11]
El ACP tiene como objetivo reducir la dimensin explicando la mayor variabilidad posible.
La primera CP es la combinacin lineal de las variables que tenga mayor varianza. La
segunda CP es una variable aleatoria, independiente y ortogonal a la anterior, de varianza
mxima. Esto es, maximizar la varianza explicada resulta equivalente a minimizar la
varianza del error. Es un proceso que se basa en la diagonalizacin de la matriz de
varianzas y covarianzas. [6]
La aplicacin del ACP est limitada por varios supuestos [31]:
134
Los componentes principales son ortogonales: el ACP puede ser solucionado con
tcnicas de descomposicin de algebra lineal.
Anlisis Factorial
Al igual que el anlisis de componentes principales, este modelo tiene como objetivo
reducir la dimensionalidad del problema suponiendo implcitamente que los datos han sido
generados de una forma particular, a partir de ciertos factores mediante combinaciones
lineales, de forma tal que los resultados obtenidos pueden ser interpretados, siendo as
este un modelo de inferencia. Dependiendo del nmero de factores que se desee, se
realizan combinaciones lineales de las variables originales buscando que se produzca el
menor error posible. Este modelo utiliza el aprendizaje por refuerzo. [6]
Anexo
135
Bibliografa
[1]. Aragn Torre, Alberto (2000). Aplicaciones de Redes Neuronales en Economa.
Espaa: Universidad de Burgos.
[2]. Aristizabal Restrepo, Maria Clara (2006). Evaluacin asimtrica de una red neuronal
artificial: Aplicacin al caso de la inflacin en Colombia. Colombia, Bogot: Banco de
la Repblica.
[3]. Baesens, B. Setiono, R. Mues, C. Vanthienen, J. (2003). Using Neural Network
Rule Extraction and Decision Tables for Credit-Risk Evaluation. Blgica: Department
of Applied Economic Science.
[4]. Bijit, Juan Antonio B. (2008). Modelo de prediccin de morosidad de la cartera usando
Redes Neuronales. Chile: Universidad de Chile.
[5]. Briglia, Enrique (2007). Aplicacin de Redes Neuronales al Riesgo de Crdito y
discusin de su inclusin en los Modelos Estadsticos tradicionales. Uruguay: Curso
Pedeciba.
[6]. Castellano Mendez, Mara (2009). Modelizacin Estadstica con Redes Neuronales.
Espaa: Universidade da Corua. Departamento de Matemticas. Tesis Doctoral.
[7]. Collantes, Joanna (2001). Prediccin con Redes Neuronales: comparacin con las
metodologas de Box y Jenkins. Venezuela, Mrida: Universidad de los Andes.
[8]. Corredor W., Adriana M. y Prez R., David (2009). El mercado de crdito comercial y
las restricciones de endeudamiento en Colombia. Reporte de Estabilidad Financiera.
Banco de la Repblica.
[9]. Del Carpio Gallegos, Javier (2005). Las Redes Neuronales Artificiales En Las Finanzas.
Per: UNMSM, Revista de la Facultad de Ingeniera Industrial.
[10].
138
[11].
Garca Estvez,
[17].
Universidad de Cantabria.
[18].
Misas Arango, Martha; Lpez Enciso, Enrique; Querubn Borrero, Pablo (2002). La
[21].
Martn Del Brio, Bonifacio y Zans Molina, Alfredo (1998). Redes Neuronales.
Martn Del Brio, Bonifacio y Zans Molina, Alfredo (2002). Redes Neuronales y
Bibliografa
[25].
139
Prez R., Fredy y Fernndez C., Horacio (2007). Las Redes Neuronales y La
Ricote Gil, Fernando (2004). Teora de las redes neuronales para la gerencia de
[30].
SPSS Neural Networks (2010) IBM Manual del Usuario y ejemplos aplicados
2010
[33].
Stiglitz, J.E. y Weiss, A. (1992): Asymmetric information in credit markets and its
implications for macroeconomics, Oxford Economic Papers, vol. 44, pp. 694-724.
[35].
de 2010 Pgina 9.
[36].
Western Hemisphere Credit & Loan Reporting Initiative WHCRI (2005). Sistemas
140
[42].
[44].
------ Urquizo Rojas, Daniela; Mendivil Gomez, Fabin (2011). Aplicacin de Redes
142
Vocabulario
ADALINA (ADAptive Linear Neuron): es un elemento adaptativo lineal que puede ser
usado para el reconocimiento de voz y caracteres,
adaptativo y en el desarrollo de filtros adaptativos que eliminen los ecos de las lneas
telefnicas.
ACP Anlisis de componentes principales: se usa para reducir la dimensionalidad de
un conjunto de datos a travs de la determinacin de las causas de su variabilidad. Esta
tcnica busca la proyeccin segn la cual los datos queden mejor representados en
trminos de mnimos cuadrados y es empleada en anlisis exploratorio de datos y en la
construccin de modelos predictivos.
Vocabulario
143
144
Vocabulario
145
146
Validacin cruzada: Idealmente, la red debe entrenarse hasta un punto ptimo en el que
el error de generalizacin es mnimo. Para esto se debe entrenar y validar a la vez para
detenerse en el punto ptimo.