Anda di halaman 1dari 14

Tarea Laboratorio 2

Nombres: lvaro Guzmn; Valentina Ugarte

Pregunta 1

Creamos una tabla donde se muestra el uso total de tarjeta de credito, segn
ao y estado de cuenta con el operador Aggregate.
Del output sale lo siguiente:

Se puede observar que en ambos aos el uso es mayor en aquellas personas


que pagan a tiempo su crtido (Balanced), a diferencia de las personas que
pagan con atrasos. Adems, se aprecia un incremento de uso, entre un ao y
otro, en aquellos que son ms morosos, ya que la cantidad de personas con
estado de 60 days late casi triplic su uso de la tarjeta. No obstante, en los
otros 2 casos el uso tuvo una reduccin importante.
Pregunta 2

Para poder obtener la tabla utilizamos el operador Select Atributtes para filtrar
los datos solo a Mo_Income, Year y Account Status. Luego dejamos los
aos en las columnas y el estado de cuenta en filas, obteniendo la desviacin
estndar de los ingresos segn aos y estado de cuenta
Obteniendo el siguiente output:

Se puede observar que los valores no varan mayormente ni entre aos ni entre
estados de cuenta, ya que seguramente los clientes han de ser los mismos con
los mismos ingresos entre ao y ao, y es posible que mantengan su
comportamiento de cumplimiento de sus deudas entre aos. Sin embargo, si
hay una diferencia apreciable entre los del estado 60 days late, que podra
deberse a muchos factores, por lo que no es claro.
Pregunta 3

De los grficos ya realizados anteriormente, el primero escogido fue el quartile


color de usage contra account status:

Se observa que las concetraciones y el promedio son similares para todos los
tipos de account status, por lo que no podra generarse mayor distincin entre
los usuarios y su morosidad de acuerdo a usos normales. Sin embargo, s
podra generarse una decisin en torno a no aplicar recursos a incentivar el
pago de las deudas a personas que tienen excesivos usos de su tarjeta de
crdito, pues es muy probable que estas paguen, vale decir, que caigan dentro
del tipo balanced. Por lo menos para usos mayores a 2.22E4.
El segundo escogido fue el de dispersin de las diferentes cuentas, respecto al
ingreso y los gastos.

Ambas variables parecieran correlacionarse directamente, por lo que podra


sencillamente deducirse que a mayores ingresos mayores gastos. No obstante,
tambin se observa que las cuentas que parecen estar ms dispersas, aquellas
que se encuentran por sobre los rayos, son en su mayora verdes o rojas, vale
decir, cuentas con estado de morosidad y escapan a la regla ya que tienen
altos ingresos y bajos gastos. Por lo que una decisin administrativa sera la de
aplicar planes de cobro ms efectivo a clientes que tienen altos ingresos y
tienden a consumir poco, porque es probable que no paguen sus crditos.
Pregunta 4

Para este punto elegimos un grfico de dispersin de Marital_Status (eje x) y


Mo_Expenses (eje y), con color de Account_Status. En el podemos diferenciar 3
clusters de clientes: Los casados, los solteros y los viudos. Cada uno con un
comportamiento diferente.

Los casados tienden a tener mayores gastos que cualquier otro estado marital,
seguramente debido a los gastos familiares involucrados, como los hijos por
ejemplo. Este tipo de cliente tiende a ser muy estricto en el cumplimiento de
sus obligaciones pecuniarias y son mayormente los que pagan a tiempo (son
mayormente color azul-balanced). Tienen un ingreso bastante alto y usan
regularmente las tarjetas de crdito, posiblemente porque no alcanzan a cubrir
los gastos presentes con el ingreso, pero tienen la seguridad que pueden pagar
en el futuro prximo, lo que reafirma su comportamiento de pago.

Los solteros, tienen gastos un tanto menores a los casados, seguramente


porque carecen de obligaciones familiares, o estn recin comenzando a
preocuparse de ellas. Puede que aun no estn casados pero convivan ya, eso
ameritara mayor investigacin. Adems, son ms irresponsables con los pagos
de sus deudas crediticias, a diferencia de los anteriores, tal vez debido a la
inmadurez consiguiente a su estado civil o porque tal vez se pueden dar el lujo
de no ser estrictos en los pagos pues no tienen responsabilidades externas que
los obliguen a no derrochar dinero en intereses adicionales. Son el segmento
que mayor ingreso tiene y que se divide en aquellos que usan mucho el
crdito, tal vez por sus expectativas a mayores ingresos futuros; y los que usan
casi nada el crdito, tal vez por las deudas que ya han contrado en
preparacin para la vida conyugal.
Por ltimo, tenemos a los viudos. Estos son mayormente viejos, el ms joven
tiene 80 aos, y la desviacin estndar de las edades muestra que no va ms
all de 6 aos. Por otro lado, tienen comportamientos de gasto mucho menores
que los otros dos clusters, posiblemente debido a la prdida de su conyugue
dada la edad y no deben tener mayores gastos por su etapa de vida: no hijos,
no colegios, no comida, no doctores, no lujos, no tecnologa, etc.
Adicionalmente, este segmento tiende a demorarse en los pagos de sus
crditos, probablemente debido a los escasos ingresos que se tiene a mayor
edad y que seguramente apenas tienen dinero, sea de la jubilacin o

excepcionalmente del trabajo. Paralelamente, usan en menor medida su tarjeta


que el resto de los clusters, tal vez con las expectativas futuras a la
imposibilidad de pago por las bajas rentas.
Pregunta 5

Utilizando los grficos del Plot View, realizamos un grfico de dispersin que
muestra las variables de Usage (eje y) y Occupation (eje x), con
Account_Status como color. En este podemos apreciar lo significante que es la
ocupacin del cliente en el uso de la tarjeta. Es notorio que los clientes
Managers tienen un uso considerablemente ms elevado que aquellos de otras
profesiones, y eso es muy importante para una empresa que entrega crdito ya
que mayor uso significa mayor retorno por el costo de los intereses del crdito.
Pero adems del uso, que es la mayor prioridad, interesa que pida crditos muy
grandes y que pague a tiempo por la liquidez del acreedor, por lo que
realizamos un filtro con el operador Filter Example para ver aquellos clientes
que cumplan con lo que necesitbamos: Ocupation=Manager;
Account_Status=Balanced; Marital_Status=Married. Esto ltimo fue designado
segn lo concluido en le punto pasado en que se estableci que los clientes
casados tienen un comportamiento ms responsable en el pago de sus deudas,
por lo que de ese modo aseguramos que tenga un estado Balanced en el
futuro.
Del output, obtuvimos 53 clientes que cumplan con nuestro filtro. As que los
ordenamos por Mo_Expenses, para priorizar por aquellos que gastan mucho y
piden crditos grandes, que conllevan intereses grandes, y sacamos los 3
ltimos que menos gastaban. Quedndonos finalmente con la nmina de los 50
mejores clientes, que muestra la tabla a continuacin.

La estrategia que privilegiaramos sera hacer polticas que busquen fidelizar e


incentivar un mayor consumo por el grupo de managers casados. En este
sentido, se ofrecern lneas de crdito de consumo nuevas. Las cuales estn
orientadas a las necesidades puntuales de este segmento, para que de este
modo se sientan incentivados a gastar ms. Es as como se puede ofrecer
crditos que se puedan pagar en ms aos, con montos de prstamo ms altos
y que sean para fines distintos a los que se usa normalmente una tarjeta de
crdito. Por ejemplo, y suponiendo que los intereses de los managers son
vrealizar viajes, emprender o realizar estudios de postgrado, se podran otrogar
prstamos para que puedan desarrollar dichas actividades; siempre teniendo
en cuenta que lo ms importante es que el crdito tenga aractersticas propias
que son importantes para este segmento.

Por otro lado, descartamos ofrecer crditos hipotecarios, pues la mayora de los
miembros de este grupo tienen casa propia. Tambin no evaluamos la
posibilidad de que sean crditos para la educacin, ya que no existe ms
informacin que la cantidad de hijos, desconociendo la edad de estos;
informacin que resultara util para poder tomar la decisin de ofrecer estos
nuevos crditos.

Pregunta 6

- ID: Es un nmero de identidad que se le asigna a cada cliente, que es


nico. Vara de 1 a 407.
- YEAR: Refleja el ao en que se realiz la transaccin. Dado las bases de
datos combinadas, tanto de la lnea de crdito nacional como
internacional, se tienen datos desde el ao 2005 hasta el 2008.
- DOB: La fecha de nacimiento del usuario. Esta data del 1913 hasta el
1962. Es importante mencionar que la mayora de los clientes son de
avanzada edad. Ejemplo de esto, es que el ms anciano tiene 101 aos;
mientras que el ms joven tiene 52 aos.
- Gender: El gnero de los usuarios. La mayora de estos son hombres,
pues 404 pertenecen a dicho sexo y tan solo 160 son mujeres. Este dato
tambin puede estar contaminado por
- Material_status: Es el estado civil de las personas, el cual puede ser
casado, soltero, o separado. El 80,1% de los usuarios est casado (452
personas), el 13,8% est soltero (78 personas) y el 6% est viudo (34
personas).
- Nbr_children: Pareciera ser la cantidad de hijos de la persona en
cuestin, los cuales van de 1 a 3 en nuestra base. En promedio los
usuarios tienen 1,539 hijos y el grado de dispersin (desviacin
estndar) es de 0,553.
- Occupation: Define si es gerente, profesional, administrativo, calificado,
o no calificado. La mayora de los usuarios tienen como ocupacin ser
administrativo (35,5%), seguido muy de cerca de los profesional (33%).
Los gerentes son un 17%, mientras que el 11,3% es calificado y el 3,2%
son no calificados.
- Home: Define si tiene casa propia o arrienda una. En este caso, 478
usuarios tienen casa propia y tan solo 86 personas arriendan.
- Mo_expenses: Son los gastos de los individuos. Esos no se sabe en qu
moneda se realizaron -si estn en dlares u otra moneda- , como
tampoco se sabe si son mensuales, promedio, entre otros. Sin embargo,
se conoce que el mnimo gastado es 257, el mximo es 1963. Por otro
lado, el promedio de gastos es 787,996 y la desviacin estndar de estos
datos es 378,858, con lo cual podemos concluir que la mayora de los
usuarios gasta a lo menos 409.
- Mo_income: Son los ingresos de los individuos, y se desconoce lo
mismo que se desconoce de los gastos (en aspectos temporales y
moneda). El mnimo valor es 1002, mientras el mximo es 4899.
Adems, el promedio de ingresos del conjunto de usuarios es 2570,418 y
la desviacin estndar es 1099,338. Con esto se pude concluir que la
mayora de los clientes ganan a lo menos 1471,08 monto cercano al
mximo gastado por los usuarios-.
- Cheking_account: Es si el usuario posee cuenta corriente. Puede ser s
o no. Solo 70 usuarios tienen cuenta corriente y 494 clientes no poseen
este tipo de cuenta.
- Savings_account: Es si el usuario posee cuenta de ahorro. Puede ser s
o no. Al contrario de la cuenta corriente, la mayora de los clientes si
tienen este tipo de cuenta (542). Mientras, solo 22 usuarios no posee
cuenta de ahorro.
- Credit_limit: Es el lmite del crdito del usuario. Este puede ser alto,
mediano, bajo y muy bajo. Tienen lmite alto en la tarjeta de crdito 276
usuarios (48,9%), 90 personas (16%) tienen lmite mediano, 106 clientes
(18,8%) tienen lmite bajo y 92 individuos (16,3%) tienen lmite muy
bajo. De este modo, la mayora (casi la mitad) de los clientes de la base
de datos tiene un lmite alto en la cuenta corriente, lo cual no se condice
necesariamente con el porcentaje de uso (los clientes no usaran la
tarjeta hasta su mxima capacidad).
- Account status: Es el estado de la cuenta, el cual puede ser
balanceado, 30 das atrasado o 60 das atrasado. El 61,7% (348
usuarios) tiene el estado de cuenta balanceado, el 15,2% (86 usuarios)
estn con un atraso de 30 das en su cuenta y el 23% (130 usuarios)
tienen un atraso de 60 das.
- Mo_balance: Es la diferencia de ingresos con gastos de los clientes. El
valor mnimo para este atributo es 513, mientras que el mximo es
3612. Por otro lado el promedio es 1782,722 con una desviacin
estndar de 796,211. Con esto podemos concluir, que la mayora de los
usuarios estn ms cercanos al mnimo que al mximo. Por lo cual, hay
ms clientes que estn ms cercanos a tener un balance cercano a 513
y que la diferencia entre lo que ganan y gastan es poca. Por otro lado,
son menos los casos que gastan mucho menos de lo que ganan.
- Credit_card: La tarjeta de crditos de los usuarios, la cual puede ser
gold, standard, o ninguna. El 47,5 % (268 personas) no tiene tarjeta de
crdito, 35,5% (200 personas) tiene tarjeta standard y 17% (96
personas) tienen tarjeta gold.
- International_limit: El lmite internacional de la tarjeta al parecer, el
cual va de 0 a 51000.
- Usage: El uso de la tarjeta, que va de 0 a 49363. Al igual que en el caso
de los gastos e ingresos, no se sabe cul es la unidad de medida ni
cunto es el margen de tiempo al cual es atingente este dato. El
promedio de uso es 3465,640 y la desviacin estndar 8277,773.
- Usage_percent: El porcentaje de uso de la tarjeta, que va de 0 a 1.
Guarda relacin con el valor obtenido en el atributo anterior, pues ambos
hablar del uso de la tarjeta. El promedio de este porcentaje es 0,266 y la
deviacin estndar 0,328.

Pregunta 7.

Viendo los atributos, y teniendo en cuenta que se quieren predecir clientes


claves a futuro, se tiene que las variables claves son: Account_Status,
Mo_expenses, Mo_income, Usage y Occupation y Marital_Status.

Entre las variables consideradas, Account_Status, es prioridad, pues garantiza


el ingreso a la empresa, sin este atributo, poco importa los gastos o el uso, ya
que el pago de las comisiones no se hace efectivo. Sin embargo, este atributo
es un consecuente y no puede ser visto previamente a la captacin del cliente,
por lo que debemos enfocarnos y tener en cuenta el resto de los atributos
mencionados que son los que determinan Account_Status. As, Occupation y
Marital_Status vendran a ser los siguientes en el orden de prelacin para
predecir clientes clave, puesto que garantizan, en terminos probabilsticos, que
el cliente pagar a la fecha estipulada en el contrato. Tercero, siempre
interesar el cliente que tenga mayores gastos y mayores ingresos, puesto que
el primero respalda las grandes sumas y el segundo la liquidez de pago. Por
ltimo, el uso implica la cantidad o el multiplicador de la comisin. En este
sentido sera ideal poder atraer clientes que tuvieran la tendencia a pagar todo
con tarjeta.

Anda mungkin juga menyukai