Anda di halaman 1dari 7

Análisis univariado de las variables

1. Sexo

La variable sexo se presenta como variable cualitativa, la cual tiene dos posibles
resultados: M(masculino) o F(femenino).
Se ha puesto como factor a la variable, categorizándola, ahora el número 2 representa
masculino, y 1 femenino.

Se verá como está distribuida en la data esta variable, podemos ver del cuadro anterior
que el 42% de la data son mujeres, y el 58% son varones.

2. Edad
En el histograma se puede ver que la distribución de los datos presenta una asimetría
positiva.

Esta tabla de datos, está representada en el diagrama de caja, se ve que la mínima edad en
esta data es de 19 años, el promedio de edades de las personas que han solicitado un crédito
es de 44 años, y la máxima edad está en 84 años.

3. Línea de crédito

El histograma de los datos representa una distribución asimétrica positiva, hay una alta
frecuencia de líneas de bajo nivel. Esto quiere decir que la entidad financiera presta en
mayor cantidad montos menores. Esto puede indicar que tiene dos tipos de clientes.

Como se ve en el cuadro, la máxima línea fue de S/. 184 300. Mientras que la mínima
fue de sólo S/. 500. El promedio de línea de los clientes es de S/. 7348, pero cabe aclarar
que se presentan datos vacíos un total de 42042. Al no contar estos datos, los cálculos
variarán.
4. Porcentaje de utilización de la tarjeta

El histograma muestra una distribución asimétrica positiva de los datos. La mayor


frecuencia en el histograma se presenta en porcentajes bajos de utilización de la tarjeta.
Esto quiere decir que la mayoría de clientes utiliza un porcentaje menor al 20% de su
línea de crédito.

El promedio de utilización de la tarjeta de la entidad financiera es 30.57%. Además, se


presenta el caso donde un cliente ha utilizado el 120% de su línea.

5. Número de meses con deuda en 12 meses previos


El histograma muestra que es una variable discreta. Y la mayor frecuencia en número de meses
con deuda en 12 meses previos, es de 12. Es decir, la mayoría de clientes ha tenido una deuda
por 12 meses, hace un año.

La media de la muestra es de 10.37 meses, pero este es debido a la alta frecuencia en el mes 12.
Se tiene que el mínimo tiempo que han tenido deuda es de 1 mes.

6. Numero de entidad con deuda en el mes t-1

Según el histograma se trata de una variable discreta. Se logra ver que la mayor frecuencia se
presenta entre las primeras tres barras, esto quiere decir que la mayoría de clientes han tenido
una deuda en el mes anterior con un máximo de 3 entidades, y un mínimo de 1 entidad.

El promedio es de 1.72 entidades, y algunos clientes han tenido deuda con 8 entidades.
7. Variación de número de entidades con deuda entre t-1 y t-12

Según el histograma es una variable discreta. La mayor frecuencia se da entre [0 - 1]. Esto quiere
decir que la mayoría de clientes que el mes anterior tenia deuda con x entidades, hace un año
también tenía deuda con la misma cantidad de entidades; o sino ha aumentado una deuda con
otra entidad.

El mínimo es 4, es decir que hay cierta cantidad de personas que el mes anterior tiene deuda con
4 entidades menos de lo que tuvo hace un año. El promedio es de 0.3449; y el máximo 4.

8. N° Meses que viene reduciendo deuda en 12 meses previos

El histograma nos muestra que es una variable discreta. La mayor frecuencia se presenta en el
rango de [4 - 12].
Esto quiere decir que la mayoria de clientes han venido reduciendo su deuda entre 4 y 12 meses
anteriores.

Hay clientes que no han reducido su deuda, y hay una cierta cantidad de clientes que viene
reduciendo hace 11 meses su deuda. El promedio es de 6.695 meses.

9. Clasif

En el histograma se ve que es una variable discreta, con valores de 0,1 y 2. Donde significa:

0: Mantiene "0" días de atraso en los 12 meses previos

1: Tuvo [1-30] días de atraso en alguno de los 12 meses previos

2: Tuvo >30 días de atraso en alguno de los 12 meses previos

Entonces la mayor frecuencia se presenta en el cero, es decir la mayoría de clientes no presenta


atraso en los últimos 12 meses.

Hay unos clientes que presenta más de 30 días de atraso en los últimos 12 meses.
10. Default

Según el histograma se ve que es una variable discreta. La cual tiene dos categorías:

0: Mantiene "0" días de atraso en los próximos 12 meses

1: Tuvo días de atraso > 60, en alguno de los próximos 12 meses

Se ve que la mayor frecuencia está en 0, es decir que la mayoría de clientes no presentan default.
Siendo más exactos un 85.7% de la data.

Anda mungkin juga menyukai