Anda di halaman 1dari 9

UNIVERSIDAD DE CHILE

FACULTAD DE ECONOMA Y
NEGOCIOS

Business Intelligence and


Analytic
TARE
A3

BENJAMN ANDRS HIRSCH VERGARA


Tabla de contenido
MODELO DE LA RUTA.................................................................................. 2
Solucin 1...................................................................................................... 3
Realice nuevamente el mtodo k-means con k=5, pero esta vez active
la opcin generar campo de distancia como se muestra en la figura:..3
Solucin 2...................................................................................................... 4
Cree una nueva escala numrica para re-categorizar el atributo
Account_Status y realice un anlisis de clster bietpico. Esta nueva
escala debe reflejar que la distancia entre los clientes que estn
Balanced y los que estn 30 days late es mayor que la distancia entre
los que estn 30 days late y 60 days late................................................4
Solucin 3...................................................................................................... 5
Muestre grficamente las diferencias entre clsters del punto anterior
utilizando un grfico de 3D scatter plot, en que el eje X corresponda al
Mo_Income, Eje y Mo_Expenses, eje Z Marital_Status y el color del
atributo a la etiqueta de clster. Interprete desde el punto de vista del
problema de negocios (descripcin de segmentos de clientes de un
Banco)...................................................................................................... 5
Solucin 4...................................................................................................... 6
Cmo se comparan los resultados del anlisis bietpico de clsters
utilizando la escala del punto 2 respecto de la utilizada en el anlisis k-
means de la pregunta 1? Refirase al nmero de clsters resultantes,
las diferencias entre las medias de los grupos y la calidad de los clsters
(medida de silueta).................................................................................. 6
Solucin 5....................................................................................................... 7
MODELO DE LA RUTA
Solucin 1
Realice nuevamente el mtodo k-means con k=5, pero esta vez
active la opcin generar campo de distancia como se muestra en la
figura:
Seleccione esta opcin para que el nugget de modelo incluya un campo con
la distancia de cada registro desde el centro del clster que le ha sido
asignado. Conecte un nodo Tabla despus de este nuevo nodo K-means.
Interprete el resultado de la columna $KMD-K-means para los dos primeros
clientes en la tabla.

Posterior a la generacin de nuevos clsters se gener una tabla para


analizar los dos primeros clientes, obteniendo lo siguiente:

Como se puede observar el primer cliente pertenece al Clster 1 y tiene un


KMD-K medias de 0,655. Esto es un buen valor ya que significa que el
cliente 1 se encuentra cerca del centro del clster al que fue asignado por el
modelo. Respecto al cliente dos, el valor obtenido es 0,938, lo que habla de
un dato ms alejado del centro del clster.
Estos resultados se condicen con lo esperado, ya que comparando las
variables del cliente 1 y 2, el primero se acerca ms en cada uno de los
atributos al clster 1 respecto al cliente 2.
Solucin 2
Cree una nueva escala numrica para re-categorizar el atributo
Account_Status y realice un anlisis de clster bietpico. Esta nueva
escala debe reflejar que la distancia entre los clientes que estn
Balanced y los que estn 30 days late es mayor que la distancia entre
los que estn 30 days late y 60 days late.

Para lograr esto se reclasificaron los valores de la variable account status,


pasando a lo siguiente: Balanced tom el valor de 1, 30 days late el valor 3
y 60 days late 4. De esta manera los valores reflejan mayor diferencia entre
balanced y 30 days late, que entre 30 days late y 60 days late.

Los clsters en el modelo bietpico quedaron de la siguiente forma:


Solucin 3
Muestre grficamente las diferencias entre clsters del punto anterior
utilizando un grfico de 3D scatter plot, en que el eje X corresponda
al Mo_Income, Eje y Mo_Expenses, eje Z Marital_Status y el color del
atributo a la etiqueta de clster. Interprete desde el punto de vista del
problema de negocios (descripcin de segmentos de clientes de un
Banco).

Se puede observar que el clster 1 agrupa gente de bajo ingreso y poco


gasto, independiente de su estado civil. Estos son un segmento poco
atractivo ya que no tiene gran excedente de ingreso mensual por lo que
difcilmente podra pagar un crdito. Situacin similar enfrenta el clster 2,
que a pesar de tener mayor ingreso, tiene mayores egresos dando un
resultado final similar. El clster ms atractivo es el tercero, ya que se trata
de gente con ingresos altos y pocos gastos, dejndoles margen para
adquirir un crdito y poder pagarlo. Esto se refleja en la siguiente captura
del grfico, donde se ve que el clster 3 se escapa de la lnea de relacin

entre ingreso y egresos.


Solucin 4
Cmo se comparan los resultados del anlisis bietpico de clsters
utilizando la escala del punto 2 respecto de la utilizada en el anlisis
k-means de la pregunta 1? Refirase al nmero de clsters
resultantes, las diferencias entre las medias de los grupos y la calidad
de los clsters (medida de silueta).

Respecto al nmero de clsters se puede observar que con el modelo K


medias se generaron cinco, en cambio el bietpico los agrup en tres
clsters. Como resultado de esto se obtuvieron clsters ms precisos, ya
que estn ms distanciados que en el modelo K Medias. Finalmente
respecto a la medida de silueta el modelo k medias da 0,2 mientras el de
bietpico 0,4 comprobando la mejor calidad de estos clsters.
Solucin 5
Realice nuevamente el mtodo Bietpico, pero ahora excluyendo los
valores atpicos. Compare detalladamente los resultados con los
clsteres que s contienen estos valores.

Anda mungkin juga menyukai