Tabla de contenido MODELO DE LA RUTA.................................................................................. 2 Solucin 1...................................................................................................... 3 Realice nuevamente el mtodo k-means con k=5, pero esta vez active la opcin generar campo de distancia como se muestra en la figura:..3 Solucin 2...................................................................................................... 4 Cree una nueva escala numrica para re-categorizar el atributo Account_Status y realice un anlisis de clster bietpico. Esta nueva escala debe reflejar que la distancia entre los clientes que estn Balanced y los que estn 30 days late es mayor que la distancia entre los que estn 30 days late y 60 days late................................................4 Solucin 3...................................................................................................... 5 Muestre grficamente las diferencias entre clsters del punto anterior utilizando un grfico de 3D scatter plot, en que el eje X corresponda al Mo_Income, Eje y Mo_Expenses, eje Z Marital_Status y el color del atributo a la etiqueta de clster. Interprete desde el punto de vista del problema de negocios (descripcin de segmentos de clientes de un Banco)...................................................................................................... 5 Solucin 4...................................................................................................... 6 Cmo se comparan los resultados del anlisis bietpico de clsters utilizando la escala del punto 2 respecto de la utilizada en el anlisis k- means de la pregunta 1? Refirase al nmero de clsters resultantes, las diferencias entre las medias de los grupos y la calidad de los clsters (medida de silueta).................................................................................. 6 Solucin 5....................................................................................................... 7 MODELO DE LA RUTA Solucin 1 Realice nuevamente el mtodo k-means con k=5, pero esta vez active la opcin generar campo de distancia como se muestra en la figura: Seleccione esta opcin para que el nugget de modelo incluya un campo con la distancia de cada registro desde el centro del clster que le ha sido asignado. Conecte un nodo Tabla despus de este nuevo nodo K-means. Interprete el resultado de la columna $KMD-K-means para los dos primeros clientes en la tabla.
Posterior a la generacin de nuevos clsters se gener una tabla para
analizar los dos primeros clientes, obteniendo lo siguiente:
Como se puede observar el primer cliente pertenece al Clster 1 y tiene un
KMD-K medias de 0,655. Esto es un buen valor ya que significa que el cliente 1 se encuentra cerca del centro del clster al que fue asignado por el modelo. Respecto al cliente dos, el valor obtenido es 0,938, lo que habla de un dato ms alejado del centro del clster. Estos resultados se condicen con lo esperado, ya que comparando las variables del cliente 1 y 2, el primero se acerca ms en cada uno de los atributos al clster 1 respecto al cliente 2. Solucin 2 Cree una nueva escala numrica para re-categorizar el atributo Account_Status y realice un anlisis de clster bietpico. Esta nueva escala debe reflejar que la distancia entre los clientes que estn Balanced y los que estn 30 days late es mayor que la distancia entre los que estn 30 days late y 60 days late.
Para lograr esto se reclasificaron los valores de la variable account status,
pasando a lo siguiente: Balanced tom el valor de 1, 30 days late el valor 3 y 60 days late 4. De esta manera los valores reflejan mayor diferencia entre balanced y 30 days late, que entre 30 days late y 60 days late.
Los clsters en el modelo bietpico quedaron de la siguiente forma:
Solucin 3 Muestre grficamente las diferencias entre clsters del punto anterior utilizando un grfico de 3D scatter plot, en que el eje X corresponda al Mo_Income, Eje y Mo_Expenses, eje Z Marital_Status y el color del atributo a la etiqueta de clster. Interprete desde el punto de vista del problema de negocios (descripcin de segmentos de clientes de un Banco).
Se puede observar que el clster 1 agrupa gente de bajo ingreso y poco
gasto, independiente de su estado civil. Estos son un segmento poco atractivo ya que no tiene gran excedente de ingreso mensual por lo que difcilmente podra pagar un crdito. Situacin similar enfrenta el clster 2, que a pesar de tener mayor ingreso, tiene mayores egresos dando un resultado final similar. El clster ms atractivo es el tercero, ya que se trata de gente con ingresos altos y pocos gastos, dejndoles margen para adquirir un crdito y poder pagarlo. Esto se refleja en la siguiente captura del grfico, donde se ve que el clster 3 se escapa de la lnea de relacin
entre ingreso y egresos.
Solucin 4 Cmo se comparan los resultados del anlisis bietpico de clsters utilizando la escala del punto 2 respecto de la utilizada en el anlisis k-means de la pregunta 1? Refirase al nmero de clsters resultantes, las diferencias entre las medias de los grupos y la calidad de los clsters (medida de silueta).
Respecto al nmero de clsters se puede observar que con el modelo K
medias se generaron cinco, en cambio el bietpico los agrup en tres clsters. Como resultado de esto se obtuvieron clsters ms precisos, ya que estn ms distanciados que en el modelo K Medias. Finalmente respecto a la medida de silueta el modelo k medias da 0,2 mientras el de bietpico 0,4 comprobando la mejor calidad de estos clsters. Solucin 5 Realice nuevamente el mtodo Bietpico, pero ahora excluyendo los valores atpicos. Compare detalladamente los resultados con los clsteres que s contienen estos valores.