I. OBJETIVOS
• Clustering
Clustering
Forma parte del aprendizaje No Supervisado, el objetivo del clustering es encontrar
agrupamientos de tal forma que los objetos de un grupo sean similares entre sí y diferentes de
los de un grupo sean similares entre sí y diferentes de los objetos de otros grupos.
No exista un criterio objetivo para la selección del número de Clusters, existen
implementaciones de diferentes métodos que ayudan a elegir el número apropiado de Clusters
para agrupar los datos; como son, el método del codo (elbow method), el criterio de Calinsky, el
Affinity Propagation (AP), el Gap (también con su versión estadística), Dendrogramas, etc.
3. Para realizar la tarea de clustering, escriba el siguiente código para cargar el conjunto de
datos.
4. Aplique el clustering k-mean, para encontrar el número óptimo de Clusters utilice el método
Elbow.
5. Luego escriba el código para visualizar los resultados de los cluster obtenidos.
2. Presione el botón Explorer, en la pestaña Preprocess seleccione el botón Open file… y elija
el archivo Mall_Customers.csv.
3. En la pestaña Cluster presione el botón Choose y seleccione weka / clusterers /
SimpleKMeans
4. En la caja de texto donde se encuentra el nombre de SimpleKMeans dele botón derecho y
elija la opción Show Properties…
V. Ejercicios
1. En Weka, pruebe con los otros algoritmos de clustering y observe los resultados. ¿A qué
conclusiones llega?
2. Pruebe las otras técnicas de Clustering para los datos de su proyecto. Realice una tabla
comparativa y seleccione el que mejor resultado genera. Tome como modelo las referencias.
VI. Cuestionario
1. http://www.sciencedirect.com/science/article/pii/S0167923605000114
2. http://www.cs.ust.hk/~qyang/Teaching/537/Papers/huang98extensions.pdf