Anda di halaman 1dari 10

AGRUPAMIENTOS O CLUSTERING NUMERO DE INCIDENTES OCURRIDOS DURANTE EL AO EN UNA ORGANIZACIN Juan Camilo Vsquez Maricela Marulanda Cristian Gonzalez

Lopez IAI103-1 Ingeniera en Sistemas Instituto tecnolgico Metropolitano Inteligencia Artificial Avanzada Hctor Tabares O. RESUMEN: Clasificar un conjunto de datos historicos referentes al numero de incidentes presentados en una empresa durante 5 aos, para lo cual se utilizara el proceso de clustering o agrupamiento donde a travs de la definicin de una cantidad determinada de cluster se pretende identificar los grupos ms semejantes entre si y obtener de esta forma objetos que representen los demas puntos de incidencia. PALABRAS CLAVES: Kmeans, Fcm, fcmdemo, findcluster, clustering, agrupamiento, matlab INTRODUCCIN

Clustering: es el proceso de particionar un conjunto de objetos (datos) en un conjunto de sub-clases con cierto significado. De acuerdo a la serie histrica compartida por la organizacin nos apoyaremos en las funciones de matlab kmeans y fcm, al igual que el algoritmo KMEDIA los cuales ayudaran en el agrupamiento de los datos y la identificacin de los cluster mas representativos. Objetivo General. Aplicar el proceso de clustering en la serie histrica definida apoyndonos en las diferentes funciones y algoritmos que estan establecidos. Objetivos Especficos. Definir una serie histrica para la implementacin del proceso de clustering Simular el proceso de agrupamiento de datos por medio de clusters con base a las funciones fcm y kmeans de matlab Verificar los resultados obtenidos con las interfaces graficas fcmdemo, findcluster a partir del archivo .dat generado desde el script de matlab

DESCRIPCIN DEL PROBLEMA.

En una organizacin se tienen los datos histricos de los ltimos 5 aos en curso de la cantidad de incidentes que se han manifestado en cada una de sus sedes obteniendo el valor general de la toda la empresa. Con estos datos se buscara aplicar un proceso de clustering agrupamiento con el fin de maximizar la similitud de incidentes del cluster y maximizar las diferencias entre clusters. X= 60 Corresponde al nmero de meses durante un periodo de 5 aos. Y= Corresponde a la frecuencia de incidentes por mes METODO PROPUESTO.

Para la solucin y aplicacin del proceso de clustering se implementara inicialmente el algoritmo de KMEDIAS, que de forma iterativa clasificar utilizando 2 clusters los incidentes ocurridos en el periodo establecido, posterior a esta implementacin se evaluarn los datos en las funciones fcm y kmeans en matlab, con el fin de establecer un nmero mayor de cluster y verificar los datos obtenidos frente a los arrojados desde el algoritmo KMEDIAS, por ltimo a travs de las interfaces graficas de matlab fcmdemo y findcluster se cargarn los datos previamente salvados con la funcion save nombrearchivo.dat esto con el proposito de validar de una forma ms rpida el proceso de agrupacin.

VALIDACIN DEL MTODO PROPUESTO

Algoritmo de agrupamiento K-MEDIAS (K-MEANS)

Agrupamiento por medio de la funcin FCM (FUZZY C-MEANS) de matlab

Agrupamiento por medio de la funcin KMEANS de matlab

Agrupamiento por medio de la interfaz grafica FINDCLUSTER de matlab Desde la consola de matlab se digita el comando findcluster, accionando el boton LoadData, la interfaz solicitar al usuario que ubique el archivo .dat previamente guadado

Una vez cargado el archivo .dat el sistema solicita se seleccione el metodo (fcm) y el nmero de cluster a utilizar para la clasificacin.

Agrupamiento por medio de la interfaz grafica FCMDEMO de matlab

ANALISIS DE LOS RESULTADOS.

Luego de ejecutada el proceso de agrupamiento de datos desde los diferentes metodos de aplicacin, se logra identificar una ptima clasificacin del nmero de incidentes presentados en el periodo establecido, se utilizaron 2 cluster para tal efecto y para cada una de las funciones que se utiliz los resultados se asemejan los unos de los otros. CONCLUSIONES.

Utilizando un numero mayor de cluster, el agrupamiento de los datos resultar ms ptimo debido a que en algunos meses el numero de incidentes fue el mismo.

Las tcnica de agrupamiento validadas en este trabajo permiten concluir el sin numero de soluciones que se podrian aplicar en trabajos reales.

Anda mungkin juga menyukai