Anda di halaman 1dari 2

Libreras Comprenden un conjunto de mtodos que implementan las funcionalidades y utilidades bsicas.

Facilitan el desarrollo de tareas de minera que son estructuralmente ms complejas. Xelopes: La librera implementa la mayora de los algoritmos de aprendizaje, pudiendo desarrollar aplicaciones, es extensible y el usuario puede incorporar sus propios mtodos. Existe una clase que permite dar uniformidad a todos los modos de acceso. Modelos como: rboles de decisin, mquinas de vectores, redes neuronales. Exportacin de datos soporte el estndar PMML. MLC++: Facilita las tareas de testear y comparar la eficiencia y resultados proporcionados por diversos algoritmos, el acceso es por archivos con formato plano, siguiendo el estilo de archivo del repositorio UCI. Modelos de aprendizaje encapsulados mediante objetos. Suites Intenta en un mismo entorno capacidades para el procesado de datos, diferentes modelos de anlisis, facilidades para el diseo de experimentos y soporte grfico, existe una interfaz. SPSS Clementine: Posee una arquitectura distribuida (cliente servidor). Acceso de dato por fuentes ODBC, tablas Excel, archivos planos ASCII, procesa datos con pick & mix, muestreo, particiones, reordenacin de campos, etc. Tcnicas como redes neuronales, agrupamiento, reglas de asociacin, regresin lineal y logstica. Tcnicas de evaluacin de modelos guiados por las condiciones especificadas por el experto. Ofrece un potente soporte grafico que permite al usuario tener una visin global de todo el proceso, que comprende desde el analista del problema con la imagen final del modelo aprendi. Generacin automtica de informes. WEKA: Los datos son cargados desde un archivo en formato ARFF. El usuario puede observar en el diferente componente grficos, informacin de inters sobre el conjunto de muestras. Procesado de dato con: seleccin de atributos, desratizacin, tratamiento de valores desconocidos, transformacin de atributos numricos. Modelos de aprendizaje como los arboles de decisin, tablas de decisin, vecinos ms prximos, mquinas de vectores soporte, reglas de asociacin y mtodos de pre-agrupamiento. La visualizacin es en Explorer que controla la invocacin textual de las operaciones; Experimenter facilita el diseo y la realizacin de experimento complejos. Kepler: Dotado de mltiples modelos de anlisis y en su diseos se contemplan aspectos tales como la flexibilidad y la extensibilidad. Arboles binarios, redes neuronales, vecinos ms prximos, algoritmos multi relacionales. Todo el sistema se maneja mdiate una interfaz grafica de usuario programa en JAVA, permitiendo elaboracin de modelos, instanciacin de sus parmetros, representacin grfica de los modelos obtenidos, Dispone de un lenguaje script que permite agilizar el diseo de los experimentos. ODMS: Oracle Data Mining Suite (Darwin): Diseo sobre una arquitectura cliente-servidor y ofrece una versatilidad para el acceso a grandes volmenes de informacin, los accesos de datos son en diversos formatos: almacenes de datos, bases de datos relacionales, proceso de datos como muestreo de datos, modelos de aprendizaje como redes neuronales, regresin lneas, y herramientas como representatividad de los modelos inferidos; resultados estadsticos, e incorporacin de grficos desde herramientas comerciales. DBMines: Se trata de un sistema concebido para la extraccin de conocimientos en grandes bases de datos relacionales, almacenes de datos y web. OLAP: concentra la funcionalidad de manejo multidimensional; OLAM concentra funcionalidad especfica e minera de datos. Los mdulos se encuentran interconectados; Permite solicita cualquier operacin OLAP y OLAM por interfaz, Tiene grficos estadsticos, visores de rboles. YALE: Realizacin de experimentos de aprendizaje automtico, las operaciones elemntales se encapsulan en los llamados operadores, los cuales son configurados por archivos XML. Tiene operaciones para importar y reprocesamiento de datos, aprendizaje automtico, validacin de los modelos.

DB2 Intelligent Miner: Pensada para explorar los pasivos sistemas de informacin de las grandes cooperaciones, engloba una serie de paquetes destinados a diferentes aspectos de la inercia de datos, adems proporciona un grupo de herramientas para aplazar tareas de minera de bases de datos, mtodos como agrupamiento, asociantes, patrones. DB2 Intellient Minser Scoring extiende la funcionalidad de la base de datos para poder aplicar tcnicas de minera en tiempo real. DB2 Intelligent Miner Modeling: descubrimiento de relaciones. SAS Enterprice Miner: Amplia el funcionamiento para trabajar con informacin procedente de archivos de texto, posee una arquitectura distribuida, toda la funcionalidad del sistema es accesible mediante una potente interfaz grafica de usuario, con formato de archivo propio SAS, archivos de sistemas d base de datos, procesa datos con trasformaciones, tratamiento estadista, filtros, y con modelos como arboles de decisin, regresin linear y logstica, redes neuronales, evaluacin que permite comparar la eficiencia el rendimiento. Visualizador de resultados, generador automtico de informes. STATISTICA Data Miner: Especialmente atomizado para trabajar con grandes volmenes de datos de entrada, importacin de diversos formatos, procesa datos como seleccin de caractersticas, muestreo, usa reglas de asociacin, arboles de decisin, agrupamiento, tiene una interfaz grfica que hace a representacin grafica de sus modelos y los estadsticos, el usuario dispone de la opcin de especificar sus propias presentaciones. Herramientas Especficas Se caracteriza por centrarse en indeterminado modelos o determinada tarea de minera de datos, permite realizar el proceso de minera de datos, y no requiere de conocimientos en programacin. CART: Contiene utilidades para el anlisis estadstico y la minera de datos orientados hacia la inferencia de rboles de decisin. Tiene acceso a las de 70 formatos de archivos, informacin estadstica. AutoClass: Trata de problemas de apuramiento haciendo uso de mtodos bayesianos, dispone de un formato de archivo de entrada propio organizada en filas, generacin de informes de diferentes clases y estacin de test predictivos. Neuronal Planner, NeuroDiet y Easy NN-plus: Neuronal Planner: tiene dos modos de trabajo y el Usuario puede especificar la topologa de la red. NeuroDiet: sigue la lnea de funcionamiento se especializa hacia el tratamiento d problemas dietticos. Easy NN-plus: Dispone de ms utilidades grficas para controlar seguimiento. NeuroShell: Trabaja con modelos de aprendizaje basado en redes neuronales: NeuroShell Predictor: predice variables como ndices de ventas; NeuroShell Classifier: optimiza las tcnicas anteriores; NeuroShell Trader: aade un aspecto de tnica de lgica difusa e indicadores de agrupamiento. See5/C5.0: Construccin de modelos de clasificacin basados en arboles de decisin y conjunto de reglas. Opera sobre grandes volmenes de datos, los modelos aprendidos pueden ser exportados en cdigo C.