Anda di halaman 1dari 3

La minera de datos es el proceso que tiene como propsito descubrir, extraer y almacenar

informacin relevante de amplias bases de datos, a travs de programas de bsqueda e


identificacin de patrones y relaciones globales, tendencias, desviaciones y otros indicadores
aparentemente caticos que tienen una explicacin que puede descubrirse mediante diversas
tcnicas de esta herramienta.
Nuestra propuesta se basa en el uso de la tecnologa y el uso de la minera de datos para
comprender y predecir fenmenos fsicos ya que posee las siguientes ventajas:

Procesamiento de reservas de datos para descubrir relaciones.


Mediante modelos avanzados y reglas de induccin, poder examinar gran cantidad de

datos y encontrar patrones difciles de investigar a simple vista


El proceso de bsqueda puede ser realizado por herramientas que automticamente
buscan patrones porque as estn programadas y despliegan los tpicos ms
importantes.

La minera de datos hace uso de programas de bsqueda para detectar desviaciones y


tendencias.
Nos basaremos en programas llamados mineros que correlacionan los criterios de seleccin y
bsqueda con los datos histricos; si se encuentra algo interesante, es presentado como un
hallazgo.
Una ventaja de los mineros es que no requieren algn hardware especial o dedicado. Trabajan
sobre datos ya recolectados, en mquinas ya existentes, realizando labores tiles mientras los
usuarios no se encuentran trabajando.
Entre los conceptos ms importantes para conocer la minera de datos se encuentran:

Datos histricos: Son datos estables y coherentes que se van acumulando a lo largo de

algn proceso.
Criterios de bsqueda: Son normas, tendencias y patrones desde los cuales los
programas mineros realizarn el proceso de seleccin y bsqueda en los datos
histricos. La prioridad de bsqueda, los criterios de inters y la explicaciones de
situaciones extraas son definidas por el usuario.

Almacenamiento de hallazgos: Los hallazgos son los datos resultantes de correlacionar


los criterios de seleccin y bsqueda con los datos histricos.

Una aplicacin de la minera de datos en la fsica puede ser empleada en la mecnica al


analizar el estudio de un pndulo simple.
El perodo del pndulo es el tiempo entre dos pasajes sucesivos del extremo del pndulo a
travs del mismo punto, movindose en la misma direccin. Si se hace oscilar un pndulo
particular y de mide el tiempo de una sola oscilacin cincuenta veces se obtienen los
siguientes datos.

De la tabla se puede observar que no hay un periodo particular para el pndulo. Lo que
debemos hacer es tomar ests cincuenta mediciones del perodo, determinar su valor promedio
y luego determinar la precisin de este valor promedio. Sumando todos los periodos y luego
dividiendo la suma entre el nmero total de mediciones, encontramos que el valor medio para
el periodo del pndulo es 3.248 segundos. Tomando la diferencia entre este valor medio y cada
medicin, obtenemos la desviacin de cada medicin de valor medio. La suma de los valores
absolutos de las desviaciones dividida entre el nmero de mediciones se denomina desviacin
media, la cual da una indicacin de la precisin de la medicin. Para este ejemplo, la
desviacin media del periodo es 0.12 segundo, es decir, 3.25 0.12 segundos.
Otra manera de expresar la precisin de la medicin es mediante el uso de desviacin rmc
(raz media cuadrtica), definida como la raz cuadrada de la cantidad obtenida sumando los

cuadrado de las desviaciones divididas entre el nmero de mediciones. En esta medicin el


rmc es de 0.15 segundos. El clculo adicional realizado al obtener la desviacin rmc bien vale
es esfuerzo, ya que tiene un significado relativamente simple. Suponiendo que las variaciones
que aparecen en el conjunto de mediciones no se debe a ninguna causa sino que son
justamente fluctuaciones normales, la desviacin rmc nos dice que aproximadamente dos
tercios de todas las mediciones caen dentro de estas mediciones de valor medio. O en otras
palabras, tenemos la confianza que, la prxima vez que tomemos las mediciones del periodo
de nuestro pndulo con el mismo aparato hay una probabilidad de un 67% de que medimos un
periodo no mayor de 3.4 segundos o no menor a 3.10 segundos.

El ejemplo que se acaba de presentar relativamente es sencillo si lo manejamos en una minera


de datos pero existen muchos fenmenos complejos como en la termodinmica, la optometra,
el electromagnetismo, fsica moderna, etc. Nuestro enfoque ser obtener los datos correctos
para modelar y predecir fenmenos fsicos y no nicamente administrativos, como se utiliza
regularmente en las industrias.

Anda mungkin juga menyukai