TEMA:
REDES NEURONALES
ESTUDIANTES:
GUEVARA RAFAEL
ERICK
JOEL
YAICATE SAQUIRAY RONALD
FECHA: 23 – 08 – 17
1
Índice:
3
1. INTRODUCCIÓN A LAS REDES NEURONALES
4
2. RESEÑA HISTORICA
7
3. REDES NEURONALES
8
Fácil inserción dentro de la tecnología existente. Se pueden obtener chips
especializados para redes neuronales que mejoran su capacidad en ciertas
tareas. Ello facilitará la integración modular en los sistemas existentes.
3.2.2. Auto-organización
Las redes neuronales emplean su capacidad de aprendizaje adaptativo
para autoorganizar la información que reciben durante el aprendizaje y/o
la operación.
Mientras que el aprendizaje es la modificación de cada elemento
procesal, la autoorganización consiste en la modificación de la red
neuronal completa para llevar a cabo un objetivo específico.
Cuando las redes neuronales se usan para reconocer ciertas clases de
patrones, ellas autoorganizan la información usada. Por ejemplo, la red
9
llamada backpropagation, creará su propia representación
característica, mediante la cual puede reconocer ciertos patrones.
Esta autoorganización provoca la generalización: facultad de las redes
neuronales de responder apropiadamente cuando se les presentan
datos o situaciones a las que no había sido expuesta anteriormente. El
sistema puede generalizar la entrada para obtener una respuesta. Esta
característica es muy importante cuando se tiene que solucionar
problemas en los cuales la información de entrada no es muy clara;
además permite que el sistema dé una solución, incluso cuando la
información de entrada está especificada de forma incompleta.
10
3.2.4. Operación en tiempo real.
Una de las mayores prioridades, casi en la totalidad de las áreas de
aplicación, es la necesidad de realizar procesos con datos de forma muy
rápida. Las redes neuronales se adaptan bien a esto debido a su
implementación paralela. Para que la mayoría de las redes puedan operar
en un entorno de tiempo real, la necesidad de cambio en los pesos
de las conexiones o entrenamiento es mínimo.
11
Elevada cantidad de datos para el entrenamiento, cuanto más
flexible se requiera que sea la red neuronal, más información tendrá
que enseñarle para que realice de forma adecuada la identificación.
Otros problemas con las redes neuronales son la falta de reglas
definitorias que ayuden a realizar una red para un problema dado.
Las Redes Neuronales Artificiales, ANN (Artificial Neural Networks) están inspiradas
en las redes neuronales biológicas del cerebro humano. Están constituidas por
elementos que se comportan de forma similar a la neurona biológica en sus
funciones más comunes. Estos elementos están organizados de una forma parecida
a la que presenta el cerebro humano.
Las ANN al margen de "parecerse" al cerebro presentan una serie de características
propias del cerebro. Por ejemplo, las ANN aprenden de la experiencia, generalizan
de ejemplos previos a ejemplos nuevos y abstraen las características principales de
una serie de datos.
Aprender: adquirir el conocimiento de una cosa por medio del estudio, ejercicio
o experiencia. Las ANN pueden cambiar su comportamiento en función del entorno.
Se les muestra un conjunto de entradas y ellas mismas se ajustan para producir
unas salidas consistentes.
Existen cuatro aspectos que caracterizan una red neuronal: su topología, el mecanismo de
aprendizaje, tipo de asociación entre la información de entrada y de salida, y la forma de
representación de estas informaciones.
12
4.1. Topología
Consiste en la organización y disposición de las neuronas en la red formando capas
o agrupaciones de neuronas. Los parámetros fundamentales de la red son: número
de capas, número de neuronas por capa, grado de conectividad y tipo de conexión
entre neuronas.
Al hacer una clasificación topológica de las RNAs se suelen distinguir:
4.1.1. Redes monocapa: se establecen conexiones laterales entre las
neuronas que pertenecen a la única capa que constituye la red. Ejemplos
de redes de este tipo son la rede HOPPFIELD y la rede BRAIN-STATE-
IN-A-BOX. Las redes monocapa se utilizan típicamente en tareas
relacionadas con lo que se conoce como autoasociación; por ejemplo,
para regenerar informaciones de entrada que se presenta como
incompleta o distorsionada.
4.1.2. Redes multicapa: disponen las neuronas agrupadas en varios niveles.
Dado que este tipo de redes disponen de varias capas, las conexiones
entre neuronas pueden ser del tipo feedforward (conexión hacia
adelante) o del tipo feedback (conexión hacia atrás).
El aprendizaje es el proceso por el cual una red neuronal modifica sus pesos
en respuesta a una información de entrada. Los cambios que se producen
durante la etapa de aprendizaje se reducen a la destrucción (el peso de la
conexión toma el valor 0), modificación y creación (el peso de la conexión
toma un valor distinto de 0) de conexiones entre las neuronas. Podemos
considerar que el proceso de aprendizaje ha terminado cuando los valores
de los pesos permanecen estables
dwj / dt = 0
1. Aprendizaje supervisado
2. Aprendizaje no supervisado
14
Algoritmos que utilizan este tipo de aprendizaje son:
4.3.2. Aprendizaje por refuerzo: este tipo de aprendizaje es más lento que el
anterior y se basa en la idea de no disponer de un ejemplo completo del
comportamiento deseado; es decir, de no indicar durante el
entrenamiento la salida exacta que se desea que proporcione la red ante
una determinada entrada. Aquí la función del supervisor se reduce a
indicar mediante una señal de refuerzo si la salida obtenida en la red se
ajusta a la deseada (éxito = +1 o fracaso = -1) y en función de ello se
ajustan los pesos basándose en un mecanismo de probabilidades.
16
4.4.2. Aprendizaje competitivo y cooperativo: las neuronas compiten unas
con otras con el fin de llevar a cabo una tarea dada. Se pretende que
cuando se presente a la red cierta información, sólo una o un grupo de
ellas se activen. Por tanto las neuronas compiten por activarse,
quedando las perdedoras a sus valores de respuesta mínimos. La
conexión entre neuronas se realiza en todas las capas de la red,
existiendo en estas neuronas conexiones recurrentes de autoexcitación
y conexiones de inhibición (signo negativo) por parte de neuronas
vecinas.
El objetivo de este aprendizaje es categorizar (clustering) los datos que
se introducen en la red. De esta forma, las informaciones similares son
clasificadas formando parte de la misma categoría, activando por tanto
la misma neurona de salida. La variación del peso de una conexión entre
una unidad i y otra j será nula si la neurona j no recibe excitación por
parte de la neurona i y se modificará si es excitada por dicha neurona i.
Un ejemplo de este tipo de aprendiaje es el desarrollado por Kohonen
conocido como Learning Vector Quantization (LVQ) aplicado a redes
feedforward de dos capas.
4.6.2. Redes discretas: Por el contrario, otras redes sólo admiten valores
discretos [0,1] a la entrada, generando también en la salida respuestas
de tipo binario. La función de activación en este caso es del tipo escalón.
18
5. Elementos básicos que componen una red neuronal.
La
misma está constituida por neuronas interconectadas y arregladas en tres capas (esto
último puede variar). Los datos ingresan por medio de la “capa de entrada”, pasan a través
de la “capa oculta” y salen por la “capa de salida”. Cabe mencionar que la capa oculta
puede estar constituida por varias capas.
Antes de comenzar el estudio sobre las redes neuronales, se debe aprender algo sobre las
neuronas y de cómo ellas son utilizadas por una red neuronal. En la Figura 4.2 se compara
una neurona biológica con una neurona artificial. En la misma se pueden observar las
similitudes entre ambas (tienen entradas, utilizan pesos y generan salidas).
Mientras una neurona es muy pequeña en sí misma, cuando se combinan cientos, miles o
millones de ellas pueden resolver problemas muy complejos. Por ejemplo, el cerebro
humano se compone de billones de tales neuronas.
19
5.1.1. Función de entrada (input function).
La neurona trata a muchos valores de entrada como si fueran uno solo; esto
recibe el nombre de entrada global. Por lo tanto, ahora nos enfrentamos al
problema de cómo se pueden combinar estas simples entradas (ini1, ini2,
...) dentro de la entrada global, gini. Esto se logra a través de la función de
entrada, la cual se calcula a partir del vector entrada. La función de entrada
puede describirse como sigue:
donde: *
Los valores de entrada se multiplican por los pesos anteriormente ingresados a la neurona.
Por consiguiente, los pesos que generalmente no están restringidos cambian la medida de
influencia que tienen los valores de entrada. Es decir, que permiten que un gran valor de
entrada tenga solamente una pequeña influencia, si estos son lo suficientemente pequeños.
20
1)Sumatoria de las entradas pesadas: es la suma de todos los valores de entrada a la
neurona, multiplicados por sus correspondientes pesos.
La función activación, es una función de la entrada global (gini) menos el umbral ( i).
21
Ninguna: este es el tipo de función más sencillo, tal que la salida es
la misma que la entrada. Es también llamada función identidad.
a. Neuronas binarias.
b. Neuronas reales.
Las neuronas binarias solamente pueden tomar valores dentro del intervalo
{0, 1} o {-1, 1}, mientras que las neuronas reales pueden hacerlo dentro del rango
[0, 1] o [-1, 1]. Los peso normalmente no están restringidos a un cierto intervalo,
aunque para aplicaciones específicas puede ser esto necesario.
22
7. Técnicas de decisión.
Lo mismo ocurre cuando se utiliza una red neuronal como un sistema de sostén de
decisiones. La salida de la red neuronal es directa o indirectamente la solución al problema
o la decisión a tomar. Por ejemplo: si uno desea determinar si un cliente, el cual está
preguntando por la solicitud de un crédito, es un buen candidato (lo que significa que es
confiable, o sea, que puede devolver el crédito solicitado), se podrían tomar en
consideración variables o atributos tales como “antecedentes de créditos, pasivo, garantías
y ganancias”. Las variables o atributos pertenecientes a un cliente específico son las
entradas al proceso de decisión. El resultado de tal proceso podría ser una decisión similar
a la siguiente: “cliente bueno” o “cliente malo”.
Los atributos expuestos en la Tabla serán tomados en cuenta para el caso del puntaje para
un crédito:
La pregunta a contestar ahora es: ¿puede encontrarse una estructura o regla de decisión
en este conjunto de datos? La respuesta es si, las redes neuronales pueden hallar una
regla de decisión a través de un conjunto de datos como el presentado en la Tabla siguiente.
N A1 A A3 A Clase
0º malo 2
al ningun 41 2
10 conoci to
al o
ningun 2 2
02 do
conoci to
b o
ningun 2 1
03 do
conoci aj
b o
ningun 1 2
40 do
conoci o
aj
b o
ningun 3 0
50 do
conoci o
aj
b o
adecuad 3 0
06 do
malo o
aj
b oningun 1 2
07 malo o
aj
b o
adecuad 3 1
80 bueno o
aj
b oningun 3 0
91 bueno o
aj
al o
adecuad 3 0
10 bueno o
to
al oningun 1 2
1 bueno to
al o
ningun 2 1
21 bueno to
al o
ningun 3 0
31 bueno to
al o
ningun 2 2
4 to o
8. Aplicaciones de las redes neuronales. Las redes neuronales pueden utilizarse en
un gran número y variedad de aplicaciones, tanto comerciales como militares. Se
pueden desarrollar redes neuronales en un periodo de tiempo razonable, con la
capacidad de realizar tareas concretas mejor que otras tecnologías. Cuando se
implementan mediante hardware (redes neuronales en chips VLSI), presentan una
alta tolerancia a fallos del sistema y proporcionan un alto grado de paralelismo en
el procesamiento de datos. Esto posibilita la inserción de redes neuronales de bajo
coste en sistemas existentes y recientemente desarrollados. Hay muchos tipos
diferentes de redes neuronales; cada uno de los cuales tiene una aplicación
particular más apropiada. Algunas aplicaciones comerciales son:
24
• Biología:
- Aprender más acerca del cerebro y otros sistemas.
- Obtención de modelos de la retina.
• Empresa:
- Evaluación de probabilidad de formaciones geológicas y petrolíferas.
- Identificación de candidatos para posiciones específicas.
- Explotación de bases de datos.
- Optimización de plazas y horarios en líneas de vuelo.
- Optimización del flujo del tránsito controlando convenientemente la
temporización de los semáforos.
- Reconocimiento de caracteres escritos.
- Modelado de sistemas para automatización y control.
• Medio ambiente:
- Analizar tendencias y patrones.
- Previsión del tiempo.
• Finanzas:
- Previsión de la evolución de los precios.
- Valoración del riesgo de los créditos.
- Identificación de falsificaciones.
- Interpretación de firmas.
25
• Manufacturación:
- Robots automatizados y sistemas de control (visión artificial y
sensores de presión, temperatura, gas, etc.).
- Control de producción en líneas de procesos.
- Inspección de la calidad.
• Medicina:
- Analizadores del habla para ayudar en la audición de sordos profundos.
- Diagnóstico y tratamiento a partir de síntomas y/o de datos analíticos
(electrocardiograma, encefalogramas, análisis sanguíneo, etc.).
- Monitorización en cirugías.
- Predicción de reacciones adversas en los medicamentos.
- Entendimiento de la causa de los ataques cardíacos.
• Militares:
- Clasificación de las señales de radar.
- Creación de armas inteligentes.
- Optimización del uso de recursos escasos.
- Reconocimiento y seguimiento en el tiro al blanco.
Desde el punto de vista de los casos de aplicación, la ventaja de las redes neuronales
reside en el procesado paralelo, adaptativo y no lineal.
26
9. Aplicaciones
RNA las hacen bastante apropiadas para aplicaciones en las que no se dispone
a priori de un modelo identificable que pueda ser programado, pero se dispone
de un conjunto básico de ejemplos de entrada (previamente clasificados o no).
Asimismo, son altamente robustas tanto al ruido como a la disfunción de
elementos concretos y son fácilmente paralelizables.
Otro tipo especial de redes neuronales artificiale se ha aplicado en conjunción con los
algoritmos genéticos (AG) para crear controladores para robots. La disciplina que trata
la evolución de redes neuronales mediante algoritmos genéticos se denomina Robótica
Evolutiva. En este tipo de aplicación el genoma del AG lo constituyen los parámetros de
la red (topología, algoritmo de aprendizaje, funciones de activación, etc.) y la adecuación
de la red viene dada por la adecuación del comportamiento exhibido por el robot
controlado (normalmente una simulación de dicho comportamiento).
27
Las áreas de aplicación incluyen la identificación del sistema y el
control (control del vehículo, predicción de la trayectoria, el control de
procesos , recursos naturales gestión), la química cuántica , juego de
papeles y la toma de decisiones (backgammon, ajedrez, póquer ), el
reconocimiento de patrones (radar sistemas, identificación de la cara,
reconocimiento de objetos y más), de reconocimiento de secuencia
(gesto, voz, reconocimiento de texto escrito a mano), diagnóstico
médico , aplicaciones financieras (por ejemplo, sistemas
automatizados de comercio ), minería de datos (o descubrimiento de
conocimiento en bases de datos, "KDD"), la visualización y el spam
de correo electrónico filtrado.
Las redes neuronales artificiales se han utilizado también para el
diagnóstico de varios tipos de cáncer. Un sistema de detección de
cáncer de pulmón híbrido basado ANN llamado HLND mejora la
precisión del diagnóstico y la velocidad de la radiología cáncer de
pulmón. Estas redes también se han utilizado para diagnosticar el
cáncer de próstata. Los diagnósticos se pueden utilizar para hacer
modelos específicos tomados de un gran grupo de pacientes en
comparación con la información de un paciente dado. Los modelos
no dependen de suposiciones acerca de las correlaciones de
diferentes variables. El cáncer color rectal también se ha previsto el
uso de las redes neuronales. Las redes neuronales podrían predecir
el resultado de un paciente con cáncer color rectal con más precisión
que los métodos clínicos actuales. Después del entrenamiento, las
redes podrían predecir múltiples resultados de los pacientes de
instituciones relacionadas.
28
observados (datos), biológicamente plausibles mecanismos para el
procesamiento neuronal y aprendizaje (redes neuronales biológicas
modelos) y la teoría (teoría del aprendizaje estadístico y teoría de la
información).
29
Redes de memoria es otra extensión de las redes neuronales que
incorporan la memoria a largo plazo que fue desarrollado por
Facebook investigación. La memoria a largo plazo puede ser leído y
escrito para, con el objetivo de utilizarlo para la predicción. Estos
modelos se han aplicado en el contexto de la búsqueda de
respuestas (QA), donde la memoria a largo plazo que de hecho actúa
como un (dinámico) base de conocimientos, y la salida es una
respuesta textual.
30
10. Potencia de calculo
El perceptrón multicapa es un aproximado de la función universal, como lo
demuestra el teorema de aproximación universal . Sin embargo, la prueba no es
constructivo sobre el número de neuronas es necesario, la topología de red, la
configuración de los pesos y los parámetros de aprendizaje.
10.1. Capacidad
Los modelos de redes neuronales artificiales tienen una propiedad
denominada "capacidad", que corresponde aproximadamente a su
capacidad para modelar cualquier función dada. Se relaciona con la
cantidad de información que puede ser almacenada en la red y a la
noción de complejidad.
10.2. Convergencia
Nada se puede decir en general sobre la convergencia ya que
depende de una serie de factores. En primer lugar, pueden existir
muchos mínimos locales. Esto depende de la función de coste y el
modelo. En segundo lugar, el método de optimización utilizado no
puede ser garantizado a converger cuando lejos de un mínimo local.
En tercer lugar, para una cantidad muy grande de datos o parámetros,
algunos métodos se vuelven poco práctico. En general, se ha
encontrado que las garantías teóricas sobre la convergencia son una
guía fiable para la aplicación práctica.
31
significativamente los parámetros libres necesarios. Hay dos
escuelas de pensamiento para evitar este problema: La primera es
utilizar la validación cruzada técnicas similares y para comprobar la
presencia de un exceso de entrenamiento y de manera óptima
seleccione hiper- tales que se minimice el error de generalización. La
segunda es utilizar algún tipo de regularización . Este es un concepto
que surge de manera natural en un marco probabilístico (Bayesiano),
donde la regularización puede realizarse mediante la selección de
una probabilidad a priori más grande sobre los modelos más simples;
sino también en la teoría estadística de aprendizaje, donde el objetivo
es reducir al mínimo más de dos cantidades: el "riesgo empírico" y el
"riesgo estructural ', que corresponde aproximadamente al error
sobre el conjunto de entrenamiento y el error de predicción en los
datos que no se ven debido a sobreajuste.
32
12. Herramientas de software
Las redes neuronales son una excitante forma de inteligencia artificial que imita el
proceso de aprendizaje del cerebro con el fin de extraer patrones de la tecnología de
datos históricos para trabajar para usted.
Mina automáticamente tus datos para las relaciones ocultas en conjuntos de datos
pequeños o grandes utilizando redes neuronales avanzadas e inteligencia artificial.
33
OpenNN es una biblioteca informática escrita en C++ que implementa redes
neuronales. La biblioteca es de código abierto y ha sido distribuida bajo la Licencia
Pública General Reducida de GNU.
Desde esta empresa defienden que los robots serán herramientas que permitirán
mejorar la capacidad del trabajo, ayudarán a las personas enfermas y desarrollarán
tareas peligrosas, como desactivar bombas o salvar vidas humanas en situaciones de
desastres naturales como la aparición de huracanes y terremotos. Pero los humanoides
formarán parte de nuestra familia dentro de 30 años, aproximadamente, ahora sólo se
espera de ellos que realicen un servicio público como el que llevó a cabo REEM en el
CosmoCaixa: la máquina trabajó de recepcionista, facilitando información sobre el
museo y sus actividades. Y la misma función informativa harán los humanoides,
próximamente, en hospitales y aeropuertos.
34
la mesa, sentarse frente al tablero y saber jugar al ajedrez gracias al sistema Hydra. El
proyecto costó 500.000 euros financiado por Pal Group.
Dos años más tarde del REEM-A, Pal Robotics lanzó otro modelo más perfeccionado.
Se trataba del REEM-B, un prototipo capacitado con reconocimiento de voz y sensores
que le permitían explorar el entorno de forma autónoma además de desplazarse,
evitando los obstáculos, sin necesidad de ayuda humana. Y en junio de 2009, llegó el
REEM H1, el primer humanoide presentado en público, al que siguió, en diciembre del
año siguiente, el REEM H2 –versión mejorada del modelo anterior– en Abu Dabi. La
parte superior del ingenio tenía forma humana, pero se movía sobre una base de ruedas
e incorporaba una pantalla táctil en el pecho. Con este prototipo, se ganaba en
estabilidad, mejoraba la interacción con las personas en espacios abiertos, conseguía
reducir los costes de fabricación y también disminuía su necesidad de consumo
eléctrico.
35
15. Conclusiones
36
16. Webgrafía
37