Anda di halaman 1dari 4

El aprendizaje colaborativo - para robots

Algoritmo permite a los agentes independientes


producen colectivamente un modelo de
mquina-aprendizaje sin agregacin de datos.

El aprendizaje automtico, en el que los ordenadores aprendan nuevas habilidades
mediante la bsqueda de patrones en los datos de entrenamiento, es la base de la
mayora de los recientes avances en la inteligencia artificial, los sistemas de
reconocimiento de voz a los coches de auto-estacionamiento. Es tambin la tcnica que
los robots autnomos suelen utilizar para construir modelos de sus entornos.
Ese tipo de construccin de modelos se complica, sin embargo, en los casos en los que
grupos de robots trabajan como equipo. Los robots pueden haber reunido informacin
que, colectivamente, se producen un buen modelo, pero que, de forma individual, es
casi intil. Si las restricciones sobre el poder, la comunicacin, o la computacin
significa que los robots no pueden poner en comn sus datos en un solo lugar, cmo
van a construir colectivamente un modelo?
En la incertidumbre en conferencia de Inteligencia Artificial en julio, los investigadores
del Laboratorio del MIT para la informacin y la toma de Sistemas respondern esa
pregunta.Presentan un algoritmo en el que los agentes distribuidos - como robots que
exploran un edificio - recoger datos y analizarlos de forma independiente. Las parejas
de agentes, como los robots que pasan el uno al otro en el pasillo, a continuacin,
analiza el intercambio.
En experimentos con varios conjuntos de datos diferentes, algoritmo distribuido de los
investigadores en realidad super a un algoritmo estndar que funciona en los datos
agregados en un solo lugar.
"Un solo equipo tiene un problema de optimizacin muy difcil de resolver con el fin de
aprender un modelo a partir de un nico lote gigante de los datos, y puede quedar
atrapado en malas soluciones", dice Trevor Campbell, un estudiante graduado en la
aeronutica y astronutica en el MIT, que escribi el nuevo papel con su asesor,
Jonathan Cmo, el Richard Cockburn Maclaurin profesor de Aeronutica y
Astronutica. "Si trozos ms pequeos de datos son primero procesados por los robots
individuales y luego se combinan, el modelo final es menos probable que se atascan en
una mala solucin."
Campbell dice que la obra fue motivada por preguntas sobre la colaboracin
robot. Pero tambin podra tener implicaciones para los grandes datos, ya que
permitira a los servidores distribuidos de combinar los resultados de su anlisis de los
datos, sin agregacin de los datos en una ubicacin central.
"Este procedimiento es completamente slida a casi cualquier red que se pueda
imaginar", dice Campbell. "Es en gran medida un algoritmo de aprendizaje flexible para
redes descentralizadas."
Problema a juego
Para tener una idea del problema Campbell y cmo resolver, imaginar un equipo de
robots que exploran un edificio de oficinas desconocido. Si su algoritmo de aprendizaje
es lo suficientemente general, ellos no tienen ninguna nocin previa de qu es una silla
o una mesa, por no hablar de una sala de conferencias o una oficina. Pero podran
determinar, por ejemplo, que algunas habitaciones contienen un pequeo nmero de
objetos en forma de silla-junto con aproximadamente el mismo nmero de objetos en
forma de tabla, mientras que otras habitaciones contienen un gran nmero de objetos
en forma de silla-junto con una sola tabla- objeto en forma.
Con el tiempo, cada robot va a construir su propio catlogo de tipos de habitaciones y
sus contenidos. Pero imprecisiones suelen colarse: Un robot, por ejemplo, podra
suceder a encontrar una sala de conferencias en la que algn viajero ha dejado una
maleta y la conclusin de que las maletas son caractersticas habituales de las salas de
conferencias.Otro podra entrar en una cocina, mientras que la cafetera est oscurecida
por la puerta de la nevera abierta y dejar la cafetera fuera su inventario de artculos de
cocina.
Idealmente, cuando dos robots encuentran entre s, se compararan sus catlogos,
reforzando las observaciones mutuas y corregir omisiones o generalizaciones. El
problema es que no saben cmo hacer coincidir categoras. Tampoco conoce la
etiqueta de "cocina" o "sala de conferencias"; slo tienen etiquetas como "habitacin
1" y "sala 3", cada uno asociado a diferentes listas de caractersticas distintivas. Pero la
habitacin de un robot 1 podra ser la habitacin de otro robot 3.
Con Campbell y el algoritmo de Cmo, los robots tratan para que coincida con las
categoras sobre la base de elementos de lista compartidos. Esto se ve obligada a llevar
a errores: Un robot, por ejemplo, podra haber deducido que los sumideros y botes de
basura a pedal estn distinguiendo caractersticas de baos, otra que se estn
distinguiendo caractersticas de las cocinas. Pero hacen todo lo posible, la combinacin
de las listas que ellos piensan que corresponde.
Cuando uno de esos robots cumple otro robot, realiza el mismo procedimiento,
haciendo coincidir las listas lo mejor que pueda. Pero aqu est el paso crucial: A
continuacin, se retira cada una de las listas de origen independiente y revanchas a los
dems, repitiendo este proceso hasta que no hay resultados de reordenamiento. Lo
hace de nuevo con cada nuevo robot que encuentra, construyendo gradualmente
modelos cada vez ms precisos.
Para Imponer
Este procedimiento relativamente sencillo resulta de un anlisis matemtico muy
sofisticado, que los investigadores presentes en su papel. "La forma en que los
sistemas informticos aprenden estos modelos complejos en estos das es que se
postula un modelo ms simple y luego lo utiliza para aproximarse a lo que se obtendra
si fueron capaces de hacer frente a todos los matices y complejidades locos", dice
Campbell. "Lo que nuestro algoritmo no es una especie de reintroducir artificialmente
la estructura, despus de que haya resuelto el problema ms fcil, y luego usar esa
estructura artificial para combinar los modelos correctamente."
En una aplicacin real, los robots probablemente no acaba de estar clasificando
habitaciones de acuerdo a los objetos que contienen: Tambin estaran clasificando los
objetos mismos, y probablemente sus usos. Pero procedimiento Campbell y How
generaliza a otros problemas de aprendizaje igual de bien.
El ejemplo de habitaciones clasificar de acuerdo con el contenido, por otra parte, tiene
una estructura similar a un problema clsico en el procesamiento del lenguaje natural
llamado modelado tema , en el que un equipo intenta utilizar la frecuencia relativa de
las palabras para clasificar documentos de acuerdo al tema. Sera tremendamente
prctico para almacenar todos los documentos en la Web en un solo lugar, por lo que
un algoritmo de aprendizaje de mquina tradicional podra proporcionar un sistema de
clasificacin uniforme para todos ellos. Pero Campbell y el algoritmo de Cmo se
entiende que los servidores dispersos podran batir lejos en los documentos en sus
propios rincones de la Web y an producir un modelo de tema colectivo.
"La computacin distribuida jugar un papel crtico en el despliegue de mltiples
agentes autnomos, como los mltiples vehculos terrestres y areos autnomos", dice
Lawrence Carin, profesor de ingeniera elctrica e informtica y vicerrectora de
investigacin de la Universidad de Duke. "El mtodo variacional distribuido propuesto
en este trabajo es computacionalmente eficiente y prctico. Una de las claves para ello
es una tcnica para el manejo de la ruptura de simetras que se manifiestan en la
inferencia bayesiana. La solucin a este problema es muy novedoso y es probable que
se deje sentir en el futuro por otros investigadores ".