Anda di halaman 1dari 14

La inteligencia sinttica y los sentidos artificiales

por Sergio Moriello

Normalmente la expresin inteligencia artificial (abreviada IA) suele aplicarse a la simulacin de los complejos procesos cognitivos que caracterizan al comportamiento del hombre con el fin de volver ms tiles a los sistemas informticos. Pero, a pesar de que esta disciplina ha sido capaz de reproducir eficientemente las funciones superiores de la inteligencia humana como el razonamiento, la resolucin de problemas, la toma de decisiones y la manipulacin y el almacenamiento de enormes cantidades de datos; todava no pudo duplicar el sentido comn de un nio de corta edad ni la capacidad sensora de un vulgar insecto. Y es justamente la ausencia de esta ltima habilidad lo que limita su capacidad de desarrollo. En efecto, de la misma forma que la mente de un nio seguramente se atrofiara de modo irreversible si fuese encerrado en una celda sin contacto con el mundo, sin comunicacin directa con la realidad exterior, el micromundo enormemente simplificado de los sistemas de IA no les ha permitido desarrollar todo su potencial. En el caso del ser humano, as como en los dems animales, sus sistemas sensoriales fueron diseados por la Naturaleza para proporcionar al cerebro informacin sobre el entorno. La informacin recibida se evala y se la integra con la estructura de conocimientos ya aprendidos, enriquecindola. De aqu se deduce que slo percibe un ser capaz de comprender, es decir, de saber de qu se trata aquello que sus sentidos captan. Un aspecto parcial de la percepcin, es el reconocimiento de formas o de patrones, que no slo se limita a lo visual, sino tambin a los sonidos, al olfato, al tacto o al gusto. Un ejemplo de esta extraordinaria capacidad humana se pone de manifiesto cuando, por ejemplo, en medio de una ruidosa fiesta, con msica y parloteo incesante, se llega a reconocer la voz de algn familiar o amigo, aun cuando haya pasado bastante tiempo desde la ltima vez que se vieron. Esta habilidad del cerebro para reconocer informacin, literalmente sumida en el caos del ruido, y retraerla adems de una manera correcta, es uno de los muchos procesos asombrosos del cerebro que se desea duplicar en una mquina. Lo deseable y lo posible A fin de que participen activamente del mundo humano, se necesitara que las computadoras puedan reconocer su entorno, aceptando informacin en formatos muy variados y no slo estandarizados. En el caso de los animales -y fundamentalmente en el hombre- la entrada de informacin se verifica a travs de sus sentidos; por este motivo, habra que
1

conferirles a las mquinas sistemas sensoriales equivalentes y potenciar la interaccin con el hombre. Aunque todava en una situacin incipiente, los dispositivos anlogos de los sentidos humanos comienzan a estar presente en las mquinas, tornndolas mucho ms efectivas. De esta manera, las computadoras inteligentes ya pueden conversar con personas en lenguaje natural y reconocer la escritura manual o las imgenes, aunque en un entorno muy restringido, acotado, especfico y limitado. Por ejemplo, estas mquinas pueden reconocer la voz humana, pero es necesario hablarles con una entonacin correcta; tambin pueden sintetizar voces en varios idiomas, con diferentes entonaciones fonticas (hombre o mujer, nio o viejo), y en diferentes estados psicolgicos (irritacin, ansiedad, o miedo, entre otros), aunque sus registros sonoros carecen de la calidez tpicamente humana. Incluso, son capaces de traducir frases simples, pero se descarrilan por modismos, metforas o expresiones no gramaticales. Asimismo logran distinguir imgenes y reconocer objetos diseados, siempre y cuando estn claramente resaltados del fondo. El ser humano ya nace con una estructura mental para comprender, para entender significados. Empieza su vida con armazones a la que agrega, a lo largo de su vida, cosas que encajan en ellos. Para cualquier operacin que involucre percepcin, la comprensin es esencial. Pero existe una comprensin profunda y otra menos profunda. Qu nivel de profundidad tiene que alcanzar la comprensin para que sea til? En otras palabras, en qu se diferencia la comprensin del mero reconocimiento? Tmese como ejemplo una charla desarrollada en una fiesta: una persona hace un comentario que la otra no entiende del todo. No obstante, debido al contexto de la situacin, la segunda persona responde de una manera que parece apropiada. Quizs no sepa nada acerca del tema en cuestin, salvo unos pequeos rudimentos, pero esto no impide que la conversacin siga, de hecho, desarrollndose durante un largo rato. Es que la comprensin tiene lugar por referencia al mundo; es mucho ms fcil saber de qu se habla o qu se ve si se tienen incorporados conocimientos generales de sentido comn y conocimientos especficos propios del dominio que se encara. Por ejemplo, si alguien dice: Jorge va al supermercado. Hoy es el cumpleaos de Luis, es muy difcil deducir lgicamente -si no se cuenta con un conocimiento general acerca del mundo y de las buenas costumbres- que normalmente se le hace un regalo a la persona que cumple un nuevo ao y que los regalos pueden comprarse en los supermercados. Estas respuestas no estn explcitas en la frase, ni siquiera en forma implcita. Igualmente, el sistema debera ser capaz de establecer referencias temporales, deduciendo que primero hay que ir al supermercado y recin despus al cumpleaos; as como inferir que Jorge y Luis mantienen una estrecha relacin de amistad. De
2

manera anloga, oraciones tales como el cuaderno est dentro del cajn y el cajn est dentro del cuaderno, que un traductor mecnico literal confundira completamente, son traducidas con suma facilidad por un ser humano que tiene incorporado un modelo de mundo en el cual, obviamente, los cuadernos se guardan dentro de los cajones. O, en el caso del reconocimiento de imgenes, por ejemplo en una fotografa satelital, un pequeo rectngulo puede interpretarse como una casa, pero tambin como un automvil. Sin embargo, un conocimiento ms completo de la situacin permite inferir que un rectangulito ubicado en un rea relativamente estrecha y larga tiene muchas chances de ser un automvil. Aunque se han logrado extraordinarios progresos en el reconocimiento de voz y de imagen, y aunque pueden manipular inmensas cantidades de datos millones de veces ms rpido que los seres humanos, las computadoras todava no pueden comprender lo que oyen ni lo que ven. Si el hombre fuera capaz de construir sistemas que entiendan, que comprendan, las mquinas extendern an ms su ya de por s amplio abanico de tareas. Por qu hubo tan poco progreso? se pregunta el profesor Patrick Winston, y l mismo se responde debido a que el campo de la IA naci en los aos sesenta, la mayora de sus practicantes ha credo que la visin, el lenguaje y las facultades motoras slo son los canales de entrada/salida de la inteligencia humana. [] Creo que nuestra inteligencia est en nuestros canales de entrada/salida, no detrs de ellos, y que debemos entender las contribuciones de la visin computacional, del procesamiento del lenguaje y las facultades motoras. Las dificultades de la lengua El lenguaje es una propiedad esencial de los seres humanos, una caracterstica biolgica tan propia de la especie como las plumas son para las aves. Esta concepcin es llevada al extremo por el lingista norteamericano Noam Chomsky, quien cree que hay un molde innato para el lenguaje natural, incluyendo los aspectos conceptuales, que ya est preestablecido (precableado, dicen algunos) por la evolucin. Algunos antroplogos consideran que el lenguaje utilizado por una sociedad es el principal factor que determina su manera de pensar y de razonar, ya que condiciona la manera de expresar los conceptos y permite contrastarlos con la de los otros individuos. No obstante, otros expertos entienden exactamente lo contrario, que es el pensamiento el que influye en el lenguaje. Incluso, algunos cientficos opinan que el hombre debe su supremaca biolgica a esta capacidad, debido a que no slo es una manifestacin primaria de la racionalidad humana, sino porque fundamentalmente es el que hizo posible inventar y conservar la cultura y la civilizacin. En efecto, le permite al hombre transmitir sus experiencias, razonamientos, emociones,
3

sensaciones y deseos a travs de incontables generaciones. El manejo apropiado del lenguaje fue, es y ser fundamental en cualquier sociedad humana. Sera muy conveniente para el ser humano poder decirle a una mquina en lenguaje natural lo que tiene que hacer y recibir de sta un comentario hablado sobre la factibilidad de la orden; no slo porque la voz es la forma de comunicacin ms natural y cmoda (hay que recordar que se aprende a hablar antes que a leer o escribir), sino porque en casos de incapacidades fsicas es el nico medio posible. El inconveniente es que el lenguaje humano, aunque relativamente eficaz para la comunicacin entre personas, no es muy apropiado para transmitir a la computadora instrucciones claras y precisas sobre lo que debe llevar a cabo. Por este motivo, el desarrollo de una interfaz dialgica es, para muchos investigadores, una de las metas principales que la IA debe alcanzar. Una computadora que comprenda el lenguaje natural podra utilizar a ste de un modo tan efectivo como lo emplea el ser humano, pudindose comunicar con la persona en forma simple y directa. Despus de todo, y como afirma Michael Dertouzos, director del Laboratorio de Ciencias de la Computacin del MIT, no nacimos con teclados y puertos para mouse, sino con bocas, ojos y odos. Para lograr ese objetivo, el sistema no slo tendra que comprender la semntica (o el significado de cada palabra de la oracin -recurdese que un lenguaje como el espaol o el ingls contiene cientos de miles de palabras-), la sintaxis (o la estructura de la oracin o de la frase -con sus cientos de reglas y excepciones-) y el contexto en que se pronuncia, sino tambin debera considerar la pronunciacin, la entonacin, el acento, las pausas, el ruido ambiental y tendra que conocer, incluso, el tema del que se habla y varios hechos referentes a l. Es por esta razn que es extremadamente difcil para los sistemas informticos identificar coherentemente el discurso hablado: porque cada individuo habla de un modo diferente, porque -a veces- su voz est influenciada por su estado de nimo, la fatiga, el alcohol o el resfro, porque pueden convivir casi incontables acentos en un mismo idioma, porque cada grupo social y profesional tiene su jerga, porque hay mucha ambigedad, inexactitud y -en numerosos casos- contradicciones, porque una misma palabra puede tener varias acepciones segn el contexto, porque hay mltiples maneras de decir lo mismo, porque muchas veces se producen frases mal construidas, dobles sentidos y metforas, y porque se habla sin fluidez: se repite, se dicen muletillas, se inventan nuevas palabras, se abrevia y no se completan las oraciones (incluso, a veces, ni siquiera las palabras). Pero, cmo se explica el hecho de que la excesiva ambigedad e inexactitud -tan caractersticos del lenguaje natural- no dificulte la comunicacin entre los hablantes de un mismo idioma? Aparentemente, debido a que la gente posee un conocimiento comn y
4

compartido acerca del mundo, cuenta con la capacidad para hacer inferencias sobre las creencias de los otros, y porque la comunicacin se produce siempre dentro de un determinado contexto, dentro de un marco especfico. Esto les permite a las personas desentraar las ambigedades contenidas en la comunicacin (tanto oral como escrita), y sera conveniente que los sistemas artificiales cuenten con anlogas capacidades. Probablemente, la mejor forma de resolver el problema de la ambigedad sea a travs de una flexible comunicacin bidireccional e interactiva entre la computadora y el ser humano, en la cual la mquina (al igual que la persona) sea capaz de indicar su entendimiento -o tambin su confusin- a travs de la interrogacin mutua, pidiendo precisiones sobre tal o cual problema y aclaraciones sobre tal o cual informacin. No hay que olvidarse que, una de las reglas sobre la naturaleza de la comprensin es que, si uno recibe una respuesta sensata a una pregunta, entonces puede asumir que su interlocutor la ha entendido. Los sistemas de reconocimiento del lenguaje hablado que han logrado mejores resultados son aquellos que restringen y limitan suficientemente el dominio (el mundo) y en donde las reglas de este dominio son claras y sin ambigedades (es decir, cuando el problema est bien estructurado). Por ejemplo, los sistemas de respuesta vocal interactiva (Interactive Voice Response o IVR) permiten a una computadora guiar telefnicamente al usuario con una serie de mensajes grabados o contestar a todas las preguntas de rutina, en diversos idiomas y adaptndose a los diferentes acentos regionales. Asimismo, ya se encuentran disponibles en laboratorio sistemas capaces de responder las consultas sobre el tiempo meteorolgico, los horarios de los diferentes vuelos de las compaas areas o los resultados de la liga de basket. Incluso la consulta puede hacerse en varias lenguas y la respuesta se da casi en tiempo real, es decir, con la fluidez con que se desenvuelve una conversacin normal entre dos personas. Adems, no slo responde a preguntas simples del tipo en qu ciudad jug el equipo X en noviembre de 1987?, sino tambin otras como cuntos partidos ganaron los equipos como locales en el primer trimestre de 1998?, o qu jugador integr ms de tres equipos diferentes en los ltimos veinte aos?. Y ya es famoso el programa Eliza (de Joseph Weizenbaum) diseado para simular una conversacin entre un psicoanalista y un paciente, con la mquina en el papel de analista. Sin embargo, no se basa en una comprensin real, sino ms bien en un proceso de comparacin y clasificacin que funciona aceptablemente en ciertos casos -muy limitados- pero que falla en tareas ms arduas, como en el caso de una verdadera conversacin. Un programa basado en Eliza pero ms evolucionado, el Dr. Abuse, posibilita actualmente hablar con la computadora y ha sido entrenado en cientos de conversaciones con personas o mquinas a travs de Internet y otros medios.
5

El exquisito arte de hablar A fin de lograr la citada comunicacin interactiva, es necesario que las computadoras no slo simulen la comprensin del lenguaje sino tambin es imperativo que sean capaces de sintetizar la voz humana. Existen bsicamente dos formas de lograrlo: a travs de la sntesis por copia o por medio de la sntesis por reglas. En ambos casos, el sistema cuenta con unidades lingsticas discretas (como fonemas, slabas o palabras) almacenadas en su memoria; pero mientras que en el primer mtodo la salida es una mera copia (una reproduccin) del discurso pregrabado, en el segundo, la palabra se construye analizando la entrada mediante reglas especificadas, con lo cual se puede generar un discurso continuo sin limitaciones de vocabulario. Aunque los sistemas ms eficaces de sntesis hablada estn restringidos a grandes computadoras, se esperan posibles implementaciones en computadoras personales de escritorio. Con el reconocimiento y la sntesis del habla los objetos podrn escuchar y hablar. Uno podr preguntarle a su reloj, computadora de mano, radio, televisor o telfono si hay algn mensaje nuevo, confirmar un vuelo, averiguar cmo est el tiempo, ubicar una localidad, reservar un hotel, buscar un producto o averiguar el resultado de un partido de ftbol. Es probable que pronto se desarrollen sistemas que comprendan preguntas formuladas en un lenguaje casi natural y que se encarguen de buscar -por uno o varios textos- la oracin, prrafo o artculo que resultara ms adecuado como respuesta. Tambin en el relativamente corto plazo posiblemente haya equipos capaces de leer y comprender abrumadoras cantidades de informacin textual de forma tal de poder indizarla automticamente, es decir, sealar las palabras-clave que correspondan a una comprensin superficial, colocar referencias bibliogrficas y archivarlas a fin de que se la pueda encontrar cuando se la necesite. Los sistemas sern igualmente capaces de elaborar y recitar automticamente resmenes de relatos, compendiar artculos periodsticos y extraer inferencias bsicas acerca del argumento, los personajes y las motivaciones. Desde un telfono celular, por ejemplo, y en el caso de las pelculas, se podr indicar en qu ciudad se est y qu filme se est buscando, y el aparato dir el nombre de los cines y las horas donde la estn pasando, adems de las crticas de especialistas y un resumen del argumento. Tambin ser posible -con la voz- controlar y/o dirigir aplicaciones informticas (como procesadores de texto o planillas de clculo) o maquinaria (como electrodomsticos o microscopios) cuando, por ejemplo, se tienen las manos ocupadas. Asimismo, un sistema de sntesis vocal podra dar una alarma oral si se produce una situacin de emergencia en un entorno industrial o sealar situaciones de peligro en otros tipos
6

de ambientes. En todos los casos, el inconveniente de estos sistemas es que, por ahora, no pueden decidir de modo convincente cundo enfatizar una palabra o elevar o bajar el tono de la voz. Por eso, lo que se busca actualmente es evitar la voz montona e incluir colorido, expresin y tono de acuerdo con la intencin y el contenido del mensaje a transmitir. Un cerebro biolgico es capaz de procesar informacin de manera rpida y precisa y puede ser entrenado para reconocer e identificar patrones, an los incompletos (por extrapolacin). No obstante, la perceptibilidad humana se ve afectada por preocupaciones emocionales (expectativas, ansiedades, humor) o estados fsicos (fatiga, dolores, malestares). En cambio, los sistemas artificiales -precisamente porque no aceptan matices- pueden llegar a ser muchas veces ms exactos que los especialistas humanos en tareas de reconocimiento y anlisis de informacin fctica. Sera el caso, por ejemplo, del anlisis qumico (de espectrogramas), la interpretacin mdica (de electrocardiogramas) o el diagnstico ingenieril (de sistemas mecnicos). Derribando la Torre de Babel Hoy en da se hablan en el planeta unos 6.500 idiomas diferentes, aunque cerca del 2100 slo sobrevivirn 300 de ellos. Las diferencias idiomticas impiden que los pueblos se entiendan correctamente entre s, generando problemas de comunicacin que, no pocas veces, sirven de asidero al odio y la sospecha. La traduccin automtica, sin duda, ayudar a la mutua comprensin de las personas de diferentes lenguas, reduciendo los problemas originados por la mala interpretacin o por la ignorancia. De esta forma, se espera que la IA contribuya significativamente a la cada de las barreras idiomticas. En la actualidad se acepta universalmente que para traducir bien se requiere una cierta profundidad de comprensin, y las computadoras an no cuentan con esta capacidad. Por lo tanto, hasta los sistemas ms elaborados slo ofrecen buenos borradores -aunque cada vez ms vlidos- que son ligeramente aproximados a los textos o documentos originales. El problema es que no alcanza con un mero traductor -ni siquiera varios especializados en algunas ramas especficas del saber, como ingeniera, medicina o derecho-, ya que las palabras corrientes normalmente son ambiguas, sus lmites son difusos y sus diversas acepciones raras veces son las mismas en los diferentes lenguajes. Es decir, el significado de una frase en muchas ocasiones no refleja una transcripcin estricta de las palabras, principalmente debido a que ciertos trminos no se pueden traducir con exactitud al pasar de un idioma al otro. La manera correcta de hacer una precisa traduccin solamente puede lograrse si se conoce el contexto en el cual se utilizan las palabras y se sabe lo que sabe la gente acerca del mundo. Como dice
7

Marvin Minsky, uno de los padres de la IA, la actual tecnologa aun no puede compararse a un buen traductor humano porque realmente el software no entiende lo que est traduciendo. Lo ideal sera que tuviese un conocimiento de sentido comn, adems del conocimiento sobre el vocabulario, la sintaxis, la gramtica, etc.. Por esta razn, tan simple, la traduccin mecnica se torna tan complicada. Por ejemplo, la palabra inglesa date significa fecha o plazo, pero tambin cita, pareja o acompaante, segn el contexto en que use. La palabra espaola fecha significa date, pero no tiene nada que ver con meeting o couple. Por otra parte, en espaol, cita significa meeting y appointment, pero no term o time. Finalmente, pareja se puede traducir como pair o couple, pero ni por las tapas significa meeting o time. Como se ve con claridad, no hay una palabra en espaol que equivalga exactamente al trmino ingls date. Por estos tipos de inconvenientes, los programas actuales de traduccin slo son relativamente tiles en campos muy especficos y limitados, como la documentacin tcnica, los manuales de instruccin y las guas de diseo. Pero, y probablemente dentro del lapso temporal de una dcada, la integracin de estas tres tecnologas hoy balbucientes (reconocimiento y sntesis del lenguaje y traduccin automtica) habr evolucionado a fin de configurar un intrprete universal, automtico, capaz de traducir cualquier idioma en tiempo real, incluso sin necesidad de que se limite excesivamente la riqueza del lenguaje de origen. As, por ejemplo, una aplicacin interesante podra ser en una videoconferencia, donde las palabras se traduzcan al mismo tiempo en que se pronuncian y los movimientos faciales de cada hablante se simulen por el sistema para adecuarlos a las palabras del idioma respectivo. Incluso, las conversaciones podran imprimirse en tiempo real, con distinto color, por ejemplo, para diferenciar a cada uno de los participantes. Por otra parte, no hay que olvidarse que la humanidad -durante el transcurso de toda su vasta historia- acumul y sigue acumulando una gigantesca cantidad de informacin en incontables libros y revistas escritos en decenas de lenguas diferentes, un invalorable tesoro para muchas personas deseosas de conocimientos. Un sistema capaz de procesar cientos de palabras por segundo podra, en un tiempo razonable, traducir todo ese capital intelectual actualmente alcanzable slo a grandes eruditos o a aquellos estudiosos que dominan simultneamente varias lenguas, con lo cual se democratizara el acceso al saber. Asimismo, se facilitara la enseanza de los idiomas, ya que la gente se sentira mucho ms cmoda al no poner de manifiesto su vergenza ante otras personas, en el momento de pronunciar mal una palabra o frase. Pero no es absolutamente necesario disponer de programas sofisticados en la propia computadora personal de sobremesa. En efecto, en el caso de los turistas o los viajeros de
8

negocios, se podra sencillamente transportar una miniaturizada -aunque potente- computadora conectada de forma inalmbrica con un conjunto de servidores especializados. En el momento de hacer una pregunta o comenzar un dilogo, un micrfono captara la voz del interlocutor y, en el mismo instante, la computadora establecera una comunicacin con el servidor adecuado. La versin traducida en tiempo real, adaptada a la velocidad de elocucin de los hablantes, se oira por los auriculares miniaturizados que cada uno, disimuladamente, llevara en sus odos. Cuando la conversacin se saliera del restringido campo de especialidad de un servidor, ste automticamente le pasara el control a otro ms adecuado. De esta forma, es probable que, tal vez dentro de un cuarto de siglo, mantener una comunicacin fluida en cualquier idioma sea tan comn como hoy es utilizar un procesador de textos. Las ventajas del mirar En los primates, incluido el Homo Sapiens, una enorme porcin del volumen cerebral se halla dedicada al tratamiento de la informacin visual. Este hecho no debera de sorprender, si se considera lo mucho que dependen estos animales de los ojos en su vida habitual. La visin es algo fundamental para la comprensin del mundo y el ser humano posee la ms completa del reino animal, debido a que su cerebro est organizado para dar prioridad al procesamiento de la informacin visual antes que a la de los otros sentidos. Desde esta perspectiva, entonces, se podra decir que el hombre es -en gran medida- un animal eminentemente visual. Dicho de forma simple, lo que la visin hace es transformar patrones de luz bidimensionales (imgenes) en representaciones internas tridimensionales (objetos en trminos de forma, color, textura, tamao, distancia y movimiento). En este proceso, el reconocimiento de formas es fundamental y equivalente al proceso de reconocimiento de palabras en la comprensin del habla continua: consiste en realizar, en tiempo real, el contraste entre la informacin de entrada (la imagen) y los conocimientos anteriores (la experiencia previa). Es este conocimiento general acerca del mundo (probablemente ya programado genticamente en el cerebro animal) el que permite la correcta interpretacin de la informacin visual, ya que, al reducir la ambigedad, simplifica enormemente la identificacin de las imgenes. Slo unos pocos millares de formas son fsicamente posibles, y es este conocimiento, y no la capacidad de un razonamiento profundo, lo que permite a un sistema dotado de visin analizar e identificar formas, dice la escritora y divulgadora Pamela McCorduck, en su libro Mquinas que piensan. De manera similar, anlogas estructuras cerebrales innatas son igualmente esenciales para la adecuada interpretacin de los dems procesos perceptivos (degustacin, olfacin y tacto), as como en la comprensin del discurso y del lenguaje.
9

La visin artificial o computacional tiene como objetivo que la mquina interprete o infiera una imagen bidimensional, una forma tridimensional o una escena, a partir de las seales visuales, de forma tal de permitirle interactuar con su entorno. Su problema fundamental es que, para las computadoras, todos los puntos de una imagen tienen igual valor. Procesarlos la totalidad de ellos hasta distinguir un patrn es una tarea fuera del alcance hasta de los mayores sistemas informticos. Es bastante probable que las computadoras aumenten significativamente su eficiencia visual si adoptan estrategias similares a las de los animales: dando importancia slo a los elementos ms significativos de una escena y no a los detalles y excluyendo del anlisis un buen nmero de formas por ser fsicamente imposibles. La ventaja de los sistemas de visin computacional reside en su habilidad para realizar tareas repetitivas y tediosas con alto grado de eficiencia. Adems de eso, estos sistemas son capaces de ver una pieza que se desplaza a una velocidad que el ojo humano no puede percibir y tomarle medidas con una precisin imposible para el hombre, as como distinguir los colores de pequesimas piezas iguales y clasificarlas por color. Esas caractersticas permiten la aplicacin de este tipo de sistemas en inspeccin automtica, deteccin de fallas, anlisis microscpico, control de calidad o seleccin de componentes, entre otras. Por ejemplo, se podra mejorar las imgenes de fotografas poco claras o difcilmente visibles, como la de un automvil envuelto en la neblina, a fin de revelar el nmero de la patente. Asimismo, el software biomtrico servir tanto para aumentar la seguridad como para facilitar la vida de la gente. Este tipo de programas aprovecha las caractersticas fsicas propias, particulares e individuales de una persona con el fin de lograr su identificacin precisa, unvoca, segura y nica. Las huellas digitales, las caractersticas faciales y la forma del iris (junto con el timbre de la voz) se han mostrado como medios idneos para la tarea. Ya se piensa en lectores pticos de huellas digitales colocados en teclados de computadoras, agendas electrnicas, telfonos celulares y tarjetas de crdito, y que incluirn la capacidad de verificar si el dedo o la mano est viva (midiendo su temperatura o sus pulsaciones sanguneas), a fin de excluir la posibilidad de que algn impostor utilice una reproduccin del dedo o de la mano de otra persona -o directamente la cercene- para tener acceso a un rea restringida. En el futuro, por ejemplo, el reconocimiento facial se volver tan eficaz que podr distinguir un rostro en una multitud (y avisar de que se trata de alguien conocido o desconocido), funcionar bajo diferentes condiciones de iluminacin y se adaptar a los cambios en las expresiones o en los peinados. Se podr usar para controlar zonas restringidas en empresas o aeropuertos, o para el control fronterizo y las transacciones financieras en cajeros automticos. Tambin podr utilizarse en los grandes hipermercados, que guiarn
10

adecuadamente al cliente hacia la seccin en que se encuentra la ropa de su talla, o en la puerta de la casa, que se abrir automticamente al reconocer que su dueo tiene las manos ocupadas. Sabuesos electrnicos Aunque el hombre confa mucho en su vista y en sus odos, los sentidos que ms impresin de realidad le aportan son el olfato y el tacto. La nariz artificial imita el sentido humano por medio de un conjunto de microsensores electroqumicos (cada uno hecho de un polmero distinto) asociada con una red de neuronas artificiales. Mediante esta ingeniosa combinacin es posible detectar, identificar y clasificar -casi en forma infalible- vapores, perfumes y olores contenidos en el aroma que las sustancias, objetos o criaturas dispersan tanto en lquidos como en gases, incluso en cantidades despreciables. El sistema informa acerca de los componentes moleculares bsicos del olor, de modo muy parecido a como una cmara digital informa acerca de los componentes rojo, verde o azul de los colores que capta. Las muestras digitales obtenidas pueden rpidamente compararse con otras ya almacenadas y codificadas, determinando as las diferencias -si las hay- entre aromas que supuestamente debieran ser iguales. La ventaja que proporciona la nariz artificial es su absoluta objetividad, su neutralidad, su incontaminacin al proceso, debido a que es incapaz de sentir emocin alguna; su reaccin es exactamente igual tanto frente a un vapor de olor desagradable como en presencia del ms exquisito perfume. Como principales aplicaciones se podra mencionar: catar cerveza o caf, monitorear niveles de emisin de gases, diagnosticar enfermedades (tanto en animales como en humanos), precisar el punto de madurez de un queso, distinguir los componentes aromticos de una flor, determinar si una herida est infectada, o revelar sustancias contaminantes en el ambiente, en el agua o en los alimentos. Podra tambin ser capaz de realizar una rapidsima imagen olfativa del tipo de ser viviente o inerte que se encuentra dentro de su radio de accin, algo especialmente til en ambientes donde la sensibilidad a la luz o a los sonidos tienen escasa importancia. Incluso, por medio del anlisis feromnico de las pisadas, el sistema podra rastrear el residuo odorfero y seguir el paradero de cualquier criatura, indicando el tiempo transcurrido. Tambin sera capaz de detectar, identificar y reconocer -en forma precisa- a personas en plena oscuridad o en medio de una multitud de sus congneres (a travs de la captacin y posterior discriminacin de las emanaciones emitidas por sus particulares y caractersticas glndulas sudorparas). Otra aplicacin interesante sera como sistema de seguridad: colocando la palma de la mano sobre una puerta, por ejemplo, el sistema analizara el espectro de olores emanados (una seal aromtica tan intransferible como las huellas
11

dactilares o el ADN) y lo comparara con los vapores que guarda en su biblioteca de olores. El sistema no sera engaado, por ejemplo, si una persona se unta la mano con alguna crema o se da la mano con otra persona. El conocimiento es poder El empleo de sensores supone una ventaja considerable para las inteligencias artificiales ya que tienen mayor sensibilidad y precisin que los sistemas sensoriales del hombre; incluso, pueden medir variables extraas a ste, como las radiaciones energticas o concentraciones de sustancias qumicas. Por ejemplo, un sistema de percepcin visual podra ver en todo el espectro electromagntico y no slo en su porcin visible, objetos cercanos o lejanos (tanto criaturas microscpicas como astros distantes), bajo cualquier condicin de iluminacin (tanto en la oscuridad casi completa como con la fuente de luz ms intensa) y a cualquier velocidad (procesos demasiados lentos o excesivamente veloces para el ojo humano). Asimismo, un sistema de percepcin auditivo podra or todo tipo de sonido y no slo los audibles, como los movimientos telricos que suelen sonar a frecuencias muy bajas, o explorar acsticamente los materiales, cuerpos y objetos a travs de un sistema de reflexin de ultrasonidos similar al del murcilago. No obstante, para interactuar adecuadamente con el mundo real en general y con el ser humano en particular, se necesita algo ms que simples sensores. Los seres humanos normalmente nacen con sistemas sensoriales apropiados para recibir seales, con un cerebro adecuado para procesarlas y adquieren rpidamente el conocimiento necesario para comprenderlas. Pero nacen sabiendo muy poco y slo despus de bastante tiempo logran aprender a construir una casa, a disear un automvil o a diagnosticar una enfermedad; para ello se precisa acumular suficientes conocimientos durante muchos aos. Aparentemente la destreza (o la inteligencia, si se quiere) no depende tanto de los mtodos de razonamiento, como se crea antes, sino fundamentalmente de la capacidad de utilizar -en formas diferentes- grandes cantidades de conocimientos de varias clases. Pero la mera acumulacin de informacin no sirve, lo verdaderamente til es la competencia para actuar, para saber aplicar ese conocimiento. Pero para eso, uno debe interiorizarlo, a fin de que pase a formar parte de uno mismo. El problema del conocimiento humano es que -en gran parte- es implcito, tcito e intuitivo, fruto de la integracin de las percepciones y de la informacin contenida en el material gentico. Guardarlo no es lo difcil, lo complicado es poder adquirirlo, representarlo y organizarlo adecuadamente. Otro problema adicional es que no es esttico, ya que se modifica
12

con el transcurso del tiempo. En efecto, la experiencia directa transforma a la persona, moldeando su estructura de conocimientos y sus esquemas de pensamiento. Es necesario encontrar formas adecuadas para actualizar todo el saber, para que la nueva pieza de informacin fluya en cascada a lo largo de la vasta red de conocimientos interconectados. Para que un sistema sea considerado inteligente tendra que ser capaz de mejorar su comportamiento de forma incremental, tanto aceptando consejos del usuario como aprendiendo de la experiencia. Por ejemplo, dice John McCarthy, otro de los padres de la IA, un beb considera inicialmente que la palabra mam es un nombre propio, luego un nombre general para las mujeres adultas, y ms tarde la designacin de una relacin, todo ello sin perder la informacin ms vieja. Por ltimo, est el problema de la extraccin de la informacin pertinente. La red de conocimientos debe estar organizada de manera tal que el sistema no slo pueda encontrar cada elemento de informacin con facilidad, sino tambin que tenga alguna forma de saber qu hechos pueden ser concernientes para ayudar a resolver el problema en cuestin. Experiencias personales Para algunos investigadores, en vez de tener un modelo del mundo programado dentro de la mquina, es mejor que sta lo pueda adquirir a travs de su propia experiencia perceptiva. Segn el filsofo Daniel Crevier, para las personas aparentemente, basta con un nivel muy bajo de procesamiento de la informacin para interaccionar con el mundo, ya que hay precedentes y restricciones fsicas que nos dicen cmo actuar. Por ejemplo, utilizar una aparato telefnico resulta natural porque, dada la forma de nuestras manos y de nuestra cabeza, slo hay una forma de sujetarlo. En vez de las especficas y complejas instrucciones que necesitara un robot para sujetar al auricular, nosotros slo necesitamos el suficiente conocimiento general para ajustarnos a la fsica de la situacin. El filsofo americano Hubert Dreyfus es, tal vez, ms drstico y extremista; para l, sin un cuerpo material no se puede hablar de inteligencia general. En efecto, la inteligencia del ser humano se asienta sobre un organismo, un cuerpo que es extremadamente complejo: tiene percepciones, sentimientos y emociones desarrolladas a lo largo de miles de millones de aos de evolucin. Sin embargo, el acercamiento que predomin -hasta ahora- fue el de una inteligencia artificial descorporizada, es decir, mquinas sin cuerpo, aunque quizs puedan llegar a alcanzar la capacidad de razonamiento humana o aun sobrepasarla holgadamente. Rodney Brooks, investigador principal en el Laboratorio de Robtica del MIT (Instituto Tecnolgico de Massachusetts), piensa de forma parecida: la inteligencia no puede ser
13

separada de la experiencia subjetiva de un cuerpo. Encabezando un equipo multidisciplinario, dise a Cog, un robot de metal, plstico y silicio inspirado en estructuras biolgicas y que se asemeja fsicamente -aunque de manera muy vaga- a la forma del hombre. El objetivo de Brooks es lograr una inteligencia parecida a la humana ms que una simple inteligencia, para lo cual decidi que a la mquina se le dieran experiencias humanas y que asimilase el conocimiento tanto a travs de la programacin como por intermedio de la proximidad con la gente y la interaccin social. Cog fue diseado para aprender como lo hace una persona, que se basa en la prueba y el error; es como un beb que tiene que aprender a hablar, caminar y tomar decisiones. Adems de sensores visuales y auditivos, tiene tambin una especie de piel -en realidad, una membrana sinttica sensible al contacto- con la cual puede experimentar sensaciones de temperatura y se pretende que sienta dolor. Ella le permite, al tocar o rozar un objeto, enviar informacin a su cerebro sinttico, de forma anloga a como ocurre en los seres humanos. El robot aprende, as, a retroceder si el objeto tiene posibilidad de daarlo. Tal vez, cuando empiece a aprender, Cog se vuelva cada vez ms sofisticado desde el punto de vista social, de un modo parecido a como el beb se vuelve nio. Quizs tenga la necesidad de interactuar con la gente, de verlos actuar, de escucharlos, y de conversar con ellos. No obstante, y a fin de que la experiencia sea significativa para una persona, sta tiene que encontrar creble a la criatura, por ejemplo, que aparente tener emociones, intenciones, deseos y creencias. Asimismo, y con el objeto de mejorar la interaccin, la comunicacin necesitara del rico y complejo lenguaje corporal para expresarse; es decir, en el uso de canales paralelos como los gestos, los movimientos de los brazos y las manos, las expresiones faciales, la mirada, el aspecto exterior, la postura y las entonaciones de la voz. Sin embargo, existe la posibilidad que Cog -y fundamentalmente sus sucesores- emprendan el camino hacia una evolucin artificial, tomando a su cargo su propia evolucin. Sin duda, sera mucho ms rpida que la biolgica, ya que las nuevas generaciones de mquinas surgen muy deprisa, adaptndose al entorno con una rapidez pasmosa. En consecuencia, no es del todo insensato pensar que, en algn momento, este tipo de creaciones puedan escaparse totalmente del control humano

14