Anda di halaman 1dari 6

Procesamiento Computacional del Lenguaje Natural

Indice

1. Qu es el Lenguaje? 2. Que es el Lenguaje Natural? 3. Que es el Lenguaje Formal? 4. Procesamiento Computacional del Lenguaje Natural(PLN) 5. Aplicaciones del PLN 6. Niveles del Lenguaje 7. Arquitectura de un Sistema de PLN 8. El Problema de la Ambigedad 9. El PLN en los Sistemas Multimedia y Expertos: Tutores Inteligentes(TI) 10. Bibliografa.

1. Que es el Lenguaje? Un lenguaje se considera como un conjunto de oraciones, que usualmente es infinito y se forma con combinaciones de palabras del diccionario. Es necesario que esas combinaciones sean correctas(con respecto a sintaxis) y tengan sentido(con respecto a la semntica). Un lenguaje es la funcin que expresa pensamientos y comunicaciones entre la gente. Esta funcin es llevada a cabo por medio de seales y vocales(voz) y posiblemente por signos escritos(escritura). En este punto podemos distinguir entre dos clases de lenguajes: los lenguajes naturales(ingles, alemn, espaol, etc.) y lenguajes formales(matemtico, lgico, etc.) A continuacin damos una breve descripcin de estos dos tipos de lenguaje. 2. Que es el Lenguaje Natural? Como mencionamos anteriormente el Lenguaje Natural(LN) es el medio que utilizamos de manera cotidiana para establecer nuestra comunicacin con las dems personas Este tipo de lenguaje es el que nos permite el designar las cosas actuales y razonar a cerca de ellas, fue desarrollado y organizado a partir de la experiencia humana y puede ser utilizado para analizar situaciones altamente complejas y razonar muy sutilmente. La riqueza de sus componentes semnticos da a los lenguajes naturales su gran poder expresivo y su valor como una herramienta para razonamiento sutil. Por otro lado la sintaxis de un LN puede ser modelada fcilmente por un lenguaje formal, similar a los utilizados en las matemticas y la lgica. Otra propiedad de los lenguajes naturales es la polisemantica, es decir la posibilidad de que una palabra en una oracin tenga diversos significados. En un primer resumen, los lenguajes naturales se caracterizan por las siguientes propiedades: 1. Desarrollados por enriquecimiento progresivo antes de cualquier intento de formacin de una teora. 2. La importancia de su carcter expresivo debido grandemente a la riqueza del componente semntico(polisemantica).

3. Dificultad o imposibilidad de una formalizacin completa. 4. Que es el Lenguaje Formal? El lenguaje formal es aquel que el hombre ha desarrollado para expresar las situaciones que se dan en especifico en cada rea del conocimiento cientfico. Las palabras y oraciones de un lenguaje formal son perfectamente definidas(una palabra mantiene su el mismo significado prescindiendo de su contexto o uso. Los lenguajes formales son exentos de cualquier componente semntico fuera de sus operadores y relaciones. Los lenguajes formales pueden ser utilizados para modelar una teora de la mecnica, fisica, matemtica, ingeniera elctrica, o de otra naturaleza, con la ventaja de que en estos toda ambigedad es eliminada. En resumen las caractersticas de los lenguajes formales son las siguientes: 1. 2. 3. 4. 5. 6. 5. Se desarrollan de una teora preestablecida. Componente semntico mnimo. Posibilidad de incrementar el componente semntico de acuerdo con la teora a formalizar. La sintaxis produce oraciones no ambiguas. La importancia del rol de los nmeros. Completa formalizacin y por esto, el potencial de la construccin computacional. Procesamiento Computacional del Lenguaje Natural(PLN)

Una meta fundamental de la Inteligencia Artificial(IA), es la manipulacin de lenguajes naturales usando herramientas de computacin, en esta, los lenguajes de programacin juegan un papel importante, ya que forman el enlace necesario entre los lenguajes naturales y su manipulacin por una maquina. Antes de continuar con nuestro estudio del PLN, es importante el que estudiemos el concepto de lo que es un lenguaje de programacin y las generaciones de estos para darnos una idea de cmo ha sido su evolucin. Qu es un Lenguaje de Programacin? Un lenguaje de programacin es un conjunto de normas lingsticas que permiten escribir un programa y que ste sea entendido por el ordenador y pueda ser trasladado a ordenadores similares para su funcionamiento en otros sistemas. Un programa es una serie de instrucciones ordenadas correctamente que permiten realizar una tarea o trabajo especfico. Ahora bien, un lenguaje de programacin se basa en dos elementos muy importantes: Sintaxis: que se refiere a la utilizacin correcta de cada una de las sentencias de cierto lenguaje de programacin. Semntica: se encarga de que cada "oracin" del lenguaje de programacin utilizado tenga un significado correcto.

A medida que la complejidad de los programas ha ido aumentando, se han requerido de nuevos lenguajes para poder describir esos problemas y que sean resueltos por el ordenador. Generaciones de Lenguajes de Programacin Las generaciones de los lenguajes de programacin, se han venido dando debido a que las necesidades que plantean los problemas son cada da ms grandes y complejo, a continuacin se hace un pequeo resumen de cada una de las generaciones de lenguajes de programacin. a. Primera Generacin: Los lenguajes de primera generacin o tambin conocidos como lenguajes maquina, son en los que se utiliza el cdigo binario(unos y ceros) para comunicarse con la computadora, esta generacin de lenguajes es muy complicada, ya que al usar pocos signos, no puede expresar cosas muy complicadas. En la actualidad ya casi no se trabaja con lenguajes maquina, los nicos que lo hacen son los diseadores de los "chips" de los procesadores.

b. Segunda Generacin: Los lenguajes de esta segunda generacin son conocidos tambin como ensambladores, y se distinguen de los lenguajes maquina por su eficiencia(en comparacin con sus antecesores). Estos lenguajes ensambladores se basan en lo que es la comprensin de varias palabras en una sola, por ejemplo: ADC significara "sumar con reserva"(en ingles: ADd with Carry) Haciendo notoria la aclaracin, de que esta serie de instrucciones sern traducidas al lenguaje maquina por el compilador del lenguaje. c. Tercera Generacin: Los lenguajes de tercera generacin o de alto nivel son los lenguajes ms comunes o que ms conocemos(C, Pascal, Algol, Cobol, Fortran, BASIC). Estos lenguajes se asemejan ya un poco ms al lenguaje humano, al utilizar palabras completas( en ingles) para la codificacin de los programas. d. Cuarta Generacin: Son los lenguajes de "programacin asistida" por medio de ayudantes o wizards, estos lenguajes se han diseado para facilitar la realizacion de muy variadas tareas, como lo son la simulacin de fenmenos fsicos, manipulacin de datos estadsticos, etc. Algunos de estos lenguajes son: Visual Basic, INFORMIX 4GL, Visual J+ +, Visual C, he inclusive algunos autores consideran las planillas de calculo dentro de esta generacin. e. Quinta Generacin: En esta generacin, el programador solo ingresa hechos y hace consultas, no se preocupa de cmo hacer los algoritmos que entregan la respuesta, algunos autores hasta hace poco todava consideraban a esta generacin como un sueo, pero gracias al avance de la tecnologa, hoy en da es toda una realidad, como lo veremos a continuacin. Ahora que ya hemos hecho un breve anlisis de los lenguajes de programacin, continuaremos con el anlisis del PLN. Antes de continuar con nuestro estudio, es necesario definir claramente lo que es el PLN, el PLN es la utilizacin de un lenguaje natural para comunicarnos con la computadora, debiendo esta entender las oraciones que le sean proporcionadas, el uso de estos lenguajes naturales, facilita el desarrollo de programas que realicen tareas relacionadas con el lenguaje o bien, desarrollar modelos que ayuden a comprender los mecanismos humanos relacionados con el lenguaje. El uso del lenguaje natural(LN) en la comunicacin hombre-maquina es a la vez una ventaja y un obstculo con respecto a otros medios de comunicacin. Por un lado es una ventaja, en la medida en que el locutor no tiene que esforzarse para aprender el medio de comunicacin a diferencia de otros medios de interaccin como lo son los lenguajes de comando o las interfaces grficas(4 Generacin). Su uso tambin es a la vez un obstculo por que la computadora tiene una limitada comprensin del lenguaje. Por ejemplo, el usuario no puede hablar sobrentendidos, ni introducir nuevas palabras, ni construir sentidos derivados, tareas que se realizan espontneamente cuando se utiliza el lenguaje natural. 5. Aplicaciones del PLN Las aplicaciones del Procesamiento de Lenguajes Naturales son muy variadas, ya que su alcance es muy grande, algunas de las aplicaciones del PLN son: Traduccin automtica: se refiere ms que nada a la traduccin correcta de un lenguaje a otro, tomando en cuenta lo que se quiere expresar en cada oracin, y no solo palabra por palabra. Una aproximacin a este tipo de traductores es el babylon. Recuperacin de la informacin: en esta aplicacin, un claro ejemplo seria el siguiente: Una persona llega a la computadora y le dice(en LN) que es lo que busca, esta busca y le dice que es lo que tiene referente al tema. Extraccin de Informacin y Resmenes: Los nuevos programas, deben tener la capacidad de crear un resumen de un documento basndose en los datos proporcionados, realizando

un anlisis detallado del contenido y no solo la truncando las primeras Lineas de los prrafos. Resolucin cooperativa de problemas: La computadora debe tener la capacidad de cooperar con los humanos para la solucin de problemas complejos, proporcionando datos e informacin, incluyendo tambin, la demanda de informacin por parte del ordenador al usuario, debiendo existir una excelente interactividad entre el usuario y el ordenador. Tutores inteligentes: La aplicacin del PLN en este aspecto, viene siendo ms acadmico, ya que se refiere a la enseanza asistida por computadora, debiendo esta ser aprox. en un 99%, al tener esta la capacidad de evaluar al educando y tener la capacidad de adaptndose a cada tipo de alumno. Reconocimiento de Voz: Esta es una aplicacin del PLN que ms xito ha obtenido en la actualidad, ya que las computadoras de hoy ya tienen esta caracterstica, el reconocimiento de voz puede tener dos posibles usos: para identificar al usuario o para procesar lo que el usuario dicte, existiendo ya programas comerciales, que son accesibles por la mayora de los usuarios, ejemplo: ViaVoice. 6. Niveles del Lenguaje Para continuar nuestro estudio de los lenguajes naturales, es necesario el que conozcamos los niveles del lenguaje, los cuales sern utilizados para la explicacin de el siguiente tema que es la Arquitectura de un sistema de PLN. Los niveles de lenguaje que daremos a conocer son los siguientes: fonolgico, morfolgico, sintctico, semntico, y pragmtico. a. Nivel Fonolgico: trata de cmo las palabras se relacionan con los sonidos que representan. b. Nivel Morfolgico: trata de cmo las palabras se construyen a partir de unas unidades de significado mas pequeas llamadas morfemas, por ejemplo: Rpida + Mente == Rpidamente c. Nivel Sintctico: trata de cmo las palabras pueden unirse para formar oraciones, fijando el papel estructural que cada palabra juega en la oracin y que sintagmas son parte de otros sintagmas. d. Nivel Semntico: trata del significado de las palabras y de cmo los significados se unen para dar significado a una oracin, tambin se refiere al significado independiente del contexto, es decir de la oracin aislada. e. Nivel Pragmtico: trata de cmo las oraciones se usan en distintas situaciones y de cmo el uso afecta al significado de las oraciones. Se suele reconocer un subnivel recursivo: discursivo, que trata de cmo el significado de una oracin se ve afectado por las oraciones inmediatamente anteriores. 7. Arquitectura de un sistema de PLN Ahora que ya conocemos los niveles del lenguaje, el siguiente paso es la elaboracin de la arquitectura del sistema de procesamiento del lenguaje natural, es decir, como va la computadora a interpretar y analizar las oraciones que le sean proporcionadas, a continuacin se muestra un esquema de cmo la computadora debe hacer el anlisis de estas. La explicacin de este sistema, es sencilla: a. El usuario le expresa a la computadora que es lo que desea hacer. b. La computadora analiza las oraciones proporcionadas, en el sentido morfolgico y sintctico, es decir, si las frases contienen palabras compuestas por morfemas y si la estructura de las oraciones es correcta. c. El siguiente paso, es analizar las oraciones semnticamente, es decir saber cual es el significado de cada oracin, y asignar el significado de estas a expresiones lgicas(cierto o falso).

d. Una vez realizado el paso anterior, ahora podemos hacer el anlisis pragmtico de la instruccin, es decir una vez analizadas las oraciones, ahora se analizan todas juntas, tomando en cuenta la situacin de cada oracin, analizando las oraciones anteriores, una vez realizado este paso, la computadora ya sabe que es lo que va a hacer, es decir, ya tiene la expresin final. e. Una vez obtenida la expresin final, el siguiente paso es la ejecucin de esta, para obtener as el Resultado y poder proporcionrselo al usuario. 8. El problema de la Ambigedad Uno de los grandes problemas del PLN se produce cuando una expresin en LN posee ms de una interpretacin, es decir, cuando en el lenguaje de destino se le pueden asignar dos o ms expresiones distintas. Este problema de la ambigedad se presenta en todos los niveles del lenguaje, sin excepcin. Ejemplo: "Juan vio a Mara, con el telescopio" "Juan vio a Mara con el telescopio" En apariencia este problema es demasiado sencillo, pero en realidad, es uno de los mas complicados y que ms complicaciones ha dado para que el PLN pueda desarrollarse por completo, ya que al presentarse en todos los niveles del lenguaje, se tienen que desarrollar programas( en lenguaje formal) para solucionarlos en cada caso. 9. El PLN en los Sistemas Multimedia y Expertos: Tutores Inteligentes(TI) La pretensin de la informtica de adaptarse al comportamiento natural de del usuario, ha llevado la incorporacin de texto, imgenes y sonido(los llamados entornos multimedia") a las estaciones de trabajo y Pcs actuales, al tiempo que stos aumentan su capacidad. Antes de continuar con el estudio del PLN en los sistemas multimedia, enumeremos las partes que pueden contener estos: 1. 2. 3. 4. 5. 6. 7. Entornos de iconos Autopistas de informacin Ratn Programacin interactiva Realidad Virtual Hipertexto Sonido

En si la multimedia es la unin de del hipertexto con el sonido, estas uniones de imgenes, texto y sonidos necesitan una filosofa del conocimiento que fundamente su funcin interna dentro de la comunicacin de conocimientos, o sea pasar a ser elementos de la estructura de conocimiento y no solo datos. A esa filosofa la llamamos idea intuitiva de la comunicacin sistema-usuario. Para deslindar, este problema, lo situamos en un contexto de enseanza de conocimientos, es decir, Tutores Inteligentes(TI) en entornos multimedia. Los TI son un tipo de sistemas expertos con mdulos especiales( alumno y pedaggico) y una reestructuracin de los existentes( conocimiento, explicaciones, interfaz). En si el modelo que debe seguir el TI es el siguiente: Como es sabido un dialogo en lenguaje natural esta muy afectado por el conocimiento que un interlocutor tiene del otro y por el contexto o entorno donde el dialogo tiene lugar. Lo primero que est aqu proporcionado por el modelo del usuario y, lo segundo, por el "paisaje de imgenes". El dialogo del TI, se basa en preguntas respuestas, pero adems el TI tiene que fijar el objetivo de cada pregunta y el tipo de informacin necesaria, incluso demandando informacin al usuario, lo cual exige una actitud cooperativa por parte de este. 10. Bibliografa Letch, Charley. Informacin Tsunami: Un futurista mira en retrospectiva, Primera Edicin, Editorial Limusa, Coleccin Megabyte, Mxico D.F., 1992

http://delta.cs.cinvestav.mx/red/logica/node3.html http://cic2.iimas.unam.mx/~villasen/protocolo-proy-CONACYT.html http://www3.uniovi.es/~Psi/REMA/v1n1/a4/p1.html http://www.dcc.uchile.cl/~cc20a/contenidos/clase05 http://www.lawebdelprogramador.com/ Trabajo realizado Cutberto Uriel Paredes Hernndez cparedes@tamaulipas.com Alumno de Conalep Cd. Victoria - 172 Cd. Victoria , Tamaulipas, Mxico a 30 de Septiembre de 2000

Anda mungkin juga menyukai