Anda di halaman 1dari 3

El procesamiento del lenguaje natural, abreviado PLN1?2?

�en ingl�s natural


language processing, NLP� es un campo de las ciencias de la computaci�n,
inteligencia artificial y ling��stica que estudia las interacciones entre las
computadoras y el lenguaje humano. El PLN se ocupa de la formulaci�n e
investigaci�n de mecanismos eficaces computacionalmente para la comunicaci�n entre
personas y m�quinas por medio del lenguaje natural, es decir, de las lenguas del
mundo. El PLN no trata de la comunicaci�n por medio de lenguas naturales de una
forma abstracta, sino de dise�ar mecanismos para comunicarse que sean eficaces
computacionalmente �que se puedan realizar por medio de programas que ejecuten o
simulen la comunicaci�n�. Los modelos aplicados se enfocan no solo a la comprensi�n
del lenguaje de por s�, sino a aspectos generales cognitivos humanos y a la
organizaci�n de la memoria. El lenguaje natural sirve solo de medio para estudiar
estos fen�menos. Hasta la d�cada de 1980, la mayor�a de los sistemas de PLN se
basaban en un complejo conjunto de reglas dise�adas a mano. A partir de finales de
1980, sin embargo, hubo una revoluci�n en PLN con la introducci�n de algoritmos de
aprendizaje autom�tico para el procesamiento del lenguaje.

�ndice
1 Historia
2 Dificultades en el procesamiento del lenguaje natural
2.1 Ambig�edad
2.2 Detecci�n de separaci�n entre las palabras
2.3 Recepci�n imperfecta de datos
3 Componentes
4 Aplicaciones
5 V�ase tambi�n
6 Enlaces externos
7 Referencias
Historia
La historia del PLN empieza desde 1950, aunque existe trabajo encontrado desde
periodos anteriores. En 1950, Alan Turing public� Computing machinery and
intelligence el cual propon�a lo que hoy llamamos test de turing como criterio de
inteligencia. El experimento de Georgetown en 1954 involucr� traducci�n autom�tica
de m�s de sesenta oraciones del Ruso al Ingl�s. Los autores sostuvieron que en tres
o cinco a�os la traducci�n autom�tica seria un problema resuelto. El progreso real
en traducci�n autom�tica fue m�s lento y despu�s del reporte ALPAC en 1996, el cual
demostr� que la investigaci�n hab�a tenido un bajo desempe�o. M�s tarde
investigaci�n a menor escala en traducci�n autom�tica se llev� a cabo hasta finales
de 1980, cuando se desarrollaron los primeros sistemas de traducci�n autom�tica
estad�stica. Esto se debi� tanto al aumento constante del poder de c�mputo
resultante de la Ley de Moore y la disminuci�n gradual del predominio de las
teor�as ling��sticas de Noam Chomsky (por ejemplo, la Gram�tica Transformacional),
cuyos fundamentos te�ricos desalentaron el tipo de ling��stica de corpus, que se
basa el enfoque de aprendizaje de m�quinas para el procesamiento del lenguaje.
Algunos de los primeros algoritmos de aprendizaje autom�tico utilizados, tales como
�rboles de decisi�n, sistemas producidos de sentencias si-entonces similares a las
reglas escritas a mano. Se puede consultar un resumen de la historia de 50 a�os de
procesamiento autom�tico de publicaciones despu�s del proyecto NLP4NLP en forma de
una publicaci�n doble en Frontiers in Research Metrics and Analytics.3?4?

Dificultades en el procesamiento del lenguaje natural


Ambig�edad
Las lenguas naturales son inherentemente ambiguas en diferentes niveles:

En el nivel l�xico, una misma palabra puede tener varios significados, y la


selecci�n del apropiado se debe deducir a partir del contexto oracional o
conocimiento b�sico. Muchas investigaciones en el campo del procesamiento de
lenguajes naturales han estudiado m�todos de resolver las ambig�edades l�xicas
mediante diccionarios, gram�ticas, bases de conocimiento y correlaciones
estad�sticas.
A nivel referencial, la resoluci�n de an�foras y cat�foras implica determinar la
entidad ling��stica previa o posterior a que hacen referencia.
En el nivel estructural, se requiere de la sem�ntica para desambiguar la
dependencia de los sintagmas preposicionales que conducen a la construcci�n de
distintos �rboles sint�cticos. Por ejemplo, en la frase Rompi� el dibujo de un
ataque de nervios.
En el nivel pragm�tico, una oraci�n, a menudo, no significa lo que realmente se
est� diciendo. Elementos tales como la iron�a tienen un papel importante en la
interpretaci�n del mensaje.
Para resolver estos tipos de ambig�edades y otros, el problema central en el PLN es
la traducci�n de entradas en lenguas naturales a una representaci�n interna sin
ambig�edad, como �rboles de an�lisis.

Detecci�n de separaci�n entre las palabras


En la lengua hablada no se suelen hacer pausas entre palabra y palabra. El lugar en
el que se debe separar las palabras a menudo depende de cu�l es la posibilidad que
mantenga un sentido l�gico tanto gramatical como contextual. En la lengua escrita,
lenguas como el chino mandar�n tampoco tienen separaciones entre las palabras.

Recepci�n imperfecta de datos


Acentos extranjeros, regionalismos o dificultades en la producci�n del habla,
errores de mecanografiado o expresiones no gramaticales, errores en la lectura de
textos mediante OCR

Componentes
An�lisis morfol�gico. El an�lisis de las palabras para extraer ra�ces, rasgos
flexivos, unidades l�xicas compuestas y otros fen�menos.
An�lisis sint�ctico. El an�lisis de la estructura sint�ctica de la frase mediante
una gram�tica de la lengua en cuesti�n.
An�lisis sem�ntico. La extracci�n del significado de la frase, y la resoluci�n de
ambig�edades l�xicas y estructurales.
An�lisis pragm�tico. El an�lisis del texto m�s all� de los l�mites de la frase, por
ejemplo, para determinar los antecedentes referenciales de los pronombres.
Planificaci�n de la frase. Estructurar cada frase del texto con el fin de expresar
el significado adecuado.
Generaci�n de la frase. La generaci�n de la cadena lineal de palabras a partir de
la estructura general de la frase, con sus correspondientes flexiones,
concordancias y restantes fen�menos sint�cticos y morfol�gicos.
Aplicaciones
Las principales tareas de trabajo en el PLN son:

S�ntesis del discurso


An�lisis del lenguaje
Comprensi�n del lenguaje
Reconocimiento del habla
S�ntesis de voz
Generaci�n de lenguajes naturales
Traducci�n autom�tica
Respuesta a preguntas
Recuperaci�n de la informaci�n
Extracci�n de la informaci�n
V�ase tambi�n
Lenguaje natural
Felisa Verdejo
Enlaces externos
Sociedad Espa�ola para el Procesamiento del Lenguaje Natural (SEPLN)
Asociaci�n Mexicana para el Procesamiento del Lenguaje Natural (AMPLN)
Grupo de Procesamiento de Lenguaje Natural - FaMAF - Universidad Nacional de
C�rdoba - Argentina
Grupo Sistemas Inteligentes de Acceso a la Informaci�n - SINAI - Universidad de
Ja�n - Espa�a
Grupo de Procesamiento de Lenguaje Natural y Sistemas de Informaci�n - GPLSI -
Universidad de Alicante - Espa�a
Grupo de Procesamiento de Lenguaje Natural - NIL - Universidad Complutense de
Madrid - Espa�a
CLiC-Centre de Llenguatge i Computaci�, Universitat de Barcelona
Laboratorio de Procesamiento de Lenguaje Natural - CIC - Instituto Polit�cnico
Nacional - M�xico
Procesamiento autom�tico del espa�ol con enfoque en recursos l�xicos grandes.
Investigaciones en an�lisis sint�ctico para el espa�ol.
Computational Linguistics: Models, Resources, Applications. (con ejemplos en
espa�ol)
Semantic Analysis of Verbal Collocations with Lexical Functions. (con ejemplos y
diccionario en espa�ol)
Sobre la representaci�n de la imprecisi�n del lenguaje natural mediante conjuntos
difusos.
Procesamiento del lenguaje natural para recuperaci�n de informaci�n
Recuperaci�n y acceso a la informaci�n en la Web mediante herramientas de
procesamiento del lenguaje natural
MachineReading: an�lisis de la estructura sint�ctica de la frase
Referencias
�Inter-Active Terminology for Europe�.
��PLN�, mejor que �NLP�, sigla de �procesamiento del lenguaje natural��.
www.fundeu.es. Consultado el 10 de julio de 2019.
Mariani, Joseph; Francopoulo, Gil; Paroubek, Patrick (2019), �The NLP4NLP Corpus
(I): 50 Years of Publication Collaboration and Citation in Speech and Language
Processing�, Frontiers in Research Metrics and Analytics
Mariani, Joseph; Francopoulo, Gil; Paroubek, Patrick; Vernier, Fr�d�ric (2019),
�The NLP4NLP Corpus (I): 50 Years of Research in Speech and Language Processing�,
Frontiers in Research Metrics and Analytics
El procesamiento del lenguaje natural, tecnolog�a en transici�n. Jaime Carbonell.
Congreso de la Lengua Espa�ola, Sevilla, 1992
Lenguas y tecnolog�as de la informaci�n. �ngel G. Jord�n. Congreso de la Lengua
Espa�ola, Sevilla, 1992
Extracci�n y Recuperaci�n de Informaci�n. Seg�n patrones: l�xicos, sint�cticos,
sem�nticos y de discurso
Entrevista a Antonio Valderr�banos (Bitext) sobre buscadores y procesamiento del
lenguaje natural

Anda mungkin juga menyukai