Anda di halaman 1dari 3

Apuntes

sobre LETRAS-Web
Antonio Moreno Sandoval


http://www.lllf.uam.es/letras/

1. Observaciones preliminares

Se trata de una versin beta. No est pensada para usuarios generales, sino para
lingistas computacionales. Es una herramienta muy potente, pero hay que
conocer sus detalles.

2. Seleccin del input (texto)



Se pueden elegir uno o ms textos de los 24 actualmente precargados. Tambin se
pueden subir hasta 7 textos propios. Para esto ltimo, hay que seleccionar
Textbox o Casilla de texto a la izda del men y luego copiar todo el texto en la
vantana correspondiente.

3. Bsqueda de patrones

Este es uno de los apartados ms tiles del programa. Permite bsquedas de
palabras y de patrones de palabras (mediante expresiones regulares).

Bsqueda de una palabra



#porque#
#por qu#


siempre entre # # que marcan los lindes de palabra. Se pueden buscar varias
secuencias de palabras:

#Don Quijote de la Mancha#

Bsqueda por patrones regulares



Letras-Web utiliza una combinacin particular de comodines para representar
las expresiones regulares. Es una caracterstica que hay que cambiar, pero de
momento no est disponible la posibilidad de utilizar las expresiones regulares
habituales.

Pulsando el botn Explicacin hay un resumen de posibilidades:

# lmite de palabra
& secuencia de caracteres entre blancos (una palabra cualquiera)
\l cualquier letra del alfabeto latino expandido (, , , )
\w cualquier letra del alfabeto anglosajn
\d cualquier dgito
\s cualquier espacio o tabulacin
\r retorno
\n cambio de lnea
\t tabulador
. cualquier letra excepto cambio de lnea
? cero u una letra
* cero o ms letras
+ una o ms letras

[a-Z] secuencia de letras de a Z

( r1 | r2 | rn) diferentes combinaciones de caracteres en alternancia.

Algunos ejemplos:

Comparacin futuro analtico (comer) y perifrstico (ir a)

#(voy|vas|va|vamos|vis|van)\sa\s[a-z]*(a|e|i)r#

#[a-z]*(a|e|i)r(|s||emos|is|n)#

4. Muestra de resultados

4.1. Item en contexto



es la forma de ver todos los ejemplos de la bsqueda

4.2. Tabla de frecuencias

realiza el recuento de formas (tem) o patrones buscados.
Cuando se selecciona Tabla de frecuencias se despliega un men donde hay que
elegir:

tem o patrn

Frecuencia absoluta | % vertical (frec. Relativa) | por mil palabras (frecuencia
normalizada


Cuando se comparan palabras o patrones de un nico texto, es til emplear la
frecuencia relativa. Cuando se comparan en diferentes corpus, entonces es
obligatorio usar la frecuencia normalizada.




Comparacin de variantes en dos corpus


el quijote c-oral-rom

1 porque 3.220 1 porque 6.738
2 por que 0.079 2 por qu 0.784
3 por qu 0.079 3 porqu 0.010
4 porqu 0.005 4 por que 0.010


quijote
el
c-oral-rom
1 estar 0.476 1 est 3.527
2 ser 2.921 2 es 17.165
3 es 5.775 3 ser 0.975
4 est 1.262 4 estar 0.765