Fernando Justicia, Julio Santiago, Alfonso Palma, Dolores Huertas & Nicols Gutirrez (1996) La
frecuencia silbica del espaol escrito por nios: Estudio estadstico. (Syllable frequency: A statistical
analysis of written productions by Spanish children). Cognitiva, 8, 131-168
Extended summary
Modern psycholinguistic research does extensive use of statistical descriptive tools,
such as frequency counts. These tools allow investigators to control for the contribution
of distributional variables of linguistically and arbitrarily defined units to language
performance. In this paper, a syllable frequency count is presented, and compared to
the other one currently available for Spanish (Alvarez, Carreiras & de Vega, 1992a).
The present syllable frequency count stems from a sample of written Spanish words
produced by school children. Subjects were 2.166 children between ages 6 and 10 (first
to fith school grades), from different rural and urban areas of Southern Spain. Children
were asked to perform two production tasks. The first task was a written composition
about a topic of their choice; the second one was producing as many isolated words as
possible during a fixed period of time. This procedure generated a sample of 255.711
words (tokens), that was constituted by repetitions of 12.281 differently spelled words
(types). The syllable frequency count was based on the division of the latter into
syllables. Each different syllable was assigned two indexes: a case index, the number of
word types containing that syllable; and a frequency index, the number of word tokens
(accumulating tokens of different types) containing the syllable. These case and
frequency indexes were obtained both in absolute terms and also by position of the
syllable in the word (monosyllable, and first to sixth plus final position). Therefore, for
each different syllable, a set of 9 case and 9 frequency indexes is presented. To give
some examples, case index for monosyllable position shows number of monosyllabic
word types constituted by a given syllable. Case index for position 1 indicates number
of word types containing a given syllable in initial position. The total case index
indicates number of word types containing a given syllable in any position. Frequency
index for position 3 shows number of word tokens (accumulated frequency) containing
a given syllable in position 3. Finally, the total frequency index shows the total number
of word tokens containing a given syllable in any position.
The resulting frequency count contains 1.148 different syllables and their associated
indexes, and is presented as an appendix to the paper. In addition, some distributional
properties of words and syllables in the vocabulary of Spanish children are analyzed.
Looking at the number of different word types as a function of number of syllables, it is
shown that there are more trisyllabic words in the sample, followed by words
comprising two and four syllables. However, when looking at the number of word
tokens (frequency of word types), bisyllables predominated, followed by longer words
Introduccin
En la investigacin psicolingstica ms reciente, a menudo se utilizan como
variables indicadores estadsticos que son propios de determinados elementos
lingsticos. El valor estadstico de estos indicadores se deriva del recuento de los
elementos lingsticos; de analizar las regularidades que presentan; de determinar la
longitud que tienen; de observar la posicin que ocupan o de establecer la frecuencia
con que ocurren. Las unidades objeto de cuantificacin, de segmentacin y
fragmentacin pueden ser tanto unidades tradicionalmente consideradas como
lingsticas (letras, slabas, palabras, etc.), as como unidades no tradicionalmente
lingsticas, definidas por los investigadores, como son los bigramas, trigramas
(Massaro, Taylor, Venezky y Jastrzembski, 1980) o el BOSS (Basic Orthographic Syllabic
Structure) (Taft, 1979). Los datos cuantificables se obtienen de los anlisis de las
distribuciones que muestran las unidades lingsticas y no lingsticas en diversas
manifestaciones orales y/o escritas de la lengua.
As, por ejemplo, se ha demostrado que la frecuencia con que ocurren las palabras y
las slabas condiciona el tiempo requerido para el procesamiento verbal. La frecuencia
de ambos tipos de unidades lingsticas incide tambin en el nmero de errores que se
cometen cuando procesamos el lenguaje (Levelt, 1989; Stemberger, 1989; del Viso, 1990).
Variables estadsticas como la frecuencia lxica pueden no slo afectar a la velocidad o
precisin del procesamiento del lenguaje, sino llevar a estrategias de procesamiento
cualitativamente diferentes (Coltheart, 1978).
En estadstica lingstica podemos distinguir la existencia de recuentos en dos
niveles. Por un lado, en un nivel lxico, nos encontramos los recuentos que tienen por
objeto la palabra. Por otro, aquellos cuya finalidad estriba en obtener datos de unidades,
con entidad propia, en un nivel inferior a la palabra. Si consideramos las unidades
lingsticas existentes en el nivel inferior a la palabra (el nivel sublxico), podemos
diferenciar diversos elementos resultantes de la combinacin de otros ms simples
como son los fonemas (y, en caso de la escritura, los grafemas) y las slabas. Tambin se
han considerado otros conjuntos de letras en forma de bigramas (dos letras), trigramas
(tres letras) en diferentes posiciones dentro de la palabra.
De todas estas unidades sublxicas del sistema fonolgico, sin embargo, las slabas
son el elemento lingstico con mayor entidad por constituir la unidad de
representacin superior del sistema fonolgico. En las slabas, a su vez, podemos
distinguir otros elementos constitutivos con entidad propia como son la cabeza y la
rima y, dentro de sta, la cima y la coda. Tambin se han considerado como unidades
de anlisis las diversas estructuras de slabas, diferentes en cada lengua, y la posicin en
que estas estructuras aparecen dentro de las palabras. Todos estos elementos, adems,
ocurren con una regularidad determinada que consideramos afecta al procesamiento
lingstico que los sujetos hacen de su lengua.
La relevancia psicolgica de la slaba es an objeto de un debate abierto en
numerosas investigaciones sobre los procesos que median en el reconocimiento y en la
produccin tanto del lenguaje hablado como del lenguaje escrito. En la percepcin del
lenguaje hablado, el problema del reconocimiento se plantea entre la continuidad no
segmentada de los sonidos y el carcter discreto o segmentado de la percepcin,
normalmente, de palabras. Algunos autores han explicado la identificacin lxica
postulando un proceso directo de ajuste entre los rasgos fonticos y el nivel lxico, sin la
mediacin de unidades de representacin intermedias (Klatt, 1980). Frente a esta
posicin, otros autores han formulado la percepcin del habla como un proceso que
discurre en etapas progresivas y ascendentes considerando, en la etapa fonolgica, las
unidades postuladas por los lingistas (Clark y Clark, 1977; Pisoni y Luce, 1987;
Studdert-Kennedy, 1974). Por tanto, es pertinente plantearse dos cuestiones, de una
parte, cmo se segmenta el habla continua y, de otra, aunque relacionada con la
anterior, cul es la informacin fonolgica necesaria y suficiente para acceder al lxico.
Las respuestas de los investigadores a estas cuestiones han sido muy variadas
(Elman y McClelland, 1984; Grosjean, 1980; Grosjean y Gee, 1984; Mackay, 1987;
Marslen-Wilson y Tyler, 1980; Pisoni y Luce, 1987), resaltando algunas de ellas el papel
que juega la slaba en los procesos de segmentacin y de acceso al lxico. Dentro de esta
problemtica se analiza tambin la cuestin relativa al valor universal de la slaba o si se
trata, por el contrario, de una cuestin especfica de cada lengua (Bradley, SnchezCasas, y Garca-Albea, 1993; Cutler, Mehler, Norris, y Segui, 1983; Cutler et al., 1986;
Garca-Albea, 1991; Mehler, Segui y Frauenfelder, 1981; Morais, Content, Cary, Mehler
y Segui, 1989; Segui, 1984; Segui, Dupoux y Mehler, 1990).
En la lectura, por el contrario, la informacin visual de la que nos servimos para leer
viene separada por espacios en blanco, por cuanto las secuencias de letras se agrupan
en palabras. En este mbito de la lectura, la cuestin del acceso al lxico se ha planteado
de varias formas. Por un lado, los modelos duales postulan que el acceso al lxico se
hace, o bien mediante la codificacin fonolgica de los grafemas cuando se aplican las
reglas de correspondencia en la conversin grafema-fonema, o bien pasando
directamente al lxico desde las formas logogrfica y/u ortogrfica (Frith, 1980). En
cada caso concreto, la ruta ms rpida determina la forma de acceso al lxico (Besner,
1990; Coltheart, 1978; Paap y Noel, 1991). Frente a este modelo dual de 'carrera entre
dos caballos', como lo denomina Henderson (1982), otros modelos conciben el acceso al
lxico como el resultado de una actividad subyacente, interactiva y simultnea entre
dos redes parciales que contienen informacin tanto ortogrfica como fonolgica pero
que no implican enfrentamiento alguno entre ambos tipos de representaciones
(Seidenberg y McClelland, 1989; Van Orden, Pennington y Stone, 1990).
En este contexto terico, el papel que pueden desempear variables que estn
asociadas con la informacin sublxica es de gran importancia. En efecto, se han
realizado un conjunto de investigaciones que ponen de manifiesto el papel de la slaba
en el acceso al lxico a partir de material impreso, tanto en adultos (Carreiras, lvarez y
de Vega, 1993; Prinzmetal, Treiman y Rho, 1986; Seidenberg, 1987, 1989; Rapp, 1992; de
Vega y Carreiras, 1989; de Vega, Carreiras, Gutirrez y Alonso, 1990) como en nios
(Defior, Justicia y Martos, en prensa; Goswami y Bryant, 1990; Treiman, 1992; Treiman y
Zukowski, 1988).
En relacin con la produccin del lenguaje hablado, el papel de la slaba est
presente en los diversos modelos explicativos (vase, por ejemplo, Levelt, 1989), aunque
su entidad psicolgica, en el caso de los errores del lenguaje, ha sido a veces
cuestionada. La razn que se aduce, en este caso, es la escasa frecuencia de la slaba
como elemento implicado en el error, a pesar de jugar un papel importante
constriendo los errores de unidades subsilbicas (pero vase Mackay, 1992, pp. 51-52
para una posible explicacin de este fenmeno). De nuevo, la influencia de factores
ligados a la slaba se ha puesto de manifiesto tanto en la produccin del lenguaje adulto
(por ejemplo, del Viso, 1990) como el infantil (Jaeger, 1992; Stemberger, 1989; Treiman,
1985).
La fuente de referencia estadstica para este tipo de trabajos son las bases de datos
que proporcionan los diccionarios de frecuencia existentes en diferentes lenguas (vase
Justicia y Palma, 1986). La mayor parte de ellos tienen la palabra como unidad
lingstica de referencia, siendo menor en nmero aquellos que hacen recuento, de una
forma exhaustiva, de unidades sublxicas. Entre los primeros, tal vez el ms utilizado
para el espaol sea el diccionario de Juilland y Chang-Rodrguez (1964). Entre los
diccionarios silbicos, el construido por lvarez y colaboradores (1992a) de la
Universidad de La Laguna es, hasta ahora, uno de los pocos que suplen, de forma
precisa, el vaco de informacin sobre la regularidad con que ocurren las slabas en
espaol.
El trabajo que nosotros presentamos es un instrumento de investigacin
complementario con el anterior, con el que mantiene ciertas diferencias que
comentaremos ms adelante. En otro lugar, hemos presentado otros diccionarios de
inters instrumental para el psicolingista (Justicia, 1985, 1995; Santiago, Justicia, Palma,
Huertas y Gutirrez, en prensa).
Nuestro objetivo con el diccionario silbico es proporcionar una base de datos que
rena las siguientes caractersticas: a) que provenga del lenguaje usual y actual del nio
en edad escolar. Teniendo en cuenta que una gran parte del vocabulario individual
bsico se adquiere en la escuela esta base de datos parte del vocabulario usual del nio
adquirido y ampliado a lo largo de los primeros aos de enseanza. En los cursos
iniciales de la enseanza primaria el nio aprende a leer y escribir. Dos habilidades
complejas en estrecha relacin con el desarrollo y adquisicin del lenguaje. b) Que
contenga informacin sublxica precisa sobre la regularidad caracterstica de las slabas
en espaol.
MTODO
Muestra.
El diccionario silbico que presentamos en el anexo resulta del proceso de silabacin
del diccionario de frecuencia de palabras, que contiene el vocabulario usual del nio, y
que publicamos hace algunos aos (Justicia, 1985). La silabacin es la accin de dividir
las palabras en slabas atendiendo a los lmites silbicos (Lzaro, 1974). El diccionario de
frecuencia de palabras se construy a partir de una muestra de 255.711 palabras. Las
palabras provenan de textos libres escritos por 2.166 nios, de edades comprendidas
entre los 6 y 10 aos. La frecuencia media total de las palabras en el diccionario es de
44,47. La versin final del diccionario contiene 5.750 voces o entradas lxicas.
Por tratarse de un diccionario silbico del espaol escrito por nios conviene
distinguir, desde el punto de vista del muestreo, dos aspectos: de una parte, la muestra
de sujetos que proporciona los textos escritos; y, de otra, la muestra de palabras que da
origen al diccionario silbico. Al primer aspecto nos vamos a referir, propiamente, en
este apartado de la muestra. Ms adelante, nos referiremos en el apartado de material a
la muestra de palabras que sirvi de base para la elaboracin de un diccionario de
frecuencia de palabras que es, a la postre, la fuente de donde finalmente se obtiene el
diccionario silbico que proponemos.
La seleccin de la muestra de sujetos que sirvi para determinar el contenido del
diccionario de palabras, se hizo mediante un muestreo estratificado con afijacin
ptima (Azorn Poch, 1972). La fijacin del nmero de sujetos por estrato result de la
conjuncin de dos criterios. En primer lugar, de la cantidad de palabras escritas por los
nios en los textos. De esta forma, determinamos la extensin del universo lxico, es
decir, el total de palabras a partir del cual obtendramos, despus, el vocabulario usual
del nio, basado en una frecuencia media de las palabras suficientemente alta de tal
manera que hiciera consistente el recuento. Cuanto mayor fue la variabilidad de
palabras escritas por los nios pertenecientes a cada estrato, mayor representacin
tuvieron en la muestra final de sujetos. El criterio aplicado, en segundo lugar, fue la
consideracin del tamao de los estratos en la poblacin de referencia.
La representacin de los sujetos en la muestra final result proporcional a la
aplicacin de ambos criterios. El muestreo de sujetos se realiz en dos etapas,
correspondiendo la primera al estudio de una muestra piloto en la que se analiz la
cantidad de palabras contenidas en los textos pertenecientes a los diferentes estratos. A
partir de aqu, en una segunda fase, se fij la muestra definitiva.
Se utilizaron diversos criterios para la estratificacin de la muestra, tales como: la
edad o nivel de escolarizacin (11 a 51 de EGB) (en los primeros cursos de la enseanza
primaria hay coincidencia entre edad y curso escolar, salvo en muy raras excepciones),
el sexo, la clase social (alta, media y baja) y la procedencia geogrfica (rural y urbana) de
los sujetos. En el estudio participaron nios de 120 unidades, de 11 a 51 de EGB, de 26
centros escolares, distribuidos por el mbito geogrfico de las cuatro provincias de
Andaluca Oriental (Almera, Granada, Jan y Mlaga). En la tabla 1 aparece, de una
manera simplificada, la muestra de sujetos por provincia, zona y curso. En todos los
niveles de la variable curso, por provincias y zonas, la proporcin de nios y nias fue
del 50%.
-------------------------
pudimos resolver fue de 313 palabras, lo que representa un 2,55% del total (12.281
palabras). Esta proporcin es an menor cuando sumamos las frecuencias que registran
estas palabras: slo 4.544 frecuencias, es decir un 1,78% del total de frecuencias (255.711)
del diccionario. Adems, hemos de aadir que la ambigedad de los homgrafos se
relaciona, sobre todo, con palabras que resultan ser formas distintas, pertenecientes a
un mismo verbo como, por ejemplo: am-amo; amar-amare. En estos casos, dado el
carcter narrativo de los textos escritos y la rareza que supone para los nios hacer uso
de los futuros de subjuntivo, nos llev a resolver la ambigedad a favor de las formas
acentuadas.
Realizadas estas consideraciones sobre algunos problemas relevantes que afectan a
la realizacin de los recuentos de palabras (Justicia, 1993), estableceremos los lmites
que sirvieron de base para el diccionario silbico. Como ya hemos comentado, en la
primera fase del recuento, obtuvimos 12.281 palabras diferentes, con su frecuencia
correspondiente para cada una de las variables de estratificacin (curso, sexo, clase
social y zona de procedencia). Con este primer diccionario procedimos a la creacin del
diccionario silbico que presentamos en este trabajo.
Hemos de sealar, que el recuento de palabras tuvo una segunda fase que concluy
con el establecimiento del diccionario de frecuencias del vocabulario infantil que
contiene 5.750 voces. La restriccin del nmero original de palabras registradas, ms de
doce mil, hasta las 5.750 entradas finales, se debe al uso de diversos criterios para
reagrupar las distintas formas que presentan las palabras, segn sus caractersticas y
accidentes gramaticales, hasta alcanzar la forma definitiva que, como voces o entradas
lxicas, tienen en el diccionario de frecuencias. Esta segunda fase carece de inters para
el diccionario silbico y el propsito de este artculo.
El recuento de slabas se hizo, pues, a partir del listado de las 12.281 palabras
diferentes o types. Cada palabra (type) tena su frecuencia, es decir, se acompaaba de
un nmero que indicaba las veces (tokens) que la palabra se repeta en los textos. Una
vez dispuestas y ordenadas las palabras con su frecuencia, iniciamos el proceso de
dividir las palabras en slabas. Esta operacin se hizo siguiendo un criterio lingstico
estrictamente ortogrfico. En la primera fase de la fragmentacin de las palabras, las
slabas conservaron su posicin dentro de la palabra. El paso siguiente consisti en
adjudicar a cada slaba, en la posicin que tena dentro de la palabra, la frecuencia total
correspondiente a la palabra. As, por ejemplo, la palabra libreta apareca con 604
frecuencias, se adjudicaban estas frecuencias a LI en posicin 1 inicial; BRE, 604
frecuencias en posicin 2; y TA, con 604 frecuencias en posicin final. Finalmente, se
procedi a la doble ordenacin, alfabtica y por frecuencias, de las slabas, consiguiendo
de esta forma el diccionario silbico. Por consiguiente, se trata, de un recuento tipo token
(Massaro et al., 1980). En estos recuentos la slaba registra la frecuencia acumulada de
todas las palabras donde aparece.
El diccionario silbico contiene distintos ndices para cada slaba, hasta un total de
18. Estos ndices proporcionan dos tipos de informacin concerniente a las slabas. Por
una parte, los ocho primeros campos, que se encuentran a continuacin del registro que
identifica cada slaba, es decir, (desde Pm, P1, P2 ... a P6 y Pf), indican el nmero de
palabras diferentes donde una misma slaba aparece en las distintas posiciones. La
informacin de estos primeros campos no tiene que ver con la frecuencia, sino con la
mayor o menor cantidad de palabras que contienen una determinada slaba y las
diferentes posiciones que suele ocupar dicha slaba dentro de las palabras. As, por
ejemplo, es mucho ms frecuente encontrar la slaba DO en posiciones finales e
intermedias de palabra y menos en posiciones iniciales. Baste recordar, como
justificacin de este hecho, la gran cantidad de adjetivos, participios y gerundios que
concluyen con la slaba DO.
Hay que subrayar que esta informacin, en principio, no tiene mucho que ver con la
frecuencia, sino con la diversidad de palabras y posiciones que suele ocupar una slaba.
Estos ndices proporcionan informacin sobre la dispersin de la slaba en el lxico (en
la muestra de palabras).
Los nueve campos siguientes (desde Fm, F1, F2 ... a F6 y Ff) indican la frecuencia
posicional de la slaba. Ntese que el valor alto de la frecuencia de una slaba puede ser
el resultado o bien de que la slaba pertenezca a una palabra de uso muy frecuente, o
bien de que aparezca en muchas palabras de uso infrecuente.
Dentro de cada conjunto de campos, los subndices se refieren a la posicin ocupada
por la slaba dentro de la palabra. As, "m" indica que la slaba constitua una palabra
monoslaba; los subndices del "1" al "6" indican la aparicin de la slaba en las diversas
posiciones dentro de la palabra, desde la primera a la sexta; y el subndice "f" indica la
aparicin de la slaba en posicin final.
Finalmente, los dos ltimos ndices contienen informacin sobre el nmero total de
palabras diferentes en las que apareci la slaba (TP) y sobre la frecuencia absoluta de
aparicin de cada slaba (TF). Vase, a continuacin, en un ejemplo, el registro
correspondiente a la slaba DO.
Pm
P1
P2
P3
P4
P5
P6
Pf
Fm
F1
F2
F3
F4
F5
F6
Ff
TP
TF
22
33
82
40
680
226
82
214
81
5164
861
5772
Los datos nos indican que la slaba DO aparece una vez como monoslabo, 22 veces,
en posicin inicial de palabra, es decir, hay 22 palabras que contienen la slaba DO en
posicin inicial, con independencia de cual sea la frecuencia de aparicin de esas
palabras; 33 palabras contienen la slaba DO en segunda posicin; 82 palabras, en
tercera posicin; 40 palabras, en cuarta posicin; 3 palabras, en quinta posicin; y 0
palabras, en sexta posicin. 680 palabras contienen la slaba DO en posicin final de
palabra.
Del mismo modo, la frecuencia de la slaba en las distintas posiciones de la palabra
es como sigue: 1 vez, aparece como monoslabo; 226 veces, aparece en posicin inicial;
82 veces, aparece en segunda posicin; y as, sucesivamente, en las distintas posiciones
hasta las 5.164 veces que registra la slaba DO en posicin final.
Por ltimo, aadir que la columna correspondiente a TP indica el total de palabras
donde la slaba aparece en alguna de sus posiciones (la slaba DO aparece en 861
palabras, cantidad equivalente al sumatorio de Pm + P1 + P2... + Pf) y TF indica la
frecuencia absoluta de la slaba DO (5.772 frecuencias, resultantes del sumatorio de las
frecuencias obtenidas por la slaba en las diversas posiciones: Fm + F1 + F2 ... + Ff).
Resultados
El resultado ms importante es el propio diccionario silbico que se aade, como
anexo, al final del artculo. La presentacin que hacemos corresponde al listado de
slabas en orden alfabtico. No obstante, hay otros datos de inters que se derivan del
contenido del diccionario silbico. Uno de ellos se refiere a la composicin silbica de la
muestra de palabras utilizada en el recuento.
------------------------Insertar aqu la tabla 2.
-------------------------
Como puede observarse en los datos de la tabla 2, en el vocabulario usual del nio,
que sirve de fuente para extraer el diccionario silbico, las palabras, al margen de la
frecuencia con que se usan, tienen una longitud variable, es decir, no se ajustan a una
distribucin homognea en funcin del nmero de slabas que poseen. Como es obvio,
esto no es una peculiaridad del lenguaje infantil. Las palabras en la lengua espaola no
se distribuyen proporcionalmente en relacin al nmero de slabas que las forman. En
el conjunto del vocabulario del nio, predominan las palabras de tres, dos y cuatro
slabas, en este orden. La menor representacin en la muestra de palabras corresponde,
por un lado, a las palabras de mayor longitud (cinco, seis y siete slabas) y, por otro, a
los monoslabos.
La distribucin de las palabras cambia, de forma notable, cuando las palabras se
ordenan teniendo en cuenta la frecuencia con que ocurren en muestras amplias del
lenguaje oral y escrito. En este caso, la frecuencia de uso de las palabras es inversamente
proporcional a la longitud: las palabras que ms se utilizan son las palabras de menor
longitud (palabras con una y dos slabas).
En la misma tabla podemos apreciar que las estructuras tienen un peso estadstico
diferente no solo cuando las comparamos entre s sino tambin en funcin del criterio
de comparacin elegido por columna. En efecto, si comparamos unas estructuras con
otras, observamos una distribucin bastante heterognea de los porcentajes
correspondientes a cada estructura, en cada columna. Por consiguiente, es importante
tener en cuenta los criterios de seleccin para valorar adecuadamente el papel de las
slabas cuando decidimos hacer uso de ellas basndonos en los datos estadsticos que
les conciernen. Veamos, con ms detalle, lo que indica cada criterio representado en las
columnas de la tabla.
Los porcentajes de la segunda columna indican el nmero de slabas del diccionario
que corresponde a cada estructura silbica. As observamos, por ejemplo, que del total
Discusin
El diccionario tiene un valor instrumental por cuanto nos permite contrastar
hiptesis sobre la importancia de las slabas en diversos mbitos de la investigacin
lingstica y psicolingstica. En este sentido, lo presentamos bsicamente como un
instrumento de trabajo. Bien es verdad que son escasos los trabajos que presentan este
cmulo de datos, obtenidos con rigor metodolgico. En espaol, no existen apenas
instrumentos de esta naturaleza que nos permitan disponer de datos empricos que
garanticen el control de variables como la frecuencia silbica en los estudios que
utilizan la slaba como estmulo visual o auditivo, en el procesamiento del lenguaje, con
la excepcin del presentado por lvarez et al. (1992a).
El diccionario que presentamos en este trabajo contiene notables coincidencias y
diferencias con el diccionario propuesto por los autores mencionados. A continuacin,
sern objeto de discusin. Para abreviar, llamaremos A a nuestro diccionario y B al
diccionario de lvarez y colaboradores. Las diferencias se agrupan en torno a cuatro
cuestiones: el origen de los diccionarios, la muestra de palabras que sirve de partida
para establecer el recuento de slabas, la consistencia de la distribucin de frecuencias y
la longitud de ambos diccionarios.
El origen de ambos diccionarios es claramente diferente. En A, la muestra de
palabras proviene del vocabulario usual del nio en los primeros aos de escolarizacin
lo que da un carcter particular a las frecuencias observadas. El universo lxico que
sirve de partida para confeccionar el diccionario B recoge muestras de palabras de la
prensa diaria, revistas cientficas y textos de narrativa de autores contemporneos. Por
tanto, el diccionario B refleja un vocabulario ms prximo al lenguaje de los adultos
que al vocabulario que utilizan los nios.
Una segunda diferencia que destacamos se relaciona con la cantidad de palabras
que da lugar al establecimiento de las frecuencias. El diccionario A se construye a partir
del recuento de una muestra de 255.711 palabras frente a las 24.967 de B. Esta diferencia
cuantitativa hace ms homognea y consistente la distribucin de frecuencias que
presenta nuestro diccionario. Es obvio que cuanto mayor sea la muestra de palabras
utilizada para crear un diccionario silbico, tenemos ms probabilidad de aproximarnos
a los lmites del nmero de slabas existente (puesto que se trata de un universo finito).
En este sentido, constatamos que la longitud de ambos diccionarios es notablemente
diferente, a pesar de que en el diccionario B la muestra de palabras proviene del
lenguaje de los adultos. En A, obtuvimos 1.148 slabas. En B aparecen 959. Ahora bien,
esta diferencia no es slo cuantitativa pues no todas las slabas de A se hayan
contenidas en B, ni todas las de B se encuentran en A. Los diccionarios coinciden en 832
slabas, lo que representa el 86,75 % del contenido del diccionario B, y el 72,47 % del
contenido de nuestro diccionario. Hay, por consiguiente, 127 slabas en el diccionario B
no contenidas en A y 316 que contiene A que no aparecen en B.
Otro problema distinto es el relativo a la correspondencia que manifiestan entre s
las distribuciones de frecuencias contenidas en ambos diccionarios. A este respecto
hicimos un anlisis de correlaciones comparando el rango de frecuencia que ocupan las
slabas que aparecen en los dos diccionarios. La correlacin entre ambos diccionarios es
de 0.733 (Correlacin significativa, 0.0001)
La coincidencia entre ambos diccionarios es, por tanto, alta. En efecto, no slo los
dos diccionarios contienen un elevado nmero de slabas en comn sino que adems
las slabas ocupan un rango de frecuencia semejante en ambos diccionarios.
De este anlisis se desprende una interesante conclusin: el conjunto de slabas
conocido por nios y adultos, sus "silabarios", por usar un trmino propuesto por
Levelt (1989), son bsicamente idnticos. La diferencia en el tamao de las muestras a
partir de las cuales se construyeron los diccionarios A y B impide establecer esta
conclusin con toda seguridad, pero la gran similitud existente entre ambos sugiere que
una gran mayora de las slabas necesarias para un dominio adulto de la lengua son
adquiridas durante la edad escolar. La ampliacin del vocabulario que se da con la
edad y la educacin durante la vida adulta descansa, pues, ms en la adquisicin de
palabras que son combinaciones novedosas de slabas ya conocidas que en la de
palabras compuestas de slabas nuevas.
Este fenmeno tiene perfecto sentido dentro de la organizacin jerrquica del
lenguaje. Los lenguajes alfabticos se estructuran jerrquicamente para conseguir
representar un mximo de elementos lxicos con un mnimo de elementos sublxicos.
La organizacin serial del lenguaje se da a dos niveles, lo que Tzeng y Wang (1984)
llaman la dualidad de patrones. A un primer nivel, un conjunto fijo de elementos
sublxicos como fonemas y slabas se organizan en series que definen palabras; a un
segundo nivel, las palabras se organizan en oraciones. Mediante el uso de reglas que
controlan el orden de los elementos a los dos niveles, fonolgicas en el primero y
sintcticas en el segundo, el lenguaje permite al hablante nativo una increble
flexibilidad y productividad a la vez que reduce el nmero de representaciones que se
necesita almacenar en memoria.
Como ltimo comentario respecto a la comparacin de ambos diccionarios, en
cuanto a la presentacin tambin se observan ciertas diferencias: en A no hacemos
distincin entre grafemas silbicos pertenecientes a palabras de clase abierta o cerrada,
ni tampoco proporcionamos el dato de las frecuencias posicionales ponderadas como
ocurre en B. En contrapartida, los campos basados en nmero de palabras diferentes
que contienen una slaba dada aportan una interesante informacin que puede ser
relevante para valorar recientes propuestas sobre la definicin de los vecindarios
(neigborhoods) de palabras espaolas impresas en trminos de slabas compartidas
(Carreiras et al., 1993). Estos autores demostraron que palabras con slabas de mayor
frecuencia son reconocidas y nombradas con latencias mayores, e interpretaron este
dato como resultado de la activacin de un mayor nmero de vecinos lxicos, que
compiten con la palabra presentada. Sin embargo, esta explicacin puede implicar dos
factores diferentes: es posible que una slaba de alta frecuencia active muchos
candidatos lxicos diferentes que comparten esa slaba, o slo active uno (o pocos) de
mayor frecuencia que la palabra presentada. El origen del fenmeno puede ser
evaluado gracias a la existencia, en el diccionario silbico presentado aqu, de campos
relativos al nmero de palabras que contienen una slaba y de campos relativos a la
frecuencia con la que se da esa slaba (fruto de sumar las frecuencias de las palabras en
las que aparece la slaba).
Para finalizar, informamos que el diccionario, presentado en este artculo, se haya
disponible en una base de datos con formato dbaseIV.
Bibliografa.
lvarez, C. J., Carreiras, M. y De Vega, M. (1992a). Estudio estadstico de la
ortografa castellana (1): La frecuencia silabica. Cognitiva, 4, 75-105.
lvarez, C. J., Carreiras, M. y De Vega, M. (1992b). Estudio estadstico de la
ortografa castellana (2): Frecuencia de bigramas. Cognitiva, 4, 107-125.
Azorn Poch (1972). Curso de muestreo y aplicaciones. Madrid: Aguilar.
Besner, D. (1990). Does the reading system need a lexicon? En D. Balota, G.B. Flores
d'Arcais y K. Rayner (Eds.), Comprehension processes in reading. Hillsdale, NJ:
LEA.
Bradley, D.C., Snchez-Casas, R.M. y Garca-Albea, J.E. (1993). The status of the
syllable in the perception of spanish and english. Language and Cognitive
Processes, 8, 197-233.
Carreiras, M., lvarez, C. J. y De Vega, M. (1993). Syllable frequency and visual
word recognition in Spanish. Journal of Memory and Language, 32, 766-780.
Clark, H.H. y Clark, E.V.(1977). Psychology and Language. An introduction to
psycholinguistics. New York: Harcourt Brace Jovanovich.
Coltheart, M. (1978). Lexical access in simple reading tasks. En G. Underwood (Ed.),
Strategies of information processing. London: Academic Press.
Cutler, A., Mehler, J., Norris, D. y Segui, J. (1983). A language-specific
comprehension strategy. Nature, 304, 159-160.
Cutler, A., Mehler, J., Norris, D. y Segui, J. (1986). The sllable's differing role in the
segmentation of French and English. Journal of Memory and Language, 25, 385-400.
De Vega, M., Carreiras, M., Gutirrez, M. y Alonso, M.L. (1990). Lectura y
comprensin: una perspectiva cognitiva. Madrid: Alianza Editorial.
De Vega, M., Carreiras, M. (1989). The role of graphemic frequency in visual word
processing. Comunicacin en 30 European Conference for Learning and Instruction.
Madrid.
Defior, S., Justicia, F. y Martos, F. (En prensa). The influence of lexical and sublexical
variables in normal and poor Spanish readers. En C.H. Leong & R. M. Joshi
(Eds.), Cross-Language Studies of Learning to Read and spell: Phonologic and
Orthographic Processing. Nato Advanced Study Institute.
Elman, J.L. y McClelland, J.L. (1984). Speech and cognitive processe: The interactive
activation model. En N. Lass (Ed.), Speech and Language. Vol. 10 (337-374). New
York: Academic Press.
Frith, U. (1980). Cognitive processing in spelling. London: Academic Press.
Garca-Albea, J.E. (1991). Segmentacin y acceso al lxico en la percepcin del
lenguaje. En J. Mayor y J.L. Pinillos (Eds.), Tratado de Psicologa General, vol. 6.
Comunicacin y Lenguaje. Madrid: Alhambra.
Goswami, U. y Bryant, P.E. (1990). Phonological Skills and Learning to Read. London:
Earlbaum.
Grosjean, F. (1980). Spoken word recognition processes and the gating paradigm.
Paap, K.R. y Noel, R.W. (1991). Dual-route models of print and sound: Still a good
horse race. Psychological Research, 53, 13-24.
Pisoni, D.B. y Luce, P.A. (1987). Acoustic-phonetic representation in word
recognition. En U.H. Fraunfelder y L.K. Tyler (Eds.), Spoken word recognition.
Cambridge: MIT Press.
Prinzmetal, W., Treiman, R. y Rho, S. (1986). How to see a reading unit. Journal of
Memory and Language, 25, 461-475.
Rapp, B.C. (1992). The nature of sublexical ortography organization: The bigram
trough hypothesis examined. Journal of Memory and Language, 31, 33-53.
Santiago, J., Justicia, F., Palma, A., Huertas, D. y Gutirrez, N. (En prensa). LEX I
and II: Two Lexical Databases for Psycholinguistic Research in Spanish. Behavior
Research Methods, Instruments, & Computers.
Segui, J. (1984). The syllable: A basic unit in speech perception?. En H. Bouma y
D.G. Bouwhuis (Eds.), Attention and Performance, vol. 10, Language control
mechanisms. New York: LEA.
Segui, J., Dupoux, E. y Mehler, J. (1990). The role of the syllable in speech
segmentation, Phoneme identification, and lexical access. En G.T.M. Altmann
(Ed.), Cognitive models of speech processing: Psychology and Computational
Perspectives. Cambridge: MIT Press.
Seidenberg, M.S. (1987). Sublexical structures in visual word recognition: Access
units or ortographic redundancy? En M. Coltheart (Ed.), Attention and
Performance XII: Reading. Hillsdale, NJ: LEA.
Seidenberg, M.S. (1989). Reading complex words. En G.N. Carlson y M.K.
Tanenhaus (Eds.), Linguistic structure in language processing. Amsterdam: Reidel.
Seidenberg, M.S. y McClelland, J.L. (1989). A dristibuted, developmental model of
word recognition and naming. Psychological Review, 96, 523-568.
Stemberger, J. (1989). Speech errors in early child language production. Journal of
Memory and Language, 28, 164-188.
Studdert-Kennedy, M. (1974). The perception of speech. En T.A. Sebeok (Ed.),
Current trends in linguistics, XII. La Haya: Mouton.
Taft, M. (1979). Lexical access via in an orthographic code: The Basic Orthographic
Syllabic Structure (BOSS). Journal of Verbal Learning and Verbal Behavior, 20, 2139.
Treiman, R. (1985). Onsets and rimes as units of spoken syllables: Evidence from
children. Journal of Experimental Child Psychology, 39, 161-181.
Treiman, R. (1992). The role of intrasyllabic units in learning to read and spell. En
Gough, P.B., Ehri, L.C. y Treiman, R. (eds.), Reading Acquisition. Hillsdale, NJ: LEA.
Treiman, R. y Zukowski, A. (1988). Units in reading and spelling. Journal of Memory and
Language, 27, 466-477.
Tzeng, O. y Wang, W. (1984). Search for a common neurocognitive mechanism for
language and movement. American Journal of Physiology: Regulatory, Integrative and
Comparative Physiology, 246, R904-R911.
Van Orden, G.C., Pennington, B., y Stone, G. (1990). Word identification in reading
and the promise of subsymbolic psycholinguistics. Psychological Review, 97, 488522.
Viso, S. del (1990). Errores espontneos del habla y produccin del lenguaje. Tesis
Doctoral. Universidad Complutense.
Tabla 1.
Muestra de sujetos por estratos de provincia, zona y cursos.
Provincia
Zona
Curso
11
Almera
Granada
Jan
Mlaga
Total
21
Total
31
41
51
Urbana
40
36
26
38
44
184
Rural
28
26
30
18
34
136
Urbana
42
28
50
70
80
270
Rural
52
30
36
48
66
232
Urbana
44
38
34
40
66
222
Rural
40
26
44
62
70
242
Urbana
116
122
112
164
126
640
Rural
40
20
48
70
62
240
402
326
380
510
548
2.166
Tabla 2.
Nmero de palabras diferentes y frecuencia acumulada segn el nmero de slabas.
__________________________________________________________________________
Palabras
Frecuencias
Monosil
2 Sil
3 Sil
4 Sil
5 Sil
180
3.419
5.169
2.837
612
56
12.281
14.012 1.548
95
13
255.713
92.702
100.729 46.614
6 Sil 7 Sil
Total
__________________________________________________________________________
Tabla 3.
Tipos de estructura silbica.
________________________________________________________________________
Estructura %
3N
3TP
3TF
________________________________________________________________________
CVC
41,20
473
25,43
9.492
20,41
101.756
CVVC 14,90
171
2,35
877
2,10
10.473
CVV
9,84
113
4,15
1.548
4,93
24.583
CV
9,58
110
53,11
19.829
53,37
266.034
CCVC
9,06
104
1,24
464
1,13
5.631
CCV
5,05
58
3,96
1.479
3,48
17.325
VC
3,48
40
4,20
1.568
6,52
32.488
CCVV
2,09
24
0,17
63
0,04
213
CCVVC 1,13
13
0,04
17
0,02
97
CVVVC 0,78
0,05
20
0,05
228
CVCC
0,70
0,06
22
0,02
82
CVVV
0,61
0,08
29
0,07
332
0,52
5,00
1.865
7,79
38.848
VV
0,35
0,08
29
0,05
269
VVC
0,35
0,01
0,01
50
VCC
0,26
0,05
18
0,00
31
CCVCC 0,09
0,02
0,00
24
________________________________________________________________________
Total 100,00
1.148
100,00
37.333
100,00
498.464
________________________________________________________________________
V = Vocal. C= Consonante.
20 columna = % de slabas del diccionario que presenta cada estructura.
40 columna = % de posiciones que acumula la estructura.
60 columna = % de frecuencias que corresponde a cada estructura.
Table headings.
Table 1. Description of the sample by province of procedence, rural or
urban area, and school year.
Table 2. Number of different words and total frequency as a function of
number of syllables.
Table 3. Types of syllable structure.
SLABA
Pm
P1
P2
P3
P4
P5
P6
Pf
Fm
F1
F2
F3
F4
F5
F6
Fm
TP
TF
(Pm, P1, P2,...a Pf=Aparicin de la slaba en cada posicin; Pm=Aparicin como monoslabo; Pf=Aparicin en posicin final.
(Fm, F1, F2,...a Ff=Frecuencia slaba por posiciones; Fm=Frecuencia como monoslabo; Ff=Frecuencia en posicin final. TP=Total de posiciones. TF=Frecuencia total de la slaba.
922
19
64
16
262
5007
7769
99
209
27
3323
1287
AB
16437
8
ABS
AC
22
58
26
64
AD
11
32
11
32
AH
12
12
AI
118
118
AIS
AL
112
1751
1161
116
2920
AM
22
22
AN
66
93
361
25
25
388
171
803
AR
65
19
1704
15
64
93
1786
AS
31
60
86
362
91
448
AT
11
12
AU
22
142
22
142
AUN
46
46
AUS
AY
BA
129
88
30
172
929
1105
113
13
1473
428
3634
BAC
BAI
15
102
15
102
BAIS
BAL
104
10
112
BAM
BAN
20
14
96
114
35
356
131
506
BAR
18
64
423
19
19
38
530
BAS
14
38
62
21
101
BAU
BE
42
58
13
307
649
10
155
121
1122
BEI
BEIG
BEIS
BEL
11
13
BEN
57
10
58
BER
19
26
180
26
207
BES
90
94
BI
27
63
12
331
889
20
32
108
1273
BIA
20
24
BIAN
BIAR
BIAS
BIE
25
10
28
BIEN
495
20
10
847
1372
BIER
36
11
38
BIL
BIO
12
93
14
97
BIOS
22
22
BIR
131
12
138
BIS
BIZ
BLA
16
46
58
18
104
BLAN
173
13
185
BLAR
45
45
BLAS
BLE
41
42
283
48
325
BLES
15
72
15
72
BLI
14
14
BLIA
BLIO
24
24
BLO
14
240
255
BLOC
78
33
111
6
BLON
BLOR
BLOS
32
32
BLU
58
58
BO
71
44
10
24
2619
506
17
521
149
3663
BOI
BOL
350
700
12
1050
BOM
11
211
14
215
BON
53
60
BOR
36
42
BOS
194
38
12
233
BOT
BRA
20
11
18
85
47
21
232
61
394
BRAL
BRAN
11
27
14
32
BRAR
36
11
43
BRAS
41
41
BRE
21
28
701
1079
51
1783
BREN
15
15
BRES
12
210
13
211
BRI
34
46
424
47
481
BRIE
BRIEN
BRIL
BRIN
16
16
BRIO
26
26
BRIOS
BRIR
10
12
BRIZ
BRO
11
25
1089
20
1116
BRON
BROS
210
210
BRU
46
51
BU
28
41
299
427
19
76
752
BUE
462
337
18
811
BUEN
34
34
BUEY
14
14
BUI
BUL
BUM
13
15
BUN
17
25
BUR
BUS
19
105
16
93
26
214
BUZ
CA
369
176
69
23
118
6541
1218
138
36
1367
756
9301
CAC
CAI
CAL
29
325
10
38
351
CAM
28
1236
11
32
1247
CAN
59
43
10
27
372
123
15
83
140
594
CAP
CAR
53
28
14
34
1620
47
16
189
130
1873
CAS
27
52
189
323
79
512
CAU
21
21
CE
81
101
22
46
493
1510
190
718
252
2914
CED
CEI
86
86
CEIS
CEL
36
36
CEN
10
24
21
30
73
291
59
399
CEP
CER
15
24
23
205
63
326
65
597
1100
CES
31
56
33
1011
37
CEU
CHA
20
44
11
45
370
210
16
650
122
1248
CHAM
15
15
CHAN
69
39
16
119
CHAR
10
11
26
25
63
31
117
CHAS
24
706
24
706
CHE
22
25
119
45
1926
55
2090
CHEN
20
22
CHES
191
191
CHEZ
CHI
42
33
310
188
80
507
CHIM
CHIN
10
CHIS
10
17
27
CHO
17
52
117
29
1230
80
1380
CHON
58
58
CHOS
16
537
16
537
CHU
18
12
52
68
30
120
CHUE
15
20
CHUM
CHUN
CHUS
CI
38
103
94
16
250
1085
324
41
255
1713
CIA
10
37
36
12
96
57
153
CIAL
11
14
CIAN
CIAR
CIAS
15
78
15
78
CIE
10
18
135
88
10
12
38
254
CIEM
13
14
CIEN
19
14
27
29
88
37
46
187
CIER
36
36
CIES
CIL
18
23
CIN
219
15
15
238
CINC
CIO
28
40
12
39
175
236
43
244
119
698
CION
88
342
88
342
CIOS
13
60
13
60
CIR
112
16
45
19
179
CIS
29
47
CIU
383
383
CLA
18
583
14
29
605
CLE
226
39
273
CLES
CLI
10
CLIP
CLIS
CLO
15
CLU
19
19
CLUB
CO
322
91
18
121
6496
349
56
1710
553
8613
110
COL
20
79
28
24
COM
70
16
392
19
86
411
CON
157
46
1534
597
389
89
212
2609
CONS
14
27
14
27
COP
17
17
COR
42
17
393
33
61
433
COS
14
14
51
55
65
334
79
454
COZ
CRA
CRAN
CRE
30
193
126
39
319
CRES
CREZ
CRI
23
57
196
31
253
CRIA
23
23
CRIAN
CRIAR
CRIE
CRIP
CRIS
10
199
10
199
CRO
20
20
10
40
CROS
CRU
15
63
15
63
CRUS
CRUZ
139
139
CU
52
93
24
371
246
118
171
741
CUA
16
11
883
49
32
943
CUAL
20
14
34
CUAN
1179
1179
CUAR
10
114
10
114
CUAS
CUE
74
415
11
489
CUEL
CUEN
323
60
16
385
CUER
129
16
11
145
CUES
10
21
21
13
42
CUI
20
95
21
96
CUL
11
20
55
22
82
CUM
51
51
CUN
CUNS
CUO
CUR
103
113
14
216
CUS
CUZ
DA
22
84
53
16
255
130
140
359
144
44
11
1779
436
2607
DAC
36
36
DAD
56
713
56
713
DAL
77
80
DAN
13
10
17
97
23
50
19
95
47
284
DAP
DAR
11
11
28
54
49
14
16
167
59
300
DAS
139
487
140
493
DE
209
81
64
49
4864
1060
458
165
17
1298
412
7863
DEIS
DEL
686
22
10
716
DEN
17
56
30
160
36
258
DER
15
15
149
10
117
37
276
DES
126
37
718
438
168
1162
DEZ
DI
116
112
69
17
24
2716
547
201
21
12
322
3521
DIA
13
12
31
42
22
94
43
189
DIAL
DIAN
17
29
DIAR
82
82
DIAS
16
16
DIC
111
111
DIE
12
14
67
33
28
72
37
201
DIEN
59
75
25
20
162
DIES
DIEZ
57
57
DIG
DIN
135
135
DIO
30
114
27
285
43
434
DIOS
37
105
142
DIR
22
13
28
DIS
50
176
56
193
DIUR
DIZ
22
22
DO
22
33
82
40
680
226
82
214
81
5164
861
5772
DOC
12
12
DON
28
243
27
39
15
337
DOR
12
12
77
116
74
687
101
877
DOS
185
414
952
188
1375
DOY
10
10
DRA
13
26
185
23
222
DRAL
13
13
DRAN
DRAR
DRAS
20
80
100
DRE
10
982
13
994
DREN
DRES
197
197
DREZ
DRI
24
153
80
32
233
DRID
DRIL
DRIR
DRO
21
497
11
521
DRON
33
35
DROS
45
45
DRU
DU
15
36
15
92
73
52
67
220
DUC
15
18
DUE
24
24
DUEN
DUER
24
24
33
DUL
30
DUM
DUN
DUOS
DUR
24
24
DUS
19
19
165
24
11
31
2588
42
80
204
2746
EH
EIS
2
7331
EL
7331
EM
48
265
48
265
EN
210
12
4222
1361
92
223
5675
ER
103
16
115
ES
343
2082
4775
177
357
7045
540
ET
540
EU
EX
73
241
74
242
FA
45
22
10
365
52
12
292
81
721
FAC
38
40
FAI
FAL
15
208
17
212
310
FAN
68
40
202
15
FAR
FAS
589
592
FAU
FE
23
25
499
221
39
110
64
875
FEC
13
25
13
25
FEL
17
17
FEN
16
10
17
FER
32
37
FES
FI
30
36
32
148
113
108
82
107
451
FIA
FIAN
FIE
20
26
FIEL
FIEN
FIER
4
87
FIES
87
FIL
FIN
281
296
FIR
FLA
25
10
27
FLAN
FLAU
22
22
FLE
19
29
FLES
FLO
27
882
27
882
FLOR
249
252
FLU
FLUEN
FLUO
FO
25
136
149
844
42
1134
FOM
15
15
FON
36
43
FOR
14
11
73
12
11
27
96
FOS
24
27
FRA
12
11
30
14
41
FRAC
FRAG
FRAN
10
12
FRAS
FRAY
FRAZ
FRE
13
53
21
63
FREN
11
20
FRES
34
11
41
206
FRI
198
15
FRIA
FRIAR
FRIE
FRIR
FRO
FRON
FRU
168
12
12
180
FU
13
21
44
46
34
90
FUC
FUE
471
348
11
823
FUEN
50
50
FUER
70
72
FUI
364
249
613
FUIS
FUN
12
21
20
20
42
FUR
19
19
FUT
112
112
GA
76
143
42
48
1970
805
66
474
312
3318
GAD
GAIS
GAL
GAM
13
13
GAN
10
21
23
27
177
11
137
62
352
GAR
14
26
27
61
14
449
54
551
GAS
13
27
11
21
175
43
209
GAZ
GE
18
22
11
12
35
53
26
51
63
165
GED
GEL
18
18
GEN
328
10
15
101
20
458
GER
21
96
16
124
GES
12
GI
17
23
18
70
59
32
38
63
204
GIA
GIAN
GIAR
GIAS
GIE
33
38
12
GIEN
GIL
GIM
27
27
GIO
637
11
643
GION
21
21
GIOS
18
18
GIP
GIR
GIS
GLA
274
18
289
GLAN
GLAR
11
GLAS
14
14
GLE
65
67
GLES
17
17
GLIOS
GLO
57
62
GLON
33
33
GLOS
GO
33
16
69
1363
93
10
1904
124
3370
GOL
12
21
GON
GOR
51
53
GOS
23
12
429
27
441
GRA
31
21
12
124
60
892
32
72
1111
GRAN
49
534
12
13
597
GRAR
GRAS
GRE
25
289
15
316
GRES
47
47
GRI
14
87
54
39
24
180
GRIE
GRIL
GRIS
16
16
GRO
61
147
14
209
GROS
21
21
GRU
37
37
GRUE
10
10
GU
39
11
31
561
40
54
632
GUA
136
64
716
25
927
GUAL
45
45
GUAN
35
41
GUAR
20
69
24
76
GUAS
58
58
GUAU
GUE
14
15
45
195
13
119
39
372
GUEN
10
10
GUES
GUI
13
17
50
100
35
40
187
GUIA
GUIAR
GUIE
12
13
GUIEN
120
13
136
GUIN
GUIO
23
23
GUION
GUIR
17
22
GUM
GUN
13
122
79
16
201
GUO
GUOS
GUR
GUS
13
698
14
699
GE
33
37
GEN
GI
HA
99
204
1924
15
109
2148
HAL
12
12
HAM
59
59
104
HAN
104
HAR
HAS
29
171
200
HAY
1515
1515
HAZ
HE
36
178
232
47
44
457
HEM
12
12
HER
22
483
22
483
HI
38
540
21
37
47
598
HIA
HIE
164
164
HIER
190
190
HIN
HIP
HIS
31
32
HO
24
21
839
122
19
13
50
993
HOL
HOM
649
649
HON
26
27
HOR
14
150
15
151
HOS
30
32
HOY
74
74
HOZ
HU
31
153
32
154
HUE
11
187
13
190
HUER
32
32
HUES
HUIR
HUM
HUN
17
31
17
31
HUR
47
26
570
204
17
33
86
ID
826
2
IM
24
74
24
74
IN
155
594
155
594
INS
11
24
11
24
IR
281
28
54
13
372
IS
40
49
10
92
IZ
43
48
JA
21
47
25
58
12
370
652
51
1325
155
2413
JAL
JAN
23
39
16
69
JAR
10
194
13
96
26
305
JAS
35
442
36
443
JAU
48
49
JAZ
14
14
JE
32
19
19
27
209
84
224
72
544
JEM
107
107
JER
353
30
237
620
JES
61
61
JI
23
69
42
26
35
137
JIEN
JIL
JIN
15
15
JIR
JIS
JO
52
28
18
1920
74
1974
JON
98
98
JOR
136
143
JOS
25
464
25
464
JU
35
839
10
43
854
JUA
JUE
292
293
JUEZ
JUI
JUN
12
47
14
16
64
JUS
KA
KI
29
35
KIN
KIOS
LA
81
86
63
10
155
6821
2107
278
288
15
1495
396
11004
LAI
LAM
223
39
262
LAN
14
17
14
13
42
72
43
47
60
206
LAR
27
89
14
126
43
234
3123
LAS
90
2759
10
15
339
94
LAU
LE
61
130
41
68
1491
1001
1990
414
171
300
306
5367
LEC
21
28
13
54
LEN
11
17
126
60
176
38
363
LEP
LER
11
20
10
31
LES
14
111
165
22
1336
126
1523
LET
29
29
LETS
LEY
LI
41
125
63
10
2075
1687
466
27
52
243
4307
LIA
160
170
LIAN
LIAS
36
36
LIE
33
48
81
LIEN
44
11
54
LIES
LIM
17
87
20
92
LIN
10
44
15
16
61
LIO
125
128
LIOS
LIP
LIR
73
78
103
LIS
82
17
LIZ
81
81
LLA
29
18
13
119
495
39
18
11
2713
185
3276
LLAIS
LLAN
35
10
15
49
LLAR
12
75
14
77
LLAS
60
380
60
380
LLE
59
23
16
905
108
70
229
104
1312
LLEN
LLER
10
10
LLES
35
35
LLI
19
11
242
42
318
31
602
LLIN
LLO
17
108
158
41
11
22
1454
141
1686
LLON
269
269
LLOS
46
361
46
361
LLU
75
75
LLUE
84
86
LO
27
67
22
142
1314
369
845
185
1844
260
4558
430
LOJ
430
LOM
LON
11
66
583
22
655
LOR
344
345
LOS
91
3767
361
92
4128
LOZ
LU
28
36
297
77
65
376
LUA
LUD
LUE
261
261
LUM
13
15
109
15
124
LUS
LUZ
240
241
MA
200
145
35
79
3742
2184
638
2445
463
9018
MAG
MAL
13
59
23
161
19
249
486
MAN
61
10
15
368
21
88
91
MAR
37
14
310
265
109
61
694
MAS
10
39
888
19
301
51
1209
ME
108
70
29
75
1940
2622
674
162
280
284
5680
MEIS
MEM
MEN
11
26
42
26
11
25
117
217
56
19
10
95
129
539
MER
11
19
33
54
330
34
419
MES
31
31
14
10
76
MEZ
MI
69
115
43
2079
371
1902
151
26
236
4534
MIA
MIAN
MIAU
MIE
34
30
64
MIEL
50
50
MIEN
11
15
11
37
66
37
22
40
164
MIER
15
46
61
MIL
65
74
MIM
MIN
105
115
MIO
44
91
10
135
MION
267
267
MIOS
MIR
44
46
467
MIS
374
75
17
10
MIX
12
12
MO
105
44
25
66
660
148
51
1357
241
2217
MOI
MOL
MON
34
364
12
85
44
464
MONS
25
25
MOR
15
34
39
23
82
MOS
373
60
14
2734
383
2808
MU
54
3038
26
67
3068
MUE
15
268
16
269
MUER
92
11
96
MUES
MUL
18
19
MUN
148
153
MUR
11
11
MUS
MUT
MUY
2077
2077
NA
71
75
66
44
184
1206
251
394
123
5894
443
7872
NAL
14
68
17
72
NAM
NAN
17
12
12
55
33
80
NAR
34
105
42
116
NAS
88
10
1133
95
1150
NAU
NAZ
NE
34
63
64
33
329
850
212
10
960
202
2363
NEC
NEIS
NEL
NEN
511
10
519
NER
19
43
124
32
178
NES
140
1181
141
1182
NET
NEU
NEZ
NI
16
108
65
18
2315
2387
178
12
200
4918
NIA
11
12
NIAS
NID
NIE
211
50
18
267
NIEN
23
26
NIL
NIN
51
55
NIO
17
12
21
NION
11
11
NIOS
NIR
23
26
86
NIS
74
13
NIZ
NO
25
57
18
143
1918
590
125
34
2698
245
5366
NOC
NOM
121
129
NOR
32
11
48
NOS
125
929
1054
130
1988
NOZ
NU
14
16
460
59
37
527
NUA
14
18
NUAL
NUE
147
12
154
NUES
163
163
NUEZ
NUIR
NUL
NUN
11
76
22
12
98
NUO
NUS
23
15
33
286
21
1500
77
1814
AC
AL
AN
14
10
40
18
65
AR
61
55
16
122
AS
14
282
14
282
15
405
66
27
27
498
EN
14
11
19
IL
27
27
IR
IS
10
26
136
41
1261
45
1438
OL
13
13
ON
14
14
OR
84
84
726
OS
12
726
12
UE
43
46
149
24
51
342
2132
132
11
1067
233
3684
OB
10
17
10
17
OBS
OC
17
17
OH
14
14
OI
OL
16
30
17
31
OM
ON
28
363
393
OP
OR
19
39
22
45
OS
22
34
28
146
32
208
PA
253
140
46
10
28
6214
1564
96
20
801
477
8695
PAC
PAI
15
15
PAIS
PAL
30
12
43
PAM
PAN
14
92
583
44
32
730
PAR
27
22
10
222
40
56
22
64
345
PAS
22
20
151
131
42
282
PAZ
14
11
25
PE
202
121
36
13
4093
958
102
83
375
5239
PEC
PED
23
23
PEI
12
48
14
50
PEL
515
515
PEN
22
143
27
22
42
196
PER
79
22
944
66
103
1014
PES
28
179
12
32
196
PEZ
122
122
PI
101
79
11
889
436
29
194
1365
PIA
14
30
12
45
PIAN
11
PIAR
16
24
PIAS
PIE
11
55
193
80
21
331
PIEL
31
31
PIEN
19
120
11
142
PIER
86
14
11
100
PIES
46
47
PIN
45
177
14
49
198
PING
PIO
70
11
73
PION
PIOS
35
35
PIS
12
191
15
194
PIZ
1360
1360
PLA
30
608
40
628
PLAC
PLAN
15
339
21
348
PLAR
PLAS
58
66
PLAU
PLE
50
13
60
PLEN
PLES
PLI
18
36
10
22
47
PLIA
PLIE
PLIO
PLIOS
PLO
13
31
110
22
152
PLOS
PLU
105
107
PO
113
49
14
27
1157
116
194
1409
204
2878
POL
13
13
PON
13
45
26
26
27
101
POR
36
23
317
984
132
62
1445
POS
13
67
107
23
175
PRA
13
41
83
26
18
150
PRAC
15
15
PRAN
PRAR
18
46
64
PRAS
PRE
69
20
230
29
203
91
462
PREN
35
133
36
139
PRES
15
PRI
19
603
12
23
615
PRIE
PRIN
138
138
PRIS
PRO
78
17
368
32
42
98
445
PRON
107
107
PRU
PRUE
PSI
PU
40
28
401
75
70
480
PUE
13
702
14
703
PUEN
23
23
PUER
695
11
701
552
PUES
116
48
16
372
14
PUG
PUL
11
107
14
110
517
PUN
118
393
16
PUR
PUS
PUZ
QUE
53
48
10
33
4108
488
671
14
1399
147
6682
52
QUEL
52
QUEN
QUES
12
54
14
58
QUI
30
85
115
469
23
91
133
698
QUIA
10
QUIAL
QUIAR
QUIAS
QUID
QUIE
13
272
16
281
QUIEN
58
58
QUIER
13
QUIN
62
64
QUIOS
QUIS
10
RA
82
144
88
26
326
923
1211
369
40
6233
666
8776
RAC
RAD
15
1
RAL
13
99
17
104
RAM
RAN
19
11
87
240
37
236
118
515
RAP
RAR
10
31
11
158
49
180
RAS
125
16
453
130
471
RAX
RAY
RAZ
RE
295
86
58
10
61
1881
567
149
21
342
512
2962
REC
16
40
12
56
RED
12
259
271
REI
52
52
REIS
REL
REN
16
40
69
20
55
36
186
REP
37
37
RER
14
14
RES
51
97
179
15
1640
152
1835
REU
15
15
REY
100
100
REZ
RI
24
103
161
65
426
602
820
127
362
1985
RIA
19
176
25
191
RIAL
RIAS
12
39
12
39
RIE
32
18
13
50
RIEN
27
10
40
RIES
RIL
RIN
15
26
10
47
RIO
53
43
873
63
924
RION
RIOR
RIOS
15
65
15
65
RIR
27
28
RIS
10
16
10
21
41
RIZ
156
156
RO
71
18
33
179
981
81
82
3051
301
4195
ROI
ROL
18
18
ROM
14
43
14
43
RON
238
19
1425
245
1452
554
ROS
89
546
94
ROZ
RRA
38
24
29
308
41
656
91
1005
RRAL
16
16
RRAN
15
36
10
25
48
RRAR
23
26
RRAS
13
12
68
19
80
RRE
64
10
324
12
93
81
429
RREN
24
27
RRER
100
100
RRES
15
12
22
RRI
44
29
146
60
75
210
RRIA
RRIE
RRIEN
83
83
RRIES
RRIL
RRIO
39
45
RRION
34
37
RRIOS
RRIR
RRO
29
10
36
103
13
1666
75
1782
274
RRON
10
273
11
RROR
RROS
16
171
16
171
RROZ
30
30
RRU
RRUI
RRUM
RRUP
RU
13
62
18
20
89
RUE
73
13
86
RUI
41
41
RUM
RUS
SA
116
112
24
101
1571
480
72
4519
361
6652
1
SAD
SAI
SAL
49
42
256
55
311
SAM
SAN
11
12
14
107
30
10
78
41
246
SAR
11
16
58
16
122
36
198
SAS
49
12
963
52
978
SAU
SE
118
102
27
154
4133
864
549
111
10
969
406
6636
SEC
43
44
SED
14
14
SEIS
71
13
86
SEL
53
54
SEM
13
39
16
46
SEN
28
16
12
72
43
15
57
131
SEP
12
13
SER
12
176
170
10
14
22
370
230
SES
14
228
16
SEX
10
10
SEY
336
336
SEYS
17
17
SI
44
75
69
453
2166
337
176
12
246
205
3394
SIA
231
14
81
13
326
SIAS
10
SIE
94
73
12
174
SIEM
211
211
SIEN
49
14
12
63
SIER
SIES
11
13
SIG
SIL
20
13
27
SIM
21
21
172
SIN
152
11
10
SIO
11
28
19
45
SION
24
444
24
444
SIR
96
96
SIS
12
18
17
26
SO
71
25
10
101
620
541
83
1613
208
2865
SOIL
SOIS
SOL
10
317
59
13
384
SOM
73
10
78
SON
763
23
11
794
SOR
10
41
157
16
202
SOS
49
229
52
232
SOY
85
85
SU
66
21
792
283
70
16
95
1161
SUA
11
14
SUB
14
21
14
21
SUE
10
379
10
379
SUEL
13
14
SUER
13
13
SUI
SUL
13
16
SUN
SUR
SUS
13
17
387
35
61
31
483
TA
68
308
162
29
377
374
3339
376
76
6909
945
11077
TAC
TAD
35
35
TAIS
TAL
15
246
18
257
TAM
897
34
12
931
TAN
39
16
47
149
105
136
57
532
111
981
TAR
15
37
21
66
205
73
41
17
457
145
793
TAS
172
59
1768
179
1827
TAU
TAZ
TE
77
185
60
315
288
1563
1459
806
24
2640
648
6780
TEC
12
TED
11
11
TEIS
TEL
97
97
TEM
15
56
19
63
TEN
19
29
27
362
131
96
80
599
TER
26
27
149
55
88
61
292
TES
13
101
66
698
118
769
TEX
TI
68
238
118
24
13
1181
1306
510
100
16
29
459
3155
TIA
11
TIAL
TIAS
TIE
10
1152
22
12
27
1189
TIEM
97
103
TIEN
127
11
144
TIER
TIES
TIG
TIL
27
29
TIM
16
20
TIN
10
57
54
167
22
278
TIO
13
276
13
276
TION
TIOS
37
37
TIR
14
13
36
21
53
TIS
14
11
21
TIU
TIUN
TIZ
TO
68
71
26
16
342
1553
407
76
29
4810
523
6875
TOL
TOM
TON
21
172
357
386
32
915
TOR
24
11
23
135
28
203
58
366
1230
TOS
151
1225
155
TOY
69
69
TRA
73
53
19
17
486
152
123
482
164
1245
TRAC
39
10
12
50
TRAI
13
14
TRAL
TRAM
25
25
TRAN
10
39
16
32
23
89
TRANS
24
24
TRAR
28
37
TRAS
14
21
12
338
23
371
TRE
38
12
33
160
153
58
347
TREIN
61
61
TREN
147
47
194
TRES
231
19
256
TRI
24
102
14
23
40
143
TRIA
10
TRIAS
TRIO
TRIR
TRIS
87
88
TRIUN
TRIZ
TRO
16
41
32
37
76
847
90
962
TROL
TROM
24
24
TRON
40
45
TROS
11
513
11
513
TROZ
TRU
10
11
86
13
98
TRUC
TRUE
TRUI
11
11
TRUIR
TRUO
17
17
TRUOS
TRUZ
8
9
TU
29
103
23
192
250
1925
103
18
163
2489
TUA
12
10
10
22
TUAL
TUAR
TUAS
TUD
TUER
TUIR
TUL
TUM
14
12
26
9
TUN
TUO
TUR
10
TUS
13
15
44
3557
15
53
3582
UD
UL
34
42
UM
UN
3173
3181
UR
US
12
12
VA
57
61
11
30
246
935
309
35
276
162
1808
VAI
VAIS
VAL
VAN
27
208
110
61
35
381
VAR
15
12
59
72
27
131
VAS
12
63
70
17
140
VE
64
68
15
30
62
941
310
296
613
178
2222
VED
VEIN
12
92
12
92
VEIS
VEL
56
56
1230
VEN
59
26
44
982
65
139
93
VER
30
31
189
352
124
39
74
713
VES
13
15
237
25
78
35
346
VEZ
469
470
VI
74
95
28
119
815
558
474
204
1980
VIA
88
88
11
177
VIAL
VIAS
VIC
13
13
VID
VIE
13
16
11
279
89
32
41
401
VIEM
VIEN
12
59
28
19
89
VIER
27
187
10
214
VIL
30
32
VIN
21
21
VIO
133
37
41
57
22
270
VION
209
209
VIOS
VIR
42
12
92
11
146
VIS
74
32
15
107
VO
20
12
14
49
136
19
40
497
97
695
VOL
30
131
14
39
145
VOR
VOS
16
116
17
117
VOY
323
324
VOZ
22
48
70
VU
VUE
37
37
VUEL
56
12
60
VUES
WA
26
26
XA
21
21
XE
XI
19
14
14
46
XIA
XIAS
XIS
16
37
16
37
XO
11572
11573
YA
13
367
79
399
26
859
YAIS
YAK
1
10
YAN
YAR
YAS
60
60
93
YE
50
25
17
20
YEC
YEN
23
10
14
42
YER
177
177
YES
105
105
YO
17
1133
37
191
23
1372
YON
YOR
57
61
YOS
34
34
YU
21
115
27
29
142
YUN
YUS
ZA
15
41
30
17
73
868
507
79
23
1236
180
2717
ZAL
ZAM
ZAN
14
13
53
29
77
ZAR
11
19
43
105
37
156
121
ZAS
30
119
31
ZE
ZI
ZINC
ZO
68
24
24
494
86
547
ZOI
ZON
64
13
74
ZOS
20
68
20
68
ZU
12
80
14
84
ZUE
ZUL
160
160