4º PP Eficiencia

1
UNIVERSIDAD DE
SAN MARTÍN DE PORRES
FACULTAD DE
CIENCIAS DE LA COMUNICACIÓN,
TURISMO Y DE PSICOLOGÍA
ESCUELA PROFESIONAL DE PSICOLOGÍA
CURSO :
MANUAL DEL CURSO DE PRUEBAS

PSICOMETRICAS DE EFICIENCIA
IV CICLO - SEMESTRE 2005-II

Elaborado por MAG. DANY ARAUJO ROBLES
LIMA – PERU
2005
Centro de Reproducción de Documentos de la USMP Material didáctico para uso exclusivo en clase
2
UNIDAD I:
FUNDAMENTOS BÁSICOS DE LA PRUEBAS PSICOMETRICAS
1. CONCEPTUALIZACION DE PSICOMETRIA.
1.1 INTRODUCCIÓN A LA PSICOMETRIA.

El “concepto” de un campo científico, como la psicometría, es desde luego algo más de lo que
puede expresarse en una definición más o menos extensa. Quizás solamente una aproximación
histórica y conceptual, en tanto que recoge una variedad de perspectivas, aportaciones y subcampos,
ofrece en su riqueza y complejidad una delimitación adecuada. A pesar de ello, parece reconfortarnos
encontrar formulaciones sintéticas y necesariamente parciales que condensen el concepto de las
disciplinas.
“Psicometría” es el término más extendido y tradicional para hacer referencia a la medición en
psicología. Un buen número de las definiciones, tanto explícitas como implícitas, que se han dado de
la misma, coinciden básicamente en sus elementos principales. Rivas (1979) coleccionó un grupo de
definiciones de psicometría de autores como Yela, Cronbach, Wilson, Musso, Cerdá, Nunnally,
Seoane y Cureton, y realizó un análisis lógico de sus contenidos. En aquellas definiciones, Yela
(1968) subrayaba que la psicometría se ocupa de todas las medidas en el campo psicológico,
habiéndose desarrollado a través de dos ramas principales: la de los métodos psicofísicos y la del
método de los tests; Cronbach resaltaba que la psicometría pretende obtener estimaciones
cuantitativas; Wilson señalaba que supone la aplicación de la medición y las matemáticas a la
psicología, idea que también resalta Seoane (1976); Musso (1970) señalaba que la psicometría es la
rama de la psicología cuya finalidad es contruir los medios de trabajo conceptuales y materiales
necesarios para construir variables cuantitativas; Cerdá consideraba que la psicometría se refiere al
conjunto de métodos e instrumentos de medida; Nunnally (1973) define la psicometría como la
“metodología que se refiere al desarrollo y empleo de las técnicas de medición en todos los aspectos
de la psicología”, y por último, también resultaba semejante la definición de Cureton, según la cual la
acepción más amplia de la psicometría abarca a todos los aspectos de la medición de variables
psicológicas. Rivas (1979) examinó los contenidos de este conjunto de definiciones con la principal y
justificada conclusión de que existe un “consenso general entre los autores en asignar a la
psicometría la tarea de medición de comportamientos observables y de naturaleza psicológica”
Aunque es bastante usual evitar dar una definición frontal y explícita, seguramente por las
desventajas y limitaciones de las definiciones, comúnmente la delimitación de contenidos y el enfoque
de los trabajos aclaran suficientemente la concepción de la psicometría que se mantiene. López Feal
(1986) , por ejemplo, señala que enfocará su delimitación de los contenidos de la psicometría desde
la perspectiva de la teoría psicométrica “que se ocupa de los principios básicos de la medida en
general” y desde “la concepción de la psicometría como método particular que su ocupa de la
construcción de escalas de medidas psicológicas y psicofísicas, tanto desde la teoría clásica de los
tests mentales como desde las teorías alternativas actuales “
Santisteban (1982) considera el “problema general de la medición en psicología” incluyendo
bajo este epígrafe los fundamentos de la teoría de la medición; los métodos de escalamiento y la
teoría de los tests, incluyendo bajo estos tres grandes apartados el amplio conjunto de desarrollos
psicométricos que los caracterizan.
El concepto de psicometría parece incluir de este modo, el conjunto de las teorías y
desarrollos acerca de la medición en psicología así como los “métodos y procedimientos para la
cuantificación de conceptos tales como aptitudes, inteligencia, sensaciones, personalidad, actitudes,
etc.” . De este conjunto de conceptualizaciones de la psicometría se desprende que esta es una
disciplina metodológica que se refiere directamente al campo de la medición psicológica en toda su
extensión y que carece de un contenido psicológico propio, en el sentido en que lo tienen la
psicología educativa o la psicología clínica, por ejemplo.
La Psicometría tiene como finalidad llevar a cabo la medición de la conducta, tanto en el ser
humano como en los animales, lo que constituye uno de los pilares fundamentales de la ciencia
psicológica, ya que el hombre cada vez más se interesa por comprender su propia naturaleza y, por
ende, la de los demás.
3
1.2 DEFINICIÓN DE PSICOMETRÍA.
Por nuestra parte, podemos definir la psicometría como la teoría y la metodología acerca de la
medida y sus técnicas en psicología, incluyendo sus condiciones, limitaciones y finalidades. La
psicometría se refiere al campo de la teoría y práctica sobre la elaboración, evaluación y aplicación de
las medidas en psicología. Este es naturalmente un campo muy amplio que carece de objeto de
contenido psicológico específico que le sea exclusivo. Es una disciplina metodológica que sirve y
fundamente la medición en los diversos campos psicológicos con objeto de estudio propio, natural o
cultural. En tanto que cada una de las parcelas de la psicología (básica, diferencial, educativa, social,
cognitiva, etc.) necesita realizar mediciones de los constructos que le son propios, implica y hace uso
de la psicometría. La psicometría por tanto es una disciplina metodológica, centrada sobre aspectos
relativos a la medición, sus condiciones y sus usos, que está en el soporte mismo de la investigación
y la práctica profesional de cualquier campo psicológico.
1.3 CAMPO SUSTANTIVO DE LA PSICOMETRÍA.

No debe entenderse mal la afirmación de que la psicometría carece de un contenido psicológico
propio. Esta afirmación no significa que la psicometría no tenga un campo propio. Al contrario,
significa que el cuerpo teórico y empírico de la psicometría no puede confundirse con ningún otro
campo psicológico. La psicometría tiene un campo sustantivo propio relativo a la teoría de la medición
en sentido amplio, un campo que puede denominarse teoría psicométrica y que contiene
conocimientos fundamentales para la medición psicológica virtualmente en todos los campos
psicológicos.
El carácter sustantivo de la psicometría puede entenderse fácilmente mediante un ejemplo.
Tomemos la teoría de la fiabilidad, que es una parte principal y bien conocida de la teoría
psicométrica clásica. Esta teoría es un conjunto denso, relativamente complejo y bien estructurado de
conocimiento que no puede ser adscrito a ninguna parte de la psicología. No puede decirse que sea
patrimonio de la psicología clínica, ni del psicodiagnóstico, ni de la psicología social, ni de la
psicología educativa, ni de ninguna otra rama de la psicología. Sin embargo, en todos esos campos
se utiliza la teoría de la fiabilidad en la construcción y evaluación de instrumentos de medida
psicológica. La teoría de la fiabilidad es un ejemplo emblemático del cuerpo sustantivo de
conocimientos de la psicometría.
Contenido de la psicometría: En general, la utilidad más inmediata de la psicometría para una

buena parte de los psicólogos consiste en elaborar y valorar medidas psicológicas. Estas medidas
pueden referirse a los diversos objetos a los que se refiere la psicología, incluyendo estímulos,
personas y conductas en todas sus modalidades.
La psicometría se encarga precisamente de determinar: a) Las condiciones del desarrollo de

medidas, b) Las cualidades de bondad de las medidas c) El uso que esas medidas deben cumplir y
d) La elaboración misma de las medidas psicológicas.
Nunnally (1987) utiliza la etiqueta “teoría psicométrica” en contraposición a la aplicación
psicométrica, que comprende el desarrollo de las medidas psicológicas concretas y la investigación
sobre esos instrumentos de medida particulares. Desde luego, la teoría psicométrica comprende la
“teoría de los tests mentales” y la “teoría y métodos de escalamiento” para decirlo con los títulos de
las obras quizás más emblemáticas.
1.4 NIVELES DEL CAMPO PSICOMETRICO
El carácter metodológico de la psicometría y su carencia de un campo de contenido

psicológico específico no significan que carezca de un espacio de contenido teórico propio. Existe
evidentemente de un campo de teoría psicométrica. Como se desprende de enunciados anteriores,
este campo de teoría psicométrica no está referido a contenidos psicológicos específicos.
El campo de la teoría psicométrica se refiere a las teorías sobre la medición psicológica. Al
conjunto de enunciados que constituyen el cuerpo teórico de fundamentación, explicación y desarrollo
de la medición en psicología.
4
La estructura del campo de trabajo de la psicometría puede reflejarse distinguiendo
claramente cuatro niveles, o zonas de trabajo, diferentes y estrechamente relacionadas: la
fundamentación matemática; la teoría psicométrica; la aplicación psicométrica; y el uso de la
psicometría.
A. Teoría psicométrica. Para medir una variable psicológica no sólo hace falta una teoría sobre la
variable psicológica -teoría psicológica- , sino también, además, una teoría sobre la medición
psicológica. Esta teoría sobre la medición psicológica, tomando las palabras con un sentido
generoso, constituye la teoría psicométrica.
La teoría psicométrica está ubicada en el núcleo principal de la psicometría y constituye el centro
de su propio cuerpo teórico. Un cuerpo de teoría metodológica, básicamente escrito en el
lenguaje de las matemáticas, que nos permite explicar y articular los métodos de medición
psicológicos. La teoría psicométrica puede distingurse sólo desde un punto de vista práctico de
los métodos psicométricos. Puede considerarse que los métodos psicométricos están referidos a
los procedimientos prácticos concretos que permiten obtener instrumentos de medida, efectuar
mediciones y poner a prueba la calidad de los instrumentos de medida y de las mediciones.
Esos métodos psicométricos constituyen la dimensión con proyección práctica, para decirlo de
algún modo, de las teorías psicométricas, que son las que conforman el pilar de elaboración y
justificación teórica. Cuando usamos la palabra psicometría con un uso sustantivo, como ciencia,
nos referimos sobre todo a la teoría psicométrica incluyendo a los métodos psicométricos
asociados a ésta. Lo más común es utilizar la etiqueta “teoría psicométrica” para hacer referencia
tanto a la teoría como a los métodos psicométricos asociados a aquella de un modo
frecuentemente indesligable.
La teoría psicométrica es la parte de la psicometría que constituye su núcleo central, conteniendo
las teorías de la medición psicológica, en sentido amplio, y los procedimientos metodológicos
asociados. Evidentemente, las teorías de la medición psicológica se elaboran usualmente con
vocación de servir a la creación de instrumentos de medida específicos.
B. Aplicación psicométrica. Es en la creación de instrumentos de medida y en el estudio empírico de
los mismos desde el punto de vista de la medición, donde se aplica y cobra su sentido más
inmediatamente útil la teoría psicométrica. Si la psicometría se ha de referir a la medición
psicológica necesariamente debe incluir este campo de aplicación psicométrica.
La aplicación psicométrica comprende el campo del desarrollo de instrumentos de medida
psicológicos directamente útiles a los propósitos de medición de acuerdo con las teorías
psicológicas. La aplicación psicométrica cubre el campo de la medición psicológica práctica. De
este modo, la psicometría se refiere no sólo a la teoría y fundamentos de la medición, sino
también a la medición psicológica práctica que es la expresión aplicada de aquélla. La aplicación
psicométrica incluye el campo de la construcción de instrumentos de medida y también el
conjunto de esos instrumentos incluyendo sus condiciones de bondad y uso. Quizás la autora
más representativa de esta faceta u orientación de la psicometría sea Anne Anastasi (1968,
1973) que en las sucesivas ediciones revisadas de su libro “Tests psicológicos” ha tratado la
psicometría dedicando una parte introductoria del texto a los “fundamentos de los tests
psicológicos”, pero el resto de las partes de la obra a los tests de inteligencia; a los tests de
aptitudes diferenciales y a los tests de personalidad.
C. Fundamentación matemática y estadística. La teoría psicométrica está asentada sobre la base de
una fundamentación matemática y estadística. Efectivamente, la teoría y los métodos
psicométricos están edificados y fundamentados en las matemáticas y en la estadística, con las
que también mantienen una desigual relación bidireccional. Por una parte, la teoría psicométrica
se soporta sobre el conocimiento matemático y estadístico, en ese sentido, la estadística en
particular, y las matemáticas en general, resultan instrumentales para la teoría psicométrica.Las
teorías y los métodos psicométricos están escritos principalmente en lenguaje matemático y
estadístico, obteniendo con ello los fuertes beneficios formales y conceptuales que estas
disciplinas aportan en cuanto se aplican a todos los campos científicos. Es difícil, si no imposible,
encontrar un ejemplo de método psicométrico fundamentado y extendido en la comunidad
científica que no esté amparado sobre una fundamentación estadística o matemática. Por otra
parte, la psicometría también ha contribuido a suscitar problemas y soluciones que han
5
estimulado el desarrollo de la estadística. Un ejemplo clásico en este terreno es el intenso
desarrollo de los métodos factoriales, nacidos en el campo psicométrico y extendidos a través de
su incorporación a los métodos de la estadística multivariada, a otras ciencias empíricas.
D: Uso psicométrico. Por último quizás debe limitarse lo que se entiende por aplicación psicométrica,
que se considera parte de la psicometría, distinguiéndolo del uso de la psicometría.
Prácticamente, toda la psicología, y prácticamente en cualquier trabajo empírico, usa de uno u
otro modo, de la medición psicológica para obtener información precisa de la realidad, para
poner a prueba hipótesis, para diagnosticar, para predecir, etc. Justamente, la medición es una
vía que relaciona teoría y realidad.
Sin embargo, este uso de la psicometría se limita a utilizar los instrumentos de medida oportunos,
de modo que el énfasis está puesto en el uso de la información obtenida para propósitos
psicológicos prácticos o de investigación y no en el desarrollo del instrumento de medida. Hemos
reservado la expresión uso psicométrico para referirnos a este amplísimo campo del trabajo
psicológico empírico que usa de los instrumentos psicométricos sin que los instrumentos mismos
sean el objeto del trabajo.
Para expresar con un ejemplo esta distinción entre aplicación psicométrica y uso
psicométrico. El trabajo de elaboración, establecimiento de la fiabilidad, calibración, validación,
adaptación, baremación, igualación, detección de sesgos, etc. de un instrumento de medición de
las aptitudes primarias pertenece al campo de la aplicación psicométrica en tanto que está
orientado al instrumento; el trabajo posterior de diagnóstico de sujetos utilizando este
instrumento, o, por ejemplo, el trabajo posterior de investigación acerca de la evolución de las
aptitudes primarias con la edad, en tanto que están centrados sobre los sujetos o sobre las
aptitudes primarias mismas y no sobre el desarrollo de un instrumento para su medición, serían
considerados como uso psicométrico.
Disciplina metodológica que se refiere directamente al campo de la medición

psicológica
Figura 1 Disciplina que se encarga de la fundamentación, elaboración y evaluación de las
medidas psicológicas
Disciplina teórica y práctica sobre la elaboración. Evaluación y aplicación de las
CONCEPTO DE PSICOMETRIA medidas psicológicas.
PSICOMETRÍA
FUNDAMENTACIÓN MATEMÁTICA Y ESTADSTICA

TEORIA PSICOMÉTRICA
Procedimientos y técnicas estadísticas sobre los que
se elabora la psicometría, Teorías sobre la medición psicológica. Cuerpo teórico de
+ explicación y desarrollo de la medición y sus métodos en
USO PSICOMÉTRICO APLICACIÓN PSICOMÉTRICA

La utilización de la medición psicológica en los
diversos campos psicológicos y Elaboración de instrumentos de medida psicológica
que no puede considerarse como
una parte de la psicometría Aplicación de la teoría psicométrica a la medición de los
diversos constructos y variables psicológicas de interés
6
Evidentemente, hacemos una utilización arbitraria y convencional, acentuando la distinción de las
palabras aplicación y uso, pero creemos que ello contribuye a delimitar el campo psicométrico del uso
que la psicología hace de los instrumentos psicométricos. Por supuesto, esta distinción puede ser útil
en muchos casos, de modo que un número de estudios podrían calificarse de aplicación o de uso
psicométrico, en función de cuál sea el énfasis con que se elaboren o conque se lean. Un caso
característico de estudios que pueden ser considerados a la vez como de aplicación psicométrica y
por tanto propiamente psicométricos, y a la vez como de uso psicométrico, y por tanto, como
propiamente psicológicos, son aquellos que tratan de establecer la red de relaciones entre un
conjunto de variables medidas con determinados instrumentos. Estos estudios admiten una lectura
como estudios de validez de constructo y también una lectura como estudios sustantivos de los
campos psicológicos a que se refieren.
2. PSICOMETRIA Y SU RELACION CON LA PSICOLOGIA

Y CON OTRAS CIENCIAS
2.1 PSICOMETRIA Y SU RELACION CON LA PSICOLOGIA.
La psicometría se ocupa de la medición psicológica en cualquiera de los campos temáticos de la

psicología, sin que pueda reducirse a la consideración de determinadas variables, constructos o
temas particulares. Esta orientación implica que la psicometría carece de un campo psicológico
específico y a la vez, que la psicometría acompaña a la psicología en cualquiera de sus campos en
tanto existen necesidades de medición. La psicometría se interesa por los contenidos y las teorías
psicológicas en tanto que presentan necesidades de medición, y contribuye al fundamento,
elaboración y contraste de las mismas poniendo las bases para efectuar medición adecuadas de los
constructos y variables que aquellas teorías contienen.
Sin embargo, no puede decirse que no existan campos y teorías psicológicas más afines a la
psicometría. Desde una perspectiva histórica, algunos campos y teorías de la psicología han tenido
un papel preponderante en el desarrollo de la psicometría, y a su vez, la psicometría ha constituido
uno de sus pilares fundamentales. El ejemplo más evidente de esta simbiosis es la teoría de la
inteligencia, pero puede decirse lo mismo de un número de teorías de la personalidad, del desarrollo
de la teoría de las actitudes, y de la psicofísica clásica. En algunos puntos, la psicometría y estos
campos de trabajo parecen llegar a confundirse, volviéndose indesligables las teorías psicológicas y
las teorías y procedimientos psicométricos de medición asociados.
2.2 FUNCIONES DE LA PSICOMETRÍA EN SU RELACIÓN CON LA PSICOLOGÍA. Puede decirse

que la psicometría cumple dos funciones principales en relación con la psicología:
1. La función instrumental. La psicometría sirve a la psicología poniendo las bases teóricas para
la medición psicológica y sirviendo a la elaboración de medidas psicológicas adecuadas.
Desde esta concepción, la psicometría resulta ser un colaborador inseparable de la psicología
que permite a ésta obtener mediciones sobre el mundo empírico, y en este sentido,
permitiendo a las teorías psicológicas entrar en conexión con la realidad empírica, contar con
descripciones rigurosas de esa realidad, efectuar pronósticos y explicaciones y ser puestas a
prueba. Desde este punto de vista, la psicometría es guiada por la teoría psicológica en una
tarea de medición que constituye una etapa instrumental de la investigación científica.
2. La función conceptual. Además, la psicometría cumple también un papel más sustantivo con
respecto a las teorías psicológicas. En primer lugar, el desarrollo psicométrico ha tenido y
tiene un fuerte impacto directo sobre las teorías psicológicas. En este sentido, la psicometría
ha contribuido a conformar las teorías psicológicas mucho más allá de lo que puede
esperarse de la condición de elaboración de instrumentos de medida. En segundo lugar, la
medición tiene un aspecto teórico asociado que lleva inevitablemente a la psicometría a
contribuir a la delimitación de las teorías, los constructos y los hechos relevantes. La
medición no es sólo contar, asignar números o reflejar cuantitativamente, también implica
desvelar, identificar, dar ala luz y revelar porciones de la realidad psicológica. De este modo
tan sustantivo, las teorías sobre la medición psicológica han influido sobre los conceptos
7
psicológicos y las teorías psicológicas. Cuando, a principios de siglo, Binet elaboró su
escala de inteligencia no sólo construyó un instrumento para una variable psicológica definida
por una teoría psicológica, sino que, además, constituyó y dio a la luz -y él, al parecer, era
consciente de ello- un modo de definir y entender la inteligencia que ha tenido una dilatada
vida.
En general, este papel generador y explícitamente conceptual del trabajo psicométrico es muy
patente en toda la medición de rasgos latentes. Evidentemente, ello no significa que se defina una
concepción “Humpty Dumpty” (1) de la medición, ni que el principio de indeterminación traído a las
ciencias sociales tenga que llevar al cuestionamiento de la medición misma. Sin embargo, debe
constatarse el lugar de la medición psicológica en la definición y acotamiento de las variables y de las
teorías a las que se debe. En ambos casos, instrumental y conceptualmente, la psicometría
contribuye al desarrollo de las teorías psicológicas.
Estos dos papeles o funciones de la psicometría respecto a las teorías psicológicas representan
una de las direcciones de la relación bidireccional entre ambas. Por un lado, la psicometría está a la
base y contribuye a la fundamentación de los diversos campos temáticos de la psicología,
ocupándose de la medición de las variables implicadas en aquellos campos. En esta dirección de la
relación de la psicología usa la psicometría para sus fines. La psicometría se configura y desarrolla
para dar soporte a las necesidades de medición de las teorías psicológicas y contribuye al desarrollo
de las mismas instrumental y conceptualmente. Por otra parte, considerando el otro sentido de la
relación de influencia entre psicometría y psicología, las demandas de las teorías psicológicas han
contribuido decisivamente al desarrollo de la teoría y de los métodos psicométricos. El desarrollo de la
psicología ha sido un estímulo para el desarrollo de la psicometría en la misma medida en que la
psicometría ha constituido un instrumento posibilitador del desarrollo de la psicología. Psicometría y
psicología se influyen mutuamente entre sí, su desarrollo y su progreso son necesariamente
indesligables.
Psicometría y método. Evidentemente, el método de la psicología es el método de la ciencia empírica,

el método científico, o hipotético-deductivo-experimental, como a veces se llama por razones más
históricas que propiamente descriptivas.
En este sentido, la psicometría en tanto que participa de la aplicación a contenidos empíricos y en
tanto que contribuye a elaborar modelos referidos a contenidos empíricos,, está sujeta obviamente al
método científico propio de toda ciencia empírica. Para decirlo expresamente el método de la
psicometría es, en tanto que referida a contenidos empíricos, el método científico. En la medida por
ejemplo en que una teoría de medición o un método de escalamiento pueden ser objeto de
contrastación empírica, estos modelos pueden ser objeto de la misma consideración hipotético-
deductiva con la que se evalúa cualquier teoría científica. Pero, además, como hemos puesto de
manifiesto anteriormente, la psicometría comporta un fuerte componente estadístico y matemático. En
la medida en que se trate del componente matemático de la psicometría, éste está obviamente
ajustado a los criterios formales de las matemáticas. Los modelos matemáticos formales
psicométricos, que pertenecen a la teoría psicométrica, han de evaluarse en tanto que modelos
formales con las herramientos y criterios de las matemáticas, y en tanto que modelos de la realidad
empírica, con la debida contrastación propia de las ciencias empíricas.
(1) Humpty Dumpty es un personaje de Lewis Carroll que aparece en su obra “A través del espejo”
que se caracterizaba por defender que él decía exactamente lo que él quería decir, definiendo
idiosincráticamente qué significaban sus palabras. La postura de Humpty Dumpty evita todas las
dificultades interpersonales de la comunicación al mismo Humpty Dumpty, y por la misma razón se
las crea al resto de sus interlocutores. Harold Gulliksen en un interesante artículo de 1968 acuñó el
término Humpty Dumpty para caracterizar a aquellos científicos que definen idiosincráticamente un
constructo o una variable justamente por el modo idiosincrático en que ellos la operativizan. Esta
postura llevada al extremo conduce a una suerte de solipsismo científico en que cada investigación
sólo sería evaluable en términos de sí misma.
8
2.3 PSICOMETRÍA Y SU RELACIÓN CON OTRAS CIENCIAS.

Una parte de los contenidos que un psicólogo está acostumbrado a ver como psicométricos serían
calificados de econométricos por un economista; de biométricos por un médico o un biólogo, etc.
Existe un núcleo común de teoría métrica y de procedimientos que se extiende formando parte de los
cimientos necesarios para el conocimiento empírico de las ciencias del comportamiento, biológicas,
sociales y de la salud. La relación más estrecha se da quizás con la medición en educación, que
usualmente puede considerarse muy estrechamente vinculada en su desarrollo a la medición
psicológica. Prácticamente, los mismos contenidos que un psicólogo considera psicométricos forman
parte para un pedagogo del campo de la medición educativa. El campo de la medición educativa
parece no diferenciarse del campo de la medición psicológica más que en algunas cuestiones de
acento.
La relación es también muy estrecha con la medición en sociología (piénsese, por ejemplo, en
la medición de actitudes sociales, quizás a través de la estrecha conexión que la psicología social
mantiene entre sociología y psicología. La teoría de la medición para la psiquiatría y para
determinadas zonas del diagnóstico y la evaluación psicológica puede considerarse indistinguible.
Aún con aspectos y zonas más distantes de la medicina, de la economía, de la biología y de otras
ciencias, el núcleo conceptual de la teoría métrica comparte muy estrechos vínculos. Esta situación
es una consecuencia del estatus epistemológico de estas ciencias y desde un punto de vista práctico
resulta muy enriquecedora.
De hecho, la naturaleza sustantiva e interdisciplinar de buena parte del conocimiento
psicométrico puede verse anecdóticamente reflejada en la procedencia y formación de importantes
autores vinculados al campo. Fechner, por ejemplo, tan asociado al origen de la psicofísica -que es,
a su vez, el punto de partida del escalamiento psicológico- fue en realidad un filósofo que nunca se
interesó por la psicofísica más que como un ejemplo que cumplía un papel en su sistema de
pensamiento. Mucho más recientemente, autores como McIver; Carmines y Zeller, que han trabajado
en cuestiones de escalamiento y teoría de la medición, son en realidad profesores de ciencias
políticas preocupados por la medición en su campo. El mismo Frederic Mather Lord, quizás el autor
más importante en buena parte de la psicometría de los últimos cincuenta años, es, en realidad, un
sociólogo reconvertido a psicólogo educativo. Rasch, uno de los psicómetras que han traído
aportaciones más eminentes y enriquecedoras es en realidad un matemático que empezó a
interesarse por razones circunstanciales por las cuestiones de medición psicológica. La lista podría
extenderse fácilmente. Estos currícula, con injertos diversos e importantes entre diversas ciencias
próximas, son verdaderamente frecuentes y probablemente muy enriquecedores para el desarrollo
del campo métrico.
Ello no significa que no existan particularidades en el terreno de la medición psicológica.
Sería bien difícil investigar el tema de las relaciones de depredación de las rapaces nocturnas
utilizando cuestionarios de autoinforme, dado que los búhos y sus congéneres no contestan
autoinformes. Allí, sería desde luego, más útil un trabajo métrico que informara cuantitativamente
sobre la composición de los despojos de sus presas que arrojan estas aves. Sin embargo, el modelo
de tratamiento métrico de la información recogida, en vistas a determinar las diversas cadenas de
depredación, quizás no es tan distinto de un problema psicológico clásico de discriminación y
clasificación de patologías.
De este modo, la mayoría de los instrumentos de medida psicológicos son explícita e
intrínsecamente psicológicos y sólo comparten sus características principales con campos
estrechamente próximos como la medición en educación. Sin embargo, las teorías de la medición y
los procedimientos de escalamiento pueden ser menos específicos de la psicología, aun siendo
específicamente psicométricos. Dicho más formalmente, los campos de la aplicación métrica y del
uso métrico suelen ser específicos de la temática científica que se está tratando; la teoría métrica
subyacente puede permanecer usualmente común.
La psicometría también se relaciona con la matemática. La psicología matemática se
caracteriza por emplear modelos matemáticos para representar fenómenos psicológicos. Un modelo,
como primera aproximación, puede definirse como una representación formalizada o abstracta de un
fenómeno. Un modelo permite efectuar predicciones contrastables que deben comprobarse o
9
verificarse, poniendo de manifiesto el ajuste entre el modelo y el mundo real. Un modelo matemático
es un modelo teórico expresado en lenguaje matemático, de modo que puede utilizar las ventajas de
las matemáticas para establecer consecuencias y estudiar el fenómeno. Puede caracterizarse a la
investigación como un intento por construir modelos de la realidad que hay que someter a
contrastación comparando sus consecuencias con los datos observables. Desde un punto de vista
lógico, los datos pueden refutar un modelo, pero nunca demostrarlo. Los modelos matemáticos son
una forma de expresión de teorías científicas que presentan ventajas por su generalidad, su precisión
y su poder deductivo.
Decía Rubén Ardila en una conferencia dictada en la Universidad de Valencia el 21 de
Noviembre de 1988, que “la psicología se orienta hacia convertirse en una disciplina matemática” en
el sentido de que el progreso de la ciencia y la matematización de sus postulados corren
necesariamente parejos. Este punto de visto no es desde luego nada extravagante, y ya fue
expresado con toda claridad por el mismo Stevens en 1951, cuando señaló que “la estatura de una
ciencia es medida comúnmente por el grado en que hace uso de las matemáticas. Con todo, las
metemáticas no son ellas mismas una ciencia, en el sentido empírico, sino un sistema simbólico,
lógico, formal -un juego de signos y reglas. La virtud que hace a las matemáticas no triviales, es su
capacidad para servir como modelo para eventos y relaciones en el mundo empírico”. En las
afirmaciones anteriores de Stevens se encuentra una parte del concepto de psicología matemática.
Coombs, Dawes y Tversky (1981) han caracterizado a la psicología matemática por la
utilización de métodos matemáticos en cuestiones psicológicas. Faverge (1972) ya había destacado
el papel de las matemáticas como lenguaje en el que se expfresa la psicología matemática. Esta
aproximación resalta la aplicación de las matemáticas a la psicología y la ausencia de contenido
psicológico particular de la psicología matemática, que se caracterizaría más por un “estilo de
investigación”. También Laming (1973) había abundado en este punto de vista caracterizando a la
psicología matemática por sus métodos y no por sus campos de aplicación. La definición de
psicología matemática que ofrece Seoane (1980) resalta también la no adscripción de contenidos
temáticos y el uso del lenguaje matemático como característica que primero distinguió a esta
disciplina. Restle y Greeno (1970) han destacado cómo en la psicología matemática es la psicología
la que usa las matemáticas, de modo que éstas últimas cumplen un papel instrumental respecto a la
primera, en lugar de considerar que las matemáticas son ejemplificadas con cuestiones psicológicas.
Santisteban (1982) destaca claramente la caracterización de la psicología matemática por el método:
“lo que distingue a la psicología matemática de otras áreas de especialidad psicológica, no es el
objeto de estudio, que por supuesto es la psicología, sino el método sistemático de investigarlo, con
una metodología que, a grandes rasgos, consiste en crear teorías o modelos expresados en lenguaje
matemático o de ordenador, y utilizar la deducción lógico-matemática y la simulación para predecir y
explicar las propiedades del objeto de estudio”
Ahora bien, un modo de ver las cosas que parece extendido es considerar la psicometría
como un brazo de la psicología matemática, que estaría formada por tres grandes campos: el de la
pscioestadística; el de la psicometría y el de los modelos. Al decir de Seoane (1980) esta clasificación
se desprende de una revisión de los principales manuales sobre psicología matemática. Esta es
desde luego una clasificación académica quizás más relacionada con la estructura eventual de un
área de conocimiento que con el tipo de contenidos característicos de esos tres grandes campos. A
nuestro juicio, la estadística como una rama de la matemática, la psicometría como una ciencia
métrica específica a interdisciplinar a la vez, y los modelos matemáticos como teorías psicológicas
formales, compartiendo una referencias metodológicas comunes, tienen tres estatus gnoseológicos
distintos. Sin embargo, hay un conjunto de referencias comunes: el método científico, los métodos de
la psicología matemática; el lenguaje común matemático-estadístico; la orientación metodológica y el
lugar de los modelos.
10
3. MEDICION PSICOLOGICA
3.1 LA MEDICIÓN EN LA CIENCIA :
El objetivo de estudio de la psicología es el estudio de la conducta, por lo general son las personas,
pero también se encarga del comportamiento de otros seres vivos, Por lo tanto se estudia la
conducta del hombre, o cualquier otro objeto viviente. Asimismo estudia los datos físicos productos
de la conducta de dichos seres. A estos individuos que arrojan o expresan o presentan datos lo
llamaremos objetos dentro del campo de la medición psicológica.
Nunnally, J y Bernstein, I. Consideran que aunque se han escrito cientos de tomos enteros sobre la
naturaleza de la medición, al final ésta se reduce a dos conceptos bastante simples: la “medición”
consiste en reglas para asignar símbolos a objetos de manera que :
1) Representen cantidades o atributos de forma numérica (escala de medición) o
2) Definan si los objetos caen en las mismas categorías o en otras diferentes con respecto a un
atributo determinado (clasificación).
La mayor parte de lo que históricamente llamamos medición tiene que ver con las escalas, y por
consiguiente, con las propiedades de los números, pero la clasificación puede ser de igual
importancia. El objeto de estudio de la psicología por lo general son las personas, pero pueden serlo
animales inferiores como sucede en algunas áreas de la psicología y de la biología, u objetos físicos,
como en ciertas investigaciones de mercado. El término “reglas” indica que la asignación de números
debe hacerse de manera explícita. Algunas reglas son tan evidentes que es innecesaria una
definición detallada, como la medición de la estatura de una persona con una cinta métrica. Por
desgracia, estos casos obvios son excepcionales en la ciencia. Ciertamente, las reglas para medir la
mayoría de atributos tales como inteligencia, timidez o aleccionamiento no son obvias por intuición.
Las reglas, a su vez, son un aspecto importante de la estandarización. Una medida se estandariza
hasta el punto en que Sus reglas sean claras; Su aplicación sea práctica;No requiera de una gran
habilidad de parte de los administradores, más allá de la necesaria para su entrenamiento inicial, y
Sus resultados no dependan del administrador específico. El punto esencial sobre la estandarización
es que los usuarios de un instrumento determinado deben obtener resultados similares. De este
modo, una prueba de inteligencia está bien estandarizada si diferentes examinadores obtienen
puntajes similares al evaluar a un niño en particular en un momento determinado.
La asignación de símbolos reglas a los objetos a medirse debe darse de tal manera que puedan
cumplir con 2 condiciones: 1. Los símbolos definan si los objetos caen en las mismas categorías o en
otras diferentes con respecto a un atributo determinado (clasificación). 2. Los símbolos representen
cantidades o atributos de forma numérica (escala de medición) es decir una característica particular
de los objetos.
El término “atributo” en la definición indica que la medición siempre implica alguna característica
particular de los objetos. Los objetos no pueden medirse, se miden sus atributos. No medimos a un
niño per se, sino más bien su inteligencia, estatura o socialización, No medimos a un adicto sino
medimos sus conducta de dependencia, de tolerancia , de interacción con los demás. La distinción
entre un objeto y sus atributos puede sonar como una mera sutileza, pero es importante debido a que
:
Primero, demuestra que la medición requiere de un proceso de abstracción. Un atributo implica
relaciones entre objetos en una dimensión particular, por ejemplo, peso o inteligencia. Una roca roja
y una roca blanca pueden pesar lo mismo, y dos rocas blancas pueden tener pesos diferentes. Los
atributos de peso y color no deben confundirse entre sí ni con ningún otro atributo.
Una segunda razón para enfatizar que uno mide atributos y no objetos es que nos hace considerar
con cuidado la naturaleza de un atributo antes de intentar la medición. Por ejemplo, un atributo en el
que creemos puede no existir en la forma propuesta, como sucede con los muchos resultados
negativos obtenidos en los esfuerzos por medir un atributo global de rigidez, lo que hace debatible
que exista tal atributo. Aun términos muy populares usados para describir a las personas pueden no
corresponder a atributos mensurables, por ejemplo, clarividencia, adivino, etc.. También es común
que en un supuesto atributo unitario se confundan diversos atributos más específicos. Por ejemplo,
11
“adaptación” puede incluir satisfacción con la vida, humor positivo, habilidades para enfrentar la
tensión emocional y otros significados del término. Aunque tales medidas conglomeradas puedan
ser justificables en parte en campos prácticos, su uso puede socavar a la ciencia psicológica.
La primera parte de la definición de medición subraya el uso de números para representar
cantidades en escalas. Técnicamente, la cuantificación implica qué tanto de un atributo está presente
en un objeto; así, los números comunican la cantidad. La cuantificación se entrelaza de manera tan
íntima con la medición, que con frecuencia los dos términos se usan de modo indistinto. Esto es
desafortunado, ya que la segunda parte de la definición, la clasificación, es al menos igualmente
importante para la ciencia.
Técnicamente, la cuantificación implica qué tanto de un atributo está presente en un objeto; así, los
números comunican la cantidad. La cuantificación se entrelaza de manera tan íntima con la medición,
que con frecuencia los dos términos se usan de modo indistinto. Esto es desafortunado, ya que la
segunda parte de la definición, la clasificación, es al menos igualmente importante para la ciencia.
Las reglas empleadas para definir una medida particular deben estar exentas de ambigüedad.
Pueden desarrollarse a partir de un complicado modelo deductivo, basarse en la experiencia previa,
surgir del sentido común o simplemente tener origen en corazonadas, pero el punto crucial es la
manera en que los usuarios concuerdan de manera consistente en la medida y, por último, qué tan
bien explica el método de medición fenómenos importantes. En consecuencia, cualquier serie de
reglas que cuantifique propiedades de objetos de manera no ambigua, constituye un método de
medición legítimo y tiene derecho a competir por la utilidad científica con otras medidas. Téngase, en
3.2. ESCALAS DE MEDICION
Stevens distingue cuatro tipos de escalas de medición: nominal, ordinal, intervalo y razón. La
clasificación se basa en las diferentes reglas usadas para signar numerales a los objetos. La
asignación de numerales da lugar a un cierto isomorfismo entre las relaciones cuantitativas de los
objetos que se miden y las relaciones entre las cantidades representadas por dichos numerales. Cada
escala corresponde a un nivel de medida diferente, asimismo, a las mediciones realizadas con cada
tipo de escala son aplicables determinadas operaciones estadísticas.
A. ESCALA NOMINAL.
Definición: La escala nominal representa el nivel más elemental de medición. Es la escala que asigna
a los objetos numerales o símbolos como etiquetas con la finalidad :
1.- Identificar a un objeto de otro o para identificar una característica de otra de un objeto o cosa. Los
números asignados sólo distinguen a los objetos, no pueden sumarse. Se usan números para
identificar a los jugadores de fútbol, se utilizan letras y números para indicar los artículos de un
catálogo
2.- Clasificar individuos, cosas y características. ,es decir se usan los símbolos o numerales que
pueden representar una cantidad o atributo, para clasificar a objetos o cosas que pertenecen a una
misma especie o clase. Esta escala además de permitir identificar la clase que pertenecen los
individuos y a las cosas establece subclases, donde a cada subclase o grupo podemos asignarle un
número o símbolo que reúnen objetos de similares características. . Se clasifica a la gente por el sexo
en varones y mujeres, a cada grupo podemos asignarle un número o símbolo. Según una tipología,
clasificamos a la gente en introvertida, neurótica y extrovertida. La escala nominal permite identificar a
los individuos y a las cosas y establecer subclases, que reúnen objetos de similares características.
Los números asignados sólo distinguen a los objetos, no pueden sumarse. La clasificación se hace de
acuerdo a algún atributo, pero no informa que la distancia entre las subclases 1 y 2 sea igual a la
distancia entre 3 y 4. Las operaciones que pueden hacerse en este nivel son “contar” el número de
miembros de una clase y “compararlos”.
Propiedades
Las escalas de medición tienen ciertas propiedades formales que se enuncian en forma de
postulados , que delinean las operaciones para elaborar las escalas y las relaciones entre los objetos
a que se aplican (Siegel 1970), en la escala nominal la única relación implicada es la “igualdad“ que
se simboliza por el signo (=) . Esto significa que los miembros de una subclase son iguales en la
propiedad mediada. La relación de igualdad de las escalas nominales pueden ser:
12
Reflexiva (a=a) Ejemplo: si se tiene que elegir a un jugador para …del equipo … cualquier
jugador será representante.
“simetría” Si a=b luego b=a ; El postulado que si “a” es igual a “b” y “b” es igual a “a” afirma que un
objeto es identico a otro. El termino identico se identifica en un sentido muy restringido , significa
identidad con el atributo que se mide, aunque puede existir diferencias entre otros atributos . Y aún
más, puede existir igualdad cuantitativa entre dos atributos y a la vez presentar diferencias
cualitativas.
y “transitiva” (si a=b y b=c, luego a=c) .
Operaciones ”. Muy pocas operaciones estadísticas pueden hacerse en la escala nominal, entre las
que se pueden realizar con las escalas numéricas son:
“contar” el número de miembros de una clase y “compararlos: contar frecuencias y determinar un
valor central, como el “modo” o MODA
También se puede aprobar algunas hipótesis relativa a la distribución de cosas clasificadas en
categorías y la asociación entre ellas. Ejemplo: Si identificamos el rendimiento académico en bueno
(B),malo (M) y regular (R ) a su vez identificamos a niños con buen nivel de nutrición (nutridos) y
niños con mal nivel de nutrición (desnutridos), Podremos comprobar la hipótesis de que existe un
mejor rendimiento académico si el alumno presente buen nivel de nutrición y el rendimiento
académico será deficiente si existe desnutrición.
Para medidas de asociación entre las variables suelen usarse las pruebas no paramétricas “Chi
cuadrado y el coeficiente de contingencia “C”.
B.ESCALA ORDINAL.
Definición: En una escala ordinal los números asignados a los objetos reflejan un orden que
corresponde a la magnitud del atributo que se mide y que cada sujeto posee. éste orden se expresa
mediante el termino mayor que (>).
• Estas se pueden organizar de acuerdo a:
Una característica en especial: Ejemplo:
Estatura. En la escuela los alumnos forman por orden de estatura, resultados una relación de
sujetos de A>B>C>D……>n. Los alumnos tienen una estatura de A>B>C>C>D.
Edades: Los niños del sexto grado tienen edades de J>G>H>A
Los puestos de un concurso de belleza
Una variable : Ejemplo
En mediciones de rangos psicológicos las personas pueden jerarquizarse en forma de letras
(A>J>R >M), de números (1>2>3>4), de abreviaturas (Hs,Au,Ac,Ag). Esta relación se interpreta en
el sentido de que el símbolo que antecede es más (en una conducta determinado) que el símbolo que
le sigue.
• En el caso de las letras si hablamos de la conducta neurótica, podemos decir que la A es más
neurótico que J , J es más neurótico que R Y R es más neurótico que M.
• En el caso donde las letras pueden remplazarse por números y podemos asignarles 1,2,3,4, que
representan el orden de los sujetos según el nivel que presenta en una determinada conducta.
Los números ordinales atribuidos indican el orden de posición. No indican cantidades absolutas ni
que los intervalos entre ellos son iguales. Ejemplo : si en el caso anterior remplazamos los
números por letras, serian: A > J > R > M, 1 > 2 > 3 > 4. La atribución de los
números 2 y 4 a los sujetos J y M, solo significa que J es más neurótico que M, pero no quiere
decir que es doblemente agresivo. Es decir no puede asumirse que la propiedad medida que
representa los numerales esta igualmente espaciada.
Propiedades: En lo que respecta a los propiedades formales de la escala ordinal estas son :
a. Transitiva: La relación jerárquica “mayor que” es transitiva , si “a” es mayor que “b” y “b” es mayor
que “c” (En la relación 1>2>3, 1 es más ansiosos que 2 y 2 es más ansioso que 3 entonces 1 es
más ansioso que 3). También la expresión mayor que puede remplazarse por la expresión “menor
que”. Cabe resaltar que el axioma de transitividad fundamental en la escala ordinal queda
ampliamente satisfecho en:
• mediciones física si “a” pesa más que “b” y “b” pesa más que “c” entonces “a” pesa más que
“c”,
13
• mediciones de determinadas variables psicológicas: como agresión, depresión, habilidad,
ordenado , etc. ejemplo: si p es menos agresivo que g y g es menos agresivo que z ; entonces p
es menos agresivo que z. Pero en algunas variables conductuales no funciona con la misma
nitidez. tomemos el ejemplo de la dominancia “a (esposa) domina “b” (esposo) y “b” (esposo)
domina “c” (hijo), pero no siempre la madre “a” puede dominar al hijo “c” e incluso puede ocurrir que
“c” domine a “a”.
Operaciones
Las pruebas estadísticas apropiadas para tratar datos de medición de escala ordinal son
variadas : la mediana para medidas de tendencia central; para medidas de correlación , el coeficiente
de correlación de rango de Spearman y r de Kendall; para la verificación de hipótesis la prueba de
Wilcoxon, test del signo, la prueba de Kolmogorov-Smirnov,etc. Todas las pruebas son no
paramétricas. Siegel (1970) llama la atención que las propiedades de la escala ordinal no son
isomórficas al sistema aritmético por lo tanto ,resulta impropio calcular medidas aritméticas y de
desviación estandar con datos ordinales, en los cuales los intervalos entre los objetos ordenados no
son iguales, así mismo es impropio emplear pruebas paramétricas de inferencia estadística con datos
de una escala ordinal, puesto que las decisiones acerca de las hipótesis son dudosas.
C. ESCALA DE INTERVALOS
Definición La escala de intervalos ofrece un ordenamiento de los objetos medidos tal como lo hace la
escala ordinal. Pero, a diferencia de esta, posee distancias o intervalos numéricos iguales entre los
valores que se asignan a los objetos , con respecto a la magnitud del atributo medido,
Ej: Si los números 10, 13,15 y 18n representan magnitudes de una propiedad medida, de los
sujetos A, B, C y D, podemos decir que la diferencia entre A y B es la misma que hay entre C y D y
también que la distancia en B y C es menor que la unidad a las diferencias que exhiben A-B y C-D.
La unidad de medición en las escalas de intervalo es arbitraria.
En estos casos los sujetos A, B, C, D son intervalos de clases o poseen un distancia por igual
entre ellos , que podría ser distancia de puntuación , se llevan por 3 puntos A=/=B =3 y C=/=D =3,
distancia de edades, se llevan por dos años, distancia entre C.I intelectual, se llevan en 10 puntos
cada uno , distancia entre grupo tienen nota de diferencia de 5 puntos cada uno.
Estos sencillos ejemplos sirven para ilustrar que la escala de intervalos permite establecer
comparaciones precisas entre los valores asignados a valores individuos en un mismo atributo
medido ,y, entre los valores atribuidos a un mismo individuo en la medición de diferentes atributos,
tales comparaciones puede efectuarse porque la escala de intervalos posee unidades comunes y
constantes. Sin este requisito no podría establecerse comparaciones validas .
La escala de intervalos tiene también “un punto de cero” aunque este punto ubicado en el
origen de la escala es arbitrario, no se mide un atributo de modo absoluto, Las escalas de
temperatura Fahrenheit y centígrados se inician en un punto “cero” arbitrario y el “cero” no significa
“no” hay temperatura simplemente en una localización arbitraria de la escala, como observa Baltes
(1981), dl cero arbitrario determina que las relaciones entre las posiciones se establezcan en términos
de distancias entre ellas y no en términos de razones. Si la temperatura del lunes fue de 32 grados y
la del viernes fue 16 grados, no significa que la temperatura del día lunes fue el doble que la del
viernes, sólo indica que fue 16 grados menor.
Los psicólogos se han interesado por construir escalas de intervalos. El problema por superar
fue encontrar el método para establecer unidades iguales, el esfuerzo fue logrado cuando menos, en
algunas áreas. En efecto, los puntajes originales de las pruebas de ejecución son convertidos en
“puntuaciones estándar” que representan la distancia de un puntaje con respecto al rendimiento
medio del grupo, en función de la desviación estándar de la distribución. Se obtiene, de esta manera,
unidades iguales y constantes que facilitan establecer comparaciones. La construcción de
instrumentos para medir variables psicológicas sobre una escala de intervalos, se apoya en la
verificación empírica de la distribución normal que adoptan los puntajes de las variables de ejecución.
Esta distribución se obtienen cuando se miden algunos atributos humanos con escalas de intervalo y
de razón, por ejemplo, la talla de un amplio número de niños de 12 años, se distribuye según la curva
de Gauss. A partir de la media de la distribución y de su desviación estándar , tomada como unidad,
se puede ubicar una posición en la curva. Si se construyen instrumentos que proporcionan una
14
distribución normal de los puntajes, se podrá expresar la posición de los individuos en un contínuo
psicológico mediante una escala de intervalos.
Operaciones
La distribución normal y las puntuaciones derivadas, como “z” y “T” solucionan el problema de
unidades iguales, pero no resuelven el problema del punto cero (Magnusson, 1969). Efectivamente,
las usuales escalas de tests psicológicos no poseen un “punto cero” en su base. La inteligencia se
mide con escalas similares a una escala de intervalos, pero ninguna empieza con cero inteligencia ni
con cero memoria.
Las mediciones tomadas con escalas de intervalos se prestan al tratamiento de pruebas

estadísticas paramétricas: media aritmética; desviación estándar; correlación “r” de Pearson; test “t”
de Student; análisis de varianza, razón “F”, y algunas otras más. Las pruebas no paramétricas no son
recomendables en vista de que no aprovechan toda la información que proveen los datos recogidos
en escalas de intervalos
D. ESCALA DE RAZON
La escala de razón (proporción) posee todas las propiedades de las escalas anteriores, y
además, tiene en su origen un punto cero absoluto. Lo cual significa que si el objeto medido alcanza
el valor cero en la escala, ese objeto no posee la propiedad medida. Una característica de esta escala
es que no sólo ofrece el orden de rango de los objetos y la igualdad de los intervalos, sino también
sobre la relación entre las distancias. Si los números 10, 13, 15 y 18 representan las magnitudes de la
propiedad medida en los sujetos A., B, C y D, al nivel de la escala de razón podremos saber que el
sujeto B tiene 1.3 veces el atributo respecto del sujeto A; C lo posee 1.23 veces con relación a B o
que D contiene 1.2 veces el atributo respecto de C. Estas propiedades se basan en el hecho que la
escala posee unidades iguales a partir de un punto cero.
Las mediciones del tiempo, longitud y peso, se inician con un punto cero verdadero, y cuando
se mide la propiedad de un objeto se determina la magnitud como un valor absoluto. No es necesario
conocer los valores de otros objetos medidos en la misma escala (Magnussson, 1969). Los valores
numéricos de estas escalas fácilmente pueden ser transformados en otra unidad de medida, por
ejemplo, de libras a gramos; de pulgadas a pies; solamente multiplicando cada valor por una
constante positiva.
Las escalas de razón son comunes en los instrumentos físicos de medición. Han habido
serios intentos para desarrollar escalas de razón en la medición psicológica. El obstáculo mayor ha
sido la consideración del cero absoluto verdadero, que en esta escala se interpreta en el sentido de
ausencia absoluta de la propiedad, hecho que no ocurre con las variables del comportamiento. Los
atributos humanos que miden los psicólogos existen en todos los individuos aunque sea en mínima
magnitud, con diferencias de grados entre las personas. Guilford (1954) observaba que el cero
absoluto es deseable, pero no esencial en la medición psicológica. En fin, la determinación del punto
cero en la construcción de escalas psicológicas es una tarea pendiente en la metodología
psicométrica. En la actualidad, las escalas más utilizadas en la medición psicológica son la ordinal y
la de intervalos.
ESCALAS DE MEDICION
ESCALAS OPERACIONES ESTADISTICOS

NOMINAL IDENTIFICAR CLASIFICAR NUMERO DE CASOS
FRECUENCIA
ORDINAL ESTABLECER UN ORDEN MEDIANA Y PERCENTILES
DE RANGO
DE INTERNVALO ENCONTRAR MEDIA, DESVIACIÓN
DIFERENCIAS O CORRELACION
DISTANCIAS
PROPORCIONAL O RAZON ENCONTRAR PORCENTAJES DE
PORPORCIONES VARIACIÓN
15
UNIDAD II:
LOS TESTS , CLASIFICACION Y PROPIEDADE PSICOMETRICAS DE LAS PRUEBAS
PSICOMETRICAS
4. LOS TEST PSICOLÓGICOS
4.1 LA TEORIA CLASICA DE LOS TESTS
Las técnicas de evaluación psicológica permiten, en general algún tipo de cuantificación,
aunque con mayor frecuencia no es esa la única información que aportan. De hecho y como indica
Sundberg (1977) esta información en una combinación de datos duros ( o cuantitativos ) o blancos
(cualitativos ). El peso de uno u otra dependerá, lógicamente de la finalidad concreta con que se
utilicen. En este sentido cabe distinguir entre la evaluación para investigación y la evaluación para un
contexto clínico, esta segunda mucho más cargado de datos cualitativos (aunque estos no se hallan
necesariamente ausentes en la primera). Ambos tipos de datos cumplen una finalidad distinta y debe
dársele las consideración que merecen:
La cuantificación desempeña un papel importante en la en la comprobación de hipótesis,
mientras que los datos cualitativos sirven más bien, dentro de una base de observación para plantear
hipótesis y refinarlas . Sin embargo la capacitación para la obtención de estos datos cualitativamente
es seguramente menos susceptible de entrenamiento sistemático ya que en definitiva, depende
mucho más de un fuerte bagaje teórico sobre aspectos básicos de funcionamiento humano que
oriente la observación y menos de una capacidad teórica. La cuantificación, por otra parte, presenta
un elemento omnipotente en todo elemento de evaluación.
La mayor parte de las pruebas estandarizadas en nuestro medio han sido creadas, son
interpretadas, y pueden ser evaluadas dentro de la teoría clásica de los test, o de puntuaciones
verdaderas. La teoría de clásica de los tests sostiene que las puntuaciones obtenidas o empíricas (X)
es la suma de las puntuaciones verdaderas (V , un concepto teórico que se supone representa la
cualidad del sujeto que se pretende medir) y el error de medida (E, o error aleatorio). La puntuación
verdadera es la media de la distribución teórica que podrían hallarse en evaluaciones repetidas de la
misma persona con el mismo test.
El error de medida se entiende toda desviación aleatoria o no sistemática, de la puntuación
verdadera, no tomándose por tal las desviaciones o sesgos sistemáticos. Es razonable pensar que la
puntuación obtenida que obtiene un sujeto cuando se le aplica un test en un momento dado, no
coincida exactamente con su verdadera puntuación en ese test, pues en ese momento puntual, el
sujeto está afectado por múltiples factores de difícil control que inciden en su conducta. Si estos
factores perjudican al sujeto, obtendrá una puntuación empírica más baja que la que verdaderamente
le correspondería; si le benefician, la obtendrá superior. Ahora bien, cuando se pasa un test a un
sujeto, no hay manera de saber su puntuación verdadera, lo único que tenemos es la puntuación
obtenida o empírica, es decir, los puntos que saca en el test: su puntuación verdadera hay que
estimarla basándonos en los supuestos del modelo.
Supuesto 1:
La puntuación verdadera (V) es la esperanza matemática de la empírica: V = E(X), donde X
es la variable aleatoria “puntuación empírica del sujeto”. Este primer supuesto constituye en realidad
una definición de la puntuación verdadera. El lector poco familiarizado con el concepto de esperanza
matemática puede hacerse una idea imaginando que se aplicase un test “infinitas” veces al mismo
sujeto. También debe imaginar que cada aplicación no afecta a las otras y que el sujeto no cambia en
el curso de las aplicaciones. En estas condiciones, la puntuación verdadera del sujeto en el test sería
la media aritmética de las puntuaciones empíricas obtenidas en las “infinitas” aplicaciones. La
puntuación verdadera es, por tanto, un concepto matemático, A partir de los valores de X
(puntuaciones empíricas) y bajo ciertos supuestos, la teoría clásica de los tests permite hacer
estimaciones probabilísticas razonables acerca del valor de las puntuaciones verdaderas. Conviene
entenderlo bien, pues a menudo se ha hecho una conceptualización platónica de las puntuaciones
verdaderas, considerándolas como algo mágico y estático, propiedad de los sujetos y que determina
su conducta. Del modelo no se sigue esta interpretación circular: la puntuación empírica en un test es
una muestra de conducta que si reúne ciertos requisitos de medida, y bajo ciertos supuestos, permite
hacer inferencias probabilísticas fundadas. De esto trata la Teoría Clásica de los Tests.
Supuesto 2:
16
Se asume también que los errores obtenidos no tienen relación con las puntuaciones
verdaderas, es decir, que cualquier nivel de la habilidad o rasgo que pretende medirse, puede verse
sometido a errores de la misma magnitud (es decir, el error en un test de inteligencia, por ejemplo,
sería en principio semejante tanto para individuos muy inteligentes, como para los tienen una menor
capacidad). Es decir, no existe correlación entre las puntuaciones verdaderas de los sujetos en un
test y sus respectivos errores de medida. No hay razón para pensar que el tamaño de los errores
vaya sistemáticamente asociado al tamaño de las puntuaciones verdaderas. Sin embargo, este
presupuesto no es compartido por otras teorías de la medida, como la del rasgo latente.
Supuesto 3:
Los errores de medida de los sujetos en un test no correlacionan con sus errores de medida
en otro test distinto. Si se aplican correctamente los tests, los errores serán aleatorios en cada
ocasión, no existiendo razón a priori para que covaríen sistemáticamente unos con otros.
Hay que señalar que ninguno de los supuestos del modelo es comprobable empíricamente
de un modo directo tal como están expresados, por tanto, aunque plausibles y sensatas a priori,
habrá que hacer deducciones que sí se puedan contrastar y confirmen o falseen el modelo.
4.2 PROPOSITOS Y USOS DE LOS TESTS

Los tests psicológicos y otros instrumentos de evaluación se aplican en una amplia variedad
de contextos de organización en la sociedad contemporánea: escuelas y universidades; negocios e
industrias; clínicas psicológicas y centros de asesoría; organizaciones gubernamentales y militares y
contextos de investigación de distintos tipos. De modo que los psicólogos de personal, psicólogos
clínicos, psicólogos de asesoría, psicólogos escolares, consejeros matrimoniales y muchos otros
especialistas aplicados y con orientación hacia la investigación sobre el comportamiento del ser
humano dedican una parte importante de su tiempo profesional a la aplicación, calificación e
interpretación de tests psicológicos.
En la actualidad, el propósito principal de los tests y evaluaciones psicológicas es el mismo que ha

prevalecido durante todo este siglo: evaluar el comportamiento, las capacidades mentales y otras
características personales con el objeto de ayudar en los juicios, predicciones y decisiones de las
personas. En forma más específica, los tests se utilizan para:
1) Observar a las personas que solicitan empleos y desean participar en programas educativos y de
capacitación;
2) Clasificar y ubicar a las personas dentro de contextos educativos y de empleo;
3) Asesorar y guiar a los individuos con propósitos educativos, vocacionales y personales;
4) Retener o suspender, promover o cambiar a estudiantes o empleados en los programas
educativos y de capacitación, así como en situaciones laborales;
5) Diagnosticar y prescribir tratamientos psicológicos y físicos en clínicas y hospitales;
6) Evaluar los cambios cognoscitivos intra e interpersonales debidos a programas de intervención
educativos, psicoterapéuticos y conductuales; y
7) Realizar investigaciones sobre los cambios en el comportamiento a través del tiempo y sobre la
efectividad de los programas y técnicas nuevas.
Además de sus aplicaciones en la descripción y análisis de las características individuales,
los tests se utilizan para evaluar el entorno psicológico, los movimientos sociales y otros eventos
psicosociales. Nadie sabe con exactitud cuántos tests disponibles comercial y no comercialmente de
cada tipo se aplican ni en qué situaciones, con qué propósitos y para quién durante un año
determinado.
Sin embargo, puede obtenerse un indicativo de la naturaleza de la intención del uso de los
tests a partir de los resultados en los distintos estudios (por ejemplo, Brown y McGuire, 1976; Wade y
Baker, 1977; Harrison y otros, 1988; Piotrowski y Keller, 1989; Archer y otros, 1991). Como es obvio,
los descubrimientos de estos estudios dependen de las clases de practicantes y/o investigadores que
se incluyen en la muestra.
4.3 DEFINICION DE TEST

El término test es una de las palabras más comunes que todos creemos comprender y por
ende, raramente tomamos el tiempo necesario para definirla de manera precisa. Definiremos un test
17
como un procedimiento sistemático para medir una muestra de conducta. Esta definición se
puede entender mejor tomando en consideración las implicaciones de los diversos componentes de
ella.
La frase “procedimiento sistemático” indica que una prueba se construye, se administra y se
califica, según reglas preestablecidas. Los reactivos se seleccionan sistemáticamente para que se
ajusten a las especificaciones de la prueba; se administran los mismos reactivos u otros equivalentes
a todas las personas y las instrucciones y límites de tiempo son iguales para todos los que se
someten a dichos tests, el uso de reglas predeterminadas para la evaluación (calificación) de las
respuestas asegura un acuerdo entre diferentes personas que tengan que Calificar la prueba.
La utilización de procedimientos estándar sirve para reducir al mínimo la influencia posible de
variables personales y situacionales irrelevantes, sobre las calificaciones del test. Por ejemplo, las
instrucciones sobre cómo responder cuando no se tenga seguridad respecto a la respuesta apropiada
hacen disminuir las diferencias individuales en las conductas de adivinación. Otra razón para usar los
procedimientos estándar es que permiten que las calificaciones dadas a distintas personas se puedan
comparar directamente. Si dos individuos responden a diferentes reactivos o tienen distintas
cantidades de tiempo para terminar las mismas pruebas, no será posible comparar sus resultados.
Así pues, el uso de procedimientos estándar permite las comparaciones directas entre los individuos.
Un segundo término crucial es el de conducta. En el sentido más estricto un test mide sólo la
conducta registrada por la prueba, esto es, las respuestas dadas por una persona a los reactivos de
la prueba. Así, no medimos directamente a la persona, sino que inferimos sus características (rasgos)
a partir de sus respuestas dadas a los reactivos del test. Si las conductas que muestran reflejan de
modo adecuado el constructo que se mide, la prueba proporcionará información útil. Si la conducta
no refleja adecuadamente la característica subyacente, las inferencias que se hagan resultarán
erróneas.
En tercer lugar, un test contiene solamente una muestra de todos los reactivos posibles.
Ningún test es tan completo como para incluir todos los reactivos posibles que se pueden desarrollar
con el fin de medir la variable psicológica en cuestión, es decir, que puedan medir el dominio
conductual (un dominio conductual es la agrupación hipotética de todos los reactivos posibles que
cubren un área particular). Se nos ocurren excepciones, tales como las de un test de adición que
cubra todas las combinaciones posibles de dos números de un sólo dígito, pero estas excepciones
suelen ser raras y en general, triviales. Así, se puede considerar que cualquier test dado es la mejor
muestra de todos los reactivos posibles.
Puesto que el test contiene sólo una muestra de todos los reactivos posibles, se plantean dos
problemas.
En primer lugar, debemos asegurarnos de que los reactivos incluidos en la prueba sean una muestra
representativa de todos los reactivos posibles.
El segundo problema consiste en saber si una persona obtendría la misma calificación al responder a
una muestra diferente de reactivos extraída del mismo “dominio”.
En otras palabras, ¿obtendría la misma calificación en una forma equivalente de la prueba? El
primero es el problema de la validez, el segundo es el de la confiabilidad.
Validez y Confiabilidad ¡Qué es esto!
¡Qué es validez y confiabilidad de un test?
5. Propiedades Psicometricas de los tests psicológicos

CONFIABILIDAD
18
Desde el punto de vista psicométrico, la prueba tiene que poseer dos características para que
se le pueda considerar un buen instrumento de medición: debe ser confiable y válido. La confiabilidad
a menudo es llamada también fiabilidad o consistencia de un test.
El problema de la confiabilidad plantea diversas formas de preguntas: ¿Hasta qué punto mide
una prueba de modo consistente?, es decir, ¿obtendremos resultados semejantes en caso de medir
el mismo grupo de objetos una y otra vez con el mismo instrumento de medición?; ¿corresponden las
mediciones obtenidas por medio de un instrumento a las “verdaderas” o “reales” medidas de la
propiedad en cuestión?. En respuesta a estas preguntas se suscitan las variadas definiciones de
confiabilidad.
La confiabilidad en términos generales, puede ser definida como el grado de concordancia
que existe entre dos medidas de un mismo objeto (Nunnally, 1983; Brown, 1980). Las estimaciones
de la confiabilidad dependen de cuáles sean las fuentes de error que más nos interesan, razón por la
cual encontramos varios tipos de confiabilidad.
Puesto que todos los tipos de confiabilidad se refieren al grado de concordancia entre dos
conjuntos de puntuaciones, este grado de acuerdo se halla a través de un estadistico de correlación ,
por ello se expresan todos generalmente en función de un coeficiente de correlación. El coeficiencte
de correlación pueden cuantitificarse desde +1 a –1, encontrando con ello correlaciones positivas
que van desde 0 a +1 y correlaciones negativas que van desde 0 a –1 . Los criterios para determinar
el nivel de relación o concordancia encontrada entre 2 mediadas son:
O a +/- 0.19 Nula relación

O.20
a +/- 0.29 Debil relación
0.30a +/- 0.59 Moderada relación
O,60
a +/- 0.79 Fuerte relación
O,80
a +/- 0.99 Muy fuerte relación
1 Perfecta relación
TIPOS DE CONFIABILIDAD : DE ESTABILIDAD, DE EQUIVALENCIA Y DE CONSISTENCIA
COEFICIENTE DE ESTABILIDAD. LA CONFIABILIDAD TEST-RETEST.

El paradigma de este tipo de confiabilidad es muy sencillo. Se aplica la prueba, transcurre cierto
período de tiempo y se le aplica nuevamente. A continuación, se calcula la correlación entre las
calificaciones en la prueba y en la reaplicación.
Este método requiere la aplicación de un mismo instrumento dos veces a un mismo grupo de
individuos. El tiempo transcurrido entre la primera y la segunda aplicación puede variar entre unos
minutos y varios años. El valor de la correlación encontrada es un coeficiente de confiabilidad que
representará el grado de estabilidad de las características medidas de los sujetos frente a la misma
actuación indagada dos veces. Además, este valor señala el grado de consistencia o similitud de los
procedimientos empleados para recoger dichas informaciones en las dos oportunidades.
La estabilidad definida como la consistencia de los puntajes a través del tiempo, asume que
aquello que es estudiado es estable en el tiempo, de ahí que el error que existe sería por el efecto de
las fluctuaciones temporales entre una y otra aplicación.
COEFICIENTE DE EQUIVALENCIA: FORMAS PARALELAS.

Puesto que cualquier test contiene sólo una muestra de todos los reactivos posibles, se puede
construir formas paralelas de la prueba. En el desarrollo de formas equivalentes, comparables o
paralelas; hay que asegurarse de que verdaderamente lo son, pues cada forma debería ser
construida independientemente, pero debe estar destinada a satisfacer las mismas especificaciones.
Los tests deben contender la misma forma y abarcar el mismo tipo de contenido; asimismo, la
amplitud total y el nivel de dificultad de los elementos debe ser igual (medias iguales); así como su
variabilidad (varianzas iguales).
Cuando las dos formas del instrumento son aplicados una tras otra a los sujetos, el valor
estadístico encontrado representa el coeficiente de equivalencia de dichos instrumentos; así como el
grado de consistencia del comportamiento medido con ellos.
19
Para equiparar el efecto de la práctica que actúa sobre los resultados del individuo en cada
una de las formas del test, es conveniente administrar a una mitad de los sujetos la forma uno, luego
la forma dos; en tanto la otra mitad de los sujetos se somete primero a la forma dos y luego a la forma
uno. Si la segunda forma del instrumento de administra a los mismos sujetos después de cierto
tiempo de aplicada la primera, entonces no sólo puede controlarse la equivalencia, sino también el
grado de estabilidad de las características medidas de los examinados.
COEFICIENTE DE CONSISTENCIA O COHERENCIA INTERNA.

El estudio de este tipo de confiabilidad tiene por finalidad determinar si un instrumento mide alguna
habilidad o rasgo conductual específico en forma más o menos igual u homogénea a través de los
ítems que lo conforman. Por lo tanto, una elevada confiabilidad de consistencia interna será, de por
sí, garantía de que se cuenta con un instrumento homogéneo.
Existen dos procedimientos para analizar la consistencia interna. Sin embargo, ambos
requieren que el instrumento sea aplicado una sola vez a los examinados.
Método de bipartición.
También es conocido como fiabilidad de la división por mitades o “split half”. Este método consiste en
que partiendo de una sola aplicación de una forma de test., es posible llegar a la medida de su
fiabilidad, siguiendo varios procedimientos de división en mitades, por supuesto, puede ser en dos o
más “mitades”.
Se obtienen dos puntajes para cada individuo, dividiendo el test en mitades comparables. La fiabilidad
de la subdivisión nos proporciona una medida de equivalencia o adecuación de las muestras de
elementos. En esta medida no entra la estabilidad temporal de las puntuaciones, puesto que sólo
requiere de una sesión.
Un procedimiento adecuado para lograr una mejor igualdad comparativa de ambas partes es el de:
a.- Hallar las puntuaciones de los items o elementos dividiendo el test en mitades comparables,
teniendo en cuenta que puede ser cada mitad superior e inferior de la prueba o los items pares
e impares del test .
b.- Una vez obtenidas las dos puntuaciones se computa el coeficiente de correlación con los
mismos criterios anteriores. Se debe tener en cuenta el tipo de variable de estudio antes de elegir
el estadistico adecuado, es decir si es de tipo ordinal o de intervalo a fin de utilizar el estadistico
RHO o Pearson respectivamente.
c.- Sin embargo, debe advertirse que lo que da en realidad dicha correlación es la fiabilidad de
una mitad de los reactivos de la prueba original y como la confiabilidad es dependiente de la
longitud de la prueba, entonces la correlación será más baja que la que se espera de una prueba
de la longitud original. Por ello, para compensar esta correlación baja, se introduce una corrección
por medio de la fórmula de Spearman-Brown o Guttman según sean las varianzas de la mitades
de la prueba, quedando estimado el coeficiente de confiabilidad para el test entero.
Estimaciones de homogeneidad.
Por medio de este método se puede estimar el grado de homogeneidad o concordancia existente
entre los resultados observados en cada item de un instrumento y el resultado total alcanzado por
éste. A diferencia del de la división por mitades, éste no analiza la consistencia de la mitad del test,
sino que se basa en la consistencia de las respuestas de los sujetos de todos los reactivos del test.
Mientras más homogéneo sea el instrumento, más alta será la consistencia entre los elementos.
El índice de homogeneidad evalúa el grado en que los items de una prueba se inter-correlacionan
entre sí. Se puede estimar de dos maneras:
a.). Una es por medio del Coeficiente de Küder-Richardson. Se utiliza cuando los items son
valorados dicotómicamente y además se supone que poseen un grado de dificultad similar. Se
computa a través de la fórmula propuesta por Küder-Richardson, siendo la fórmula KR 20 si los
items tienen varianzas diferentes y la KR 21 si se asume que tienen varianzas similares.
20
b). - El otro método de estimar la homogeneidad es el Coeficiente Alfa de Cronbach. Es concebida
como la generalización de la fórmula KR 20 para el caso de los items con valoración politómica
(con alternativas), y se computa a través de la fórmula propuesta por Cronbach. Sus resultados
pueden ser interpretados como la correlación entre una y otra prueba psicológica de la misma
longitud, tomadas de un mismo dominio.
VALIDEZ
La característica más importante de una prueba en su validez. Sin pruebas de validez, no

será posible interpretar o dar significado a las calificaciones. La validez se refiere a la extensión o
exactitud con la que la prueba mide lo que pretende medir. Una prueba es válida hasta donde mida
un constructo dado y no otras variables extrañas.
De la misma manera que la confiabilidad, la validez se mide por coeficientes de correlación.
No se calcula por la correlación de dos puntuaciones de la misma prueba, sino por la relación entre la
actuación de un test y otros hechos observables independientemente, pero relativos al rasgo de
conducta que se está considerando.
Las técnicas específicas para investigar la validez son numerosas y se han descrito con
diferentes nombres. Aun cuando no existe consenso en los tipos de validez, la American
Psychological Association estableció una clasificación tripartita: Validez de criterio; validez de
contenido y validez de construcción.
TIPOS DE VALIDEZ: VALIDEZ DE CONTENIDO, CALIDEZ RELACIONADA CON EL CRITERIO Y
VALIDEZ DE CONSTRUCTO
A: VALIDEZ RELACIONADA AL CRITERIO.
En este caso, los resultados del instrumento son comparados con los resultados proporcionados por
una medida denominada criterio. El instrumento es válido, si exhibe una buena 20orrelación con la
medida criterio.
A mayor Coeficiente de 20orrelación de Criterio mayor validez del test.
A menor Coeficiente de 20orrelación de Criterio menor validez del test.
En este caso, la validez se refiere a que el instrumento mide lo mismo que la medida criterio. Los
tipos de validez relacionada con el criterio son:
A.1 Validez predictiva.

Se refiere a las situaciones en que los datos de criterio se reúnen en algún momento del futuro. El
test predice cierto resultado después de un tiempo dado; es decir, las calificaciones de las pruebas
predicen realmente las calificaciones del criterio. La validez predictiva computada como un
coeficiente de validez, necesita estimarse por los tests usados en la orientación vocacional y en la
selección y la clasificación de los individuos para propósitos de adiestramiento o trabajo. Es más
apropiado para estudios de validez local, en los cuales hay que comprobar la eficacia de un test
con respecto a un programa específico. Es como la validez práctica de un test en una situación
específica.
Una prueba es válida al predecir los resultados. Por ejemplo, es válida en trabajos de oficina si se
correlaciona con una evaluación de rendimiento en oficina; en el caso de un test de aptitud
escolar, si se correlaciona con las notas de estudio; en el caso de un test de aptitud mecánica, el
criterio podría ser la actuación subsecuente en el oficio como mecánico. Para obtener este
coeficiente de validez se correlacionan los resultados de la prueba con el criterio.
A..2 Validez concurrente.

Se refiere a las situaciones en que las calificaciones de las pruebas psicológicas y los datos del
criterio se reúnen en el mismo punto del tiempo. En este caso, puesto que se dispone ya de las
calificaciones de criterio, el propósito es determinar si las calificaciones de la prueba psicológica
pueden sustituirse por los datos registrados en el criterio. En términos de procedimiento, este tipo
de validez se establece al correlacionarse las puntuaciones de la prueba y las de la prueba que
establece el criterio (es decir, mide la misma variable).
21
Es el tipo más apropiado para ciertos usos de los tests psicológicos, y puede justificarse por
derecho propio. Especialmente, es recomendable en los tests de personalidad, o en los tests
empleados para el diagnóstico de la situación actual, que para la predicción de sucesos futuros.
B. VALIDEZ DE CONTENIDO.
Se la ha definido como el grado en que los items que constituyen la prueba son una muestra
representativa del dominio de contenido, donde el término dominio, se refiere a los temas o asunto
que se está midiendo. Entonces, como su nombre lo indica, se ocupa del contenido de la prueba
psicológica. El contenido significa los constituyentes sustantivos, el tema en sí de la prueba.
Usualmente, se ha recomendado que este tipo de validez sea asignado a las pruebas de
rendimiento escolar y también se ha sugerido para las escalas de actitudes y otras mediciones de
rasgos. Por ejemplo, al valorar los tests de rendimiento, donde se mide el grado de dominio del
individuo en una habilidad específica o un curso de estudio. Esto indica que se conoce bien los límites
del universo del contenido, o dominio.
Por lo general, esta forma de validez se ha determinado mediante la comparación sistemática
de los iterms de la prueba con el dominio del contenido estudiado. Este análisis es factible de ser
llevado a cabo de dos formas:
a.- La primera consiste en estudiar de manera lógica y racional los items explicitando el
porqué se incluye en la prueba;
b.- La segunda se refiere a que con la ayuda de un grupo de jueces competentes y
calificados, se evalúa el grado en que los reactivos concuerdan con los planteamientos del
constructor del instrumento; siendo denominada esta técnica como el criterio de jueces.
El criterio de jueces ha sido en muchos casos la estrategia para evaluar la validez de

contenido. La modalidad más común para este tipo de validez consiste en solicitar la
aprobación o desaprobación de la inclusión de un ítem en la prueba, por parte de varios
jueces, cuyo número puede variar según los requisitos del autor del instrumento.
Quizás el problema más importante derivado que el uso de esta técnica ha generado es el referido a
la cuantificación de sus resultados. Por ello, un intento de solución ha sido calcular un índice de
acuerdo entre los jueces al evaluar el item, siendo en este caso, el grado de acuerdo el que indicaría
la confiabilidad de los juicios y por ende la validez del mismo; ya que evaluaría el consenso que existe
para la inclusión del item en la prueba.
C. VALIDEZ DE CONSTRUCTO.
Este tipo de validez es importante siempre que se diseña una prueba psicológica para medir algún
atributo o alguna cualidad (constructo) que se supone poseen las personas. Estos estudios tratan de
responder la preguntas ¿qué constructo mide? ¿hasta qué punto mide bien la prueba psicológica ese
constructo? Así pues, se enfoca la atención en el constructo, en la característica de lo que se está
midiendo.
Este tipo de validez se evalúa mediante la acumulación de evidencia y no es posible ningún
índice cuantitativo único. Con el fin de determinar la validez de este tipo en una prueba psicológica, es
preciso examinar todo el caudal de evidencias que la rodean; el tipo de reactivos que se incluyen; la
estabilidad de las calificaciones; la homogeneidad de la prueba; su correlación con variables de otras
pruebas y otros datos que iluminen el significado de las calificaciones.
Se utiliza cuando el usuario de la prueba desea inferir el grado en el que un individuo posee
alguna cualidad o rasgo hipotético (constructo) que se refleja en la ejecución de la prueba. Debido a
que esta validez requiere de una acumulación de varios métodos, lo que sería muy dificultoso para el
investigador, se recurre generalmente a alguno de ellos, entre los cuales, figuran los siguientes.
Correlaciones con otros tests. :VALIDEZ CONGRUENTE

También llamada validez congruente, donde el test construido recientemente se correlaciona con
un test establecido, cuyas medidas son aceptadas de la cualidad o rasgo que se examina. Por
ejemplo, el test Stanford-Binet mide la inteligencia, por lo tanto, una correlación alta entre la
prueba nueva y el Stanford-Binet significará que el instrumento nuevo también mide la inteligencia.
22
Análisis factorial.
Es un procedimiento estadístico de particular importancia. Es una técnica usada para analizar las
interpretaciones de datos psicológicos. Se propósito principal es el de simplificar la descripción
conductual reduciendo el número de categorías partiendo de una multiplicidad de variables de
medición hasta obtener unos cuantos rasgos. Identificados éstos, podrán usarse para describir la
composición factorial de un test, por lo tanto, un test puede identificarse tanto en términos de los
factores principales que determinan sus puntuaciones, como del peso de cada factor.
El enfoque más corriente para evaluar la validez de constructo ha sido ver si los
diferentes instrumentos que se supone miden lo mismo tienen una alta correlación entre sí. Pero,
como la elevada intercorrelación bien puede indicar que no hay solamente una variable rasgo en
común, sino varias, entonces, la mejor respuesta a esta pregunta: ¿qué mide esta prueba?, se
presenta en forma de una lista de factores con los cuales se correlaciona. Por ello, para este tipo de
información, el método que ofrece las mejores respuestas es la validez factorial. En realidad, éste no
es sino una de las formas más amplias para evaluar la validez de constructo.
La validez congruente y factorial son dos buenos ejemplos de métodos convergentes, es
decir, que tratan de establecer que dos pruebas miden el mismo factor. Sin embargo, una prueba
psicológica no sólo debe correlacionarse con otras que tengan como fin medir el mismo factor, sino
que también deberá carecer de relación con pruebas que midan otros constructos diferentes. Este es
el aspecto “divergente”. Por ejemplo, las calificaciones de una prueba propuesta como medida de
creatividad no deberán tener una alta correlación con las calificaciones de una prueba de inteligencia.
Es decir, para que sea válida, una prueba psicológica debe medir un constructo que pueda demostrar
que es independiente de otros constructos establecidos.
Validez experimental: Efectos inducidos experimentalmente.
Se averigua cómo responderá una prueba a los cambios de las condiciones externas cuando
estén presentes las variables inducidas experimentalmente. Por ejemplo, podría administrarse un test
de ansiedad a un individuo en un estado de tensión inducido experimentalmente, y las puntuaciones
de ansiedad del test se correlacionan con otras medidas de ansiedad durante y después del test.
Correlación items –test : Análisis de items
Los ítems o reactivos son unidades básicas que configuran el material o contenido de un
instrumento de medición. Esta unidad se compone de la formulación del problema o situación y de la
o las respuestas al mismo.
El análisis de items es un procedimiento a través del cual se evalúa la eficacia del item y esto
se hace estudiando las respuestas a cada item. Para conocer el comportamiento de cada una de
estas unidades básicas y el de su conjunto, se utilizan recursos estadísticos y la interpretación de
esta información sirve para asegurar la validez y la confiabilidad del instrumento.
El análisis de items nos da la información acerca de los siguientes puntos:
1. La dificultad del item.,
2. El poder discriminativo del item y
3. La eficiencia de cada opción.
De esta manera, la información del análisis de items nos puede decir si el item fue demasiado fácil o
demasiado difícil; qué tan bien discriminó entre los sujetos con puntuaciones altas y aquellos con
puntuaciones bajas en el test, y si todas las opciones funcionaron de la manera deseada. Un
item contribuye a la confiabilidad y a la validez de un test. Por ello, estas propiedades dependen de
los items individuales que conforman el test, a la vez la confiabilidad y la validez de los datos
determinan el valor del test. Un item contribuye a la confiabilidad del test cuando mide la misma clase
de puntaje verdadero que los otros items del test; es decir, si un item tiene una correlación positiva
con los demás items. Un item contribuye a la validez del test si mide la misma clase de puntaje
verdadero que la medida de criterio; es decir, si un item tiene una correlación positiva con la medida
de criterio.
Según Magnuson (1979), los métodos usados para el análisis de items pueden
dividirse en dos grupos principales:
1. Método de atajo, el cual investiga las diferencias entre los grupos extremos en las distribuciones y
del criterio respectivamente, en relación a su capacidad para resolver cierto item, y
2. Métodos que determinan el grado de relación, mediante un coeficiente de correlación.
23
NORMAS
En las pruebas psicológicas es poco frecuente trabajar con las calificaciones directas obtenidas por
un sujeto o por un grupo, sino más bien se procede a transformar esos puntajes con la finalidad de
hacerlos interpretables. Hay dos tipos básicos de puntajes derivados o transformados:
1) Las calificaciones relacionadas con las normas. En las cuales se compara el rendimiento del sujeto
con el obtenido por otras personas que conforman el grupo de referencia normativo; y
2) Las calificaciones relacionadas con las consecuencias. Están constituidas por aquellos
tipos de puntajes que expresan la ejecución de un sujeto en función de una conducta o calificación
pronosticada. Aquí consideraremos diferentes variantes de las calificaciones relacionadas con las
normas.
Media y desviación estándar del grupo. Cuando la puntuación bruta sufre una transformación
estadística teniendo como base la media y la desviación estándar del grupo, se dice que las
puntuaciones brutas han sido convertidas a puntuaciones típicas o estándar. Las puntuaciones
típicas son importantes porque:
(a) para toda prueba y para todo grupo proporcionan la misma media y desviación
estándar;
(b) muestran la misma estructura de la distribución de las calificaciones brutas;
(c) permiten la comparación intergrupos o interpruebass; y (d) pueden tratarse
matemáticamente. Se dice que son calificaciones estándar lineales entre las que destacan
la calificación Z y la T.
1) Calificación Z. Es la base de las calificaciones estándar. Las demás calificaciones
estándar lineales se obtienen a partir de ella. Una calificación es la desviación que tiene una
calificación bruta de la media en unidades de desviación estándar. Las calificaciones tienen una
media 0 y una desviación estándar 1.
Una de las desventajas de estas calificaciones es que la mitad de las puntuaciones son
negativas y se expresan en puntos decimales, lo cual hace muy engorroso los cálculos. Por ello, se
transforman por lo común a otras calificaciones, para así obtener un resultado más exacto y
accesible. Una de las unidades estándar lineales más comunes es la escala T.
2) Calificación T. Su diferencia de la calificación Z es que, en ésta, hay una media de 50 y
una desviación estándar de 10. Su fórmula es:
T = 50 + 10 ( Z )
Puesto que la multiplicación por o suma de una constante no destruye las relaciones en la escala, las
relaciones entre las calificaciones T serán las mismas que las calificaciones brutas.
Este método evita números negativos y las fracciones decimales. Una de sus limitaciones es
que en muchos usos prácticos de la prueba una unidad tan fina como 0.1 desviación estándar puede
ser considerada un refinamiento excesivo y quizá todo lo que se necesita sea discriminaciones más
gruesas.
Rangos del grupo. Estas calificaciones se basan en el número de personas más altas y más
bajas, en vez de utilizar un valor de calificación específico. Entendemos por rango la posición relativa
de una calificación bruta a lo largo de la curva normal; es decir, la primera para la alta o mejor, la
segunda para la que sigue, etc.
Los percentiles representan este tipo de puntajes derivados. Un percentil es cualquiera de los
99 puntos de igual amplitud en que se divide una distribución de frecuencia dentro de un grupo de
100.
Un rango percentil es la posición relativa de un individuo dentro de un grupo específico. Un
rango percentil se define como el porcentaje de personas del grupo normativo que obtiene
calificaciones más bajas. Es decir, si un rango percentil es 78, indica que el 78 % de las personas del
grupo normativo obtuvieron calificaciones más bajas. En otras palabras, el percentil indica la
clasificación relativa de la persona en porcentajes.
Un percentil representa un orden en la ejecución, expresado en porcentajes. Por este método
de cálculo, la persona que se halla exactamente en el medio del grupo recibe el percentil 50. Este
percentil se llama mediana, indicando el rendimiento de los miembros más representativos del grupo.
24
Una de las desventajas es que como solamente son rangos, no representan unidades iguales de
diferencias individuales.
6. CLASIFICACION DE LOS TESTS
Como sucede en otras profesiones, los tests psicológicos tienen su propio vocabulario
especial. Los tests pueden clasificarse como psicométricos o como proyectivos. Es la división más
importante y significativa. Los psicométricos se ajustan a normas cuantitativas, sus elementos son
valorados independientemente unos de otros con una puntuación numérica, su resultado final es una
medida. Los proyectivos se ajustan a normas principalmente cualitativas, sus elementos son
valorados cualitativamente en relación con el test total, su resultado es un diagnóstico. Los tests
psicométricos se refieren a carácterísticas psicológicas, concebidas como unidades más o menos
independientes. Los proyectivos se refieren en general a la personalidad total.
Un método de clasificación es la dicotomía estandarizado contra no estandarizado. Un test

estandarizado tiene instrucciones fijas para la aplicación y la calificación, está diseñado por creadores
de tests (expertos en el campo) y se aplica a un grupo representativo de la población, para quienes
está dirigido el test. Distintos tipos de calificaciones transformadas, o normas, pueden calcularse a
partir de las calificaciones brutas de los tests de este grupo de muestra (el grupo de estandarización)
en personas a quienes se les aplica; estas normas sirven como base para interpretar las
calificaciones a personas a quienes se les aplica subsecuentemente. Incluso más comunes que los
tests estandarizados publicados son los tests o instrumentos no estandarizados de los salones de
clases, que por lo general están diseñados de manera informal por los maestros de escuela.
Los test también se clasifican como individuales o de grupo. Un instrumento individual, como
la Escala de Inteligencia de Binet-Simon, se aplica a una persona a la vez. Un instrumento de grupo,
como el Test Alfa del Ejército (de Estados Unidos), puede aplicarse de manera simultánea a varias
personas.
En tanto que la dicotomía individual contra de grupo se relaciona con la eficiencia de la

aplicación; la velocidad contra poder se refiere a los límites de tiempo de un instrumento. Un
instrumento de velocidad puro consiste en varios conceptos sencillos, pero los límites de tiempo son
muy estrictos y casi nadie lo termina en el tiempo permitido. Los límites de tiempo en un instrumento
de poder son extensos para la mayoría de las personas que lo presentan, pero el test contiene
conceptos más difíciles que los de velocidad.
Una tercera dicotomía de la clasificación objetivo contra no objetivo, trata del método para
calificar un instrumento. Un instrumento objetivo tiene estándares de calificación fijos y precisos y
puede calificarlo cualquier persona. Por otra parte, la calificación de los tests de ensayo y ciertos tipos
de tests de personalidad es bastante subjetiva y los distintos calificadores pueden obtener resultados
diferentes.
Los tests también pueden clasificarse de acuerdo con el contenido o la tarea que se presenta
a quienes se someten a éstos. Algunos tests contienen sólo material verbal (por ejemplo, vocabulario
y enunciados), en tanto que otros consisten en material no verbal (por ejemplo, diagramas y
rompecabezas). También es probable que un test requiera que quienes lo presenten manipulen
objetos, como clavijas en orificios. Este tipo de instrumento se conoce como test de ejecución.
Otra clasificación amplia de los tests, es aquella de acuerdo con el contenido o con el
proceso, esto es, la dicotomía cognoscitivo contra afectivo. Los instrumentos cognoscitivos, que
tratan de cuantificar los procesos y productos de la actividad mental, pueden clasificarse como
medidas de logro y aptitud.
Un instrumento de logro, que evalúa el conocimiento de alguna materia académica u
ocupación, se concentra en el comportamiento pasado de la persona que la presenta (lo que en
realidad ha aprendido o logrado).
25
Un instrumento de aptitud centra la atención en el comportamiento futuro, es decir, lo que
la persona es capaz de aprender con una capacitación adecuada. De esta manera, las pruebas de
aptitudes mecánicas o para el trabajo de oficina están diseñadas para evaluar la habilidad y para
beneficiarse de una capacitación avanzada en las labores mecánicas o de oficina, respectivamente.
Sin embargo, el logro y la aptitud no son entidades separadas; lo que una persona logró en el pasado
por lo general es un indicador bastante adecuado de lo que puede esperarse de ella en el futuro. De
hecho, algunos psicólogos prefieren no utilizar los términos de logro y aptitud como formas de
clasificar tests, se refieren a ambos tipos de instrumentos como de habilidades.
Los instrumentos afectivos están diseñados para evaluar los intereses, actitudes, valores,
motivos, rasgos del temperamento y otras características no cognoscitivas de la personalidad. Con
este propósito, se han diseñado distintas técnicas, como la observación conductual, los inventarios de
lápiz y papel y las técnicas o dibujos proyectivos.
Ciertas instituciones y organizaciones que conservan archivos de tests psicológicos y
educativos tienen sistemas formales para clasificar estos instrumentos. Uno de los sistemas de
clasificación más comprensivos es el de The Mental Measurement Yearbook. En este sistema, los
tests se clasifican en 19 categorías amplias de contenido.
7. CLASIFICACION DE LAS PRUEBAS

PSICOMETRICAS DE EFICIENCIA
Los tests de eficiencia son instrumentos destinados a la exploración de la capacidad

intelectual y psicomotriz de la personalidad del individuo, como también, su rendimiento, su eficacia y
su adaptación. Comprenden, a su vez, dos subgrupos:
A. Test de Aptitudes y
B. Test de inteligencia propiamente dicho.
A. TESTS DE APTITUDES.
Miden el rendimiento potencial del sujeto, o el rendimiento predicho del sujeto en determinadas áreas.
Llamados test de aptitudes, a todos aquel que se refiere a las capacidades cognoscitivas y
psicomotoras potenciales del sujeto y no a su actual grado de conocimiento o competencia. Estos
test pueden definirse bien en relación con la estructura dividen psíquica del sujeto, y los llamaremos
test de aptitudes psicológicas como son los de inteligencia de 25isposición, de 25isposición25
visomotora, etc. O bien en relación a las exigencias de una determinada 25isposici externa, en cuyo
caso los llamaremos test de aptitud práctica , como son los de aptitud para las matemática , para la
ingenieria , para tornero o impresor o aviador, etc.
Entre los test de aptitudes psicológicas destacan en primer lugar los tests llamados test de
inteligencia general y en segundo lugar –a pesar de la poca importancia que se le dá – a los test que
miden diferentes características de esa inteligencia general o como suele decirse ,los test de factores
cognitivos y de aptitudes primarias, como son los de razonamiento abstracto, comprensión verbal,
fluidez verbal, facilidad ideativa, razonamiento cuantitativo , 25isposición espacial , facilidad y 25isposi
espacial , 25isposic perceptiva, memoria lógica, memoría inmediata, etc.
Con respecto a las aptitudes prácticas existen numerosos test y grupos de test (Batería) para
apreciar la 25isposición de los individuos hacia los distintos trabajos y profesiones . Ejemplo: En la
enseñanza se usan los test de aptitudes para las matemáticas, para la física, etc. Y tests más
generales que distinguen entre los sujetos más apto para el estudio de una disciplina. Por todo ello se
dividen:
A.1 .TESTS DE FACTORES Y CONDUCTAS ESPECÍFICOS.

Destinados a apreciar aptitudes intelectuales particulares. Son muy numerosos y comprenden
pruebas diversas, según los factores o conductas a considerar.. Estas ofrecen un contraste con las
pruebas de rendimiento que mide el aprendizaje resultante de las experiencias relativamente
especificas y que se enfoca en el aprendizaje del pasado – Otro modo de aclarar la definición de
pruebas de aptitudes especificas es el decir que los aprendizajes que aborda una medida de aptitud
reflejan las experiencias de toda la vida del individuo y que la finalidad de las pruebas es predecir lo
26
que se puede aprender en el futuro. Este último punto que las pruebas de aptitudes predicen el
aprendizaje futuro, es la marca crucial de la definición de aptitudes. La mayoría de las definiciones
indican que las pruebas de aptitudes señalan las capacidades para adquirir ciertas conductas o
habilidades, dadas las oportunidades adecuadas. Por eso las aptitudes son importantes ya que la
probabilidades de que se adquieran o aprendan otras conductas especificas. Lo que se pueda
aprender puede varias desde una habilidad intelectual compleja como un cálculo matemático.
A.1-1: TEST DE FACTORES ESPECIFICOS: .

En un primer rubro están los que miden los factores específicos que miden la madurez visual; motriz e
intelectual. Ejemplo: El Test Gestáltico Visomotor de Bender; el Test de Goodenough-Harris
A.1-2: TEST DE CONDUCTAS ESPECIFICOS :

En un segundo grupo, están los que miden aptitudes para conductas específicas, como la Batería de
Aptitudes para el Aprendizaje (BAPAE) (CALIFORNIA) y otras, como tests de aptitudes para el
lenguaje, para el cálculo, etc. En este mismo grupo se encuentran las pruebas que miden aptitudes
en el caso de personas sordas, ciegas, etc. Cabe recordar y considerar una prueba de aptitud de
conductas especifico solo se puede considerar como tal cuando mide los resultados de experiencias
del pasado y si su marco de referencia enfoca al futuro.
Finalmente es importante señalar lo que es una prueba de habilidad. Ya que esta ofrece un
contraste con las de aptitudes, son quienes indican el poder para poder aprender a realizar una tarea
. En otras palabras la habilidad se refiere a un estado actual y la aptitud a un estado futuro. En este
sentido la habilidad es similar al rendimiento sin embargo las habilidades y el rendimiento difieren de
que estas últimas las consecuencias de experiencias especificas del aprendizaje mientras que las
habilidades miden los resultados de experiencias de aprendizaje más amplias o generales. Entre las
pruebas de habilidades tenemos prueba de habilidades primarias
A.2 TESTS DE FACTOR G.

Son pruebas por lo general colectivas en su forma de aplicación, en las que el sujeto debe describir
relaciones lógicas de dificultad creciente. Estas relaciones son presentadas casi siempre en forma no
verbal (cifras, dibujos, etc). Tienen como finalidad apreciar la inteligencia general de un sujeto,
subyacente a todas las aptitudes particulares. Las más conocidas son el Test de Matrices Progresivas
de Penrose y Raven y el D-48 conocido como el Dominó, de amplia aplicación para la selección de
cuadros en forma colectiva y en forma individual en clínica.
B- TESTS DE INTELIGENCIA PROPIAMENTE DICHOS.

Exploran el nivel intelectual o algunas de las funciones intelectuales en particular (memoria, juicio,
razonamiento, etc.) y el grado de ciertos conocimientos adquiridos. En este grupo se pueden
distinguir:
B.1 ESCALAS O PRUEBAS DE DESARROLLO.

Son instrumentos de medida que buscan identificar la edad mental y el cociente intelectual en niños y
adolescentes, así como hacer comparaciones entre la edad mental y la edad cronológica, con la
finalidad de situar al sujeto en lugares más avanzados o más retrasados en relación al promedio.
Ejemplo de estas pruebas son la Escala de Inteligencia Stanford-Binet; Prueba de Slosson de
Inteligencia; Prueba de Desarrollo de Gessell; Escala de Inteligencia para Niños de Wechsler (WISC-
R).
B.2 ESCALAS POR PUNTOS O INTELIGENCIA GENERAL.
Miden el nivel intelectual desde un punto de vista estático y no desde una perspectiva de desarrollo.
Ejemplo: la Escala de Inteligencia para Adultos de Wechsler; la Escala Mc Carthy de Habilidades
Infantiles; la Prueba Gráfica de Inteligencia (PTI).
27
8. ESCALA DE MADUREZ VISOMOTOR DE BENDER

8 1. FUNDAMENTOS DE LA ESCALA
La Psicología de la Gestalt
Los fundamentos cientítícos del B.G. que son los mismos que adoptó Münsterberg para su
escala, se encuadran en la psicología de la percepción tal y como ha sido concebida por la
Psícología Gestáltica. En tal sentido, Bender tuvo como marco teórico los principios gestálticos, los
conceptos de gestalt, gute gestalt, tal y como fueron trabajados por Wertheimer (1923) quien
originalmente había utilizado los diseños - que posteriormente adaptó Bender para las láminas que
comprende su test - para demostrar las leyes de la Psicología de la Gestalt asociadas a la
percepción.
Los psicólogos de la Gestalt, entre ellos Von Ehrenfels (1859-1932); Max Wertheimer (1880-
1934); Kurt Koffka (1886-1941) y Wolfgang Kóhler (1887-1949) asumiendo una posición
"antiatomística", introdujeron el concepto de gestalt sustentando la tesis de que el todo no es igual a
la suma de sus partes, sino algo más, una estructura propia y por tanto, que el todo es en alguna
medida independiente de sus miembros. De tal manera, eran opuestos a la idea de que la
conciencia pudiera ser estudiada por el de sus elementos, situación tal que destruía la unidad de los
fenómenos que se estudiaban.
La Psicología de la Gestalt, en lo referente al campo de estudio de la percepción, se orientó
fundamentalmente a resolver cuestiones relacionadas a la organización de los datos ópticos en
figuras; al análisis del modo cómo se distinguen y producen la organización de las figuras, y a
determinar las leyes gobernantes de la configuración de las formas.
Las hipótesis de trabajo contemplaron planteamientos destinados a comprobar que las
figuras se organizan de una manera espontánea y que la configuración de las mismas se da como
una propiedad a un tiempo inherente a las figuras y a la naturaleza de la percepción, especificando
que las figuras emergen sobre un fondo en virtud de la homogeneidad, distancia, ritmo y simetría de
los miembros de la constelación de datos a los que tiende la percepción misma. Es así que las
hipótesis fueron confirmadas por medio del método de investigación experimental, concluyéndose
que la configuración e integración de las figuras no se producen por adición. sustracción o
combinación de ellas, sino por diferenciación, aumento o disminución de la complejidad interna del
patrón estimulante. Por lo tanto, es el cuadro total del estímulo y el estado de integración del
organismo lo que determina el patrón de respuesta. Por otra parte, enunciaron las leyes o principios
sobre los cuales se rige la percepción. entre ellos, la proximidad, semejanza, buena forma.
dominancia, cierre y buena continuación; los cuales se hacen presentes en cada una de las láminas
del B.G.
Para Bender, el empleo de las constelaciones estimulantes de Wertheimer, en muestras de
niños Y adultos, tuvo como objeto estudiar, la función gestáltica en diferentes condiciones de
normalidad - anormalidad. La función gestáltica es definida como aquella función del organismo
integrado por la cual éste responde a una constelación de estímulos dada como un todo, siendo la
respuesta misma una constelación, un patrón, una gestalt.
Evidentemente, lo anterior se asume al observar que la respuesta configurada no es otra
cosa que un patrón visomotor que muestra diferencias. con el patrón - estímulo por la acción de los
procesos integradores del sistema nervioso del sujeto que lo ha visoexperíenciado.
La Percepción
El aparato sensorial del hombre fija las clases de contacto a su disposición con los objetos,
sea visual, táctil, olfatívo, gustativo, etc. Sin embargo, la naturaleza del contacto con los objetos y
sobre todo la de la discriminación y significado de los mismos, está determinada por el análisis del
estado de la atención y la percepción, respectivamente.
La atención es el proceso de la selección de objetos o de complejos de objetos, eventos,
fenómenos, etc., que implica empezar un acontecimiento de la conducta o el acto de ponerse en
28
contacto psicológico con un objeto, de modo tal que éste cumple su función como objeto
estimulante. Cuando el hombre ejecuta una respuesta discríminadora al haber establecido el
contacto con el objeto, está otorgándoles significado. Por lo tanto, este acto viene a representar la
fase perceptiva de un acontecimiento psicológico.
La percepción es definida como el proceso de interpretación de los estímulos que Implica

reconocerlos, tener clara conciencia de ellos y experienciarlos como vivencias externas al Yo.
Asimismo, es concebida como un proceso de carácter constructivo por el cual el individuo organiza
los datos que le proporcionan sus sentidos, los interpreta y configura por medio de lo que ha
aprendido a través de sus experiencias previas y los recuerdos del pasado. Al respecto
Condemarín, 1979, sostiene que, el proceso total de percibir es una conducta psicológica que
requiere atención, organización, discriminación y selección y, que se expresa -indirectamente - a
través de respuestas, verbales, motrices y gráficas.
La percepción asume una serie de características, a saber: a) Cumple una función de
adaptación por cuanto provee a la persona de la orientación necesaria en su medio ambiente; b) Es
la resultante de la interacción de las condiciones del objeto-estímulo y de los factores que actúan
dentro de nosotros mismos y de los factores sociales externos; c)Es más o menos estable respecto
de un estímulo cuando éste cambie o hayan variado en alguna medida las circunstancias, d)Se da
en términos de probabilidades, dado que ciertos sucesos, por la experiencia que tenemos de ellos,
van sucediéndose conjuntamente con cierto grado de probabilidad; e) Suele ser selectiva, los
estímulos a lo que ponemos nuestra atención constituyen de por sí el foco perceptivo; f) Posee
organización (está sujeta a leves); g) Influyen en ella la maduración, el aprendizaje, el lenguaje y
sus motivaciones (motivos fisiológicos y sociales); entre otras.
La Percepción Visual
Es definida como la capacidad para discriminar y dar significado a los estímulos de índole
visual, interpretándolos en relación con experiencias anteriores.
La percepción visual no es simplemente la facultad de “ver en forma correcta" por cuanto la
interpretación de los estímulos visuales ocurren en el cerebro y no en los ojos. Sabemos que la luz al
entrar al ojo se enfoca en la retina, donde conos y bastones (órganos de la visión) son estimulados
produciéndose en éstos un cambio de composición química que desencadena el impulso nervioso
hacía el cerebro, lográndose la sensación de la luz, el color y la percepción de los objetos.
Frostig, (1980) ha señalado cinco facultades de la percepción visual, las mismas que las ha
considerado importantes para establecer la capacidad de aprendizaje en los niños.
a) Coordinación Visomotriz, es la capacidad de coordinación de la visión con los movimientos
del cuerpo o de sus partes.
b) Percepción de Figura-Fondo, es la capacidad de abstraer del campo perceptivo lo que
constituye el centro de nuestra atención (figura) de aquello que es secundario (fondo)
c) Constancia Perceptual, es la capacidad de generalizar la percepción de un objeto al darnos
cuenta que éste posee propiedades invariables tales como, forma, tamaño y posición
específicos, aunque existe variabilidad de su imagen en la retina del ojo.
d) Posición en el espacio, es la capacidad de relación entre un objeto con referencia a nosotros
mismos como observadores, cuando comprendemos el significado de los términos que
indican una posición espacial (en, fuera, arriba, abajo, antes, detrás, izquierda, derecha, etc).
e) Relaciones Espaciales, es la capacidad del observador de percibir la posición relativa de dos
o más objetos en relación consigo mismo y entre aquellos.
La Percepción Visomotora
Es definida por Münsterberg (1969), como una complicada función integrativa que comprende
tanto la Percepción como la expresión motora de la Percepción. Concebida como proceso,
comprende cuatro etapas:
a) La visión del estímulo (sensación)
b) La comprensión e interpretación de lo vísualizado (percepción)
c) La traducción de la percepción en acción (expresión motora), y
29
d) La acción motriz resultante (coordinación vísomotora).
Así, al copiar los modelos del B.G. implica psicológicamente, la organización de una serie de
movimientos enlazados en función de una totalidad percibido en forma visual. Cada movimiento está
sujeto a una organización global-compleja del campo motor de igual a igual con la configuración del
campo perceptivo. Según Paín (1974) la percepción visomotora implica pensar lo percibido como lo
actuado en términos de totalidad, es decir como sistemas coherentes cuyas partes tienen sentido en
función del todo.
Münsterberg (Ob.cit. ) afirma que, en los niños pequeños, tanto la función receptiva
(percepción visual) y la función expresiva (reproducción de lo percibido) por encontrarse en pleno
desarrollo, resultan difíciles de distinguirse, sobre todo cuando ambas funciones están todavía
ínmaduras; habiendo observado en un grupo de niños en edad escolar, seleccionados al azar, que el
ritmo de maduración en ambas funciones diferían de un niño a otro. Así, un niño pequeño puede
haber madurado temprano en la percepción, y puede percibir perfectamente la configuración total de
cada dibujo del Bender; sin embargo su función expresiva puede estar todavía inmadura y faltarle la
capacidad para reproducir correctamente lo que ha percibido. Otro niño puede ser capaz de
reproducir perfectamente en detalle, dibujos que todavía percibe incorrectamente ... sólo se puede
empezar a hablar de perturbaciones en la función receptiva o expresiva, cuando la discrepancia entre
ambas es extrema en una edad en que la mayoría de los niños ha alcanzado cierto grado de madurez
en ambas funciones.
VALIDEZ DE LA ESCALA DE MADURACION VISOMOTORA DE BENDER

La validez de un test es juzgada por los propósitos específicos que éste se propone. Como
Münsterberg diseñó su escala a fin de evaluar la madurez de la percepción visomotora y diagnosticar
la posibilidad de lesión cerebral; abordaremos este punto, en dos partes que comprenden los dos
propósitos antes mencionados.
A. Validez del B.G. para la evaluación de la Percepción Visomotora
La Escala de Maduración conformada por 30 ítems de puntuación dicotómica determinada por la

presencia o ausencia de errores en la reproducción, plantea teóricamente que un niño pueda recibir
un puntaje comprendido entre 0 a 30, indicando un puntaje alto un pobre rendimiento y el bajo puntaje
un buen desempeño.
Para la validación de la Escala, Münsterberg utilizó el método de validez relacionado con el
criterio (concurrente), para lo cual eligió como criterio el desempeño escolar medido por el Test
Metropolitan de Rendimiento.
Seleccionó una muestra de 165 alumnos, 99 de ellos pertenecían a primer grado, de los
cuales 59 se ubicaron por encima del promedio en el desempeño observado por el test Metropolitan y
40 por debajo; los 66 niños restantes eran de segundo grado, 45 tuvieron buen rendimiento y 21 bajo
desempeño. La muestra representó una sección socio-económica transversal de seis colegios de
áreas urbanas, suburbanas y rurales de Estados Unidos.
Los datos del análisis de los ítems respecto a la capacidad para discriminar entre un
desempeño bajo y alto fueron tratados estadísticamente con la prueba de Chi cuadrado, que mostró
que :18 de los 30 ítems eran significativos al nivel del 5% o menos y que los 12 ítems restantes
mostraban una "fuerte tendencia".
Posteriormente, Münsterberg halló que las calificaciones Y los puntajes obtenidos en el test
de rendimiento de Metropolitan durante el primer grado se correlacíonaban significativamente con el
rendimiento en tercero y sexto grado (r:061, r:071, respectivamente), lo cual asociado con los
resultados encontrados al validar la escala, le permitió postular la hipótesis siguiente: "Los Puntajes
del B.G. pueden -predecir no sólo el rendimiento en los dos primeros grados sino también en Ios
siguientes”.
30
Esta hipótesis fue verificada por tres investigaciones cuidadosamente diseñadas que realizaron
Münsterberg y colaboradores, en tres muestras diferentes de niños en edad escolar y cuyas
conclusiones fueron las siguientes:
1. El puntaje obtenido en el B.G. al comienzo del primer grado permite pronosticar el rendimiento
de ese niño en primero, segundo y tercer grado, medido por el test Metropolítan de Rendimiento
escolar. Asimismo, tiene una alta correlación con el juicio del profesor sobre el rendimiento del
alumno al término del primer grado
2. El puntaje obtenido en el B.G. al comienzo del segundo grado se correlaciona estrechamente

con los puntajes de los tests de rendimiento de segundo y tercer grado y con la estimación del
profesor al final del segundo grado.
3. El B.G. administrado en tercer grado se correlaciona con la estimación del rendimiento hecha
por el profesor al final del segundo grado.
4. Los puntajes del B.G. en cuarto grado son indicadores deficientes del rendimiento actual en ese
grado, en términos de la estimación del profesor.
5. Los puntajes obtenidos en el B.G. al comienzo del jardín de infantes son poco confiables para
pronosticar cuáles serán los niños que se clasificarán como muy buenos al final del año lectivo,
en base a la estimación de sus profesores.
Cabe mencionar, que Münsterberg y colaboradores realizaron una serie de estudios
correlacionales que directa e indirectamente tienen que ver don la validez de los ítems de la escala, y
que mostraron que el B.G. es un instrumento útil para evaluar la madurez para el aprendizaje y que
su eficacia aumenta cuando se lo emplea en combinación con otros tests de madurez para el
aprendizaje.
Por otra parte, analizaron los puntajes en el B.G. y su relación con la inteligencia así como
con los problemas de lectura y aritmética, indicando que el B.G. puede ser utilizado como un test
breve de inteligencia no verbal, para determinar qué niños de jardín de infantes están en condiciones
de aprender a leer así como para indentificar las probables dificultades en aritmética.
En Lima, Chang (1990) comprobó la validez de la Escala de maduración haciendo uso, al
parecer del método de validez concurrente, eligiendo como criterio externo dos tests de inteligencia :
El Test de Matrices Progresivas de Raven, escala especial y el Test de Goodenough-Harris.
Para dicho estudio seleccionó 100 varones y niñas, de un total de 2,080 niños que
constituyen la muestra (no se indica el criterio de selección) pertenecientes a las clases sociales
media y baja. Los puntajes obtenidos en cada test usados como criterios externos y en el test de
Bender según la Escala de Maduración se correlacionaron aplicando el método de producto-momento
de Pearson. Los coeficientes de correlación obtenidos entre los puntales de los tests de Bender y
Raven fue de -0.49 y entre los puntales de los tests de Bender y Goodenough-Harris fue de -0.40 .
Ambos coeficientes resultaron negativos por los diferentes, sistemas de puntuación que se utilizan en
los tests usados como criterios (aciertos) y de Bender (errores) y muestran un grado moderado de
asociación.
A nuestro juicio, este estudio de validación de la Escala de maduración de Munsterberg, no
ha estado dirigida a validar la Escala respecto a sus fines diagnósticos de¡ nivel de maduración de la
percepción visomotora. Los resultados encontrados por el autor al relacionar los puntales obtenidos,
en la muestra de estudio, en la Escala de Maduración y dos tests de inteligencia, expresan mas bien
que dicha Escala podría ser usada como una escala de inteligencia no verbal, con la cautela del
Caso. Por ello, amerita realizar estudios de validación que utilicen criterios externos ad hoc al
propósito que persigue la escala de maduración.
B. Validez del B.G. para el diagnóstico de Lesión Cerebral

Antes de exponer el procedimiento de validación que utilizó Münsterberg, se analizaran
algunas consideraciones de carácter teórico-práctico acerca de los alcances del B.G. en relación al
diagnóstico de lesión cerebral.
De las múltiples investigaciones que se han realizado con este reactivo visomotor, la mayoría de
estudiosos están de acuerdo en que los protocolos de respuesta de los lesionados cerebrales
cualquiera sea su edad o inteligencia, muestran diferencias estadísticamente significativas, rasgos
31
más primitivos y mayor inmadurez que los de las personas sin lesión cerebral. Respecto a los
efectos que la lesión cerebral puede ocasionar, Bender, señala que la percepción visomotora es una
función integral de la personalidad como un todo, que está controlada por la corteza cerebral.
Cualquier perturbación en este centro máximo de integración modificará la función integradora del
individuo llevándolo a un nivel inferior y más primitivo. El efecto de la lesión cerebral dependerá de
varios factores, entre los que figuran: el lugar y extensión de Ia lesión cerebral, el nivel de
maduración previo a la lesión y el ajuste emocional y social de la persona.
También se han realizado muchos estudios de carácter intensivo, en niños y adultos
lesionados, utilizándose diversos reactivos psicológicos, encontrándose entre ellos el B.G., con la
finalidad de aislar signos asociados a la lesión cerebral. Algunas resultados han demostrado
que existen signos de lesión específicos (rotación, distorsión, integración pobre, perseveracíón,
sustitución de puntos por líneas, desplazamiento, etc), mientras que otros resultados indican que la
evaluación completa de cada instrumento empleado es imprescindible para el diagnóstico de lesión
cerebral y que no deben considerarse signos aislados como indicadores de dicha lesión.
Münsterberg con el objeto de validar su escala de maduración diseñó un estudio para
determinar si el B.G. como un todo o en parte podría discriminar entre niños con lesión cerebral y sin
ella, comprendidos entre los 5 y los 10 años de edad; relacionados con los resultados de las variables
edad e inteligencia.
Para tal fin, seleccionó una muestra de 384 alumnos de educación primaria, de los cuales 103
habían sido diagnosticados con lesión cerebral y 281 no la presentaban. El grupo comprendía la
escolaridad desde jardín de infantes hasta quinto grado, con la excepción de 16 alumnos que
concurrían a centros de educación especial para niños con lesión cerebral. A todos los niños con
lesión cerebral se les practicó el diagnóstico sin utilizar pruebas psicológicas, empleándose los
criterios médicos. También se procedió a establecer los coefientes intelectuales derivados de la
aplicación de las escalas de inteligencia de Wechsler (WISC) y Stanford-Binet, respectivamente,
obteniéndose para este grupo cocientes intelectuales entre 75 y 122 con un promedio de 90. El B.G.
fue administrado individualmente y todos los protocoloes fueron tabulados con la escala de
maduración.
Los puntales obtenidos por los niños de cada grupo fueron comparados de tres maneras:
A) Analizándose el puntaje total obtenido por cada niño, para lo cual se usó el estadístico Chi
cuadrado a fin de establecer las comparaciones del número de niños de cada grupo, cuyos
puntales eran superior o inferior a la media de su nivel de edad, encontrándose valores
significativos al nivel del 1%.
B) Examinándose cada ítem de puntuación respecto a su importancia diagnostica en relación con
la edad del niño. Se aplicó también la prueba de chi-cuadrado para establecer las
comparaciones del número de niños, en cada grupo, cuyos protocolos presentaban un ítem de
puntuación en términos de presente o ausente. Se omitieron los ítems 12b (fig.3);18b y 19
(fig.6), porque las frecuencias teóricas no llegaron a la frecuencia crítica necesaria para
emplear el chí cuadrado.
C) Investigándose la relación entre CI y los puntajes en el B.G. de los niños con lesión cerebral.
La prueba chí-cuadrado permitió comparar el número de niños con un Cl promedio o inferior al
promedio y con puntajes en el Bender superiores o inferiores a la norma para su nivel de edad.
Se encontraron diferencias estadísticamente significativas entre ambos grupos, al nivel del 10
%.
Las conclusiones, para la investigación de las comparaciones, efectuadas se expresan a
continuación en el orden anteriormente propuesto.
A) a.1. La gran mayoría de los niños con lesión cerebral mostraron una pobre percepción
vísomotora, pero alrededor de un cuarto de los niños del grupo control también lo
presentaron.
a.2. Un Bender pobre indica la posibilidad de daño cerebral especialmente si el puntaje
obtenido está a más de una desviación estándar de la norma para un determinado nivel
de edad.
a.3. Un puntaje pobre puede ser resultado de variados factores, entre ellos, enfermedad,
fatiga, problemas visuales, perturbación emocional, debilidad genética en la percepción
32
visomotora, maduración lenta. Sin embargo, el más importante es la inmadurez o
disfunción en la percepción visomotora.
a.4. Nunca debe hacerse un diagnóstico definitivo de lesión cerebral basándose sólo en el
puntaje directo total. Y de igual modo, no puede descartarse la existencia de lesión
cerebral porque se dé un buen desempeño en el B.G.
B) b.l. Ninguna desviación se dio exclusivamente en el grupo de los niños con lesión
cerebral y en el grupo de control. Sin embargo, distintos ítems de puntuación adquieren
significación diagnóstica en diferentes niveles de edad, dependiendo esto de la dificultad de un
dibujo o parte del mismo.
b.2. El número de ítems que puede discriminar entre niños con lesión cerebral o sin ella,
aumenta a medida que aumenta la edad. Pocos ítems tienen valor diagnóstico en el
nivel de los cinco o seis años de edad.
El mismo examinador puede confrontar estas conclusiones remitiéndose al capítulo III,
parte E: diagnóstico de indicadores de lesión cerebral: asimismo, observando los ítems de puntuación
categorizados respecto a la significatividad de cada uno de ellos como indicadores de lesión cerebral
c.1. La relación entre el CI y el Bender no es muy estRecha en el caso de niños con lesión cerebral.
c.2. Los niños con lesión cerebral, como grupo, tienden a comportarse pobremente en el
Bender independientemente del CI que hayan obtenido.
C.3. Generalmente un buen desempeño en el Bender, indica la probabilidad de un Cl por lo
menos promedio para los niños con lesión.
Factores que incrementan la validez de la Escala de Maduración para el diagnóstico de Lesión

Cerebral: Münsterberg ha realizado varios estudios acerca de una serie de factores o variables de
conducta que se relacionan con la tarea de ejecutar las representaciones del Bender y que sirven de
criterios al examinador para aumentar la validez del diagnóstico de los índicadores asociados a lesión
cerebral.
Factor Tiempo
Observaciones efectuadas durante la administración del B.G. respecto a la gran facilidad,
rapidez o lentitud en la cantidad de tiempo que empleaban algunos niños al completar la prueba,
llevaron a Münsterberg a pensar que el factor tiempo parecía tener alguna significación diagnóstico.
Es así que planificó un estudio con el objeto de estimar el tiempo promedio requerido por los niños
para terminar la prueba.
La muestra de estudio la conformaron 339 niños comprendidos entre 5 años y 9 años 6
meses de edad, procedentes de 16 aulas cuya escolaridad fluctuaba desde jardín de infantes hasta
cuarto grado; a quienes se les administró el test de Bender sin saber que se les registraba el tiempo.
Los resultados se expresan en tiempos promedios (en minutos y segundos) y en límites críticos de
tiempo (minutos redondeados), estos últimos implican una desviación estándar por encima o por
debajo de la medía por cada intervalo de edad. (Ver Tabla 1)
Los resultados indican que el tiempo es significativo sólo cuando el niño termina en más o
menos tiempo que aquel que es indicado por los límites críticos de tiempo para un intervalo de edad
dado. Las interpretaciones suelen hacerse en dos sentidos: uno, cuando el tiempo es demasiado
corto, lo cual se asocia a impulsividad y falta de concentración adecuada o también a falta de
esfuerzo sostenido para llevar a cabo la prueba demasiado de manera óptima; otro, cuando el tiempo
es largo, cuya implicación diagnostica estriba en el perfeccionismo o la compulsividad en la
percepción visomotora, o ambas cosas.
TABLA 1
EDAD TIEMPO MEDIO Y LIMITES CRITICOS DE CRITICOS
5a 5 min. 13 seg. 3 a 10 min.

5a. 6m. 7 min. 0 seg. 4 a 10 min.
6a. 6min. 20 seg. 4a 9 mín.
6a. 6m. 6min. 33 seg. 4a 9 min.
7a. 6min. 2'7seg. 4a 9 min.
7a. 6m. 6min. 53seg. 4a 9 min.
8a. 6mín. 45 seg. 4a 9 min.
9a.-- 6m. 6min. 5 seg. 4a 9 min.
9a. 6min. 17 seg. 4a 8 mín.
33
9a. 6m. 6min. 30 seg.. 4a 8 mín.
Munsterberg (1960).
La cantidad de tiempo que emplean la mayoría de los niños con lesión cerebral, como grupo,
según observaciones realizadas por Münsterberg, es la misma que utilizan los niños normales;
cobrando importancia diagnostica cuando el lapso en el que termina un niño es extremadamente
corto o prolongado. Münsterberg afirma que, los niños con lesión cerebral se caracterizan por su
impulsividad y por la tendencia a tener escasos controles; debiéndose considerar la probabilidad de
impulsividad asociada con lesión cerebral combinadamente con otros factores cuando los dibujos
sean realizados en menos de cuatro minutos. Asimismo, cuando el niño se rija por una conducta
compulsiva, la misma que puede servir al control de la ímpulsividad, se deberá explorar la presencia
de problemas subyacentes al control de los impulsos asociados con lesión neurológica.
Factor Espacio
Este factor es objetivado por el indicador denominado, “expansividad", el mismo que se define como
el uso que se hace de dos hojas o más, al dibujar las figuras del Bender. Münsterberg lo ha
observado muy a menudo en niños en edad preescolar y también en aquellos niños en edad escolar
que son demasiados ¡repulsivos y con escasos controles internos.
A fin de demostrar que el indicador de expansividad era característico de los niños con lesión
cerebral, se diseñó un estudio en un grupo de niños con lesión neurológica y en un grupo control,
cuyas conclusiones demostraron que la expansividad, se da en los Protocolos de los niños lesionados
de cualquier edad, y en el grupo control sólo en los niños en edad preescolar.
Se recomienda investigar la posible existencia de una lesión cerebral cuando se observe el
empleo de dos o más hojas de papel para completar el Bender en los niños en edad escolar.
Indagación de los errores cometidos
Es aconsejable con el objeto de distinguir si las dificultades por parte del niño, se deben
primordialmente a problemas en la función receptiva o expresiva o en ambas.
El procedimiento consiste en muestrear los errores cometidos por el niño, solicitándole dibujar
nuevamente y averiguando sí él se da cuenta de los errores que hay en sus representaciones. Si el
examinado expresa que el dibujo errado es igual al de la tarjeta-estímulo, pensaremos después de
analizar otros signos concurrentes de que se trata de un transtorno perceptual; sin embargo, si el niño
critica su producción gráfica estaremos ante una dificultad de índole motora.
Observación de la Conducta
Durante la administración de la prueba es muy conveniente registrar las observaciones pertinentes a

las conductas de los examinados, por cuanto contribuyen a resaltar las dificultades, que de una u
otra manera tienen que ver con el diagnóstico de la madurez de la percepción vísomotora y que son
utilizados como medios para compensar ciertos problemas ligados a aquella función.
Entre las conductas susceptibles de ser observadas, tenemos:
a) El trazo de la figura con el dedo antes de empezar a dibujar.
b) La puesta del dedo en cada parte de la lámina a medida que va graficando la figura.
c) La observación de la lámina sólo una vez y por corto tiempo, para luego proceder a dibujar de
memoria.
d) Rotación de la lámina y del papel en él que el dibujo es copiado en posición rotada, retornando
luego el papel a su posición original al terminar el dibujo.
e) Verificación continuado del número de puntos y círculos sin mostrar seguridad a pesar del
número correcto.
f) Dibujos apurados, impulsivos. Borrado espontáneo con corrección posterior que conlleva
mucho trabajo.
g) Expresión de disgusto por los dibujos mal realizados con repeticiones consecutivas por
corregirlos, sin éxito.
34
Estas conductas, los factores antes mencionados, el sistema de valoración de la escala de
maduración por medio del puntaje total e Individual de los ítems, más el conocimiento y experiencia
clínica del examinador, harán del Bender un Instrumento valiosísimo para la interpretación de los
resultados con fines diagnósticos.
3. CONFIABILIDAD DE LA ESCALA DE MADURACION

La confiabilidad Implica la veríficabilidad de la estabilidad, consistencia o equivalencia de un
instrumento de medida, usando un mismo test en diferentes ocasiones, formas paralelas,
calificaciones independientes o tratamientos estadísticos específicos.
Para el estudio de la confiabílidad de la escala de maduración Münsterberg consideró dos

métodos: a) De consistencia, b) Test-retest.
a) La consistencia de los resultados fue determinada en base a la valoración independiente de
30 protocolos de niños, por parte de cuatro examinadores, los cuales enviaron copias de las
reproducciones del test de Bender a Münsterberg para su respectiva evaluación. Los resultados de
los puntajes asignados por los cinco calificadores fueron analizados en base al uso de la correlación
producto-momento de Pearson, que mostró coeficientes de correlación altamente significativos
( 0.91 ; 0.93 ; 0.93 ; 0.93 ; 0.95, respectivamente) comprobando la alta -confiabilidad del sistema de
puntuación de la escala. b) La estabilidad de los resultados se estableció administrando la escala a
un grupo de niños los cuales fueron retestados cuatro meses después, intervalo de tiempo
considerado "bueno" para reducir los efectos de la práctica así como los efectos de la maduración en
la percepción visomotora.
El procedimiento contempló la selección de niños provenientes de dos aulas de jardín de
infantes y dos aulas de primer grado. Luego de administrarse la prueba, las muestras de conducta
fueron valoradas según la escala de maduración. A fin de obtener el coeficiente de confiabilidad de
estabilidad entre los puntajes obtenidos en la primera y segunda aplicación se empleo el coeficiente
de correlación de rangos de Kendall. Todas las correlaciones fueron significativas al nivel del 0.01
resultados que hacen de esta escala un instrumento altamente confiable.
Por otra parte, Münsterberg realizó varios estudios de re-test en niños con lesión neurológíca
con el objetivo de inferir el ritmo de maduración de la percepción visomotora. Los intervalos de
tiempo entre el test y el retest fluctuaron entre tres meses a tres años. Los resultados encontrados
mostraron que el mayor valor del re-test en los niños lesionados estriba en descubrir posibles
regresiones así como la existencia de enfermedades cerebrales progresivas.
En Lima, Chang (1990) comprobó la confiabilidad de la Escala de maduración, utilizando dos
métodos: a) de consistencia, y b) test-retest.
El primer método, fue establecido por el grado de acuerdo en la calificación entre dos
psicólogos quienes en forma independiente puntuaron 100 protocolos (50 de varones y 50 de niñas),
en base a las reglas de cuantificación establecidas por Münsterberg para cada uno de los 30 ítems de
la Escala.
Los puntajes asignados por ambos psicólogos se correlacionaron por medio del coeficiente
producto-momento de Pearson, obteniéndose un coeficiente de consistencia de 0.88, de alta
significación estadística.
El segundo método, consistió en determinar la estabilidad de los puntajes en base a la
aplicación de la Escala a 100 niños (50 varones, 50 mujeres) en un lapso de 7 días entre la primera y
segunda administración. El coeficiente de correlación fue obtenido por el método producto-momento
de Pearson, obteniéndose sólo un grado moderado de estabilidad (0.55). Al parecer ha influido el
corto lapso de tiempo entre una y otra aplicación, ya que en siete días los niños pueden recordar
claramente los dibujos que realizaron y menguar su interés y motivación al tener que repetir los
dibujos.
4. DATOS NORMATIVOS
En Estados Unidos, los datos normativos, para la Escala de Maduración del Bender, se
obtuvieron en el año 1959, en una muestra normativa conformada por 1,104 alumnos (637 niños y
467 niñas), que provenían de zonas urbanas, suburbanas y rurales de estados del Este y medio
35
Oeste. El grupo normativo estuvo constituido por sub-grupos de edades comprendidas entre los 5
años a 10 años 11 meses, desde jardín de infantes hasta el quinto grado escolar.
La administración del Bender fue realizada en forma individual, rigiéndose la calificación
según las reglas de la escala de maduración.
Los resultados se expresan en: A) Normas de Edad: por puntajes promedios de error y
desviaciones estándares, con sus respectivos límites críticos para la muestra total en cada nivel de
edad, que permiten efectuar las comparaciones del puntaje directo del niño examinado con el de otros
niños de su misma edad cronológica y nivel perceptual. Se observa que no se ofrecen datos
normativos separados para niños y niñas, por cuanto no se dieron diferencias significativas entre
ellos. B) Normas de grado: expresan los puntajes medios, desviaciones estándares y límites críticos
de desviación normal de los niños que empiezan jardín de infantes hasta el cuarto grado, a fin de
comparar el resultado del niño examinado con los de su propio grupo de grado escolar.
En Lima, Chang (1.990) estandarízó la Escala de Maduración en una muestra de 2,400 niños
(1,200 varones y 1,200 niñas) cuyas edades fluctuaban entre los 5 años a 10 años 11 meses,
procedentes de Centros educativos del nivel inicial y primario, pertenecientes a la clase social alta,
media y baja.
Respecto a la selección de la muestra, no se señala la técnica de muestreo utilizada, no
pudiéndose inferir su adecuada representatividad, sólo se aprecia la distribución muestra por edad,
clase social y sexo, que el número de participantes por sexo es la misma (1,200), que por cada grupo
de edad diferenciado cada 5 meses, se ha asignado 200 niños en número idéntico por clase social
( Alta 10, Media 30, Baja 60).
Los datos normativos (véase Tabla 2) se expresan en resultados estándares en términos de
las medías aritméticas de errores cometidos y desviaciones estándares, en doce grupos de edad
diferenciados en intervalos de cinco meses. No encontró diferencias significativas por género y clase
social.
Según Chang (1990) la evidente disminución obtenida en los puntajes promedios tanto en
varones como en mujeres entre los 5 y 9 años de edad, expresan el efecto de la maduración de la
función perceptíva vísomotora de los niños. Asimismo, informa que a los 9 años de edad, la mayoría
de los niños pueden copiar las figuras del Bender sin cometer "gruesos" errores, y que a partir de esta
edad un puntaje de cero sólo indica que la percepcíón visomotora de un niño se encuentra dentro de
la norma para su grupo de edad.
Ráez et al (1985) realizaron una investigación haciendo uso de la Escala de maduración de
Münaterberg, con el objetivo de establecer la relación entre maduración y edad, sexo y nivel
socioeconómico, en 1,019 niños comprendidos entre 5 años a 10 años 11 meses.
Los autores no encontraron diferencias significativas entre maduración, sexo y nivel
socioeconómico, resultados coincidentes con los efectuados por Münsterberg (1960) y Chang (1990).
Las relaciones establecidas entre maduración y edad permitieron comprobar el carácter
evolutivo de la Escala hasta los 9 años de edad, tal como lo señalan las investigaciones de
Münsterberg y Chang.
Entre las conclusiones de dicho estudio Raez et al plantean la necesidad de usar normas que
correspondan a nuestra población, por las marcadas diferencias encontradas en los puntajes
promedios de la muestra de niños de Lima con los de los niños de Estados Unidos.
Asimismo, señalan que la tabla confeccionada con los resultados estándares de la muestra
de estudio no debe ser utilizada para fines diagnósticos, debiendo limitarse su uso a la detección de
deficiencias en el proceso de maduración visomotora. Nosotros planteamos que dichos resultados
estándares que semejan datos normativos, no debieran ser utilizados para el fin de detección
planteado ni mucho menos para un fin diagnóstico ya que los resultados no son producto de una
estandarización. Es preciso tener en cuenta que la estandarización de un test es un proceso
psicoestadístico por el cual se establecen normas de administración, calificación y de comparación,
previa comprobación empírica de la validez y confiabilidad para un grupo cultural determinado, y que
el diseño de investigación empleado debe ser eminentemente psicométríco.
36
UNIDAD V:
PRUEBAS PSICOMETRICAS DE EFICIENCIA : CONDUCTAS ESPECIFICAS
PRUEBA DE MADUREZ MENTAL DE CALIFORNIA SERIE PRE PRIMARIA
FACTORES
 MEMORIA
 RELACIONES ESPACIALES
 RAZONAMIENTO LÓGICO
 RAZONAMIENTO NUMERICO
 CONCEPTOS VERBALES
SECCIÓN NO VERBAL
TEST Nº 1
Tiempo requerido: alrededor de 4 minutos.
Dígase: “Pongan la hoja de papel de manera que solamente se vea la primera hilera de figuras,
donde está la pelota. Cuando yo diga marquen, Uds. Harán un aspa (X) sobre las cosas
que yo he dicho”.
El examinador dibujará un círculo en la pizarra y dirá.
Dígase: “Sí yo digo que marquen un círculo, Uds. lo harán así”.
El examinador pondrá una X sobre el círculo.
Dígase: “Yo soy a leer los nombres de algunas cosas que hay en esta hilera. Escuchen
cuidadosamente y recuerden las cosas que yo diga. Uds. Deberán marcarlas después
que he terminado”.
1. “Listos, escuchen: Chompa, bote. Marquen las cosas que he dicho”.
Conceda 5 segundos. Tome el tiempo y asegúrese que los niños estén haciendo las marcas, aún
si ellas estuvieran mal hechas.
2. “Dejen sus lápices. Muevan la hoja a la hilera de abajo. Ahora escuchen las cosas que voy a
nombrar: mesa (pausa), silla (pausa), llave. Pongan una marca sobre cada cosa que he dicho.
Conceda 8 segundos.
3. “Dejen sus lápices. Pasemos a la hilera 3. Escuchen las cosas que deben marcar: la cola del
perro, el asa de la canasta, las orejas del conejo, el nido en el árbol. Ahora marquen las cosas
que he nombrado”.
Conceda 10 segundos.
4. “Dejen sus lápices. Miren la próxima hilera. Escuchen las cosas que deben marcar: un pie del
muchacho, la cola del cerdo, la tapa de la caja, el palo de la escoba, un ala del avión. Ahora
marquen las cosas que he dicho”.
5. “Dejen sus lápices. Ahora muevan la hoja hacia abajo. Escuchen las cosas que voy a
nombrar para que Uds. Las marquen: un ojo de la lechuza, la trompa del elefante, la cola de la
ardilla, un ala del cisne, la cola del mono, la canasta que el perro tiene en el hocico, el bolsillo del
saco. Ahora marquen las cosas que he nombrado”.
Cuando los niños han completado el ejercicio.
Dígase: “Ahora volteen la página donde está el Nº 3”.
TEST Nº 3
Tiempo requerido, alrededor de 2 minutos.
Dígase: “Pongan una hoja de papel dejando que se vea solamente la bebé y la niña”.
1. “Pongan una marca sobre la cabeza de la bebé”.
37
Conceda 5 segundos. Tome el tiempo que los niños emplean para hacer sus marcas y si ellas
están bien o mal hechas.
2. “Pongan una marca sobre el pie de la niña”.
Conceda 5 segundos. Compruebe si los niños han comprendido lo que deben hacer. “Ahora
muevan la hoja de papel hacia abajo”.
3. “Pongan una marca sobre la mano derecha del niño”.
Conceda 5 segundos.
4. “Pongan una marca sobre el ojo izquierdo de la niña”.
Conceda 5 segundo.
5. “Pongan una marca sobre el pie izquierdo del hombre”.
Conceda 5 segundos.
“Muevan su hoja hasta que se vean tres manos”.
6. “Pongan una marca sobre cada mano derecha”.
Conceda 5 segundos.
“Muevan la hoja hasta que se vean tres pies”.
7. “Pongan una marca sobre cada pie izquierdo”
Conceda 5 segundos. Cuando el grupo ha terminado los siete ítems.
Dígase: “Alto. Volteen la página al Nº 4”.
El examinador debe comprobar que todos los niños tengan un cuadernillo correctamente.
TEST Nº 4
Tiempo límite sugerido: 4 minutos.
Dígase: “Pongan su hoja de papel de modo que se vea sólo la primera hilera de dibujos. Miren
la primera figura, y después miren las otras figuras que hay en la misma hilera”.
El examinador debe mostrar a los alumnos los dibujos de la hilera número 1.
Dígase: “La primera figura está entre las figuras que siguen, pero está volteada, en otra
posición. Busquen esta figura y pónganle una marca”.
Permítase suficiente tiempo para marcar la figura y ayude individualmente a los niños si fuera
necesario.
El examinador debe cerciorarse de que los niños han marcado la figura oval. Las normas toman en
cuenta la ayuda brindada a los alumnos en un ítem.
Dígase: “Muevan su hoja hacia abajo, donde están los dibujos de las cajas. En esta hilera
harán lo mismo que hicieron anteriormente. Busquen la figura que es igual a la
primera y le ponen una marca”. Conceda 4 segundos.
Dígase: “Ahora sigan de la misma manera con los otros ejercicios que se encuentran en esta
página. Busquen la figura que es igual a la primera y le ponen una marca. ¡Listos!
¡Empiecen!.
Después de 4 minutos.
Dígase: “Alto. Ahora volteen la hoja al Nº 5”.
TEST Nº 5
Tiempo sugerido: 4 minutos.
Dígase: “Pongan su hoja de manera que se vea la primera hilera de figuras”.

1. “Aquí hay cuatro muchachos. Miren la primera figura…un muchacho parado. Ahora miren las
otras figuras de la misma hilera y encontrarán que una es diferente, opuesta a la primera figura.
¿Cuál es?
Espere la respuesta de los niños.
“Sí, es el muchacho que está parado de cabeza. Pongan una marca sobre esta figura porque es
opuesta a la primera”.
Conceda 5 segundos.
2. “Muevan su hoja hacia la hilera número 2. Miren la primera figura y busquen otra que sea
opuesta o diferente a esta figura y la marcan”.
Conceda 5 segundos. Después que los niños han tenido tiempo para marcar el segundo ítem.
Conceda 5 segundos. Después que los niños han tenido tiempo para marcar el segundo ítem.
38
Dígase: “Ahora pagan los otros ejercicios que hay en esta página de la misma manera que
lo hicieron anteriormente. Busquen la figura que es opuesta a la primera y cuando la
han encontrado le ponen una marca. ¡Listos! ¡Empiecen!”. Después de 4 minutos.
Dígase: “Alto. Ahora volteen la hoja”.
TEST Nº 6
Dígase: “Vean la primera hilera de figuras. Aquí hay, primero, dos figuras que se parecen en algo,
viene una raya y después otras figuras. La chompa y los zapatos se parecen en algo. ¿En
qué se parecen?. Pausa. Sí, son cosas que sirven para vestirnos. Uds. Deben buscar entre
las figuras que le siguen en la misma hilera, otra figura que se parezca en algo a las dos
primeras. ¿Cuál es?. Sí, es la gorra. Marquen la gorra. La gorra, la chompa y los zapatos
son cosas que sirven para vestirnos”.
“Ahora miren hacia abajo, donde está el sol, la luna y otras figuras que le siguen. Pongan una
marca sobre la figura que es parecida al sol y la luna. Pausa.
“Hagan de la misma manera los demás ejercicios que hay en esta página. Ponen una marca
sobre la figura que es parecida a las dos primera figuras de cada hilera. ¡Listos! ¡Empiecen!.
Circulen por el salón y vea si los niños están haciendo sus marcas –bien o
mal–. Después de 4 minutos.
Dígase: “Alto, ahora volteen la página al número 7. Doblen el cuadernillo así, para que puedan
ver sólo las figuras de esta prueba”.
TEST Nº 7
Dígase: “Pongan la hoja de papel dejando que se vea solamente la primera hilera de figuras.
En esta hilera Uds. ven una niña, un niño, una mujer, un abrigo, dos guantes y un
hombre”.
1. “En este ejercicio Uds. buscarán algo que va con la mujer, como niña va con niño. ¿Cuál
será?. Sí, es el hombre. Porque niña es a niño como mujer es a hombre. Pongan pues, una
marca sobre el hombre.
Conceda 5 segundos.
2. “Ahora miren la hilera que sigue. La bebé es a mamá como muñeca es a… (Pausa). Busquen
algo que va con la muñeca y lo marcan”.
“En las siguientes hileras Uds. harán lo mismo. Comparan las dos primeras figuras y busquen
otra que va con la tercera figura. ¡Listos! ¡Empiecen!”. Después de 4 minutos.
Dígase: “Alto, volteen la hoja al número 9”.
TEST Nº 9
Tiempo requerido alrededor de 5 minutos.
Dígase:
1. “Miren arriba solamente los tres árboles. Pongan una marca sobre el más alto de los tres
árboles”.
2. “Ahora miren los pollitos. Pongan una marca en el grupo donde hay más pollitos”.
3. “Ahora miren los gatitos. Pongan una marca sobre el gatito que está en medio de todos”.
4. “Ahora miren los barquillos de helados o trompitos. Pongan una marca en el grupo que tiene
más barquillos o trompitos”.
5. “Miren ahora el primer collar. En una parte del collar falta una perla. Pongan una marca en el
lugar donde falta esa perla”.
39
6. “Miren el segundo collar. A este collar también le falta una perla. Pongan una marca en el
lugar donde falta la perla”.
7. “Miren el último collar. A este collar también le falta una perla. Pongan una marca en el lugar
donde falta la perla”.
Cuando el grupo ha terminado el ítem 7.
Dígase: “Alto. Pongan sus lápices sobre la carpeta”.
El examinador tomará un intervalo de cinco (5) minutos antes de ofrecer la Sección Verbal de la
Prueba de Madurez Mental de California.
SECCIÓN VERBAL
TEST Nº 2
Cuento: Tiempo para la lectura del cuento: alrededor de 3 minutos.
Dígase: “Siéntense cómodamente, dejen sus lápices sobre la carpeta. Yo les voy a leer un
cuento. Escuchen cuidadosamente para que puedan recordar lo que leo, porque más
tarde Uds. deberán responder a algunas preguntas relacionadas con el cuento. El
nombre del cuento que les voy a leer es: “La mamá gata y sus gatitos”.
El examinador leerá seguidamente el cuento con voz clara, en forma pausada y en tono de voz usual.
Lea el título de nuevo antes de empezar.
“La mamá gata y sus gatitos”

“Yo les voy a contar un cuento acerca de una mamá y sus cinco gatitos.
Ellos pertenecían a dos niños, Juanita y Luis. La mamá gata y sus hijitos vivían en una canasta que
estaba en el jardín de la casa de los niños.
La mamá gata siempre estaba preocupada cuando los niños jugaban con sus gatitos.
Un día que Luis y Juanita fueron a jugar con los gatitos, encontraron que la canasta estaba vacía. La
mamá gata y sus cinco pequeños gatitos se habían ido.
Luis dijo: “Vamos a vigilar a la mamá gata, ella tiene que venir por comida”.
Los niños vigilaron y esperaron largo tiempo hasta que tuvieron hambre.
Cuando se iban a comer, vieron que la mamá gata venía por la esquina de la casa. La mamá gata
también vio a los niños, y corrió hacia afuera.
Juanita y Luis que estaban escondidos detrás de un árbol, vieron que la gata entró en un barril que
estaba cerca a la casa.
Juanita dijo: “Pobre mamá gata, debe estar con mucha hambre, ella tiene miedo de nosotros. No puede
venir a beber su leche”.
Luis puso una taza de leche junto al barril para ella.
Después que los niños almorzaron, Juanita dijo: “Vamos a ver si la mamá gata vino por su leche”.
Ciertamente, la gata estaba bebiendo su leche.
La mamá gata se dio cuenta inmediatamente que Luis y Juanita eran sus amigos, y decidió traer a sus
gatitos a la canasta donde tenían luz y calor. La gata tomó uno de sus gatitos en su boca, trepó fuera del barril y
lo llevó a la canasta. Uno por uno fue sacando a los otros gatitos fuera del barril. Pronto todos los gatitos estaban
en la canasta, Luis y Juanita que estaban mirando desde la ventana de la cocina aplaudieron con alegría.
Juanita puso una taza de leche fresca junto a la canasta.
La mamá gata en agradecimiento se paró y volvió a hacer cariño a Juanita ya que comprendió que los
niños eran sus amigos y podrían ser buenos con sus gatitos.
Después de finalizar el cuento,
Dígase: “Ahora, volteen la página al Nº 10”. El examinador ayudará a los alumnos a encontrar
el test 10, si fuera necesario”.
TEST Nº 10
Dígase: ”Pongan su hoja de manera que se vea sólo la primera fila. En esta fila hay varios
nidos con huevos”.
1. “Pongan una marca en el nido que tiene 5 huevos”.
40
2. “Muevan la hoja hasta que vean los centavos. Si tú tienes un centavo y te regalan dos
centavos más. ¿Cuántos centavos tendrás?. Pon una marca en el cajoncito que muestra cuántos
centavos tendrás.
3. “Miren ahora las crayolas. Si tú tienes dos y la maestra te regala tres más, pon una marca en
el cajoncito que muestra cuántas crayolas tendrás”.
4. “Muevan su hoja hasta que vean las flores. Pongan una marca en el cajoncito de flores que
tiene una flor menos que el cajoncito que tiene más flores”. Conceda 20 segundos.
5. “En la hilera siguiente pueden ver varios patitos que siguen a su mamá. Pongan una marca
sobre el cuarto patito que está después de la mamá.
6. “Ahora miren la hilera de los ganchitos de colgar ropa. Pongan una marca sobre la mitad del
grupo de ganchitos. En el sitio que divide la hilera en dos partes iguales”.
7. “En la última fila hay unas tortas. Hagan una marca sobre la torta que tiene suficientes partes
para 4 niños y que pueden quedar todavía 2 pedazos más en el plato”.
Después que los niños han completado el ítem 7.
Dígase: “Alto. Ahora volteen la hoja al número 11”.
TEST Nº 11
Dígase:
1. “Pongan su hoja de modo que se vea solamente la primera hilera de figuras. Uds. marcarán
las figuras que yo diga. Perro. Pongan una marca sobre el perro.
2. “Muevan su hoja hacia abajo. Sobre. Pongan una marca en el sobre.
Compruebe que los niños están haciendo las marcas, aunque estén equivocadas.
Las instrucciones a dar a los alumnos cada vez son: “Miren las figuras de abajo”. Pronuncie bien la
palabra y diga “Pongan una marca sobre…, pronuncie la palabra dos veces. Haga una pausa de 5
segundos después de cada palabra.
Test de Vocabulario
3. Bandera 4. Paquete 5. Jirafa 6. Pulsera 7. Para tirar al blanco

Dígase:“Ahora, pongan otra vez su hoja en la parte de arriba de la página”.
8. Rueda 9. Torre 10. Estatua11. Casi alcanza la niña
12. Medida 13. Carpeta vacía 14. Brazos extendidos
Cuando el grupo ha terminado el ítem 14,

Dígase: “Alto, ahora volteen la hoja. Todos en el Nº 8”.
TEST Nº 8
Dígase: “Pongan su hoja para que se vea solamente los dos muchachos. Este es un juego
para ver cómo Uds. pueden pensar. Escuchen, cuando yo diga marquen, Uds.
marcarán la respuesta correcta”.
El examinador leerá cada oración dos veces antes de decir a los alumnos que hagan
la marca dándoles tiempo para que lo hagan y cuando ellos deben proceder a trabajar
en la próxima oración.
Dígase: “Yo voy a leer cada cosa dos veces para que Uds. la comprendan bien. No marquen
hasta que diga que lo hagan”.
1. “Juan es más alto que Pedro. Pongan una marca sobre Pedro. (Conceda 5 segundos). Miren
ahora las dos niñas.
2. “María puede alcanzar más alto que Juana. Pongan una marca sobre María. (Conceda 5
segundos). Miren las figuras de los zapatos.
41
3. “El zapato de Carlos es más chico que el de Luis. Pongan una marca sobre el zapato de
Luis. (Conceda 5 segundos). Ahora miren las figuras de las tres niñas.
4. “La maestra dijo: “Yo voy a regalar una sombrilla a la niña que aprenda más palabras cada
día. Betty fue la niña que aprendió más palabras. Pongan una marca sobre Betty. (Conceda 5
segundos. Ahora miren donde están las tres flores.
5. “Miren estas flores. La flor de Ana es más grande que la de Betty, pero no es tan grande
como la flor de Juana. Pongan una marca sobre Ana. (Conceda 5 segundos).
6. “Miren los tres perros. Fido puede saltar más alto que Rintín. Duke es más alto que Fido.
Pongan una marca sobre Fido. (Conceda 8 segundos). Pongan su hoja donde están los tres
muchachos.
7. “Ahora miren los tres muchachos sentados sobre la banca. Benito está más cerca de la
puerta que Samuel. Juan está más cerca a la puerta que Benito. Pongan una marca sobre
Benito. (Conceda 8 segundos).
Después que el grupo ha completado los siete ítems,
Dígase: “Alto. Volteen a la página Nº 2”.
TEST Nº 2
Dígase: “En esta página hay varias figuras que tienen relación con el cuento que les leí
anteriormente. Miren la primera hilera de figuras.
1. “En el primer cuadro hay un perro, una gallina y una gata con sus gatitos. Pongan una marca
sobre el animal que se menciona en el cuento”.
Conceda 5 segundos.
2. “Miren el cuadro Nº 2. Pongan una marca sobre la figura que muestra a quienes pertenecía la
gata y los gatitos”.
Conceda 5 segundos.
3. “Ahora pongan una marca sobre la figura que muestra donde vivían mejor la gata y sus
gatitos”.
Conceda 5 segundos.
4. “Vean el cuadro Nº 4. Pongan una marca sobre la figura que muestra donde la mamá gata y
sus gatitos se escondían”.
Conceda 5 segundos.
5. “Pongan su hoja en la parte de arriba, en el cuadro Nº 5. Pongan una marca sobre la figura
que muestra dónde los niños se escondían para mirar a la mamá gata”.
Conceda 5 segundos.
6. “Miren el cuadro Nº 6. Pongan una marca sobre la figura que muestra dónde Luis puso la taza
de leche para la mamá gata”.
Conceda 5 segundos.
7. “Miren el cuadro de abajo. Pongan una marca sobre la figura que muestra cómo la mamá
gata llevaba a sus gatitos”.
Conceda 5 segundos.
8. “Vean el último cuadro. Pongan una marca sobre la figura que muestra lo que hizo la mamá
gata cuando Juanita le trajo leche”.
Conceda 5 segundos.
Después que los niños han terminado de marcar el último ítem,
Dígase: “Alto. El examen ha terminado. Pongan sus lápices sobre la carpeta”.
Proceda a recoger los tests.
UNIDAD VI:
PRUEBAS PSICOMETRICAS DE EFICIENCIA : FACTOR G
TEST DE INTELIGENCIA DOMINO D-48
BASES TEORICAS
El Test Dominó 48 de Pierre Pichot se basa en la teoría bifactorial (de Charles Spearman,
psicólogo inglés quien hacía 1904 estableció el método de análisis factorial para el estudio de la
42
estructura de la Inteligencia con vista a la necesidad de contar con datos empíricos que se
sustentaran en una sólida base científica.
A fin de comprender esta teoría pasaremos a exponer brevemente el método de Análisis Factorial.
El origen de este método recae en la persona de Karl Pearson y su consolidación en Charles
Spearman cuando hacia 1904 publica dos artículos al respecto.
Se le puede entender como un procedimiento experimental matemático pará analizar el complejo
conjunto de relaciones que se pueden dar entre grupos de variables medidas a través de un gran
número de tests, que se expresa en una tabla de correlaciones de cada una con las demás,
determinando el número y naturaleza de las mismas, por la extracción de las varíanzas factoriales
comunes.
A estas variables subyacentes identificadas que deberán ser en menor número que el conjunto de
medidas se les denomina "factores", los mismos que aluden a conceptos psico-matemáticos que no
son otra cosa que construcciones hipotéticas inferidas de las correlaciones entre un conjunto de tests,
que no deben ser entendidos como entidades reales medidas directamente o abstracciones
matemáticas no verbales o relaciones de explicación causal.
El análisis factorial, respecto a la inteligencia, tiene por finalidad analizar y diferenciar la organización
y estructura de las capacidades humanas e identificando las unidades o propiedades fundamentales
sobre las que se basan los tests y medidas. Es así que nos informa que pruebas o medidas
pertenecen al mismo grupo, cuales miden iguales capacidades y el grado en que lo hacen. Su
procedimiento, expuesto aquí muy "gruesamente" conlleva los siguientes pasos:
1. Seleccionar y ordenar todos los tests que se han de emplear.
2. Administrar los tests a una muestra grande de sujetos (más de 300)
3. Calificar los tests.
4. Calcular las correlaciones entre los puntajes de cada prueba y las demás,
5. Situar las correlaciones en una matriz de correlaciones.
6. Identificar los factores, éstos son las unidades en que se funda la resolución de tests y
que se reflejan en las correlaciones. Si hay correlación significativa entre dos o más
pruebas tendrán la varianza como factor común y miden un elemento común.
Claro está que los procedimientos existentes se corresponden con los métodos de análisis
factorial habidos, como el de los factores principales en que se extrae una cantidad máxima
de varianza a medida que se calcula cada factor; aquí las variables se conciben corno puntos
en un espacio de n dimensiones, las que tienen correlaciones significativas deben guardar
proximidad entre sí y estar alejadas de los que no las tienen,
El trabajo de Spearinan se desenvolvió en dos planos-cuantitativo y cualitativo dando lugar a
un análisis probabilístico de los factores Intelectuales y a un análisis de la noegénesis,
respectivamente.
Análisis probabilístico de los factores
Spearman partió de la hipótesis siguiente: Si dos o más habilidades están correlacionadas
entre sí, en alguna medida han de estar en dependencia de un factor común que determina las
correlaciones y, un factor especifico que determina la diferencia entre esas habilidades. La base de
esta Hipótesis se sustenta en el planteamiento: Las aptitudes están correlacionadas entre sí o son
enteramente independientes.
Spearman aisló los factores por un proceso de deducción lógica en base el examen de las
asociaciones entre las habilidades Infiriéndolas y no captándolas por observación directa, llegando a
identificar dos factores: el factor general: “g” y el específico "e".
El factor "g" es concebido como un concepto psicomatemático que confiere un carácter
unitario a la Inteligencia en el sentido de ser considerado un factor común y fundamental para todas
las funciones cognitivas de un mismo Individuo, de ahí que su magnitud es intraindividualmente
constante e linterindividualmente variable. Se considera que está presente en todas las actividades
del sujeto en mayor o menor Intensidad dependiendo del tipo de tarea y los mecanismos a través de
los cuales opera, "g” a nivel hipotético seria la energía mental subyacente y constante a todas las
operaciones mentales del sujeto. Al respecto, Speannan (1955) sostuvo" ... la constancia del
rendimiento total demuestra que toda la actividad mental exactamente del mismo modo que la física
consiste en las manifestaciones siempre cambiantes de una misma entidad subyacente a la cual
puede darse el nombre de energía"
43
El factor "e" también es considerado cuantitativo, variable en un mismo individuo y entre
individuos. Se le considera propio de cada habilidad particular, no muestra correlaciones con “g”ni
con con otros "e". Hipotéticamente son as máquinas e instrumentos a través de los cuales actúa y
opera la energía mental "g". Ninguna energía, sin embargo, puede trabajar en el vacío, sino mediante
un "motor u otro... los motores podrían adelantar mucho en la explicación de los factores “e"
La tesis de Speartman acerca de la energía mental y sus motores es fuertemente detenida
por él en base a una copiosa fundamentación apoyada en la física, fisiología, la psicología general y,
en el trabajo experimental.
Análisis cualitativo de la Noegénesis
Spearman, en este plano, en opinión de Piaget e lnheider (1 973) cap.3. p. 149. determinó en
parte la naturaleza operacional de los actos de la inteligencia.

Según Spearman (1965) “La tarea de delinear todo el territorio del conocimiento, a fin de
mostrar exactamente que área se halla ocupado por una operación mental o tests particulares,
comienza con las tres leyes cualitativas fundamentales y sus correspondientes procesos pues estos
indican la forma en que todo nuevo conocimiento ... que no sea simplemente reproductivo, se hace
posible” Cap.XI. p. 1 54.
Estas leyes son:
a) La Aprehensión de la propia experiencia, por la cual se sostiene que todo conocimiento se
basa en la experiencia y sólo en ella, en su aprehensión más que en la estructuración de la
misma, por cuanto una persona tiene una mayor o menor capacidad de observación de su
propia cuenta “Una persona no solamente sabe, sino también sabe lo que sabe* (Spearman,
1955. Cap XI.p. 154).
b) La educción de relaciones, esta ley sostiene que cuando un Individuo tiene en la mente dos o
más ideas cualesquiera, también posee una menor a mayor capacidad de englobar en su
pensamiento cualquier clase de relaciones esenciales entre ellas. Aquí hay que tener en
cuenta que las relaciones son educidas, vale decir, extraídas de una experiencia que las
contiene.
e) La educción de correlatos, ya implica una coordinación multiplicativa de relaciones y enuncio
que cuando una persona tiene en su mente una idea cualquiera junto con una relación,
también tiene al mismo tiempo una mayor o menor capacidad de Incorporar al pensamiento
una Idea correlativa (Spearman, 1955. Cap. Xi. p.156).
La Inteligencia para Spearman además de noegénesis es entendida como una capacidad
abstractivas o capacidad clasificatoria de contenidos mentales que lnicialmente se presentan
confusos. Es así que la noegénesis se efectúa básicamente con conceptos abstractos a diferentes
niveles.
VALIDEZ, CONFIABILIDAD Y TIPIFICACION
Para que un test pueda considerarse como instrumento científico debe cumplir con tres condiciones
principales: fiabilidad, validez y tipificidad (Yela, 1984)
Validez
La validez de¡ test Dominó 48 ha sido verificado en diferentes muestras poblacionales de Lima y del
extranjero, habiéndose utilizado diversos métodos. En Francia, Pichot y otros investigadores
aplicando el método de factorización ha obtenido índices de saturación del factor "g" de 0.88, 0. 90 y
0.92, respectivamente, lo que significa que el test D-48 es uno de los tests de factor "g" que mide con
más propiedad dicho factor.
Maillard (1967), también en Francia, utilizó el método de validez predictiva, para comprobar el uso
del D-48 como instrumento de pronóstico escolar en la enseñanza secundaria. No se cuenta con el
reporte del coeficiente de validez predictiva obtenido por este investigador, En Lima, Infante y Faura
(1971) aplicaron el método de validez concurrente, seleccionando como criterio externo el test de
Matrices Progresivas, Escala General, de John Raven. La comprobación concurrente entro las
puntuaciones en el test D-48 y el Raven, arrojó un coeficiente de validez de 0.77.
Fiabilidad
El método utilizado por la mayoría de Investigadores que han verificado la confiabilidad del Test D-48,
ha sido el de Küder-Richardson, elegido por ser el más indicado para las pruebas cuyos ítems suelen
44
ser dicotómicos, es decir que se puntúan con 1 ó un 0 según se acierte o no y, por ser un test
homogéneo en tanto mide principalmente un factor Identificado por análisis -factorial.
Aplicando dicho método, Pichot obtuvo un coeficiente de 0.86 e Infante y Faura 0.95. Ambos
coeficientes Indican una alta consistencia interna del test, señalando el estudio del primero, que el 86
% de la medida se debe a una auténtica medida y el 14 % a la Varianza de error y, en el segundo
sólo un 5% de varianza de error.
Tipicidad
El resultado de un examinado en una prueba, se expresa mediante un puntaje que describe la
ejecución en dicho test pero no indica la poca, regular o mucha inteligencia que se posee. Para ello
es necesario contar con puntuaciones tipificadas, elaboradas con exigencias técnicas para Indicar con
precisión la posición relativa del sujeto en la población a la que pertenece.
La puntuación tipificada que se usa en el test D-48 es la norma percentil, ésta indica el tanto por
ciento de sujetos del grupo normativo a que el sujeto es superior en el test en cuestión. Por ejemplo,
si un examinado ocupa el percentil 75, es superior al 75% de los sujetos que constituyen su población
de referencia. Hacer uso de la tabla para la clasificación de los sujetos en niveles de capacidad
intelectual.
Niveles de Capacidad Intelectual según Rangos
______________________________________________________
Rango Nivel de Capacidad Intelectual
I Intelectualmente Superior
II+ Definidamente Superior al Promedio
II Superior al Promedio
III+ Probablemente Superior al Promedio
III Promedio
III Probablemente Inferior al Promedio
IV Inferior al Promedio
IV Definidamente Inferior al Promedio
V Intelectualmente Deficiente
Nota.- Para ubicar al examinado en el percentil 50 y clasificarlo en la categoría mental Problamente Superior al Promedio,
su puntaje directo debe ser superior a la mediana. En el caso de la categoría mental Probablemente Inferior al
Promedio, su puntaje debe ser inferior a la mediana.
PUNTAJE PERCENTIL RANGO CATEGORÍA INTELCTUAL Dx
CLAVE DE RESPUESTA
ITEMS CLAVE ITEMS CLAVE ITEMS CLAVE ITEMS CLAVE
1 12 23 34
2 13 24 35
3 14 25 36
4 15 26 37
5 16 27 38
6 17 28 39
7 18 29 40
8 19 30 41
9 20 31 42
45
10 21 32 43
11 22 33 44
CRITEROS DE INTERPRETACIÓN
UNIDAD VI:
PRUEBAS PSICOMETRICAS DE EFICIENCIA : TESTS DE INTELIGENCIA
PROPIAMENTE DICHA
ESCALA DE INTELIGENCIA DE WECHSLER:
WPPSI-R , WISC-III Y WAIS III
ANTECEDENTES
Tres medidas diferentes de la inteligencia fueron elaboradas por David Wechsler. Wechsler
resumió sus consideraciones sobre el concepto de inteligencia señalando que "la inteligencia es la
capacidad global de un individuo para entender y enfrentarse al mundo que lo rodea” (Wechsler,
1974, p. 5). Wechsler señala que su definición de la inteligencia difiere de las concepciones de otros
es dos aspectos importantes:
1. Concibe a la inteligencia como una entidad total o global, es decir, una entidad multideterminada
y multifacética, más que un rasgo independiente y definido aisladamente.
2. Evita separar cualquier habilidad (por ejemplo, razonamiento abstracto) por muy crucial o
abrumadoramente importante que se le considere. En particular, evita equiparar la inteligencia
general con la habilidad intelectual.
La Escala Wechsler original, Escala Wechsler-Bellevue de Inteligencia (1939), diseñada

para evaluar la inteligencia en adultos, fue revisada en 1955 y denominada Escala Wechsler de
Inteligencia para Adultos (WAIS). En 1949, Wechsler elaboró la Escala Wechsler para el Nivel
Escolar (WISC). Esta Escala fue revisada y estandarizada en 1974 a su forma actual y se le llama
Escala Wechsler de Inteligencia para Niños-Revisada (WISC-R). En 1967, Wechsler desarrolló una
extensión descendente del WISC, la Escala Wechsler para los Niveles Pre-escolar y Primario
(WPPSI).
Las escalas Wechsler son pruebas de aplicación individual. Aunque las tres Escalas son
similares en forma y contenido, son escalas distintas diseñadas para utilizarse con personas de
diferentes niveles de edad. El WAIS está diseñado para usarse con individuos de más de 16 años de
edad; el WISC-R está diseñado para evaluar la inteligencia de personas de 6 a 16 años; el WPPSI se
utiliza con niños de 4 a 6 años y medio. Las tres son escalas por puntos, incluyen subpruebas tanto
verbales como de ejecución. Las subpruebas de las tres escalas se resumen en el siguiente cuadro:
Actualmente estas mismas versiones han sido revisadas y de ella se han elaborado las nuevas
versiones que remplazan cada una de las escalas, asi tenemos la versión de Wais III, Wisc III y Wppsi
-r.
CLASIFICACION DE LAS ESCALAS DE WECHSLER

ESCALA WAIS ESCALA WISCR ESCALA WPPSI
1 1 1
2 2 2
3 3 3
4 4 4
5 5 5
6 6 6
46
1
2
3
4
5
CONSIDERACIONES SOBRE EL WISC-R,

ESCALA DE INTELIGENCIA REVISADA PARA EL NIVEL ESCOLAR
Partiendo de una afirmación admitida y ampliamente atendida, los instrumentos psicométricos

de inteligencia en calidad son recursos o estrategmas psicométricos; en la táctica la realización de
tareas y preguntas estandarizadas para evaluar el potencial de un individuo de acuerdo a su conducta
efectiva en cuestión, brindan la oportunidad de designar a éste como inteligente. Ciertamente existen
diferentes definiciones de inteligencia, pero en realidad todas las escalas de inteligencia la conciben
de la misma manera, es decir, principalmente por la evaluación de las habilidades mentales del objeto
o de sus capacidades intelectuales en general. Conviene dejar claro que un instrumento psicométrico
de inteligencia o es exactamente un instrumento de habilidades mentales, y es su función ni su
intención el evaluar algunas habilidades cognitivas del sujeto, así como tampoco pronunciarse por si
mismo contra quienes se oponen al “Cociente de Inteligencia” o al concepto global de inteligencia
para apreciar la competencia educacional o vocacional. Aunque los instrumentos geométricos de
inteligencia inevitablemente hacen todo lo anterior, en opinión del autor, la información que se obtiene
de ellos es relevante solamente para hacerse extensivo lo que establece o define por encima de la
conducta intelectiva.
LA EDAD MENTAL (EM), EL COCIENTE DE INTELIGENCIA (CI) POR DESVIACIÓN Y LA EDAD DE

ESCALA (EdE)
Los cambios en los conceptos de edad mental y los CI que se introdujeron en el Manual de l
WISC de 1949 fueron ampliamente conocidos y aceptados. Sin embargo, para facilitar al lector, la
sección de este Manual de 1949 que trata estos conceptos se ha reproducido a continuación:
ABANDONO DEL CONCPETO DE EDAD MENTAL
El WISC difiere de otras escalas de inteligencia infantil en varios aspectos. Uno de ellos es la
renuncia completa al concepto de edad mental (EM) como una medida básica de la inteligencia. Este
concepto, introducido originalmente por Bidet en 1908, ha tenido una gran influencia especialmente
en E.U.A. y ha permanecido sin modificarse como base fundamental para apreciar la capacidad
intelectual. Definida operacionalmente, la edad mental es, primero, un recurso aritmético para
calificar las subescalas en términos de años y meses y, segundo, un método para igualar y comparar
las puntuaciones del instrumento (ya sea en términos de dificultad o en otra forma) de tal manera, que
cuando la puntuación obtenida del niño promedio sea transformada en una anotación numérica en
años y meses, ésta sea igual a la edad cronológica (EC).
La puntuación así obtenida es una edad mental. De este modo se espera que un niño
promedio de 6 años, obtendrá una EM de 6; un niño promedio de 10 una EM de 10, y así
sucesivamente. Hasta aquí esto es correcto. Una EM es un nivel definible de rendimiento en un
instrumento psicométrico de inteligencia. Si no fuera más allá de los objetivos para los cuales fue
elaborado, el concepto EM podría ser un método fácilmente aceptado y práctico para la definición de
los niveles de ejecución en una escala. Pero sucede que generalmente implica o asume mucho más.
Se ha considerado que la EM representa un nivel absoluto de capacidad mental, de tal

manera que una EM de 6 tiene el mismo significado sin tomar en cuenta si es obtenida por un niño de
47
6, de 10 o bien de 16 años. Todo lo anterior significa que los sujetos de diferentes edades pueden
obtener la misma puntuación en la escala. Aunque se acepte que los niveles de inteligencia son
idénticos, esto es sólo una suposición que debe ser probada. En efecto, la evidencia tanto estadístico
como clínica está en contra de tal suposición. Los maestros de psicometría han empleado mucho
tiempo, enseñando a sus alumnos, primero que la EM es una medida de nivel mental (una EM de 7
es un nivel mental de siete para todos los niños que obtengan esta clasificación) y segundo,
enseñándoles que después de todo esto no es cierto (por ejemplo, un niño de 5 años con una EM de
7 no tiene el mismo tipo de mentalidad que un niño de 10 años con una EM de 7).
Otro problema de interpretación de la EM surge cuando se calcula el CI mediante la fórmula

EM
acostumbrado CI = 100 x .
EC
Un niño de 5 años con una EM de 6, tiene un CI de 120. también un niño de 10 años con una EM de
12, tiene un CI de 120. Pero el primer niño tiene un año de adelanto en su edad mental, mientras que
el segundo tiene dos años de adelanto en su EM. Esto quiere decir que un CI que no va acompañado
por la edad en la cual ese CI fue obtenido, se presta a diferentes interpretaciones. En consecuencia a
un sujeto un CI basado en su EM, se debe consignar la edad que tenía cuando se hizo la aplicación
del instrumento; para que ese CI sea significativo.
La dificultad en el uso de las edades mentales se hizo evidente n los primeros intentos por
definir la norma para los adultos la pregunta habitual era si la edad mental de los adultos debería ser
de 16 años (como lo estableció Terman en 1916 en la revisión Stanford del Bidet) o alguna otra edad.
Esta pregunta se volvió inútil dado que la edad es esencialmente una función del instrumento
utilizado. De modo que si definimos la edad mental adulta como la edad en la cual las puntuaciones
medias ya no aumentan, se pueden encontrar instrumentos psicométricos en los cuales las
puntuaciones promedio dejan de aumentar desde los 12 años, mientras que en otros continua
aumentando hasta los 20 ó 25 años. Además, al extender (o extrapolar, para usar un término
estadístico) el concepto de edad mental, lo que fue necesario para obtener los equivalentes de EM
para las ejecuciones superiores en la escala, hubo que prescindir del concepto. La edad mental que
no sea el equivalente de la puntuación promedio de una edad cronológica real, es una contradicción
en términos. Obtener una EM de 22, en un instrumento cuya norma promedio para adultos es de 15
años sólo puede conducir a confusiones.
No es necesario decir que el usuario puede entender las limitaciones de la edad mental ya
señaladas y puede adaptarse a las dificultades acerca de las EM, de los CI y sus interpretaciones.
Pero lo cierto es que hay una gran tendencia a conservar el concepto de EM debido a su uso tan
generalizado en la planeación educativa para niños. Durante algún tiempo ciertos psicólogos pueden
sentirse incómodos al tener que abandonar la EM como un paso intermedio para calcular el CI a partir
de las puntuaciones naturales. En el examen de adolescentes y adultos el concepto de EM casi ha
desaparecido. Aún en los exámenes educativos con aplicaciones de grupo, el uso de rangos
percentilares para un grupo determinado de edades ha reemplazado prácticamente al CI derivado de
la EM.
Estas son algunas de las razones por las cuales el autor decidió construir el WISC de tal
manera que se evitarán las confusiones derivadas de la EM y que al mismo tiempo se retuvieran las
cualidades del CI.
COCIENTE DE INTELIGENCIA
POR DESVIACIÓN
Una de las innovaciones más importantes en la estandarización de esta Escala, es que por
primera vez se realizó con niños una extensa aplicación individual, donde los CI se obtuvieron
comparando la ejecución en cada subescala de cada sujeto no con un grupo de edades mixtas, sino
exclusivamente con las puntuaciones obtenidas por niños de su misma edad. Los métodos
estadísticos empleados serán descritos en el siguiente capítulo. Sin embargo, por lo pronto podemos
enfatizar dos puntos. el primer punto se refiere a que el método, de un solo golpe, ha afinado
48
considerablemente el problema de la variabilidad del CI individual. Conservando idéntica la
desviación estándar de los CI año tras año, el CI obtenido por un niño no varía, a menos que su
rendimiento actual comparado con el de otros niños de su edad varíe. Si las desviaciones estándar
no se hubieran hecho idénticas, el CI obtenido por un niño variaría considerablemente de año en año,
aunque su habilidad relativa permanecería constante. Los CI obtenidos mediante exámenes
sucesivos con el WISC nos dan automáticamente la posición relativa del sujeto dentro del grupo de
edad al que pertenece en cada período que sea examinado. Si se observaran algunos cambios,
éstos pueden atribuirse a cambios en el sujeto y no a la estructura del instrumento o a su
estandarización, debido a que las desviaciones estándar de las unidades de CI, así como las medias
de todos los grupos de edades, son idénticas. Ya no se trata de descubrir cuántos niños puntúan
arriba o debajo de un CI determinado dentro de la población, dado que el CI por desviación es, por
definición, dependiente de la distribución normal de las puntuaciones de la Escala.
A cada persona examinada se le asigna un CI el cual, a su edad representa su clasificación

relativa de inteligencia. Este CI como todos los obtenidos de manera similar, es CI por desviación,
dado que indica el grado mediante el cual el sujeto se desvía por arriba o por abajo del rendimiento
promedio de los individuos del grupo de su misma edad. El CI de 100 en el WISC es equivalente a la
puntuación total promedio para cada edad y la desviación estándar equivale a 15 puntos de CI. En
términos de límites percentilares, al primer percentil superior corresponde un CI de 65 o menor.
Cincuenta por ciento de los niños de cada edad obtendrán un CI de 90 a 110.
Con respecto al segundo punto, no se ha hecho ningún intento por definir a priori el
significado clínico y social del CI. El significado exacto de cualquier de estos valores de desviación,
como el de cualquier otra medida de inteligencia, será conocido mediante la acumulación de
estadísticas sociales y de experiencia clínica tanto con grupos normales como clínicos.
De hecho, la media (100) y la desviación estándar (15) que se escogieron, dan Cocientes de
Inteligencia, los que en su conjunto se encuentran numéricamente muy cercanos a los CI de otros
instrumentos también estandarizados, como por ejemplo el Stanford-Binet. Esto permite la
comparación de los CI obtenidos en el WISC con los CI de otras escalas, por lo menos a nivel
numérico. Sin embargo, como las escalas no son idénticas, la interpretación individual debe hacerse
siempre en términos del instrumento que se ha empleado. Los que están acostumbrados a pensar en
términos de percentiles, reconocerán por supuesto que los CI por desviación son fácilmente
traducibles a rangos percentilares. El cuadro 7 del Capítulo III será útil cuando se tengan los
resultados de otros instrumentos expresados en base a percentiles.
EDAD DE ESCALA
Al abandonar la Edad Mental como indicador no apto del nivel mental, a favor del Cociente de
Inteligencia por desviación, el autor no intenta expresar que es carente de importancia el
conocimiento de lo que se puede esperar que haga un niño en diferentes estadios de su desarrollo
mental. Para ciertos propósitos, seguramente es útil e importante el conocer qué es lo que un niño
puede o no hacer a cierta edad. Pero esta información puede ser obtenida rápidamente por una
comparación y evaluación directa de sus habilidades, como lo revelan sus puntuaciones en las
subescalas, en lugar de un inferencia indirecta proveniente de un índice total.
Para lograr este fin se realizó un análisis sistemático de todas las puntuaciones subescalares
del WISC-R por edades. Los resultados obtenidos de estos análisis se presentan en el cuadro 21
(apéndice D). Para cada una de las subescalas, el cuadro muestra los diferentes niveles de ejecución
(puntuaciones xxxxxxxxx) que pueden esperarse de edades entre 6-2 y 16 a xxxxx años (en
intervalos de 4 meses). El término Edad de Escala o Edad Escalar se sugiere para designar estas
edades asociadas a puntuaciones. El examinados que consulte las páginas 188 y 189 podrá
comparar las puntuaciones del WISC-R con las edades mentales de otras Escalas.
49
CONCEPTO GLOBAL DE INTELIGENCIA
El WISC-R no prescribe una definición particular de inteligencia, pero como todo intento para
abordar la inteligencia, pero como todo intento para abordar la inteligencia, resulta necesario discurrir
sobre los conceptos del xxxxxxxx así como los utilizados eventualmente por el usuario. Los puntos
de vista que el autor sustenta a este respecto se presentan ampliamente en “Measurement and
Appraisal of Adult Intelligence” (1958) y en otros textos. Muy brevemente, éstos quedan
comprendidos en la siguiente definición tal vez pueda impresionar al lector no de una manera tan
radical, como muchas otras definiciones que se podrían citar. Sin embargo, en un examen cuidadoso
de esta definición, encontramos que difiere mucho de otras , en dos aspectos importantes; (1)
Concibe a la inteligencia como a una entidad xxxxxxxxxxxx; esto es, como una entidad
mutideterminada y multifacética más bien que un rasgo definible de una manera única. (2) Evita
distinguir cualquier habilidad, no obstante, por ejemplo, el razonamiento abstracto se estima como de
crucial importancia. En realidad se evita equiparar la inteligencia general con la habilidad intelectual.
Por último, la inteligencia no es una clase de habilidad total, ni en realidad se puede

considerar en el mismo sentido como la memoria, la fluidez verbal, etc. más bien algo que xxxxxxx
infiere de aquellas habilidades que se manifiestan bajo diferentes circunstancias y condiciones. Se
puede inferir la inteligencia de una persona a partir de lo que piensa, habla y la forma de conducirse
con respecto a sus distintas formas de reaccionar a determinados estìmulos. En realidad, desde hace
tiempo, la apreciación de tales respuestas ha sido una forma ordinaria para determinar la inteligencia.
La creación de las escalas mentales (“mental tests”) como una invención relativamente reciente y un
nuevo método, es según los psicólogos con mejor procedimiento o al menos más científico.
Todos los instrumentos de “habilidades” son esencialmente una serie de tareas que se le
presentan al sujeto para que emita uno u otro tipo de respuesta que puede calificarse con facilidad;
esto es, una estratagema creada para permitir a un sujeto que se comunique de una manera
significativa con el examinador. Es así que la subescala de comprensión verbal es una estratagema
que permite a un sujeto responde a determinadas preguntas por medio de la utilización de palabras o
símbolos verbales; la subescala de razonamiento aritmético le permite comunicarse con el
examinador mediante la manipulación numérica o los símbolos numéricos; en la subescala
visomotora, por ejemplo Diseños con Cubos, es una tarea que permite conocer su comprensión de
los patrones visuales por una manipulación no verbal de los materiales; esto sucede en forma similar
en otras subescalas. En forma amplia, las subescalas son modos particulares de comunicación y uno
se puede referir a ellas como diferentes lenguajes. Estos lenguajes pueden ser escasa o
completamente diferentes entre los sujetos, pero esto no quiere decir que un lenguaje es
necesariamente más válido que otro. La inteligencia puede manifestarse de muchas formas, es así
que una escala de inteligencia será mejor mientras utilice más variedad de lenguajes (subescalas).
Es por esta razón que el WISC-R hace énfasis en la importancia de probar la inteligencia por distintas
vías y lo logra al reunir a las distintas subescalas. Esto también se hace porque se asume, como ya
se mencionó anteriormente, que se estima mejor a la inteligencia, no como un rasgo único y aislado,
sino como una entidad compuesta o global.
FACTORES NO INTELECTIVOS
La inteligencia general en todos los casos se contempla como un constructo multifacético.

Muchas definiciones sólo comprenden un escueto rango de muchas habilidades y aptitudes que
pueden abarcar o determinar la conducta intelectiva; éstas se refieren principalmente a destrezas
cognitivas (por ejemplo, capacidad para razonar, aprender, resolver problemas, etc.). Sin embargo, la
conducta intelectiva puede provenir además de uno o de muchos “conglomerados” de aptitudes
(factores) que son más bien de naturaleza conativa y de los rasgos de personalidad, que de las
habilidades cognitivas. Estos implican a capacidades y a los denominados “drives” y actitudes, que
50
frecuentemente son descritos en términos de sensitividad social o valores morales y estéticos. En
ellos quedan incluidos rasgos tales como persistencia, gusto, control de impulsos y la observancia de
los objetivos; pero tales rasgos por más importantes que sean son independientes de la habilidad
intelectual. Por tal razón es mejor designarlos como factores no intelectivos de la inteligencia. A
manera de enzimas, sirven para dirigir e incrementar la utilización de otras capacidades.
Los factores no intelectivos operan a todos los niveles de inteligencia y se puede esperar que
afecten tanto las capacidades del individuo superior, como aquel pobremente dotado. Ellos pueden
hacer que una persona torpe se alerte y que otra brillante sea menos perceptiva. Esto puede
considerarse de gran interés en la variabilidad observada en la ejecución de algunos individuos. No
obstante uno debe evitar la tentación de asignar todas las diferencias observadas a la presencia de
tales factores. Los factores no intelectivos son ingredientes necesarios de la conducta intelectiva y,
sin embargo, no son substitutos (como algunas veces se presume) de otras habilidades básicas. Una
porción de “drive” no podrá convertir a un tonto en un matemático: como tampoco sólo las buenas
intenciones son suficientes para convertir a una persona en un santo.
DIAGNOSIS PSICOLÓGICA, EVALUACIÓN

INDIVIDUAL E INTERPRETACIÓN
El término diagnosis psicológica proviene de la medicina, donde el término “diagnosis” se

refiere a la identificación de una enfermedad con signos o síntomas físicos. Aplicado a la psicología
ha llegado a tomar más o menos significado de “evaluación”; evaluación de un propósito o área
específica, ya sea en la diagnosis de desórdenes mentales, en el consejo o bien en la educación. En
estos términos la diagnosis psicológica puede circunscribir la evaluación de diferentes grados de
retraso mental, la presencia de mal funcionamiento cerebral orgánico sugerido por los datos
aportados por un instrumento psicométrico, el fracaso en una determinada subescala que indica una
incapacidad específica de aprendizaje (por ejemplo, en lectura). Por la variedad y número de
subescalas, así como por sus componentes cualitativos, el WISC-R permite en forma rápida este tipo
de evaluación. Existe ya considerable literatura en donde se reporta lo relativo a los hallazgos y los
patrones de los síndromes. Algunos de los resultados encontrados confirman claramente el síndrome
particular que se investigó; otros dan solamente un apoyo parcial y algunos otros no ofrecen ningún
apoyo. La calidad y grado del diagnóstico, se ha encontrado que depende de lo homogéneo de la
población comparada, la validez del criterio diferencial que se utilizó, de los métodos empleados y en
gran medida de la experiencia y sofisticación del examinador.
Es de particular importancia en los estudios diagnósticos la cuestión de los signos

encubiertos; esto es que cuando se presenta una puntuación significativamente alta o
significativamente baja en una subescala, no quiere decir que se refiera a un único síndrome sino a
diversos síndromes diagnósticos. De este modo, una baja puntuación en Retención de Dígitos puede
estar asociada con un mal funcionamiento cerebral orgánico o puede ser concomitante a una
incapacidad de lectura, o bien puede atribuirse a una ansiedad manifiesta. En realidad un mismo o
similar signo puede asociarse con diferentes entidades mórbidas o a incapacidades educacionales;
esto ha conducido a que algunos investigadores restrinjan el uso de los patrones subescalares como
base de un diagnóstico diferencial. El hecho de que una baja puntuación en Retención de Dígitos es
característica de varias entidades mórbidas, no quiere decir que deba pasarse por alto como signo
diagnóstico sin consecuencias: una alta temperatura puede suscitarse por una infección respiratoria e
insolación; no obstante, para una apendicitis y paludismo viene siendo un signo sin importancia. La
relevancia e importancia de un signo o síntoma depende en gran parte de “qué es lo que lleva
consigo”. De este modo, una baja puntuación en Retención de Dígitos así como una baja puntuación
en las otras subescalas pueden simplemente confirmar por otra parte una clara manifestación de
deficiencia mental; una baja puntuación en Retención de Dígitos asociada con una baja puntuación
en Diseños con Cubos y una pobre puntuación en Claves pueden indicar la presencia de un síndrome
cerebral orgánico; una baja puntuación en Retención de Dígitos junto con una puntuación
relativamente alta en las demás subescalas (particularmente Vocabulario e Información) puede
sugerir un situación de ansiedad. Por supuesto teóricamente son posibles las combinaciones de las
51
diez subescalas tomando dos o más de ellas a la vez, pero esto no resulta muy alentador.
Afortunadamente muchos de los patrones no llegan a ser relevancia diagnóstica. No obstante, estos
pocos patrones contribuyen mucho al arsenal diagnóstico del examinador y por ello todos los
psicólogos clínicos necesitan estar alertas a la importancia que se les asigne.
En gran parte la habilidad del diagnosticador para apreciar la ejecución en una subescala,
radica en su capacidad para detectar e interpretar las respuestas poco usuales y aberrantes. No
existe una regla general para trata tales respuestas, ni tampoco una estimación provisional sobre si
alguna de las respuestas desviantes o idiosincrásicas pueden tener una importancia diagnóstica
significativa. Desde luego mucho depende de qué es lo que se considera como desviado. Al
respecto es de esencial importancia el conocimiento y familiaridad con la literatura existente. Así
mismo es de importancia que el examinador esté alerta del grado en que las respuestas del sujeto
puedan estar influidas o condicionadas por sus antecedentes culturales y socioeconómicos. En la
revisión del WISC, se prestó considerable atención para poder eliminar o alterar aquellos reactivos
mencionados en la literatura o reportados por el autor como injustificados o cargados culturalmente
(véase capítulo II).
ORGANIZACIÓN DE LA ESCALA
El WISC-R (Escala de Inteligencia Revisada para el Nivel Escolar) está constituido por las
mismas doce subescalas del WISC publicado en 1949 (seis pertenecientes a la escala Verbal y seis a
la escala de Ejecución). Las doce subescalas, al igual que la subescala denominada como “Visual
Motor Memory” se aplicaron a la muestra completa de estandarización. Esta última subescala,
requería que el niño copiara una secuencia que era manejada por el examinador y se intentaba
integrarla como una subescala complementaria de Ejecución (subescala no verbal visomotora),
análoga a Retención de Dígitos. Más tarde esta subescala fue eliminada del WISC-R porque
presentaba dificultades para aplicarse y por las estrictas normas estadísticas que se establecieron.
Por razones únicamente de brevedad en el tiempo de aplicación, solamente diez de las

subescalas del WISC-R se consideran como básicas. El CI se calcula a partir de cinco subescalas
Verbales y cinco de Ejecución, y que se mencionan a continuación. (El número asignado a cada una
de ellas, corresponde al orden de aplicación).
Verbal Ejecución
1. Información. 2. Figuras incompletas.
3. Semejanzas. 4. Ordenación de dibujos.
5. Aritmética. 6. Diseños con cubos.
7. Vocabulario. 8. Composición de objetos.
9. Comprensión. 10. Claves (o laberintos).
Tanto Retención de Dígitos en la escala Verbal, como laberintos en la de Ejecución no se

utilizaron para establecer los cuadros de los CI. Se conservaron como subescalas complementarias,
que se aplican cuando se tiene tiempo, o bien sirven como substitutos cuando existe un impedimento
para aplicar alguna de las subescalas básicas o bien cuando una de ellas queda invalidada. Sin
embargo, una substitución no puede hacerse simplemente porque el niño puntúa bajo en una
subescala particular Verbal o de Ejecución. Con excepción de la substitución opcional de Claves o
Laberintos (véase Capítulo VII), el examinador no puede modificar la aplicación de las subescalas
básicas por conveniencia o preferencia personal. Cuando Retención de Dígitos o Laberintos
substituyen a las subescalas básicas, por supuesto se hace uso de los CI para los sujetos.
Siempre es permisible aplicar las doce subescalas; aún más en situaciones clínicas el incluir
las subescalas complementarias es muy recomendable porque proveen información cualitativa y
diagnóstica. Las puntuaciones normalizadas equivalente de las puntuaciones naturales para
Retención de Dígitos y Laberintos se han derivado de la misma forma como se ha hecho para las
demás subescalas. No obstante, si el examinador aplica Retención de Dígitos o Laberintos
52
adicionalmente a las diez subescalas básicas, no puede incluir a éstas (2) en el cálculo del CI del
niño (véase capítulo VII).
Por último, el hecho de que el WISC-R mantenga la subdivisión original de Escala Verbal y
Escala de Ejecución requiere de comentario. Esta dicotomía es en primer lugar una manera de
identificar los dos principales modos por medio de los cuales se expresan las habilidades del humano.
Los estudios factoriales se han incrementado a través de los años y han confirmado la validez de esta
amplia dicotomía. Desde luego las habilidades representadas en las subescalas, pueden también ser
clasificadas significativamente de otra manera. Por otro lado, también se ha conservado de otra
manera. Por otro lado, también se ha conservado a partir del WISC de 1949, la técnica de
establecimiento de reactivos en cada subescala, así como la obtención de los CI de los niños. Esto
se hizo partiendo de que la teoría indica que las medidas de inteligencia es mejor considerarlas como
clasificacionales, no jerárquicas. Con esto no se quiere decir que todas las subescalas del WISC-R
son consideradas como medidas de inteligencia igualmente buenas y efectivas, sino que cada una es
indispensable para apreciar en forma global la inteligencia. Aspectos adicionales sobre las doce
subescalas aparecen en el capítulo II, en donde también se discuten los cambios que se realizaron al
WISC original.
VII. INSTRUCCIONES PARA OBTENER LAS PUNTUACIONES NORMALIZADAS Y LOS CI
Después que se ha asignado la puntuación correspondiente para cada respuesta dada por el
examinado, el examinador debe seguir ciertos pasos, principalmente de naturaleza contable, para
determinar las puntuaciones naturales del niño, las puntuaciones normalizadas y finalmente los CI.
No puede pasarse por alto la importancia de efectuar estas operaciones con cuidado y exactitud.
Deben tomarse en cuenta las siguientes sugerencias:
1. Anote de manera exacta y legible los puntos para cada reactivo.

2. Asegúrese de registrar los puntos de los reactivos sencillos (iniciales) que no hubo necesidad
de aplicar.
3. Cuando se otorguen bonificaciones por tiempo, use cuidadosamente los cuadros y anote
correctamente.
4. Compruebe la suma de los puntos de los reactivos al computar las puntuaciones naturales de
las subescalas.
5. Cerciórese que la puntuación natural de cada subescala es transferida correctamente al
espacio adecuado de la portada del Protocolo.
6. Después de verificar la fecha de nacimiento y la fecha de aplicación, calcule la edad del niño
cuidadosamente.
7. Para evitar la posibilidad de error al convertir las puntuaciones naturales en puntuaciones
normalizadas y éstas en CI, así como en cualquier otro prorrateo que sea necesario, es preciso
tener mucho cuidado en el uso de los cuadros apropiados.
CONVERSIÓN DE LAS PUNTUACIONES NATURALES EN PUNTUACIONES NORMALIZADAS
Después de anotar las puntuaciones naturales en la portada del Protocolo, éstas deben
convertirse en puntuaciones normalizadas de acuerdo a la edad del niño. El cuadro 19 (Págs. 83-99)
sirve para este propósito. La edad del niño (años, meses y días) determina qué página del cuadro
debe usarse para convertir sus puntuaciones. El cuadro está dividido en períodos de 4 meses de
edad. En el espacio de la esquina superior de cada página se precisan los límites superior e inferior
del período de edad en años, meses y días. El pequeño cuadro que se encuentra del lado derecho,
representa el límite del período de edad en años y meses y puede usarse como una rápida guía para
localizar la página apropiada.
Después de encontrar la página exacta del cuadro, busque la columna de una subescala
determinada y localice la puntuación obtenida por el niño en esa subescala. Leyendo
53
horizontalmente a partir de esta puntuación natural hacia la columna del extremo izquierdo, centro
o extremo derecho, busque la puntuación normalizada equivalente. Anote esta puntuación en la
portada del Protocolo exactamente a la derecha de la puntuación natural previamente registrada.
Cuando se haya hecho lo mismo con todas las subescalas, se tendrá una columna de puntuaciones
normalizadas cerca de la columna de puntuaciones naturales. Ya no es necesario prestar atención a
las puntuaciones naturales, pues las puntuaciones normalizadas equivalentes son más significativas y
permiten el tratamiento aritmético.
OBTENCIÓN DE LAS SUMAS DE LAS

PUNTUACIONES NORMALIZADAS
La puntuación de la Escala Verbal es igual a la suma de las puntuaciones normalizadas del

niño en las cinco subescalas verbales regularmente aplicadas. Así mismo, la puntuación de la Escala
de Ejecución se obtiene sumando las puntuaciones normalizadas del niño en las cinco subescalas de
Ejecución regularmente aplicadas. Como se ha indicado, siempre es permitido que el examinados
substituya Laberintos por Claves como quinta subescala de Ejecución. La puntuación normalizada
total es la suma de las puntuaciones de la Escala Verbal y la Escala de Ejecución y está basada en
diez subescalas.
Si se aplican al niño todas las 6 subescalas verbales o de ejecución, no debe usarse la

puntuación normalizada en Retención de Dígitos y Laberintos para calcular la suma de puntuaciones
normalizadas.
(En la edición en inglés del WISC en 1949, se instruía al examinador para prorratear cuando
se aplicaban las 6 subescalas verbales o de ejecución. Sin embargo, en el WISC-R se ha cambiado
este procedimiento, dado que el prorrateo de seis subescalas a cinco subescalas requiere un trabajo
de contabilidadf que no se justifica).
Habrá ocasiones en que se disponga de menos de cinco puntuaciones de las subescalas
verbales o de ejecución, ya sea porque se haya invalidado una subescala durante la aplicación o bien
por algún impedimento especial que haga imposible la aplicación. Si no se aplica una de las
subescalas verbales, puede usarse Retención de Dígitos como alternativa.
De manera similar, Laberintos (o Claves) puede incluirse como subescala alterna de
ejecución. Si sólo se dispone de cuatro puntuaciones de subescalas verbales o de ejecución
incluyendo una alternativa para cada Escala), la suma de las puntuaciones normalizadas debe
prorratearse para obtener la puntuación verbal o de ejecución que pueda usarse para obtener el CI.
Para prorratear las puntuaciones del niño en cuatro subescalas verbales o de ejecución,
multiplique la suma de las cuatro puntuaciones normalizadas por 5/4; el resultado será una estimación
de su puntuación verbal o de ejecución si hubiera respondido a cinco subescalas. Observe que el
prorrateo se realiza para obtener separadamente las puntuaciones verbales y de ejecución. La
puntuación total normalizada nunca se prorratea. Después de obtener por medio del prorrateo la
puntuación verbal o de ejecución, se suman de la manera indicada anteriormente, para obtener la
puntuación total normalizada. El cuadro 22 facilitará el prorrateo.
Tanto la puntuación verbal como la de ejecución debe basarse por lo menos en cuatro
subescalas verbales y cuatro de ejecución. La abreviatura PRO debe anotarse en el margen cercado
a cualquier suma prorrateada de puntuaciones normalizadas, para indicar que sólo se usaron cuatro
subescalas.
ASIGNACIÓN DE LOS CI
El cuadro 20 (Pág. 100) presenta la conversión de las puntuaciones verbales y de ejecución
normalizadas en CI para todas las edades. Estos valores deben anotarse en los espacios adecuados
de la portada del Protocolo. Sin las sumas de puntuaciones normalizadas del niño son mayores o
menores que los valores que aparecen en el cuadro 20, o si se obtienen puntuaciones naturales de
cero en varias de las subescalas, consulte la Pág. 12.
TRAZO DEL PERFIL

54
Después de haber determinado las puntuaciones normalizadas del niño, el examinador
podrá trasladar dichas puntuaciones al perfil del WISC-R en la portada del Protocolo. Para aquellos
que deseen delinear el perfil, deben en primer término anotar en los cuadros de las subescalas la
puntuación natural obtenida por el examinador. Después deben señalar con una “X” el punto
equivalente a la puntuación normalizada, para que por último unan las “X”. (Véase en el capítulo IV la
sección que trata de las diferencias significativas entre las puntuaciones de las subescalas).
El perfil tiene la ventaja de mostrar gráficamente los puntos fuertes y débiles del niño en las
subescalas del WISC-R. Sin embargo, el examinador debe ser cauto al interpretar las pequeñas
diferencias entre las puntuaciones normalizadas de cualquiera de las dos Escalas. Tal y como se
indicó en el cuadro 12, es necesaria una diferencia de 3 o más puntos de la puntuación normalizada
para que sea estadísticamente significativa en un nivel de confianza de 15%. El examinador
encontrará particularmente útil el capítulo IV para interpretar el perfil del niño, principalmente las
secciones de “Confiabilidad” y “Diferencias entre las puntuaciones normalizadas”. También será de
gran ayuda el cuadro 7, que presenta la relación entre las puntuaciones normalizadas y los
Coeficientes de Inteligencia con las desviaciones de la media y los rangos percentilares.
OBTENCIÓN DE LA EDAD ESCOLAR
El cuadro 21 (Pág. 101) proporciona las puntuaciones naturales equivalentes para las edades
escalares. Este se desarrolló para ayudar al examinador que desea conocer las normas de edad
para el WISC-R. En la página 81 se incluye una discusión acerca de la construcción del cuadro 21,
así como la forma de utilizarlo.
CONSIDERACIONES SOBRE EL WPPSI,
Los niños son genios desconocidos – A. France

ESTUDIO CRÍTICO DE LA ESCALA
La etapa de los 4 a 6 años es, en cierto modo, un significativo período en el avance intelectual
del niño. Aunque a menudo está considerado dicho promedio como recación formal y guiada
deliberadamente a relaciones sociales más amplias con otros niños de la misma edad. A los 4 ó 5
años aproximadamente, el niño ya no es un bebé, sino un pequeño hombre. En cuanto a experiencia
e idioma que lo constituyen como tal, puede pensar por sí y aprovechar de sus errores. A esa edad,
no podría explicar lo que se mueve a las nubes, y le faltan aún varios años para basarse en teorías,
pero si sabe, que si cruza la calle contra la luz de peligro, podría ser atropellado, y si se corta una
manzana por la mitad se obtiene dos pedazos. Además, el niño ha llegado a la edad de realizar
ciertas tareas de dificultad razonable. La inteligencia de un niño de 4 – 6½ años no es, como se dice
a veces, básicamente un mecanismo sensorial ni esencialmente otro ente. Sus habilidades no están
restringidas a ninguna modalidad específica. Al contrario, puede expresarse en diferentes formas;
puede realizar muchas cosas de diferente manera, con tal de que, por su puesto, actúe con interés y
atención.
El WPPSI se basa en la suposición de que el niño de 4 – 6 años no solo posee las futuras
potencialidades, sino también pueden ser evaluados sistemáticamente mediante una batería
adecuada de subtests, los que sirvieron como principios para la construcción del WISC. A semejanza
de éste, consiste en una batería de subtests, cada uno de los cuales, tratado por separado, puede ser
considerado como evaluador de una habilidad, y cuando se los combina para una evaluación
completa, determinan toda la capacidad intelectual(1).
Así mismo, como el WISC, es la división de la batería de subntests en grupos: verbal y de

ejecución, no porque el autor expresa que representan diferentes tipos de inteligencia, sino porque la
1
55
dicotomía ha resultado diagnósticamente útil. Lo mismo puede decirse de la descomposición de la
escala en subtests que evalúan habilidades diferentes. El objetivo no es sólo establecer posibles
diferencias de la madurez o aptitudes, sino poner en alerta al examinador sobre el modo como
aptitudes o deficiencias pueden influenciar en las actitudes.
La realización de una escala pre-escolar según las pautas propuestas dependen de la

factibilidad de evaluación de las habiliddes del niño de 4 – 6½ años, como también en caso de niños
de mayor edad, con un porcentaje de mayoría o minoría, más bien que de presencia o ausencia, a
que uno está obligado a hacer cuando se trata de infantes. Una respuesta afirmativa significa que las
habilidades mentales del niño pre-escolar son esencialmente las mismas que las de los niños de
edades mayores. Se presume solamente que las habilidades mentales son continuas y no
desiguales, y que en consecuencia se puede usar las mismas o semejantes tareas al evaluarlos. La
pregunta práctica que surge es ¿a qué edad se puede empezar a actuar así?.
Cerca de tres años se ha investigado lo que respecta a dicha pregunta, y se obtuvo

resultados interesantes en el sentido de que la mayoría de los subtest WISC, con leves
modificaciones, podrían ser empleados con niños de 4 años. Estos subtests fueron experimentados
en estudios preliminares de 300 niños, y después de algunas mejoras fueron resumidos con la
complementación de otros tres subtests nuevos en la batería que ahora comprende el WPPSI. El
éxito, sin embargo, no se cifra solamente en el WISC, sino que radica en la creación de una escala
independiente, de adecuación magnifica a la evaluación mental de los niños entre 4 y 6½ años.
EL CONCEPTO DE DESARROLLO MENTAL
Los primeros años del niño son notorios por su crecimiento progresivo y la formación de sus
diversos atributos, rasgos físicos y habilidades que tienden a constituir al individuo como tal. Los
procesos y los alcances en los que estas habilidades se desarrollan, en cuanto son interpretados
como habilidades intelectuales adaptables, están CIasificadas con el término de Desarrollo Mental.
Lamentablemente, durante los primeros años del desarrollo del niño, no siempre es fácil
diferenciar en forma inequívoca entre lo intelectivo y lo primariamente neural, mecánico-sensorial u
otros aspectos del proceso de madurez. Por ejemplo, a las 28 semanas un niño puede sentarse y
alcanzar un objeto. ¿Se trata predominantemente de un comportamiento inicial mecánico o
adaptable?, ó ¿uno de los dos adjetivos en mayor grado?. A los 18 meses, según los programas de
desarrollo mental de Gesell, el niño es evaluado en su habilidad para acuñar cubos en una taza, y
para alcanzar un plato vacío al examinador. La primera habilidad se CIasifica como “manualidad
adaptable”, la segunda, como (lingüística) “social – personal”. A los 36 meses, se evalúan tres ítems
como aprobados o desaprobados; colocar bolitas en una caja, ejecutar una orden simple, ponerse los
zapatos. La primera habilidad se califica como motora, la segunda como lingüística, y la tercera como
social personal. ¿Representan estas categorías algo más que CIasificaciones de prácticas
convenientes?.
Uno necesita distinguir entre manifestaciones de comportamiento secuenciales en edades

sucesivas y de creciente complejidad a medida que se desarrolla el niño; y sus habilidades
relacionados con dicho crecimiento. La realidad de que la función continúa madurando con la edad
avanzante no puede “ipso facto” usarse como predecesor de otras habilidades que de igual manera
se perfeccionan con la edad.
Las relaciones observadas pueden ser primordialmente una concomitancia temporal. Por Ej.,
durante los dos primeros años la estatura del niño aumenta sistemáticamente y rápidamente con la
edad. Sin embargo, no se usaría la talla de un niño como índice de capacidad intelectual. Lo que
queda por probar es si la inCIusión de otros ítems en las escalas tienen relación directa con la
inteligencia o no. Si las correlaciones entre los CI obtenidos por niños menores de dos años y los
obtenidos por niños mayores de dos años son criterios justificables, la respuesta es un rotundo no.
La razón principal de las correlaciones bajas entre los CI obtenidos de escalas de inteligencia infantil
56
y los derivados de escalas administradas a edades mayores son las siguientes: los tests utilizados
en edades menores de dos años, no evalúan las mismas funciones. Este no se debe a la naturaleza
de los tests sino al proceso de madurez.
No es posible evaluar el potencial intelectual del niño en sus primeros años con el mismo
medio o la misma forma que se haría en años posteriores. Una de las razones se debe a que
muchas funciones que se desea evaluar no se han desarrollado del todo como para ser calificadas
efectivamente. Por ejemplo, no es posible evaluar el vocabulario de un niño antes de que aprende a
hablar; sus habilidades para reproducir figuras geométricas y se amplían con cierto grado de
coordinación mecánica y a medida que avanza en edad, etc. Por otra parte, ciertas habilidades que
pueden servir de indicadores del nivel mental de una edad no puede utilizarse en una época posterior
porque esas habilidades varían rápidamente. Por ejemplo, un niño es capaz de coger un objeto
firmemente con el dedo pulgar e índice a los seis meses, y con mayor facilidad a los ocho meses;
pero de ahí en adelante, la habilidad se modifica un tanto, sino del todo. Dichas diferencias
aparentemente quizá no tengan una relación importante con los niveles de maduración de otras
habilidades en desarrollo. Para asegurarse de que se está tratando las mismas habilidades de un
niño que se desea evaluar, es necesario disponer de tests que no solo sean apropiados sino también
eficaces para evaluar las habilidades en forma constante. La función de subtests en el WPPSI
satisface los criterios aludidos. En realidad, la mayoría de estos subtests abarcan los mismos ó son
las ampliaciones en el WISC. Proveen no sólo una base para describir los niveles de desarrollo, sino
también un medio para comparar la ejecución de las mismas habilidades que las evaluadas en las
edades avanzadas.
EL CONCEPTO DE EDAD MENTAL
Como definiera en un principio Bidet, la Edad Mental (EM) fue un término introducido para
describir la habilidad intelectual con relación a lo que el niño de una edad determinada debería hacer.
En este sentido, sirve para un propósito muy útil. Pero, a través de los años, ha adquirido para
muchos un significado complementario de un nivel ó medida de inteligencia completamente definidos.
Así una EM de 4 años se interpreta a menudo como aplicable con el mismo sentido en estas
diferentes edades son idénticas, correlativa y cuantitativamente, a casi idénticas. En efecto, los ítems
del subtests aprobados o desaprobados son a menudo diferentes, y si los ítems son idénticos, los
aciertos y desaciertos pueden ser mejorados en forma diferente.
El concepto esencial de la EM también ha sido confuso y ambiguo mediante evaluaciones

formuladas de manera imprecisa para otros aspectos del desarrollo del niño. Se encuentran edades
en desarrollo (EDs) para funciones fisiológicas y crecimiento somático, edades educativas (ECs) para
diferentes temas escolares, y otras definiciones de complementación apreciadas con cierta dificultad.
A semejanza de las EMs (edades mentales), éstas son técnicas para definir niveles de desarrollo o
comportamiento con relación a la capacidad del individuo de una edad determinada. Pero la
semejanza conCIuye aquí: una EM no sólo es una CIase de edad progresiva, y como se verá
adelante un cociente de inteligencia (CI) es bastante diferente del cociente de desarrollo (CD) aún
cuando éste último se derive análogamente.
Para evitar diferencias erróneas, y en particular, la suposición de que una EM representa un

nivel absoluto de capacidad mental, el autor descartó la EM como medida básica de inteligencia
cuando preparó su WISC y las escalas para adultos. Ahora no la usa tampoco por las mismas
razones. Al omitirla, no significa que él considere inútil el criterio de evaluación de la edad. En
realidad, para ciertos propósitos, podría ser importante. Pero aún en estos casos, parece
conveniente reemplazar la EM con una medida de nivel mental que describa más exactamente lo que
representa realmente una EM, una calificación de test igual a la evaluación “medio” de un niño de
edad determinada. Sin embargo, los niveles de habilidad que se desea en diferentes edades pueden
ser logrados mediante el WPPSI. Con el fin de ofrecer comparaciones con normas de edad de otras
escales, la Tabla 23 del Apéndice representa los equivalente de los puntajes directos del WPPSI para
las edades del test.
57
EL CI (cociente de inteligencia) COMO MEDIDA

DE CAPACIDAD INTELCTUAL
El WPPSI considera el cociente de inteligencia (CI) como la medida más efectiva o la forma
de expresar los dotes intelectuales del niño con relación a los niños de la misma edad. Los CIs
WPPSI, a semejanza de los previstos por el WISC, son CIs de desviación, es decir, medidas de
posición relativa calculadas en base al puntaje de evaluación infantil y su diferencia del promedio o de
la del mismo grupo de edad, y no según el procedimiento tradicional EM – EC (edad mental - edad
cronológica).
El método usado para computar los CIs WPPSI (descritos más ampliamente en el Cap. 3)
inCIuye la conversión de los puntajes directos en puntajes equivalentes que tienen los mismos
promedios y las desviaciones Standard en cada nivel de edad. Las sumas de estos puntajes
equivalentes fueron luego convertidas a CIs de desviación mediante una sola tabla usada para todas
las edades comprendidas por la Escala. Como en el WISC, el promedio CI y la desviación Standard
valen efectivamente 1000 y 15 respectivamente en cada edad. Si las desviaciones Standard de los
CIs no fueran las mismas en todas las edades un CI infantil podría variar considerablemente año tras
año, aún cuando su habilidad relativa permaneciera constante. Sin embargo, manteniendo las
distribuciones de los CIs comparables en cada edad, el CI del niño no cambiaría mucho (aparte de la
desconfiabilidad del Test), a menos que varíe su desempeño en el test comparado con los de su
edad.
Comparando el retest de los CIs no implica, por supuesto, que el niño obtendrá
necesariamente un CI idéntico cuando es examinado con la misma escala a una semejante. El
criterio de que así es, no corresponde a los detractores, los que se oponen a su uso. La regla admite
ciertas modificaciones más bien que excepciones, pero la cantidad para la mayoría no es abundante
ni importante. La cantidad del cambio depende del intervalo entre los tests sucesivos y las edades
en las que se los ha administrado, cuanto más largo el intervalo y más joven el sujeto a la hora del
test inicial, tanto mayor al cambio. Al comenzar con 3 ó 4, y a intervalos que varían entre uno y dos
años, la diferencia promedio de los CI de test-retests para muchos tests de inteligencia es
aproximadamente de 5 a 7 puntos. un estudio de retest con el WPPSI indica que el mismo orden de
diferencia promedio puede esperarse de esta Escala, ya que la diferencia aquí fue una ganancia de
retest de aproximadamente 4 puntos CI de la Escala total. Será de interés que de los 50 niños en
este estudio, la mitad ganó de 0 a 9 puntos CI en el retest, y la otra mitad de la muestra se dividió
entre los que perdieron puntajes CI en el retest, y los que ganaron 10 puntos o más. Amplias
diferencias (20 puntos, o más), aunque relativamente no frecuentes, presentan una ventaja
interpretativa y deben ser registrados. Generalmente se observa que los factores identificables son
previos al examen o a la hora del mismo, los cuales definen las grandes diferencias observadas. Sin
embargo, el hecho de que un CI de un individuo puede oscilar significativamente, no justifica un
esceptismo pleno con respecto a la validez del CI. Debe tenerse en cuenta que se considera algunas
medidas alternativas de capacidad mental que han sido propuestas. Según el autor, el CI obtenido de
un test de inteligencia individual administrado adecuadamente es aún la mejor medida de prueba del
potencial intelectual.
CAPÍTULO 4
CONSIDERACIONES GENERALES DE LA PRUEBA
El WPPSI (Escala de Inteligencia Pre-escolar de Wechsler) ha sido diseñado para ser usado
principalmente con niños de 4 a 6½ años de edad. Aunque también se puede emplear con grupos
cuyas edades son más o menos cercanos, brillantes de 3 años y retardados de 7 y más, los
materiales y orientaciones fueron seleccionados para su estabilidad y efectividad para el primer rango
58
de edades; y las normas son dadas para esas edades solamente. En general, se recomienda que
el WPPSI se use en vez del WISC-R en niveles donde las dos escalas se traslapen.
PROCEDIMIENTO NORMALIZADOS
La administración y calificación del WPPSI debe ser encargada a un examinador competente

preparado y con experiencia. El debe seguir cuidadosamente las indicaciones de este manual. Estos
procedimientos fueron estrictamente adheridos durante la estandarización y sus resultados válidos
dependen del grado de acatamiento del examinador. Las desviaciones en estas instrucciones sólo
conllevan a estimados erróneos de la inteligencia del niño.
Aunque se recomendará que el examinador siempre tenga el manual a su lado, su

familiaridad con las indicaciones y condiciones especiales pertinentes a los subtests deberían ser
suficientes para permitirle observar principalmente al niño antes que el texto impreso. En este
sentido, el examinador no debería tomar el tiempo adicional por el puntaje durante la administración
de las pruebas, mientras que por un lado las distracciones deberán ser evitadas, el examinador puede
con frecuencia despertar el interés del niño preguntándole o pidiéndole hacer algo que no es parte del
test, (por ejemplo, que regrese los materiales usados a sus lugares respectivos).
Mientras haya alguna parte igual en la administración del test entre WPPSI y WSIC, los
procedimientos escritos para la nueva escala, significativamente de aquellos empleados en el WISC
se deben administrar cuidadosamente.
Usualmente se emplean de 50 a 75 minutos para un examen regular de los 10 subtests. Para

la mayoría de los niños, una simple sesión de esta duración no es tan larga. Si un niño se cansa, el
examen deberá ser descontinuado y hacer una segunda cita. Durante la estandarización del WPPSI
las pruebas eran interrumpidas por una inadecuada motivación o falla de interés, que por la real fatiga
en sí. Esto sucedía raramente, pero es algo que tiene que ser considerado, especialmente cuando
se examina a niños distraídos o con impedimentos.
El hecho que a veces se requiera más de una sesión, no debería ser una razón para reducir
el número de subtests tomados. Por regla general se deben tomar todos los 10 subtests, aunque a
veces hay situaciones donde ciertos subtests no pueden ser administrados por impedimentos que
interfieren, tales como, una insuficiente comprensión del lenguaje, impedimentos del motor sensorial.
Sin embargo, la reducción en el número de subtests es injustificable y no debe ser incentivado por la
pregunta de lo que uno debe hacer cuando no hay suficiente tiempo para tomar los 10 subtests. Las
escalas abreviadas no son recomendables, uno no pensaría en reducir el número de pruebas para
completar un examen físico.
AMBIENTE ADECUADO PARA LAS PRUEBAS
Durante la estandarización a los niños se les tomó el test en sus hogares, internados, nidos y
escuelas primarias, etc.(1). Estos y otros lugares donde los niños desean ser probados, son
suficientemente variados como para garantizar los efectos que los diferentes ambientes pueden tener
sobre la ejecución del test por el niño. En general, los factores que más interfieren con la actividad
espontánea del niño son la falta de familiaridad con su ambiente, restricción del movimiento y
presencia de extraños. Si un niño ha estado en atención por un tiempo considerable, como suceden
en los niños y escuelas primarias, que usualmente presentan un ambiente familiar, pero a menudo
carente de este ambiente en los cuartos de prueba. El hogar puede ser el lugar poco apropiado para
examinar a la prueba; es aún más difícil de evitar distracciones, la peor de ellas es la inoportuna
presencia de miembros de la familia. Las facilidades de las CIínicas y hospitales, sin embargo
cómodos y bien equipados, son aptos para la prueba al niño.
1 (1)
Un núm ero de ni ños fueron eval uados en hos pit al es m ent al es pero es t os
cas os no fueron us ados en norm as es t abl eci das .
59
ESTABLECIENDO RAPPORT CON EL NIÑO
Tan importante como el ambiente en que el test tiene lugar son la paciencia, la relación y
actitud en general del examinador hacia el niño. La apariencia del examinador debe ser objetiva, y de
simpatía y el test debe ser tomado en una atmósfera amigable, pero se debe evitar toda CIase de
manifestaciones de efusividad y “sobresolicitud”. Es propósito general establecer una armonía la cual
mantendrá al niño interesado en lo que está haciendo y animarlo a que lo haga con el máximo
esfuerzo.
Los esfuerzos del examinador para establecer ese rapport debería ser gradual, el pequeño no
debe ser apurado, si el rapport no puede ser establecido en un tiempo relativamente corto, es mejor
no continuar y esperar otra oportunidad. Como en el caso de niños mayores, uno debe distinguir
entre el negativismo y la timidez. La sobreactividad puede ser mejor tomada con juicio y tacto. Por
supuesto, que no puede permitírsele destruir los materiales de la prueba, pero puede ser permitido
moverse por el salón y familiarizarse con el examinador.
A veces con el pequeño no es posible tratar de tomar el comando de la situación del examen.
El puede querer tomar los materiales del test pero con un pequeño engaño se debe lograr restaurar
su cooperación. El examinador debe en todo momento mantener suficiente control para permitirle
seguir adelante y completar el examen en forma efectiva.
Antes de empezar el test, una efectiva introducción, es decir al niño que el examinador desea
compartir los juegos con él. La mayoría de niños acepta esto como una explicación adecuada para
su entrada al salón de examen, con tal que ellos no hayan sido advertidos. A menudo es necesario
investigar y determinar si es que un examen ha sido advertidos. A menudo es necesario investigar y
determinar si es que un examen ha sido propuesto al niño como un premio o como una alternativa
para castigarlo. Si éste es el caso, el objetivo del test debería ser reinterpretado con mucho tacto.
Ya en el salón de prueba el niño debería ser sentado cómodamente ante una mesa o
escritorio de superficie lisa, adecuada a su altura y sobre una silla la cual le permitirá moverse
libremente y manejar los materiales del test fácilmente. Estos materiales deberían estar
convenientemente dispuestos para que el examinador pueda presentarlos sin demora, pero no deben
estar mostrados o expuestos al niño antes que los use. Sin embargo, el examinador debe evitar
cualquier apariencia de secreto, porque la mayoría de los niños reaccionan desfavorablemente a
procedimientos que le sugieren encubrimiento.
Algunos de los materiales del test son bastante pequeños, y algunos niños pueden tratar de
llevárselos a la boca. El examinador debe vigilar esto para prevenir accidentes.
Por último, el establecimiento de un mejor rapport necesario para cualquier examen

individual, es especialmente importante en el caso de los niños pequeños. Antes de proseguir con el
test, el examinador deberá estar razonablemente enterado que el niño no sienta ansiedad, ni miedo y
que esté familiarizado con su ambiente.
ADMINISTRACIÓN DE LA PRUEBA
Los siguientes materiales son inCIuidos en el equipo WPPSI:

1. El Manual.
2. Protocolos (o formas de registro).
3. Láminas plegadas, impresas con laberintos.
4. Papel impreso especialmente para el diseño geométrico.
5. Un tablero y una caja de 28 cilindros coloreados para la prueba “Casa de Animales2.
60
6. Un folleto de espiral conteniendo “Figuras Incompletas” y “Diseño de Bloques” 8-10.
7. Un folleto o libreta de espiral, conteniendo: problemas Aritméticos 1-4 y Diseños Geométricos.
8. Catorce bloques rojos y blancos para diseño de bloques y para problemas aritméticos 5-8.
El examinador también necesitará un cronómetro y dos lápices con punta roja (para laberintos
y diseños geométricos). Lápices de madera con punta roja y espesor mediano y de dureza tal que
sea satisfactorio para este propósito. Los lápices deben ser tajados sin punta o con una punta
redondeada, porque la coordinación está pobremente desarrollada en la mayoría de los niños, es
mejor usar lápices, no más largos de 15 cm.
El protocolo ha sido diseñado para ayudar al examinador en anotar y calificar las respuestas
del niño y para escribir otra información pertinente de acuerdo a su experiencia y su conducta durante
la prueba. Unos cuantos subtests pueden ser calificados de la manera cómo el niño ejecuta los
subtests verbales, los cuales requieren que las respuestas del niño sean registradas exactamente
como son dadas. Este registro permite el estudio y evaluación posterior. Para subtests de acierto
(Laberintos, Diseño de Bloques, Diseño Geométricos y Oraciones), la columna de “puntaje” de la hoja
de protocolos muestra la posible calificación para cada elemento. El examinador debe encerrar en un
círculo el número apropiado para cada elemento. El examinador debe encerrar en un círculo el
número apropiado para cada elemento, luego sumar los círculos para obtener el total.
El orden preferido de la administración de los subtests en el WPPSI es así:
1. Información. 7. Diseño geométrico.

2. Casa de animales. 8. Semejanzas.
3. Vocabulario. 9. Diseño de bloques.
4. Figuras incompletas. 10. Comprensión.
5. Aritmética. Oraciones (prueba suplementaria).
6. Laberintos. Reprueba de Casa de Animales (retest).
La escala está arreglada para que haya alguna alternativa entre la prueba de ejecución y
verbal y entre los fáciles y difíciles. Sin embargo, si el niño tiene alguna dificultad especial o
manifiesta resistencia a un subtest en particular, el examinador puede cambiar libremente el orden
pre-escrito.
Para los subtests con estricto límite de tiempo, el conteno del tiempo deberá empezar de
acuerdo a las normas dadas en el Manual. El examinador debe usar un cronómetro. Cualquier
tiempo usado para repetición o aCIaración de una pregunta deberá ser inCIuido en la medición del
tiempo permitido para cada elemento.
Para subtests que no tienen un tiempo límite establecido, cerca de 15 seg. deberá ser
suficiente para que el niño empiece con sus respuestas. Este puede ser variado, dependiendo del
niño, en particular. Si él no responde después de un intervalo apropiado, o después de repetir la
pregunta (donde esté permitido) el examinador deberá registrar un puntaje de cero y pasar al
siguiente ítem.
Las normas para calificar los subtests las provee el Manual. Para algunos subtests la
calificación es completamente objetiva, para otras como vocabulario y comprensión, el criterio del
examinador es requerido, y él deberá llegar a estar más familiarizado con el criterio de calificación
establecido.
Las normas para descontinuar cada subtest están dadas en el Manual. El criterio para todos
los subtests excepto “Casa de Animales2, es un número seguro de errores consecutivos. Si el
61
examinador tiene cualquier duda, así como si el criterio ha sido alcanzado, él deberá proseguir
entonces para presentar más ítems, que está seguro que en una evaluación posterior mostrarán que
el número de errores ha disminuido.
Excepto cuando esté prohibido específicamente, las preguntas pueden ser repetidas cuando
el niño parece no entender. Si un niño responde a una pregunta en forma ambigua, el examinador
debe preguntar al niño para aCIarar su respuesta, se le puede decir: “DIME MÁS ACERCA DE
ELLO”, o algo similar. Sin embargo, no es responsabilidad del examinador insinuar al niño que su
respuesta puede ser mejorada, no deberá presionar al niño. Cuando una pregunta es cuestionada, el
examinador deberá escribir la letra “R” (de repetición y registrar también que su respuesta no es
sincera y espontánea.
Si el niño corrige una respuesta espontánea o luego, la respuesta a ser calificada es primera.
Si el niño dice que no puede ejecutar un subtest, el examinador puede decir: “TRATA UNA VEZ
MÁS”. En el caso de que el pequeño necesite ayuda, decirle: “YO QUIERO VER, LO BIEN QUE
PUEDES HACERLO TU MISMO”.
A veces el niño dirá: “NO SÉ”, en respuesta a alguna pregunta fácil, y luego dará respuestas
aceptables a más preguntas difíciles sobre la misma prueba. Si el examinador siente que el niño
realmente sabe la respuesta a esa pregunta fácil, él debe regresar más tarde para explorar la
posibilidad que el niño sea capaz de dar la respuesta correcta (éste procedimiento es inapropiado
para tales pruebas como Laberintos, Diseños de Bloques y Oraciones).
Si un niño insiste que no quiere hacer un subtest en particular, el examinador debe evitar
presionarlo, pero deberá descontinuar temporalmente el subtest y pasar a otro. Después que el resto
del test ha sido tomado el examinador debe regresar al subtest descontinuado, (éste hecho debe
anotarse en el protocolo).
Si el niño para o descontinúa un ítem de un subtest, antes que el tiempo termine, él deberá
ser gentilmente estimulado a proseguir. Si tal incentivo no lo trae de regreso a la prueba, el
examinador debe pasar al siguiente ítem. En el caso de que el ítem incompleto sea uno en el cual el
crédito parcial es dado, califique la porción que ha sido hecha correctamente. Si un niño ha estado
cerca de completar un problema en el final del tiempo límite, el examinador puede permitirle
terminarlo para evitar que el niño se moleste, pero el protocolo debe mostrar sólo lo que ha sido
hecho en el tiempo límite. Rara vez sucede que un niño rehusa hacer una parte o todo, o
posiblemente sea correcta, en ese caso se le disculpará de la sesión de prueba, o sea que se
suspenderá la sesión.
TRABAJO DE RUTONA DEL EXAMINADOR
Un buen número de pasos en la administración y calificación del WPPSI son principalmente

de rutina y requieren de cuidados de parte del examinador, por tal motivo se deberá, tener en cuenta
lo siguiente:
1. Registrar los puntos para cada subtest cuidadosa y legiblemente.
2. Cuando las primeras partes de un subtest no son administrados, como puede ser el caso de
“Aritmética, Diseño de Bloques y Oraciones”, asegúrese de registrar los puntos para esas
partes o detalles.
3. Chequear la suma de puntos ítem por ítem en la computación de los puntajes directos de los
subtests. Chequear el puntaje directo de la Casa de Animales, que se obtiene en la tabla
apropiada.
4. Asegurarse que el puntaje directo para cada subtest, sea cuidadosamente transferido al
espacio apropiado, en el protocolo.
5. Calcular la edad del niño cuidadosamente después de verificar la fecha de nacimiento y la
fecha del examen.
62
6. Evitar errores en la conversación de puntajes directos a puntajes equivalentes y de éstos a
(CI) cocientes de inteligencia y prorratear si es necesario. Para evitar la posibilidad de leer mal
(o sea no entender después) repita los pasos usando las tablas.
CONVERSIÓN DE PUNTAJES DIRECTOS A EQUIVALENTES
Cuando los ítems para cada subtests (excepto Casa de Animales), han sido calificados y los
puntajes sumados, el resultado es el puntaje directo para cada subtest. (El puntaje directo para la
Casa de Animales se obtiene de la Tabla 20). Cada uno de éstos puntajes directos deben ser
convertidos a puntajes equivalentes a la edad del niño. (nota adecuada a su edad).
La edad es comprobada por sustracción, usando el cuadro que aparece a continuación.

Ejemplo:
Año Mes Día
4 51
Fecha de Prueba 1966 10 21
Fecha de Nacimiento 1961 7 28
Edad 5 2 23
La edad del niño determina cuál tabla de puntajes equivalente correspondientes a puntajes
directos debe ser usada. Estas tablas son proporcionadas para rangos de 3 meses. La 1ra. edad
dada en la esquina superior izquierda de cada tabla de edad es la más baja de ese rango de edad, la
segunda es la edad más alta.
Después de localizar la tabla apropiada, el examinador entra a la columna para el subtest

determinado y encuentra el puntaje directo obtenido en cada subtest por el niño. Leyendo
horizontalmente desde este puntaje directo a la columna derecha de la tabla, el examinador hallará el
puntaje equivalente correspondiente. Este puntaje es pasado a un espacio apropiado del protocolo,
se coloca a la derecha del anterior puntaje directo. Al final deben haber dos columnas de notas en el
protocolo. Algunas conversiones requieren de un tratamiento aritmético.
El puntaje Verbal es la suma de los puntajes equivalente de los 5 subtests verbales.

Igualmente el puntaje de ejecución es obtenido por adición de los puntajes equivalentes de los 5
subtests de ejecución. El puntaje equivalente total es la suma del puntaje verbal y de ejecución,
desde que es basado en los 10 subtests.
Habrán veces en que menos de 5 puntajes del subtest verbal o de ejecución estén
disponibles, ya sea porque durante su administración algún subtest ha sido invalidado o por otra
razón. Si algunos de los subtests verbales no pueden ser usados, las oraciones pueden inCIuirse
como alternativa. S uno de los subtests de ejecución no fue tomado o sucede otro imprevisto,
entonces es indispensable prorratear los resultados con lo que tenga a mano, y derivar un “cociente
de inteligencia” (Tabla 24).
Si sólo 4 pruebas fueron tomadas, la suma de los 4 puntajes equivalente es multiplicado por
5/4. Los puntajes equivalentes totales deberían basarse al menos sobre 4 subtest verbales y 4 de
ejecución. Se deben prorratear estos dos puntajes por separado, pero nunca se debe prorratear el
puntaje equivalente total. Todo lo prorrateado debe ser indicado en el protocolo con el símbolo
“PRO”.
DETERMINANDO LOS COCIENTES DE INTELIGENCIA

63
Por el uso de la Tabla 22, el examinador puede convertir los puntajes de ejecución
verbales y totales al CI. Estos valores deben ser colocados en espacios apropiados del protocolo.
Para sumas de puntajes equivalentes que son mayores o menores que los que aparecen en la Tabla
22, (ver la Tabla 5). Explicación:
Para cualquier niño que obtiene una suma de puntajes equivalentes mayores o menores que
la Tabla 22 debe establecerlo como “debajo de 45” o “Superior de 155” respectivamente.
Porque ningún niño puede obtener una suma de puntajes equivalentes menor de 5 ya que
dichos puntajes no indican una completa ausencia de la habilidad medida por el subtest, y se debe
considerar sólo como indeterminado, por ejemplo: un niño puede obtener cero en vocabulario, pero
puede saber el significado de algunas palabras. A menos que el niño obtenga un puntaje directo
mayor que cero (o menor que la tabla 22) al menos en 2 subtests verbales.
Ningún CI verbal le será computado y se le puede considerar como no examinado (en verbal).
Pero a menos que el niño obtenga un puntaje directo superior a cero por lo menos en 2 subtests
verbales y al menos en 2 subtests de ejecución, ninguna escala completa del CI (o sea, ni verbal, ni
de ejecución, ni total) debe ser computada.
CONSIDERACIONES ESPECIALES
ASPECTOS CUALITATIVOS:
Mientras que la evaluación de las pruebas deberá ser a base principalmente de puntajes
cuantitativos, un entendimiento profundo de un niño puede ser obtenido atendiendo a los actos y a los
gestos cualitativos e idiosincrásicos de su respuesta. Esto puede reflejar no sólo la influencia de su
hogar y cultura, sino que, también la contribución de roles y factores de personalidad, como
persistencia, impulsos, motivación y necesidad de ganar.
Consideremos por ejemplo, la pregunta de información: “¿QUÉ VIENE EN UNA BOTELLA?”.
Respuestas como champagne, cerveza o algo parecido puede subrayas el impacto de un hogar con
un ambiente particular. La persistencia a menudo se nota, por ejemplo cuando un niño desea
continuar trabajando aún después de haber terminado el tiempo límite. Si un niño responde que él
debe lavarse su cara y manos porque su madre lo dice, puede reflejar dependencia. Así mismo, la
agresión puede estar indicada si el niño dice: “Le pegaré”, cuando se le pregunta que haría si un niño
más pequeño empieza a pelear con él.
Por supuesto, que no se deben ni se pueden sacar deducciones de una respuesta aislada.
Por otro lado, una conducta inesperada o no frecuente puede ser significativa. La ejecución de los
subtests y otros datos disponibles contribuirá a una mayor comprensión y entendimiento del niño.
DIAGNÓSTICO DE DEFICIENCIA MENTAL EN UN NIÑO PRE-ESCOLAR

Esta diagnosis por métodos médicos y psicométricos no es usualmente difícil, pero su
diferencia con otros desórdenes similares, (por ejemplo esquizofrenia y parálisis cerebral), es en
muchos aspectos un serio desafío. No existe sólo el problema de distinguir los retrasos congenitales
del desarrollo mental “Interrumpido” sino de observar y evaluar la naturaleza y carácter de esos
desórdenes, los cuales se van apoderando sistemáticamente en el niño y que tanto en la edad
escolar como posteriormente es la causa del impedimento de decisiones y planes para su futura
educación. Se necesita conocer las virtudes del niño como sus defectos intelectuales. Esta
información puede ser mejor obtenida de un CIaro y metódico examen psicológico.
Infortunadamente, tal información es rara vez disponible en un niño retardado cuando él es
presentado para la admisión a la escuela. Esto es verdad porque él presenta u ofrece resistencia a
una examen psicológico, y su falta de habilidad es frecuentemente no notada antes que se enrole a la
escuela primaria llegando a veces hasta 2do. ó 3er. grado. Muchos de los problemas resultantes, los
directores de las escuelas evitarán si los niños fuesen evaluados individualmente antes de entrar o
ingresar a ellos. Aunque la diagnosis de grandes deficiencias mentales no es difícil generalmente, su
validez en el caso individual puede depender grandemente de la propiedad y estabilidad de los tests
empleados. La efectividad del test, WPPSI para diagnosticar la deficiencia mental dependerá del
64
grado de retarde del niño y edad particular al momento de la prueba. La aplicación del test
presupone un nivel de funcionamiento global, esto es igual al CI de 75 para 4 años, 60 para 5 años, y
50 para 6 años. Para niños con desarrollo menor que éstos niveles, el WPPSI puede ocasionar
demasiadas dificultades y tiene que ser suplementado y a veces reemplazado por otras medidas.

4º PP Eficiencia

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

4º PP Eficiencia

Diunggah oleh

Hak Cipta:

Format Tersedia

1

MANUAL DEL CURSO DE PRUEBAS

IV CICLO - SEMESTRE 2005-II

1.1 INTRODUCCIÓN A LA PSICOMETRIA.

1.3 CAMPO SUSTANTIVO DE LA PSICOMETRÍA.

Contenido de la psicometría: En general, la utilidad más inmediata de la psicometría para una

La psicometría se encarga precisamente de determinar: a) Las condiciones del desarrollo de

1.4 NIVELES DEL CAMPO PSICOMETRICO

El carácter metodológico de la psicometría y su carencia de un campo de contenido

Disciplina metodológica que se refiere directamente al campo de la medición

FUNDAMENTACIÓN MATEMÁTICA Y ESTADSTICA

USO PSICOMÉTRICO APLICACIÓN PSICOMÉTRICA

2. PSICOMETRIA Y SU RELACION CON LA PSICOLOGIA

2.1 PSICOMETRIA Y SU RELACION CON LA PSICOLOGIA.

La psicometría se ocupa de la medición psicológica en cualquiera de los campos temáticos de la

2.2 FUNCIONES DE LA PSICOMETRÍA EN SU RELACIÓN CON LA PSICOLOGÍA. Puede decirse

Psicometría y método. Evidentemente, el método de la psicología es el método de la ciencia empírica,

2.3 PSICOMETRÍA Y SU RELACIÓN CON OTRAS CIENCIAS.

3.2. ESCALAS DE MEDICION

Las mediciones tomadas con escalas de intervalos se prestan al tratamiento de pruebas

ESCALAS OPERACIONES ESTADISTICOS

4.2 PROPOSITOS Y USOS DE LOS TESTS

En la actualidad, el propósito principal de los tests y evaluaciones psicológicas es el mismo que ha

4.3 DEFINICION DE TEST

5. Propiedades Psicometricas de los tests psicológicos

O a +/- 0.19 Nula relación

COEFICIENTE DE ESTABILIDAD. LA CONFIABILIDAD TEST-RETEST.

COEFICIENTE DE EQUIVALENCIA: FORMAS PARALELAS.

COEFICIENTE DE CONSISTENCIA O COHERENCIA INTERNA.

La característica más importante de una prueba en su validez. Sin pruebas de validez, no

A.1 Validez predictiva.

A..2 Validez concurrente.

El criterio de jueces ha sido en muchos casos la estrategia para evaluar la validez de

Correlaciones con otros tests. :VALIDEZ CONGRUENTE

6. CLASIFICACION DE LOS TESTS

Un método de clasificación es la dicotomía estandarizado contra no estandarizado. Un test

En tanto que la dicotomía individual contra de grupo se relaciona con la eficiencia de la

7. CLASIFICACION DE LAS PRUEBAS

Los tests de eficiencia son instrumentos destinados a la exploración de la capacidad

A.1 .TESTS DE FACTORES Y CONDUCTAS ESPECÍFICOS.

A.1-1: TEST DE FACTORES ESPECIFICOS: .

A.1-2: TEST DE CONDUCTAS ESPECIFICOS :

A.2 TESTS DE FACTOR G.

B- TESTS DE INTELIGENCIA PROPIAMENTE DICHOS.

B.1 ESCALAS O PRUEBAS DE DESARROLLO.

8. ESCALA DE MADUREZ VISOMOTOR DE BENDER

La percepción es definida como el proceso de interpretación de los estímulos que Implica

VALIDEZ DE LA ESCALA DE MADURACION VISOMOTORA DE BENDER

La Escala de Maduración conformada por 30 ítems de puntuación dicotómica determinada por la

2. El puntaje obtenido en el B.G. al comienzo del segundo grado se correlaciona estrechamente

B. Validez del B.G. para el diagnóstico de Lesión Cerebral

Factores que incrementan la validez de la Escala de Maduración para el diagnóstico de Lesión

5a 5 min. 13 seg. 3 a 10 min.

Durante la administración de la prueba es muy conveniente registrar las observaciones pertinentes a

3. CONFIABILIDAD DE LA ESCALA DE MADURACION

Para el estudio de la confiabílidad de la escala de maduración Münsterberg consideró dos

Dígase: “Pongan su hoja de manera que se vea la primera hilera de figuras”.

“La mamá gata y sus gatitos”

3. Bandera 4. Paquete 5. Jirafa 6. Pulsera 7. Para tirar al blanco

Cuando el grupo ha terminado el ítem 14,

parte la naturaleza operacional de los actos de la inteligencia.

PUNTAJE PERCENTIL RANGO CATEGORÍA INTELCTUAL Dx

La Escala Wechsler original, Escala Wechsler-Bellevue de Inteligencia (1939), diseñada