Modulo Pruebas Psicometricas

Curso : Pruebas Psicométrica I.
1
Docente : Ricardo Mandamiento Ayquipa. U.S.P.
UNIDAD I: PSICOMETRIA Y SUSTENTO TEORICO DE LOS TEST
PSICOMETRICOS.
Objetivo 1: Adquirir los conocimientos relacionados con los antecedentes de

la psicometría.
1.1 INTRODUCCIÓN A LA PSICOMETRIA.

El término "Psicometría" es el más extendido y general para hacer
referencia a la medición psicológica. Su significado popular y la etimología de la
palabra apuntan en la misma dirección: la disciplina que se encarga de la
medición en Psicología. De hecho, los diccionarios de uso más común como el
de la Real Academia de la Lengua o el de María Moliner también coinciden en
su significado: la medida de los fenómenos psíquicos. Desde el punto de vista
de la propia Psicología, Asì tenemos:
Yela (1968) dice la Psicometría se ocupa de todas las medidas en el

campo psicológico, habiéndose desarrollado a través de dos ramas principales:
los métodos psicofísicos y la teoría de los tests. Nunnally (1973) se refiere a la
Psicometría como la metodología encargada del desarrollo y utilización de las
técnicas de medición en todos los ámbitos de la psicología. Cureton, según la
cual la acepción más amplia de la psicometría abarca a todos los aspectos de
la medición de variables psicológicas
Muñiz (1998) define la Psicometría como "... el conjunto de métodos,

técnicas y teorías implicadas en la medición de variables psicológicas... lo
específico de la Psicometría sería su énfasis y especialización en aquellas
propiedades métricas exigibles a las mediciones psicológicas
independientemente del campo sustantivo de aplicación y de los instrumentos
utilizados"
Martínez-Arías (1995) introduce un matiz que apunta hacia la relación

entre la Psicometría y la Psicología Matemática. Para la autora, la Psicometría
"... aglutina todo el conjunto de modelos formales que posibilitan la medición de
variables psicológicas, centrándose en las condiciones que permiten llevar a
cabo todo proceso de medición en psicología". Cronbach resaltaba que la
psicometría pretende obtener estimaciones cuantitativas; Wilson señalaba que
supone la aplicación de la medición y las matemáticas a la psicología, idea que
también resalta Seoane (1976); Musso (1970) señalaba que la psicometría es
la rama de la psicología cuya finalidad es contruir los medios de trabajo
conceptuales y materiales necesarios para construir variables cuantitativas;
Cerdá consideraba que la psicometría se refiere al conjunto de métodos e
instrumentos de medida;
No resulta difícil entresacar los elementos comunes de las definiciones

anteriores. La Psicometría es una disciplina metodológica, sin un contenido
psicológico propio, pero con un campo sustantivo: la teoría de la
medición en sentido amplio. Muñiz (1998) afirma que el trabajo psicomético
Curso : Pruebas Psicométrica I. 2
tiene como finalidad construir y utilizar adecuadamente los tests y las escalas,
de tal modo que se garantice su fiabilidad, validez y aplicación adecuada.
Rivas (1979) examinó los contenidos de este conjunto de definiciones

con la principal y justificada conclusión de que existe un “consenso general
entre los autores en asignar a la psicometría la tarea de medición de
comportamientos observables y de naturaleza psicológica”.
El concepto de psicometría parece incluir de este modo, el conjunto de

las teorías y desarrollos acerca de la medición en psicología así como los
“métodos y procedimientos para la cuantificación de conceptos tales como
aptitudes, inteligencia, sensaciones, personalidad, actitudes, etc.” . De este
conjunto de conceptualizaciones de la psicometría se desprende que esta es
una disciplina metodológica que se refiere directamente al campo de la
medición psicológica en toda su extensión y que carece de un contenido
psicológico propio, en el sentido en que lo tienen la psicología educativa o la
psicología clínica, por ejemplo. La Psicometría tiene como finalidad llevar a
cabo la medición de la conducta, tanto en el ser humano como en los
animales.
1.1.2 RESEÑA DE LA HISTORIA DE PSICOMETRIA

La revisión de los antecedentes históricos y de la evolución de la medida
en Psicología, ofrece una perspectiva útil para comprender la Psicometría
actual. Para algunos autores, la historia de los tests mentales es tal vez uno de
los mejores ejemplos de la existencia de una interacción entre las demandas
sociales y la evolución de una disciplina científica. Salvando las distancias, la
valoración es aplicable al conjunto de la historia de la medida en Psicología.
La historia de la medición psicológica ha estado marcada por la

interrelación entre la evolución interna de la Psicometría y de la Psicología con
el deseo de responder a las demandas sociales de cada momento histórico,
reflejando un mayor acento en las aplicaciones prácticas que en el desarrollo
teórico. Se desarrollo en base a las diferencias individuales y la consolidación
de institucional de la Psicometría
Estudio de las diferencias individuales
Debemos advertir de una doble simplificación. Primera, dejar a un lado,

por razones de tiempo, la Psicofísica impide lograr una visión comprehensiva
de la historia de la medición en Psicología; segunda, la que vamos a cometer
en este apartado, reducir la historia del estudio de las diferencias individuales a
la historia de los tests psicológicos y presentarla recurriendo a las aportaciones
de algunas figuras clave. La última es reduccionista pero difícil de evitar: gran
parte de la Psicometría actual no se puede comprender sin atender a los
antecedentes y orígenes históricos de los tests psicológicos y de la medida de
la inteligencia.
El rápido progreso económico y social en la Europa de finales del siglo
XIX planteó la necesidad de evaluar las capacidades y conocimientos de los
individuos en contextos educativos, laborales, etc. Si la Filosofía y la Fisiología
fueron las disciplinas que más influyeron en el trabajo de los primeros
psicofísicos, el impacto más dramático sobre el estudio de las diferencias
individuales vino de la Biología. Al tiempo que Fechnner presentaba sus
trabajos, Darwin (1809-1882) presentó su teoría en La Evolución de las
Especies (1859) y su aplicación al estudio del hombre en El origen del hombre
y la selección en relación al sexo (1871). Darwin defendió que la inteligencia y
el sentido moral también se habían ido perfeccionando de manera gradual a
través de la selección natural. Al defender esta idea Darwin no hacía sino
reflejar la visión científica y la opinión popular dominante en la Inglaterra del
siglo XIX, que justificaba el colonialismo y el sistema de clases bajo la creencia
de que el hombre de letras inglés de clase media era el pico de la evolución
humana (Rust y Golombok, 1989). No es exagerado afirmar que las
necesidades de la evaluación educativa fueron las primeras demandas sociales
con un impacto significativo y duradero en la evolución del estudio de las
diferencias individuales y, por ende, de la Psicometría. Los intentos por medir la
inteligencia como respuesta a esas demandas caminan de la mano de los
desarrollos metodológicos durante este periodo.
Thorndike (1997) señala al movimiento hacia la educación obligatoria en

Francia, Inglaterra y Estados Unidos a finales del siglo XIX, como uno de los
desarrollos críticos que propiciaron la medida de la inteligencia. La llegada por
primera vez a las escuelas de niños cuyos padres no había recibido una
educación o, como en el caso americano, cuya lengua materna no era el inglés,
generó una heterogeneidad en la población de alumnos como antes no se
había conocido. La exposición de estos niños a un currículo antiguo, diseñado
para un grupo selecto de estudiantes, trajo como resultado niveles dramáticos
de fracaso escolar próximos al 50%. Este fracaso fue visto como una pérdida
de recursos en un tiempo en que eran limitados, de forma que se planteó la
necesidad de destinar los recursos a quienes más se pudieran beneficiar, el
medio: la evaluación de la inteligencia. Este es el contexto en el que se debe
situar la obra de Binet
Los pioneros de la Psicología llevaban años intentando una formulación

aceptable de la inteligencia. Según Rust y Golombok (1989) los primeros
autores tenían unas definiciones de la inteligencia que no iban más allá de lo
que podría ser la psicología popular del maestro común de escuela. Se
reconocía la diferencia entre una persona educada y una persona inteligente,
entendiendo esta última como una persona "educable", con un origen
esencialmente genético y receptora ideal de los recursos educativos, frente a
los "torpes" incapaces de beneficiarse de la educación normal.
Entre los pioneros en el estudio de las diferencias individuales destaca el

considerado por muchos autores, como el fundador de la Psicometría: Francis
Galton. Primo de Darwin, inició sus investigaciones llevado por el objetivo de
mostrar el componente hereditario del "genio". Para ello reunió el primer banco
con los datos de personas relacionadas y no relacionadas. Influido por el
asociacionismo de Locke y llevado por sus observaciones de que las personas
con deficiencias mentales presentaban una peor ejecución a la hora de
discriminar sensaciones de frío, calor, dolor, etc., pensó que la discriminación
sensorial podía ser el medio para cuantificar el intelecto de una persona. Sus
aportaciones propiamente metodológicas abarcan la formulación de las bases
de procedimientos estadísticos, como el “coeficiente de correlación”
desarrollado por K. Pearson (1857-1936), las intuiciones sobre la forma de
"campana", como imagen para describir la distribución de puntuaciones en un
test, así como las primeras aplicaciones de las escalas de "rating" y los
métodos de cuestionario (Anastasi y Urbina, 1997).
J. M. Catell (1860-1944) trabajo con Wundt, con quién compartió el

interés por los fenómenos perceptivos y sensomotores, y el rigor en el control
de las condiciones en que se realizaban las observaciones, pero de quién se
distanció ante el despreció del experimentalista alemán por las diferencias
individuales. Más tarde trabajo con Galton e inició en Estados Unidos el estudio
de las diferencias individuales. Acuñó el término "test mental" en un artículo
publicado en 1890 en la revista Mind bajo el título “Mental test and
measurements”. Asumió la idea de Galton sobre la posibilidad de medir las
funciones intelectuales por medio de tests de discriminación sensorial y tiempo
de reacción. Sin embargo, los primeros estudios que se realizaron para evaluar
este tipo de tests ofrecieron resultados desalentadores: el "rendimiento
intelectual" mostraba poca correspondencia de unos tests a otros y
prácticamente ninguna relación con estimaciones independientes del nivel
intelectual realizadas por los profesores. Por el contrario, Ebbinghaus,
apuntando ya un cambio de enfoque, había obtenido con un test de terminación
de frases una correspondencia clara con el rendimiento académico de los
niños.
Pero sin duda, la consolidación social de la medición psicológica vino de

la obra del francés Alfred Binet (1857-1911) cuya influencia en el desarrollo de
la teoría de los tests perdura en la actualidad. Binet ya a finales de los años
noventa del siglo XIX criticó la aproximación de Galton y Cattell con el
argumento de que para medir procesos mentales complejos era necesario
observar la ejecución de los individuos en actos mentales complejos,
rechazando la idea de que fuese necesaria una mayor precisión para la que no
había instrumentos disponibles, ya que las diferencias individuales eran
mayores respecto a los procesos superiores que en cuanto a la discriminación
sensorial.
Binet recibió en 1904 el encargo del ministerio francés de instrucción

pública de elaborar un instrumento de medida capaz de diferenciar entre los
niños "educables" y los que no podrían beneficiarse de la educación normal.
Junto con su colaborador Simon presentó en 1905 la primera versión del test
Binet-Simon. El test estaba formado por 30 problemas o tareas dispuestos en
orden de dificultad creciente, que medían la capacidad de juicio, razonamiento
y comprensión. Para determinar el nivel de dificultad, los problemas habían
sido administrados a 50 niños de entre 3 y 11 años más a algún niño retrasado.
La segunda versión del test editada en 1908, incluía un número mayor de ítems
junto con la eliminación de algunos que se habían considerado podían reflejar
diferencias en función de la extracción social de los niños, además aparecían
ya agrupados por niveles de edad. Binet prefirió el término "nivel mental" al de
"edad mental" popularizado por las sucesivas traducciones de la escala, ya que
el primer término estaba exento de las connotaciones evolutivas del segundo.
Al poco tiempo de su presentación, el test de Binet y Simon fue traducido a
diferentes idiomas y aplicado en diversos países, lo que prueba la favorable
acogida social que recibió.
El interés por la obra de Binet se ha mantenido a lo largo del tiempo. Van

der Linden (1986) ha resaltado las contribuciones estrictamente metodológicas
de la aproximación de Binet a la medida de la inteligencia. Primero, frente a los
experimentos antropométricos y psicofísicos que planteaban una única tarea,
Binet decidió alargar la longitud del test por dos motivos: a) el conjunto de
ítems debía ser una representación adecuada de la gran variedad de tareas a
las que se debe enfrentar una persona en su vida diaria; y b) conocedor de las
teorías de Spearman entendió que cada ítem en sí mismo era una media
imprecisa, por lo que era necesario combinar observaciones de un buen
número de ítems para obtener una medida fiable. Segundo, la insistencia de
Binet en la estandarización de la aplicación del test, reflejada en la extrema
precisión de las guías sobre el material, la administración, la puntuación y la
interpretación de las mediciones. Por último, la práctica de "normativizar" el test
para iniciar una interpretación relativa de la ejecución de las personas.
Tras las aportaciones de Binet, los mayores desarrollos en la medición

de las diferencias individuales hay que buscarlos en un área y lugar diferente.
El test de Binet fue introducido en Estados Unidos por H. H. Goddard, cuya
traducción y adaptación recibieron el beneplácito de la audiencia médica, al
venir a cubrir la necesidad de una medida estandarizada y objetiva para el
diagnóstico de la subnormalidad. Sin embargo, fue rápidamente desplazada
por la revisión y adaptación psicométricamente más sólida, realizada por L. M.
Terman en 1916 en la Universidad de Stanford. Al entrar Estados Unidos en la
Primera Guerra Mundial, un comité encabezado por R. M. Yerkes detecta la
necesidad de clasificar de forma rápida al millón y medio de reclutas con
respecto a su nivel intelectual. De nuevo, una demanda social provoca un
avance metodológico: los primeros tests de inteligencia de administración
grupal y no verbales, para evaluar a los reclutas analfabetos o que no tenían
como lengua materna el inglés. En este contexto hay que situar las
contribuciones de A. S. Otis, por la introducción del formato de elección múltiple
y otros formatos de puntuación objetiva. Impulsado por las necesidades
militares aparece también el primer test estandarizado para la evaluación de
variables de personalidad: el “Personal Data Sheet” de R. S. Woodworth, un
instrumento pensado para la detección de personas con inestabilidad
emocional.
La consolidación institucional de la Psicometría
De forma paralela a los avances teóricos y las aplicaciones prácticas, se

fue produciendo la consolidación institucional de la Psicología y, claro está, de
la propia Psicometría. Esta consolidación se refleja en la creación de
asociaciones profesionales, de publicaciones especializadas para la
comunicación entre profesionales y de empresas privadas dedicadas desde el
inicio al floreciente negocio de la evaluación psicológica.
J. Jastrow habla sobre los tests en la primera convención de la American

Psychological Association (APA) en 1892. La APA formó en 1895 un comité
especializado en la nueva tecnología de los tests. En 1899 Kilpatrick,
presidente de la APA, realizó un llamamiento a los psicólogos para que
elaborarán tests de tal naturaleza que "... pudieran ser aplicados tanto a niños
como adultos, que fueran de tal forma que todas las personas tuvieran las
mismas oportunidades de mostrar las capacidades examinadas, y que en aras
de la economía del tiempo fueran diseñados de forma que se pudieran
administrar a una clase o escuela de una vez" (Thorndike, 1997, pág. 6).
Impulsado por la figura clave de Terman el uso de los tests de inteligencia en
las escuelas creció rápidamente. El propio Terman calculó que en el periodo
entre 1920 y 1921 más de dos millones de niños habían respondido a un test
de inteligencia. El uso de test también se extendió al mundo laboral como
prueba su incorporación a las prácticas de selección de la administración
americana.
Cattell fundó la Psychological Corporation para la producción industrial

de tests en 1922. En 1947 se funda el Educational Testing Service (ETS)
institución sin animo de lucro que no sólo se ha encargado de la producción de
tests estandarizados de rendimiento y tests de aptitud académica, sino que
desde su constitución, ha contribuido a la formación y práctica profesional de
influyentes psicómetras. Desde 1975, el ETS edita en formato CD-ROM el
proyecto ERIC donde con una periodicidad anual se recoge la información
disponible sobre tests, escalamiento y medición psicológica y educativa.
Galton, Pearson y Weldon fundaron en 1901 la revista Biometrika que desde

entonces publica trabajos matemáticos relacionados con la Biología y la
Psicología. Thorndike funda en Estados Unidos en 1936 la publicación
Psychometrika, revista de referencia para la Psicometría desde sus inicios.
Desde entonces, la aparición de revistas relacionadas con la medición
psicológica ha sido continua. Un acontecimiento que se ha convertido en
referente obligado para todos los profesionales es la publicación por las
asociaciones profesionales más relevantes de las guías técnicas y éticas de la
medición psicológica y educativa. Las recomendaciones elaboradas por la APA
son, sin duda, las que han tenido y tienen una mayor influencia.
La Psicometría española : La aparición de la Psicometría en España

está ligada al nacimiento y desarrollo de la propia Psicología científica al igual
que en el resto del mundo. Carpintero (1996) señala uno de los rasgos
distintivos de la psicología española que también imprime carácter a la propia
Psicometría: España ha sido un país más receptor que creativo y el interés por
la disciplina fue el resultado de la constatación de que la Psicología podía
ofrecer soluciones prácticas en ámbitos como la educación, la clínica o la
empresa.
Autores del Renacimiento como Luis Vives (1492-1540) o Huarte de San
Juan (1530-1589) son los iniciadores de una tradición que retomará la
psicología científica cuando inicia su andadura en las últimas décadas del siglo
XIX. Carpintero (1996) sitúa en la Guerra Civil la frontera divisoria entre dos
épocas. Antes de la ruptura que supuso la guerra es posible rastrear entre las
aportaciones de diferentes figuras los antecedentes de la Psicometría
española. Muñiz (1991) recoge una reseña de un libro publicado por Julian
Besteiro en 1897 con el título de La Psicofísica. Carpintero (1996) destaca
entre los personajes de lo que denomina "la primera psicotecnia" a Emilio Mira
y López (1896-1964). Mira fundó en Barcelona el Institut d'Orientacio
Professional en 1918, realizó trabajos en el campo de la orientación y selección
profesional y fue autor de un test influido por el acercamiento sensomotriz a la
consciencia: el Test Miokinetiko (PMK). Carpintero (1996) achaca a la falta de
un análisis masivo de sujetos normales en contextos industriales o militares al
igual que se hacía en Estados Unidos, la falta de una consciencia amplia sobre
la utilidad social de la Psicología durante este periodo.
José Germain (1898-1986) había iniciado su labor antes de la guerra en

el entorno intelectual de la Institución Libre de Enseñanza, como prueba la
adaptación y baremación para la población española del test de Terman que
realizó junto a Mercedes Rodrigo en 1930. Sin embargo, destaca su figura por
ser el iniciador, junto con sus discípulos, del largo proceso de recuperación de
la psicología científica en España de los años cuarenta. Germain fue en 1948 el
primer director del recién creado Departamento de Psicología Experimental,
dentro del Instituto de Filosofía del Consejo Superior de Instituciones
Científicas. Entre los discípulos de Germain se encontraba Mariano Yela (1921-
1994) figura sin la que es imposible entender la Psicometría española.
La Psicometría española carece de una revista específica aunque son

muchas las publicaciones periódicas que dedican un apartado a la metodología
de la medición psicológica. En 1995 se constituyó la Asociación Española de
Metodología de las Ciencias del Comportamiento (AEMCO), encargada de
organizar los Congresos de Metodología que con periodicidad bienal, van ya
por su sexta celebración. AEMCO ha editado en 1999 el primer número de la
revista Metodología de las Ciencias del Comportamiento con la pretensión de
ser el lugar de referencia para las publicaciones de los metodologos españoles
en el ámbito de las ciencias humanas y sociales.
Objetivo 2: Conceptualizar Psicometría, Identificar la relaciòn con otras

ciencias Relaciòn y el status científico de la Psicometría.
1.1.3. CONCEPTUALIZACION DE LA PSICOMETRÍA.

Se define a la psicometría como la teoría y la metodología acerca de la medida

y sus técnicas en psicología, incluyendo sus condiciones, limitaciones y
finalidades. La psicometría se refiere al campo de la teoría y práctica sobre
la elaboración, evaluación y aplicación de las medidas en psicología. Este
es naturalmente un campo muy amplio que carece de objeto de contenido
psicológico específico que le sea exclusivo. Es una disciplina metodológica que
sirve y fundamente la medición en los diversos campos psicológicos con objeto
de estudio propio, natural o cultural. En tanto que cada una de las parcelas de
la psicología (básica, diferencial, educativa, social, cognitiva, etc.) necesita
realizar mediciones de los constructos que le son propios, implica y hace uso
de la psicometría. La psicometría por tanto es una disciplina metodológica,
centrada sobre aspectos relativos a la medición, sus condiciones y sus usos,
que está en el soporte mismo de la investigación y la práctica profesional de
cualquier campo psicológico.
No debe entenderse mal la afirmación de que la psicometría carece de

un contenido psicológico propio. Esta afirmación no significa que la
psicometría no tenga un campo propio. Al contrario, significa que el cuerpo
teórico y empírico de la psicometría no puede confundirse con ningún otro
campo psicológico. La psicometría tiene un campo sustantivo propio relativo a
la teoría de la medición en sentido amplio, un campo que puede denominarse
teoría psicométrica y que contiene conocimientos fundamentales para la
medición psicológica virtualmente en todos los campos psicológicos.
El carácter sustantivo de la psicometría puede entenderse fácilmente

mediante un ejemplo. Tomemos la teoría de la fiabilidad, que es una parte
principal y bien conocida de la teoría psicométrica clásica. Esta teoría es un
conjunto denso, relativamente complejo y bien estructurado de conocimiento
que no puede ser adscrito a ninguna parte de la psicología. No puede decirse
que sea patrimonio de la psicología clínica, ni del psicodiagnóstico, ni de la
psicología social, ni de la psicología educativa, ni de ninguna otra rama de la
psicología. Sin embargo, en todos esos campos se utiliza la teoría de la
fiabilidad en la construcción y evaluación de instrumentos de medida
psicológica. La teoría de la fiabilidad es un ejemplo emblemático del cuerpo
sustantivo de conocimientos de la psicometría.
Contenido de la psicometría: En general, la utilidad más inmediata de la

psicometría para una buena parte de los psicólogos consiste en elaborar y
valorar medidas psicológicas. Estas medidas pueden referirse a los diversos
objetos a los que se refiere la psicología, incluyendo estímulos, personas y
conductas en todas sus modalidades.
La psicometría se encarga precisamente de determinar: a) Las
condiciones del desarrollo de medidas, b) Las cualidades de bondad de las
medidas c) El uso que esas medidas deben cumplir y d) La elaboración misma
de las medidas psicológicas.
Nunnally (1987) utiliza la etiqueta “teoría psicométrica” en
contraposición a la aplicación psicométrica, que comprende el desarrollo de las
medidas psicológicas concretas y la investigación sobre esos instrumentos de
medida particulares. Desde luego, la teoría psicométrica comprende la “teoría
de los tests mentales” y la “teoría y métodos de escalamiento” para decirlo con
los títulos de las obras quizás más emblemáticas.
1.1.4. PSICOMETRÍA Y SU RELACIÓN CON OTRAS CIENCIAS.
Una parte de los contenidos que un psicólogo está acostumbrado a ver como
psicométricos serían calificados de econométricos por un economista; de
biométricos por un médico o un biólogo, etc. Existe un núcleo común de teoría
métrica y de procedimientos que se extiende formando parte de los cimientos
necesarios para el conocimiento empírico de las ciencias del comportamiento,
biológicas, sociales y de la salud. La relación más estrecha se da quizás con la
medición en educación, que usualmente puede considerarse muy
estrechamente vinculada en su desarrollo a la medición psicológica.
Prácticamente, los mismos contenidos que un psicólogo considera
psicométricos forman parte para un pedagogo del campo de la medición
educativa. El campo de la medición educativa parece no diferenciarse del
campo de la medición psicológica más que en algunas cuestiones de acento.
La relación es también muy estrecha con la medición en sociología

(piénsese, por ejemplo, en la medición de actitudes sociales, quizás a través de
la estrecha conexión que la psicología social mantiene entre sociología y
psicología. La teoría de la medición para la psiquiatría y para determinadas
zonas del diagnóstico y la evaluación psicológica puede considerarse
indistinguible. Aún con aspectos y zonas más distantes de la medicina, de la
economía, de la biología y de otras ciencias, el núcleo conceptual de la teoría
métrica comparte muy estrechos vínculos. Esta situación es una consecuencia
del estatus epistemológico de estas ciencias y desde un punto de vista práctico
resulta muy enriquecedora.
De hecho, la naturaleza sustantiva e interdisciplinar de buena parte del

conocimiento psicométrico puede verse anecdóticamente reflejada en la
procedencia y formación de importantes autores vinculados al campo. Fechner,
por ejemplo, tan asociado al origen de la psicofísica -que es, a su vez, el punto
de partida del escalamiento psicológico- fue en realidad un filósofo que nunca
se interesó por la psicofísica más que como un ejemplo que cumplía un papel
en su sistema de pensamiento. Mucho más recientemente, autores como
McIver; Carmines y Zeller, que han trabajado en cuestiones de escalamiento y
teoría de la medición, son en realidad profesores de ciencias políticas
preocupados por la medición en su campo. El mismo Frederic Mather Lord,
quizás el autor más importante en buena parte de la psicometría de los últimos
cincuenta años, es, en realidad, un sociólogo reconvertido a psicólogo
educativo. Rasch, uno de los psicómetras que han traído aportaciones más
eminentes y enriquecedoras es en realidad un matemático que empezó a
interesarse por razones circunstanciales por las cuestiones de medición
psicológica. La lista podría extenderse fácilmente. Estos currícula, con injertos
diversos e importantes entre diversas ciencias próximas, son verdaderamente
frecuentes y probablemente muy enriquecedores para el desarrollo del campo
métrico.
Ello no significa que no existan particularidades en el terreno de la

medición psicológica. Sería bien difícil investigar el tema de las relaciones de
depredación de las rapaces nocturnas utilizando cuestionarios de autoinforme,
dado que los búhos y sus congéneres no contestan autoinformes. Allí, sería
desde luego, más útil un trabajo métrico que informara cuantitativamente sobre
la composición de los despojos de sus presas que arrojan estas aves. Sin
embargo, el modelo de tratamiento métrico de la información recogida, en
vistas a determinar las diversas cadenas de depredación, quizás no es tan
distinto de un problema psicológico clásico de discriminación y clasificación de
patologías.
De este modo, la mayoría de los instrumentos de medida psicológicos

son explícita e intrínsecamente psicológicos y sólo comparten sus
características principales con campos estrechamente próximos como la
medición en educación. Sin embargo, las teorías de la medición y los
procedimientos de escalamiento pueden ser menos específicos de la
psicología, aun siendo específicamente psicométricos. Dicho más formalmente,
los campos de la aplicación métrica y del uso métrico suelen ser específicos de
la temática científica que se está tratando; la teoría métrica subyacente puede
permanecer usualmente común.
La psicometría también se relaciona con la matemática. La psicología
matemática se caracteriza por emplear modelos matemáticos para representar
fenómenos psicológicos. Un modelo, como primera aproximación, puede
definirse como una representación formalizada o abstracta de un fenómeno. Un
modelo permite efectuar predicciones contrastables que deben comprobarse o
verificarse, poniendo de manifiesto el ajuste entre el modelo y el mundo real.
Un modelo matemático es un modelo teórico expresado en lenguaje
matemático, de modo que puede utilizar las ventajas de las matemáticas para
establecer consecuencias y estudiar el fenómeno. Puede caracterizarse a la
investigación como un intento por construir modelos de la realidad que hay que
someter a contrastación comparando sus consecuencias con los datos
observables. Desde un punto de vista lógico, los datos pueden refutar un
modelo, pero nunca demostrarlo. Los modelos matemáticos son una forma de
expresión de teorías científicas que presentan ventajas por su generalidad, su
precisión y su poder deductivo.
Decía Rubén Ardila en una conferencia dictada en la Universidad de

Valencia el 21 de Noviembre de 1988, que “la psicología se orienta hacia
convertirse en una disciplina matemática” en el sentido de que el progreso de la
ciencia y la matematización de sus postulados corren necesariamente parejos.
Este punto de visto no es desde luego nada extravagante, y ya fue expresado
con toda claridad por el mismo Stevens en 1951, cuando señaló que “la
estatura de una ciencia es medida comúnmente por el grado en que hace uso
de las matemáticas. Con todo, las metemáticas no son ellas mismas una
ciencia, en el sentido empírico, sino un sistema simbólico, lógico, formal -un
juego de signos y reglas. La virtud que hace a las matemáticas no triviales, es
su capacidad para servir como modelo para eventos y relaciones en el mundo
empírico”. En las afirmaciones anteriores de Stevens se encuentra una parte
del concepto de psicología matemática.
Coombs, Dawes y Tversky (1981) han caracterizado a la psicología

matemática por la utilización de métodos matemáticos en cuestiones
psicológicas. Faverge (1972) ya había destacado el papel de las matemáticas
como lenguaje en el que se expfresa la psicología matemática. Esta
aproximación resalta la aplicación de las matemáticas a la psicología y la
ausencia de contenido psicológico particular de la psicología matemática, que
se caracterizaría más por un “estilo de investigación”. También Laming (1973)
había abundado en este punto de vista caracterizando a la psicología
matemática por sus métodos y no por sus campos de aplicación. La definición
de psicología matemática que ofrece Seoane (1980) resalta también la no
adscripción de contenidos temáticos y el uso del lenguaje matemático como
característica que primero distinguió a esta disciplina. Restle y Greeno (1970)
han destacado cómo en la psicología matemática es la psicología la que usa
las matemáticas, de modo que éstas últimas cumplen un papel instrumental
respecto a la primera, en lugar de considerar que las matemáticas son
ejemplificadas con cuestiones psicológicas. Santisteban (1982) destaca
claramente la caracterización de la psicología matemática por el método: “lo
que distingue a la psicología matemática de otras áreas de especialidad
psicológica, no es el objeto de estudio, que por supuesto es la psicología, sino
el método sistemático de investigarlo, con una metodología que, a grandes
rasgos, consiste en crear teorías o modelos expresados en lenguaje
matemático o de ordenador, y utilizar la deducción lógico-matemática y la
simulación para predecir y explicar las propiedades del objeto de estudio”
Ahora bien, un modo de ver las cosas que parece extendido es considerar la
psicometría como un brazo de la psicología matemática, que estaría formada
por tres grandes campos: el de la pscioestadística; el de la psicometría y el de
los modelos. Al decir de Seoane (1980) esta clasificación se desprende de una
revisión de los principales manuales sobre psicología matemática. Esta es
desde luego una clasificación académica quizás más relacionada con la
estructura eventual de un área de conocimiento que con el tipo de contenidos
característicos de esos tres grandes campos. A nuestro juicio, la estadística
como una rama de la matemática, la psicometría como una ciencia métrica
específica a interdisciplinar a la vez, y los modelos matemáticos como teorías
psicológicas formales, compartiendo unas referencias metodológicas comunes,
tienen tres estatus gnoseológicos distintos. Sin embargo, hay un conjunto de
referencias comunes: el método científico, los métodos de la psicología
matemática; el lenguaje común matemático-estadístico; la orientación
metodológica y el lugar de los modelos.
Objetivo 3: Identificar los niveles de la Psicometría.
I. 2 NIVELES DE LA PSICOMETRIA
El carácter metodológico de la psicometría y su carencia de un campo
de contenido psicológico específico no significan que carezca de un espacio de
contenido teórico propio. Existe evidentemente de un campo de teoría
psicométrica. El campo de la teoría psicométrica se refiere a las teorías
sobre la medición psicológica. Al conjunto de enunciados que constituyen el
cuerpo teórico de fundamentación, explicación y desarrollo de la medición en
psicología.
La estructura del campo de trabajo de la psicometría puede reflejarse
distinguiendo claramente cuatro niveles.
A. Teoría psicométrica. Para medir una variable psicológica no sólo hace

falta una teoría sobre la variable psicológica -teoría psicológica- , sino
también, además, una teoría sobre la medición psicológica. Esta teoría
sobre la medición psicológica, tomando las palabras con un sentido
generoso, constituye la teoría psicométrica.
La teoría psicométrica está ubicada en el núcleo principal de la psicometría

y constituye el centro de su propio cuerpo teórico. Un cuerpo de teoría
metodológica, básicamente escrito en el lenguaje de las matemáticas, que
nos permite explicar y articular los métodos de medición psicológicos. La
teoría psicométrica puede distingurse sólo desde un punto de vista práctico
de los métodos psicométricos. Puede considerarse que los métodos
psicométricos están referidos a los procedimientos prácticos concretos que
permiten obtener instrumentos de medida, efectuar mediciones y poner a
prueba la calidad de los instrumentos de medida y de las mediciones. Esos
métodos psicométricos constituyen la dimensión con proyección práctica,
para decirlo de algún modo, de las teorías psicométricas, que son las que
conforman el pilar de elaboración y justificación teórica. Cuando usamos la
palabra psicometría con un uso sustantivo, como ciencia, nos referimos
sobre todo a la teoría psicométrica incluyendo a los métodos psicométricos
asociados a ésta. Lo más común es utilizar la etiqueta “teoría psicométrica”
para hacer referencia tanto a la teoría como a los métodos psicométricos
asociados a aquella de un modo frecuentemente indesligable.
La teoría psicométrica es la parte de la psicometría que constituye su

núcleo central, conteniendo las teorías de la medición psicológica, en
sentido amplio, y los procedimientos metodológicos asociados.
Evidentemente, las teorías de la medición psicológica se elaboran
usualmente con vocación de servir a la creación de instrumentos de
medida específicos.
B. Aplicación psicométrica. Es en la creación de instrumentos de medida y

en el estudio empírico de los mismos desde el punto de vista de la
medición, donde se aplica y cobra su sentido más inmediatamente útil la
teoría psicométrica. Si la psicometría se ha de referir a la medición
psicológica necesariamente debe incluir este campo de aplicación
psicométrica.
La aplicación psicométrica comprende el campo del desarrollo de

instrumentos de medida psicológicos directamente útiles a los propósitos
de medición de acuerdo con las teorías psicológicas. La aplicación
psicométrica cubre el campo de la medición psicológica práctica. De este
modo, la psicometría se refiere no sólo a la teoría y fundamentos de la
medición, sino también a la medición psicológica práctica que es la
expresión aplicada de aquélla. La aplicación psicométrica incluye el campo
de la construcción de instrumentos de medida y también el conjunto de
esos instrumentos incluyendo sus condiciones de bondad y uso. Quizás la
autora más representativa de esta faceta u orientación de la psicometría
sea Anne Anastasi (1968, 1973) que en las sucesivas ediciones revisadas
de su libro “Tests psicológicos” ha tratado la psicometría dedicando una
parte introductoria del texto a los “fundamentos de los tests psicológicos”,
pero el resto de las partes de la obra a los tests de inteligencia; a los tests
de aptitudes diferenciales y a los tests de personalidad.
C. Fundamentación matemática y estadística. La teoría psicométrica está

asentada sobre la base de una fundamentación matemática y estadística.
Efectivamente, la teoría y los métodos psicométricos están edificados y
fundamentados en las matemáticas y en la estadística, con las que también
mantienen una desigual relación bidireccional. Por una parte, la teoría
psicométrica se soporta sobre el conocimiento matemático y estadístico, en
ese sentido, la estadística en particular, y las matemáticas en general,
resultan instrumentales para la teoría psicométrica.
Las teorías y los métodos psicométricos están escritos principalmente en

lenguaje matemático y estadístico, obteniendo con ello los fuertes
beneficios formales y conceptuales que estas disciplinas aportan en cuanto
se aplican a todos los campos científicos. Es difícil, si no imposible,
encontrar un ejemplo de método psicométrico fundamentado y extendido
en la comunidad científica que no esté amparado sobre una
fundamentación estadística o matemática. Por otra parte, la psicometría
también ha contribuido a suscitar problemas y soluciones que han
estimulado el desarrollo de la estadística. Un ejemplo clásico en este
terreno es el intenso desarrollo de los métodos factoriales, nacidos en el
campo psicométrico y extendidos a través de su incorporación a los
métodos de la estadística multivariada, a otras ciencias empíricas.
D: Uso psicométrico. Por último quizás debe limitarse lo que se entiende por
aplicación psicométrica, que se considera parte de la psicometría,
distinguiéndolo del uso de la psicometría. Prácticamente, toda la psicología,
y prácticamente en cualquier trabajo empírico, usa de uno u otro modo, de
la medición psicológica para obtener información precisa de la realidad,
para poner a prueba hipótesis, para diagnosticar, para predecir, etc.
Justamente, la medición es una vía que relaciona teoría y realidad.
Sin embargo, este uso de la psicometría se limita a utilizar los instrumentos

de medida oportunos, de modo que el énfasis está puesto en el uso de la
información obtenida para propósitos psicológicos prácticos o de
investigación y no en el desarrollo del instrumento de medida. Hemos
reservado la expresión uso psicométrico para referirnos a este amplísimo
campo del trabajo psicológico empírico que usa de los instrumentos
psicométricos sin que los instrumentos mismos sean el objeto del trabajo.
CONCEPTO DE PSICOMETRIA
PSICOMETRIA
FUNDAMENTACION MATEMATICA Y
ESTADISTICA TEORIA PSICOMETRICA
Teorías sobre la medición psicológica. Cuerpo teórico de
Procedimientos y técnicas
explicación y desarrollo de la medición y sus métodos en
estadísticas sobre los que se elabora
psicología
la psicometría,
+
USO PSICOMETRICO APLICACIÓN PSICOMETRICA
La utilización de la medición psicológica en Elaboración de instrumentos de medida psicológica
los diversos campos psicológicos y que no
puede considerarse como una parte de la Aplicación de la teoría psicométrica a la medición de los
psicometría diversos constructos y variables psicológicas de interés
Objetivo 4: Identificar las ventajas de las medidas estandarizadas
1.3 VENTAJAS DE LAS MEDIDAS ESTANDARIZADAS

Las medidas basadas en reglas bien desarrolladas, incluyendo por lo
general algunos formatos de normas que describen los puntajes obtenidos en
poblaciones de interés, se llaman “estandarizadas”. Algunas de las ventajas
de las medidas estandarizadas sobre los juicios personales son las siguientes:
Objetividad. La principal ventaja de la medición es eliminar las

conjeturas de la observación científica. Un principio clave de la ciencia es que
cualquier exposición de hechos realizada por un científico debe ser verificable
de manera independiente por otros científicos. El principio es violado si los
científicos pueden estar en desacuerdo con la medida. Por ejemplo, en virtud
de que no existe una medida estandarizada de la “energía libidinosa”, dos
psicólogos podrían estar en gran desacuerdo con respecto a la energía
libidinosa de un paciente. Evidentemente, será difícil evaluar teorías de la
energía libidinosa hasta que ésta pueda ser medida.
Podríamos argumentar que la medición es el principal problema de la

psicología. Los avances importantes en psicología, sino es que en todas las
ciencias, a menudo están basados en avances en la medición. Los resultados
científicos implican de manera inevitable relaciones funcionales entre variables
mensurables, y la ciencia de la psicología no puede progresar más rápido que
la medición de sus variables fundamentales.
´
Cuantificación. Los resultados numéricos proporcionados por las
medidas estandarizadas tienen dos ventajas. Primero, los índices numéricos
pueden ser reportados con mayor detalle que los juicios personales,
permitiendo que se noten efectos más sutiles. Los maestros pueden ser
capaces de asignar de manera confiable a los niños en categorías amplias de
inteligencia como “brillante”, “promedio” y “por debajo de lo normal”, pero las
pruebas de inteligencia proporcionan diferenciaciones más finas. Segundo, la
cuantificación permite el uso de métodos más potentes de análisis matemático
que con frecuencia son esenciales para la elaboración de teorías y el análisis
de experimentos. Aunque teorías psicológicas importantes no necesitan ser
demasiado cuantitativas, la tendencia claramente es, y seguirá siendo, esa
dirección. Las teorías que se pueden afirmar matemáticamente hacen posible
deducciones precisas para la investigación empírica.
´
Comunicación. La ciencia es una empresa demasiado pública que
requiere de una comunicación eficiente entre científicos. Los científicos se
basan en el pasado y sus hallazgos deben ser comparados con los resultados
de otros científicos que estén trabajando en el mismo problema. La
comunicación se facilita enormemente cuando se dispone de medidas
estandarizadas. Supongamos, por ejemplo, que se ha reportado que un
tratamiento particular hace que los sujetos “parezcan ansiosos” en un
experimento sobre los efectos de la tensión emocional en la reacción de
ansiedad. Esto deja muchas interrogantes con respecto a lo que el
experimentador considera “parecer ansioso” y dificulta que otros
experimentadores investiguen el mismo efecto. Puede lograrse una
comunicación mucho mejor si la medida de ansiedad estuviera estandarizada.
Hasta las evaluaciones subjetivas muy cuidadosas son más difíciles de
comunicar que los análisis estadísticos de las medidas estandarizadas.
Economía. Aunque el desarrollo de las medidas estandarizadas con

frecuencia requiere de una gran cantidad de trabajo, por lo general, son mucho
más económicas en tiempo y dinero que las evaluaciones subjetivas después
de que han sido desarrolladas. Por ejemplo, aun los mejores jueces de la
inteligencia necesitan observar a un niño por algún tiempo. Una estimación al
menos tan buena puede obtenerse por lo común en menos de una hora con
cualquiera de las diversas medidas de inteligencia que pueden ser
administradas en grupo a bajo costo.
Además de ahorrar tiempo y dinero, las medidas estandarizadas a
menudo liberan a los profesionales para que puedan dedicarse a trabajos más
importantes. Por lo general, el progreso favorece a las medidas que requieren
relativamente poco esfuerzo para su empleo o que permiten que técnicos
menos entrenados realicen la administración y la calificación. El tiempo
ahorrado permite tanto a los que ejercen la profesión como a los científicos de
disponer de más tiempo para los aspectos más eruditos y creativos de su
trabajo.
Generalización científica. La generalización científica se halla en el

centro mismo del quehacer científico. La mayoría de las observaciones
implican acontecimientos particulares. La ciencia busca encontrar el orden
subyacente en estos acontecimientos particulares por medio de la formulación
y evaluación de hipótesis de naturaleza más general. Las teorías, incluyendo
aquellas de las ciencias conductuales, intentan ser generales y por
consiguiente explicar un mayor número de fenómenos con una serie pequeña y
simple de principios.
Muchas generalizaciones científicas, en particular en las ciencias

conductuales, deben ser expresadas en términos estadísticos. Estas tratan con
la probabilidad de que ocurra un evento y no pueden ser especificadas con
más exactitud. El desarrollo y uso de métodos estandarizados son tan
esenciales para las relaciones probabilísticas como para las deterministas
Objetivo 4: Identificar los elementos básicos de Medición psicológica
1.4 LA MEDICIÓN EN LA CIENCIA:

El objetivo de estudio de la psicología es el estudio de la conducta, por lo
general son las personas, pero también se encarga del comportamiento de
otros seres vivos, Por lo tanto se estudia la conducta del hombre, o cualquier
otro objeto viviente. Asimismo estudia los datos físicos productos de la
conducta de dichos seres. A estos individuos que arrojan o expresan o
presentan datos lo llamaremos objetos dentro del campo de la medición
psicológica.
Nunnally, J y Bernstein, I. Consideran que aunque se han escrito cientos de
tomos enteros sobre la naturaleza de la medición, al final ésta se reduce a dos
conceptos bastante simples: la “medición” consiste en reglas para asignar
símbolos a objetos de manera que:
1) Representen cantidades o atributos de forma numérica (escala de

medición) o
2) Definan si los objetos caen en las mismas categorías o en otras diferentes
con respecto a un atributo determinado (clasificación).
La mayor parte de lo que históricamente llamamos medición tiene que ver con
las escalas, y por consiguiente, con las propiedades de los números, pero la
clasificación puede ser de igual importancia. El objeto de estudio de la
psicología por lo general son las personas, pero pueden serlo animales
inferiores como sucede en algunas áreas de la psicología y de la biología, u
objetos físicos, como en ciertas investigaciones de mercado. El término
“reglas” indica que la asignación de números debe hacerse de manera
explícita. Algunas reglas son tan evidentes que es innecesaria una definición
detallada, como la medición de la estatura de una persona con una cinta
métrica. Por desgracia, estos casos obvios son excepcionales en la ciencia.
Ciertamente, las reglas para medir la mayoría de atributos tales como
inteligencia, timidez o aleccionamiento no son obvias por intuición.
Las reglas, a su vez, son un aspecto importante de la estandarización. Una

medida se estandariza hasta el punto en que
1) Sus reglas sean claras;
2) Su aplicación sea práctica;
3) No requiera de una gran habilidad de parte de los administradores, más
allá de la necesaria para su entrenamiento inicial, y
4) Sus resultados no dependan del administrador específico. El punto esencial
sobre la estandarización es que los usuarios de un instrumento
determinado deben obtener resultados similares. De este modo, una
prueba de inteligencia está bien estandarizada si diferentes examinadores
obtienen puntajes similares al evaluar a un niño en particular en un
momento determinado.
La asignación de símbolos reglas a los objetos a medirse debe darse de tal

manera que puedan cumplir con 2 condiciones:
1) Los símbolos definan si los objetos caen en las mismas categorías o en
otras diferentes con respecto a un atributo determinado (clasificación).
2) Los símbolos representen cantidades o atributos de forma numérica (escala
de medición) es decir una característica particular de los objetos.
El término “atributo” en la definición indica que la medición siempre implica

alguna característica particular de los objetos. Los objetos no pueden medirse,
se miden sus atributos. No medimos a un niño per se, sino más bien su
inteligencia, estatura o socialización, No medimos a un adicto sino medimos
sus conducta de dependencia, de tolerancia , de interacción con los demás.
La distinción entre un objeto y sus atributos puede sonar como una mera
sutileza, pero es importante debido a que:
 Primero, demuestra que la medición requiere de un proceso de

abstracción. Un atributo implica relaciones entre objetos en una dimensión
particular, por ejemplo, peso o inteligencia. Una roca roja y una roca blanca
pueden pesar lo mismo, y dos rocas blancas pueden tener pesos
diferentes. Los atributos de peso y color no deben confundirse entre sí ni
con ningún otro atributo.
 Una segunda razón para enfatizar que uno mide atributos y no objetos es
que nos hace considerar con cuidado la naturaleza de un atributo antes de
intentar la medición. Por ejemplo, un atributo en el que creemos puede no
existir en la forma propuesta, como sucede con los muchos resultados
negativos obtenidos en los esfuerzos por medir un atributo global de
rigidez, lo que hace debatible que exista tal atributo. Aun términos muy
populares usados para describir a las personas pueden no corresponder a
atributos mensurables, por ejemplo, clarividencia, adivino, etc.. También es
común que en un supuesto atributo unitario se confundan diversos atributos
más específicos. Por ejemplo, “adaptación” puede incluir satisfacción con la
vida, humor positivo, habilidades para enfrentar la tensión emocional y
otros significados del término. Aunque tales medidas conglomeradas
puedan ser justificables en parte en campos prácticos, su uso puede
socavar a la ciencia psicológica.
La primera parte de la definición de medición subraya el uso de números

para representar cantidades en escalas. Técnicamente, la cuantificación
implica qué tanto de un atributo está presente en un objeto; así, los números
comunican la cantidad. La cuantificación se entrelaza de manera tan íntima con
la medición, que con frecuencia los dos términos se usan de modo indistinto.
Esto es desafortunado, ya que la segunda parte de la definición, la
clasificación, es al menos igualmente importante para la ciencia.
Técnicamente, la cuantificación implica qué tanto de un atributo está

presente en un objeto; así, los números comunican la cantidad. La
cuantificación se entrelaza de manera tan íntima con la medición, que con
frecuencia los dos términos se usan de modo indistinto. Esto es desafortunado,
ya que la segunda parte de la definición, la clasificación, es al menos
igualmente importante para la ciencia.
Las reglas empleadas para definir una medida particular deben estar
exentas de ambigüedad. Pueden desarrollarse a partir de un complicado
modelo deductivo, basarse en la experiencia previa, surgir del sentido común o
simplemente tener origen en corazonadas, pero el punto crucial es la manera
en que los usuarios concuerdan de manera consistente en la medida y, por
último, qué tan bien explica el método de medición fenómenos importantes. En
consecuencia, cualquier serie de reglas que cuantifique propiedades de objetos
de manera no ambigua, constituye un método de medición legítimo y tiene
derecho a competir por la utilidad científica con otras medidas.
Objetivo 6: Identificar criterios teóricos y metodológicos de los tests
psicológicos
1.5 LA TEORIA CLASICA DE LOS TESTS
Las técnicas de evaluación psicológica permiten, en general algún tipo

de cuantificación, aunque con mayor frecuencia no es esa la única
información que aportan. De hecho y como indica Sundberg (1977) esta
información en una combinación de datos duros ( o cuantitativos ) o blancos
(cualitativos ). El peso de uno u otra dependerá, lógicamente de la finalidad
concreta con que se utilicen. En este sentido cabe distinguir entre la
evaluación para investigación y la evaluación para un contexto clínico, esta
segunda mucho más cargado de datos cualitativos (aunque estos no se hallan
necesariamente ausentes en la primera). Ambos tipos de datos cumplen una
finalidad distinta y debe dársele la consideración que merecen:
La cuantificación desempeña un papel importante en la en la
comprobación de hipótesis, mientras que los datos cualitativos sirven más bien,
dentro de una base de observación para plantear hipótesis y refinarlas . Sin
embargo la capacitación para la obtención de estos datos cualitativamente es
seguramente menos susceptible de entrenamiento sistemático ya que en
definitiva, depende mucho más de un fuerte bagaje teórico sobre aspectos
básicos de funcionamiento humano que oriente la observación y menos de una
capacidad teórica. La cuantificación, por otra parte, presenta un elemento
omnipotente en todo elemento de evaluación.
La mayor parte de las pruebas estandarizadas en nuestro medio han

sido creadas, son interpretadas, y pueden ser evaluadas dentro de la teoría
clásica de los test, o de puntuaciones verdaderas. La teoría de clásica de los
tests sostiene que las puntuaciones obtenidas o empíricas (X) es la suma de
las puntuaciones verdaderas (V , un concepto teórico que se supone
representa la cualidad del sujeto que se pretende medir) y el error de medida
(E, o error aleatorio). La puntuación verdadera es la media de la distribución
teórica que podrían hallarse en evaluaciones repetidas de la misma persona
con el mismo test.
El error de medida se entiende toda desviación aleatoria o no

sistemática, de la puntuación verdadera, no tomándose por tal las desviaciones
o sesgos sistemáticos. Es razonable pensar que la puntuación obtenida que
obtiene un sujeto cuando se le aplica un test en un momento dado, no coincida
exactamente con su verdadera puntuación en ese test, pues en ese momento
puntual, el sujeto está afectado por múltiples factores de difícil control que
inciden en su conducta. Si estos factores perjudican al sujeto, obtendrá una
puntuación empírica más baja que la que verdaderamente le correspondería; si
le benefician, la obtendrá superior. Ahora bien, cuando se pasa un test a un
sujeto, no hay manera de saber su puntuación verdadera, lo único que tenemos
es la puntuación obtenida o empírica, es decir, los puntos que saca en el test:
su puntuación verdadera hay que estimarla basándonos en los supuestos del
modelo.
Supuesto 1:
La puntuación verdadera (V) es la esperanza matemática de la empírica:

V = E(X), donde X es la variable aleatoria “puntuación empírica del sujeto”.
Este primer supuesto constituye en realidad una definición de la puntuación
verdadera. El lector poco familiarizado con el concepto de esperanza
matemática puede hacerse una idea imaginando que se aplicase un test
“infinitas” veces al mismo sujeto. También debe imaginar que cada aplicación
no afecta a las otras y que el sujeto no cambia en el curso de las aplicaciones.
En estas condiciones, la puntuación verdadera del sujeto en el test sería

la media aritmética de las puntuaciones empíricas obtenidas en las “infinitas”
aplicaciones. La puntuación verdadera es, por tanto, un concepto matemático,
A partir de los valores de X (puntuaciones empíricas) y bajo ciertos supuestos,
la teoría clásica de los tests permite hacer estimaciones probabilísticas
razonables acerca del valor de las puntuaciones verdaderas. Conviene
entenderlo bien, pues a menudo se ha hecho una conceptualización platónica
de las puntuaciones verdaderas, considerándolas como algo mágico y estático,
propiedad de los sujetos y que determina su conducta. Del modelo no se sigue
esta interpretación circular: la puntuación empírica en un test es una muestra
de conducta que si reúne ciertos requisitos de medida, y bajo ciertos
supuestos, permite hacer inferencias probabilísticas fundadas. De esto trata la
Teoría Clásica de los Tests.
Supuesto 2:
Se asume también que los errores obtenidos no tienen relación con las
puntuaciones verdaderas, es decir, que cualquier nivel de la habilidad o rasgo
que pretende medirse, puede verse sometido a errores de la misma magnitud
(es decir, el error en un test de inteligencia, por ejemplo, sería en principio
semejante tanto para individuos muy inteligentes, como para los tienen una
menor capacidad). Es decir, no existe correlación entre las puntuaciones
verdaderas de los sujetos en un test y sus respectivos errores de medida. No
hay razón para pensar que el tamaño de los errores vaya sistemáticamente
asociado al tamaño de las puntuaciones verdaderas. Sin embargo, este
presupuesto no es compartido por otras teorías de la medida, como la del
rasgo latente.
Supuesto 3:
Los errores de medida de los sujetos en un test no correlacionan con sus

errores de medida en otro test distinto. Si se aplican correctamente los tests,
los errores serán aleatorios en cada ocasión, no existiendo razón a priori para
que covaríen sistemáticamente unos con otros.
Hay que señalar que ninguno de los supuestos del modelo es

comprobable empíricamente de un modo directo tal como están expresados,
por tanto, aunque plausibles y sensatas a priori, habrá que hacer deducciones
que sí se puedan contrastar y confirmen o falseen el modelo.
DEFINICION DE TEST
El término test es una de las palabras más comunes que todos creemos
comprender y por ende, raramente tomamos el tiempo necesario para definirla
de manera precisa. Definiremos un test como un procedimiento sistemático
para medir una muestra de conducta. Esta definición se puede entender mejor
tomando en consideración las implicaciones de los diversos componentes de
ella.
La frase “procedimiento sistemático” indica que una prueba se

construye, se administra y se califica, según reglas preestablecidas. Los
reactivos se seleccionan sistemáticamente para que se ajusten a las
especificaciones de la prueba; se administran los mismos reactivos u otros
equivalentes a todas las personas y las instrucciones y límites de tiempo son
iguales para todos los que se someten a dichos tests, el uso de reglas
predeterminadas para la evaluación (calificación) de las respuestas asegura un
acuerdo entre diferentes personas que tengan que Calificar la prueba.
La utilización de procedimientos estándar sirve para reducir al mínimo la

influencia posible de variables personales y situacionales irrelevantes, sobre las
calificaciones del test. Por ejemplo, las instrucciones sobre cómo responder
cuando no se tenga seguridad respecto a la respuesta apropiada hacen
disminuir las diferencias individuales en las conductas de adivinación. Otra
razón para usar los procedimientos estándar es que permiten que las
calificaciones dadas a distintas personas se puedan comparar directamente. Si
dos individuos responden a diferentes reactivos o tienen distintas cantidades de
tiempo para terminar las mismas pruebas, no será posible comparar sus
resultados. Así pues, el uso de procedimientos estándar permite las
comparaciones directas entre los individuos.
Un segundo término crucial es el de conducta. En el sentido más estricto

un test mide sólo la conducta registrada por la prueba, esto es, las respuestas
dadas por una persona a los reactivos de la prueba. Así, no medimos
directamente a la persona, sino que inferimos sus características (rasgos) a
partir de sus respuestas dadas a los reactivos del test. Si las conductas que
muestran reflejan de modo adecuado el constructo que se mide, la prueba
proporcionará información útil. Si la conducta no refleja adecuadamente la
característica subyacente, las inferencias que se hagan resultarán erróneas.
En tercer lugar, un test contiene solamente una muestra de todos los

reactivos posibles. Ningún test es tan completo como para incluir todos los
reactivos posibles que se pueden desarrollar con el fin de medir la variable
psicológica en cuestión, es decir, que puedan medir el dominio conductual (un
dominio conductual es la agrupación hipotética de todos los reactivos posibles
que cubren un área particular). Se nos ocurren excepciones, tales como las de
un test de adición que cubra todas las combinaciones posibles de dos números
de un sólo dígito, pero estas excepciones suelen ser raras y en general,
triviales. Así, se puede considerar que cualquier test dado es la mejor muestra
de todos los reactivos posibles.
PROPOSITOS Y USOS DE LOS TESTS
Los tests psicológicos y otros instrumentos de evaluación se aplican en

una amplia variedad de contextos de organización en la sociedad
contemporánea: escuelas y universidades; negocios e industrias; clínicas
psicológicas y centros de asesoría; organizaciones gubernamentales y militares
y contextos de investigación de distintos tipos. De modo que los psicólogos de
personal, psicólogos clínicos, psicólogos de asesoría, psicólogos escolares,
consejeros matrimoniales y muchos otros especialistas aplicados y con
orientación hacia la investigación sobre el comportamiento del ser humano
dedican una parte importante de su tiempo profesional a la aplicación,
calificación e interpretación de tests psicológicos.
En la actualidad, el propósito principal de los tests y evaluaciones psicológicas
es el mismo que ha prevalecido durante todo este siglo: evaluar el
comportamiento, las capacidades mentales y otras características personales
con el objeto de ayudar en los juicios, predicciones y decisiones de las
personas. En forma más específica, los tests se utilizan para:
1) Observar a las personas que solicitan empleos y desean participar en

programas educativos y de capacitación;
2) Clasificar y ubicar a las personas dentro de contextos educativos y de
empleo;
3) Asesorar y guiar a los individuos con propósitos educativos, vocacionales y
personales;
4) Retener o suspender, promover o cambiar a estudiantes o empleados en los
programas educativos y de capacitación, así como en situaciones laborales;
5) Diagnosticar y prescribir tratamientos psicológicos y físicos en clínicas y
hospitales;
6) Evaluar los cambios cognoscitivos intra e interpersonales debidos a
programas de intervención educativos, psicoterapéuticos y conductuales; y
7) Realizar investigaciones sobre los cambios en el comportamiento a través
del tiempo y sobre la efectividad de los programas y técnicas nuevas.
Además de sus aplicaciones en la descripción y análisis de las

características individuales, los tests se utilizan para evaluar el entorno
psicológico, los movimientos sociales y otros eventos psicosociales. Nadie
sabe con exactitud cuántos tests disponibles comercial y no comercialmente
de cada tipo se aplican ni en qué situaciones, con qué propósitos y para quién
durante un año determinado.
Objetivo 7: Identificar Identificar criterios teóricos y metodológicos de las

propiedades psicométricas de los tests psicológicos
1.6 Propiedades Psicométricas de los tests psicológicos
1.6.1 CONFIABILIDAD
Desde el punto de vista psicométrico, la prueba tiene que poseer dos

características para que se le pueda considerar un buen instrumento de
medición: debe ser confiable y válido. La confiabilidad a menudo es llamada
también fiabilidad o consistencia de un test.
El problema de la confiabilidad plantea diversas formas de preguntas:

¿Hasta qué punto mide una prueba de modo consistente?, es decir,
¿obtendremos resultados semejantes en caso de medir el mismo grupo de
objetos una y otra vez con el mismo instrumento de medición?; ¿corresponden
las mediciones obtenidas por medio de un instrumento a las “verdaderas” o
“reales” medidas de la propiedad en cuestión?. En respuesta a estas preguntas
se suscitan las variadas definiciones de confiabilidad.
La confiabilidad en términos generales, puede ser definida como el

grado de concordancia que existe entre dos medidas de un mismo objeto
(Nunnally, 1983; Brown, 1980). Las estimaciones de la confiabilidad dependen
de cuáles sean las fuentes de error que más nos interesan, razón por la cual
encontramos varios tipos de confiabilidad.
Puesto que todos los tipos de confiabilidad se refieren al grado de

concordancia entre dos conjuntos de puntuaciones, este grado de acuerdo se
halla a través de un estadistico de correlación , por ello se expresan todos
generalmente en función de un coeficiente de correlación. El coeficiencte de
correlación pueden cuantitificarse desde +1 a –1, encontrando con ello
correlaciones positivas que van desde 0 a +1 y correlaciones negativas que
van desde 0 a –1 . Los criterios para determinar el nivel de relación o
concordancia encontrada entre 2 mediadas son:
O a +/- 0.19 Nula relación
O.20 a +/- 0.29 Debil relación
0.30 a +/- 0.59 Moderada relación
O,60 a +/- 0.79 Fuerte relación
O,80 a +/- 0.99 Muy fuerte relación
1 Perfecta relación
TIPOS DE CONFIABILIDAD: DE ESTABILIDAD, DE EQUIVALENCIA Y DE

CONSISTENCIA
COEFICIENTE DE ESTABILIDAD. LA CONFIABILIDAD TEST-RETEST.
El paradigma de este tipo de confiabilidad es muy sencillo. Se aplica la prueba,

transcurre cierto período de tiempo y se le aplica nuevamente. A continuación,
se calcula la correlación entre las calificaciones en la prueba y en la
reaplicación.
Este método requiere la aplicación de un mismo instrumento dos veces a

un mismo grupo de individuos. El tiempo transcurrido entre la primera y la
segunda aplicación puede variar entre unos minutos y varios años. El valor de
la correlación encontrada es un coeficiente de confiabilidad que representará el
grado de estabilidad de las características medidas de los sujetos frente a
la misma actuación indagada dos veces. Además, este valor señala el grado
de consistencia o similitud de los procedimientos empleados para recoger
dichas informaciones en las dos oportunidades.
La estabilidad definida como la consistencia de los puntajes a través del

tiempo, asume que aquello que es estudiado es estable en el tiempo, de ahí
que el error que existe sería por el efecto de las fluctuaciones temporales entre
una y otra aplicación.
COEFICIENTE DE EQUIVALENCIA: FORMAS PARALELAS.
Puesto que cualquier test contiene sólo una muestra de todos los reactivos
posibles, se puede construir formas paralelas de la prueba. En el desarrollo de
formas equivalentes, comparables o paralelas; hay que asegurarse de que
verdaderamente lo son, pues cada forma debería ser construida
independientemente, pero debe estar destinada a satisfacer las mismas
especificaciones. Los tests deben contender la misma forma y abarcar el
mismo tipo de contenido; asimismo, la amplitud total y el nivel de dificultad de
los elementos debe ser igual (medias iguales); así como su variabilidad
(varianzas iguales).
Cuando las dos formas del instrumento son aplicados una tras otra a los
sujetos, el valor estadístico encontrado representa el coeficiente de
equivalencia de dichos instrumentos; así como el grado de consistencia del
comportamiento medido con ellos.
Para equiparar el efecto de la práctica que actúa sobre los resultados del
individuo en cada una de las formas del test, es conveniente administrar a una
mitad de los sujetos la forma uno, luego la forma dos; en tanto la otra mitad de
los sujetos se somete primero a la forma dos y luego a la forma uno. Si la
segunda forma del instrumento de administra a los mismos sujetos después de
cierto tiempo de aplicada la primera, entonces no sólo puede controlarse la
equivalencia, sino también el grado de estabilidad de las características
medidas de los examinados.
COEFICIENTE DE CONSISTENCIA O COHERENCIA INTERNA.
El estudio de este tipo de confiabilidad tiene por finalidad determinar si un

instrumento mide alguna habilidad o rasgo conductual específico en forma más
o menos igual u homogénea a través de los ítems que lo conforman. Por lo
tanto, una elevada confiabilidad de consistencia interna será, de por sí,
garantía de que se cuenta con un instrumento homogéneo.
Existen dos procedimientos para analizar la consistencia interna. Sin

embargo, ambos requieren que el instrumento sea aplicado una sola vez a los
examinados.
Método de bipartición.
También es conocido como fiabilidad de la división por mitades o “split half”.

Este método consiste en que partiendo de una sola aplicación de una forma de
test., es posible llegar a la medida de su fiabilidad, siguiendo varios
procedimientos de división en mitades, por supuesto, puede ser en dos o más
“mitades”.
Se obtienen dos puntajes para cada individuo, dividiendo el test en mitades

comparables. La fiabilidad de la subdivisión nos proporciona una medida de
equivalencia o adecuación de las muestras de elementos. En esta medida no
entra la estabilidad temporal de las puntuaciones, puesto que sólo requiere de
una sesión.
Un procedimiento adecuado para lograr una mejor igualdad comparativa de

ambas partes es el de:
a.- Hallar las puntuaciones de los items o elementos dividiendo el test en

mitades comparables, teniendo en cuenta que puede ser cada mitad
superior e inferior de la prueba o los items pares e impares del test.
b.- Una vez obtenidas las dos puntuaciones se computa el coeficiente de
correlación con los mismos criterios anteriores. Se debe tener en cuenta el
tipo de variable de estudio antes de elegir el estadistico adecuado, es decir
si es de tipo ordinal o de intervalo a fin de utilizar el estadistico RHO o
Pearson respectivamente.
c.- Sin embargo, debe advertirse que lo que da en realidad dicha correlación
es la fiabilidad de una mitad de los reactivos de la prueba original y como la
confiabilidad es dependiente de la longitud de la prueba, entonces la
correlación será más baja que la que se espera de una prueba de la longitud
original. Por ello, para compensar esta correlación baja, se introduce una
corrección por medio de la fórmula de Spearman-Brown o Guttman según
sean las varianzas de las mitades de la prueba, quedando estimado el
coeficiente de confiabilidad para el test entero.
Estimaciones de homogeneidad.
Por medio de este método se puede estimar el grado de homogeneidad o

concordancia existente entre los resultados observados en cada item de un
instrumento y el resultado total alcanzado por éste. A diferencia del de la
división por mitades, éste no analiza la consistencia de la mitad del test, sino
que se basa en la consistencia de las respuestas de los sujetos de todos los
reactivos del test. Mientras más homogéneo sea el instrumento, más alta será
la consistencia entre los elementos.
El índice de homogeneidad evalúa el grado en que los items de una prueba se

inter-correlacionan entre sí. Se puede estimar de dos maneras:
a.). Una es por medio del Coeficiente de Küder-Richardson. Se utiliza

cuando los items son valorados dicotómicamente y además se supone que
poseen un grado de dificultad similar. Se computa a través de la fórmula
propuesta por Küder-Richardson, siendo la fórmula KR 20 si los items tienen
varianzas diferentes y la KR 21 si se asume que tienen varianzas similares.
b). - El otro método de estimar la homogeneidad es el Coeficiente Alfa de

Cronbach. Es concebida como la generalización de la fórmula KR 20 para el
caso de los items con valoración politómica (con alternativas), y se computa
a través de la fórmula propuesta por Cronbach. Sus resultados pueden ser
interpretados como la correlación entre una y otra prueba psicológica de la
misma longitud, tomadas de un mismo dominio.
1.6.2 VALIDEZ
La característica más importante de una prueba en su validez. Sin

pruebas de validez, no será posible interpretar o dar significado a las
calificaciones. La validez se refiere a la extensión o exactitud con la que la
prueba mide lo que pretende medir. Una prueba es válida hasta donde mida un
constructo dado y no otras variables extrañas.
De la misma manera que la confiabilidad, la validez se mide por

coeficientes de correlación. No se calcula por la correlación de dos
puntuaciones de la misma prueba, sino por la relación entre la actuación de un
test y otros hechos observables independientemente, pero relativos al rasgo
de conducta que se está considerando.
Las técnicas específicas para investigar la validez son numerosas y se

han descrito con diferentes nombres. Aun cuando no existe consenso en los
tipos de validez, la American Psychological Association estableció una
clasificación tripartita: Validez de criterio; validez de contenido y validez de
construcción.
TIPOS DE VALIDEZ: VALIDEZ DE CONTENIDO, CALIDEZ RELACIONADA

CON EL CRITERIO Y VALIDEZ DE CONSTRUCTO
VALIDEZ RELACIONADA AL CRITERIO.
En este caso, los resultados del instrumento son comparados con los
resultados proporcionados por una medida denominada criterio. El instrumento
es válido, si exhibe una buena correlación con la medida criterio.
A mayor Coeficiente de Correlación de Criterio mayor validez del test.

A menor Coeficiente de Correlación de Criterio menor validez del test.
En este caso, la validez se refiere a que el instrumento mide lo mismo que la

medida criterio. Los tipos de validez relacionada con el criterio son:
Validez predictiva.
Se refiere a las situaciones en que los datos de criterio se reúnen en algún
momento del futuro. El test predice cierto resultado después de un tiempo
dado; es decir, las calificaciones de las pruebas predicen realmente las
calificaciones del criterio. La validez predictiva computada como un
coeficiente de validez, necesita estimarse por los tests usados en la
orientación vocacional y en la selección y la clasificación de los individuos
para propósitos de adiestramiento o trabajo. Es más apropiado para estudios
de validez local, en los cuales hay que comprobar la eficacia de un test con
respecto a un programa específico. Es como la validez práctica de un test en
una situación específica.
Una prueba es válida al predecir los resultados. Por ejemplo, es válida en

trabajos de oficina si se correlaciona con una evaluación de rendimiento en
oficina; en el caso de un test de aptitud escolar, si se correlaciona con las
notas de estudio; en el caso de un test de aptitud mecánica, el criterio podría
ser la actuación subsecuente en el oficio como mecánico. Para obtener este
coeficiente de validez se correlacionan los resultados de la prueba con el
criterio.
Validez concurrente.
Se refiere a las situaciones en que las calificaciones de las pruebas

psicológicas y los datos del criterio se reúnen en el mismo punto del tiempo.
En este caso, puesto que se dispone ya de las calificaciones de criterio, el
propósito es determinar si las calificaciones de la prueba psicológica pueden
sustituirse por los datos registrados en el criterio. En términos de
procedimiento, este tipo de validez se establece al correlacionarse las
puntuaciones de la prueba y las de la prueba que establece el criterio (es
decir, mide la misma variable).
Es el tipo más apropiado para ciertos usos de los tests psicológicos, y puede
justificarse por derecho propio. Especialmente, es recomendable en los tests
de personalidad, o en los tests empleados para el diagnóstico de la situación
actual, que para la predicción de sucesos futuros.
VALIDEZ DE CONTENIDO.
Se la ha definido como el grado en que los items que constituyen la prueba

son una muestra representativa del dominio de contenido, donde el término
dominio, se refiere a los temas o asunto que se está midiendo. Entonces,
como su nombre lo indica, se ocupa del contenido de la prueba psicológica. El
contenido significa los constituyentes sustantivos, el tema en sí de la prueba.
Usualmente, se ha recomendado que este tipo de validez sea asignado

a las pruebas de rendimiento escolar y también se ha sugerido para las escalas
de actitudes y otras mediciones de rasgos. Por ejemplo, al valorar los tests de
rendimiento, donde se mide el grado de dominio del individuo en una habilidad
específica o un curso de estudio. Esto indica que se conoce bien los límites del
universo del contenido, o dominio.
Por lo general, esta forma de validez se ha determinado mediante la

comparación sistemática de los iterms de la prueba con el dominio del
contenido estudiado. Este análisis es factible de ser llevado a cabo de dos
formas:
a.- La primera consiste en estudiar de manera lógica y racional los items

explicitando el porqué se incluye en la prueba;
b.- La segunda se refiere a que con la ayuda de un grupo de jueces

competentes y calificados, se evalúa el grado en que los reactivos
concuerdan con los planteamientos del constructor del instrumento;
siendo denominada esta técnica como el criterio de jueces.
El criterio de jueces ha sido en muchos casos la estrategia para evaluar

la validez de contenido. La modalidad más común para este tipo de validez
consiste en solicitar la aprobación o desaprobación de la inclusión de un ítem
en la prueba, por parte de varios jueces, cuyo número puede variar según los
requisitos del autor del instrumento.
Quizás el problema más importante derivado que el uso de esta técnica ha

generado es el referido a la cuantificación de sus resultados. Por ello, un
intento de solución ha sido calcular un índice de acuerdo entre los jueces al
evaluar el item, siendo en este caso, el grado de acuerdo el que indicaría la
confiabilidad de los juicios y por ende la validez del mismo; ya que evaluaría el
consenso que existe para la inclusión del items en la prueba.
VALIDEZ DE CONSTRUCTO.
Este tipo de validez es importante siempre que se diseña una prueba

psicológica para medir algún atributo o alguna cualidad (constructo) que se
supone poseen las personas. Estos estudios tratan de responder las preguntas
¿qué constructo mide? ¿hasta qué punto mide bien la prueba psicológica ese
constructo? Así pues, se enfoca la atención en el constructo, en la
característica de lo que se está midiendo.
Este tipo de validez se evalúa mediante la acumulación de evidencia y

no es posible ningún índice cuantitativo único. Con el fin de determinar la
validez de este tipo en una prueba psicológica, es preciso examinar todo el
caudal de evidencias que la rodean; el tipo de reactivos que se incluyen; la
estabilidad de las calificaciones; la homogeneidad de la prueba; su correlación
con variables de otras pruebas y otros datos que iluminen el significado de las
calificaciones.
Se utiliza cuando el usuario de la prueba desea inferir el grado en el que
un individuo posee alguna cualidad o rasgo hipotético (constructo) que se
refleja en la ejecución de la prueba. Debido a que esta validez requiere de una
acumulación de varios métodos, lo que sería muy dificultoso para el
investigador, se recurre generalmente a alguno de ellos, entre los cuales,
figuran los siguientes.
Correlaciones con otros tests. : VALIDEZ CONGRUENTE
También llamada validez congruente, donde el test construido recientemente

se correlaciona con un test establecido, cuyas medidas son aceptadas de la
cualidad o rasgo que se examina. Por ejemplo, el test Stanford-Binet mide la
inteligencia, por lo tanto, una correlación alta entre la prueba nueva y el
Stanford-Binet significará que el instrumento nuevo también mide la
inteligencia.
Análisis factorial.
Es un procedimiento estadístico de particular importancia. Es una

técnica usada para analizar las interpretaciones de datos psicológicos. Se
propósito principal es el de simplificar la descripción conductual reduciendo el
número de categorías partiendo de una multiplicidad de variables de medición
hasta obtener unos cuantos rasgos. Identificados éstos, podrán usarse para
describir la composición factorial de un test, por lo tanto, un test puede
identificarse tanto en términos de los factores principales que determinan sus
puntuaciones, como del peso de cada factor.
El enfoque más corriente para evaluar la validez de constructo ha sido

ver si los diferentes instrumentos que se supone miden lo mismo tienen una
alta correlación entre sí. Pero, como la elevada intercorrelación bien puede
indicar que no hay solamente una variable rasgo en común, sino varias,
entonces, la mejor respuesta a esta pregunta: ¿qué mide esta prueba?, se
presenta en forma de una lista de factores con los cuales se correlaciona. Por
ello, para este tipo de información, el método que ofrece las mejores
respuestas es la validez factorial. En realidad, éste no es sino una de las
formas más amplias para evaluar la validez de constructo.
La validez congruente y factorial son dos buenos ejemplos de métodos

convergentes, es decir, que tratan de establecer que dos pruebas miden el
mismo factor. Sin embargo, una prueba psicológica no sólo debe
correlacionarse con otras que tengan como fin medir el mismo factor, sino que
también deberá carecer de relación con pruebas que midan otros constructos
diferentes. Este es el aspecto “divergente”. Por ejemplo, las calificaciones de
una prueba propuesta como medida de creatividad no deberán tener una alta
correlación con las calificaciones de una prueba de inteligencia. Es decir, para
que sea válida, una prueba psicológica debe medir un constructo que pueda
demostrar que es independiente de otros constructos establecidos.
Validez experimental: Efectos inducidos experimentalmente.
Se averigua cómo responderá una prueba a los cambios de las

condiciones externas cuando estén presentes las variables inducidas
experimentalmente. Por ejemplo, podría administrarse un test de ansiedad a un
individuo en un estado de tensión inducido experimentalmente, y las
puntuaciones de ansiedad del test se correlacionan con otras medidas de
ansiedad durante y después del test.
Correlación items –test: Análisis de ítems

Los ítems o reactivos son unidades básicas que configuran el material o
contenido de un instrumento de medición. Esta unidad se compone de la
formulación del problema o situación y de la o las respuestas al mismo.
El análisis de items es un procedimiento a través del cual se evalúa la

eficacia del item y esto se hace estudiando las respuestas a cada item. Para
conocer el comportamiento de cada una de estas unidades básicas y el de su
conjunto, se utilizan recursos estadísticos y la interpretación de esta
información sirve para asegurar la validez y la confiabilidad del instrumento.
El análisis de items nos da la información acerca de los siguientes

puntos:
1. La dificultad del item.,
2. El poder discriminativo del item y
3. La eficiencia de cada opción.
De esta manera, la información del análisis de ítems nos puede decir si

el item fue demasiado fácil o demasiado difícil; qué tan bien discriminó entre los
sujetos con puntuaciones altas y aquellos con puntuaciones bajas en el test, y
si todas las opciones funcionaron de la manera deseada. Un item contribuye a
la confiabilidad y a la validez de un test. Por ello, estas propiedades dependen
de los items individuales que conforman el test, a la vez la confiabilidad y la
validez de los datos determinan el valor del test. Un ítem contribuye a la
confiabilidad del test cuando mide la misma clase de puntaje verdadero que los
otros items del test; es decir, si un item tiene una correlación positiva con los
demás items. Un item contribuye a la validez del test si mide la misma clase de
puntaje verdadero que la medida de criterio; es decir, si un item tiene una
correlación positiva con la medida de criterio.
Según Magnuson (1979), los métodos usados para el análisis de items pueden
dividirse en dos grupos principales:
1. Método de atajo, el cual investiga las diferencias entre los grupos
extremos en las distribuciones y del criterio respectivamente, en relación
a su capacidad para resolver cierto item, y
2. Métodos que determinan el grado de relación, mediante un
coeficiente de correlación.
1.6.3 NORMAS
En las pruebas psicológicas es poco frecuente trabajar con las
calificaciones directas obtenidas por un sujeto o por un grupo, sino más bien se
procede a transformar esos puntajes con la finalidad de hacerlos interpretables.
Hay dos tipos básicos de puntajes derivados o transformados:
1) Las calificaciones relacionadas con las normas. En las cuales se compara el

rendimiento del sujeto con el obtenido por otras personas que conforman el
grupo de referencia normativo; y
2) Las calificaciones relacionadas con las consecuencias. Están constituidas

por aquellos tipos de puntajes que expresan la ejecución de un sujeto en
función de una conducta o calificación pronosticada. Aquí consideraremos
diferentes variantes de las calificaciones relacionadas con las normas.
Media y desviación estándar del grupo. Cuando la puntuación bruta

sufre una transformación estadística teniendo como base la media y la
desviación estándar del grupo, se dice que las puntuaciones brutas han sido
convertidas a puntuaciones típicas o estándar. Las puntuaciones típicas son
importantes porque:
(a) para toda prueba y para todo grupo proporcionan la misma media y
desviación estándar;
(b) muestran la misma estructura de la distribución de las calificaciones
brutas;
(c) permiten la comparación intergrupos o interpruebass; y (d) pueden
tratarse matemáticamente. Se dice que son calificaciones estándar
lineales entre las que destacan la calificación Z y la T.
1) Calificación Z. Es la base de las calificaciones estándar. Las demás

calificaciones estándar lineales se obtienen a partir de ella. Una calificación es
la desviación que tiene una calificación bruta de la media en unidades de
desviación estándar. Las calificaciones tienen una media 0 y una desviación
estándar 1.
Una de las desventajas de estas calificaciones es que la mitad de las
puntuaciones son negativas y se expresan en puntos decimales, lo cual hace
muy engorroso los cálculos. Por ello, se transforman por lo común a otras
calificaciones, para así obtener un resultado más exacto y accesible. Una de
las unidades estándar lineales más comunes es la escala T.
2) Calificación T. Su diferencia de la calificación Z es que, en ésta, hay una

media de 50 y una desviación estándar de 10. Su fórmula es:
T = 50 + 10 ( Z )
Puesto que la multiplicación por o suma de una constante no destruye las
relaciones en la escala, las relaciones entre las calificaciones T serán las
mismas que las calificaciones brutas.
Este método evita números negativos y las fracciones decimales. Una de
sus limitaciones es que en muchos usos prácticos de la prueba una unidad tan
fina como 0.1 desviación estándar puede ser considerada un refinamiento
excesivo y quizá todo lo que se necesita sea discriminaciones más gruesas.

Modulo Pruebas Psicometricas

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Modulo Pruebas Psicometricas

Diunggah oleh

Hak Cipta:

Format Tersedia

Curso : Pruebas Psicométrica I.

Objetivo 1: Adquirir los conocimientos relacionados con los antecedentes de

1.1 INTRODUCCIÓN A LA PSICOMETRIA.

Yela (1968) dice la Psicometría se ocupa de todas las medidas en el

Muñiz (1998) define la Psicometría como "... el conjunto de métodos,

Martínez-Arías (1995) introduce un matiz que apunta hacia la relación

No resulta difícil entresacar los elementos comunes de las definiciones

Rivas (1979) examinó los contenidos de este conjunto de definiciones

El concepto de psicometría parece incluir de este modo, el conjunto de

1.1.2 RESEÑA DE LA HISTORIA DE PSICOMETRIA

La historia de la medición psicológica ha estado marcada por la

Estudio de las diferencias individuales

Debemos advertir de una doble simplificación. Primera, dejar a un lado,

Thorndike (1997) señala al movimiento hacia la educación obligatoria en

Los pioneros de la Psicología llevaban años intentando una formulación

Entre los pioneros en el estudio de las diferencias individuales destaca el

J. M. Catell (1860-1944) trabajo con Wundt, con quién compartió el

Pero sin duda, la consolidación social de la medición psicológica vino de

Binet recibió en 1904 el encargo del ministerio francés de instrucción

El interés por la obra de Binet se ha mantenido a lo largo del tiempo. Van

Tras las aportaciones de Binet, los mayores desarrollos en la medición

De forma paralela a los avances teóricos y las aplicaciones prácticas, se

J. Jastrow habla sobre los tests en la primera convención de la American

Cattell fundó la Psychological Corporation para la producción industrial

Galton, Pearson y Weldon fundaron en 1901 la revista Biometrika que desde

La Psicometría española : La aparición de la Psicometría en España

José Germain (1898-1986) había iniciado su labor antes de la guerra en

La Psicometría española carece de una revista específica aunque son

Objetivo 2: Conceptualizar Psicometría, Identificar la relaciòn con otras

1.1.3. CONCEPTUALIZACION DE LA PSICOMETRÍA.

Se define a la psicometría como la teoría y la metodología acerca de la medida

No debe entenderse mal la afirmación de que la psicometría carece de

El carácter sustantivo de la psicometría puede entenderse fácilmente

Contenido de la psicometría: En general, la utilidad más inmediata de la

La relación es también muy estrecha con la medición en sociología

De hecho, la naturaleza sustantiva e interdisciplinar de buena parte del

Ello no significa que no existan particularidades en el terreno de la

De este modo, la mayoría de los instrumentos de medida psicológicos

Decía Rubén Ardila en una conferencia dictada en la Universidad de

Coombs, Dawes y Tversky (1981) han caracterizado a la psicología

Objetivo 3: Identificar los niveles de la Psicometría.

A. Teoría psicométrica. Para medir una variable psicológica no sólo hace

La teoría psicométrica está ubicada en el núcleo principal de la psicometría

La teoría psicométrica es la parte de la psicometría que constituye su

B. Aplicación psicométrica. Es en la creación de instrumentos de medida y

La aplicación psicométrica comprende el campo del desarrollo de

C. Fundamentación matemática y estadística. La teoría psicométrica está

Las teorías y los métodos psicométricos están escritos principalmente en

Sin embargo, este uso de la psicometría se limita a utilizar los instrumentos

Objetivo 4: Identificar las ventajas de las medidas estandarizadas

1.3 VENTAJAS DE LAS MEDIDAS ESTANDARIZADAS

Objetividad. La principal ventaja de la medición es eliminar las

Podríamos argumentar que la medición es el principal problema de la

Economía. Aunque el desarrollo de las medidas estandarizadas con

Generalización científica. La generalización científica se halla en el

Muchas generalizaciones científicas, en particular en las ciencias

Objetivo 4: Identificar los elementos básicos de Medición psicológica

1.4 LA MEDICIÓN EN LA CIENCIA:

1) Representen cantidades o atributos de forma numérica (escala de

Las reglas, a su vez, son un aspecto importante de la estandarización. Una

La asignación de símbolos reglas a los objetos a medirse debe darse de tal

El término “atributo” en la definición indica que la medición siempre implica

 Primero, demuestra que la medición requiere de un proceso de