PSICOMETRA
Melissa Judith Ortiz Barrero
Mg. Psicologa
La teora de los tests puede verse como un esquema conceptual formalizado para
hacer inferencias a partir de las puntuaciones de las personas en los tests y permitir la
toma de decisiones que impliquen el constructo objeto de la medicin. La teora de
los tests proporciona los fundamentos para la elaboracin y uso de los tests,
aportando adems las herramientas para examinar las propiedades mtricas de las
mediciones obtenidas con ellos.
tests
deben
permitir la cuantificacin objetiva de acuerdo con unas reglas establecidas y que los
autores de los tests
deben
aportar
ptima, en los que se instruye a la persona para que conteste lo mejor que pueda
(incluira los tests de inteligencia, aptitudes y rendimiento); y tests de ejecucin tpica,
que demandan de la persona informacin sobre sus actitudes, sentimientos,
intereses, etc., donde se incluiran los cuestionarios e inventarios de personalidad.
Crocker y Algina (1986) enumeran los problemas por los que la medida
psicolgica est contaminada por el error:
La teora de los tests suele dividirse en dos grandes ramas: la teora clsica de los
tests (parte de la concepcin de que la puntuacin observada en el test est
compuesta de un componente verdadero y otro de error) y la teora de respuesta a los
tems (o teora del rasgo latente).
Validez
Criterio de calidad relacionado con la adecuacin de las puntuaciones del test
para el objetivo que suscit su aplicacin.
Por lo general, el resultado inicial de las pruebas es una puntuacin natural como el
nmero total de afirmaciones de personalidad refrendadas en una direccin en
particular o el nmero total de problemas resueltos correctamente, esta puntuacin
inicial es intil en s misma, los examinadores deben ser capaces de convertir la
puntuacin inicial a alguna forma de puntuacin derivada que se base en la
comparacin con un grupo normativo o de estandarizacin. Se compara la puntuacin
del examinado con la distribucin de puntuaciones obtenidas por la muestra de
estandarizacin. As, se determina, a partir de las normas, si una puntuacin obtenida
es baja, promedio o alta
Un grupo normativo consiste en una muestra de personas examinadas que son
representativas de la poblacin hacia la cual se dirige la prueba. El objetivo esencial
de la estandarizacin de una prueba consiste en determinar la distribucin de las
puntuaciones naturales en un grupo normativo, de modo que quienes desarrollan la
prueba tengan la posibilidad de publicar las puntuaciones derivadas conocidas como
normas.
Las normas indican la posicin que tiene un individuo dentro de la prueba, en relacin
con el desempeo de otras personas de la misma edad, grado escolar, sexo y otras
variables. Dichas normas pueden volverse anticuadas en slo unos cuantos aos, de
modo que la regla, ms que la excepcin, debe ser el establecimiento peridico de
nuevas normas.
La gran parte de las pruebas psicolgicas se interpreta a travs de la consulta de
normas; como ya se seal, estos instrumentos se denominan pruebas referidas a la
norma. Sin embargo, existen otros tipos de instrumentos; las pruebas referidas a
criterio que ayudan a determinar si una persona puede alcanzar un criterio
objetivamente. En el caso de las pruebas referidas a criterio, las normas no son
esenciales.
Existen diferentes tipos de normas, pero stas tienen una caracterstica en comn:
cada una incorpora un resumen estadstico de un enorme conjunto de puntuaciones.
Ejemplo:
La prueba es un cuestionario de opcin mltiple con 30 palabras difciles como
firmamento, paradisiaco y melifluo. Una profesora toma la prueba y elige la alternativa
correcta para 17 de las 30 palabras. Pregunta cmo se compara su calificacin con
otras personas con el mismo nivel acadmico. Cmo podra responderse a su
pregunta?
Una manera de responder a la interrogante consistira en darle una lista de las
puntuaciones naturales de la muestra preliminar de estandarizacin con 100
profesores representativos de su universidad. Cuando se nos confronta con un
conjunto de datos cuantitativos, la tendencia humana natural es la de resumir y
organizar dichos datos en patrones significativos. Por ejemplo, en la evaluacin del
significado de la puntuacin de vocabulario de la profesora, se podra calcular la
puntuacin promedio de toda la muestra o establecer la posicin relativa de la
puntuacin de la profesora.
Distribucin de frecuencias
Una manera simple y til de resumir los datos consiste en tabular una distribucin de
frecuencias, la cual se prepara al especificar un pequeo nmero de intervalos de
clase de igual tamao y despus determinar cuntas puntuaciones cae n dentro de
cada intervalo. La suma de las frecuencias de todos los intervalos ser igual a N, el
nmero total de puntuaciones en la muestra. No existe una re gla simple para
determinar el tamao de los intervalos; ste, obviamente, depende del nmero de
intervalos deseado. Es comn que la distribucin de frecuencias tenga entre 5 y 15
intervalos de clase.
Ejemplo:
Intervalo de clase
4-6
Frecuencia
1
7-9
10-12
13-15
16-18
19-21
22-24
25-27
28-30
12
21
24
21
7
5
1
W=100
Medidas de variabilidad
Distribucin normal
Una razn por la que los psiclogos prefieren las distribuciones normales es que la
curva normal tiene caractersticas matemticas tiles que forman la base para varios
tipos de investigacin estadstica. As, a fin de facilitar el uso de estadsticas
inferenciales, los psiclogos prefieren que las puntuaciones de prueba en la poblacin
normal sigan una distribucin normal o casi normal, otra propiedad til de las
distribuciones normales es que el porcentaje de casos que caen dentro de un cierto
rango o ms all de un cierto valor se conoce de manera exacta.
-
Darle sentido a los resultados de prueba es, en gran medida, una cuestin de
transformar las puntuaciones naturales en formas ms interpretables y tiles de
informacin.
Percentiles y rangos percentiles: Un percentil expresa el porcentaje de personas
dentro de la muestra de estandarizacin que obtuvieron puntuaciones por debajo de
una puntuacin natural especfica. Un percentil indica slo cmo se compara a un
individuo con la muestra de estandarizacin y no transmite el porcentaje de preguntas
respondidas de manera correcta. Los percentiles tambin pueden concebir se como
ltigos en un grupo de 100 sujetos representativos, donde 1 es el rango inferior y 100
el superior.
Construccin de pruebas
Las pruebas vlidas surgen de manera lenta de un proceso evolutivo. En esta seccin
se enfatiza en los aspectos bsicos del desarrollo de pruebas. As, la construccin de
pruebas consta de seis etapas entrelazadas:
-
Definicin de la prueba.
Revisin de la prueba.
Publicacin de la prueba.
Una vez que se tiene disponible una versin preliminar de la prueba, los autores e n
general la aplican a una muestra de tamao modesto de individuos (pilotaje), a fin de
reunir los datos inciales sobre las caractersticas de los reactivos. El examen de stos
implica una variedad de procedimientos estadsticos conocidos como anlisis de
reactivos, cuyo propsito consiste en determinar cules reactivos deben conservarse,
revisarse o eliminarse. Con base en el anlisis de reactivos y en otras fuentes de
informacin, se revisa la prueba. Si las revisiones son sustanciales, es posible que se
requieran nuevos reactivos y prepruebas adicionales con nuevos individuos.
Construccin de Reactivos
Pruebas de aptitud: miden la capacidad para una tarea o tipo de hab ilidad
relativamente especfica; en efecto, las pruebas de aptitud son una forma
estrecha de prueba de capacidad.
En un sentido estricto, existen cientos de tipos diferentes de pruebas, cada una de las
cuales mide un aspecto ligeramente diferente del individuo.
Procesos de aplicacin deseables
Se analizarn primero las pruebas individuales y despus se enumerarn de manera
breve algunos puntos importantes acerca de los procedimientos deseables en las
pruebas con grupos.
que no utilice anteojos y que no haya pasado por un examen reciente de la visin.
Las alteraciones del habla representan otro problema para quienes deben hacer un
diagnstico. Las respuestas verbales de las personas con alteraciones del habla son
difciles de descifrar. Debido a la incapacidad del examinador para entender las
respuestas, los sujetos pueden recibir un menor crdito del que merecen
Conducir una prueba grupal requiere tanto refinamiento como aplicar una prueba
individual. Sin duda, la ms grande fuente de error en la aplicacin de una prueba
grupal tiene que ver con tomar de manera inadecuada el tiempo en las pruebas
cronometradas. Los examinadores deben conceder el tiempo suficiente para el proceso completo de prueba: organizacin, lectura de las instrucciones en voz alta y
presentacin de la prueba en s por parte de los sujetos. Conceder el tiempo suficiente
requiere previsin en la programacin. Por supuesto, reducir el tiempo en una prueba
causa que las normas sean completamente invlidas y con toda probabilidad reduce la
puntuacin de la mayora de los sujetos en el grupo. Conceder demasiado tiempo para
una prueba puede constituir tambin un tremendo error.
Una segunda fuente de error en la aplicacin de pruebas grupales es la falta de
claridad en las instrucciones para los examinados. Los examinadores deben leer las
instrucciones con lentitud, con una voz clara y fuerte que atraiga la atencin de los
sujetos. Las instrucciones no deben parafrasearse. Cuando el manual lo per mite, los
examinadores deben detenerse en la lectura y aclarar las dudas de los individuos que
tienen alguna confusin.
Las variaciones en las condiciones fsicas de aplicacin de prueba constituyen una
tercera fuente de error potencial en la conduccin de una prueba grupal. Los
examinadores deben asegurarse de que la habitacin de examen est bien iluminada
y, de ser necesario, que tenga calefaccin o aire acondicionado para controlar las
variaciones extremas en cuanto a temperatura y humedad. La importancia de la
superficie de escritura se aumenta por la tendencia actual a utilizar hojas separadas
de respuesta. Los sujetos necesitan de un espacio ms amplio de escritorio cuando
emplean hojas separadas de respuesta que bajo otras condiciones. Aunque pocos
editores de prueba lo sealan, sera bueno especificar en los manuales de prueba las
variaciones admisibles en cuanto a superficie de escritura que de todos modos
permiten resultados comparables de prueba.
Entonces
ramas: la teora clsica de los tests y la ms reciente teora de respuesta a los tems.
Los conceptos clave de la teora clsica de los tests son: confiabilidad y validez.
"confiabilidad" es medir algo de forma consistente; mientras que "validez" es medir lo
que realmente se pretende medir. Ambas propiedades admiten un tratamiento
matemtico.
La consistencia interna puede calcularse por correlacin entre distintos tests. Los
mtodos ms conocidos se denominan: mtodo de las formas paralelas, mtodo
del test-retest y mtodo de las dos mitades.
La validez puede calcularse correlacionando las mediciones con las de una medida
patrn aceptada como vlida. Se distinguen los siguientes aspectos: validez de
contenido, validez predictiva y validez de constructo.
Con frecuencia, el estudiante de evaluacin inexperto supone que los procedimientos
de examen son tan sencillos y simples que una sola lectura rpida del manual ser
suficiente como preparacin para la prueba. Aunque algunas pruebas individuales son
sumamente rudimentarias y poco complicadas, muchas de ellas tienen aspectos
complejos de aplicacin que, si no se toman en cuenta, pueden causar que el
individuo examinado falle de manera innecesaria en los reactivos.
Ya sea que una prueba grupal utilice o no una correccin para la puntuacin, el punto
importante reside en enfatizar en este contexto que quien aplica la prueba debe seguir
el procedimiento estandarizado y nunca ofrecer consejo adicional acerca de adivinar
las respuestas. En las pruebas grupales, las desviaciones con respecto al manual de
instrucciones son simplemente inaceptables.
Referencias
Arnau, J. (1989). Metodologa de la investigacin y diseo. En J. Arnau y H.
Carpintero (Eds.). Historia, teora y mtodo. Madrid: Alhambra Universidad.
Crocker, L. y Algina, J. (1986). Introduction to classical and modern test theory. New