Al Método y Metodología Estadística de La

INTRODUCCIN AL MTODO Y METODOLOGA ESTADSTICA DE LA
PSICOMETRA
Melissa Judith Ortiz Barrero
Mg. Psicologa
La conexin entre la psicometra y la psicologa matemtica, permite considerar el

mtodo de la Psicometra desde una doble vertiente: por un lado, en tanto que la
teora psicomtrica se refiera a contenidos empricos, el mtodo no es otro que el
mtodo cientfico propio de toda ciencia emprica; y por otro lado, el componente
matemtico de los modelos formales de medicin, sujeta a la teora psicomtrica,
como a la psicologa matemtica, a los criterios formales de las matemticas (Meli,
1990).
Muchos campos de la Psicometra la utilizan como tcnica de obtencin de datos,

cuando el problema de investigacin hace imposible contrastar el modelo con datos
empricos. Este es el caso cuando se pretende descubrir las propiedades y
caractersticas de ndices estadsticos, mtodos de estimacin, potencia de
contrastes, etc. Adems, la simulacin preserva tambin el estatus de mtodo en
cuanto generadora de conocimiento.
El anlisis del mtodo no puede obviar el papel instrumental de la Psicometra

como herramienta metodolgica para la contrastacin emprica de las teoras
psicolgicas. La aplicacin del mtodo cientfico en psicologa obliga a que la
Psicometra desempee un papel activo en diferentes momentos del proceso.
Arnau (1989) articula las relaciones entre el plano terico y emprico del mtodo
cientfico en tres niveles: el nivel terico-conceptual, que abarca desde el
planteamiento del problema hasta la formulacin de hiptesis empricamente
contrastables; el nivel tcnico-metodolgico que abarca el plan de investigacin y la
estrategia de recogida de datos; y el nivel estadstico-analtico, donde se realiza la
modelizacin estadstica de los datos y las inferencias sobre las hiptesis
sometidas a contrastacin. La generalizacin de los resultados hace retornar la

aplicacin del mtodo al nivel terico-conceptual con lo que se cierra el ciclo. La
Psicometra acompaa a la aplicacin del mtodo en cada uno de los tres niveles.
Los contenidos de la Psicometra

Hay un consenso amplio en la disciplina sobre cules son los contenidos propios de la
Psicometra. Si se unen las diferentes versiones de la teora de los tests bajo una
denominacin comn, se obtiene la divisin en tres grandes grupos de los
contenidos psicomtricos: teora de la medicin, escalamiento y teora de los tests.
-
La teora de los tests
La teora de los tests puede verse como un esquema conceptual formalizado para
hacer inferencias a partir de las puntuaciones de las personas en los tests y permitir la
toma de decisiones que impliquen el constructo objeto de la medicin. La teora de
los tests proporciona los fundamentos para la elaboracin y uso de los tests,
aportando adems las herramientas para examinar las propiedades mtricas de las
mediciones obtenidas con ellos.
La definicin de test no ha variado de forma significativa conforme evolucionaba la

teora de los tests. un test psicolgico es esencialmente una medida objetiva y
tipificada de una muestra de conducta; es un procedimiento estandarizado que busca
mostrar la ndole o grado de instruccin, aptitud o manera de ser de un sujeto.
Otras caractersticas definitorias de un test psicolgico son que los
tests
deben
permitir la cuantificacin objetiva de acuerdo con unas reglas establecidas y que los
autores de los tests
deben
aportar
informacin tcnica sobre la precisin y
relevancia para el objetivo de la evaluacin de las mediciones aportadas por el test.

Se han elaborado diversas clasificaciones de los tests utilizando diferentes criterios.
Crocker y Algina (1986) ofrecen una clasificacin til de los tests atendiendo al
carcter general de la tarea que deben realizar las personas: tests de ejecucin
ptima, en los que se instruye a la persona para que conteste lo mejor que pueda
(incluira los tests de inteligencia, aptitudes y rendimiento); y tests de ejecucin tpica,
que demandan de la persona informacin sobre sus actitudes, sentimientos,
intereses, etc., donde se incluiran los cuestionarios e inventarios de personalidad.
Crocker y Algina (1986) enumeran los problemas por los que la medida
psicolgica est contaminada por el error:
Ausencia de aproximaciones nicas a la medicin de la mayora de los

constructos.
Muestreo limitado del comportamiento (muestreo reducido de situaciones y

momentos temporales).
Presencia inevitable de los errores de medida.
Evolucin de las teoras psicolgicas (el significado de las mediciones siempre

estar sujeto a la evolucin de la teora de la que forma parte).
La finalidad de la teora de los tests es aportar soluciones para minimizar el impacto

de estos problemas sobre la medicin psicolgica (Martnez-Arias, 1995).
La imposibilidad de observar de forma directa la mayora de las variables psicolgicas
obliga a considerar la teora de los tests como una maquinaria conceptual para la
inferencia psicomtrica. El papel de los tems es el de provocar que las respuestas de
las personas en una situacin estandarizada, reflejen la conductas que en situaciones
espontneas, se consideraran los indicadores conductuales del constructo. La
cuantificacin se produce cuando a travs de un procedimiento de escalamiento se
asignan valores cuantitativos a los patrones de repuesta de las personas en el test.
El objetivo principal de la teora de los tests es estudiar el proceso de inferencia y
aportar procedimientos para realizarla (Crocker y Algina, 1986). Este objetivo ha
hecho que bajo la denominacin teora de los tests tengan cabida contenidos tan
diversos como: construccin de tests, elaboracin de tems, anlisis de tems,
mtodos de puntuacin e interpretacin de las puntuaciones y, de forma

preponderante, el anlisis de la fiabilidad y validez de las medidas aportadas por los
tests.
La teora de los tests suele dividirse en dos grandes ramas: la teora clsica de los
tests (parte de la concepcin de que la puntuacin observada en el test est
compuesta de un componente verdadero y otro de error) y la teora de respuesta a los
tems (o teora del rasgo latente).
Criterios de calidad en la construccin de test
Utilice como gua la siguiente pgina web: http://www.uned.es/psico-3-psicometria/ En

ella encontrar la explicacin de conceptos y tcnicas importantes para la
construccin de pruebas tales como los de Validez y Confiabilidad (fiabilidad), que se
encuentran a continuacin. Adems encontrar ejercicios (plantillas) que podr
resolver.
Confiabilidad
Criterio de calidad relacionado con la precisin de las medidas obtenidas con un test
y que proporciona informacin acerca de:
La estabilidad temporal de las puntuaciones obtenidas con el test (test-retest y

formas paralelas)
La consistencia interna del test (alpha y dos mitades)
Validez
Criterio de calidad relacionado con la adecuacin de las puntuaciones del test
para el objetivo que suscit su aplicacin.
Conceptos estadsticos, normas y estandarizacin
Por lo general, el resultado inicial de las pruebas es una puntuacin natural como el
nmero total de afirmaciones de personalidad refrendadas en una direccin en
particular o el nmero total de problemas resueltos correctamente, esta puntuacin
inicial es intil en s misma, los examinadores deben ser capaces de convertir la
puntuacin inicial a alguna forma de puntuacin derivada que se base en la
comparacin con un grupo normativo o de estandarizacin. Se compara la puntuacin
del examinado con la distribucin de puntuaciones obtenidas por la muestra de
estandarizacin. As, se determina, a partir de las normas, si una puntuacin obtenida
es baja, promedio o alta
Un grupo normativo consiste en una muestra de personas examinadas que son
representativas de la poblacin hacia la cual se dirige la prueba. El objetivo esencial
de la estandarizacin de una prueba consiste en determinar la distribucin de las
puntuaciones naturales en un grupo normativo, de modo que quienes desarrollan la
prueba tengan la posibilidad de publicar las puntuaciones derivadas conocidas como
normas.
Las normas indican la posicin que tiene un individuo dentro de la prueba, en relacin
con el desempeo de otras personas de la misma edad, grado escolar, sexo y otras
variables. Dichas normas pueden volverse anticuadas en slo unos cuantos aos, de
modo que la regla, ms que la excepcin, debe ser el establecimiento peridico de
nuevas normas.
La gran parte de las pruebas psicolgicas se interpreta a travs de la consulta de
normas; como ya se seal, estos instrumentos se denominan pruebas referidas a la
norma. Sin embargo, existen otros tipos de instrumentos; las pruebas referidas a
criterio que ayudan a determinar si una persona puede alcanzar un criterio
objetivamente. En el caso de las pruebas referidas a criterio, las normas no son
esenciales.
Existen diferentes tipos de normas, pero stas tienen una caracterstica en comn:
cada una incorpora un resumen estadstico de un enorme conjunto de puntuaciones.
As, para comprenderlas, el lector necesita dominar la estadstica descriptiva

elemental.
Ejemplo:
La prueba es un cuestionario de opcin mltiple con 30 palabras difciles como
firmamento, paradisiaco y melifluo. Una profesora toma la prueba y elige la alternativa
correcta para 17 de las 30 palabras. Pregunta cmo se compara su calificacin con
otras personas con el mismo nivel acadmico. Cmo podra responderse a su
pregunta?
Una manera de responder a la interrogante consistira en darle una lista de las
puntuaciones naturales de la muestra preliminar de estandarizacin con 100
profesores representativos de su universidad. Cuando se nos confronta con un
conjunto de datos cuantitativos, la tendencia humana natural es la de resumir y
organizar dichos datos en patrones significativos. Por ejemplo, en la evaluacin del
significado de la puntuacin de vocabulario de la profesora, se podra calcular la
puntuacin promedio de toda la muestra o establecer la posicin relativa de la
puntuacin de la profesora.
Distribucin de frecuencias
Una manera simple y til de resumir los datos consiste en tabular una distribucin de
frecuencias, la cual se prepara al especificar un pequeo nmero de intervalos de
clase de igual tamao y despus determinar cuntas puntuaciones cae n dentro de
cada intervalo. La suma de las frecuencias de todos los intervalos ser igual a N, el
nmero total de puntuaciones en la muestra. No existe una re gla simple para
determinar el tamao de los intervalos; ste, obviamente, depende del nmero de
intervalos deseado. Es comn que la distribucin de frecuencias tenga entre 5 y 15
intervalos de clase.
Ejemplo:
Tabla 1. Distribucin de frecuencia de las puntuaciones de 100 profesores en una
prueba de vocabulario (Tomado de Gregory, 2001)
Intervalo de clase
4-6
Frecuencia
1
7-9
10-12
13-15
16-18
19-21
22-24
25-27
28-30
12
21
24
21
7
5
1
W=100
Medidas de tendencia central
Se puede establecer una sola puntuacin representativa de las 100 puntuaciones de

vocabulario en nuestra muestra? La media (X) o promedio aritmtico es una de dichas
puntuaciones. Se calcula sumando todas las puntuaciones y dividindolas entre N, el
nmero de puntuaciones. Otro ndice til de tendencia central es la mediana, la
puntuacin que se encuentra a la mitad cuando se han ordenado todas las
puntuaciones. Si el nmero de puntuaciones es par, la mediana es el promedio de las
dos puntuaciones a la mitad. En cualquier caso, la mediana es el punto que divide en
dos la distribucin, de modo que la mitad de los casos se encuentren por encima de
ella y la mitad por debajo. Por ltimo, la moda es simplemente la puntuacin que
ocurre con mayor frecuencia. Si dos puntuaciones tienen la mayor frecuencia de
ocurrencia, se dice que la distribucin es bimodal. La media es sensible a los valores
extremos y puede ser engaosa si una distribucin tiene pocas puntuaciones
inusualmente altas o bajas. Considrese el caso extremo donde nueve personas
ganan $10 000.00 y una dcima persona gana $910 000.00. El ingreso promedio para
este grupo de personas sera de $100 000; sin embargo, este nivel de ingresos no es
tpico de nadie dentro del grupo. La mediana del ingreso, colocada en $10 000, es
mucho ms representativa. Por supuesto, ste es un ejemplo extremo, pero ilustra un
punto en general: si una distribucin est sesgada (es decir, es asimtrica), la
mediana es un mejor ndice de la tendencia central que la meda.
Medidas de variabilidad
Dos o ms distribuciones de puntuaciones de prueba pueden tener la misma media y,

sin embargo, es posible que difieran en gran medida en el grado de dispersin de las
puntuaciones con respecto a la media. Para describir el grado de dispersin, es
necesario un ndice estadstico que exprese la variabilidad de las puntuaciones en una
distribucin.
El ndice estadstico de variabilidad que se utiliza con mayor frecuencia en un grupo
de puntuaciones es la desviacin estndar (DE). Desde un punto de vista conceptual,
el lector necesita saber que la DE refleja el grado de dispersin en un grupo de
puntuaciones. De hecho, en el caso extremo donde todas las puntuaciones son
idnticas, la DE es exactamente cero. A medida que un grupo de puntuaciones se
dispersa ms, la DE se vuelve ms grande.
La varianza es otra medida de variabilidad, pero en general, los psiclogos prefieren
informar la desviacin estndar, que se calcula obteniendo la raz cuadrada de la
varianza.
-
Distribucin normal
Los psiclogos prefieren una distribucin normal de puntuaciones de prueba, aun

cuando muchas otras distribuciones son tericamente posibles. Por ejemplo, una
mayor proporcin de personas obtendra puntuaciones en el rango superior si las
pruebas psicolgicas se conformaran a una distribucin rectangular de puntuaciones,
en vez de a una distribucin normal.
Figura 1. Distribucin normal (Tomada de Gregory, 2001)
Una razn por la que los psiclogos prefieren las distribuciones normales es que la
curva normal tiene caractersticas matemticas tiles que forman la base para varios
tipos de investigacin estadstica. As, a fin de facilitar el uso de estadsticas
inferenciales, los psiclogos prefieren que las puntuaciones de prueba en la poblacin
normal sigan una distribucin normal o casi normal, otra propiedad til de las
distribuciones normales es que el porcentaje de casos que caen dentro de un cierto
rango o ms all de un cierto valor se conoce de manera exacta.
-
Transformacin de las puntuaciones naturales
Darle sentido a los resultados de prueba es, en gran medida, una cuestin de
transformar las puntuaciones naturales en formas ms interpretables y tiles de
informacin.
Percentiles y rangos percentiles: Un percentil expresa el porcentaje de personas
dentro de la muestra de estandarizacin que obtuvieron puntuaciones por debajo de
una puntuacin natural especfica. Un percentil indica slo cmo se compara a un
individuo con la muestra de estandarizacin y no transmite el porcentaje de preguntas
respondidas de manera correcta. Los percentiles tambin pueden concebir se como
ltigos en un grupo de 100 sujetos representativos, donde 1 es el rango inferior y 100
el superior.
Puntuacin estndar o puntuacin z: Una puntuacin estndar utiliza la desviacin

estndar de la distribucin total de puntuaciones naturales como la unidad
fundamental de medida. La puntuacin estndar expresa la distancia de la media en
unidades de desviacin estndar. Por ejemplo, una puntuacin natural que se
encuentra exactamente a una desviacin estndar por encima de la me dia se
convierte en una puntuacin estndar de +1.00. Una puntuacin estndar no slo
expresa la magnitud de la desviacin con respecto a la media, sino tambin la
direccin de esa desviacin (positiva o negativa). El clculo de la puntuacin estndar
de un individuo es sencillo: se resta la puntuacin natural de la persona examinada a
la media del grupo normativo y despus se divide esta diferencia entre la desviacin
estndar del grupo normativo.
Puntuaciones T y otras puntuaciones estandarizadas: Desde un punto de vista

conceptual, las puntuaciones estandarizadas son idnticas a las puntuaciones
estndar. La relacin entre las puntuaciones estndar y estandarizadas siempre se
traza como una lnea recta, sin embargo, las puntuaciones estandarizadas siempre se
expresan como nmeros enteros positivos (no existen fracciones decimales ni signos
negativos), de modo que muchos usuarios de prueba prefieren representar los
resultados en esta forma. El punto importante acerca de las puntuaciones
estandarizadas es que se puede transformar cualquier distribucin a una escala
preferida con media y desviacin estndar predeterminadas.
Un tipo muy conocido de puntuacin estandarizada es la puntuacin T, que tiene una
media de 50 y desviacin estndar de 10. Las escalas en puntuacin T son
especialmente comunes en las pruebas de personalidad. Por ejemplo, en el MMPI,
cada escala clnica (como Depresin, Paranoia) se convierte a una medida comn,
donde 50 es la puntuacin promedio y 10 es la desviacin estndar de la muestra
normativa.
Seleccin de un grupo normativo
Cuando se elige un grupo normativo, quienes desarrollan pruebas se esfuerzan por

obtener una muestra representativa de la poblacin para la cual se dise la prueba
(Gregory, 2001). Considrese una prueba de rendimiento escolar diseada para nios
de quinto de primaria en Colombia, la poblacin serian todos los nios en quinto grado
del pas. Se puede obtener una muestra representativa de estos individuos
potenciales a travs de un muestreo aleatorio por computadora de 10 000 nios, entre
los millones de nios elegibles. Cada uno tendra igual probabilidad de ser elegido
para realizar la prueba; es decir, la estrategia de seleccin sera un muestreo
aleatorio.
En el mundo real, obtener muestras normativas nunca es tan sencillo y definitivo como
el caso hipottico anterior; los investigadores no tienen una lista completa de todos los
nios en el pas. Para ayudar a asegurar que los grupos normativos de menor tamao
sean verdaderamente representativos de la poblacin para la cual se dise la
prueba, los autores de la misma utilizan un muestreo aleatorio estratificado. Este

enfoque consiste en estratificar, o clasificar, a la poblacin blanco en cuanto a
variables antecedentes (como edad, sexo, raza, clase social, nivel educativo) y
despus seleccionar al azar un porcentaje apropiado de personas dentro de cada
estrato. Pero lo que es ms tpico es un esfuerzo de buena fe por elegir una muestra
diversa y representativa de escuelas fuertes y dbiles; vecindarios minoritarios y
blancos; ciudades grandes y pequeas y comunidades del norte, este, centro y sur. Si
esta muestra engloba entonces aproximadamente el mismo porcentaje de minoras,
habitantes de las ciudades, familias de clase alta y baja que el censo nacional,
entonces los autores de la prueba se sienten seguros de que el grupo es
representativo.
Construccin de pruebas
Las pruebas vlidas surgen de manera lenta de un proceso evolutivo. En esta seccin
se enfatiza en los aspectos bsicos del desarrollo de pruebas. As, la construccin de
pruebas consta de seis etapas entrelazadas:
-
Definicin de la prueba.
Seleccin de un mtodo de escalamiento.
Construccin de los reactivos.
Examen de los reactivos.
Revisin de la prueba.
Publicacin de la prueba.
La definicin de la prueba consiste en la delimitacin de su alcance y propsito, lo cual

debe saberse antes de que el autor pueda proseguir con su construccin. La seleccin
de un mtodo de escalamiento es un proceso en el que se establecen las reglas
mediante las cuales se asignan nmeros a los resultados de la prueba. La
construccin de los reactivos es tanto un arte como una ciencia y es aqu donde
puede requerirse la habilidad del autor.
Una vez que se tiene disponible una versin preliminar de la prueba, los autores e n
general la aplican a una muestra de tamao modesto de individuos (pilotaje), a fin de
reunir los datos inciales sobre las caractersticas de los reactivos. El examen de stos
implica una variedad de procedimientos estadsticos conocidos como anlisis de
reactivos, cuyo propsito consiste en determinar cules reactivos deben conservarse,
revisarse o eliminarse. Con base en el anlisis de reactivos y en otras fuentes de
informacin, se revisa la prueba. Si las revisiones son sustanciales, es posible que se
requieran nuevos reactivos y prepruebas adicionales con nuevos individuos.
As, la construccin de pruebas implica un cir cuito de realimentacin donde se podran

producir varios borradores de un instrumento. La publicacin de la prueba es el paso
final. Adems de difundir los materiales de una prueba, el autor debe producir un
manual fcil de comprender para el psiclogo que vaya a aplicarla.
Construccin de Reactivos
Construir los reactivos de una prueba es un procedimiento intenso y cuidadoso que

impone demandas a la creatividad de los autores de pruebas. Quien los redacta se
enfrenta con varias preguntas inciales:
El contenido de los reactivos debe ser homogneo o variado?

Qu rango de dificultad deberan cubrir los reactivos?
Cuntos reactivos inciales deberan construirse?
Qu procesos cognitivos y dominios del reactivo deberan cubrirse?
Qu tipos de reactivos de prueba deberan utilizarse?
Pautas para la redaccin de reactivos de opcin mltiple

o Elija palabras que tengan significados precisos.
o Evite la sintaxis compleja o extraa.

o Incluya toda la informacin necesaria para la seleccin de la respuesta.
o Incluya lo ms posible de la pregunta dentro del planteamiento.
o No tome los planteamientos al pie de la letra de los libros de texto.
o Utilice opciones de igual extensin y fraseo paralelo.
o Utilice "ninguna de las anteriores" y "todas las anteriores" en raras
ocasiones.
o Reduzca al mnimo el empleo de negativos como no.
o Evite la utilizacin de palabras no funcionales.
o Evite la especificidad innecesaria en el planteamiento.
o Evite indicios innecesarios de la respuesta correcta.
o Presente los reactivos a otras personas para escrutinio editorial.
Las Pruebas y su Proceso de Aplicacin

El procedimiento estandarizado es una caracterstica esencial de cualquier prueba
psicolgica. Se considera que una prueba est estandarizada si los procedimientos
para su aplicacin son uniformes de un examinador a otro y de un ambiente a otro.
Por supuesto, la estandarizacin depende, en cierto grado, de la capacidad del
examinador. Incluso la mejor prueba puede resultar intil en manos de un evaluador
descuidado, con entrenamiento deficiente o mal informado. Sin embargo, la mayora
de los examinadores son competentes. Por tanto, la estandarizacin depende en gran
medida de las disposiciones de aplicacin que se encuentran en el manual de
instrucciones que por lo comn acompaa a una prueba.
La formulacin de las instrucciones es un paso esencial para la estandarizacin de

una prueba. A fin de garantizar procedimientos uniformes de aplicacin, quien
desarrolla una prueba debe proporcionar materiales estmulo comparables para todos
los examinados, debe especificar con una precisin considerable las instrucciones
verbales para cada reactivo o subprueba y debe aconsejarle al examinador cmo ha

de manejar una diversidad de dudas por parte de la persona evaluada.
Quien desarrolla una prueba puede incluso llegar hasta el punto de recomendar el
comportamiento deseado en el examinador, como mantener una expresin facial
neutra cuando se registra la respuesta de un sujeto. Estas influencias aparentemente
sutiles pueden tener un serio impacto sobre la uniformidad de los procedimientos de
prueba. Por ejemplo, un examinador que se sonre con displicencia cuando registra
las respuestas podra provocar que el sujeto se sienta ansioso y falle en una tarea
fcil.
Una prueba psicolgica tambin es una muestra limitada de conducta. Ni el sujeto ni el
examinador tienen el tiempo suficiente para una prueba realmente amplia, incluso
cuando sta se dirige a un dominio conductual bien definido y finito. Sin embargo, la
muestra de conducta es de inters slo en la medida que permita que el examinador
realice inferencias acerca del dominio total de conductas relacionadas, la prediccin
exitosa es una cuestin emprica que se resuelve a travs de la investigacin
apropiada.
Una prueba psicolgica tambin debe permitir la derivacin de puntuaciones o categoras; toda prueba suministra una o ms puntuaciones o proporciona evidencia de que
una persona pertenece a una categora y no a otra. En pocas palabras, las pruebas
psicolgicas resumen la ejecucin en nmeros o clasificaciones. Las pruebas miden
las diferencias individuales, se supone que todas las personas poseen el rasgo o
caracterstica medida, aunque en diferentes cantidades. El propsito de la prueba consiste en estimar la cantidad del rasgo o cualidad que posee un individuo.
En este contexto, se deben hacer dos advertencias. Primero, toda puntuacin de prueba siempre reflejar cierto grado de error de medicin. La imprecisin de las pruebas
es simplemente inevitable: stas deben depender de una muestra externa de
conducta para estimar la caracterstica no observable y, por tanto, inferida. Con
frecuencia, los psicmetras expresan este punto fundamental con la ecuacin:
X=T+e
donde X es la puntuacin observada, T la puntuacin verdadera y e el
componente de error positivo o negativo. Lo mejor que puede hacer quien desarrolla
una prueba es procurar que e sea muy pequeo.

Una prueba psicolgica tambin debe poseer normas o estndares. En general, la
puntuacin de prueba de una persona se interpreta al compararla con las
puntuaciones obtenidas por otros individuos en la misma prueba. Las normas no slo
establecen un desempeo promedio, sino que tambin sirven para indicar la
frecuencia con la que se obtienen diferentes puntuaciones altas y bajas As, las normas permiten que el examinador determine el grado al que se desva una puntuacin
con respecto a las expectativas. Tal informacin puede ser muy importante en la
prediccin de la conducta externa a la prueba del individuo exa minado. Las normas
tienen tal importancia trascendental en la interpretacin de pruebas, que despus se
les considerar con amplitud en una seccin independiente dentro de este texto.
Tipos y usos de las pruebas

Las pruebas pueden agruparse de manera amplia en dos bandos: pruebas grupales y
pruebas individuales. Las pruebas grupales son medidas principalmente de lpiz y
papel, adecuadas para examinar a grandes grupos de personas a un mismo tiempo.
Las pruebas individuales son instrumentos que, por su diseo y prop sito, deben
aplicarse a una sola persona. Una ventaja importante de estas ltimas es que el examinador puede estimar el nivel de motivacin del sujeto y evaluar la relevancia de
otros factores (p. ej., impulsividad o ansiedad) sobre los resultados de prueba.
Por conveniencia, las pruebas se clasificarn en ocho categoras representadas en;
cada una de ellas contiene pruebas referidas a la norma, referidas a criterio, individuales y grupales. El lector observar que cualquier tipologa de las pruebas es una
determinacin puramente arbitraria. Por ejemplo, podra postularse incluso otra
dicotoma: pruebas que buscan medir el desempeo mximo (p. ej., una prueba de
inteligencia) contra las que buscan estimar una respuesta tpica (p. ej., un inventa rio
de personalidad).
-
Principales tipos de pruebas psicolgicas:
Pruebas de inteligencia: miden la capacidad de un individuo en reas

relativamente globales como comprensin verbal, organizacin perceptual o
razonamiento y, por tanto, ayudan a determinar el potencial para el trabajo

escolar o para ciertas ocupaciones.
Pruebas de aptitud: miden la capacidad para una tarea o tipo de hab ilidad
relativamente especfica; en efecto, las pruebas de aptitud son una forma
estrecha de prueba de capacidad.
Pruebas de aprovechamiento: miden el grado de aprendizaje, xito o logro de

una persona en un tema o tarea.
Pruebas de creatividad: evalan el pensamiento novedoso y original y la

capacidad para encontrar soluciones poco comunes o inesperadas, en
especial, para problemas definidos de manera vaga.
Pruebas de personalidad: miden los rasgos, cualidades o conductas que

determinan la individualidad de una persona; dichas pruebas incluyen listas de
verificacin, inventarios y tcnicas proyectivas.
Inventarios de intereses: miden la preferencia de un individuo por ciertas

actividades o temas y, por tanto, ayudan a determinar la eleccin de carrera.
Procedimientos conductuales: describen de manera objetiva una conducta y

estiman su frecuencia, identificando los antecedentes y consecuencias de la
conducta.
Pruebas neuropsicolgicas: miden el desempeo cognoscitivo, sensorial,

perceptual y motor para determinar el grado, localizacin y consecuencias
conductuales del dao cerebral
En un sentido estricto, existen cientos de tipos diferentes de pruebas, cada una de las
cuales mide un aspecto ligeramente diferente del individuo.
Procesos de aplicacin deseables
Se analizarn primero las pruebas individuales y despus se enumerarn de manera
breve algunos puntos importantes acerca de los procedimientos deseables en las
pruebas con grupos.
Procedimientos deseables con pruebas individuales
Un componente esencial de las pruebas individuales es que los examinadores deben

familiarizarse ntimamente con los materiales e instrucciones antes de comenzar con
la aplicacin. En su mayora, esto implica extensos ensayos y anticipacin de las
circunstancias poco comunes y de la respuesta apropiada. Un examinador bien
preparado tiene memorizados los elementos clave de las instrucciones verba les y est
listo para manejar lo inesperado. La atencin apropiada a los detalles de aplicacin es
esencial para obtener resultados vlidos.
Otro ingrediente importante de la aplicacin vlida de una prueba es la sensibilidad a
las discapacidades de la persona evaluada. Las discapacidades en audicin, visin,
habla o control motor pueden distorsionar gravemente los resultados de prueba. Si el
examinador no reconoce la discapacidad fsica responsable del desempeo deficiente
en la prueba, puede clasificarse al sujeto como discapacitado a nivel intelectual o
emocional cuando, de hecho, el problema esencial es una discapacidad senso rial o
motora.
Las pruebas vlidas con sujetos que tienen discapacidades auditivas requieren antes
que nada que el examinador detecte la existencia de la discapacidad! Con frecuencia
esto es ms difcil de lo que parece. Las indicaciones de una posible dificultad auditiva
incluyen falta de respuesta normal ante el sonido, falta de atencin, dificultades para
obedecer instrucciones orales, observacin intensa de los labios del hablante y
articulacin deficiente En el caso de personas con una prdida auditiva leve, es
esencial que el examinador se coloque de frente al sujeto, hable ms fuerte y repita
las instrucciones lentamente. En contraste con los individuos que tienen alteraciones
auditivas, las personas con discapacidades visuales generalmente atienden bien a los
materiales de prueba presentados de modo verbal. La persona con alteraciones
visuales introduce un tipo diferente de reto para el examinador; delectar la existencia
de una alteracin visual y despus, asegurarse de que el sujeto puede ver bien los
materiales de prueba.
En general, es tan comn que los nios requieran anteojos correctores, que los
examinadores deben estar alertas a un problema de visin en cualquier sujeto joven
que no utilice anteojos y que no haya pasado por un examen reciente de la visin.
Las alteraciones del habla representan otro problema para quienes deben hacer un
diagnstico. Las respuestas verbales de las personas con alteraciones del habla son
difciles de descifrar. Debido a la incapacidad del examinador para entender las
respuestas, los sujetos pueden recibir un menor crdito del que merecen
Procedimientos deseables con pruebas de grupo
Conducir una prueba grupal requiere tanto refinamiento como aplicar una prueba
individual. Sin duda, la ms grande fuente de error en la aplicacin de una prueba
grupal tiene que ver con tomar de manera inadecuada el tiempo en las pruebas
cronometradas. Los examinadores deben conceder el tiempo suficiente para el proceso completo de prueba: organizacin, lectura de las instrucciones en voz alta y
presentacin de la prueba en s por parte de los sujetos. Conceder el tiempo suficiente
requiere previsin en la programacin. Por supuesto, reducir el tiempo en una prueba
causa que las normas sean completamente invlidas y con toda probabilidad reduce la
puntuacin de la mayora de los sujetos en el grupo. Conceder demasiado tiempo para
una prueba puede constituir tambin un tremendo error.
Una segunda fuente de error en la aplicacin de pruebas grupales es la falta de
claridad en las instrucciones para los examinados. Los examinadores deben leer las
instrucciones con lentitud, con una voz clara y fuerte que atraiga la atencin de los
sujetos. Las instrucciones no deben parafrasearse. Cuando el manual lo per mite, los
examinadores deben detenerse en la lectura y aclarar las dudas de los individuos que
tienen alguna confusin.
Las variaciones en las condiciones fsicas de aplicacin de prueba constituyen una
tercera fuente de error potencial en la conduccin de una prueba grupal. Los
examinadores deben asegurarse de que la habitacin de examen est bien iluminada
y, de ser necesario, que tenga calefaccin o aire acondicionado para controlar las
variaciones extremas en cuanto a temperatura y humedad. La importancia de la
superficie de escritura se aumenta por la tendencia actual a utilizar hojas separadas
de respuesta. Los sujetos necesitan de un espacio ms amplio de escritorio cuando
emplean hojas separadas de respuesta que bajo otras condiciones. Aunque pocos
editores de prueba lo sealan, sera bueno especificar en los manuales de prueba las
variaciones admisibles en cuanto a superficie de escritura que de todos modos
permiten resultados comparables de prueba.
La importancia del rapport
Los editores de pruebas instan a los examinadores a establecer un rapport; una

atmsfera cmoda y clida que sirva para motivar a los examinandos y que produzca
la cooperacin. Dar lugar a un ambiente cordial para la prueba es un aspecto crucial
de una prueba vlida. Un examinador que no establece rapport puede provocar que
una persona reaccione con ansiedad, falta de cooperacin de naturaleza pasivoagresiva u hostilidad abierta. El fracaso para establecer el rapport distorsiona los datos
de la prueba: se subestima la capacidad y se hace un juicio inadecuado de la
personalidad. El rapport es de particular importancia en las pruebas individuales y en
particular cuando se evala a nios.
Ansiedad ante la prueba
La ansiedad ante la prueba se refiere a aquellas respuestas fenomenolgicas,

fisiolgicas y conductuales que acompaan a la preocupacin acerca del posible
fracaso en una prueba. No hay duda de que los sujetos experimentan diferentes
niveles de ansiedad ante la prueba, que van desde una actitud despreocupada, hasta
un temor incapacitante ante el prospecto de que se les someta a prueba.
Entonces
Los contenidos de la psicometra se articulan, fundamentalmente, en dos grandes

bloques: teora de los test, que hace referencia a la construccin, validacin y
aplicacin de los test, y escalamiento, que incluye los mtodos para la elaboracin de
escalas psicofsicas y psicolgicas. A su vez, la teora de los test se divide en dos
ramas: la teora clsica de los tests y la ms reciente teora de respuesta a los tems.
Los conceptos clave de la teora clsica de los tests son: confiabilidad y validez.
"confiabilidad" es medir algo de forma consistente; mientras que "validez" es medir lo
que realmente se pretende medir. Ambas propiedades admiten un tratamiento
matemtico.
La consistencia interna puede calcularse por correlacin entre distintos tests. Los
mtodos ms conocidos se denominan: mtodo de las formas paralelas, mtodo
del test-retest y mtodo de las dos mitades.
La validez puede calcularse correlacionando las mediciones con las de una medida
patrn aceptada como vlida. Se distinguen los siguientes aspectos: validez de
contenido, validez predictiva y validez de constructo.
Con frecuencia, el estudiante de evaluacin inexperto supone que los procedimientos
de examen son tan sencillos y simples que una sola lectura rpida del manual ser
suficiente como preparacin para la prueba. Aunque algunas pruebas individuales son
sumamente rudimentarias y poco complicadas, muchas de ellas tienen aspectos
complejos de aplicacin que, si no se toman en cuenta, pueden causar que el
individuo examinado falle de manera innecesaria en los reactivos.
Ya sea que una prueba grupal utilice o no una correccin para la puntuacin, el punto
importante reside en enfatizar en este contexto que quien aplica la prueba debe seguir
el procedimiento estandarizado y nunca ofrecer consejo adicional acerca de adivinar
las respuestas. En las pruebas grupales, las desviaciones con respecto al manual de
instrucciones son simplemente inaceptables.
Referencias
Arnau, J. (1989). Metodologa de la investigacin y diseo. En J. Arnau y H.
Carpintero (Eds.). Historia, teora y mtodo. Madrid: Alhambra Universidad.
Crocker, L. y Algina, J. (1986). Introduction to classical and modern test theory. New
York: Holt, Rinehart and Winston.

Gregory, R. (2001). Evaluacin psicolgica: Historia, principios y aplicaciones. Mxico:
Manual Moderno
Martnez-Arias, R (1995). Psicometra: Teora de los tests psicolgicos y
educativos. Madrid: Sntesis.
Meli, J.L. (1990). La construccin de la Psicometra coma ciencia terica y
aplicada. Valencia: Cristbal Serrano.

Al Método y Metodología Estadística de La

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Al Método y Metodología Estadística de La

Diunggah oleh

Hak Cipta:

Format Tersedia

INTRODUCCIN AL MTODO Y METODOLOGA ESTADSTICA DE LA

La conexin entre la psicometra y la psicologa matemtica, permite considerar el

Muchos campos de la Psicometra la utilizan como tcnica de obtencin de datos,

El anlisis del mtodo no puede obviar el papel instrumental de la Psicometra

sometidas a contrastacin. La generalizacin de los resultados hace retornar la

Los contenidos de la Psicometra

La teora de los tests

La definicin de test no ha variado de forma significativa conforme evolucionaba la

informacin tcnica sobre la precisin y

relevancia para el objetivo de la evaluacin de las mediciones aportadas por el test.

Ausencia de aproximaciones nicas a la medicin de la mayora de los

Muestreo limitado del comportamiento (muestreo reducido de situaciones y

Presencia inevitable de los errores de medida.

Evolucin de las teoras psicolgicas (el significado de las mediciones siempre

La finalidad de la teora de los tests es aportar soluciones para minimizar el impacto

mtodos de puntuacin e interpretacin de las puntuaciones y, de forma

Criterios de calidad en la construccin de test

Utilice como gua la siguiente pgina web: http://www.uned.es/psico-3-psicometria/ En

La estabilidad temporal de las puntuaciones obtenidas con el test (test-retest y

La consistencia interna del test (alpha y dos mitades)

Conceptos estadsticos, normas y estandarizacin

As, para comprenderlas, el lector necesita dominar la estadstica descriptiva

Tabla 1. Distribucin de frecuencia de las puntuaciones de 100 profesores en una

prueba de vocabulario (Tomado de Gregory, 2001)

Medidas de tendencia central

Se puede establecer una sola puntuacin representativa de las 100 puntuaciones de

Dos o ms distribuciones de puntuaciones de prueba pueden tener la misma media y,

Los psiclogos prefieren una distribucin normal de puntuaciones de prueba, aun

Figura 1. Distribucin normal (Tomada de Gregory, 2001)

Transformacin de las puntuaciones naturales

Puntuacin estndar o puntuacin z: Una puntuacin estndar utiliza la desviacin

Puntuaciones T y otras puntuaciones estandarizadas: Desde un punto de vista

Seleccin de un grupo normativo

Cuando se elige un grupo normativo, quienes desarrollan pruebas se esfuerzan por

prueba, los autores de la misma utilizan un muestreo aleatorio estratificado. Este

Seleccin de un mtodo de escalamiento.

Construccin de los reactivos.

Examen de los reactivos.

La definicin de la prueba consiste en la delimitacin de su alcance y propsito, lo cual

As, la construccin de pruebas implica un cir cuito de realimentacin donde se podran

Construir los reactivos de una prueba es un procedimiento intenso y cuidadoso que

El contenido de los reactivos debe ser homogneo o variado?

Pautas para la redaccin de reactivos de opcin mltiple

o Evite la sintaxis compleja o extraa.

Las Pruebas y su Proceso de Aplicacin

La formulacin de las instrucciones es un paso esencial para la estandarizacin de

verbales para cada reactivo o subprueba y debe aconsejarle al examinador cmo ha

una prueba es procurar que e sea muy pequeo.

Tipos y usos de las pruebas

Principales tipos de pruebas psicolgicas:

Pruebas de inteligencia: miden la capacidad de un individuo en reas

razonamiento y, por tanto, ayudan a determinar el potencial para el trabajo

Pruebas de aprovechamiento: miden el grado de aprendizaje, xito o logro de

Pruebas de creatividad: evalan el pensamiento novedoso y original y la

Pruebas de personalidad: miden los rasgos, cualidades o conductas que

Inventarios de intereses: miden la preferencia de un individuo por ciertas

Procedimientos conductuales: describen de manera objetiva una conducta y

Pruebas neuropsicolgicas: miden el desempeo cognoscitivo, sensorial,

Procedimientos deseables con pruebas individuales

Un componente esencial de las pruebas individuales es que los examinadores deben

Procedimientos deseables con pruebas de grupo

La importancia del rapport

Los editores de pruebas instan a los examinadores a establecer un rapport; una

Ansiedad ante la prueba