Enfoques tericos
Los contenidos de la psicometra se articulan, fundamentalmente, en dos grandes bloques:
Teora de los test, que hace referencia a la construccin, validacin y aplicacin de los test,
Escalamiento, que incluye los mtodos para la elaboracin de escalas psicofsicas y
psicolgicas.
A su vez, la teora de los test se divide en dos ramas:
la teora clsica de los test y la ms reciente teora de respuesta al tem.
Los conceptos clave de la teora clsica de los test son: confiabilidad (o fiabilidad)
y validez. Un test es vlido si mide realmente el atributo que pretende medir; mientras
que es confiable si lo mide siempre de igual manera, es decir, si la aplicacin del
instrumento da medidas estables y consistentes.
Ambas propiedades, validez y confiabilidad, admiten un tratamiento matemtico.
La consistencia interna puede calcularse por correlacin entre distintos test.
Los mtodos ms conocidos se denominan:
mtodo de las formas paralelas, mtodo del test-re test y mtodo.
La validez puede calcularse correlacionando las mediciones con las de una medida patrn
aceptado como vlida. Se distinguen los siguientes aspectos: contenido, validez y validez
de constructo.
La confiabilidad (o fiabilidad) tiene tambin relacin con la precisin del instrumento que se
utiliza para medir.
Por ejemplo, si se compara un termmetro con la mano de una madre para determinar si
un nio tiene fiebre, se puede afirmar que el termmetro es ms confiable, puesto que es
ms preciso.
Fiabilidad (psicometra)
En el campo de la psicologa, la educacin y la investigacin social, la fiabilidad (tambin
llamada tcnicamente confiabilidad) es una propiedad psicomtrica que hace referencia a
la ausencia de errores de medida, o lo que es lo mismo, al grado de consistencia y
estabilidad de las puntuaciones obtenidas a lo largo de sucesivos procesos de medicin
con un mismo instrumento.
Consideraciones generales
Es necesario aclarar que la fiabilidad no es una propiedad de los test en s mismos, sino
de las interpretaciones, inferencias o usos especficos que se hagan a partir de los datos y
medidas que estos proporcionan
. Asimismo, no puede hablarse de la fiabilidad en trminos absolutos; s cabra hablar
del grado de fiabilidad que puedan presentar los instrumentos de medida en un contexto
de aplicacin determinado.
A partir de la variabilidad en las puntuaciones encontradas tras una serie de mediciones
repetidas puede determinarse el ndice de precisin, consistencia y estabilidad de un
instrumento.
En el supuesto de que el resto de condiciones se mantengan inalteradas, puede concluirse
que, a mayor variabilidad de resultados, menor fiabilidad del instrumento de medicin
No obstante, uno de los principales problemas que se presentan en el campo de la
investigacin en ciencias sociales tiene que ver con la dificultad de conseguir que las
distintas medidas se realicen exactamente en las mismas condiciones.
Las condiciones personales de los sujetos, como la motivacin, la maduracin o el grado
de atencin, pueden variar de una medicin a otra, por lo que resulta imprescindible
establecer un procedimiento estandarizado de medicin que permita reducir al mnimo
las variables extraas que puedan influir en los resultados finales.
Por lo tanto, la fiabilidad hace referencia a la estabilidad y consistencia de las mediciones
en aquellos casos en los que no existen razones tericas o empricas que nos hagan
suponer que la variable que se mide se haya visto modificada de forma significativa por los
sujetos, por lo que se asume su estabilidad
Donde
, y
Coeficiente de fiabilidad
El coeficiente de fiabilidad (
por los sujetos en dos formas paralelas de un test (X y X'). Suponiendo que las dos
formas del test sean realmente paralelas (es decir, midan realmente lo mismo), las
puntuaciones de los sujetos deberan ser iguales en ambas aplicaciones. As, cuando
la correlacin es igual a 1, la fiabilidad es mxima.
El grado en que el coeficiente de fiabilidad se aleje de 1 ser un indicador del grado
de error aleatorio de medida que estaremos cometiendo en la aplicacin de las
pruebas.
El coeficiente de fiabilidad no debe confundirse con el ndice de fiabilidad, que es la
correlacin entre las puntuaciones verdaderas y las empricas (
), y se obtiene a
Formas paralelas
Este procedimiento es el que se deriva naturalmente del modelo. Requiere que se
utilicen dos pruebas o instrumentos paralelos, esto es, que midan lo mismo de forma
diferente.
Por ejemplo: dos test que con diferentes preguntas midan un determinado rasgo.
Despus se comparan los dos test, calculando el coeficiente de correlacin de
Pearson. Esta correlacin ser, como hemos visto en el apartado anterior, el
coeficiente de fiabilidad. Si la correlacin es alta, se considera que hay una buena
fiabilidad. Al valor obtenido tambin se le conoce como coeficiente de equivalencia,
en la medida en que supone un indicador del grado de equivalencia entre las dos
formas paralelas de un test.
La dificultad de este procedimiento radica en conseguir que dos instrumentos sean
realmente "paralelos", dada la dificultad que supone realizar dos pruebas que midan
Test-re test
Con este mtodo el coeficiente de fiabilidad se calcula pasando mismo test dos veces
a los mismos sujetos. Se pueden pasar inmediatamente, o dejando un intervalo de
tiempo entre el test y el re test. Despus se calcula la correlacin de Pearson entre las
puntuaciones de ambas aplicaciones, y el resultado obtenido ser el coeficiente de
fiabilidad.
Se considera un caso especfico de formas paralelas, dado que evidentemente un
testes paralelo a s mismo. Al resultado obtenido se le
denomina coeficiente
Dos mitades
A diferencia de los anteriores, este mtodo slo requiere una aplicacin del test.
Tras obtener las puntuaciones obtenidas por los sujetos en cada una de las dos
mitades en que se habr dividido, se procede a calcular la correlacin entre las dos
puntuaciones.
El resultado obtenido ser un indicador de la covariacin entre ambas mitades, es
decir, de la consistencia interna del test.
Mtodo
de
Guttman/Flanagan (1945/1937):
Otra
frmula
basada
en
la
Coeficiente beta (): Propuesto por Raju (1977) para calcular la fiabilidad de una
batera compuesta por diversos subtests. En los casos en los que se desea
calcular la fiabilidad de una batera, se trata a los distintos subtests como si fueran
los tems de un nico test y se calcula el coeficiente alfa global.
El problema surge en los casos en los que los distintos subtests no tienen el
mismo nmero de tems, lo que suele ser lo ms frecuente, y que repercute en
una infraestimacin del alfa global.
Validez (psicometra)
En el campo de la metrologa, psicometra y estadstica, la validez es un concepto que
hace referencia a la capacidad de un instrumento de medicin para cuantificar de forma
significativa y adecuada el rasgo para cuya medicin ha sido diseado.
De esta forma, un instrumento de medida es vlido en la medida en que las evidencias
empricas legitiman la interpretacin de las puntuaciones arrojadas por el test.
Consideraciones generales
La constatacin de la validez de un instrumento de medida no ofrece mayores problemas
cuando se trata de cuantificar variables objetivas, como el peso, la estatura o el volumen.
Pero en el caso de variables psicolgicas es necesario probar de forma emprica que el
instrumento es vlido para aquello que dice evaluar.
No obstante, ms que el test en s mismo, lo que se somete a validacin son las
posibles inferencias que se vayan a realizar a partir de los resultados obtenidos.
Tanto la fiabilidad como la validez son dos propiedades psicomtricas que deben cumplir
las interpretaciones e inferencias que se hagan de los resultados obtenidos por los test
psicolgicos.
La validez, pues, no debe ser una caracterstica propia del test, sino de las
generalizaciones y usos especficos de las medidas que el test proporciona
Es importante sealar que un instrumento de medicin no tiene un coeficiente fijo de
validez que vaya a servir para cualquier propsito o para cualquier grupo de individuos,
sino que siempre depender de la correcta eleccin del criterio a valorar (variable criterio)
y la muestra seleccionada
Existen diversos tipos de validez, pero estas subdivisiones no constituyen conceptos que
deban ser asumidos como independientes entre s. Los tipos de validez mantienen una
relacin de influencia recproca y conforman las diversas partes de un todo, que es lo que
conocemos de forma genrica como "validez"
Definiciones de validez
As, para Messick (1984, pp. 741), la validez unificada integra consideraciones de
contenido, criterio y consecuencias en un marco de referencia de constructo para la
evaluacin emprica de hiptesis racionales acerca del significado de las puntuaciones y
de relaciones relevantes desde el punto de vista terico, incluyendo las de naturaleza
cientfica y aplicada
Tipos de validez.
Validez de contenido.
Se dice que una prueba o test cumple con las condiciones de validez de contenido si
constituye una muestra adecuada y representativa de los contenidos y alcance
del constructo o dimensin a evaluar. En los casos en los que la materia objeto de
medicin se puede precisar con facilidad, la poblacin de contenidos que se pretende
evaluar est bien definida, por lo que la seleccin de los tems del test no ofrece mayores
dificultades, pudindose recurrir a mtodos estadsticos de muestreo aleatorio para
obtener una muestra representativa de tems
Validez predictiva.
Tambin conocida como validez criterial, validez relativa al criterio o validez de pronstico,
se refiere al grado de eficacia con que se puede predecir o pronosticar una variable de
inters (criterio) a partir de las puntuaciones en un test.
Es frecuente que en los procesos de seleccin de personal se utilicen instrumentos que
pretendan determinar o predecir el rendimiento futuro de los candidatos al puesto de
trabajo basndose en las respuestas obtenidas.
Para ello es necesario que se haya obtenido una evidencia emprica de que los resultados
obtenidos en la prueba correlacionen efectivamente con el rendimiento futuro en el puesto
de trabajo.
As pues, la operacionalizacin del concepto se realiza a partir del
denominado coeficiente de validez, que es la correlacin entre el test y el criterio. A
mayor correlacin, mayor capacidad predictiva del test.
Existen distintos diseos experimentales que permiten determinar esta correlacin.
La eleccin de un diseo u otro depender de las necesidades y circunstancias
especficas de cada caso:
Donde "x" hace referencia a las puntuaciones obtenidas en el test, e "y" hace referencia a
las puntuaciones obtenidas en la variable criterio.
Validez de constructo.
A diferencia de lo que ocurre en otros campos, muchos de los conceptos manejados en el
mbito de la psicologa no son directamente observables, por lo que requieren del apoyo
de medidas indirectas.
Los conceptos de peso o volumen son suficientemente tangibles como para no resultar
susceptibles de interpretaciones subjetivas al respecto de su significado, pero no ocurre lo
mismo en el caso de variables psicolgicas como el neuroticismo o la introversin.
Estos conceptos precisan del acuerdo o consenso sobre sus significados para poder ser
catalogados como tiles y vlidos desde un punto de vista cientfico.
La validez de constructo, pues, hace referencia a la recogida de evidencias empricas que
garanticen la existencia de un constructo psicolgico en las condiciones exigibles a
cualquier otro modelo o teora cientfica.
Por todo ello, la validez de constructo se presenta como una condicin indispensable a la
hora de valorar la eficacia de un instrumento de evaluacin sobre una variable psicolgica
determinada.
Para Messick (1980; p.1015) la validez de constructo es el concepto unificador que integra
las consideraciones de validez de contenido y de criterio en un marco comn para probar
hiptesis acerca de relaciones tericamente relevantes
. Asimismo, Cron Bach (1984; p.126) refiere que la meta final de la validacin es la
explicacin y comprensin, y por tanto, esto nos lleva a considerar que toda validacin es
validacin de constructo.
Los procedimientos metodolgicos ms utilizados para la obtencin de datos referentes a
la validez de constructos psicolgicos han sido el anlisis factorial y la matriz
multirrasgo-multimtodo. Ambos sistemas son indicadores respectivos de las
denominadas "validez factorial" y "validez convergente-discriminante"
Validez factorial] El anlisis factorial es una tcnica del anlisis multivariado que permite
realizar una estimacin de los factores que dan cuenta de una serie de variables.
Se trata de una tcnica de reduccin de datos que permite encontrar grupos homogneos
de variables a partir de un grupo de variables mucho ms numeroso.
Los criterios de formacin de grupos se basan en la necesidad de que las variables a
agrupar correlacionen entre s, y cumplan el requisito de ser independientes.
Es decir, formarn un grupo aquellas variables que, siendo independientes entre s,
muestren un ndice de correlacin elevado.
As, podremos hablar de validez factorial de un constructo en aquellos casos en los que
todas las medidas que se hayan diseado para evaluarlo arrojen resultados similares al
ser sometidas a un anlisis factorial.
Este anlisis puede ser evaluatorio, si se realiza con la intencin de descubrir la posible
estructura subyacente factorial de un conjunto de datos cualesquiera; o confirmatorio, si se
realiza con base en unas expectativas y teoras previas al respecto de esa estructura.
Validez convergente-discriminante
Este tipo de validez se determina a partir de los resultados arrojados por la matriz
multirrasgo-multimtodo (diseo MRMM, sistematizado por Campbell y Fiske en 1959). El
sistema consiste en realizar mediciones de varios rasgos con distintos mtodos de
medicin. De este modo podemos encontrarnos con varios resultados.
El hecho de que un mismo rasgo sea detectado por igual con varias metodologas
diferentes, es un indicador fiable de la existencia real de ese rasgo.
Es decir, las medidas de distintos rasgos por el mismo mtodo muestran una baja
correlacin en comparacin con la que muestran las medidas del mismo rasgo con
diferentes mtodos, seal de que los rasgos son independientes entre s, e
independientes al sistema de medicin empleado.