medición en el proceso de
evaluación psicológica
Calidad
Contenido Formato Administración Calificación Interpretación
psicométrica
Pruebas Psicológicas
¿Qué es un Test
Psicológico?
• “Un test es un procedimiento
sistemático para observar el
comportamiento y describirlo con
la ayuda de escalas numéricas o
categorías fijas” (Cronbach,
1998)
• “En esencia, la prueba
psicológica es una medida
objetiva y estandarizada de una
muestra de conducta” (Anastasi
y Urbina,1998)
Tipos de
Instrumentos
Psicológicos
Inventarios de
Tests de
Personalidad y
Inteligencia/Cognitivos
Psicopatología
Estandarización Confiabilidad
Validez
Preguntas qué debe hacerse el
evaluador:
¿Comprende adecuadamente el
constructo teórico que el test
supuestamente mide?
Orientación ¿Los ítems del test corresponden
Teórica a la descripción teórica del
constructo?
Esta información usualmente se
encuentra en el Manual del test
o en publicaciones científicas
en revistas especializadas
Consideraciones
Prácticas
Preguntas qué debe hacerse el
evaluador:
¿Si la lectura es un requisito para el
examinado, su capacidad coincide con
el nivel requerido por el test?
¿Qué es un Test
estandarizado?
3 preguntas deben ser aclaradas en
relación con las normas de un test:
• ¿El grupo de estandarización es
representativo de la población en la
¿Qué es un Test cual se piensa usar el test?
estandarizado? • ¿El grupo de estandarización es lo
suficientemente grande?
• ¿Tiene el test subgrupos
especializados de normas, así como
normas amplias nacionales?
¿Qué es un Test estandarizado?
Confiabilidad (Kerlinger y Lee, 2000)
• Confiabilidad se refiere a la
proporción de la varianza
total atribuida a la varianza
verdadera. Entre mayor es
la proporción de la
varianza total atribuida a la
verdadera, la prueba es
Confiabilidad más confiable
(Cohen y • Una fuente de error
sistemática no cambia la
Swerdlick, variabilidad de la
distribución ni afecta la
2001) confiabilidad
Características
de los ítems La longitud del
que lo propio test.
configuran.
Variabilidad de
la muestra.
La fiabilidad de un test
depende de factores como:
• Construcción (muestreo de
contenido)
• Administración (temperatura,
iluminación, ventilación, ruido,
incomodidad física,
procedimientos de aplicación
Fuentes de del evaluador, efecto de
error (Cohen y fármacos)
Swerdlick, 2001) • Calificación e interpretación
(el calificador con elementos de
subjetividad en pruebas de
personalidad o inteligencia o en
guías de observación
conductual, así como el sistema
de calificación)
• El propósito de la confiabilidad
es estimar el grado de varianza
en el test debido al error
• 4 métodos principales:
Resultados consistentes al
Confiabilidad volver a evaluar (test-retest)
(Groth-Marnat, Precisión relativa en un
2009) momento dado (formas
alternativas)
Consistencia interna de los
ítems (Alfa Cronbach)
Grado de acuerdo entre dos
evaluadores
En la práctica es imposible que una
medición sea perfecta. Siempre existe un
grado de error asociado a cualquier
medición
Existen varias formas de medir la
confiabilidad. Todas producen coeficientes
de confiabilidad entre 0 y 1.
0 significa nula confiabilidad y 1 representa
el máximo de confiabilidad
Los procedimientos más utilizados para
medir la confiabilidad son 5: Test-retest,
formas alternativas o paralelas, mitades
partidas, coeficiente Alfa de Cronbach y el
coeficiente KR-20
Confiabilidad
Confiabilidad
Se refiere a la
Se mide como la razón representatividad y relevancia
indicada por expertos del instrumento de medición
en relación con el constructo
que se esta midiendo
Validez de Contenido
1. Relevantes: exhaustiva especificación de todas las
posibles conductas o dominios del constructo a medir.
Validez de Criterio
“…la validez unificada integra
consideraciones de contenido, criterio y
consecuencias en un marco de referencia
de constructo para la evaluación empírica
de hipótesis racionales acerca del
significado de las puntuaciones y de
relaciones relevantes desde el punto de
vista teórico, incluyendo las de naturaleza
científica y aplicada” (Messick, pág. 741)
Validez: EVOLUCIÓN
HISTÓRICA:
Según los “Standards for educational and
psychological tests and manuals” (APA,
AERA, NCME, 2014): la validez
tradicionalmente hace referencia al grado en
que se mide aquello que se pretende medir,
pudiéndose diferenciar entre validez de
contenido, de criterio y de constructo→
visión tripartirta predominante
Validez: EVOLUCIÓN
HISTÓRICA:
Messick (1989), amplia el concepto: a) abre el
concepto de medida no limitándolo a las
puntuaciones del test, incluye las puntuaciones
obtenidas en cualquier otro instrumento de
evaluación; b) destaca la importancia de considerar la
utilidad de las decisiones y consecuencias derivadas
del procedimiento de medida, apareciendo el
concepto de validez consecuencial; c) enfoque
integrador del macroconcepto de validez en torno a la
validez de constructo.
Validez: EVOLUCIÓN
HISTÓRICA:
• Ruptura con la visión tripartita
de la validez. La validez de
constructo asume la
relevancia y
representatividad de los
aspectos medidos (v.
contenido) así como las
relaciones con otros criterios
externos de interés (v.
criterio).
Validez de Constructo
Validez de
Constructo
Validez de Constructo
Tipos de evidencia
• Convergente: cuando las puntuaciones en la
prueba sometida a validación de constructo
tienden a correlacionarse altamente en la
dirección predicha con las puntuaciones en
pruebas anteriores, más establecidas y ya
validadas diseñadas para medir el mismo
constructo (o uno similar).
Validez de Constructo
Tipos de evidencia
• Discriminante: cuando
un coeficiente de validez
muestra poca relación
entre puntuaciones de
Validez de prueba y /u otras
Constructo variables con las que las
puntuaciones en la
prueba que se esta
sometiendo a validez de
constructo no debería
correlacionarse desde el
punto de vista teórico.
01 02 03
Se asocia más con lo Un juicio sobre la La simple apariencia
que la prueba parece relevante que parecen de validez no es una
medir que con lo que los reactivos de la base aceptable para
en realidad mide prueba hacer inferencias
interpretativas a partir
de las puntuaciones de
la prueba
Validez aparente
• Disponibilidad comercial
• Existe un manual completo disponible
Criterios • Ha demostrado niveles de confiabilidad y
validez adecuados
para incluir • Es válido para el propósito para el que se
utiliza
pruebas • Se tienen claros los requisitos para poder
utilizarlo
psicológicas • Ha sido sometido a evaluaciones de pares
en ámbito • Están claros los constructos que mide
• Qué tan directamente mide esos
forense constructos
• Requiere un grado aceptable de inferencia
(Ackerman, entre los constructos que evalúa y los
asuntos psicolegales de relevancia
2010) • Incluye medidas del estilo de respuesta
1. ¿Cuál constructo será evaluado?
2. ¿Qué tan directamente evalúa el instrumento el
constructo de interés?
3. ¿Existen métodos alternativos de evaluación
que midan el constructo de interés de forma Factores a
más directa?
4. ¿El uso de este instrumento requiere un nivel
considerer en el
de inferencia inaceptable entre el constructo uso de técnicas
que evalúa y los aspectos psicolegales de
relevancia? de evaluación
5. ¿Está el instrumento publicado psicológica en
comercialmente?
6. ¿Hay disponible un manual de usuario el contexto
completo?
7. ¿Se han demostrado niveles adecuados de
forense
confiabilidad?
8. ¿Se han demostrado niveles de validez
adecuados?
9. ¿Es el instrumento válido para el propósito en
que será utilizado? Melton y otros (2007)
10. ¿Cuáles son las calificaciones necesarias para
usar el instrumento?
11. ¿Ha sido el instrumento sometido a revisión de
pares?
12. ¿Incluye el instrumento medidas del estilo de
respuesta?
Recomienda el uso de
los mejores métodos
disponibles y de su
correcta aplicación e
Recolección y interpretación,
análisis de datos reportando todos los
resultados relevantes
(Ackerman,2010) para el propósito de la
evaluación y al mismo
tiempo evitando ir
“más allá de los
datos” al especular
sobre aspectos para
los cuales no se
cuenta con
información que los
apoye.
Guías para los psicólogos
forenses de la APA (2012)
Los especialistas deben utilizar instrumentos
de evaluación cuya validez y confiabilidad
ha sido establecida para usarse con miembros
de la población evaluada. Cuando esto no ha
sido establecido, se deben considerar y
describir las fortalezas y limitaciones de sus
hallazgos.
• Un estándar de buenas prácticas debe
proporcionar guías sobre los métodos
aceptables. En este sentido, los
evaluadores forenses deben estar
familiarizados con la validez y
confiabilidad de las pruebas e
instrumentos que incluyen en su
estrategia de evaluación. Los expertos
deben conocer los manuales de los tests
que contienen la información sobre las
normas, la confiabilidad y la validez,
así como de la relevancia, las
aplicaciones y las limitaciones de tales
instrumentos de medición.
Estándares de Buenas
Prácticas (Heilbrun,
Grisso & Goldstein (2009)
Estándares para las Pruebas Psicológicas y la
Evaluación (AERA, APA, NCME, 2014.Capítulo 10)
Calificaciones
Interpretación
de los Selección de Administración Seguridad de
de Pruebas
usuarios de Pruebas de Pruebas las Pruebas
Psicológicas
las pruebas Psicológicas Psicológicas Psicológicas
(10.10 al
psicológicas (10.4 al 10.6) (10.7 al 10.9) (10.18)
10.17)
(10.1 al 10.3)
DIRECTRICES INTERNACIONALES
PARA EL
USO DE LOS TESTS
• http://www.intestcom.org/page/17
Objetivo
El objetivo fundamental de las directrices es mejorar el uso de los tests,
describiendo la forma adecuada de utilizarlos.
Un usuario competente utilizará los tests de forma adecuada, profesional y
ética, prestando la debida atención a las necesidades y derechos de las
personas implicadas en el proceso de evaluación, y teniendo muy en cuenta las
razones para utilizar los tests, así como el contexto en el cual se lleva a cabo su
aplicación. Este objetivo se alcanzará asegurándose de que el usuario de los
tests tiene las competencias y conocimientos necesarios para llevar a cabo el
proceso evaluativo.
• 1. Uso ético de los tests
• 1.1 Actuar de forma ética y profesional
• 1.2. Asegurarse de que son competentes para el uso de los
tests
• 1.3. Responsabilizarse del uso que hacen de los tests
• 1.4. Asegurarse de que los materiales del test están seguros
• 1.5. Asegurarse de que los resultados de los tests se tratan
confidencialmente
• 2. Utilización adecuada de los tests
• Consideraciones de validez
facial:
Se le debe dar mucha
importancia a los distintos
métodos disponibles en
términos de cuanto facilitan a
los usuarios legales la
comprensión de las bases para
realizar las inferencias clínicas
y sus opiniones.
La naturaleza adversarial del campo de trabajo
forense requiere de profesionales competentes
en modelos de evaluación que cuenten con los
mejores estándares a nivel científico.