Anda di halaman 1dari 55

El uso de instrumentos de

medición en el proceso de
evaluación psicológica

M.SC. CARLOS SABORÍO VALVERDE


Pueden diferir
en:

Calidad
Contenido Formato Administración Calificación Interpretación
psicométrica

Pruebas Psicológicas
¿Qué es un Test
Psicológico?
• “Un test es un procedimiento
sistemático para observar el
comportamiento y describirlo con
la ayuda de escalas numéricas o
categorías fijas” (Cronbach,
1998)
• “En esencia, la prueba
psicológica es una medida
objetiva y estandarizada de una
muestra de conducta” (Anastasi
y Urbina,1998)
Tipos de
Instrumentos
Psicológicos

Inventarios de
Tests de
Personalidad y
Inteligencia/Cognitivos
Psicopatología

Tests de habilidades o Baterías de


constructos evaluación
específicos neuropsicológica

Listas de Chequeo de Entrevistas semi-


constructos estructuradas /
específicos estructuradas
¿Por qué usar este
instrumento o método en
particular?
¿Hay algún lineamiento
relevante publicado para el
uso de esta prueba?
Solidez ¿Es confiable este
Psicométrica de instrumento?
las Pruebas ¿Este instrumento es válido?
¿Qué inferencias pueden
hacerse en forma razonable a
partir de la puntuación de
esta prueba y qué tan
generalizables son los
resultados?
¿Cómo evaluar un Test
Psicológico?

“Una puntuación incorrecta es peor que no tener ninguna


puntuación; si no se puede encontrar algún test adecuado, el
informe correcto es “no se pudo obtener ninguna puntuación””
(Cronbach, 1998)
Se debe investigar y comprender: (Groth-Marnat, 2009)

La orientación Teórica Aspectos prácticos

Estandarización Confiabilidad

Validez
Preguntas qué debe hacerse el
evaluador:
¿Comprende adecuadamente el
constructo teórico que el test
supuestamente mide?
Orientación ¿Los ítems del test corresponden
Teórica a la descripción teórica del
constructo?
Esta información usualmente se
encuentra en el Manual del test
o en publicaciones científicas
en revistas especializadas
Consideraciones
Prácticas
Preguntas qué debe hacerse el
evaluador:
¿Si la lectura es un requisito para el
examinado, su capacidad coincide con
el nivel requerido por el test?

¿Qué tan apropiada es la extensión del


test?
¿Qué es un Test estandarizado?
• Todos los sujetos que aplican el test lo hacen bajo las
mismas condiciones
❑Un conjunto estandarizado de preguntas o
estímulos
❑Son presentados bajo condiciones estandarizadas
❑Las respuestas del sujeto se recopilan de una
forma estandarizada
❑Estas se puntúan e interpretan de acuerdo a
normas o criterios estandarizados
Cada test tiene normas que reflejan la
distribución de puntajes en la muestra de
estandarización
Los puntajes específicos de un sujeto tienen
sentido si existe similitud entre él y la muestra
de estandarización
Entre menos similar el sujeto específico a la
muestra de estandarización, mucho menor es la
utilidad del test para su evaluación

¿Qué es un Test
estandarizado?
3 preguntas deben ser aclaradas en
relación con las normas de un test:
• ¿El grupo de estandarización es
representativo de la población en la
¿Qué es un Test cual se piensa usar el test?
estandarizado? • ¿El grupo de estandarización es lo
suficientemente grande?
• ¿Tiene el test subgrupos
especializados de normas, así como
normas amplias nacionales?
¿Qué es un Test estandarizado?
Confiabilidad (Kerlinger y Lee, 2000)

• La confiabilidad es la carencia de distorsión o la precisión de un instrumento de


medición
• Tiene que ver con la precisión con la que un instrumento mide lo que dice
medir
• Es el grado en que su aplicación repetida al mismo sujeto produce resultados
similares
• Algunos sinónimos son: consistencia, estabilidad, reproducibilidad, carencia de
distorsión, predictibilidad
• Que un instrumento sea confiable solamente significa que esta midiendo algo
de forma precisa o consistente
Confiabilidad (Groth-Marnat, 1999)

• Al concepto de confiabilidad le subyace el de rango posible de error o error de


medición de un puntaje determinado
• Es un estimado del rango de posible fluctuación aleatoria que puede ser
esperada en un puntaje individual
• Es importante señalar que cierto grado de error siempre va a estar presente en
la medición
• Inevitable y natural variabilidad en la ejecución humana
• Muchos constructos en psicología son medidos de forma indirecta
(inferencia)
X=T+E

• Confiabilidad se refiere a la
proporción de la varianza
total atribuida a la varianza
verdadera. Entre mayor es
la proporción de la
varianza total atribuida a la
verdadera, la prueba es
Confiabilidad más confiable
(Cohen y • Una fuente de error
sistemática no cambia la
Swerdlick, variabilidad de la
distribución ni afecta la
2001) confiabilidad
Características
de los ítems La longitud del
que lo propio test.
configuran.

Variabilidad de
la muestra.

La fiabilidad de un test
depende de factores como:
• Construcción (muestreo de
contenido)
• Administración (temperatura,
iluminación, ventilación, ruido,
incomodidad física,
procedimientos de aplicación
Fuentes de del evaluador, efecto de
error (Cohen y fármacos)
Swerdlick, 2001) • Calificación e interpretación
(el calificador con elementos de
subjetividad en pruebas de
personalidad o inteligencia o en
guías de observación
conductual, así como el sistema
de calificación)
• El propósito de la confiabilidad
es estimar el grado de varianza
en el test debido al error
• 4 métodos principales:
Resultados consistentes al
Confiabilidad volver a evaluar (test-retest)
(Groth-Marnat, Precisión relativa en un
2009) momento dado (formas
alternativas)
Consistencia interna de los
ítems (Alfa Cronbach)
Grado de acuerdo entre dos
evaluadores
En la práctica es imposible que una
medición sea perfecta. Siempre existe un
grado de error asociado a cualquier
medición
Existen varias formas de medir la
confiabilidad. Todas producen coeficientes
de confiabilidad entre 0 y 1.
0 significa nula confiabilidad y 1 representa
el máximo de confiabilidad
Los procedimientos más utilizados para
medir la confiabilidad son 5: Test-retest,
formas alternativas o paralelas, mitades
partidas, coeficiente Alfa de Cronbach y el
coeficiente KR-20

Confiabilidad
Confiabilidad

1. Estabilidad / Test-retest: un mismo instrumento


de medición es aplicado 2 o más veces a un
mismo grupo de personas, luego de cierto período
(análisis de correlación) Para medir constructos
relativamente estables en el tiempo.
2. Formas alternativas/paralelas: se administran
2 versiones equivalentes del instrumento a un
mismo grupos de personas en un período de
tiempo corto (correlación)
3. Mitades partidas: requiere una sola aplicación
de la medición. Los ítems se dividen en 2 mitades
y se correlacionan. Entre más ítems mayor
confiabilidad
Confiabilidad

Consistencia interna o entre reactivos: homogeneidad, unifactorialidad


• 4. Alfa de Cronbach: una sola administración del instrumento (reactivos
dicotómicos o tipo Likert)
• 5. Coeficiente KR-20: similar al coeficiente alfa, especial para reactivos
dicotómicos

• Confiabilidad entre evaluadores: grado de acuerdo o consistencia que existe


entre dos o más evaluadores. Se utiliza la correlación y el coeficiente Kappa
(escalas nominales)
Permite estimar el rango de puntuación verdadera (se
hace la suposición de que el individuo fuera a presentar
una gran cantidad de pruebas equivalentes).

El error estándar de medición es una forma de expresar


la confiabilidad de la prueba.

Es útil para establecer el intervalo de confianza.

Confiabilidad (Error de medición


estándar) σ meas = σ √1-r
Validez
• Es el grado en que un instrumento realmente
mide lo que pretende medir.
• Establecer la validez de un test es algo
extremadamente difícil debido al tipo de
conceptos abstractos como ansiedad,
inteligencia, personalidad.
• No tienen una realidad tangible, lo que hace
necesaria la inferencia.
• La validez es un juicio basado en evidencia
sobre lo apropiado de las inferencias
extraídas de las puntuaciones de la prueba.
• Además, la validación de tests requiere un
proceso de continuo refinamiento.
Validez
No hay un solo tipo de validez
Se pueden tener 3 tipos de
evidencia:
Relacionada con el
contenido
Relacionada con el criterio
Relacionada con el
constructo
No son mutuamente excluyentes.
No siempre se necesita conocer los
3 tipos
El grado en que un
instrumento refleja un dominio El grado en que la medición
específico de contenido de lo representa el concepto medido
que se pretende medir

Se refiere a la
Se mide como la razón representatividad y relevancia
indicada por expertos del instrumento de medición
en relación con el constructo
que se esta midiendo

Validez de Contenido
1. Relevantes: exhaustiva especificación de todas las
posibles conductas o dominios del constructo a medir.

2. Representativos: que todas las posibles conductas estén


recogidas en el test.

Distinción artificial entre Validez de Contenido y de


Constructo, ya que en el momento en que se definen los
dominios a medir, estaremos delimitando también el
constructo

Validez de Contenido: se analiza hasta


qué punto los elementos de un test son:
Es un juicio respecto a lo adecuado que puede ser el uso de una
puntuación de prueba para inferir la posición más probable del individuo en
una medida de interés (criterio)

Establece la validez de un instrumento comparándolo con algún criterio


externo

Validez concurrente (correlaciona con el criterio en el mismo momento)

Validez predictiva (el criterio se fija en el futuro)

Validez de Criterio
“…la validez unificada integra
consideraciones de contenido, criterio y
consecuencias en un marco de referencia
de constructo para la evaluación empírica
de hipótesis racionales acerca del
significado de las puntuaciones y de
relaciones relevantes desde el punto de
vista teórico, incluyendo las de naturaleza
científica y aplicada” (Messick, pág. 741)

Validez: EVOLUCIÓN
HISTÓRICA:
Según los “Standards for educational and
psychological tests and manuals” (APA,
AERA, NCME, 2014): la validez
tradicionalmente hace referencia al grado en
que se mide aquello que se pretende medir,
pudiéndose diferenciar entre validez de
contenido, de criterio y de constructo→
visión tripartirta predominante

Validez: EVOLUCIÓN
HISTÓRICA:
Messick (1989), amplia el concepto: a) abre el
concepto de medida no limitándolo a las
puntuaciones del test, incluye las puntuaciones
obtenidas en cualquier otro instrumento de
evaluación; b) destaca la importancia de considerar la
utilidad de las decisiones y consecuencias derivadas
del procedimiento de medida, apareciendo el
concepto de validez consecuencial; c) enfoque
integrador del macroconcepto de validez en torno a la
validez de constructo.

Validez: EVOLUCIÓN
HISTÓRICA:
• Ruptura con la visión tripartita
de la validez. La validez de
constructo asume la
relevancia y
representatividad de los
aspectos medidos (v.
contenido) así como las
relaciones con otros criterios
externos de interés (v.
criterio).

Validez: • Entendemos la validez como


concepto unitario donde la
Principal Validez de constructo es el
aspecto central donde
aportación de convergen criterios científicos
(representatividad y utilidad)
Messick (1994) y valores sociales
(consecuencias de la
aplicación de la medida).
Validez
• En Teoría de tests, la validez, hace referencia a la
adecuación de las inferencias realizadas a partir
de las puntuaciones del test
• Validación; proceso mediante el cual el constructor, o
el usuario de los tests, recoge la evidencia empírica
necesaria para apoyar las inferencias que se van a
realizar; entendiendo por evidencia tanto los datos,
observaciones y hechos, como los argumentos que
permitan apoyar y sustentar esos hechos.
• Según los estándares (2014), vamos a entender:
La validez como un concepto unitario
La validación como un proceso continuo que permitirá
recoger evidencias sobre la adecuación de las inferencias

- Distintos “tipos de validez”, se sustituye por


“distintas estrategias para obtener evidencias de
validez”
Es probablemente la más importante desde una perspectiva científica

Un juicio de lo apropiado de las inferencias extraídas de las puntuaciones


de prueba respecto a posiciones individuales en una variable llamada
“constructo”.

Es el grado en el que puede afirmarse que el instrumento mide un


constructo o rasgo teórico (Anastasi y Urbina, 1998)

Es el grado en que una medida se relaciona consistentemente con otras


mediciones de acuerdo con hipótesis derivadas teóricamente

Validez de Constructo
Validez de
Constructo

• Las puntuaciones del test no son el


constructo. El constructo puede
manifestarse a través de múltiples
indicadores. Por ello, mediante la
Validez de Constructo se acumulan
evidencias que apoyan que las
puntuaciones del test son una de sus
posibles manifestaciones.
• La prueba es homogénea
• Puntuaciones se correlacionan con otras
puntuaciones en otras pruebas de acuerdo con lo
que se predeciría a partir de una teoría que abarca
la manifestación del constructo
Tipos de • Las puntuaciones se incrementan o disminuyen
como función de la edad o del paso del tiempo
evidencia como se predijo teóricamente
• Puntuaciones de postprueba difieren como se
predijo desde un punto de vista teórico
• Las puntuaciones de prueba obtenidas por
personas de grupos distintos varían como lo
predijo la teoría

Validez de Constructo
Tipos de evidencia
• Convergente: cuando las puntuaciones en la
prueba sometida a validación de constructo
tienden a correlacionarse altamente en la
dirección predicha con las puntuaciones en
pruebas anteriores, más establecidas y ya
validadas diseñadas para medir el mismo
constructo (o uno similar).

Validez de Constructo
Tipos de evidencia
• Discriminante: cuando
un coeficiente de validez
muestra poca relación
entre puntuaciones de
Validez de prueba y /u otras
Constructo variables con las que las
puntuaciones en la
prueba que se esta
sometiendo a validez de
constructo no debería
correlacionarse desde el
punto de vista teórico.
01 02 03
Se asocia más con lo Un juicio sobre la La simple apariencia
que la prueba parece relevante que parecen de validez no es una
medir que con lo que los reactivos de la base aceptable para
en realidad mide prueba hacer inferencias
interpretativas a partir
de las puntuaciones de
la prueba

Validez aparente
• Disponibilidad comercial
• Existe un manual completo disponible
Criterios • Ha demostrado niveles de confiabilidad y
validez adecuados
para incluir • Es válido para el propósito para el que se
utiliza
pruebas • Se tienen claros los requisitos para poder
utilizarlo
psicológicas • Ha sido sometido a evaluaciones de pares
en ámbito • Están claros los constructos que mide
• Qué tan directamente mide esos
forense constructos
• Requiere un grado aceptable de inferencia
(Ackerman, entre los constructos que evalúa y los
asuntos psicolegales de relevancia
2010) • Incluye medidas del estilo de respuesta
1. ¿Cuál constructo será evaluado?
2. ¿Qué tan directamente evalúa el instrumento el
constructo de interés?
3. ¿Existen métodos alternativos de evaluación
que midan el constructo de interés de forma Factores a
más directa?
4. ¿El uso de este instrumento requiere un nivel
considerer en el
de inferencia inaceptable entre el constructo uso de técnicas
que evalúa y los aspectos psicolegales de
relevancia? de evaluación
5. ¿Está el instrumento publicado psicológica en
comercialmente?
6. ¿Hay disponible un manual de usuario el contexto
completo?
7. ¿Se han demostrado niveles adecuados de
forense
confiabilidad?
8. ¿Se han demostrado niveles de validez
adecuados?
9. ¿Es el instrumento válido para el propósito en
que será utilizado? Melton y otros (2007)
10. ¿Cuáles son las calificaciones necesarias para
usar el instrumento?
11. ¿Ha sido el instrumento sometido a revisión de
pares?
12. ¿Incluye el instrumento medidas del estilo de
respuesta?
Recomienda el uso de
los mejores métodos
disponibles y de su
correcta aplicación e
Recolección y interpretación,
análisis de datos reportando todos los
resultados relevantes
(Ackerman,2010) para el propósito de la
evaluación y al mismo
tiempo evitando ir
“más allá de los
datos” al especular
sobre aspectos para
los cuales no se
cuenta con
información que los
apoye.
Guías para los psicólogos
forenses de la APA (2012)
Los especialistas deben utilizar instrumentos
de evaluación cuya validez y confiabilidad
ha sido establecida para usarse con miembros
de la población evaluada. Cuando esto no ha
sido establecido, se deben considerar y
describir las fortalezas y limitaciones de sus
hallazgos.
• Un estándar de buenas prácticas debe
proporcionar guías sobre los métodos
aceptables. En este sentido, los
evaluadores forenses deben estar
familiarizados con la validez y
confiabilidad de las pruebas e
instrumentos que incluyen en su
estrategia de evaluación. Los expertos
deben conocer los manuales de los tests
que contienen la información sobre las
normas, la confiabilidad y la validez,
así como de la relevancia, las
aplicaciones y las limitaciones de tales
instrumentos de medición.

Estándares de Buenas
Prácticas (Heilbrun,
Grisso & Goldstein (2009)
Estándares para las Pruebas Psicológicas y la
Evaluación (AERA, APA, NCME, 2014.Capítulo 10)

Calificaciones
Interpretación
de los Selección de Administración Seguridad de
de Pruebas
usuarios de Pruebas de Pruebas las Pruebas
Psicológicas
las pruebas Psicológicas Psicológicas Psicológicas
(10.10 al
psicológicas (10.4 al 10.6) (10.7 al 10.9) (10.18)
10.17)
(10.1 al 10.3)
DIRECTRICES INTERNACIONALES
PARA EL
USO DE LOS TESTS

• http://www.intestcom.org/page/17
Objetivo
El objetivo fundamental de las directrices es mejorar el uso de los tests,
describiendo la forma adecuada de utilizarlos.
Un usuario competente utilizará los tests de forma adecuada, profesional y
ética, prestando la debida atención a las necesidades y derechos de las
personas implicadas en el proceso de evaluación, y teniendo muy en cuenta las
razones para utilizar los tests, así como el contexto en el cual se lleva a cabo su
aplicación. Este objetivo se alcanzará asegurándose de que el usuario de los
tests tiene las competencias y conocimientos necesarios para llevar a cabo el
proceso evaluativo.
• 1. Uso ético de los tests
• 1.1 Actuar de forma ética y profesional
• 1.2. Asegurarse de que son competentes para el uso de los
tests
• 1.3. Responsabilizarse del uso que hacen de los tests
• 1.4. Asegurarse de que los materiales del test están seguros
• 1.5. Asegurarse de que los resultados de los tests se tratan
confidencialmente
• 2. Utilización adecuada de los tests

Directrices de la • 2.1. Estimar la utilidad potencial de los tests en una situación


evaluativa

ITC (2013) 2.2. Elegir tests técnicamente correctos y adecuados a cada
situación
• 2.3. Prestar atención a los aspectos relacionados con el sesgo
de los tests
• 2.4. Hacer los preparativos necesarios para la aplicación del
test
• 2.5. Aplicar los tests adecuadamente
• 2.6. Puntuar y analizar los resultados de los tests con precisión
• 2.7. Interpretar los resultados adecuadamente
• 2.8. Comunicar los resultados de forma clara y precisa
• 2.9. Revisión de la adecuación del test y de su uso
Las pruebas psicológicas generales no se desarrollaron
con preguntas forenses específicas en mente, así que
siempre hay un salto inferencial involucrado en la
interpretación de las pruebas psicológicas generales
para responder preguntas forenses.

De esta forma, el evaluador debe considerar


cuidadosamente qué tipo de información se puede
extraer de resultados de las pruebas psicológicas y
cómo esta información se aplica a la pregunta forense
específica del caso particular.

Alcance de pruebas clínicas en


el ámbito forense (Witt,2010)
Alcances de los instrumentos
(Otto y otros, 2014)
Los resultados de los tests psicológicos y de los
instrumentos de evaluación forense no se traducen
directamente en opinions psicolegales.

Los tests deben ser entendidos como herramientas


para reunir datos y generar hipótesis. No proporcionan
conclusiones sobre asuntos psicolegales.

Se debe presentar la discusión de los resultados de


los instrumentos de forma que refleje su peso real en
el proceso de toma de decisiones.
Categorías de instrumentos psicológicos desde
una perspectiva forense (Heilbrun, Rogers y
Otto, 2002)
Instrumentos de Evaluación Clínica (IEC): las pruebas
psicológicas y las mediciones desarrolladas para la
evaluación, diagnóstico y planeamiento de tratamiento con
poblaciones clínicas en contextos terapéuticos

Instrumentos Forenses Relevantes (IFR): se centran en


constructos clínicos que son a menudo relevantes en la
evaluación de una persona dentro del sistema legal

Instrumentos de Evaluación Forense (IEF): mediciones


directamente relevantes a un estándar legal específico
Cuestionamientos específicos en torno al uso
de pruebas psicológicas en el contexto
evaluativo forense (Melton y otros, 2007)

• Relevancia para la pregunta


legal específica:
Si la prueba le informa al
evaluador únicamente acerca de
diagnósticos o de niveles
generales de funcionamiento y va
a permitir solamente inferencias
especulativas acerca del
comportamiento legalmente
relevante, el evaluador debe
considerar si existe alguna otra
forma más directa de enfrentar
este problema.
Cuestionamientos específicos en torno al uso
de pruebas psicológicas en el contexto
evaluativo forense (Melton y otros, 2007)

• Naturaleza hipotética de los


resultados de las pruebas
psicológicas:
Los resultados obtenidos en pruebas
psicológicas deberían ser
considerados mejor como hipótesis
acerca de la naturaleza de los
trastornos psicológicos, personalidad
o funcionamiento conductual del
evaluado. En la ausencia de
evidencia que corrobore las
hipótesis, el evaluador forense debe
ser precavido en relación con las
conclusiones acerca de tendencias
sugeridas por los tests.
Cuestionamientos específicos en torno al uso
de pruebas psicológicas en el contexto
evaluativo forense (Melton y otros, 2007)

• Limitaciones de los contextos


reconstruidos:
Las pruebas psicológicas
convencionales tienen menos
utilidad en las evaluaciones
reconstructivas, que en las que el
foco de la evaluación es el estado
mental actual. Esto a pesar de la
estabilidad en la manifestación del
funcionamiento cognitivo,
emocional o conductual.
Cuestionamientos específicos en torno al uso
de pruebas psicológicas en el contexto
evaluativo forense (Melton y otros, 2007)

• Consideraciones de validez
facial:
Se le debe dar mucha
importancia a los distintos
métodos disponibles en
términos de cuanto facilitan a
los usuarios legales la
comprensión de las bases para
realizar las inferencias clínicas
y sus opiniones.
La naturaleza adversarial del campo de trabajo
forense requiere de profesionales competentes
en modelos de evaluación que cuenten con los
mejores estándares a nivel científico.

Es necesario entonces desarrollar un enfoque


Reflexión especializado forense que garantice la utilización
correcta de instrumentos de evaluación, tomando
en cuenta la necesidad de incorporar información
final de terceras fuentes y descartando actitudes que
invaliden los resultados de los instrumentos.

Finalmente, es fundamental entender las


limitaciones que instrumentos de naturaleza
clínica tienen para abordar asuntos estrictamente
psicolegales.

Anda mungkin juga menyukai