Anda di halaman 1dari 17

Universidad Arturo Michelena

Escuela de Psicologa
Ctedra de Tcnicas Psicomtricas I

MTODOS
PRCTICOS
PARA ESTIMAR LA
CONFIABILIDAD
Lic. Miguel Bastidas
Fecha: Abril 2015

TEST- RETEST
Aplicar el mismo instrumento por segunda ocasin.
Rtt= correlacin entre los resultados de la misma persona en 2 aplicaciones de la prueba.
Muestra el grado en el que los resultados de una prueba pueden generalizarse en otras
ocasiones.
> rtt, < susceptible son los resultados a cambios fortuitos.
Intervalo= corto de tiempo; depende de la variable que se pretende medir y de los sujetos
examinados (Etapas evolutivas).

Mide= Estabilidad temporal del PV- Predice el comportamiento futuro.

Fluctuaciones aleatorias (largo alcance) = reducirse espuriamente.


Memoria (Corto alcance) = incrementarse espuriamente.
Varianza verdadera
Efectos de aplicacin
Adivinacin
Falta de acuerdo entre los calificadores o evaluadores.

TEST- RETEST
Desventajas
Rtt restringido a cambios al azar de corto alcance
Practica produce grados de mejora
Efectos de la memoria: intervalos corto, mayor recuerdo, resultados no independientes, rtt
elevada y falsa.
Varianza Verdadera tratada como Varianza de error
Varianza resultante de las fluctuaciones de los PV. El resultado ser una subestimacin de la
rtt del test y sobreestimacin de los errores.

Varianza de error tratada como varianza verdadera


Varianza resultante de la memoria tratada como varianza verdadera. El resultado ser una
sobreestimacin de la rtt del test y subestimacin de los errores.
Si los factores de la aplicacin del test afectan las ejecuciones de los individuos en una ocasin
dada, sin aparecer sistemticamente en la ocasin del re-test, este efecto dar una 2 .
Si uno de los factores de la aplicacin del test, se repite sistemticamente, el resultado puede
ser una 2 ilusoria (efecto de la memoria).

TEST -PARALELOS
Se construyen 2 test tratando de satisfacer lo mejor posible las condiciones de estricto
paralelismo. El rtt es llamado coeficiente de equivalencia.
Rtt= correlacin entre las puntuaciones de las 2 formas. Correlacin entre las 2 versiones.
Intervalo= corto o largo. Si hay tiempo entre las aplicaciones rtt por cambios en el PV.
Mide= estabilidad temporal y consistencia de las respuestas a las diferentes muestra de tems.
Informacin sobre el Paralelismo y equivalencia= n de reactivos, = forma de expresarse, =
contenido, = alcance y dificultad.
PP
Mayor
Ventaja
T-RT
rtt
Facilita la aplicacin de la misma prueba al mismo Ss.
PPT
Menor
No afecta memoria.
Recomendada en test de velocidad
Desventaja
Efecto del primer test sobre el segundo el uso de formas alternas reduce pero no elimina
el efecto de la prctica.
Difcil construccin de un test equivalente grado en el que la naturaleza de la prueba
cambia con la repeticin.

TEST -PARALELOS

=
Aplicacin
Adivinacin
Calificacin

Fluctuaciones (corto intervalo)


+ fluctuaciones en el desempeo (da informacin de la equivalencia, paralelismo y
estabilidad temporal)
- efecto de la memoria, no fluctuaciones del PV.

Fluctuaciones (Largo Intervalo)


+ Fluctuaciones temporales (informacin equivalencia y paralelismo)
+ No efecto de la memoria
+ informacin de la respuesta de los sujetos a los diferentes reactivos
- fluctuaciones del PV
Costosas en tiempo y dinero.
Muestreo de contenido= en que medida los resultados de la prueba dependen de los
factores especficos de la seleccin de reactivos particulares.

DIVISIN POR MITADES


Mediante diversos procedimientos es posible obtener una medida de rtt a partir de una nica
aplicacin de la prueba ya que al dividirla en mitades equivalentes. Se obtienen 2
puntuaciones de cada persona.
rtt= se obtienen mitades paralelas de una misma prueba y se calcula la correlacin entre ellas.
Se dividen en: Pares e impares- Divisin intencionada.
Cada mitad debe ser equivalente en contenido y dificultad.
Afectada por la cantidad de tems > tems, > rtt
Mide= coeficiente de precisin
Informacin= paralelismo equivalencia entre las pruebas (= contenido, = dificultad)

Ventaja
Eficiente en cuanto a costo y tiempo
Desventaja
No da informacin de la estabilidad temporal.

DIVISIN POR MITADES


Formula Spearman- Brown

= 1+ correccin del rtt


Cuando se aplica el coeficiente de divisin por mitades, la formula requiere que se duplique
la longitud o tamao de la prueba (+ tems)
Procedimiento para estimar el coeficiente de precisin de un test.
Los tems deben ser homogneos. Cada tem debe medir la misma clase de puntaje
verdadero. contenido.

=
1 + 1

KUDER-RICHARDSON
Un test se encuentra conformado por tantos test paralelos como tems tenga. Cada tem es
tratado como un test paralelo.
Supone que todos los tems tienen = X y S
Rtt= la correlacin entre 1 tem y su tem paralelo da la rtt de 1 solo tem.
Spearman Brown= se usa para estimar la rtt de un test compuesto de n tems.
Caracterstica
Coeficiente de consistencia interna
Da la mejor rtt expresada como test paralelos al azar
Proporcin de la 2 determinada por el tamao de los trminos de covarianza para un n
dado de tems.
> homogneos, > rtt
Requiere de 1 sola aplicacin
Cada tem = frecuencia correcta e intercorrelacin con otros tems.
=
Muestreo de contenido
heterogeneidad

Desventaja
Inadecuado para pruebas de velocidad

ALFA DE CROMBACH
Confiabilidad por CONSISTENCIA INTERNA DE LA PRUEBA
Cronbach (1951) la magnitud en que los tems de un test estn correlacionados calculando el
promedio de las correlaciones entre los reactivos que forman un instrumento (citado en
Oviedo y Campo, 2005).
Magnusson (2005) reporta que ste ndice se refiere al grado en que los diferentes tems de un
instrumento covaran estadsticamente e indica cmo se relacionan entre s. Asimismo,
Cervantes (2005) comenta que permite observar la intercorrelacin entre los distintos
componentes de un instrumento, es decir, la estimacin de la equivalencia de los reactivos
entre s.
Los valores de este coeficiente varan entre 0 a 1, siendo los valores ms cercanos a 1
indicadores de un alto grado de consistencia interna (Magnusson, 2011). El clculo de este
coeficiente proporciona informacin sobre qu reactivo se comporta de manera inconsistente
y produce un valor ms bajo de confiabilidad que el que se esperara si se eliminara del test
(Aragn, 2011).

ALFA DE CROMBACH
Oviedo y Campo (2005)
Interpretacin
valor mnimo aceptable = 0,70. Menor = baja consistencia.
Valor mximo aceptable = 0,90. Mayor =Sobreestimacin.
Aceptable = 0,80-0,90.
=
Adivinacin
Aplicacin
Velocidad
Cantidad de tem
El muestreo de contenido
La heterogeneidad de la conducta muestreada.
< homogeneidad < consistencia entre reactivo.

Oviedo y Campo (2005) representa una propiedad inherente del patrn de respuesta de
alguna poblacin estudiada, no es un rasgo de una escala en s misma por lo que puede
variar en funcin al grupo al que se le aplique el instrumento.

ALFA DE CROMBACH
Rtt= correlacin entre todos los tems del test o el promedio de todas las posibles divisiones
por mitades.
Se toma cada tem como un test paralelo.
Se calcula la rtt entre tems.
Si rtt es alto no se garantiza que sea homogneos.
Mide= Homogeneidad de los tems o consistencia interna del test.
Promedio de rxy de todos los tems
Es mas estable que el K-R
La heterogeneidad es mala o buena dependiendo del constructo.
Heterogneo CI- Personalidad
Homogneo Calculo-Parcial
Consideraciones Importantes
Es indicador de la unidimensionalidad del test, pero se requiere verificar la estructura
factorial de la prueba.
Practicidad 1 sola aplicacin.

Homogeneidad de la muestra
Anastasi y Urbina (1998) sealan que una de las fuentes de varianza de error de la
confiabilidad es la heterogeneidad del rea muestreada.
A mayor heterogeneidad, menor rtt
A mayor homogeneidad, mayor rtt
Si un test mide diversos constructos psicolgicos o aspectos del
comportamiento menor ser su rtt
Si un test mide un solo constructo psicolgico o aspecto del comportamiento
mayor ser su rtt

CONFIABILIDAD ENTRE JUECES


Grado de acuerdo o consistencia que existe entre dos o mas evaluadores.
Rxy= coeficiente de correlacin entre las puntuaciones asignadas por cada experto.
Kappa
Theta
Interpretacin= Proporciona informacin del error como resultado de la calificacin de
la prueba.
Significancia estadstica <0,10 o 0,05
=
Aplicacin
Adivinacin
Subjetividad

De acuerdo a Viera y Garrett (2005), a travs del estadstico Kappa, se


puede medir la confiabilidad entre observadores en situaciones donde dos jueces
independientes estn evaluando el mismo instrumento. En la tabla 1 se puede
apreciar la interpretacin estandarizada de este ndice estadstico. Los autores
reportan que se puede utilizar un Kappa por encima de 0,57.

Kappa

Interpretacin-Grado de acuerdo

<0

Pobre Acuerdo

0,01-0,2

Escaso acuerdo

0,21-0,4

Acuerdo justo

0,4-0,6

Acuerdo Moderado

0,61-0,80

Acuerdo considerable

0,81-0,99

Acuerdo cas perfecto

Acuerdo Perfecto

Interpretacin
Mnimo= 0,60
Investigacin= 0,70-0,80
Toma de decisiones >0,90.

Anda mungkin juga menyukai