Anda di halaman 1dari 3

Fundamentos de la teora de la puntuacin de prueba

La Teora Clsica de la puntuacin de prueba supone que cada persona podra obtener una calificacin real si no hubiera errores de medicin. Sin embargo, ya que los instrumentos de medicin son imperfectos, la puntuacin observada para cada persona casi siempre difiere de la capacidad real o caracterstica de la persona. La diferencia entre la puntuacin real y la observada resulta del error de medicin. Una suposicin importante en la teora clsica de las pruebas es que los errores de medicin son aleatorios. Aunque los errores sistemticos son considerados en la mayor parte de los problemas de medicin, es menos probable que estos obliguen al investigador a llegar a conclusiones errneas. La teora bsica del muestreo indica que la distribucin de los errores aleatorios tiene forma de campana. Por lo tanto, el centro de la distribucin debera representar la puntuacin real y la dispersin con respecto a la media de la distribucin mostrara la distribucin de los errores de muestreo. Tericamente la desviacin estndar de la distribucin de errores de cada persona nos habla de la magnitud del error de medicin. Ya que por lo general suponemos que la distribucin de errores aleatorios ser la misma para todas las personas, la teora clsica de las pruebas usa la desviacin estndar de errores como la medida de error bsica. Por lo regular, a esto s ele llama error estndar de medicin. El error estndar de medicin nos dice respecto del promedio que tanto vara una puntuacin a partir de la puntuacin verdadera.

Modelo de muestreo de dominio

La medicin considerada en el modelo de muestreo del dominio es el error que se introduce al usar una muestra de reactivos en vez del dominio completo. Conforme la muestra es ms grande representa al dominio de manera cada vez ms precisa. Como resultado a mayor cantidad de reactivos, mayor confiabilidad. Cuando se elaboran pruebas, cada reactivo es una muestra de la capacidad o la conducta a ser medida. Las pruebas largas tienen muchas de estas muestras y las pruebas cortas tienen algunas. Sin embargo, cada reactivo debera representar igualmente la capacidad estudiada. La confiabilidad puede estimarse a partir de la correlacin de prueba observada con la puntuacin verdadera. Esta sera fcil de encontrar si pudieran obtenerse las puntuaciones reales. Sin embargo obtener las puntuaciones reales no es prctico y rara vez es posible.

Ya que las puntuaciones verdaderas no estn disponibles, la nica alternativa es estimar cuales seran. Dado que los reactivos se obtienen aleatoriamente de un dominio determinado, cada prueba o grupo de reactivos debera producir un estimado objetivo o imparcial de la puntuacin verdadera. Debido al error de muestreo, sin embargo, diferentes muestras aleatorias de reactivos podran producir diferentes estimaciones de la puntuacin verdadera. La distribucin de estos estimados debera distribuirse aleatoria y normalmente. Si creamos muchas pruebas mediante muestreo del mismo dominio, entonces deberamos obtener una distribucin normal de estimaciones imparciales de la puntuacin verdadera. Para estimar la confiabilidad podemos crear muchas pruebas paralelas aleatorias sacando al azar repetidas muestras de reactivos del mismo dominio.

Muestreo de tiempo: mtodo test-retest Las estimaciones de confiabilidad test-retest se usan para evaluar el error asociado con la administracin de una prueba en dos momentos diferentes. Este tipo de anlisis es valioso solo cuando se miden rasgos o caractersticas que no cambian con el tiempo. Las pruebas que miden alguna caracterstica de cambio constante no son apropiadas para la evaluacin test-retest. Las confiabilidad test-retest es relativamente fcil de evaluar; solamente administre la misma prueba en dos ocasiones claramente especificadas y luego obtenga la correlacin entre las puntuaciones de las dos pruebas. Algo que siempre debe considerar es la posibilidad de un efecto remanente. Este efecto ocurre cuando los resultados de la primera sesin de prueba influyen en los resultados de la segunda sesin. Cuando hay efectos remanentes, la correlacin test-retest generalmente sobrestima la confiabilidad real. Los problemas de remanencia son importantes nicamente cuando los cambios en el tiempo son al azar. En los casos en que los cambios son sistemticos, los efectos de remanencia no daan la confiabilidad. Los efectos de remanencia aleatorios ocurren cuando los cambios no son predecibles a partir de las primeras puntuaciones o cuando algo afecta a algunos pero no a todos los examinados. Si algo afecta a todos los examinados por igual, entonces los resultados estn afectados uniformemente y no ocurre un error neto. Los efectos de la prctica son un tipo importante del efecto remanente, algunas habilidades mejoran con la prctica, cuando una prueba se aplica en una segunda ocasin, los examinados califican mejor porque han agudizado sus habilidades por haber presentado la prueba la primera vez. La prctica puede afectar a los examinados de maneras diferentes, de tal forma que los cambios no son constantes en el grupo. Debido a estos problemas, el intervalo de tiempo entre las sesiones de prueba debe seleccionarse y evaluarse cuidadosamente. Si las dos administraciones de la prueba son cercanas en el tiempo, se corre un riesgo relativamente grande de tener efectos de prctica y de remanencia. Sin embargo, conforme aumenta el tiempo entre sesiones de prueba, pueden intervenir muchos otros factores para afectar las puntuaciones. Cuando encuentre una correlacin test-retest en el manual de una prueba, debe prestar especial atencin al intervalo entre las dos sesiones de prueba. Una prueba bien evaluada tendr muchas correlaciones retest asociadas con diferentes intervalos entre las sesiones de prueba. Con frecuencia

desea asegurarse de que la prueba es confiable ms all del intervalo de su propio estudio. Incluso debe considerar los eventos que ocurrieron entre la aplicacin original y el retest. Por supuesto, algunas veces las bajas correlaciones test-retest no significan que una prueba no es confiable. En vez de esto, sugieren que la caracterstica bajo estudio ha cambiado. Uno de los problemas de la teora clsica de las pruebas es que supone que las disposiciones conductuales son constantes en el tiempo. Sin embargo algunos autores han sugerido que las caractersticas conductuales importantes, fluctan en el tiempo. En la teora clsica de las pruebas estas variaciones se consideran como errores.

Muestreo de reactivos: mtodo de formas paralelas La confiabilidad de formas paralelas compara dos formas equivalentes de una prueba que mide el mismo atributo. Las dos formas usan diferentes reactivos, sin embargo, las reglas utilizadas para seleccionar los reactivos de un nivel particular de dificultad son las mismas. Cuando las dos formas de la prueba estn disponibles puede compararse el desempeo en una forma frente a la otra. Algunas veces las formas se administran al mimo grupo de personas el mismo da. El coeficiente de correlacin producto-momento de Pearson se usa como estimacin de la confiabilidad. Cuando ambas formas de prueba se administran el mismo da, las nicas fuentes de variacin son el error aleatorio y la diferencia entre las formas de la prueba. Algunas veces las dos formas de la prueba se administran en tiempos diferentes. En estos casos, el error asociado con el muestreo de tiempo tambin se incluye en la estimacin de la confiabilidad. El mtodo de formas paralelas proporciona una de las evaluaciones ms rigurosas de confiabilidad que se usan. Desafortunadamente, el uso de formas paralelas ocurre en la prctica con menos frecuencia de la deseada. En ocasiones, los creadores de pruebas encuentran agobiante desarrollar dos formas de la misma prueba y las restricciones prcticas hacen difcil volver a evaluar al mismo grupo de individuos.