Anda di halaman 1dari 10

DESARROLLO DE PRUEBAS

No todas las pruebas son creadas de la misma forma. La creacin de una buena prueba no es una cuestin accidental, sino el producto de la aplicacin a conciencia y slida de los principios establecidos para su elaboracin. No todas las pruebas se crean igual. La creacin de una prueba no es una cuestin fortuita, es el producto de una aplicacin mediata y slida de principios establecidos de elaboracin de pruebas. El proceso de elaboracin de una prueba ocurre en cinco etapas: CONCEPTUALIZACIN DE LA PRUEBA CONSTRUCCIN DE LA PRUEBA ENSAYO DE LA PRUEBA ANLISIS DE LOS REACTIVOS REVISIN DE LA PRUEBA Conceptualizacin de la prueba: Elaboracin del proyecto de investigacin (incluye seleccin de la teora, definicin de constructos) Estudio piloto con entrevistas no estructuradas. La intencin es conocer cmo medir mejor el constructo que se tiene como objetivo. Construccin de la prueba. Determinacin de la escala (likert, escalograma de Guttman, diferencial semntico) Elaboracin de la tabla de especificaciones. Elaboracin de tems. Validez de contenido. Estandarizacin (procedimiento para uniformizar los criterios de aplicacin, calificacin e interpretacin) Ensayo de la prueba. Aplicacin a grupo piloto para determinar si los tems son comprendidos. Aplicacin a la muestra. . Anlisis de reactivos. Determinacin de la validez. Determinacin de la confiabilidad. Normas de baremos. Para medidas de ejecucin mxima: ndice de dificultad. Anlisis de distractores. Revisin de la prueba. Seleccin de los mejores tems. Revisin (ajuste) de la prueba y tabla de especificaciones. Validacin cruzada (realizar nuevamente procedimiento de validez con una nueva muestra de la misma poblacin) Interpretacin.

Una vez que se concibe la idea para una prueba (conceptualizacin), se hace un borrador de los reactivos que contendr (construccin). Luego, este primer borrador se ensaya en un grupo muestra de personas que la vayan a responder (ensayo). Una vez que se tiene los datos del ensayo se analiza el desempeo de quienes la respondieron en su totalidad y cada uno de los reactivos. Se emplearan procedimientos estadsticos, a los que nos referiremos en forma colectiva como anlisis de reactivos, para ayudar a hacer juicios respecto a cules son convenientes tal como estn, cules necesitan ser revisados y cules deben descartarse. El anlisis de los reactivos de la prueba puede incluir un

estudio acerca de su confiabilidad y validez y dependiendo del tipo de prueba que sea, su nivel de dificultad. Con base en el anlisis de los reactivos y en consideraciones relacionadas, se har una revisin o segundo borrador de la prueba, esta versin revisada ser ensayada en una nueva muestra de evaluados; se analizaran los resultados, si es necesario se revisara de nuevo la prueba y as se continua.

CONCEPTUALIZACION DE UNA PRUEBA: El surgimiento de algn fenmeno social o patrn de comportamiento podra servir como estmulo para el desarrollo de una nueva prueba, as como en respuesta a una necesidad de evaluar el dominio de una ocupacin o profesin recin creada (ejemplo: la ingeniera ambiental, las comunicaciones inalmbricas y las redes computacionales). Sin importar cul sea el estmulo para la elaboracin de una nueva prueba, el futuro constructor de pruebas enfrenta de inmediato diversas interrogantes: Qu es lo que va a medir la prueba segn su diseo? Cul es el objetivo de la prueba? Existe la necesidad para esta prueba? Quin usar esta prueba? educadores? otros? para qu propsito ser usada? Quin tomara esta prueba? Para quin es? para qu rango de edades ser aplicable? En qu medida este contenido es especfico para una cultura? Cmo se aplicara la prueba? Qu diferencias existen en su aplicacin grupal e individual? Estar diseada para aplicarse por medio de computadoras? Cul ser el formato ideal de la prueba? Deber ser en forma de verdadero o falso, ensayo, opcin mltiple o alguna otra? Quin se beneficia con la aplicacin de la prueba? Cmo se asignara significado a las puntuaciones de esta prueba?

Son necesarios diferentes enfoques para la elaboracin de la prueba y para los anlisis de los reactivos individuales dependiendo de si la prueba terminada esta diseada con referencia a una norma o a un criterio. PRUBAS REFERIDAS A LA NORMA: En estas pruebas los sujetos que resolvieron la prueba determinan las normas para establecer el significado de la puntuacin de un individuo. Considere la norma como el nivel distintivo en el desempeo de un grupo especfico. Al comparar la puntuacin en bruto de un individuo (el nmero real de

respuestas correctas) con la norma, determinaremos si la puntuacin est arriba, por debajo o alrededor del promedio de ese grupo. Existen por lo menos tres tipos de grupos normativos (grupos de comparacin) en la educacin: El grupo o la escuela misma, el distrito escolar y las muestras nacionales. Las pruebas referidas a la norma cubren una amplia gama de objetivos generales, en vez de evaluar un nmero limitado de objetivos especficos. Son especialmente tiles para medir el aprovechamiento general del estudiante. Estas pruebas son adecuadas tambin cuando tan solo los mejores candidatos sern admitidos en un programa. Limitaciones: Los resultados de tales pruebas no indican si los alumnos estn listos para pasar a un material ms avanzado. Ejemplo: el hecho de saber que un estudiante est ubicado dentro del 3 por ciento superior de la clase en una prueba de conceptos de algebra, no le indica que este preparado para estudiar matemticas avanzadas; es probable que todos los miembros de la clase tengan una comprensin limitada de los conceptos de algebra. Estas pruebas tampoco se recomiendan para medir valore afectivos o psicomotores. LAS PRUEBAS Y EVALUACIONES CON BASE EN UN CRITERIO : pruebas cuyas puntuaciones se comparan con parmetros de desempeo establecido. Se emplean por lo comn en el contexto de la autorizacin de una licencia ya sea para practicar la medicina o para conducir un automvil. Los enfoques con referencia a un criterio tambin se emplean en contextos educativos en los que se debe demostrar el dominio del material particular antes de que el estudiante pase a un material avanzado o estructurado, desde un punto de vista conceptual, en base a conocimientos o habilidades existentes o ambos.

Las pruebas referidas a un criterio miden el dominio de objetivos muy especficos. Los resultados de una prueba referida a un criterio deberan indicarle al profesor exactamente lo que los estudiantes son capaces y no son capaces de hacer. Problemas para la elaboracin de reactivos de pruebas referidas a normas contra pruebas con base en un criterio Generalmente en estas pruebas, la persona que tiene puntuaciones altas, tiene correcto un reactivo en particular, y quienes sacan bajos puntajes, suelen fallar en el mismo reactivo. De manera ideal, cada reactivo orienta a la prueba con un solo fin, pueden existir excepciones a la regla.

ESTUDIO PILOTO: Se refiere en general a la investigacin preliminar en torno a la creacin de un prototipo de prueba. Los reactivos de esta pueden ser estudiados en el piloto para valorar si deben ser incluidos en la forma final del procedimiento. En el estudio piloto, generalmente, quien elabora la prueba intenta determinar cmo medir mejor el constructo que tiene como objetivo. El proceso puede implicar la creacin, revisin y eliminacin de muchos reactivos de la prueba; al igual que reseas literarias y experimentacin, entre otros. Una vez completado el estudio piloto, comienza el proceso de elaboracin de la prueba. Estudio piloto (entrevistas abiertas para captar informacin, estudios fisiolgicos en las personas). Al realizar el estudio piloto, el proceso implica la creacin, revisin, y eliminacin de reactivos, todo por el bien del estudio para mejorar el constructo que se tiene como objetivo. Al finalizar esto, se da paso a la elaboracin de la prueba Investigacin piloto (estudio de reactivos de prueba) Trabajo piloto Estos son los pasos preliminares para la creacin de un prototipo de la prueba Construccin de prueba Elaboracin de escalas Generalmente son con una asignacin numrica, y se define como el proceso de definicin para establecer las reglas de los estudios. Thurstone es un expositor que acredita la vanguardia de insturmentar mtodos de elaboacin de escalas que sean solidas en el sentido metodolgico. Kenneth Merrell El mejor consejo para lo futuros elaboradores, es poner todo tu esfuerzo y recursos para hacer bien el trabajo. S haces bien la etapa planeacin y elaboracin, ser mucho ms efectivo y seguro el resultado, propiedades psicomtricas mas solidas para su prueba. Tipos de escalas: se clasifican por tipologas, son diversas (unas pueden medir peso, kilos, etc) Mtodo para elaborar escalas: Generalmente el que tengas ms o menos puntos, va a tener ms o menos caractersticas depende lo indique el mtodo y el tipo de escala. Los tipos de mtodos pueden ser: Verdadero y Falso Del 1 al 10 Excelente / Insatisfactoria Caras (feliz, normal, triste)

La escala de estimacin se puede usar para registrar juicios, ya sean de uno mismo, de otros, de experiencias o de objetos, y adoptar varias formas. Existe una escala de estimacin sumatoria de Likert, generalmente se usa para medir actitudes. Cada reactivo se evala con 5 respuestas alternativas El uso de escalas de estimacin de todo tipo, da como resultado, datos a nivel ordinal. Algunas escalas son unidimensionales (una respuesta subyace en las estimaciones), otras son multidimensionales (ms de una respuesta subyace en las estimaciones). *Otro mtodo que elabora escalas que produce datos ordinales, es el mtodo de comparaciones apareadas. ( se presentan pares de estmulos como fotos, 2 objetos, 2 afirmaciones, y se les piden que las compare, luego deben seleccionar un estimulo ms atractivo que el otro.

*Otro sistema es la elaboracin de escalas categricas. Los estmulos se colocan en una de dos o ms categoras alternativas que difieren en forma cualitativa con respecto algn continuo. *Una escala Guttman, otro mtodo de elaboracin de escalas que produce medidas en el nivel ordinal. Los reactivos varan en forma secuencial de expresiones ms dbiles a otras ms fuerte de actitud, creencia o sentimiento. Thurstone aplica criterios para crear una escala. Se recopilan cantidades razonablemente grandes para determinar algo como positivo y negativo Los expertos dictaminan cada afirmacin que realiza la persona evaluada, se les pide que sean objetivos en las evaluaciones y que no consideren sus propias opiniones. Se calcula una media y una desviacin estndar. Se juntan todos los datos, y se sacan promedios para estandarizar Los reactivos se seleccionan para su inclusin en la escala final, se dbeen reflejar com una amplia gama de actitudes para determinar algo. La escala al contar con estos puntos, esta lista para ser aplicada.

ELABORACION DE ESCALAS: Anteriormente se defini medicin de escalas como la asignacin de nmeros (valores) de acuerdo con reglas. La elaboracin de escalas puede ser explicada como el proceso para establecer reglas y con ellos lograr la asignacin numrica en la medicin realizada con base en el constructo, o tambin proceso por el cual se disea y calibra una dispositivo de medicin, y la forma en que se asignan nmeros (u otros ndices), valores

de escala, a diferentes cantidades del rasgo, atributo o caracterstica que se este midiendo.

TIPOS DE ESCALA: En psicometra la escala se usa para medir un rasgo, una caracterstica o un atributo psicolgico. Cuando pensamos en tipos de escalas, pensamos en las distintas maneras en que las escalas pueden ser clasificadas.

Ejemplos: Escala de clasificacin del reactivo A Cmo te sentiste con lo que viste en la televisin?

Las caritas sonrientes como se ilustra en el reactivo A se han usado en la investigacin sociopsicologica con nios y adultos con alguna discapacidad en torno al lenguaje. Las caritas se usan en vez de palabras como triste, feliz y neutral.

Escala de clasificacin del reactivo B Creo que me gustara trabajar como guardabosques Verdadero Falso (encierre en un crculo su respuesta).

Escala de clasificacin del reactivo C

Por favor, clasifique al empleado segn su disposicin para cooperar y relacionarse con sus compaeros de trabajo: Excelente ____ / ______ / _____ / _____ / _____ / _____ / _____ Insatisfactorio

Quienes elaboran pruebas disean el mtodo de medicin que creen se adapta mejor a la conceptualizacin de la medicin del rasgo (o lo que sea) que se desee medir.

METODOS PARA ELABORAR ESCALAS: Escala de estimacin: La cual puede definirse como el agrupamiento de palabras, afirmaciones o smbolos a travs de los cuales el evaluado indica la intensidad de sus juicios relativos a un rasgo, actitud o emocin particular. Las escalas de estimacin pueden ser usadas para registrar juicios personales o de otros individuos, experiencias objetos y pueden adoptar formas diversas. Ejemplo: Hara trampa en el pago del impuesto si tuviera oportunidad:

1 Nunca Se justifica

10 Siempre se justifica

Escala de Likert: Es un tipo de escala de estimacin sumatoria, se usa en forma extensa dentro de la psicologa, por lo general para escalas de actitud. Cada reactivo ofrece cinco alternativas de respuesta (a veces siete), usualmente en algn tipo de sucesin entre acuerdo y desacuerdo o aprobacin y desaprobacin. Hara trampa en el pago de impuestos si tuviera la oportunidad (marque una opcin) __________
Nunca se justifica

__________
rara vez se justifica

________
a veces se justifica

__________
usualmente se justifica

_________
siempre se justifica

Escala Ordinal (mtodo de comparacin por pares): A los examinados se les presentan pares de estmulos (dos fotografas, dos objetos, dos afirmaciones) y se les pide que los comparen. Luego deben seleccionar uno de ellos de acuerdo con una regla; por ejemplo, la regla de que estn ms de acuerdo con una afirmacin que con la otra o la regla de que encuentran un estmulo ms atractivo que el otro. Seleccione el comportamiento que considere ms justificado: a) Hacer trampa en la declaracin de impuestos si tiene la oportunidad. b) Aceptar un soborno durante el cumplimiento de nuestros deberes. Por cada para de opciones los evaluados recibiran una mayor puntuacin si seleccionaran la opcin considerada ms justificable por la mayora de un grupo de jueces.

Otra escala ordinal es la Escala Guttman: Los reactivos en ella varan en forma secuencial, de las expresiones ms dbiles a las ms fuertes, todas ellas basadas en la actitud o sentimiento que se mide. Esta de acuerdo o en desacuerdo con cada una de las siguientes:
a) Todas las personas deberan tener derecho a decidir si desean terminar con su vida.

b) Las personas con enfermedades terminales y que sufren de dolor deberan tener la opcin de que un mdico les ayude a terminar con su vida. c) Las personas deberan tener la opcin de rechazar el uso de equipo para mantener la vida en forma artificial antes de enfermarse ms gravemente. d) Las personas tienen derecho a una vida confortable.

REDACCION DE REACTIVOS:

Aqu se tiene que ver el rango que cubren los reactivos, cuales deben emplearse para dicha evaluacin y cuantos reactivos deben utilizarse (cantidad). Un muestre general proporciona una base para la validez de contenido de la versin final de la prueba. La elaboracin de reactivos, puede basarse en experiencias personales, o conocimiento acadmico de la materia, tambin se busca ayuda en otros incluyendo a expertos.

En el proyecto completo de la construccin de una prueba, las consideraciones relacionadas con la redaccin final de los reactivos de la prueba van de la mano con las consideraciones de la elaboracin de escalas. Tres preguntas a las que se enfrenta el redactor de pruebas o de reactivos son:

Qu rango de contenidos deben cubrir los reactivos? Cul de los muchos tipos diferentes de formatos de reactivos deben emplearse? Cuntos reactivos deben redactarse?

La meta principal de la planificacin de la prueba es la preparacin de un bosquejo detallado, como una tabla de especificaciones que sirva como gua al elaborar los reactivos con los que se van a evaluar o predecir ciertos objetivos. Todos los reactivos representan procedimientos para obtener informacin acerca de los individuos, pero la cantidad y los tipos de informacin varan con la naturaleza de las tareas planteadas por diferentes tipos de reactivos. Preguntas cerradas Preguntas precisas, que no den chance a extenderse, para ello hay que generar buenos reactivos, es por eso la importancia de los estudios pilotos. Pueden darse reactivos en forma dual, falsos o verdaderos, etc. Preguntas abiertas Son abiertas, se les pueden dar 3 reactivos para que responda, con todo tipo de opcin. La desviacin estndar generalmente se encuentra una medida til. Comparar y redactar Comparar y contrastar las respuestas Calificacin de reactivos La lgica de esta prueba es ser acumulativa donde mayor puntuacin indica que tiene mas rasgos o capacidad en lo que se le pregunta. Generalmente se clasifica a la persona luego de ser evaluada. Ensayo de la prueba Ya creado el borrador, se debe ensayar con personas que pongan a prueba esta evaluacin, que sirvan de crtica y de referente para saber cmo se aborda. Es importante con quien y con cuantos se toma esta prueba. No deben ser menos de 5 sujetos, en su preferencia 10, donde los reactivos les pongan a prueba. Se debe ejercer el ensayo, lo ms cercano a lo que se pretende utilizar el da de maana. Anlisis de reactivos Se deben seleccionar los reactivos ms efectivos, implementar un ndice de dificultad de cada reactivo, un ndice de validez, ndice de confiabilidad, e ndice de discriminacin. Aqu se evala como lograr las metas a corto plazo.

RESERVA DE REACTIVOS: Es el deposito o provisin de donde se seleccionaran o descartaran los reactivos para la versin final a utilizar. REACTIVOS DE ENSAYO La ventaja principal de los reactivos de ensayo es que pueden medir la habilidad personal para organizar, relacionar y comunicar, conductas que no son fciles de evaluar con los reactivos objetivos. Las pruebas de ensayo tienen las ventajas de que requieren menos tiempo para su elaboracin y reducen la probabilidad de que los examinados respondan en forma correcta a los reactivos por simple adivinacin.

FORMATO DE REACTIVOS: son las variables tales como la forma, plan, estructura, arreglo y disposicin de los reactivos de pruebas individuales.

Formato de seleccin de respuesta: requieren que quienes respondan la prueba elijan una respuesta entre una serie de alternativas.

Reactivo de Relacin: se le presentan dos columnas de respuestas al examinado, premisas a la izquierda y respuestas a la derecha. La tarea de quien presenta el examen es determinar cul respuesta se asocia mejor con cual premisa.

Reactivo de completar: tambin puede llamarse de respuesta breve, requiere que el examinado proporcione una palabra o frase que complete una oracin.

Reactivo de Ensayo: el examinado responde escribiendo una composicin, por lo general una que demuestre que hay rememoracin de hechos, entendimiento, anlisis o interpretacin.