Validez evaluaciones aula

Evaluacin al interior del aula
Carla Frster Marn*

Cristian A. Rojas-Barahona**
lo que respondieron los estudiantes era lo que quera evaluar el
profesor?, las respuestas en la evaluacin son coherentes con el
dominio de la disciplina que se presenta durante las clases? y los
resultados son independientes de quin evale y de quin revise la
informacin obtenida?
Concordante con esta idea, Messick (1989) define la validez como un

juicio evaluativo integrado del grado en el cual la evidencia emprica
y terica soporta la adecuacin y pertinencia de las inferencias y
acciones basadas en los puntajes de un test o en otros modos de
evaluacin (p. 13). As, por ejemplo, la pregunta la Prueba de
Seleccin Universitaria (PSU) es vlida? no es una buena pregunta,
ms bien correspondera decir: la PSU es vlida para predecir los
resultados de los estudiantes durante su primer ao de universidad?,
o mejor an, en qu grado es vlido el puntaje de la PSU para
predecir el resultado de los estudiantes en su primer ao de
universidad?
En otras palabras, la validez no es una propiedad intrnseca de un
instrumento o situacin evaluativa, sino una propiedad de la
interpretacin y los usos que se realizan de la informacin obtenida a
partir de ellos.
El concepto de validez utilizado en el enfoque psicomtrico tiene
sentido solo
para pruebas a gran escala, aplicadas a un nmero considerable de
estudiantes, donde se espera que los resultados generen una
distribucin normal (se espera que la mayora de las personas
obtenga puntuaciones medias y una proporcin menor se ubique en
los extremos), pero en la sala de clases no se tiene como objetivo que
los resultados de los alumnos se distribuyan de esta forma, por el
contrario, se espera una curva asimtrica, donde la mayora (si no
todos) est sobre el puntaje de aprobacin de un determinado
aprendizaje, ya que esto indicara que lograron aprender lo que se
esperaba para ese momento (edad, curso, perodo del ao, etc.). Por
esta razn, Stiggins (2001) evita hablar
de validez en el contexto de la sala de clases y reemplaza este
trmino por evaluacin de alta calidad (high-quality classroom
assessment).
A gran escala el propsito es sacar conclusiones del desempeo de

los estudiantes para los fines especficos de la evaluacin diseada,
desempeo de los estudiantes y entregar evidencia respecto de la
enseanza de ese contenido.
Comparacin de la validez evaluaciones a gran escala y en la
sala de clases (Adaptado de Brookhart, 2003)
Evaluacin a gran
escala
Las interpretaciones y las
acciones tomadas son
Los estudiantes son la
materia sobre la que se
realizan
las
Los
estudiantes
no
reciben
un
beneficio
directo de la evaluacin,
El
objetivo
de
la
evaluacin es realizar
una
inferencia
significativa
estadsticamente sobre
El contexto de la medicin
es un constructo
Las especificaciones del
contenido describen un
dominio disciplinar.
La administracin del test
es estandarizada y se
controla el efecto de las
ciencias,
prcticas
y
La
evaluacin
es
independiente
de
la
enseanza.
Se
puede
Evaluacin a nivel
aula
Las deducciones y las
acciones tomadas son
Los
estudiantes
son
observadores
conjuntamente con los
Los estudiantes reciben
beneficios individuales de
la informacin de la
El
objetivo
de
la
evaluacin es comprender
cmo es el desempeo de
los
estudiantes
comparado con el ideal
El contexto de la medicin
es un constructo relevante.
Las especificaciones de
contenido
reflejan
el
dominio
(objetivo
de
Las creencias de los
profesores, sus prcticas
y el conocimiento de la
materia y de los estuLa evaluacin es parte de
la enseanza. Una buena
evaluacin
es
un
Validez de contenido
Esta validez se refiere a la correspondencia que existe entre el
contenido/habilidades que evala el instrumento y el campo de
conocimiento al cual se atribuye dicho contenido (Brualdi, 1999;
Garca, 2002; Hogan, 2004; Lukas y Santiago, 2004).
En este sentido, resguardar que las evaluaciones en el aula tengan
validez de contenido implica garantizar que las situaciones evaluativas
incluyan los contenidos y habilidades asociadas a estos. Se deben
considerar los contenidos y habilidades ms relevantes para demostrar
el logro de un aprendizaje, es decir, se debe seleccionar una

muestra pertinente y representativa del universo de
contenidos cubierto por un curso, una clase, o un conjunto de
ellas.
Por tanto, certificar lo que un estudiante sabe y es capaz de hacer o no
en un curso tiene directa relacin con los contenidos y habilidades que
fueron evaluados.
Hay veces en que tenemos que estudiar, por ejemplo un texto
entero, y luego en la prueba aparecen un par de preguntas textuales
y nada ms me parece negativo porque creo que es bueno aplicar
lo que uno lee, adems suelen pasar que justo nos preguntan lo que
tenamos menos claro de todo y eso nos perjudica
Recomendaciones
Tabla de especificaciones: Con esta tabla es posible visualizar si se
estn cubriendo todos los contenidos seleccionados, si las
habilidades asociadas a dichos tems son coherentes con las metas
de aprendizaje trazadas y si los tems corresponden a los contenidos
y habilidades que se esperaban. A partir de este anlisis, tambin es
posible establecer si existe una graduacin de la complejidad en
cuanto a las habilidades evaluadas y si los tems son los ms
apropiados para evaluar una habilidad determinada.
Validez instruccional
Tiene relacin con lo que los estudiantes han tenido oportunidad de
aprender durante las clases para responder correctamente en una
evaluacin (Crocker et al, 1988).
En el mbito educativo este tipo de validez es clave, dado que
representa la relacin entre lo que se ensea y lo que se evala.
Cuando esta relacin es dbil se presentan dos problemas, por una
parte, los estudiantes no tienen posibilidad de demostrar lo
que aprendieron durante las clases y, por otra, son evaluados en
aspectos que no se les ensearon.
Esta ltima idea se ve reflejada especialmente cuando se cambia el
nfasis de lo que se ense, por ejemplo, en clases se ensean los
conceptos, sus definiciones y luego en la evaluacin se les pide que
apliquen dichos conceptos en situaciones que nunca han sido
trabajadas durante las clases, aludiendo a que se espera que los
estudiantes sean capaces de hacerlo como parte de la construccin
de su propio aprendizaje.
En conclusin, se dice que una evaluacin tiene validez instruccional

cuando contiene situaciones evaluativas coherentes con las
actividades de aprendizaje realizadas por los alumnos.
En este apartado se incluye tambin lo que se ha llamado validez
semntica, que consiste en que las situaciones de evaluacin
contienen trminos cuyo significado es conocido y compartido entre
el constructor del instrumento (en el caso del aula, el profesor) y los
alumnos.
He tenido profesores que evalan en sus pruebas cosas (contenidos)
que han tratado mal, a la rpida o sencillamente no han tratado ni en
clases ni en los textos referidos (asumiendo que los vimos en otros
cursos) No me parece pedaggico evaluar contenidos de otros
cursos
Las acciones que se sugieren a continuacin para resguardar
la validez instruccional tienen relacin con las prcticas de
enseanza que se utilizan habitualmente:
1. Velar porque las situaciones de evaluacin contengan los
contenidos vistos en las actividades de aprendizaje realizadas.
2. Velar porque las situaciones de evaluacin sean equivalentes o
similares a las actividades de aprendizaje realizadas. (No
significa repetir la gua que se realiz en clases y ahora ponerle
una nota, por el contrario, esta sugerencia apunta a evaluar
actividades en trmino de habilidades similares a las
trabajadas.) se intencionaron actividades para lograr los aprendizajes esperados o metas de aprendizaje determinadas
3. Cuidar que el lenguaje utilizado en las situaciones de
evaluacin sea conocido por los estudiantes.
Validez consecuencial
Este tipo de validez se relaciona con las consecuencias y secuelas
intencionales y no intencionales que tendr el uso e interpretaciones
que se dar a la informacin recogida en la evaluacin. (Hogan, 2004;
McMillan, 2003; Moss, 1997).
son especialmente importantes en una evaluacin cuando las
interpretaciones de la informacin pueden implicar
consecuencias adversas para los participantes (Brualdi, 1999).
En las evaluaciones a gran escala las consecuencias estn en la
toma de decisiones y reformulacin de polticas pblicas y tienen
implicancias ticas y sociales que hacen relevante estudiar la
validez desde este punto de vista.
en cambio, las consecuencias tienen relacin directa con las
dinmicas de enseanza- aprendizaje que se dan entre
profesores y alumnos; en este sentido, Brookhart (2003) seala
que si la integracin entre enseanza y evaluacin es tomada
seriamente, una situacin evaluativa debera ser como

consecuencia un vehculo para el aprendizaje.
por consecuencia, se relaciona con los propsitos para los cuales
se dise la evaluacin.
Entre las consecuencias imprevistas de una evaluacin, y que le
restan validez, destacan la falta de motivacin de los
estudiantes para participar en una actividad de evaluacin,
interiorizar un error conceptual a causa de la tarea realizada,
generar un ambiente de competencia entre los estudiantes,
resentimiento de los estudiantes por el formato de la evaluacin,
entre otros.
En un trabajo en grupo, en el cual se evalu a todos por igual, uno de
mis compaeros no se prepar bien, se puso nervioso y la exposicin
no fue la mejor, pero los otros tres compaeros hicieron su
presentacin de buena forma Por las razones anteriores, la
evaluacin del grupo fue disminuida y con esto se premi al
compaero deficiente y se perjudic a los otros que s lo hicimos bien
Una evaluacin oral, para m es muy confuso dar a conocer lo que se
sabe con tanta presin de por medio, los nervios juegan en contra en
estos casos y siento que no representa una buena manera de evaluar
ya que lo que preguntan se podra responder perfectamente en forma
escrita y lo hacen ms por no revisar
1. Definir claramente los propsitos y usos de la evaluacin. En
este sentido se presentan tres grandes fines: diagnstico
(por ejemplo, identificar los conocimientos previos de los
estudiantes, reconocer conductas de entrada, ajustar la
planificacin al contexto, etc.), formativo (por ejemplo,
mejorar los aprendizajes y la motivacin de los estudiantes,
monitorear su desarrollo, mejorar el proceso de enseanza,
etc.) y sumativo (por ejemplo, certificar los aprendizajes de los
estudiantes, informar a los padres el desempeo de sus hijos al
final del curso, etc.)
2. Identificar claramente las evidencias que darn cuenta de los
propsitos de la evaluacin.
Confiabilidad (o precisin de sta)
La confiabilidad implica que el instrumento entrega resultados
similares cuando se repite su aplicacin en las mismas
circunstancias a las mismas personas.
El concepto de confiabilidad hace referencia a consistencia,
exactitud y estabilidad de los resultados, a las inferencias que se
pueden realizar, y tiene directa relevancia en las conclusiones y
posterior toma de decisiones
Este criterio de calidad tiene su origen en la psicometra,

donde se dice que una prueba ser confiable si
consistentemente genera la misma puntuacin, o una similar, al
ser aplicada a un individuo, y su puntuacin es replicable al
menos con un margen de error pequeo.
Smith (2003) reafirma esta idea sealando que los profesores no
calculan coeficientes alfa, ni correlaciones test-retest, ni formas
paralelas, por una parte, porque no tienen un nmero de casos
suficientes y, por otra, porque las evaluaciones son realizadas a
un estudiante en un tiempo especfico. No obstante, lo que es
fundamental en este caso es que se espera que el alumno
cambie su aprendizaje de una semana a otra, elemento que va
contra lo esperado en psicometra respecto de la estabilidad de
los rasgos que se miden.
Moss (2003) plantea que lo correcto para hablar de
confiabilidad a nivel de aula es analizar la suficiencia de
informacin, es decir, la confiabilidad est representada
por tener suficiente evidencia de un aprendizaje que
permita tomar decisiones con el menor margen de error
En el primer caso (evaluacin estandarizada) se busca una
clasificacin estable a lo largo de un continuo y a nivel de aula
se busca obtener informacin estable entre el ideal del
aprendizaje (lo que busca el profesor de sus alumnos) y lo real
alcanzado.
COMPARACIN DE LA CONFIABILIDAD DE
EVALUACIONES A GRAN ESCALA y EN LA SALA DE
CLASES
(Adaptado de Brookhart, 2003)
Evaluacin a gran
escala
La confiabilidad es la
consistencia entre factores
relevantes.
El
objetivo
de
la
confiabilidad es tener una
clasificacin estable de
los estudiantes en una
escala de puntuacin o
Evaluacin en el
aula
La confiabilidad es la
suficiencia de la
informacin.
El
objetivo
de
la
confiabilidad es tener informacin estable acerca
de la diferencia entre el
desempeo
de
los
FACTORES QUE INFLUYEN:

el nmero de observaciones o evidencias de un aprendizaje, ya
que mientras ms instancias de evaluacin del mismo aprendizaje
(nmero de tems en una prueba, instancias de evaluacin
formativas, etc.), mayor ser la consistencia interna del proceso de
evaluacin y ms confiable ser la conclusin respecto del logro del
estudiante; b) las caractersticas de la aplicacin, referidas a la

claridad de las instrucciones, tiempo destinado y disposiciones del
espacio fsico; y c) la precisin de la correccin y puntuacin
(Himmel et al, 1999; Hogan, 2004). Este ltimo punto ser tratado
en forma independiente bajo el ttulo de Objetividad, dada la
relevancia que tiene en el mbito educativo.
En un curso donde las pruebas eran una pregunta por cada tema y si
justo no te sabas eso especfico, perdas con esa pregunta, aunque te
supieras el tema.
1. Aplicar al mismo estudiante variadas situaciones evaluativas
que midan el mismo aprendizaje. Esto se puede realizar en
distintas actividades evaluativas o poniendo en un mismo
instrumento distintas situaciones de evaluacin que evalen lo
mismo (por ejemplo, distintos tems en una prueba).
2. Velar por la claridad de los tems e instrucciones.
3. Velar porque el ambiente de aplicacin sea similar en cuanto a
recursos, espacios y tiempo.
4. Velar por la precisin de la correccin. (Detenerse en el
apartado preguntas abiertas en este punto, as como en tems
cerrados.
Objetividad
se decidi tratarlo en forma separada dada la relevancia e impacto
que tiene al interior de la sala de clases. Esto no supone que sea
independiente de la confiabilidad (es solo una aproximacin
metodolgica al problema).
Por lo general, la objetividad se entiende como la calidad de un objeto
en s, independiente de las consideraciones o juicios personales.
Si llevamos la objetividad al mbito evaluativo, supone que
tanto los instrumentos como el juicio que se emite a partir de
la informacin recogida con ellos sean imparciales.
En relacin a este tema Calatayud (1999) afirma que quien cree que
la evaluacin de los estudiantes es una accin objetiva, se embarca
en una tarea imposible.
Estudios asociados a las expectativas de los docentes como los de
Rosenthal y Jacobson (1968; efecto Pigmalion), de Spears (1984) y
de Rubie-Davies (2006) muestran que los estudiantes considerados
de bajo rendimiento tienen menos tiempo para contestar en una
interrogacin oral, reciben menos ayuda o pistas cuando preguntan
alguna duda en una prueba y reciben menos retroalimentacin de su
desempeo que los estudiantes considerados de alto rendimiento,
para los cuales los docentes tienen mayores expectativas.
Estudios como el de Lpez y colaboradores (1983) dan cuenta de

cmo diferentes profesores de matemticas o fsica dan puntuaciones
o calificaciones distintas a un mismo ejercicio, lo cual se podra atribuir
a diferentes niveles de exigencia en la correccin que no debera
afectar a los estudiantes, si son corregidos todos por la misma
persona (Gil Prez y Vilches, 2008), mientras que otras evidencias
indican que un mismo profesor puede puntuar o calificar de manera
diferente la respuesta de un estudiante dependiendo del momento
(Hoyat, 1962).
(pedirle a los estudiantes que respondan con el mismo color, tambin
responde hasta cierto punto, con este criterio)
Aunque se asume que la correccin nunca ser ciento por ciento
objetiva, es conocido por todos que los profesores tienen escaso
tiempo para co- rregir trabajos y pruebas de sus estudiantes, y que lo
hacen en los pocos espacios fsicos y temporales que tienen
disponibles, implicando que algunos comienzan en el colegio durante
la maana, pero pueden terminar al da siguiente en su casa de
madrugada.
En un taller se hacan controles de lectura con tres preguntas sin
mayor explicacin, al tener el control observ que no tena todo el
puntaje en ninguna de las preguntas, al preguntar por qu, el
profesor me dio la respuesta correcta y era lo mismo pero con otras
palabras
En la clase de artes, en mi caso present una pintura que fue bien
evaluada, la hice a la rpida y no me tom mayor trabajo, en cambio,
a uno de mis compaeros lo evalu muy mal, siendo que su pintura
era mucho ms trabajada, novedosa y haba seguido todas las
instrucciones Como no haba pauta, no pudo alegar nada
En enseanza media, todas las evaluaciones de historia se
realizaban con cuestionarios, el problema radicaba en que las
pruebas quedaban en poder del profesor y no se tena derecho a
correccin.
1. Informar a los alumnos la intencionalidad de la evaluacin y los
aprendizajes a evaluar.
2. Dar a conocer a los alumnos los criterios de evaluacin.
(Preparar una presentacin oral que va a ser evaluada en
cuanto al uso de las habilidades comunicativas es muy
diferente que prepararla para ser evaluado en el dominio
conceptual de dicha presentacin, por tanto, los nfasis que un
estudiante pone y el tipo de aprendizaje que desarrolla estarn
en directa relacin con la pauta de trabajo que se le haya
entregado).
3. Elaborar pautas de respuesta o correccin. (Considerar el
ejemplo del profesor que regresa a re-evaluar una respuesta
ante la ausencia de un criterio establecido. Esto apunta,
principalmente, a la falta de una claridad con respecto al logro
esperado, y en tanto no sea establecido, la evaluacin ser una

tentativa de acercamiento a ste).
4. Establecer previamente los criterios de asignacin de puntajes
en funcin de la relevancia y nivel de complejidad de los
aprendizajes. (Este elemento es clave en dos sentidos: primero
permite al docente asegurar, previo a la aplicacin de la evaluacin, que los tems a evaluar reflejan, en trminos de
extensin y complejidad, la relevancia que se les asigna con un
puntaje determinado en comparacin con el puntaje total de la
evaluacin; y en segunda instancia, los estudiantes toman
decisiones en funcin del peso que tiene cada tem respecto de
la dedicacin y orden con la que se enfrentan a ellos)
Resumen
La validez de contenido de un instrumento o situacin
evaluativa se refiere a la cobertura y relevancia de los contenidos
y/o habilidades en un rea disciplinar espe- cfica que han sido
seleccionados, y las sugerencias para resguardar este criterio son:
elaborar una tabla de especificaciones del instrumento y someter la
evaluacin a criterio de jueces.
La validez instruccional hace referencia a la coherencia entre lo
que se va a evaluar y lo que los estudiantes han tenido
oportunidad real de aprender. Las sugerencias para resguardar este
criterio de calidad son: velar por que las situaciones de evaluacin
contengan los contenidos vistos en las actividades de aprendizaje,
sean equivalentes a las actividades realizadas y utilicen un lenguaje
conocido por los estudiantes.
La validez consecuencial tiene relacin con las consecuencias
tanto positivas como negativas que puede tener una evaluacin para
el aprendizaje de los estudiantes; se sugiere resguardar este criterio
definiendo claramente los propsitos y usos de la evaluacin e
identificando a priori las evidencias que darn cuenta de dichos
propsitos.
Es pertinente resaltar que la validez instruccional debe ir de la
mano de la validez de contenidos, no sera lgico evaluar algo que
efectivamente se ense, pero que no es relevante para el rea
disciplinar del curso.
Confiabilidad. Las acciones que permiten resguardar este criterio son:
evaluar en reiteradas ocasiones a un estudiante respecto de un
mismo aprendizaje, ya sea en instancias diferentes o en varios tems
dentro de una misma situacin evaluativa, velar por la claridad de los
tems, sus instrucciones, el ambiente de aplicacin y la precisin en la
correccin. Para ello se sugiere informar previamente a los
estudiantes la intencionalidad de la evaluacin y los aprendizajes a

evaluar, dar a conocer los criterios de evaluacin, elaborar pautas de
respuesta o correccin y asignar previamente los puntajes en funcin
de la relevancia y nivel de complejidad de los aprendizajes.

Validez evaluaciones aula

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Validez evaluaciones aula

Diunggah oleh

Hak Cipta:

Format Tersedia

Evaluacin al interior del aula

Carla Frster Marn*

Concordante con esta idea, Messick (1989) define la validez como un

A gran escala el propsito es sacar conclusiones del desempeo de

el logro de un aprendizaje, es decir, se debe seleccionar una

En conclusin, se dice que una evaluacin tiene validez instruccional

seriamente, una situacin evaluativa debera ser como

Este criterio de calidad tiene su origen en la psicometra,

FACTORES QUE INFLUYEN:

estu- diante; b) las caractersticas de la aplicacin, referidas a la

Estudios como el de Lpez y colaboradores (1983) dan cuenta de

esperado, y en tanto no sea establecido, la evaluacin ser una

estudiantes la intencionalidad de la evaluacin y los aprendizajes a

Anda mungkin juga menyukai