LA EVALUACION DE APRENDIZAJES
Pruebas diagnstico
Banco de pruebas
La medida en educacin. 11. Clasificacin
Clases de evaluacin
El proceso de la evaluacin
~ ~
,.
Alcal, 166
~
-
I
CCS EDITORIAL
28028 MADRID
'Ir 91 725 20 00 / @ 91 726 25 70 ISBN84f42-019-9
www.editorialees.eom I e.e.: sei@editorialees.eom 9 "788498"420197
Tefilo Rodrguez Neira Luis lvarez Prez
Paloma Gonzlez-Castro Julio A. Gonzlez-Pienda
Jos Muiz Fernndez Jos C. Nez Prez
Enrique Soler Vzquez
LA EVALUACiN
DE APRENDIZAJES
Editorial ees
Pgina web de EDITORIAL CCS: www.editorialccs.com
Autores Varios
2006. EDITORIAL CCS, Alcal 166/28028 MADRID
Prlogo 9
3. LA MEDIDA EN EDUCACIN.
1. RECOGIDA DE INFORMACIN 53
4. PRUEBAS OBJETIVAS 73
5. PRUEBAS VERDADERO/FALSO 81
1. Observacin 169
1.1. Observacin espontnea 169
1.2. Observacin estructurada 170
2. Encuesta 178
2.1. Entrevista 178
2.2. Cuestionario 179
Glosario 283
Los autores
551ntZION5IHdV 510
NOI)Vn1VA5I
I V1 V ONHO.L N5I
lDl.LVW5I1aOHd
I
La problemtica relacionada con la evaluacin, tanto desde el punto de vista
terico como prctico, no suele dejar indiferente a nadie; es ms, a menudo se
convierte en una autntica palestra de confrontacin tanto ideolgica como
tcnica (Zabalza, 1989: 235). Como otros fenmenos educativos, la evaluacin,
con todo lo que conlleva, sufre peridicos vaivenes en lo que se refiere a su
valor y consideracin.
Con el fin de que cada lector, de acuerdo con su experiencia y sus conoci-
mientos, subraye, elimine o ample lo que considere oportuno en relacin con
este tema, en los prrafos siguientes, y antes de iniciar su estudio sistemtico,
se recoge una miscelnea de opiniones que suelen orse en los centros de ense-
anza y se leen en la bibliografa especializada.
En todas las publicaciones que abordan la evaluacin educativa se mencio-
nan problemas asociados. Los interesados encontrarn esta amplia problemti-
ca en tratados ya clsicos sobre evaluacin que muchos autores han ido apor-
tando a lo largo de la historia de la educacin; entre otros, es obligado citar a
Adams (1983), Bloom Hasting y Madaus (1975), Cronbach (1972), Ebel YFrisbie
(1977), Gronlund (1973), Lafourcade (1977), Popham (1978), Scriven (1967),
Stufflbean y Shinkfield (1985), Tenbrink (1981), Thorndike y Hagen (1969),
Tyler (1950). Tambin, como ms cercanos a nuestro entorno: Barber (1999),
Casanova (1997), Monedero (1998), Sabirn (1999) y Zabalza (1989).
Opiniones referentes a aspectos varios y diversos: exmenes; juicios de valor
sobre el rendimiento de los alumnos; fines de la evaluacin; programacin, cali-
ficacin y evaluacin; desfase entre la teora y la prctica; dificultades y lmites
de la evaluacin; su funcin de control y seleccin.
1. Destacan las opiniones sobre los exmenes, en los que, para algunos, se
concentran todos los diablos de la educacin. As, se dice que los exmenes
producen ms efectos negativos que positivos, que son represivos y suponen
un instrumento de poder, que reflejan un estilo de enseanza conservador y
autoritario, que producen ansiedad y provocan secuelas muy negativas en la
personalidad y desarrollo de los alumnos; en fin, a veces se ven como una ame-
naza que desmotiva y llega a alienar y daar el propio autoconcepto, por lo que
se declaran incompatibles con una educacin que pretenda ayudar a'realizarse
14 La evaluacin de aprendizajes
al alumno. Luchar contra los exmenes fue una de las consignas estudiantiles de
Mayo del 68.
Otros, sin embargo, acuden al sentido comn para demostrar que la mayora
de los alumnos no sufre estos daos. Efectivamente, dicen, una mala nota dada
a un alumno que se ha esforzado puede causarle un perjuicio, pero normal-
mente las malas calificaciones se asignan a los alumnos que no han estudiado; y
los alumnos que no se esfuerzan suponen un problema mayor que los que estu-
dian, trabajan y se preocupan, por lo que no hay que corregir la evaluacin, sino
la instruccin.
Por otro lado, aaden, una preocupacin moderada por los exmenes es
siempre beneficiosa: el aprender a enfrentarse con situaciones problemticas
que la vida va a deparar, como son los exmenes, es una parte necesaria de la
maduracin. Los problemas de los alumnos que fracasan suelen ser de otra
ndole, y no se van a solucionar suprimiendo los exmenes.
Casi nadie dice que en la enseanza reglada puede haber instruccin sin
evaluacin, incluso para algunos sta llega a ser la pieza clave del sistema edu-
cativo: no puede haber enseanza y aprendizaje si no hay unas metas que alcan-
zar, y si stas no se valoran; es decir, ensear, aprender y evaluar son partes
interrelacionadas del ciclo de instruccin. Sin embargo, desde otras posiciones,
aunque moderadas, se insiste en la sustitucin de algunos instrumentos de eva-
luacin, y se llega a decir que se podra educar mejor sin exmenes formales;
no obstante, en la prctica parece difcil encontrar alternativas.
2. La emisin de juicios de valor sobre los alumnos y sobre la calidad de sus
tareas se suele basar en una informacin elemental o en una percepcin muy
genrica sobre su personalidad; es decir, se critica la tendencia en la prctica
evaluadora a reducir el espectro de informaciones y, por tanto, a simplificar los
juicios de valor. Para Gimeno (1988: 377): la importancia de las notas y de las
evaluaciones escolares desde un punto de vista social, acadmico y personal
para los alumnos contrasta con la simplicidad de los procesos por los que se
adjudican a los alumnos; unos procesos que tienen mucho que ver con una
tpica conducta simplificada de toma de decisiones por parte del profesor.
En este sentido, algunos estudios sealan cmo la toma de decisiones se realiza
frecuentemente urgida por exigencias administrativo-institucionales y por las
necesidades del momento, sin una oportuna elaboracin de acuerdo con algn
modelo estructurado.
3. Se suele considerar tambin que los instrumentos de evaluacin se usan
a menudo con fines distintos para los que fueron diseados; por ejemplo, prue-
bas destinadas a identificar logros de los alumnos se utilizan como variable
exclusiva para valorar centros o profesores.
Si la eficacia de la instruccin se juzga desde instancias externas slo a partir
de las respuestas en los exmenes, surge en los profesores la tentacin de prepa-
rar a los alumnos para lo que se les va a exigir en las pruebas; tanto ms si las con-
secuencias de las malas notas recaen personal y directamente en el profesor. La
Problemtica en tomo a la evaluacin de aprendizajes 15
excesiva influencia de los exmenes hace que puedan modificarse las calificacio-
nes: la prctica puede ir desde capacitar a los alumnos exclusivamente en los con-
tenidos de los que se van a examinar o ensear las respuestas de lo que se va a
preguntar, hasta subir la nota; lo que muestra que el fin influye en la enseanza.
Otras veces, es el mismo profesor el que decide incluir en las calificaciones
factores distintos del grado de adquisicin de objetivos de aprendizaje (Stig-
gins, Frisbie y Griswold, 1989). Se conceden notas altas como premios y bajas
como castigos, convirtindolas as en instrumentos de control en clase. El uso
de las calificaciones para estos propsitos se acepta slo si revierte indirecta-
mente en una mejor disposicin hacia el aprendizaje (una asignatura que no se
califica se convierte en una mara); porque, de lo contrario, se estara comuni-
cando a los alumnos que se prima ms el comportamiento social que el apren-
dizaje de las metas del programa de la escuela.
En general, se admite por muchos que los alumnos que hacen ms esfuerzo
y demuestran ms deseo de aprender deben ser recompensados por ello; por
lo que un reto significativo para todo profesor es encontrar formas de premio,
distintas a las calificaciones, que puedan estimular a los alumnos a actuar cerca
de los niveles ptimos de su capacidad cognitiva. Esta no es una tarea fcil,
puesto que los alumnos responden de manera diferente a las palabras de elo-
gio, a las notas oficiales, a las caras sonrientes ya privilegios especiales.
Slo si desarrollar actitudes de los alumnos hacia algo o su disposicin a
esforzarse figuran entre los objetivos de aprendizaje programados, y si el profe-
sor ha planificado procedimientos instruccionales para ayudar a los alumnos a
desarrollar estos comportamientos, se puede juzgar apropiado considerados en
la asignacin de las calificaciones.
4. La presin sobre profesores y alumnos para alcanzar calificaciones altas
ha llevado a disear currculos dirigidos por los exmenes, es decir, a suprimir
aquellos temas o materias que no se van a controlar, con lo que los exmenes se
convierten en programacin. As, se critica que a veces se ensea para aprobar
exmenes, ms que para alcanzar unos objetivos basados en unos intereses per-
sonales o en unos valores o necesidades sociales. De aqu el aforismo de que
los que construyen las pruebas controlan el programa )~en ltimo trmino, el
aprendizaje de los alumnos. Parece que esto ha influido en las prcticas educati-
vas ms de lo conveniente.
5. Con frecuencia se seala que hay un gran desfase entre la teora y la
prctica; incluso entre los materiales disponibles y esa misma prctica. Las cau-
sas son muy complejas: burocracia escolar, presin de tiempo, prejuicios acien-
tficos, actitudes tpicas de profesores y alumnos conformadas por aos de
experiencia escolar, inercia y rutina de las tcnicas de evaluacin tradicional,
etc. Esto no se puede corregir ni fcilmente ni muy de prisa.
A este desfase contribuye no poco la confusin patente en la bibliografa y
en la normativa al respecto, como lo pone de manifiesto Juan Manuel lvarez
Mndez (1994: 316) cuando escribe:
16 La evaluacin de aprendizajes
Pero sobre todo faltan estrategias para evaluar las capacidades afectivas. Con
demasiada frecuencia se califican contenidos actitudinales sin base objetiva, por
lo que no es extrao que tales calificaciones estn tan des prestigiadas y devalua-
das, tanto para profesores como para alumnos.
8. Frente a las crticas de algunos autores referentes a las limitaciones de la
evaluacin, otros sealan que stas van ms all de lo racional: porque no se
pueden medir algunos logros educativos, se concluye que no se puede medir
ninguno; porque no se pueden operativizar todos los fines educativos, se relega
todo intento de operativizacin previa y necesaria para una medida adecuada;
porque la maduracin de una persona transciende la educacin formal, ni se
intentan controlar los logros de la misma; porque se defiende que la evaluacin
debe ser un instrumento de investigacin didctica y de informacin, se olvidan
otros pasos intermedios y, en todo caso, indispensables para realizar tal investi-
gacin, como es la medida rigurosa y explcita de los aprendizajes.
9. Por ltimo, los que defienden como fin de la evaluacin informar al alum-
no de su logros y causas, sin valoracin por parte del profesor, censuran lo que
la evaluacin tiene de control y seleccin. A este respecto Gimeno (1981: 217),
recogiendo el sentir de otros muchos autores, escribe que la evaluacin debera
tener como funcin bsica: "... de cara al alumno, una informacin que le
ayude a progresar hacia el autoaprendizaje, ofrecindole noticia del estado
en que se encuentra y las razones del mismo, para que coja l mismo este
dato como gua de autodireccin, meta de toda educacin.
* * *
Para llegar a una definicin equilibrada, ayuda analizar su relacin con los
dems elementos del currculo, programacin y metodologa, as como con los
fines para los que se emplea.
a) Se suele admitir que la evaluacin marca la diferencia entre un currculo
de una sola direccin, de profesor a alumno, en consecuencia asimtrico
o balstica en palabras de Bell (1981), y un proceso interactivo simtri-
co que proporciona feedback y provoca cambios tanto en profesores
como en alumnos.
La evaluacin sirve tambin para relacionar los otros elementos del currcu-
lo es decir, para relacionar los medios con los efectos que produce la
educacin, juzgando la pertinencia y eficacia de ambos.
Modificar un programa, o incluso unas estrategias de enseanza, sin cam-
biar el sistema de evaluacin, tiene todas las probabilidades de no condu-
cir a nada. Por el contrario, la experiencia dice que, si se modifica el siste-
ma de evaluacin, aun sin modificar explcitamente el programa de
enseanza, es mayor la repercusin sobre el aprendizaje. A esto se refie-
re el aforismo ya citado de que quien controla el examen controla el pro-
grama que se lleva a cabo.
Es importante la planificacin previa de un sistema de evaluacin que
pueda servir de base a la preparacin de un programa. La evaluacin nos
da una medida del nivel del que se parte, el nivel al que se llega y del
progreso realizado. Pues bien, este proceso debe comenzar ya en el mis-
mo momento de la programacin de objetivos de aprendizaje, precisan-
do en la formulacin de los mismos el criterio, grado de perfeccin o
nivel aceptable de la actuacin esperada del alumno.
b) Los fines explcitos de la evaluacin se enumerarn al tratar del para qu
evaluar; pero, adems, una serie de fines se esconden tras el currculo
oculto. Por citar uno, el prestigio de la institucin: no siempre tal prestigio
logrado a travs de la evaluacin es de absoluto inters para los centros,
ya que algunos no lo han adquirido por el resultado de sus exmenes,
sino por una larga tradicin; por el contrario, otros centros acostumbran a
dar a conocer el porcentaje de alumnos que tiene xito en pruebas de
todo tipo, como medio para consolidar su prestigio.
Todo ello, fines y relacin con los otros elementos curriculares, puede dar
pistas para formular una adecuada definicin de evaluacin.
2. Qu: Qu intentamos evaluar? La evaluacin educativa puede recaer
sobre sistemas, instituciones, docentes, etc. En el presente trabajo nos centra-
mos exclusivamente en el estudio de la evaluacin de aprendizajes de los alum-
nos en el marco de una instruccin formal. Para asegurar la validez de esta eva-
luacin, es decir, para evaluar realmente lo programado, es necesario, entre
otros requisitos, describir rigurosamente las capacidades y los contenidos cien-
tficos especificando los indicadores pertinentes. Comprende, por consiguiente,
Problemdtica en torno a la evaluacin de aprendizajes 19
4. LA REFORMA TYLERIANA
OBJETIVOS
(1)
La evaluacin educativa, dice Tyler (1973: 109), es aquel proceso que tiene
por objeto determinar en qu medida han sido alcanzados los objetivos pre-
viamente establecidos. Como consecuencia, precisa las siguientes condiciones
de una buena evaluacin: a) propuesta clara de objetivos; b) determinacin de
las situaciones en que se estima que el alumno manifiesta la conducta esperada;
c) eleccin de instrumentos apropiados de evaluacin, normalmente tests; d)
interpretacin de los resultados de las pruebas; e) determinacin de la fiabili-
dad y objetividad de las medidas.
Podra representarse este proceso con el siguiente esquema:
Especificacin de objetivos
COMPARACiN
Elaboracin de pruebas
EL PERFECCIONAMIENTO DE LA ACTIVIDAD
5. EVALUATIVA: LA TOMA DE DECISIONES
A principios de los aos sesenta, resultaba muy llamativo el divorcio entre las
acciones del proceso instructivo y los referentes que servan para valorado. La
crisis econmica obligaba a cuestionar muy seriamente la rentabilidad de las
inversiones educativas, lo que provoc la proyeccin de la eficacia de esquemas
de evaluacin empresariales al mundo educativo por parte de autores como
Cronbach, Suchman, Scriven, etc.
Esta visin crtica, junto al sndrome Sputnik, condujeron, en 1965, a esta-
blecer en Estados Unidos el Acta de la Educacin Elemental y Secundaria
(ESEA)ya crear el National Study Comitte on Evaluation. Tomaban definitiva-
mente cuerpo nuevas conceptualizaciones al establecer una evaluacin que no
slo pretende constatar el rendimiento del alumno relacionando los resultados
con los objetivos, sino que introduce ya explcitamente la toma de decisiones
Evolucin del concepto de evaluacin educativa 33
o realmente han
(Las yoperaciones
observadas
Operaciones
e(5deseados
ecomo
deseados
:::l
acontecido)
planeadas oQ) verdaderamente
Antecedentes observados
Antecedentes
Resultados
Relacin
(Las
(Los emprica
condiciones
se han existen)
resultados
obtenido) que
que
esea
peraciones
Operaciones
actividades
o, ro "O"O
Q)
que pasen)
como 'uro
<..>
actividades
Relacin emprica
elacin
egar)
stir) lgica
ue
gica
7.1. Enfoquecondudual
Prescindiendo de posturas extremas, como la de Watson, que casi nunca entra-
ron en el mbito educativo, es uno de los enfoques que sigue influyendo en las
evaluaciones docentes. Considera que los comportamientos de un sujeto son
fundamentalmente una consecuencia de lo que aprende. Lo mental es cualitati-
vamente similar a la conducta manifestada; por consiguiente, la evaluacin se
basa en el estudio de la conducta observable que puede ser comprobada por
observadores independientes.
Como la conducta queda definida por el binomio estmulo-respuesta, es decir,
por la relacin entre los factores ambientales -estimulos- y los factores conduc-
tuales -respuestas-, la obtencin de la informacin sobre esa conducta consis-
te en un anlisis (coincide con el modelo A-B-C,es decir anlisis del comporta-
miento [B=behavior], sus antecedentes [A]y sus consecuentes [C]), cuyas fases,
segn Peterson (1968), son: a) observacin sistemtica de la conducta, en nuestro
caso de los aprendizajes del alumno; b) observacin sistemtica de la condicin-
estmulo que precede al comportamiento; c) manipulacin experimental de una
condicin que est relacionada funcionalmente con la conducta; d) observacin y
registro posterior de los cambios en el comportamiento.
La evaluacin conductual se realiza bsicamente a partir de una valoracin
criterial (cap. 13), y los criterios se toman de la fuente sociolgica del currculo.
Se trata, por tanto, de comprobar la presencia o ausencia de aquellas conductas
o de aquel conjunto de repertorios conductuales precisados en objetivos opera-
tivos que vienen exigidos por la sociedad.
El enfoque conductual desemboca fundamentalmente en la evaluacin
cuantitativa, que histricamente se redujo de hecho a la medida del xito o fra-
caso de los resultados del aprendizaje con valoraciones criteriales sumativas
(cap. 15), por mucho que sus defensores manifiesten en teora que este tipo de
evaluacin no tenga que reducirse a una clasificacin de alumnos por su capaci-
tacin" sino que, slo a partir de la valoracin de rendimientos, se puede y
debe llegar al anlisis y a la valoracin de la metodologa empleada, de la com-
Evolucin del concepto de evaluacin educativa 39
Enfoquecognitivo 7.2.
Este enfoque est representado por Ausubel (1976) y tambin por Ausubel y
Sullivan (1980), que consideran que la evaluacin ha de tener en cuenta el modo
en que los sujetos representan e! conocimiento en sus estructuras previas.
Esta forma de evaluar (Greeno, 1980) viene determinada por la necesidad
de utilizar en la evaluacin las mismas tcnicas de representacin que los profe-
sores usan para ensear y los alumnos para aprender conceptos, mtodos y
destrezas propios de su proceso de aprendizaje. Estas tcnicas son las redes
semnticas que sirven de gua para formular las pruebas de evaluacin.
Posner (1979) tambin se vali de las redes semnticas para explorar lo que
saban sus alumnos antes y despus de un proceso de enseanza-aprendizaje.
Antes, para comprobar los conocimientos previos con respecto a los objetivos
nuevos que se iban a transmitir; y despus, para valorar la modificacin de las
estructuras previas y la forma en que se ha integrado la nueva informacin.
En una lnea muy parecida, Novaky Gowin (1988) utilizan para evaluar aprendi-
zajes los mapas conceptuales mediante la comparacin entre el mapa conceptual
elaborado por e! alumno y un modelo establecido previamente por e! profesor.
Tambin sugieren, en la lnea de Posner, la posibilidad de comparar los mapas con-
ceptuales de! alumno antes y despus del proceso de instruccin.
La conclusin ms importante que se puede obtener a partir de este enfo-
que es la necesidad de evaluar teniendo como referente los conocimientos pre-
vios del alumno, que constituirn la base para la valoracin de los nuevos
aprendizajes, para establecer a partir de los mismos los avances conseguidos y
la posterior toma de decisiones.
LA PRCTICA EVALUATIVA
EN LA ACTUALIDAD 8.
profesores el modelo que han soportado como alumnos, nos encontramos con
que actualmente an subsisten en una extraa convivencia muchos de los enfo-
ques o modos de evaluar conductuales,neoconductuales y cognitivos que han
ido apareciendo a lo largo de la historia de la educacin, algunos de los cuales
han sido objeto de estudio en el presente captulo. Podramos decir que cada
una de esas aproximaciones evaluativas mantiene hoy lo que de ms relevante y
prctico haba en ellas. Como novedad relativa en la actualidad, se pueden citar
los matices que introducen tres nuevos enfoques.
8.1. La evaluacincualitativa
8.3. La evaluacinadaptativa
test que mejor se adapta a sus caractersticas. Las ventajas que esto conlleva son
enormes, tanto en la precisin de las mediciones como en el tiempo invertido,
incluso en la satisfaccin de los examinados, que de este modo se enfrentan a
pruebas acordes con su nivel, por lo que se minimizan los aspectos frustrantes
que lleva anejos toda evaluacin. En algunos pases, este tipo de evaluacin se
est imponiendo rpidamente por las ventajas que ofrece tanto para el examina-
dor como para los examinados (Olea, Ponsoda y Prieto, 1998, 1999; Muiz,
1996; Renom, 1993, 1997; Van der Linden y Glass, 2000; Wainer, 1990). El uso
de los TAl plantea todo un conjunto de problemas tcnicos nuevos sobre los
que trabajan intensamente los especialistas en la actualidad. Cabra citar, por
ejemplo, la nueva forma de estimar la fiabilidad mediante la Funcin de Infor-
macin, que permite calcular la precisin de las pruebas para los distintos nive-
les de la variable medida, en vez de ofrecer un valor global como haca el coefi-
ciente de fiabilidad clsico; o los nuevos mtodos para evaluar el sesgo de los
instrumentos de medida, en la actualidad rebautizados como Funcionamiento
Diferencial de los tems (Camilli y Shepard, 1994; Fidalgo, 1996; Holland y Wai-
ner, 1993).
Un campo clsico de la medicin educativa como son los TestsReferidos al
Criterio (Berk, 1984; Glaser, 1963; Muiz, 2003; Popham, 1978), ha cobrado un
nuevo impulso gracias a la TRl, sobre todo en lo relativo a la estimacin de la
fiabilidad, mediante la funcin de informacin, la cual posibilita un estableci-
miento ms riguroso de los puntos de corte, de modo que minimicen los erro-
res al clasificar a las personas segn dominen o no el criterio/dominio evaluado.
Los mtodos para establecer los puntos de corte de forma rigurosa siguen
generando en la actualidad abundantes investigaciones, dada la relevancia que
ello puede tener para la vida acadmica y profesional de muchas personas
(Berk, 1986, 1996; Cizek, 1996; Muiz, 2003). Otro campo clsico que ha sido
muy potenciado por la irrupcin de la TRl ha sido la construccin de los tems
(Haladyna, 1994; Osterlind, 1998), al convertirse stos en la unidad de medicin
y anlisis en detrimento del test, como queda bien patente en la propia denomi-
nacin de la TRl. Asimismo, la construccin automtica de tems y tests por
ordenador (Hambleton, Slater, Narayana y Setiadi, 1996) es otra lnea en la que
se trabaja activamente.
Si bien las lneas y temas sealados ocupan las energas de la mayora de
investigadores y profesionales en la actualidad, a la vez que constituyen el para-
digma dominante en la medicin educativa, existen otros anlisis y posiciona-
mientas que pugnan por abrirse paso. Es el caso, por ejemplo, de todo lo rela-
cionado con la tica y deontologa de la evaluacin educativa, y es que de poco
vale una tecnologa de evaluacin poderosa sin las riendas tico-deontolgicas.
No hay que olvidar que se evala a personas y sobre ellas se toman decisiones,
de modo que toda precaucin en este sentido es poca. Los profesores, amn de
otros colectivos relacionados con la educacin, y la propia administracin debe-
ran ser conscientes de la necesidad de una buena preparacin en la tecnologa
de la evaluacin, lo que redundara en beneficios para el proceso educativo y
44 La evaluacin de aprendizajes
para los alumnos evaluados. En este sentido, son muy interesantes las directri-
ces elaboradas por la federacin de profesores americanos y otras asociaciones
sobre las competencias requeridas por los profesores para evaluar a los alum-
nos (American Federation of Teachers, 1990), as como las directrices para el
uso adecuado de los tests en mbitos educativos elaboradas por varias organiza-
ciones educativas Goint Committee on Testing Practices, 1988).
Finalmente, no se puede pasar por alto el chisposo debate surgido en tor-
no a lo que ha dado en llamarse un tanto pretenciosamente evaluacin autn-
tica (Bravo y Fernndez del Valle, 2000; Hakel, 1998; Powell, 1990), como si
otras formas de evaluar no lo fuesen. Los partidarios de este enfoque argumen-
tan a favor de una evaluacin alejada de situaciones estandarizadas en cuanto a
formato de respuesta de las pruebas y otros aspectos, abogando por dar un
mayor realismo al proceso evaluativo, para acercar la evaluacin lo ms posible
a la situacin real que se pretende medir. En realidad, esto no es nada nuevo,
pues tcnicas como el muesfreo de conductas reales en el puesto de trabajo o
la utilizacin de centros de evaluacin en los que se simulan las condiciones
reales son bien conocidos y utilizados en psicologa industrial y del trabajo des-
de hace mucho tiempo. En el mbito educativo, dos formas de evaluacin en
esta lnea autntica seran la evaluacin de rendimientos (Performance
Assessment) y el portafolio. En la evaluacin de rendimientos, se trata de eva-
luar a travs de ejecuciones concretas del examinado, en vez de utilizar pruebas
estandarizadas. En el caso del portafolio, la idea es que el alumno presente un
portafolio o carpeta en la que incluya todos los trabajos que considere oportu-
nos para demostrar su preparacin en un determinado campo. De entrada, la
idea de introducir realismo en el proceso evaluativo parece razonable, pero su
implementacin en la prctica conlleva numerosos problemas an no bien
resueltos, como es la estimacin de la fiabilidad de las evaluaciones o su eleva-
do coste en tiempo y dinero. El debate sigue abierto y, hoy por hoy, no hay evi-
dencia emprica de que estas alternativas ofrezcan mediciones ms fiables y vli-
das que las aportadas por las evaluaciones convencionales estandarizadas; y
stas y otras propiedades psicomtricas son irrenunciables, hgase la evaluacin
en nombre del principio que se haga. Al hilo de este planteamiento de la eva-
luacin autntica, se reabren viejas polmicas, como el uso de los tems de
eleccin de respuesta frente a los de respuesta construida (Hakel, 1998; Oster-
lind, 1998), o se retornan otras latentes como la surgida en torno a la validez
consecuencial (Messick, 1989), relativa a si el estudio de la validez debe o no
de incluir las consecuencias del uso de los tests. Nadie duda de que vigilar el
uso adecuado de los tests es de suma importancia, pues la mayora de los 21:>U-
50S se producen ms por la mala prctica que por fallos en las propiedades psi-
comtricas de las pruebas (Frederiksen, Mislevyy Bejar, 1993; Gonzlez-Rom y
Espejo, 2003; Prieto y Delgado, 1996, 1999, 2003); pero el que esto sea as no
parece avalar que haya que incluir las consecuencias del uso de los tests en los
anlisis de validez, pues ello sacara la validez del mbito tcnico y cientfico
donde se encuentra para alojada en el ms resbaladiZO de los valores. Mezclar
Evolucin del concepto de evaluacin educativa 45
ambos tipos de problemas no parece que vaya a ser beneficioso ni para la vali-
dez ni para la mejora del uso de los tests.
Adems de estas razones, la utilizacin de aplicaciones informticas enrique-
cidas con medios audiovisuales e internet est potenciando de manera insospe-
chada la utilizacin de bancos de pruebas objetivas de estructuras varias (Pars-
hall y Balizet, 2001; parshall, Davey y pashley, 2000; Zenisky y Sireci, 2000).
Queden ah estos apuntes generales sobre algunos de los temas que ms aten-
cin estn recibiendo actualmente en el campo de la medicin educativa. Otros
muchos podran citarse, lo que pone de manifiesto la gran actividad investigadora
que est teniendo lugar en este mbito con tan fuertes implicaciones sociales.
LA EVALUACiN EN EL SISTEMA
EDUCATIVO ESPAOL 9.
A modo de conclusin
minados aprendizajes por parte del alumno, al evaluar stos, no slo algn tipo
de aprendizaje sino su desarrollo global, debemos valorar por aadidura su efi-
cacia como sistema total.
De evaluar restrictivamente conductas finales observables de los alumnos se
pasa as, desde posiciones cognitivistas, a planteamientos evaluativos globales
de cariz cualitativo; en donde la evaluacin se entiende ms como comprensin
profunda e iluminacin de las caractersticas de los alumnos, teniendo en cuen-
ta todas sus formas de representacin tanto en los procesos como en los pro-
ductos del aprendizaje.
Estas exigencias siguen aumentando hasta llegar a solicitar cada vez ms
informacin sobre aspectos de la personalidad del alumno, desde la perspectiva
de la Psicologa cognitiva y, desde la perspectiva sociolgica, sobre las circuns-
tancias que le rodean; y hasta reclamar una apertura conceptual que d cabida
en la evaluacin a resultados no previstos y acontecimientos imprevisibles. Esto
es, evaluacin ms all de los objetivos y de la realizacin correcta de una activi-
dad (exigencia que tiene sus races en la nocin vygotskyana del ZDp,citada en
el cap. 15), enfocada al tipo de ayuda que el aprendiz necesita. La dificultad de
explicitar todo ello para que no quede en una arbitrariedad subjetiva y en
estructurado para poder ser interpretado lleva en algunos casos al desaliento y,
en definitiva, al abandono de la toma de decisiones externa al alumno. El eva-
luador se tendr que limitar a recoger informacin de manera neutral para que
sean los interesados los que las tomen. Despus de tan largo camino, evaluar se
reduce a informar.
Desde la perspectiva cuantitativa, sin abandonar nunca la posterior toma de
decisiones externa, tambin se sinti la necesidad de ampliar el campo de las
informaciones, que se mantuvieron, no obstante, parceladas y operativizadas. A
esto responde la aparicin de taxonomas que distinguen mltiples capacidades
para fijar como eje de referencia aspectos de carcter cognoscitivo, psicomotriz
o afectivo.
* * *
interno del alumno, la medida de lo que es, sabe y puede hacer, indispensable
para una toma de decisiones adecuada.
Tendencia cualitativa: Entre los autores de esta tendencia se encuentran
Dewey, parlett, Stake, Stenhouse, etc. Su enfoque educativo en general, y res-
pecto a la evaluacin en particular, se enmarca dentro de los siguientes rasgos
caractersticos.
Los cuatro primeros apartados recogen algunas de las ideas que ya en abril
de 1952 intent exponer Rogers en la Universidad de Harvard. La conferencia,
que se hizo famosa aunque dur apenas 10 minutos, tuvo la virtud de exasperar
a los presentes ya muchos de los que luego tuvieron la oportunidad de enterar-
se de su contenido, y por ello se conoce como la bomba pedaggica de
Rogers.
a) El fin de la educacin es el desarrollo personal y social, hasta alcanzar
autoestima y seguridad, para llegar a un bienestar. El referente evaluador
no est siempre explicitado de forma plena y total, acentuando la liber-
tad de! sujeto y dejando un amplio margen a la subjetividad.
b) La organizacin escolar est orientada a favorecer laflexibilidad en pro-
gramas, objetivos, mtodos, etc.
c) El currculo est centrado en el cliente; el alumno, en sus necesidades
individuales, sentimientos, intereses, estilos de aprendizaje, etc.
d) El profesor es e! motivador yfacilitador de todo e! proceso de aprendi-
zaje.
e) La funcin principal de la evaluacin es la de diagnosticar y servir de
feedback para mejorar el rendimiento, dando prioridad a la riqueza
sobre el rigor evaluativo. Se concibe la educacin como permanente en
un sistema cerrado del que nadie sale. En vez de seleccionar, la evalua-
cin busca las condiciones que capaciten a cada individuo a alcanzar su
techo de desarrollo.
Por e! contrario, la evaluacin educativa clsica ejerce una influencia distractora
y hasta nociva sobre alumnos, profesores y el proceso de aprendizaje, porque:
En todo sistema fsico (partculas) o social (personas), cuando se introdu-
ce un elemento extrao para medido, se perturba, y puede llegar a des-
truir e! sistema. Ejemplos son e! termmetro que modifica la temperatura
de un vaso de agua, e! encuestador que distorsiona con su mera presencia
los comportamientos de los encuestados o e! examen para e! alumno.
Adems, los comportamientos mejores no se pueden describir porque
apenas si son observables; slo se miden los resultados menos nobles
de la educacin porque suelen ser ms fcilmente observables.
El individuo es capaz de dirigirse a s mismo, y de encontrar en su pro-
pia naturaleza su equilibrio (homeostasis) y sus valores, sin que nadie
decida por otros. Ponen el ejemplo de la nutricin infantil.
Evolucin del concepto de evaluacin educativa 51
* * *
o x y z
Estas medidas son, en definitiva, juicios en los que se afirma que dichos seg-
mentos son iguales o dos/tres veces mayores que el patrn unidad.
Propiedades de la medida: En toda medida, si podemos realizar con las
variables unas ciertas operaciones, las propiedades de estas ltimas deben con-
servarse tambin en los nmeros que representan las medidas. Estudiaremos,
sin embargo, slo las dos que nos interesarn cuando hagamos las aplicaciones
a la medida en educacin.
1. Propiedad de orden: Si una cualidad es ms intensa que otra, los nme-
ros que representan estas cualidades deben ser tambin uno mayor que otro.
Por ejemplo, la medida de un segmento S) es 4, y la de otro S2es 2; si el pri-
mer segmento es mayor que el segundo, sus medidas tambin deben serio:
meS)) = 4 m(S2) = 2
meS)) > m(S2) 4 >2
[meS) es la medida del segmento S]
Escalas: Son escalas los distintos modos de asignar nmeros. Para medir las
variables, segn su naturaleza, hay que utilizar diferentes tipos de escalas, que
no siempre cumplen las dos propiedades mencionadas. Por tanto, nos interesa
destacar la clasificacin de las escalas de medida, indispensables para clarificar
posteriormente el concepto de medida en educacin.
La medida en educacin. 1. Recogida de informacin 57
1. APLICACIONES A LA EDUCACiN
el . . k3,
k2, k'2' k"2
kp k'p
k'3' k"l
k"3
e2 .
e3
Por ejemplo, la amplia gama de comportamientos (kl' k\, k\) que supone
hacer sumas disponiendo los sumandos de diversas maneras, realizando los clcu-
los por diversos procedimientos, etc., la relacionaramos con un estado interno
(el) del alumno; el hecho de que realice multiplicaciones tambin de diversas
maneras (k2, k'2, k"Z) lo asociaramos con otro estado interno del aprendiz (ez);
y as sucesivamente.
Variable y objetivo: Cada familia de comportamientos tambin se relacio-
na con un objetivo. Grficamente:
el . kp
k2, k'2'
k3, k'3'
k\, k"2."
k'\ .
k"3 01
03
O2
e2
e3 ..
tancia que queda por recorrer para alcanzados; como aparece en el siguiente
esquema:
(eO,el) . (~,kl) . 01
(eo,e) '111( . (~,kz) '111( . 0z
(eO,e3) . (~,k3) . 03
5 7 10
01: Crculo
Oz: Cuadrado
03: Rectngulo
04: Rombo
05: Trapecio
06: Sector circular
07: Corona circular
aa
O
LENGUA: Realizar composiciones escritas:
, 01: Descripcin
Oz: Narracin
VO
a-zlO
03: Dilogo
04: Cartas comerciales
05: Impresos
Se est utilizando una escala ordinal, como la que se usa para medir la belle-
za. Sera ms discutible el uso de una escala de intervalo, como la utilizada para
medir temperaturas, ya que sera difcil sostener la igualdad de distancias entre
(er!Ko) H (e!K) H (e/Kz) H (e31Ks).En estos casos de inclusividad de los
objetivos, est justificado utilizar los cdigos tradicionales de O a 10 o de sus-
penso a sobresaliente de una escala ordina!.
o Media ponderada
coeficiente, igualo distinto, a cada objetivo que marque su peso especfico rela-
tivo; determinacin que, como cualquier otra, puede estar teida de subjetivi-
dad y restarle rigor.
Por ejemplo, si un alumno en una prueba no responde a las preguntas
correspondientes a los dos primeros objetivos, cuyos coeficientes son 10% para
el objetivo 01 y 30% para 02' pero lo hace a las de los dos ltimos, cuyos coefi-
cientes son 20% para 03 y 40% para 4, el resultado global [R] ser:
1 0,1 (10%) o
0,3 (30%) O
2
3 0,2 (20%) 10
4 0,4 (40%) 10
Este 6" est ya afectado por los coeficientes. El rigor va quedando ms dete-
riorado en el caso de tener que hallar la media ponderada de resultados de par-
tes muy distintas de una materia, y ms aun si es de distintas asignaturas.
Es importante tener presente este modo de proceder cuasiautomtico, pero
subjetivo, para obtener los datos de la evaluacin educativa, con objeto de des-
mitificarlos de su aureola de precisin que con todo fundamento subrayan las
crticas conocidas. Porque la realidad es que muchos profesores, una vez que
llegan a un 4,5, se olvidan de sus ingredientes subjetivos y lo consideran como
los 4,5 m de longitud de una viga. Las medidas en educacin no son homog-
neas como las del orden fsico; difieren en las escalas y, por tanto, en la exacti-
tud de las unidades, en la situacin del cero, etc. Por todo ello, algunas de las
cosas que hacemos con los resultados de las correcciones de los exmenes,
tales como calcular medias, desviaciones, coeficientes de correlacin, slo tie-
nen sentido y valor si se las somete a una interpretacin adecuada. Es necesario
ser conscientes de las limitaciones de nuestras medidas, pero no por eso debe-
mos dejar de hacer lo que nos parece til; y una de esas cosas tiles es medir
los aprendizajes sin olvidar, no obstante, las licencias que nos tomamos.
Debemos tambin recordar que una misma medida puede representar
diversas cualidades (las familias de comportamientos antes mencionadas); un
4,5 no significa exactamente lo mismo en todos los alumnos.
Por ltimo, conviene reiterar una vez ms que la medida es un elemento de
la evaluacin, y la recogida de informacin es un aspecto de la medida, porque
a partir de ella debe emitirse un juicio de valor para poder tomar decisiones:
volver a estudiar la leccin, estudiar otros temas, pasar curso, repetir, etc. Y
deben tomarse no slo a partir del juicio o calificacin hecha con el resultado
64 La evaluacin de aprendizajes
Por razonable que en apariencia parezca dar este peso diferente a cada pre-
gunta, algunos autores sostienen que tiende a tener efectos relativamente
pequeos y rara vez proporciona resultados ms vlidos o fiables. Los datos
de la tabla siguiente, tomada de Evaluation and Examination Service
(1982). (Evidence far nat weighting abjective test items, EES Memo n. 5I.
Iowa City, IA: University of Iowa), sobre los efectos de distintos pesos espe-
cficos de tems aplicados en cuatro exmenes, avalan esta afirmacin de
que no hay ventaja obvia cuando se usan pesos especficos distintos:
Examen 21
83
41alumnos
160
50
90
34
105
N N 8ien: especfico
tems
8(1-140)
8(1-45)
8(1-70)
Peso +4 Correlacin
===0,945
+1 0,976
00,983
+1
+1 ,923
INSTRUMENTOS DE EVALUACiN 2.
Se trata de estudiar los formatos o tipos de pruebas con los que se puede reco-
ger la informacin sobre el rendimiento de los alumnos. Ostedind (1998) defi-
ne instrumento de evaluacin como un instrumento de medida que propone
al alumno un estmulo y una forma prescriptiva de emitir una respuesta, a partir
de la cual se puede deducir la consecucin de un objetivo de aprendizaje; dicho
de otro modo, se entiende por instrumentos de evaluacin aquellos recursos
que, en diferentes situaciones, facilitan identificar modos de actuacin como
indicadores para medir el grado de consecucin de objetivos de aprendizaje.
Estas situaciones no deben limitarse a las pruebas orales y escritas. El recurso
ms tradicional o novedoso y e! indicio ms pequeo que ayuden a un docente
a comprender mejor a un alumno, o que ayuden a un alumno a comprenderse
mejor a s mismo, deben considerarse como vlidos, siempre que en alguna
medida puedan estimarse. Conviene, por tanto, esforzarse en obtener todos los
indicios a travs de todos los medios apropiados.
Dado que a los objetivos de aprendizaje no se accede de modo inmediato,
se usan instrumentos que proporcionen datos a partir de los cuales se pueda
inferir si el alumno los ha alcanzado. Los diversos modos de actuacin de los
alumnos servirn como indicadores del grado de consecucin de los objetivos,
aunque indicadores aislados no sirven para evaluar la complejidad del compor-
tamiento de un alumno. De ah la necesidad de ir integrando todas las informa-
ciones que se puedan obtener a travs de los diversos instrumentos de evalua-
cin; diferentes de las actividades de enseanza-aprendizaje en la medida en
que pretenden valorar el grado de consecucin de unos objetivos. Tanto unos
como.otras incluyen procesos mentales sobre contenidos cientficos, pero difie-
ren en e! fin para el que se usan: en un caso son estrategias de aprendizaje y en
otro, instrumentos de evaluacin que pretenden provocar una respuesta defini-
da de! alumno. Una situacin que supusiera cualquier respuesta, como en algu-
nos casos la observacin y las encuestas, permitira considerada como instru-
mento de evaluacin slo desde un punto de vista analgico.
Por tanto, la evaluacin de aprendizajes necesita una amplia gama de instru-
mentos -tests o exmenes compuestos por tems, preguntas o pruebas (trmi-
nos con significados diferenciados, pero que usamos indistintamente)-que
respondan a ciertas cualidades, con el fin de que los datos obtenidos puedan
valorarse y significar algo para e! propio alumno, para el profesor, para la institu-
cin educativa y para la sociedad que, en ltima instancia, ha establecido la
estructura educativa. Y no vale apelar a refugiarse en la connotacin peyorativa
que la palabra examen encierra para, por ello, estar en contra de los mismos;
porque todo profesor examina y califica.
Disear situaciones para comprobar la consecucin de objetivos de aprendi-
zaje es una tarea de gran importancia en educacin. Aunque siempre hubo y
sigue habiendo otros protocolos, esta tarea frecuentemente se reduce a cons-
70 La evaluacin de aprendizajes
truir preguntas de manera precisa y breve para poder deducir, de las respuestas
de los alumnos, conclusiones vlidas y fiables sobre la adquisicin de objetivos
referidos a capacidades de diversos mbitos, en especial los cognoscitivos. Es
una tarea difcil, entre otras razones porque, con frecuencia, los tems se redu-
cen a una simple frase que ofrece pocas oportunidades para describir un con-
texto que aclare su significado; por otra parte, tampoco es fcil establecer la
indispensable relacin entre pregunta y objetivo que reduzca las fuentes de
error y aumente la validez y fiabilidad de los resultados. Todo ello es un reto a la
creatividad y experiencia del profesor.
El anlisis de los exmenes corrientemente utilizados muestra que, a veces,
las preguntas adolecen de muchos defectos, entre los que podemos citar (Guil-
bert, 1989):
1. Futilidad: Se entiende por futilidad la poca importancia de las pregun-
tas. La prueba pierde utilidad cuando el nmero de preguntas que emplea cons-
tituya una pequea muestra de todas las posibles.
Ms grave es el conservadurismo que obliga al alumno a responder de acuer-
do con los prejuicios o incluso las posibles ideas desfasadas del examinador.
2. Ambigiiedad: La ambiguedad del lenguaje empleado puede hacer que
el alumno tenga que dedicar ms tiempo a la comprensin de la pregunta que a
respondeda, con el riesgo aadido de no contestar a lo que se le pide.
Esta ambiguedad resulta mayor cuando existen errores en la redaccin de
las preguntas, o cuando constituyen una trampa que enmascara datos necesa-
rios para dar la adecuada respuesta. Por otra parte, la formulacin defectuosa
delos tems puede dar pistasy sugerir las respuestas a los alumnos.
3. Complejidad: Por un lado, la complejidad de la materia puede hacer
que la bsqueda de la respuesta correcta suponga ms dificultad de la prevista.
Ms grave, sin embargo, es la complejidad de las instrucciones: ciertas pruebas
incluyen algunas tan complejas o variadas (cada pregunta lleva unas distintas),
que lo que se evala es mucho ms la aptitud del alumno para descifrar las ins-
trucciones que el nivel real de sus conocimientos y su capacidad para utilizados.
Esto es especialmente importante en las llamadas pruebas objetivas (PO).
4. xito en los exmenes: Sobre todo en las pruebas objetivas (PO), los
alumnos desarrollan un sexto sentido que les lleva a predecir las preguntas
que van a salir, su estilo, su forma, etc.
Otros alumnos, con la ayuda de una buena expresin escrita pero carente de
contenido, pueden disimular la ausencia de conocimientos y acabar por influir
en el corrector, hasta el punto de que ste juzgue las palabras y no los conoci-
mientos.
Para evitar estos y otros posibles defectos, es esencial que quien construye
una prueba, tanto si se trata de una prueba libre (PL) como de una prueba obje-
tiva (PO), la someta a un anlisis crtico y siga una serie de instrucciones.
La medida en educacin. 1. Recogida de informacin 71
encuestas (EN) que hemos llamado, a falta de un ttulo mejor, PD, pruebas en
sentido analgico, ya que en algunos casos se admite cualquier respuesta.
LIMITACIONES . LIBERTAD
lle los fundamentos para elegir entre las varias alternativas que se le presentan.
Por ello, si las PO estn bien construidas, no permiten responder correctamente
a partir slo del mero reconocimiento, de la memoria rutinaria o de la asocia-
cin verbal no significativa.
No est claro que el proceso mental resultara diferente si no se sugirieran
respuestas y si la tarea pedida fuera la produccin material de una respuesta, no
la eleccin de la que es correcta. Producir una respuesta no es necesariamente
una tarea ms compleja y ms difcil, o ms indicadora de los logros, que esco-
ger la mejor de las alternativas disponibles (Quellmalz et al., 1980). Hogan
(1981), a travs de una revisin de la investigacin relacionada con la compara-
cin entre las respuestas abiertas (RA) y las PO, desde Patterson (1926) hasta
nuestros das, lleg a la siguiente conclusin: "En la mayora de los casos, se
encontr que las medidas obtenidas a travs de RAy PO eran equivalentes, o
casi equivalentes, definidas por su intercorrelacin, dentro de los lmites de
sus respectivas fiabilidades. Ms an, las medidas de PO no slo son conside-
rablemente ms fciles de calificar, sino que casi siempre son ms fiables que
las de las RA. Sin embargo, a pesar de las abrumadoras pruebas empricas de
las conclusiones recogidas por Hogan, muchos profesores continan ignorn-
dolas y persisten en la creencia de que en sus particulares situaciones las RAy
las PO producen medidas de cualidades completamente distintas.
Por todo lo anterior, se pueden cuestionar en gran medida las crticas de que
en las PO, al sugerir posibles respuestas, es el profesor quien hace la parte ms
importante de la tarea; de que el alumno realiza una actividad menos vlida, al
limitarse a seleccionar una informacin sin construida; de que, finalmente, las
PO sean ms superficiales y menos realistas para evaluar el conocimiento que
los exmenes clsicos, llamados tcnicamente respuestas abiertas (RA).
3. Adivinanza: Es preciso subrayar que el azar de que caiga lo que el
alumno sabe -azar siempre implcito en la eleccin de toda muestra de pre-
guntas que el profesor selecciona para todo tipo de exmenes- afecta ms a
las pruebas libres (PL), pues los exmenes clsicos tienen menos preguntas;
mientras que las PO se prestan mejor a hacer un barrido ms amplio de la
materia de examen.
Respecto del azar ms tpico de las PO, el derivado de adivinar la respuesta,
hay que distinguir entre adivinanza informada y adivinanza ciega. La primera
proporciona indicaciones vlidas de logros: cuanto ms sepa el alumno, es ms
probable que sus conjeturas informadas sean correctas. En cuanto a la segunda,
los alumnos muy motivados, en una prueba de dificultad adecuada y con tiem-
po suficiente, harn pocas adivinanzas ciegas en un examen de PO; pues saben
que, por poco que piensen, esto es ms seguro y rentable que adivinar ciega-
mente la respuesta correcta. Adems, Ebel (1968) y Hills y Gladney (1968)
demostraron que, para comprobar la consecucin de logros, las calificaciones
en el intervalo del azar no son significativamente diferentes de aquellas otras
libres del azar.
Pruebas objetivas 77
a2. Un metro de un cierto tejido cuesta 3 euros. Cuntos euros cuestan 500 cm?
a) 0,8
b) 1
* e) 1,5
d) 3,5
a3. Ante cada una de las afirmaciones siguientes, contestar con H si se trata de
un hecho, y O si se trata de una opinin:
Republicano es el sistema de gobierno imperante en Francia [H/O]
84 La evaluacin de aprendizajes
1. CONSTRUCCiN
Nota: Estos tems, que presentan al alumno expresiones usuales como afir-
macin verdadera o alguna alteracin como afirmacin falsa, se pueden apren-
der de memoria, por lo que son indicadores de una simple memorizacin vaca.
Por el contrario, los tems siguientes usan como indicadores de la compren-
sin de un principio que se reconozca en algunas parfrasis no usuales:
b1. Si un objeto con un determinado volumen se rodea de un lquido o gas,
lafuerza que experimenta hacia arriba es igual al peso del volumen
del lquido o gas [V]
b2. Lafuerza hacia arriba sobre un objeto rodeado por un lquido o gas es
igual al rea de la superficie del objeto multIPlicada por la presin del
fluido que lo rodea [F]
Con este formato tambin se pueden presentar problemas difciles que exi-
jan una capacidad de aplicacin compleja; por ejemplo:
d1. El trmino siguiente en la serie 3, 4, 7, 11, 18 es 29 [V]
Nota: Una persona bien informada puede juzgarlo como falso porque no es
la luz enviada por las estrellas la que parpadea; sino que, a causa de las pertur-
baciones en la atmsfera, la luz de las estrellas parece que parpadea.
Nota: Parece razonable creer que, aadiendo ms soluto a una disolucin satu-
rada, se puede conseguir una sobresaturada (a2). El que ha estudiado el tema
sabe que el solmo que se aade a una disolucin saturada no se disuelve; slo
evaporando el disolvente o enfriando, se puede conseguir que una disolucin
saturada pase a sobresaturada. El alumno que contesta nicamente por sentido
comn lo har de manera errnea. Sin embargo, el mismo sentido comn induce
al alumno mal preparado a contestar correctamente el tem a3, por lo que no
cumple de forma adecuada la funcin de comprobar el aprendizaje.
88 La evaluacin de aprendizajes
Desde el punto de vista opuesto, se puede usar una lgica superficial para
enmascarar la respuesta correcta, o incluso sugerir la incorrecta. Por ejemplo:
a4. Unapelota de goma de lOOg flota sobre la superficie de una piscina de agua
de manera que exactamente la mitad est sumergida. Para sumergirla completa-
mente se necesita unafuerza adicional hacia abajo de 50 g [F]
Nota: La pelota, de 100 g de masa, est sumergida hasta la mitad, lo que da a
la mitad de 100 una verosimilitud superficial considerable. La verdad es que si
su peso, provocado por los 100 g, la sumerge hasta la mitad, se necesitarn
otros 100 g para sumergida toda.
2. APLICACiN
Consideradas las ventajas e inconvenientes que ofrecen estas pruebas V/F, con-
viene recordar las circunstancias que potencian su aplicacin.
Aunque tem por tem los V/F tienden a no discriminar entre alumnos de
alto y bajo rendimiento acadmico, en conjunto, una hora de examen con bue-
nos tems V/F suele ser tan efectiva como con otros formatos, como los EM
CEbel, 1980). Por consiguiente, se deben aplicar cuando se dispone de poco
tiempo para preparar un examen, ya que los V/F son relativamente fciles de
escribir, al reducirse a referencias sencillas que se suelen comunicar sobre la
materia en una clase oralmente o por escrito.
Sin embargo, estas pruebas V/F deben evitarse en las siguientes circunstancias:
a) Cuando no se puedan controlar razonablemente las consecuencias de la
adivinanza. No obstante, la influencia de la adivinanza ciega disminuye confor-
me el examen tiene ms tems; la probabilidad de conseguir una calificacin
moderadamente buena, digamos de 70, en un examen de 100 tems V/F por adi-
vinacin slo ciega es menor de 1/1.000. Los exmenes acadmicos de 100
tems V/F han mostrado unos coeficientes de fiabilidad de 0,85 y 0,95. Esto avala
la conclusin de que buenos tests V/F no tienen por qu verse viciados por el
azar CEbely Frisbie, 1977).
b) Cuando se limiten a comprobar la memorizacin de datos triviales; ya
que en este caso los alumnos se concentran en recordar datos aislados con un
aprendizaje memorstico rutinario, ms que en un aprendizaje significativo para
comprender y desarrollar un pensamiento crtico. En favor de esta censura, se
citan tems tpicos del formato V/F como los siguientes:
Pruebas verdaderoljalso 91
Nota: Si fueran estas las nicas preguntas que se pudieran hacer con tems
V/F, ciertamente seran de poco valor. Sin embargo, como qued claro al hablar
de las normas de construccin, es posible hacer preguntas que controlen la
capacidad de los alumnos para memorizar datos significativamente, compren-
der conceptos y principios, e incluso aplicados.
e) Cuando no se pueda evitar la ambigiiedad. La ambiguedad no es un
defecto inherente a los tems V/F. Ms an, debemos distinguir entre ambigue-
dad intrnseca y ambiguedad aparente.
La ambiguedad aparente puede deberse a errores en el conocimiento de los
alumnos. Este tipo de ambiguedad es no slo inevitable, sino que puede ser
til, haciendo que la tarea de responder sea ms difcil para el mal estudiante
que para el bien preparado, lo que ayuda a discriminar entre los dos.
La ambiguedad intrnseca, que causa dificultades tanto al experto como al
aprendiz, es posible que no siempre pueda ser eliminada, puesto que a veces el
lenguaje conlleva cierto grado de imprecisin; pero en las formulaciones utiliza-
das en los tems V/F debe ser reducida al mximo.
Por supuesto que es verdad la acusacin de que hay tems V/F ambiguos y
carentes de significacin. Una causa puede ser que los profesores a veces
extractan frases de los libros de texto para usarlas como tems; y; sin embargo,
aun en un libro de texto bien escrito, pocas de sus frases tomadas literalmente
se podran convertir en buenos tems, ya que muchas de ellas se limitan a reco-
ger la estructura y la organizacin del discurso. Otra es caer en la imprecisin
por querer llevar hasta el lmite la norma de la concisin y ser excesivamente
breves: la brevedad imprecisa lleva a peores consecuencias que la verbosidad
clara. Escribir buenos tems V/F es ms una tarea de construccin creativa que
de mera copia.
Hay que prevenirse contra una gran fuente de ambiguedad: la incertidum-
bre, por parte tanto del alumno como del profesor, de los estndares de la
verdad en este tipo de tem. Un tem con una idea no completa, con algn tipo
de carencia, no tiene por qu considerarse falso. Si el profesor consigue comu-
nicar este extremo, por ejemplo en las instrucciones generales de los procedi-
mientos que va a usar en la evaluacin, y el alumno lo comprende y acepta
como una regla ms del juego, la tarea del examinador ser ms fcil y habr
ms posibilidades de enriquecer las pruebas de evaluacin en general, y los
tems V/F en particular, con afirmaciones verdaderas que no son completas. No
obstante, hay que evitar afirmaciones que caigan en una zona indefinida entre la
verdad y la falsedad. Por ejemplo:
al. El sujeto concuerda en nmero y persona con el verbo [V]
92 La evaluacin de aprendizajes
Nota: Esta afirmacin sera inaceptable, pues queda indefinida entre verda-
dero y falso; dado que, sin ser falsa (Le atraan la belleza o la dote de la
joven), el verbo tambin puede concordar en singular (Le atraa la belleza o la
dote de la joven), expresando en uno y otro caso un matiz de estilo, segn se
sienta la disyuncin. Incluso, a veces, la conjuncin o no tiene un valor pro-
piamente disyuntivo, sino aclarativo o explicativo, con lo que el verbo ha de
concordar en singular (El protagonista o personaje principal de la pelcula
hace una gran interpretacin).
Otra fuente de ambiguedad es el hecho de que en los tems V/F las afirma-
ciones generalmente son absolutas sin un contexto que las matice, y los alum-
nos tienen que buscar puntos de referencia alternativos en su estructura men-
tal. El tem V/F que dice: ElAneto es una montaa alta lleva al alumno a
buscar picos altos, de manera que la altura del monte Aneto se pueda juzgar en
relacin con las alturas de otras montaas. En este caso, yen muchos otros si se
cree conveniente, es sencillo liberar los tems de toda ambiguedad introducien-
do explcitamente una comparacin dentro de la pregunta. As, por ejemplo:
al. El monte Aneto es una montaa alta [?]
a2. El monte Aneto es una montaa ms alta que el Naranjo de Bulnes [V)
O tambin:
bl. Las tareas que se hacen en casa son de mayor calidad [?]
b2. Las tareas que se hacen en casa son de mayor calidad que las hechas
m~ M
d) Cuando se estime que perjudican el aprendizaje. Los crticos de los
tems V/F afirman que su uso tiene efectos nocivos para el aprendizaje, por
varias razones.
En primer lugar, dicen que la manera categrica con que se presentan y cali-
fican las respuestas puede proporcionar al alumno la falsa nocin de la simplici-
dad del conocimiento, al establecer dicotomas artificiales para su valoracin.
En segundo lugar, acusan a las preguntas V/F de exponer al alumno al apren-
dizaje de conocimientos errneos. La presentacin de afirmaciones falsas como
si fueran verdaderas puede tener el peligro de exponer al alumno a los errores,
facilitando as que los recuerden. Sin embargo, Ross (1947: 349) concluy que
los efectos de sugestin negativa en los tems V/F son mucho menores de lo
que a veces se presume y que quedan ampliamente compensados con los efec-
Pruebasverdaderoifa~o 93
r~JJI~lllJ,,,_
TEXTO: Se hizo un experimento que consisti en hacer flotar un
cuentagotas en un frasco lleno de agua. Al cabo de una
hora, se anot el nivel que haba alcanzado el agua dentro
del cuentagotas, A continuacin se calent el frasco
durante 30 segundos,
BASE: Qu van'able se modific en el expen'mento?
DISTRACTORES: a) Laforma del cuentagotas.
b) El nivel de agua en elfrasco.
c) El intervalo de tiempo entre la toma de temperatura.
RESPUESTA: d) La temperatura del aire y del agua en elfrasco.
Con frecuencia no son necesarios tantos detalles, por lo que el tem se pre-
senta en forma abreviada, con la base o enunciado y las alternativas (a veces
tambin se les llama distractores, aunque es mejor reservar este trmino para
las respuestas incorrectas).
98 La evaluacin de aprendizajes
Existe una serie de variedades, entre las que citamos las siguientes:
Escoger la nica respuesta correcta: Es la variedad ms popular y acon-
sejable.
al. Qu es la neviza?
a) Polvo de nieve cado en el mismo da.
b) Una variante del hielo cristalizado.
* c) Nieve comprimida que se hace hielo.
d) La abrasin del hielo cristalizado.
a) Exceso de electrones.
b) Defecto de electrones.
c) Un determinado potencial.
*
d) Igual nmero de protones que de electrones.
Pruebas de eleccin mltiple 99
Base comn: Se aprovecha una misma informacin para hacer varias pre-
guntas sobre ella.
a5. Una nia de 8 meses de edad ingresa en el hosPitalpor el escaso aumento de
peso, a pesar de su apetito voraz. La presencia de esteatorrea y neumona del
lbulo superior derecho sugierefibrosis qustica.
1. Si este diagnstico es correcto, sera de esperar que los resultados de la prueba
del sudor manifestaran concentraciones:
a) Baja de Na+y elevada de Gr.
b) Normales de Na+y Gr.
c) Elevada de Na+y normal de el-.
*
d) Elevadas de Na+y Gr.
2. Lospadres de la nia desean saber si otros hijos que pudieran tener naceran
con fibrosis qustica. Debe indicrseles que la probabilidad en tanto por ciento
de que sus siguientes hijospadezcan la enfermedad es aproximadamente de:
a) 100
b) 50
c) 33
* d) 25
CONSTRUCCiN 1.
los efectos de obviar alguna de estas sugerencias; sin embargo, los profesores
llegan a formular mejores preguntas si conocen y siguen estas sugerencias que
si las desconocen o las desprecian.
A continuacin, aportamos algunas de ellas para elaborar la base del tem;
posteriormente, trataremos de las respuestas.
Nota: La base, fricadel Sur, sin los distractores no tiene sentido. Hasta
que el alumno lea todas las respuestas, no sabr a qu se refiere la pregunta. La
formulacin de la base es ambigua, lo que produce frustracin en los alumnos
proporcionando medidas no fiables.
a2. Sealar la afirmacin correcta:
a) La anfora consiste en repetir una palabra al comienzo de un mismo
verso.
b) Versosde arte menor son los escritos segn la regla del ars minore.
c) La estructura mtrica de la lira es 7a ] ]B 7b 7a ] ]B.
* d) La sinresis consiste en formar un falso diPtongo en una palabra dentro
de un verso.
tar la pregunta si se aade que la habitacin est iluminada de manera que ten-
ga lugar la fotosntesis, que est cerrada de forma que la composicin del aire
no va a ser neutralizada por la ventilacin, y que no hay otros seres vivos que
puedan consumir el oxgeno ms de prisa de lo que se produce.
Pero, a veces, para asegurarse de que el tem tenga una respuesta correcta,
los examinadores reducen sus dimensiones hasta tal punto que el problema se
diluye. Por ejemplo, es difcil dar una respuesta coherente a: Qu razones lle-
varon a la Repblica Democrtica Alemana a levantar en 1961 el muro de
Berln? Sin embargo, si se limita la pregunta con la siguiente condicin: Qu
explicacin de la accin de levantar el muro de Berln por la DDR dio el
peridico Frankfurter Allgemeine el 25 de agosto de 1961?, es relativamente
fcil contestada, pero deja de tener valor.
2.3. Introducciones: Abunda en la norma anterior. A veces son necesarias
frases de introduccin para describir la escena o el contexto. Tales frases difie-
ren de los prembulos instruccionales y escaparates retricos que se mencio-
nan al hablar de suprimir lo irrelevante.
Si son necesarias muchas ideas descriptivas y cualificadoras, combinar las
descripciones con las preguntas en una misma oracin probablemente hace la
base del tem ms compleja. Se puede conseguir una expresin ms clara pre-
sentando estas descripciones e informaciones previas en frases de introduccin
separadas; en otra se hace la pregunta. Por ejemplo:
al. Hace unos 200 millones de aos la superficie seca de la Tierra no se presenta-
ba separada en los actuales continentes, sino que se presentaba unida en un
solo continente denominado:
a) Mundo Antiguo.
b) Eurasia.
* c) Pangea.
d) Atlntida.
e
En el diagrama se ve un crculo con centro Ay cuatro puntos B, C, D, E en su cir-
cunferencia, tales que los arcos BE = DE = 2BD.
Cul es el valor del ngulo agudo BAD en grados?
a) 64
b) 70
* c) 72
d) 75
b) Radiacin.
c) Conveccin.
d) Absorcin.
Nota: El alumno que conozca superficialmente las propiedades del cambio fsi-
co y qumico sealar la b). Sin embargo, un alumno con mayores conocimientos
reconocer que los casos a) y d) son ejemplos de cambios elctricos y qumicos;
nicamente en el caso e) no hay cambio qumico, sino slo de estado fsico.
En general, la base se puede hacer ms fcil hacindola ms general, o ms
difcil hacindola ms especfica. El par de tems siguientes ilustra cmo la gene-
ralizacin o la concrecin de una pregunta puede usarse para controlar su difi-
cultad:
bl. Un arancel es un impuesto sobre:
a) bienes races.
*
b) bienes importados.
c) herencias.
d) donaciones.
Pruebas de eleccin mltiple 109
Nota: Basta una nocin difusa sobre aranceles para responder correctamente
a esta pregunta general; sin embargo, es necesario un mayor conocimiento sobre
los aranceles para responder correctamente el siguiente tem ms concreto:
b2. Un arancel altamente proteccionista sobre coches japoneses en la UE benefi-
cia ms directamente a:
Construccin de respuestas: Una vez terminada la base del tem, hay que
escribir la respuesta correcta as como un conjunto de distractores o respuestas
incorrectas. El propsito de los distractores es discriminar entre los alumnos
que dominan y no dominan una materia. Para ello, el distractor debe ser una
alternativa lgica y plausible que parezca tener relacin con la pregunta. El
alumno inteligente descartar por ridculos los distractores demasiado alejados
de la pregunta; con ello se reduce el nmero de distractores reales. Se pueden
emplear varias tcnicas para preparar distractores plausibles, sin proporcionar
pistas que ayuden al alumno no preparado a contestar correctamente; entre
otras, se pueden citar las siguientes:
1. Usar afirmaciones verdaderas que no contestan directamente a la pre-
gunta.
2. Emplear expresiones familiares estereotipadas que tengan alguna asocia-
cin con los trminos usados en la pregunta y que parezcan atractivas a
los alumnos simplemente por un recuerdo vago de haber odo aquellas
palabras alguna vez.
3. Definir la clase de cosas a la que deben pertenecer todas las respuestas
alternativas. Por ejemplo, si se pregunta lo que enfra un refrigerador
elctrico, la clase de posibles respuestas se define como cosas que pue-
den causar el enfriamiento y los distractores seran: hielo, aire en movi-
miento, expansin de un gas, etc.
4. Utilizar los errores cometidos por los alumnos en exmenes clsicos (RA)
y de respuesta limitada (RL);aunque a veces no compensa por el trabajo
que esto supone (Loree, 1948).
He aqu algunas sugerencias para generar buenos distractores en tems EM,
agrupadas por su homogeneidad interna y externa, y completadas con otros
recursos que suelen utilizar los expertos.
*
c) La geografa sistemtica estudia un solo fenmeno en su distribucin
sobre la tierra para llegar a generalizaciones de la geografa regional,
que estudia la distribucin defenmenos en un rea dada.
d) La geografa sistemtica es la manera moderna cientfica de estudiar la
diferenciacin de la superficie de la tierra, mientras que la geografa
regional es la manera tradicional y descriptiva de estudiar la distribu-
cin defenmenos en el espacio.
Nota: Este tem se puede mejorar, incluyendo la frase incompleta: Una vena
es un vaso sanguneo que lleva sangre ... en la base. A veces la repeticin de
palabras ayuda a clarificar el tem, pero en ste, como en otros casos, la repeti-
cin parece excesiva e innecesaria.
Conviene tambin eliminar los artculos en las alternativas que no sean fra-
ses completas, ya que pueden dar pistas no deseables. El ejemplo bl es mejor
simplificado como el b2:
bl. Qu rgano del cuerpo se puede extirpar sin peligro de la vida?
a) El hgado.
b) El corazn.
c) Elpncreas.
* d) Un rin.
114 La evaluacin de aprendizajes
b2. a) Hgado.
b) Corazn.
c) Pncreas.
* d) Rin.
Cuando sean homogneas, hay que incluir las unidades de las respuestas en
la base. Por ejemplo, es preferible la formulacin de c2 a la de cl:
cl. Calcular la superficie de un cuadrado de 2m de lado:
a) 2m2
* b) 4m2
c) 6m2
d) 8m2
c2. Cul es la superficie en m2 de un cuadrado de 2m de lado?
a) 2.
* b) 4.
c) 6
d) 8.
a) Xfue prcticamente O.
*
b) Xfue la mitad de y
c) Xfue prcticamente igual a Y
d) X fue mayor que Y
a) Yemas.
b) Esporas.
c) Ambos medios: yemas y esporas.
*
d) Ninguno, ni esporas ni yemas.
Tambin, si cada uno de los dos elementos tiene diferentes valores, por
ejemplo, subir/bajar y rpido;1ento, se pueden combinar para obtener cuatro
alternativas:
a) Sube rpidamente.
b) Sube lentamente.
c) Baja rpidamente.
d) Baja lentamente.
Indique su grado de acuerdo con utilizar dinero pblico para proyectos de explo-
racin espacial:
a) Nada b) Poco c) Bastante d) Mucho
2. APLICACiN
Hay semejanzas sustanciales entre los dos tipos de tems. En los tems EM hay
implcitamente una afirmacin verdadera y varias falsas, por lo que controlan
los objetivos de manera semejante; y cuando los tems EM se transforman en
V/F, y viceversa, las calificaciones obtenidas por grupos semejantes de alumnos
se correlacionan tanto corno lo permiten sus ndices de fiabilidad (Frisbie,
1973).
Una diferencia obvia es el nmero de alternativas que se le ofrecen al alum-
no; pero precisamente esta diferente concrecin y definicin de la tarea presen-
tada suele hacer ms difcil juzgar si una afirmacin aislada es verdadera o falsa
en los tems V/F, que juzgar por comparacin cul de varias alternativas es la
mejor respuesta en los EM.
Sin embargo, hay circunstancias en que ambos formato s no son equivalen-
tes, sino que, por el contrario, se aconseja uno de ellos, corno ilustran los ejem-
plos de la tabla siguiente:
A. Para los tems que se basan en proposiciones, es indiferente el formato.
B. Cuando hay slo dos alternativas plausibles, por razones obvias es prefe-
rible el formato V/F. La preferencia por el formato EM ha llevado muchas
veces a presentar corno EM lo que es una coleccin de tems V/F.
e. Cuando los tems no se basan en proposiciones, es preferible el formato
EM.
120 La evaluacin de aprendizajes
c)
b)
a) Obedece
Se
Cambiar VERSINEM
unacompone lalasimagen
elipse. leyes.
de clulas que se M
vivas
(F)muy
forma 2b.4b.
3b. de
Un
1b. animales
correctora
2a.
La3a.
en
que
luz
4a.
La
x2/9Un
tener
sevirus
principal
virusque
Es+se
grfica
obedece
paga
vivas
El ...................................
caracterstica
forma
un
y2/4=1
sus
muy
VERSINVlF
1a. La es
principal
clulas
llega
mejor es acambiar
puedede
trabajo
compone
funcin
de
las en un
funcin
plantas
cambiar
la
es
impuestosla
leyes
grandes
grfica de la
ciudadanodevivir
es
retina
de ola
buen
retina
cnica
una
la queunams
lacantidad
de
clulas
el una
solamente
imagen
parbola
elipse lente
...........
una
.........
lente
que
.................
cnica el que
................... M
M
(F)(F)
...
........ (F)
buen
e
dad
o de ciudadano?
en de
la
clulas
retina.
luz que c) Se puedenlas
obedecer
ciudadano reproducir
leyes
que el hecho solos.
...................
de
cnica
atos 3. x2/9+ las2.siguientes
igual y2/4=1
deCul
4. de
utilidadseCul es la
NOprincipal
representa C.
B.carac-
es tems
afirmaciones funcin
que se deacomodan
una mejor al formato VlF EM
SVAI.L:lraO SVa5lnHd :la
SOdl.L SOH.LO
V/F MLTIPLES 1.
2. RESPUESTASCOMBINADAS
Las respuestas combinadas (RC) son una variante que sintetiza los formato V/F y
EM. Se proponen varias alternativas como en los tems V/F mltiples, pero lue-
go se agrupan para pedir, en formato EM, la combinacin correcta. Por ejemplo:
Entre los hechos de intervencin de Felipe 11en la poltica interior de Francia, se
pueden citar:
A La candidatura de Eugenia de Montijo al trono francs.
B. El tratado de Vervins.
e El tratado de la Isla de los Faisanes, en Bayona.
D. El tratado de Chateau-Chambrsis.
E. Lapresencia de Margarita de Parma en los Estados Generales de Francia.
Elegir la combinacin correcta:
a)AyB
b)ByC
* c) ByD
d)DyE
3. EMPAREJAMIENTO
6. Potencia elctrica .
7. Trabajo elctrico .
4. CLASIFICACiN
RESPUESTADOBLE 5.
Ahora escoger,de entre las siguientes, las causas que expliquen cada una de las
afirmaciones sealadas como verdaderas.
1. La eclptica terrestre.
2. El movimiento de campos magnticos polares, que suponen diversas radia-
ciones incidentes en la meteorologa fra.
3. La diferencia de potencial calorfico de polos y ecuador.
4. La reflexin de los rayos solares durante el verano por la nieve acumulada
durante el invierno.
5. Lafiltracin espacial de variantes trmicas estelares.
6 La desviacin del movimiento rotacional, que supone la incidencia solar en
zonas ms o menos amplias de lospolos.
7. El enfriamiento progresivo producido por la capa de CO;!que impide la nor-
mal refrigeracin ambiental del planeta.
Solucin: B1, C6, E4.
6. RESPUESTALIMITADA
En las preguntas de respuesta limitada (RL)se pide una respuesta abierta y cor-
ta. Aunque son preguntas abiertas, por ser stas muy limitadas, ya que se exige
un dato predeterminado y preciso; suelen considerarse como PO. Si preguntan
una frase, debe ser corta y especfica. Los tems que exigen respuestas ms lar-
gas se clasifican ms bien como respuesta abierta (RA). He aqu algunos ejem-
plos:
Elpseudnimo de Jos Martnez Ruiz es:(lzorn.
Culesson los moifemas del verbo?Tiempo. modo. Dersona nmero v asDecto.
Escribir el nombre comn de los siguientes compuestos qumicos:
A CaCO] Caliza
B. NaCI Sal
C. C1fl22011 Azcar
D. NH] Amonaco
7. PROBLEMAS CIENTFICO-MATEMTICOS
1. RESPUESTAABIERTA
1. Objetivo: Es necesario tener a la vista, como en las PO, las variables que
se quieren medir. Subrayamos aqu esta condicin, ya que sin objetivos explci-
tos es casi imposible construir PO; sin embargo, a veces, resulta ms fcil for-
mular preguntas de RAsin hacer una detenida y previa consideracin de lo que
se pretende evaluar. Muchos de los rasgos que se dicen medir con las RA,tales
como la originalidad, no se suelen definir claramente por la especial dificultad
de explicitar sus indicadores; por ejemplo, se llega a valorar la creatividad o el
pensamiento crtico, aunque sea difcil concretar los rasgos que pueden permi-
tir su medicin (Fernndez Garrido, 1980; Forteza. 1974; Olea, 1993).
2. Instrucciones: Las instrucciones claras son tanto ms necesarias cuanto
menor sea el nivel de desarrollo del alumno. En todo caso, como ya dijimos al
hablar de las PO, no se deben repetir en cada examen; cada profesor marca
al principio las reglas del juego. Estas instrucciones, que pueden referirse a la
presentacin de las preguntas y de las respuestas de los alumnos, al rigor en las
expresiones cientficas, a la duracin del examen, etc., a menudo condicionan la
misma dificultad de la prueba.
3. Normas: Buscamos la fuente de inspiracin de las normas de construc-
cin precisamente en las deficiencias que se deben evitar.
Las limitaciones ms serias de las RAcomo medidas de logros se refieren a la
fiabilidad de las calificaciones obtenidas con ellas. Recordemos que baja fiabili-
dad significa que hay inconsistencia entre las calificaciones obtenidas de prue-
bas propuestas sucesivamente, o calificaciones independientes del mismo exa-
men. Las conclusiones de una serie de investigaciones (Stalnaker, 1966) ponen
de manifiesto que distintos correctores competentes e independientes asignan
a menudo puntuaciones diversas a la misma RA;cada corrector tiene su estilo
propio de calificacin: lo que para unos es importante, puede seda menos para
otros. Incluso el mismo corrector asigna puntuaciones distintas a la misma
prueba cuando ha mediado un determinado perodo de tiempo.
Son tres las principales causas de esta baja fiabilidad que pueden ayudar a
identificar mejor las normas de construccin.
a) La muestra limitada de contenido cubierto por el examen. En compara-
cin con las PO, se han hecho pocos estudios experimentales de la fiabili-
dad de las muestras de RA;en parte por la dificultad de obtener en ellas
calificaciones suficientemente objetivas. Ruch (citado por Ebel y Frisbie,
1977) puso de manifiesto que hay una relacin directa entre la extensin
de la muestra de tareas en un examen y la precisin con que pueden
diferenciarse los niveles de logros. Es obvio que la suerte del alumno en
ser preguntado sobre lo que sabe supone, cuantos menos tems tenga el
examen, un fctor que influye ms en la calificacin que recibe.
b) La indefinicin de las tareas propuestas en las preguntas. En muchas RA,
la tarea indicadora del logro y la base para juzgado no estn especificadas
de manera fcil de entender. Cuanto ms detalladas y explcitas sean, tan-
138 La evaluacin de aprendizajes
blema es que slo vale para una vez. La siguiente es de nivel superior, pero quizs
se me admita: colgando el barmetro de una pequea cuerdecita para formar un
pndulo y midiendo el perodo en la cima y en la base, llegaramos, a travs del
valor de "g", a la altura del edificio. Pero reservo para el final la que ms me gusta:
supongo que el edificio ser importante y tendr portero; me dirigira a l y le dira:
Sr. Portero, tengo un barmetro fenomenal; si me dice la altura del edificio, se lo
regalo. El alumno dio seis respuestas, pero no la que pretenda el profesor, relacio-
nada con la presin atmosfrica. La pregunta no era tan clara.
Las pruebas mixtas (PM) pueden combinar las ventajas del examen clsico (RA)
con las de las pruebas objetivas (PO). No son dos exmenes sin relacionar, sino
uno solo presentado mediante dos formas secuenciadas y complementarias:
examen tradicional y prueba objetiva con formato EM o RL. El alumno ha de
resumir y transcribir en PO lo que ya escribi en su RA,con lo que se consigue
tener constancia escrita de su razonamiento a disposicin del corrector.
Ejemplos:
al. Objetivo: Comprender el concepto de funcin continua en un punto.
Prueba libre (RA): Explicar el concepto de funcin continua en un punto.
Prueba objetiva (EM) (ejemplificacin parcial de la PO):
[(x)= lim
lirn.funcin x->a
d) * b)
1. e)
x->a
x~a
x->a
liIll
Una [(xl x~a
lim
= =y[(al
=[(xl
[(a)
f(x) [(xl
[(al es continua en el punto a si:
al
A
..
2. 'Cul seria la grfica de una funcin continua en x = 2?
m1
y y
2 m
2
f(2l = 3
O
f(2l = 2
,-i
~
f(2) = 2
~ t
f" no est definida en
x=2
a) *b) C) d)
1. Se lanza verticalmente hacia arriba un proyectil con una velocidad de 150 mis;
calcular el tiempo que tarda en subir al punto ms alto.
Datos: v =
E--f
cuaclOn utz'1'zzad a: t =
Resultado: t = s
c) Ecuacin utilizada: t =
Resultado: t = s
2. EXAMEN ORAL
Los exmenes orales (EO) han sido los primeros instrumentos de evaluacin
utilizados para comprobar rendimientos de aprendizajes; fue el formato predo-
minante aun antes de la aparicin de las instituciones educativas.
La prctica docente es prdiga en el uso de preguntas orales que sirven para
ayudar al aprendizaje, as como de instrumento de evaluacin. Por supuesto,
estos propsitos estn con frecuencia relacionados, y a veces son inseparables,
particularmente cuando la naturaleza de la evaluacin es formativa ms que
sumativa.
Las preguntas orales como estrategias de enseanza sin la formalidad del
examen oral pueden cumplir, entre otras, las siguientes funciones:
a) De repaso para, antes de una prueba, revisar y reformular lo mal aprendido.
b) De introduccin en sesiones de discusin y debate. Las preguntas ayu-
dan a provocar la participacin de los alumnos, activan sus conocimien-
tos previos y modelan estrategias metacognitivas.
Otros tipos de pruebas libres 151
/0Valoracin
/00
0/0/ Explicaciones
Predicciones
Aplicacin/
Memorizacin
/
NATURALEZA
Comprensin/
de datos,
DE LAS PREGUNTAS
Otros tipos de pruebas libres 155
///
relacin
Sin
Centrada en// el tema
// Relacionada
con NATURALEZA
reformulada
parcialmente
Pregunta DE LAS
/ PREGUNTAS
4. PROYECTO
SIMULACiN 5.
ANEXO I
SIMULACiN DE QUMICA ANALTICA
Cu2+
Lquido pH>7 CrOt amarillo K+, AsOl, MoOt
Olor NH3 Sn2+,Sb,Pb J- blanco wot, VOi,
Color azul Hg2+ J- negro Ag+
A3+, Bi3+, Cr3+, Fe3+ Ca2+, Sr2+, Ba2+
C02+, Ni Zn2+, Cd2+, Mn2+
J- coloreados Mg2+
ENSAYO NO
Ag+
MoOt,j,
EXISTE
POSIBLE
wot,j,
Zn2+ ,j, blanco
EXISTE
Mn2+,j,
Ca2+
K+,AsO/
AsO/oCd2+verde
Mg2+
K+,AsO/,j, pardo
negro
amarillo
K+
Ca2+,
Ag+
Zn2+, Sr2+, Ba2+
Cd2+,
K+,AsO/,j, Mn2+
Ca2+,Sr2+,Ba2+
amarillo
g+ Sr2+, Ba2+
Ca2+,
Zn2+,
Mg2+
Mg2+, Sr2+,
Cd2+,
,j,
Cd2+ Ba2+
Mn2+
amarillo
ESQUEMA
____ ~A~ ~
a ppdo. t t dln. a
blanco +
se disuelve parte HzS
~ ~A~ _
b ppdo. t t dln. b
amarillo
+
Sx(NH,J2
ANEXO 11
CASO CLNICO
(preparado por el profesor J. P. Grangaud, Taller de Docimologa
de Timimoun, Argelia, 6-16 de febrero de 1977, Guilbert, 1989)
ETAPA A:
DECISiN CONSECUENCIAS
2. Hacer tomar la tempera- Durante este tiempo uno de los nios hace -1
tura, pesar y tallar a una parada respiratoria.
todos los nios. (ESCOJA OTRA ACCiN)
162 La evaluacin de aprendizajes
NOTA
3. Examinar con prioridad Seale los tres nios que debe examinar en I +1
a algunos de estos primer lugar.
nios. (PASE A LA ETAPA B, DONDE ELEGIR
ESTOS NIOS ENTRE LOS 15 QUE FIGU-
RAN EN LA LISTA)
SELECCIONE
congestionado.
Pliegue
campos
90 Amin;
DESCRITOS
(PASE cutneo
LA pulmonaresLOS
Temperatura:
ETAPA ENe) EL
D)
E) NIOS 40,8QUE
Temperatura:
abdominal. NECESITAN
35C;
Globos subictericia
DELoculares ATENCiNconjuntival
Yhundidos. INMEDIATA ENTRE
..........................
Extremidades
.........................................................................................
ENUNCIADO C. Focos de
CASO estertores crepitantes
NUMERADOS en ambos
DEL1 ALfras
15.(+1) LOS
.. (+1)
9.
10. Peso:
Mientras
3.
8.
4.
5.1.Se
Bajo
le
La 7,60;
CONSECUENCIAS
7. 2.
6.
Se Mientras
llama
el
enfermera
le
Peso:
Un llama
nio Altura:
lemanto
aausculta
4,100;est
la
hace sala
de
Vd.64
la
aurgentemente
lale
Altura:
unasala le
de
llama cm;
llaman
de
parada
56 Permetro
examinando
madre
espera con
aencuentra
urgentemente
espera
cm; donde
respiratoria
Permetro
sala craneal:
urgencia 44 cm; Frecuencia respiratoria:
......................................................
.............................................................................................
la.........................................................................
a este unnio,
recin otronacido
demuere deen10 la das
sala ciantico
de35,8
esperaC.(-1)
de..................................................................
un
en nio
craneal:
espera
la sala presenta
..................................................
39 cm;espera convulsiones
Temperatura: NOTA
y(O)
............
............................. ..(-1)
(-1)
(O)
Otros tipos de pruebas libres 163
11. Durante el examen, otra madre irrumpe en la consulta con su hijo. El nio
presenta convulsiones ...................................................................................... (-1)
12. 15.
14.
13. Un
Se nio
Es llamado
Hayleun hace
con
llama
nio una
con
con parada
urgencia respiratoria
a la asala
urgencia
convulsiones de
en espera
la sala la
desalaen de
espera la...................................................
sala
espera de espera (-1) (-1)
.............................
...................................................
.........................................
NOTA
ETAPAD: tico.
El: nio
Durante Apresenta
respiratoria.
(PASE el
CONSECUENCIAS
LA -1
+1
unnio,
examen,
ETAPA
O colapso.
el nio
G) se una
vuelve cian-
Mientras pincha al hace parlisis ,
in; Frecuencia
urgencia.
urea
QUE cardaca:
y glucemia.
HARA VD. CON180.ESTE NIO(8) EN ESTE MOMENTO?
Fr- 4. Hacer
2. Hacer una
inmediatamente
exploracin
164 La evaluacin de aprendizajes
ETAPA E: cin.
en Mientras
convulsiones.
El
(PASE
La NOTA
nio AseLApone
Temperatura ETAPA
interroga+1aH)
-1
ciantico
asciende
O durante
la madre
a 41,5 ela pun-
el nio entra
,
CONSECUENCIAS
QUE HARA VO. CON ESTE NIO (9) EN ESTE MOMENTO?
er
er inmediatamente un
una exploracin 3. Practicar una puncin
-1
+1
+1 la
Hecho.
ETAPAFnaturaleza
naturaleza
cantidad
calentarle?
congestio-
lquido,
Inscriba en yde del enema.
Hecho. -1carie?
+1 Jlalala
O-1
TRATAMIENTO
ETAPAH
Nio
Hecho
Nio
Para
Intil.
Hecho.
Inscriba Not
no
ETAPAG
InscribanoNot.
Not
Prescripcin+1
enANULADA
O
enEtapa
con- aIde
la
sinEtapa
laRESIDENTE.
Tiene
PRESCRIPCiN
sube
laLa POR
36,5e yperfu-
Temperatura
Para la
EL can- su
ya
larefres-
naturaleza
cantidad
Temperatura
ANULADO
lquido,
Etapa
inoportuna.
perfusin
gestionado.
K lade
lade
PORy
nado.
La cianosis
desaparece.
36,2e del lquido
CiN
41,5e.
LADA.
flujo. ANU-
PRESCRIP-
su flujo.
4. Dar oxgeno.
Otros tipos de pruebas libres 165
TRATAMIENTO
Inscriba
ANULADO. rios
Noto
la
ETAPAG
en
Not.
PRESCRIPCiN
Ninguna +
-1
+1
-11-1
1 -1
-1
-1
O-1
indi-O
O Sin
Antibitico
-utilizable indicacin.
Ningn
Sobre en
suficientes
No tiene
ETAPAF
tiene el
ANULADO.
ANULADO.
la no
crite-
crite-
PRESCRIPCiN
ANULADO.
ANULADA.
indicacin.
cacin.
EtapaJ.
Etapa
qu
posologa Ken
criterio.
cri- la ANULADO.nistracin.
cacin. va de admi-
posologa
la etapa K yla
posologa y
LADA.
nistracin.
MOMENTNEA-
MENTEANU-
rapia.
ina.
uccina-
micina.
ETAPA 1:
ETAPAJ:
I ETAPA K:
O)I.LSON~Vla SV851nHd
'"
j
j
Los profesores dedican casi una tercera parte de su tiempo a tareas relacionadas
con la valoracin (Stiggins, 1988); as, administran exmenes formales, aplican
otros mtodos orientados a recoger datos, hacen juicios y toman decisiones
durante la instruccin.
Profesores de todos los niveles consideran importante y crucial para aumen-
tar el conocimiento de sus alumnos (Dorr-Bremme y Herman, 1986) la informacin
obtenida por mtodos diferentes a los exmenes tradicionales. La aplicacin de
estos otros instrumentos de evaluacin, que agrupamos como pruebas diagns-
tico (PD), supone el dominio de una serie de tcnicas particularmente tiles en
aquellas reas donde no es fcil hacer valoraciones por mtodos convenciona-
les. Recogemos aqu de manera resumida los aspectos de aplicacin ms fre-
cuente en contextos acadmicos de dos de estas tcnicas: la observacin (OB) y
la encuesta (EN), ya que los interesados pueden ampliar fcilmente su estudio
en las referencias bibliogrficas citadas y, en general, en la extensa bibliografa
disponible.
OBSERVACiN 1.
La mayora de las observaciones que hacen los profesores en el aula son inci-
dentales. Tales observaciones son muy tiles para una evaluacin formativa y
suelen constituir el primer paso para, ms tarde, hacer una observacin planifi-
cada.
170 La evaluacin de aprendizajes
1.2. Observacinestrudurada
o Pautas de observacin
1. Subjetividad: Mirar con orejeras y mirar sin ver son expresiones comu-
nes que traducen la manera selectiva de mirar que, sin darse cuenta, practican
algunos observadores. Para superar esta posible subjetividad, una de las pautas
ms utilizadas es conseguir un acuerdo entre jueces, valorando las diferencias
halladas en el total de conductas registradas por ellos en el perodo total de
observacin. A partir de las frecuencias extremas detectadas, se proponen fr-
mulas para su correccin (Anguera, 1983; Fernndez Ballesteros, 1983; Cabrera
y Espn, 1986).
2. Imparcialidad: Las expectativas formadas a partir de nuestra experien-
cia previa son mejor observadas que aquellos sucesos que se ven como si fue-
sen ajenos. Por consiguiente, otra pauta de observacin ser no dejarse llevar
por la tendencia natural a fijarse en detalles familiares al observador, o a con-
centrarse en aquellos aspectos de un suceso que mejor encajan en nuestros
preconceptos.
3. Reactividad: Se refiere a la modificacin de la conducta que pueden
sufrir los sujetos observados por el solo hecho de saberse observados. Por con-
siguiente, entre las interferencias causales de la reactividad, que conviene ami-
norar, se pueden mencionar: la modificacin del marco natural producida por
el sistema de observacin, la introduccin de otros estmulos nuevos en el
Pruebas diagnstico 171
o Instrumentos de observacin
FECHA: 11 octubre 11 1I
CLASE:
PERIODO:
ltimos
Entre
11
11111
11
11
1111111111
1111111
111111
11111 Historia
3 10 Y 5 del final
5 minutos
el minuto
materias ...............................
Nombre: Fecha:
Lugar: Nombre: Incidente
Comentario Clase:
Clase:
Incidente: Fecha
Comentario:
Alumno: Comentario
Observador
Incidente
Lugar Clase:
clase podran ser los siguientes, el primero para cada alumno y el segundo
para un grupo de alumnos de un aula:
Alumno: _
.. '., TIEMPOS J >
', ...... 2" Semana
Semana 13 Semana
4aSemana
33 ..... < ..,
B. Colabora
D.
C. Presenta tareas ..........
en trabajos
Aula: .
13 I 2" 33 13 I 23 33 13
Juan .
Laura .
43
2 5
B. Colabora
D.
C. Presenta tareas
en los trabajos en grupo
174 La evaluacin de aprendizajes
5 Excelente 5 Siempre
4 Bueno 4 Casi siempre
3 Normal 3 Con frecuencia
2 Deficiente 2 Pocas veces
1 Muy deficiente 1 Nunca
+3 +2 +1 o -1 -2 -3
8 7 6 5 4 3 2
AA A D DD
4.3. Escala descriptiva: Describe con ms detalle los grados de cada com-
portamiento. Estas escalas ayudan a evitar juicios demasiado genricos y preci-
pitados, lo que permite una evaluacin ms objetiva; por ejemplo, para evaluar
Laatencin en clase:
-no
5. Siempre se con -frecuencia.
2.
4.3.
con
1. Reacciona
-Se
entiende.
atencin.
IIamarle
distrae.
Se
ASe
-aPregunta
siempre
del
Nolas Es
frecuencia.
veces
distrae
continuamenteintil
respondesi la
distrae
profesor.
bien
preguntas se
Pruebas diagnstico 175
VALOR
Los
La
No exmenes
preparacin
se 9,0
se
dedeben
deben
1,S
debe obligar
son evitar
incluir
exmenes
ayudan
a nadie
la mejor OPINIONES
porque
pruebas
consume
a estudiar
aestrategia
hacer
con son alienantes.
optativas.
unaprendizaje.
exmenes.
ms
de tiempo y unas
profundidad.
..
Se presentan los tems ordenados al azar, no las valoraciones, para que los
sujetos sealen las opiniones con las que estn de acuerdo. La media de los valo-
res de las opiniones elegidas es la medida de su actitud. Los resultados, ms
176 La evaluacin de aprendizajes
que un valor absoluto, indican la posicin relativa del individuo dentro del
grupo.
5.2. Escala de Acuerdo o Concordancia (Likert, 1932): La escala
Likert, que consiste tambin en una lista de enunciados, es el mtodo ms
extendido para las mediciones de actitud. Las dos diferencias fundamentales
entre esta escala de Likert y la de Thurstone son las siguientes: la valoracin de
los tems se basa en datos empricos, no en la opinin previa de los jueces; y
el sujeto no seala simplemente si est de acuerdo o no con cada opinin, sino el
grado de su acuerdo, generalmente de 1 a 5, de manera semejante a la Escala
numrica.
Debe procurarse que los enunciados, relacionados con la actitud que se
quiere evaluar, estn formulados de forma afirmativa. Para evaluar la misma
Actitud hacia los exmenes, se presentaran una serie de tems, por ejemplo:
5 4 3 2
5 4 3 2
1. La participacin en el trabajo por parte de todo los miembros del equipo fue:
(7) MXIMA MNIMA (1)
2. El inters en el trabajo puesto por todos los miembros del equipo fue:
(7) GRANDE ESCASO (1)
5. El inters mostrado por los miembros del equipo por las ideas de los dems fue:
(7) GRANDE ESCASO (1)
6. La libertad de los miembros del equipo para expresar abiertamente sus ideas fue:
(7) GRANDE ESCASA (1)
8. La eficacia de los miembros del equipo para llevar a cabo su tarea fue:
(7) GRANDE ESCASA (1)
5.4. Otras escalas: Son muchas las variantes de escalas que se encuentran
en la bibliografa especializada. La mayora son de escasa aplicacin en el con-
texto educativo que aqu nos interesa, por lo que nos limitamos a citadas: la
escala de anlisis jerrquico de Guttman (Edwards, 1957), la escala de Lunn
(1969), las comparaciones emparejadas (Thurstone, 1947). Una buena revisin
actual puede consultarse en Dunn-Rankin, Knezek, wallace y Zhang (2004).
2. ENCUESTA
2.1. Entrevista
Cuestionario 2.2.
Dicotmicos (A)
Mltiples excluyentes (B)
CUESTIONARIOS Cerrados (2)
Mltiples no excluyentes (C)
Mixtos (3)
{Abiertos (1) { Clasificacin (D)
o Confeccin de cuestionarios
1. Factores: Una vez delimitado el campo de estudio, una primera tarea con-
siste en identificar las variables o factores que lo configuran. Se pueden utilizar
para ello diversos procedimientos como definicin de conceptos, construccin
de indicadores de presencia o ausencia de los factores, etc.
2. Preguntas: La bondad de un cuestionario se juzga por la clase de pre-
guntas que se proponen y por su adecuada formulacin. Las preguntas de un
cuestionario recaen sobre aquellas variables o factores respecto a los cuales
deseamos tener informacin. Cuando se formulan las preguntas, es convenien-
te seguir una serie de reglas prcticas:
a) La pregunta ha de ser clara y concreta, evitando palabras de significado
confuso y ambiguo, o trminos excesivamente tcnicos y poco usuales.
Cuando la informacin deseada depende de un factor excesivamente
complejo, es preferible utilizar varias preguntas. Ese ideal de claridad exi-
ge tambin prescindir de frases negativas y de aquellas otras que condi-
cionan la respuesta.
b) Las preguntas han de tener aceptabilidad social. Esto supone evitar pre-
guntas inadecuadas porque exijan una informacin confidencial, o pon-
gan de manifiesto la ignorancia o falta de informacin del sujeto.
c) Es conveniente seguir una adecuada distribucin de las preguntas. As, la
tcnica del embudo propone formular preguntas generales para pasar,
a continuacin, a otras ms concretas.
d) Por su parte, el fenmeno de la irradiacin -influencia de la pregunta
anterior- aconseja usar preguntas amortiguadoras que corten una
182 La evaluacin de aprendizajes
PROPIEDADES PSICOMTRICAS 1.
Los tests y pruebas, para poder ser utilizados de una forma adecuada como ins-
trumentos cientficos de medida, han de reunir una serie de propiedades y
requisitos mtricos (Muiz, 2003), de los que citamos los siguientes:
Fiabilidad 1.1.
Es la precisin con la que una prueba mide una variable dada. Se proponen
diversas formas para realizar una estimacin emprica del coeficiente de fiabili-
dad:
L ZXZy
rXY [1]
N
186 La evaluacin de aprendizajes
(Zx = x ;x x)
Zy = puntuacin tpica de un alumno en la 2a prueba
(Zy=Y;y YJ
N = nmero de alumnos.
2 Pxx'
Pxx' = 1+ Pxx' [2]
[3]
n - 1 0'2x
ex = n [1 - J~l cr~J
Factores que afectan a la fiabilidad: Para que las pruebas sean ms fia-
bles, conviene que el profesor tenga en cuenta los siguientes factores:
a) Longitud: La fiabilidad de una prueba o test es mayor si se incrementa
e! nmero de tems similares para comprobar el mismo objetivo. En principio,
cuantos ms tems se utilicen, es decir, cuanto mayor sea la longitud de la prue-
ba, mayor ser la fiabilidad.
Caractersticas de las pruebas 187
A partir de la fiabilidad del test original, se puede medir ese aumento de fia-
bilidad mediante la frmula de Spearman-Brown (Muiz, 2003):
npxx'
[4]
Pxx' =1+ (n - 1) Pxx'
Validez 1.2.
1.3. Dificultad
1.4. Discriminacin
Se dice que un tem discrimina si distingue entre aquellos sujetos que puntan
alto en la prueba y los que puntan bajo. En consecuencia, el ndice de discrimi-
nacin (IDs) se define como la correlacin entre las puntuaciones de los sujetos
en el tem y sus puntuaciones en la prueba (Muiz, 2003).
El ndice de discriminacin, que vara de -1 a + 1, permite determinar en
qu medida una pregunta es selectiva para distinguir un grupo competente de
un grupo incompetente. Cuanto ms elevado es este ndice, la pregunta permi-
te diferenciar mejor dichos grupos.
Si un test, por ejemplo, se compone de preguntas con altos ndices de dis-
criminacin, asegura una clasificacin discriminativa de los estudiantes segn su
nivel de actuacin. Dicho de otra manera, el test no concede ventajas a los alum-
nos dbiles respecto de los fuertes; ms bien ayuda a reconocer a los mejores
estudiantes. Esto, por tanto, slo quiere decir que una pregunta separa a los
alumnos en la misma direccin (discriminacin positiva) que el resto del exa-
men, o en direccin contraria (discriminacin negativa).
Uno de los procedimientos para establecer el ndice de discriminacin es el
siguiente: con las pruebas ya corregidas, se hacen dos grupos: mejores califica-
ciones y peores calificaciones. El ndice de discriminacin vendr dado por la
siguiente frmula:
IDs = As - Ar
N [6]
2
* * *
OTRAS CARACTERSTICAS 2.
RELACiN ENTRE
3. LAS CARACTERSTICAS DE UN EXAMEN
Las propiedades y caractersticas hasta aqu citadas guardan entre s una estre-
cha dependencia, de las que destacamos algunas.
Validez y fiabilidad: Para que un instrumento de evaluacin sea vlido
debe ser a la vez pertinente y fiable. La fiabilidad es una condicin necesaria,
pero no suficiente, para la validez. As, resultados vlidos deben ser fiables, pero
resultados fiables no son necesariamente vlidos. En consecuencia, los resulta-
dos poco fiables influyen en el grado de validez. Por otra parte, una prueba pue-
de a menudo volverse ms vlida si se aumenta su fiabilidad.
Validez y pertinencia: El concepto de pertinencia corresponde, ms o
menos, al de validez de contenido. El modo de establecer una y otra es anlogo.
Por definicin, una pregunta es pertinente si sirve a la validez del tem, y un
tem es pertinente si respeta las especificaciones de los objetivos establecidos
durante su planificacin.
Caractersticas de las pruebas 191
VALIDEZ
~
FIABILIDAD PERTINENCIA
~
OBJETIVIDAD DISCRIMINACiN
~
DIFICULTAD PRACTICABI LIDAD
Para que una prueba sea vlida, es necesario que sea pertinente y fiable; pero
puede ser fiable y no vlida. De manera semejante, para que sea fiable, ha de ser
objetiva y discriminante; lo contrario no es verdad. Para que discrimine, debe
poder llevarse a la prctica y tener un ndice de dificultad adecuado, no viceversa.
Caractersticas de las pruebas 193
4. Ejemplos de bancos
4.1. Matemticas (Teresa y Luengo, 1996)
OBJETIVO (4)
CAPACIDAD: Comprensin.
CONTENIDO: Concepto de derivada de una funcin en un punto.
DISEO (1): Se trata de comprobar si se comprende el concepto de deriva-
da de una funcin en un punto, para lo cual se propone en primer lugar que se
seleccione las expresiones que corresponden a la derivada de f en un punto
determinado y, haciendo uso del resultado obtenido y conocidos los valores
que toma la funcin en las proximidades del mismo, se estime el valor de la
derivada de la funcin en dicho punto.
PRUEBA c.04.01.01
1) Qu expresiones entre las que siguen corresponden a la derivada de la fun-
cin f en x = 1?
PRUEBA c.04.01.02
1. l. lm------
f(O + h) - f(O)
h-tO h
2 1 lID
. _f_(x_) _-_1
x-tO X
d) 1
202 La evaluacin de aprendizajes
OBJETIVO (4)
CAPACIDAD: Comprensin.
CONTENIDO: Concepto de derivada de una funcin en un punto.
DISEO (2): Para comprobar si se comprende el concepto de derivada de
una funcin, se propone que, con la ayuda de la grfica de la funcin y conoci-
dos los valores que toma en las proximidades de un punto, se estime el valor de
la derivada de la funcin en dicho punto, como el lmite de los cocientes
f(x) - f(a) . ,
----- (pendlentes de las secantes que se apoyan en el).
x-a
PRUEBA c.04.02.01
x fW-
3 1,25
5 3,25
5,5 4,0625
5,9 4,8025
6 5
a) lim f(x) = 2
x-t6
b) e (6) =2
c) f(3) = -1,25
d) lim f(x) = -2,5
x-t3
Banco de pruebas 203
PRUEBA c.04.02.02
2\;
25,75
OO-
5,4375
5,724
5,64 2
5
2,5
2,05
2,2 I~I
OBJETIVO (5)
CAPACIDAD: Aplicacin.
CONTENIDO: Derivabilidad de una funcin en un punto. Clculo de
lmites. Derivadas laterales.
PRUEBA a.05.01.01
x
Considrese la funcin dada por f (x) = --
1+ Ixl
1) Cul es el valor de las derivadas laterales de f en x=O?
a) e (0)= f~ (0)= 1
b) e (0)= f~ (0)=-1
c) e (0)= -1 Yf~ (0)= 1
d) f~ (0)= 1 Yf~ (0)=-1
a) S, y su derivada en x = O es l.
b) S, Ysu derivada en x = O es-l.
c) No, al ser distintas las derivadas laterales de f en x = O.
d) No, al estar definida f por medio de valores absolutos.
PRUEBA a.05.01.02
si x:/:.O
Dada la funcin f(x) = {--" Sl X = O
4. f'(O) =O
Banco de pruebas 205
a) 1Y2
b) 1 y4
c) 2y3
d) Todas
a) S, y su derivada en x = O es O
b) S, Ysu derivada en x = O es 1
c) No, al ser distintas las derivadas laterales de f en x =O
d) No, al no estar definida f en x = O
206 La evaluacin de aprendizajes
OBJETIVO (5)
CAPACIDAD: Aplicacin.
CONTENIDO: Derivabilidad de una funcin en un punto. Clculo de
lmites. Derivadas laterales.
PRUEBA a.05.02.01
b) f'(x) = leas xl
e)
f'(x) = { - eas x para x>
x~O
d)
f'(x) = {- eos
eas x para x >
<O
PRUEBA a.05.02.02
e) f'(x) = 13x21
d) f'(x) = 3x2
d) No existe
Diagnstico: 4.01.01.1-a) / 4.01.01.2-b) / 4.01.02.1-d) / 4.01.02.2-b) /
4.02.01.l-a) / 4.02.01.2-b) / 4.02.02.1-d) / 4.02.02.2-b) / 5.01.01.1-a) /5.01.01.2-a)
/ 5.01.02.1-a) / 5.01.02.2-d) / 5.01.02.3-c) / 5.02.01.l-d) / 5.02.01.2-c) /5.02.01.3-
c) / 5.02.02.1-a) / 5.02.02.2-a) /5.02.02.3-c)
208 La evaluacin de aprendizajes
PRUEBA c.04.01.01
b)
c)
B
C
~ ~'-
.. . . -
-
PRUEBA c.04.01.02
PRUEBA c.04.01.03
PRUEBA c.04.01.04
Una persona va en una moto con velocidad constante. Suelta una de sus manos
y lanza verticalmente hacia arriba una bola de acero, dejando la mano extendi-
da. Labola caer:
a) Detrs del motorista, si la velocidad de la moto es grande.
b) Delante del motorista.
c) En la mano que la lanz.
d) Detrs del motorista siempre.
PRUEBA c.04.01.05
PRUEBA c.04.01.6
h
fica representa correctamente el espacio horizontal X recorrido por el proyectil
en funcin del tiempo?
x x
x
a) b) c) d)
PRUEBA c.04.01.07
Un nio lanza con un tirachinas una piedra a un pjaro que vuela horizontal-
mente a una altura de H m. El tiempo transcurrido desde que la piedra golpea
al pjaro hasta que ste choca contra el suelo slo depende de:
a) Velocidad que lleva el pjaro.
b) Altura H.
c) Altura H y velocidad que lleva el pjaro.
d) Distancia entre el nio y el pjaro en el momento del impacto y altura H.
210 La evaluacin de aprendizajes
PRUEBA c.04.01.08
PRUEBA c.04.01.09
~ ~ ~
Al golpear un baln se le comunica una velocidad inicial Va = Si + lO} . En el
punto ms alto de su trayectoria la velocidad y la aceleracin toman los valores:
a~~~j jj
SiOj ~ -9,S
10 -9,S
9,S
9,S
~
~
PRUEBA a.44.01.01
Tres cubas electrolticas idnticas contienen disoluciones acuosas diluidas de
igual concentracin de HC1, HZS04 y Hl04. Si se hace pasar la misma cantidad
de electricidad, en cul de ellas se recoger ms volumen de hidrgeno en
c.n.?
a) HCl
b) HZS04
c) Hl04
d) Igual en las tres
PRUEBA a.44.01.02
PRUEBA a.44.01.03
En la electrolisis de una sal de oro desconocida, se obtuvieron 3,09 g de oro
haciendo pasar 4.550 C. Cul es el eq-g del in oro en dicha sal?
Dato: 1 F = 96.500 C
a) 49,25 g
b) 65,66 g
c) 98,5 g
d) 197g
212 La evaluacin de aprendizajes
PRUEBAa.44.01.04
PRUEBA a.44.01.05
a) 0'11 v
b) 1,61 v
c) 2,22 v
d) 2,51 v
PRUEBA c.06.01.01
PRUEBA c.06.01.02
PRUEBA c.06.01.03
PRUEBA c.04.01.01
Cmo se define una dorsal medio-ocenica?
a) Grandes cordilleras marinas de plegamiento.
b) Acumulaciones de lava basltica con claras anomalas trmicas positivas.
c) Geosinclinales en los que se estn produciendo el plegamiento de
rocas sedimentarias.
d) Fosas submarinas en las que la corteza ocenica subduce.
PRUEBA c.04.01.02
PRUEBA a.04.01.01
Segn el convencionalismo poltico, cul es el origen de las leyes polticas?
a) La convencin de las voluntades de los dioses.
b) El acuerdo social de la mayora.
c) Las leyes dadas por e! acuerdo de los fundadores de la polis.
d) El Logos o Razn Universal.
PRUEBA a.04.01.02
Pero, segn yo creo, la naturaleza misma demuestra que esjusto que elfuer-
te tenga ms que el dbil. Los valores morales, como la justicia, se fundamen-
tan segn los sofistas en la:
a) Voluntad del ms fuerte o en la voluntad de la mayora.
b) Astucia de los dioses, que son ms fuertes que los humanos.
c) Conciencia de cada superhombre.
d) Imposicin de las tradiciones populares de las culturas dominantes.
PRUEBA a.04.0l.03
PRUEBA a.04.01.04
El bien y la verdad en e! plano tico dependen del mayor o menor grado de pla-
cer que nos proporcionan y del poder establecido. El resto de las normas mora-
les son:
PRUEBA a.04.01.05
PRUEBA a.04.01.06
En el fondo no tenis idea de los valores del hombre, y por eso no sois con-
ductores sino seductores, deca Platn de los sofistas. Segn esta crtica, el
requisito de acuerdo de la mayora, es suficiente para que algo se convierta en
ley?
a) S, porque los acuerdos de la mayora marcan el bien comn.
b) No, porque los acuerdos pueden estar equivocados.
c) S, porque eso es lo que se requiere para que algo sea ley
d) No, porque aparte de los acuerdos, se requiere que la ley sea justa.
1 4
2
3
9
8
5 Lxf
40
20
32
54
27
21
12
2
4 = Lx2f
324
256
243
200
147
36
2
80 = 1296
8
212
-
(j-~~ ~~f;. _ x:2 = ~ 11296
40 _ (5, 3)2 = 2, 07
. d d e d'1C
Y1a mIta h a d eSVIaClon
.. , tlpIca:
,. 2, 7 = 1,03
--
2
3 Para determinar los sitios de corte:
Intervalo de calificaciones S: (S,3 - 1,03 , S,3+ 1,03) = (4,27, 6,33).
Observamos que hay 17 alumnos con puntuaciones en este intervalo (S a 6),
que representan el 42,S% de los 40 alumnos.
Corte de las calificaciones SB-N: (6,33 + 2,07 = 8,4).
Sern calificados con N los alumnos cuyas puntuaciones estn en el interva-
lo (6,33,8,4), y con SBlos que tengan ms que 8,4.
Observamos que hay 7 alumnos con N (los de 7 y 8), que representan el
17,S%;y 3 alumnos con SB (los de 9), que representan eI7,S%.
Corte de las calificaciones I-MD: (4,27 - 2,07 = 2,2).
Sern calificados con I los alumnos cuyas notas estn en el intervalo (2,2,
4,27), y con MD los que tengan menos de 2,2.
Hay 9 alumnos con I (los de 3 y 4), que representan el 22,5%; Y4 con MD
(los de 1 y 2), que representan el 10%.
La medida en educacin. II. Calificacin 223
En resumen:
SE: 7,5% (3)
N: 17,5% (7)
S: 42,5% (17)
1:22,5% (9)
MD: 10% (4)
Obsrvese que los porcentajes son parecidos a los que obtendramos si la
distribucin fuese normal con un nmero suficiente de alumnos.
CLASES DE DECISIONES 1.
Conviene recordar que las decisiones educativas las puede tomar una persona o
un grupo. En todo caso, es difcil hacer buenas tomas de decisiones, y ms
cuando las circunstancias de riesgo o incertidumbre son acusadas o cuando,
findose de la propia experiencia y capacidad, se resuelven de manera intuitiva.
Los resultados, en cambio, suelen ser ms eficaces y la probabilidad de acier-
to mayor, sobre todo en el caso de la toma de decisiones grupal, cuando se tie-
nen en cuenta unas reglas inspiradas en teoras psicolgicas y prcticas empre-
sariales. Estas reglas se materializan en el enfoque de toma de decisiones
racional, que Zerilli (1978: 103) define del siguiente modo: La decisin es un
proceso racional continuo mediante el cual partiendo de ciertos datos y efec-
tuando un anlisis y valoracin sobre la conveniencia y las consecuencias
de las soluciones alternativas posibles, respecto a un determinado objetivo, se
llega a efectuar la eleccin final.
Este enfoque expresa siempre una sistematizacin y en muchos casos refleja
tambin un proceder espontneo real que, aunque aparentemente resulte artifi-
cial y tedioso a los profesores nuevos, llega a automatizarse de una manera
natural en profesores habituados.
El enfoque racional de los procesos de evaluacin educativa viene marcado
preferentemente por un carcter grupal, ya que son grupos de docentes los que
toman las deCisiones en los Departamentos, Seminarios, Claustros y Juntas de
Evaluacin. Existen mltiples razones que justifican muy positivamente este
extremo (Huber, 1984):
Los grupos suelen tener ms informacin y mayor capacidad para usada
correctamente que la que puede atribuirse a una persona.
La aceptacin de una decisin tiende a ser ms completa cuando se ha
intervenido en el proceso de tomada.
A todo esto hay que aadir la ventaja que tiene para la institucin la
experiencia que sus miembros adquieren con esa participacin grupal
en la toma de decisiones.
Por el contrario, una de las desventajas que ms afecta a las decisiones
grupales es el consumo de mucho tiempo y el desnimo que esto inspira.
Toma de decisiones en la evaluacin educativa 233
HERRAMIENTAS DE TOMA
DE DECISIONES 3.
Se han elaborado diferentes tcnicas para cada una de las fases de la toma de
decisiones que describiremos a continuacin agrupndolas en torno a tres cla-
ses: anlisis, seleccin y plan de accin, Todas ellas son de aplicacin en las
situaciones de toma de decisiones grupal, algunas tambin para realizadas indi-
vidualmente.
1. Tcnicas de anlisis (Blasco, 1990; Delbecq, Van de Ven y Gustafson,
1975): Son instrumentos de exploracin cuyo fin es precisamente detectar posi-
bles alternativas de problemas, causas, soluciones, etc. Son muchas las que se
pueden encontrar en la bibliografa especializada; por ejemplo, rboles de per-
tenencia, anlisis de grficos, estratificacin de datos. Aqu describiremos con
ms detalle cuatro: las dos primeras de carcter ms general, el brainstorming
para grupos pequeos y el Phillips 66 para grupos ms numerosos; las dos
ltimas ms especficas y complementarias de las anteriores, ya que pueden uti-
lizarse en sus grupos.
a) Brainstorming o tormenta de ideas (Anzieu y Martn, 1975; Ciri-
gliano y Villaverde, 1982): Se apoya en la teora psicolgica de la asociacin de
ideas por contigiiidad, semejanza o contraste, por lo que se rompe la barrera de
lo inconsciente, se estimula la facultad creadora y; al activar procesos asociativos
y reforzar la capacidad de comunicacin, ayuda a descubrir ideas originales,
aumentando la informacin elaborada. El brainstorming se sita en los meca-
nismos de la induccin, desarrollando una actitud interrogativa, poniendo de
manifiesto las preocupaciones de los miembros de un grupo acerca de las posi-
bles alternativas de formulacin de problemas o de sus soluciones.
Para ello se organiza un grupo pequeo, entre 5 y 10 personas, concebido
para presentar ideas divergentes, sin restricciones o inhibiciones debidas a difi-
cultades procedimentales de ejecucin, ni a limitaciones de aptitudes o de habi-
lidades. Todas las ideas son aceptadas sin ponedas en tela de juicio, a menos
que choquen con las reglas acordadas, por ejemplo, en cuanto al tiempo de dis-
cusin, o que tiendan a menoscabar las contribuciones de los otros.
Aunque el brainstorming es relativamente libre, es posible limitado; as,
una sesin de promocin de ideas sobre un campo amplio de problemas, cau-
sas o soluciones puede continuar con otra sobre algn aspecto ms restringido.
Es indispensable, por un lado, que el grupo sea homogneo y est integrado
por individuos relativamente maduros que se conozcan suficientemente bien
como para crear una atmsfera en la que sea aceptable la completa libertad de
expresin; por otro lado, es tambin necesario disponer de suficiente tiempo
para encarar el tema de una manera relajada y sin tensiones, porque no se nece-
siten inmediatamente resultados,
236 La evaluacin de aprendizajes
ES NO ES
QU insatisfactorio
-En otros
Literatura
Rendimientoevaluacin
la 1alos
Disciplinario
Historia
Integracin
Historia:
Literatura:
En otras
Todos cursosescolar
evaluacin
yescolar
3a evaluac.
asignaturas
2aobjetivos
2a
TAREA
DEL FAMILIA
ALUMNO
CALIFICACiN
NEGATIVA
CAPACIDAD
DEL ESCUELA
ALUMNO
1a 3 3 2 9
2a 2 2 3 8
3a 3 2 7
CRITERIOS 2 3 TOTAL
ALTERNATIVAS
1a o 3 5 8
2a 5 7
Alternativas Positivas
Comparacin
Incgnitas
(Desventajas)
Negativas
2"
Todas estas tcnicas no se utilizan como mtodos nicos, sino como tcni-
cas complementarias a otras ms tradicionales en el campo de la educacin
para buscar una mayor profundidad y amplitud de las alternativas, debido a las
aportaciones de todos los integrantes del proceso instructivo.
3. Tcnicas para disear un plan de accin: A este fm se puede emplear
la siguiente herramienta, que es una versin ms o menos simplificada del
PERT,siglas que corresponden a Program Evaluation and Review Technique, y
que se refiere al camino crtico de un calendario de un plan de accin que espe-
cifica las fechas, personal implicado, orden de las operaciones, etc., para conse-
guir una meta determinada. Se pueden encontrar aplicaciones al contexto edu-
cativo en Pokras (1992).
Se empieza teniendo presentes las respuestas a una serie de preguntas
hechas en las fases de anlisis y seleccin, tales como: cul es el objetivo de la
decisin en trminos de comportamiento?, qu actividades son necesarias para
alcanzado?, quin ser el responsable de cada una?, en qu orden se realizar
cada actividad y cunto tiempo supondr cada una?, qu recursos son necesa-
rios?, qu criterios se adoptan para medir si el objetivo se ha conseguido?
A continuacin, se ordenan las acciones que se consideran imprescindibles
para llevar a la prctica la decisin tomada, as como la indicacin de las personas
responsables, el sistema de seguimiento, los recursos y tiempos. El conjunto de
tales actuaciones y propuestas constituye un detallado plan de accin que, en el
caso de ser muchas o complejas, se puede recoger en una tabla como la siguiente:
DECISiN TOMADA:
Persona Recursos
Tiempo responsable
Tcnica de seguimiento
2"
Acciones
recoger en una hoja de previsin donde figure lo que puede fallar, cmo se
puede evitar que ocurra y cmo se rectificar el fallo si ocurre.
JUNTAS DE EVALUACiN 4.
por no ser irreversibles, por lo que se pueden rectificar cuantas veces se estime
oportuno. Son fundamentalmente tres, como aparece en el siguiente esquema:
Organizacin Datos
Opciones funcional
Asignatura Asignatura
Obligatoria Optativa
Programa Programa
nico Complem.lnico
MODELO A
CURSO:
A
A
P
C
PC . SOCIALES
MATEMTICAS
LENGUA
EVALUACiN:
NOMBRE
CATEGORAS (Siglas)
1. Conceptuales (C):
(M) Memorizacin: No recuerda datos.
(1<) Comprensin: No los comprende.
2. Procedimentales (P):
(R) Aplicacin: No es capaz de resolver cuestiones.
2. Afectivas (A):
(T) Atencin: Es incapaz de mantener una atencin sostenida.
(1) Inters: No demuestra inters.
MODELO B
72548
10
CURSO: 96
3 1 ASIGNATURA
NOMBRE
CATEGORAS:
1. Bajo nivel de aptitudes. 6. No entrega los trabajos a tiempo.
2. Retraso en el aprendizaje. 7. Aparentemente no estudia.
3. Falta de inters. 8. Deficiencias en el recuerdo de datos.
4. Nivel de atencin bajo. 9. Deficiencias de comprensin.
5. Problemas personales. 10. Deficiencias de aplicacin.
244 La evaluacin de aprendizajes
4.2. Proceso
Los pasos del ejemplo que estamos sugiriendo se simbolizan en el siguiente dia-
grama:
Psiclogo
Mdico
Departa-
mento
V SELECCINMLTIPLE:Voto ponderado.
C) PERTsimplificado.
1. Problema:
1.1. Enumerar, por medio de un brainstorming o Phillips 66 completado
con QDCC, los problemas planteados por los datos aportados.
1.2. Filtrar, por medio de una seleccin simple s/no, solo los susceptibles
de decisiones ejecutivas; es decir, los problemas relacionados con el aprendiza-
je. El resto de problemas, enviados al rgano competente (Jefatura de Estudios,
Departamento, Gabinete de Orientacin, etc.).
1.3. Seleccionar un problema de aprendizaje por medio de la seleccin pon-
derada o matriz de clasificacin por criterios.
2. Soluciones:
2.1. Formular todas las posibles causas del problema seleccionado por
medio de un brainstorming o Phillips 66.
2.2. Formular todas las soluciones sugeridas por las causas detectadas a tra-
vs de brainstorming o Phillips 66 completado con diagrama causa-efecto.
2.3. Aplicar criterios no slo cognoscitivos (capacidad demostrada de com-
prensin, aplicacin, etc., de contenidos), sino tambin afectivos (inters, apti-
tudes, etc.), de acuerdo con el modelo de recogida de datos decidido previa-
mente.
2.4. Seleccionar la mejor alternativa por medio de la seleccin ponderada o
de la matriz de clasificacin por criterios.
3. Plan de accin: Concretar las acciones, personas responsables de cada
accin, sistema de seguimiento, recursos y tiempos.
4. Introducir las mejoras adecuadas en las decisiones previas y los pasos del
proceso, con el fin de empezar a recoger nuevos datos para la sesin siguiente.
NOI)Vn'VA:I:la S:lS,")
.1
Son varios los criterios que se pueden adoptar para determinar las distintas cla-
ses de evaluacin (Rodrguez Diguez, 1980). Entre otros, conviene citar el sis-
tema que se evala (dando lugar a la evaluacin interna y externa), el momento
de aplicacin (evaluacin inicial, intermedia y final) y los fines y funciones de la
evaluacin (evaluacin formativa y sumativa).
SISTEMA EVALUADO 1.
2. TIEMPO DE APLICACiN
3. FINES DE LA EVALUACiN
mo, puede ajustar las actividades para aprender, introducir posibles correccio-
nes y procesos alternativos remediales para continuar su aprendizaje. Este tipo
de evaluacin debe hacer competir al alumno consigo mismo, y no con otros
alumnos, con el fin de luchar contra sus deficiencias. Tiende a promover un
desarrollo personal adecuado.
Es, por tanto, un ingrediente del proceso de aprendizaje; pero tambin es
un complemento natural de una buena enseanza, ya que es unfeedback para
los profesores; porque, si el fallo se detecta sistemticamente en una mayora
de alumnos, habr que orientar los remedios hacia el programa para revisado y
precisado, y hacia la metodologa para introducir las correcciones oportunas en
las estrategias de enseanza. Esta evaluacin requiere un espritu ms positivo
de cooperacin de todos los grupos implicados y una integracin de todos los
elementos. No debe, de ninguna manera, ser utilizada por el profesor para san-
cionar.
d) TIempo de aplicacin: Como consiste en evaluar tanto las estrategias
de aprendizaje como el rendimiento conseguido por el alumno 'durante la ins-
truccin, desde el momento en que aborda el aprendizaje hasta que termina,
mediante controles precisos, ms o menos formales, la evaluacin debe ser per-
manente.
Esta nocin ha sido a menudo mal traducida, como evaluacin continua, y
peor interpretada: hay profesores que la entienden como una continua evalua-
cin, dedicando ms tiempo a examinar que a otras actividades educativas y
manteniendo al alumno constantemente sobre ascuas. Hay otros profesores,
y alumnos, por el contrario, que la entienden como si un apto justificase siem-
pre la adquisicin de todos los objetivos previos; por ejemplo, un aprobado en
Qumica en el 2 trimestre, justifica toda la Fsica del 1er trimestre. Esto se
podra aceptar en caso de resultados positivos de objetivos inclusivos con rela-
cin de orden (cap. 3) (un aprobado en dividir justifica sin ms el aprobado en
sumar y multiplicar); pero no en el caso de resultados negativos (un suspenso
en dividir no asegura tambin un suspenso en multiplicar y sumar), o de objeti-
vos no inclusivos sin relacin de orden (el caso citado de Fsica y Qumica); de
esta forma, la adquisicin de unos objetivos enmascara la de otros totalmente
distintos y sin relacin.
En resumen, la evaluacin formativa es una evaluacin permanente para
determinar el grado de adquisicin de cada objetivo, y detectar tanto los aspec-
tos NO asimilados, como las causas para reajustar y optimizar los logros y el
proceso de enseanza-aprendizaje.
Otras coordenadas que completan el perfil de la evaluacin formativa son:
e) Nivel de generalizacin: Como se fija ms en la adquisicin de cada
objetivo o incluso de aspectos parciales de los objetivos, el nivel de generaliza-
cin de las pruebas es mnimo, de manera que todas y cada una de las capacida-
des y de los contenidos importantes, aun implcitos, de los objetivos deben
quedar reflejados en algn control de la evaluacin formativa.
Clases de evaluacin 255
; Oviedo,
Barna. MAC,
Pregunta minutos.
Estbanez
Documental
Guadalaviar.
la
deGeografa
donde
Informtico
Planeta
Texto
Serie
Cf.:
Universidad
manifestacin
El
papella
cap.5, dinmica
Turia
BUp,
MAC. enMAV:
2Apuntes
oen
movimiento
10Texto
clase,
Leccin
Albacete,
Atlas
Milagroso,
Vicens-Vives,
tecnnico;
CC.NN.
Enciclopedia
adj.
topogrfico,
del
(1976)Anlisis
mapa
tectnicas,
interpretacin
Tamargo,
de
mapaKyoto,
(Grfico
Puyol,
(1992),
las
pgs.
(1984):
AA.W.
Respuesta yJ.
1Ecos,
7",
Escolar,
AA.W.
R. J.ea
Barna,
Cualquier
Espaa:
fsico
placas
milimetrado.)
Programa
AA.W(1994)
Geografa
aparezca
para estudiar
83ss.
El
(1980)50
de
un Lae
de 7.yDISA-EI
formacin del
representacin,
Espaa,
del
relieve
pg. siglo
Mundo, 49. su
pg.
XXI, 28.
Tebar
pgs. Flores,
13, 14 Y
,
1358.
Espaa Ebro.
Levante-
Madrid,
prof.: MEC,
Lminas,
Depresin
elaborado
(1993)
el
Espaa! del
por
Objetivo
Ev.
Formativa
Ev.
Sumativa
Clases de evaluacin 261
PLANIFICACiN 1.
Para planificar un examen, sobre todo cuando los resultados se van a valorar cri-
terialmente, como es el caso ms frecuente en situaciones acadmicas, una de
las estrategias que se usa a menudo es empezar estableciendo una tabla de doble
entrada, conocida como tabla de especificaciones o matriz de evaluacin,
que recoja los objetivos que se van a evaluar directamente. Con independencia
de la taxonoma de capacidades y de la estructura de contenidos adoptadas, no
es necesario examinar de todos los objetivos, sino slo de una muestra. El
conocimiento, producto del aprendizaje significativo, no est atomizado; por el
contrario, se almacena de una manera relacionada en racimos de conocimien-
tos afines. Por esta razn, se puede concluir que, seleccionando una muestra
representativa, se puede extrapolar de su xito, la consecucin de toda una pro-
gramacin. Si la materia es breve, la muestra se puede seleccionar mentalmen-
te; en caso de exmenes ms amplios, ayuda hacer una representacin escrita
266 La evaluacin de aprendizajes
colocando los diferentes contenidos que se van a evaluar en las filas, y las capa-
cidades en las columnas.
En los ejemplos siguientes, la primera tabla reproduce una matriz de pro-
gramacin con el nmero de objetivos de dicha programacin, y la segunda
una tabla de especificaciones en la que el nmero de objetivos se ha traducido a
nmero de elementos de un examen, localizados en las celdas:
MATRIZ DE PROGRAMACiN
6O
11
3
5
25
34
28
35
4
13
28
5
1
12
22 1118
111 132
1. Lectura
O 33
16
20
18 4
2
1
5
O
(Tabla de especificaciones)
2III 2
3
O
O 131
I3419
O21
3
1O2
11
18
O 96 64
910
8
12
7 2
3
I O TOTAL
4. Sustantivo
El proceso de la evaluacin 267
Orden de finalizacin 32
24
956
965
35
940
964
948
955
27
31
52
968
942
40
30
25
1.010
Suma
Rango................................
de.............................
decalificaciones
calificaciones
Una segunda razn que aconseja dar tiempo suficiente para contestar es que
la ansiedad que los alumnos sufren en los exmenes, ya alta de por s en prue-
bas sin lmite de tiempo, se acenta ante exmenes que hay que realizar en
poco tiempo o en un tiempo muy justo.
En resumen, una prueba se considera adecuada cuando la mayora de los
alumnos disponen de tiempo para contestar a todas las preguntas. Aunque no
hay normas generales, los especialistas en evaluacin consideran inadecuado
por rpido un examen si menos del 90% de los alumnos tiene tiempo para con-
testar todas las preguntas.
En todo caso, el nmero de cuestiones que un alumno puede contestar en
un tiempo determinado depende de varios factores; por ejemplo, del tipo de
preguntas, de la mayor o menor complejidad del proceso requerido para poder
responderlas y de los hbitos de trabajo y experiencia del alumno (uno puede
quiz terminar un examen en la mitad del tiempo que necesita otro). Por ello,
no es fcil determinar qu tiempo se requiere para contestar a unas determina-
das cuestiones. Normas como estimar un minuto para cada tem de eleccin
mltiple o 30 segundos para un tem verdadero/falso son generalizaciones
sin fundamento. Slo la experiencia de proponer pruebas semejantes en con-
textos semejantes puede ayudar a decidir el tiempo necesario para realizar un
examen.
b) Muestra de preguntas: Hemos dicho al tratar de la tabla de especifica-
ciones que basta controlar una muestra significativa de objetivos para poder
sacar conclusiones de toda una programacin. Adems, es obvio que en los ex-
menes tampoco se incluyen todas las preguntas posibles que sugieren aquellos
objetivos seleccionados; aunque, por lo comn, cuantas ms preguntas conten-
gan, ms fiables van a ser las calificaciones. En terminologa estadstica, los
tems de un examen constituyen una muestra de una poblacin mucho ms
amplia. As, una prueba que consista en la localizacin en un mapamundi de
100 capitales se podra construir seleccionando una de cada 5 capitales de las
500 que se han estudiado en clase. Estas 500 capitales constituyen la pobla-
cin, de las que se seleccionan las 100 como muestra representativa de las
500. Conviene insistir en que la poblacin a la que nos referimos ahora no son
los objetivos (en este caso, el objetivo sera nico: localizar capitales en un
mapamundi), sino el conjunto de todas las preguntas que se pueden hacer
para comprobar los objetivos.
Consideremos un alumno al que, por una parte, se le pide localizar las 500
capitales y sita correctamente 325 (65%); y, por otra, de las 100 capitales de la
muestra, localiza bien 68 (68%). La diferencia entre el 65% de la poblacin y el
68% de la muestra se conoce como error de muestreo.
En este ejemplo, la poblacin de las preguntas est definida, 500 capitales;
pero no ocurre as en la mayor parte de los casos, en los que no se dispone de
una relacin predefinida y limitada para elegir una muestra representativa de las
preguntas. Sin embargo, las que se utilizan para cualquier prueba son tambin
270 La evaluacin de aprendizajes
una muestra, dado que suponen slo una parte de las que se podran utilizar. El
problema, pues, estriba en elegir una muestra adecuadamente representativa
de una poblacin terica de las cuestiones correspondientes a un tema.
Por consiguiente, toda prueba no deja de ser una muestra, por lo que su
calificacin est tambin sujeta a sus errores: cualquier muestra perfectamente
seleccionada al azar estar sujeta a los errores de muestreo simplemente por-
que es una muestra. Sin embargo, una muestra grande estar por lo comn ms
cercana al parmetro poblacin que otra ms limitada, y los errores debidos a
ella sern menores.
En resumen, es importante seleccionar una muestra de pruebas significativa,
a sabiendas de que los errores inherentes de muestreo estarn presentes en
prcticamente todas las calificaciones educativas; aunque no estn producidos
por errores al hacer el muestreo.
Por ltimo, conviene hacer una consideracin ms sobre el nmero de pre-
guntas. Hay que sealar que depende tambin del factor interpretacin que se
va a hacer de los resultados: una calificacin criterial necesita una muestra ms
amplia que una normativa. Como orientacin, hay autores que establecen como
mnimo 3 preguntas para evaluar un objetivo criterialmente; pero slo 2 si la
interpretacin va a ser normativa.
Indirectos
P. Objetivas P. Reales
P. Diagnstico Simulacin
Verdadero/Falso
Eleccin Mltiple
Respuesta limitada
Problemas
P. Libres
Respuesta abierta
Pruebas mixtas
Examen oral
Prueba prctica
Proyecto
cin, como es obvio, entraa menos problemas. Sin embargo, cuando algn
componente sirve para evaluar objetivos nicos, relevantes por ser nicos, no
por su mayor o menor importancia, su peso debe ser superior al asignado a
otros que cubren varios objetivos iguales. Hay que sealar tambin que los
objetivos ms importantes han de ser evaluados mediante ms componentes,
con objeto de resaltar su importancia en la nota final.
EJECUCiN 4.
consistir ste, as como otros aspectos que se consideren necesarios para dar
respuesta a las preguntas lgicas que suelen hacerse ante cualquier prueba. Con
ello, adems, se reduce su ansiedad.
c) Habilidades para hacer exmenes: No es infrecuente que los alum-
nos que no saben hacer exmenes rindan por debajo de lo esperado. Por ello,
el profesor ha de procurar que tengan en cuenta, entre otras, las siguientes con-
sideraciones:
1. El alumno debe leer o escuchar atentamente las instrucciones del exa-
men y seguidas al pie de la letra.
2. Debe interpretar las palabras clave de cada pregunta: definir, describir,
justificar, ete., y todo, siempre, a veces, ete.
3. Debe conocer y considerar los criterios de calificacin: cunto vale
cada pregunta?, quitan puntos las respuestas errneas?, se puede
dejar alguna pregunta sin responder?, etc.
4. Debe tener en cuenta la importancia de la legibilidad y la limpieza, cir-
cunstancias que pueden influir en todo corrector.
5. Debe adoptar una buena postura fsica.
6. Debe afrontar la prueba con la mejor disposicin mental posible; lafati-
ga de un estudio atropellado a ltima hora puede pasar recibo.
7. Debe asignar a cada pregunta un nivel de dificultad (muy difcil, regular,
fcil) y, consecuentemente, un tiempo a cada una para poder responder
a todas.
8. Debe saber que en las pruebas objetivas por lo general se penaliza el
adivinar; sin embargo, ha de intentar deducir razonadamente las res-
puestas a todas las preguntas.
9. Si ha de reflejar sus respuestas en una hoja aparte, como suele ser el
caso de las pruebas objetivas, debe comprobar concienzudamente las
marcas para asegurarse de que corresponden a lo que realmente quiere
contestar.
10. En pruebas libres debe reflexionar y organizar sus respuestas antes de
empezar a redactadas: en primer lugar, hacer un esquema de las ideas
principales y, luego, desarrollado. Adems, se aconseja escribir siempre
algo adecuado en todas las preguntas.
11. Aadir,siempre que sea conveniente, diagramas, grficos, recuadros, etc.
12. Debe repasar sus respuestas para detectar y corregir los errores. Est
demostrado que el cambio de respuestas tiende a mejorar las califica-
ciones cuando tal cambio, ms que a adivinanza al azar, responde a nue-
vas intuiciones (Crocker y Benson, 1980; Mueller y Wasser, 1977).
13. Para evitar las faltas de ortografa, en caso de duda, utilizar sinnimos o
perfrasis.
El proceso de la evaluacin 275
CORRECCiN Y CALIFICACiN 5.
-10 -9 -8 -6 -4 o +4 +6 +8 +9 +10
6. TOMA DE DECISIONES
Una vez obtenidos los resultados y valorados con una calificacin, procede
tomar las decisiones oportunas, individual o grupalmente, siguiendo las obser-
vaciones que se recogen en el captulo 14.
7. REVISiN
Es prctica habitual el ofrecer una ltima oportunidad al alumno para que revise
las valoraciones y decisiones que el profesor hizo de sus ejercicios y, as, pueda
aportar nuevos datos para alcanzar una mejor evaluacin. Incluso algunos pro-
fesores dedican alguna clase a realizar esta revisin conjuntamente como un
medio ms de practicar una evaluacin formativa, que, por un lado, corrija erro-
res y, por otro, asegure un recuerdo ms duradero.
Para ello, es imprescindible planificar estas sesiones de revisin previamente
con una informacin detallada sobre los errores detectados en las respuestas y sus
posibles explicaciones; de lo contrario, se corre el peligro de desperdiciarlas con
largas y estriles discusiones sobre los merecimientos de un punto arriba o abajo.
Al mismo tiempo, si los resultados medios de los alumnos caen por debajo
de lo esperado, las decisiones deben dirigirse hacia los mtodos de enseanza y
de evaluacin; en especial, si los exmenes proporcionan informacin sobre el
fin para el que se proponen, si la formulacin de las preguntas adolece de algu-
na ambiguedad, si el grado de dificultad de las preguntas sobrepasa el lmite
aconsejable, etc. (cap. 15).
* * *
El proceso de la evaluacin 281
Hasta aqu el largo camino que va desde planificar el examen hasta que se
informa al alumno de sus logros y de las decisiones tomadas. Aunque a primera
vista puede parecer muy complicado, la verdad es que la mayora de los profe-
sores llegan fcilmente a automatizado. El peligro es ms bien que el proceso
de la evaluacin se convierta en una rutina que no tenga en cuenta las precisio-
nes que intentamos recoger en este y en los anteriores captulos.
Glosario
Capacidades: Son el conjunto de disposiciones de tipo gen tico que, una vez
desarrolladas a travs de la experiencia, dan lugar a las Habilidades inte-
lectuales.
rencias, de tal manera que todos los ejemplos del concepto tienen esos
atributos y ningn no-ejemplo los posee. Al conjunto de estas caracters-
ticas necesarias y suficientes de un concepto, se le conoce como rasgos
definitorios. Segn esta concepcin clsica, los conceptos se aprenden por
discriminacin entre los diversos elementos del objeto o fenmeno y la
posterior abstraccin de sus elementos comunes. Los hay ms o menos
semejantes al prototipo, por lo que el hecho de que algo encaje dentro
de una categora no es una cuestin de todo o nada, sino ms bien de gra-
do. Dicho de otra forma, no todos los ejemplos de un concepto son bue-
nos prototipos del mismo, por lo que, para presentar un concepto,
deben tenerse en cuenta estos diferentes niveles de bondad de los ejem-
plos. As, se podra discutir si la piedra en el borde de una mesa es mejor
prototipo de energa potencial que un muelle comprimido.
En la bibliografa se encuentra a veces el trmino conceptos con el signifi-
cado de contenidos conceptuales, sinnimo de Objetivos de Aprendiza-
je cuya capacidad es la memorizacin o la comprensin.
Conceptos Base: Conceptos previos cientficamente correctos, vlidos y valio-
sos que, una vez activados y convertidos en Inclusores, sirven como punto
de apoyo para organizar los nuevos conocimientos.
Concreto: Vase Abstracto.
Contenido: En la acepcin de contenido cientfico, son los datos (trminos y
hechos), mtodos (convencionalismos, clasificaciones, criterios, etc.) y
generalizaciones (conceptos, principios y teoras) propios de una materia
o rea del saber.
A veces, se utiliza tambin para significar los contenidos de la enseanza,
cuando se habla de bloques de contenido, contenidos conceptuales,
procedimentales yactitudinales.
Control Estimular: Habilidad para discriminar los elementos bsicos de un
conjunto. Esta habilidad est muy condicionada por aspectos perceptivos.
Creatividad: Es la Capacidad de la persona para realizar innovaciones valio-
sas. No es un don excepcional posedo por unos pocos talentos, sino una
cualidad que todos los hombres poseen en uno u otro grado.
Criterios de Promocin: Son las normas que condicionan el paso de un cur-
so, de un ciclo o de una etapa a la siguiente.
Diversificacin Curricular: Vase Adaptacin Curricular Grupal.
Diferenciacin Progresiva: Expresin usada por Ausubel para referirse a la
organizacin j~rrquica de las estructuras de conocimiento. No coincide
con la deduccin, puesto que induccin y deduccin se refieren a la
secuencia de adquisicin de conocimientos, y aqu se postula que, inde-
pendientemente del mtodo, la Informacin queda estructurada jerrqui-
camente.
288 La evaluacin de aprendizajes
Jerarqua de Valores: Los Valores son mltiples. Hay valores tiles, econmi-
cos, vitales, intelectuales, religiosos, morales, estticos, etc. Entre s, man-
tienen relaciones de valor, es decir, establecen una jerarqua, un orden de
prelacin valioso, de modo que el cumplimento de uno debe prevalecer
sobre el otro. Cada valor se rige por el grado de preferibilidad o de no
indiferencia que le corresponde. Unos valores son terminales porque tie-
nen sentido en s mismos, y otros son instrumentales porque son medio
para conseguir otros. La promocin personal de una sensibilidad axiolgi-
ca y de una clara conciencia valorativa es la culminacin necesaria de una
verdadera educacin humana.
Lnea Base: Es la formada por el nivel de conocimientos que configuran el
estado inicial del alumno.
Memoria Permanente (MP): Es la parte de la Estructura Cognitiva donde se
integra la Informacin a largo plazo para posteriormente poder recupe-
rada.
Memoria de Trabajo (MT): Es un elemento de la Estructura Cogntiva donde
la Informacin se organiza en un breve plazo antes de integrada en la
Memoria Permanente.
Mtodo: Plan que realiza el docente tras considerar el conjunto de decisiones
tomadas respecto de la presentacin y transmisin del conocimiento, por
una parte, y en relacin tambin con las tareas que los alumnos han de
realizar para conseguir determinados objetivos. Cada mtodo abarca,
pues, las Estrategias de enseanza-aprendizaje, consideradas ms apropia-
das para conseguir ciertos Objetivos o fines.
Metodologa: Trata los Mtodos de Enseanza Expositiva y por Descubri-
miento.
Multicultural: Situacin en la que coexisten diversas culturas en cuanto con-
junto de ideas, Valores, sistemas de creencias y aspiraciones de una comu-
nidad que constituyen, en cada una de ellas, las bases culturales de su edu-
cacin.
Objetivo: Es una Capacidad sobre un Contenido; esto es, una accin cognos-
citiva, psicomotriz o afectiva sobre una realidad concreta.
Objetivo de Aprendizaje: Es un Objetivo que se puede evaluar directamente
a travs de algn indicador observable.
Objetivos de rea: Son los Objetivos Generales, de carcter disciplinar, en
donde se reflejan las metas a alcanzar en cada materia del currculo. En
algunos Sistemas Educativos, como el espaol, se formulan en primera
instancia en el currculo oficial vigente, aunque los centros tienen la facul-
tad de matizados.
Objetivo de Ciclo: Es el perodo de toma de decisiones, en orden a la promo-
cin; por ejemplo, en la Educacin Primaria del actual Sistema Educativo
espaol, es de dos cursos escolares.
292 La evaluacin de aprendizajes
Sntesis: Estrategia para relacionar e integrar ideas. Hay que distinguir entre
sntesis de proceso o peridicas y sntesis de conjunto o final (efecto
zoom de la Teora de la Elaboracin). A travs de las sntesis peridicas,
el alumno es consciente en todo momento de la estructura informativa y
de la importancia de cada parte individual de conocimiento respecto a
otras partes relacionadas.
La sntesis final es una especie de recapitulacin o repaso rpido en el que
se muestra cmo la explicacin del tema responde a la pregunta o proble-
ma inicial. Es hacer una interpretacin de los conflictos suscitados en la
Pregunta Problema, consolidando as los objetivos propuestos.
Se entiende tambin por sntesis la Capacidad de deducir y crear, propia
de la taxonoma de Bloom.
Sistema: Es una realidad compleja en la que sus partes y elementos, diferencia-
dos, se relacionan entre s para alcanzar una finalidad comn.
Sistema Educativo: Es no slo el ordenamiento legal, determinado por las
leyes, rdenes y reglamentos de distinto orden que establecen las autori-
dades acadmicas, sino tambin la concepcin educativa que conlleva,
entre otras, la seleccin de Estrategias de enseanza y de aprendizaje. Un
Sistema Educativo se caracteriza por la coherencia entre sus fines, conteni-
dos (conocimientos, Actitudes, Valores), ambiente, estrategias didcticas y
organizacin, que se ponen en prctica en funcin de lograr las metas
deseadas.
Sobreaprendizaje: Es el proceso por el que, una vez que el material se apren-
de de memoria y se recuerda sin error, se vuelve a estudiar repetidamente.
Sumario: Es la presentacin previa de todas las ideas que se van a tratar poste-
riormente en una exposicin. Se distingue del Resumen en que ste se
refiere a las ideas que ya se han tratado. El nmero de ideas del sumario
suele ser considerablemente amplio, por lo que tendr que hacerse super-
ficialmente y en un nivel Abstracto.
Team Teaching: Es una manera de organizacin que afecta a los alumnos, divi-
dindolos, segn las exigencias de las actividades de enseanza-aprendiza-
je, en grupos (grandes, medianos, pequeos); y a los profesores quienes
se responsabilizan, en equipo, de determinadas tareas que facilitan la eva-
luacin mutua, por ejemplo observacin en el aula.
Tcnica Didctica: Conjunto estructurado y secuenciado de pasos derivados
de una seleccin de Estrategias suficientemente validada en la prctica.
Teoras del Aprendizaje: Son los modelos o paradigmas que sustentan cada
modo peculiar de entender el aprendizaje. Bsicamente son el Conductis-
mo, el Cognitivismo y el Constructivismo. Para el Conductismo, el apren-
dizaje se da a travs de asociaciones simultneas (contiguidad), o de aso-
ciaciones de la conducta con sus consecuencias (contingencia). Para el
296 La evaluacin de aprendizajes
Referencias biliogrficas
AM:ERI(::AN
FEDERATION OF TEACHERS, NATIONALCOUNCIL ON MEASUREMENTIN
EDlJCA:TION& NATIONALEDUCATION ASSOCIATION (1990). Standards for tea-
chers competence in educational assessment of students. Washington, De: AFT.
AMERICAN PSYCHOLOGICAL ASSOCIATION (1992). Ethical principIes of psycholo-
gists and code of conduct. American Psychologist,51, 644-648.
BLOOM, B. S. (ed.)
de Examinadores
Conocimiento.
des en el aprendizaje
EBEL, R. L. (1980). Are true-false items useful?" En R. L. Ebel (ed.): Practical pro-
blems in educational measurement. Lexington, MA: D.C.Heath.
EBEL,
nosR.Aires:
L. YFRISBIE,
Guadalupe
D. A
(orig.
(1977).
1991).
Fundamentos de la medicin educacional. Bue-
EDWARDS,AL. (1957). Techniques 01 Attitude Scale Construction. New York: Apple-
ton-Century.
EISNER, E. W (1988). The Art 01 Educational Evaluation. A Personal View. London:
The Falmer Press.
GIMENO SACRISTN,].
Madrid: Anaya. (1981). Teora de la Enseanza y Desarrollo del Currculo.
GIMENO
Madrid:SACRISTN,].
Morata. (1988). El Currculo: Una Reflexin sobre la prctica.
GLASER, R. 1. (1963). Instructional Technology and the measurement of learning
outcomes: some questions. American Psychologist,18,519-521.
GMEZ, P. C. y GARCA, A. (1991). Manual TTl. Procedimientos para aprender a
aprender. Madrid: Eos.
GONZLEZ-ROM, V y ESPEJO, B. (2003). Testing the midcl1e response categories
not sure, in between, and? in polytomous items. Psicothema, 15,278-284.
GORING, P. O. (1971). Manual de mediciones y evaluacin del rendimiento en los
estudios. Buenos Aires: Kapelusz.
302 La evaluacin de aprendizajes
Valladolid: ICE
evdluatingalternatives to tradi-
KEP~;~. ~~'lr
TREGOE, B. (1983). El nuevo directivo
KRIPPENDORFF, K. (1980). Content analysis. An introttuc'tion
Beverly Hills, CA: Sage Publications.
San Francisco:
To11Ulde deci-
New
aptitudes. EnJ.
aplica-
Anlisis de un
TAYLOR,H. (1980). Contract grading. ERIC/TM Report No. 75. Princeton, NJ; ERIC
Clearinghouse on Tests, Measurement and Evaluation, ERIC Document Reproduc-
tion,Service No. ED 198 152.