Anda di halaman 1dari 308

I

LA EVALUACION DE APRENDIZAJES

Problemtica en torno a la evaluacin de aprendizajes

Evolucin del concepto de evaluacin educativa

La medida en educacin. 1. Recogida de informacin

Pruebas objetivas '


Pruebas verdadero/falso

Pruebas de eleccin mltiple

Otros tipos de pruebas objetivas


Pruebas libres

Otros tipos de pruebas libres

Pruebas diagnstico

Caractersticas de las pruebas

Banco de pruebas
La medida en educacin. 11. Clasificacin

Toma de decisiones en la evaluacin educativa

Clases de evaluacin

El proceso de la evaluacin

~ ~
,.

Alcal, 166
~
-
I
CCS EDITORIAL

28028 MADRID
'Ir 91 725 20 00 / @ 91 726 25 70 ISBN84f42-019-9
www.editorialees.eom I e.e.: sei@editorialees.eom 9 "788498"420197
Tefilo Rodrguez Neira Luis lvarez Prez
Paloma Gonzlez-Castro Julio A. Gonzlez-Pienda
Jos Muiz Fernndez Jos C. Nez Prez
Enrique Soler Vzquez

LA EVALUACiN
DE APRENDIZAJES

Editorial ees
Pgina web de EDITORIAL CCS: www.editorialccs.com

Autores Varios
2006. EDITORIAL CCS, Alcal 166/28028 MADRID

Queda prohibida, saivo excepcin prevista en la ley,


cuaiquier forma de reproduccin, distribucin, comuni-
cacin pblica y transformacin de esta obra sin contar
con autorizacin de los titulares de la propiedad inte-
lectuai. La infraccIn de los derechos mencionados
puede ser constitutiva de delito contra ia propiedad
intelectuai (arts. 270 y ss. dei Cdigo Penai). El Centro
Espaoi de Derechos Reprogrficos (www.cedro orgl
vela por el respeto de los citados derechos.

Diagramacin editorial: Concepcin Hernanz


ISBN-1 O: 84-9842 -019-9
ISBN-13: 978-84-9842-019-7
Depsito legal: M-38569-2006
Fotocomposicin: M&A, Becerril de la Sierra (Madrid)
Imprime: Grficas Blonde S.L. (Madrid)
AUTORES

lvarez Prez, Luis.


Universidad de Oviedo. Departamento de Psicologa
Gonzlez-Castro, Paloma.
Universidad de Oviedo. Departamento de Psicologa
Gonzlez-Pienda, Julio Antonio.
Universidad de Oviedo. Departamento de Psicologa
Muiz Fernndez, Jos.
Universidad de Oviedo. Departamento de Psicologa
Nez Prez, Jos Carlos.
Universidad de Oviedo. Departamento de Psicologa
Rodriguez Neira, Te:ftlo.
Universidad de Oviedo. Departamento de C. de la Educacin
Soler Vzquez, Enrique.
Universidad de Columbia. Mster en Educacin
ndice

Prlogo 9

1. PROBLEMTICA EN TORNO A LA EVALUACIN


DE APRENDIZAJES 11
2. EVOLUCIN DEL CONCEPTO DE EVALUACIN
EDUCATIVA 23

3. LA MEDIDA EN EDUCACIN.
1. RECOGIDA DE INFORMACIN 53

4. PRUEBAS OBJETIVAS 73

5. PRUEBAS VERDADERO/FALSO 81

6. PRUEBAS DE ELECCIN MLTIPLE 95

7. OTROS TIPOS DE PRUEBAS OBJETIVAS 121


1. V/F mltiples 123
2. Respuestas combinadas 124
3. Emparejamiento 124
4. Clasificacin ,. 126
5. Respuesta doble 127
6. Respuesta limitada 128
7. Problemas cientfico-matemticos 130

8. PRUEBAS LIBRES 133

1. Respuesta abierta 136


8 La evaluacin de aprendizajes

9. OTROS TIPOS DE PRUEBAS LIBRES 147

1. Pruebas mixtas 149


2. Examen oral 150
3. Prueba prctica real 155
4. Proyecto 156
5. Simulacin 157

10. PRUEBAS DIAGNSTICO 167

1. Observacin 169
1.1. Observacin espontnea 169
1.2. Observacin estructurada 170

2. Encuesta 178
2.1. Entrevista 178
2.2. Cuestionario 179

11. CARACTERSTICAS DE lAS PRUEBAS 183

1. Propiedades psicomtricas 185


2. Otras caractersticas 189
3. Relacin entre las caractersticas de un examen 190
4. Principios ticos y deontolgicos de la evaluacin 193

12. BANCO DE PRUEBAS 195

13. lA MEDIDA EN EDUCACIN. 11. CALIFICACIN 217

14. TOMA DE DECISIONES EN lA EVALUACIN


EDUCATIVA 227

15. ClASES DE EVALUACIN 247

1. Sistema evaluado 249


2. Tiempo de aplicacin 250
3. Fines de la evaluacin 252
3.1. Evaluacin formativa 252
3.2. Evaluacin aumativa 256

16. EL PROCESO DE lA EVALUACIN 263

Glosario 283

Referencias bibliogrficas 297


Prlogo

El objetivo fundamental de este libro, que ahora presentamos, es analizar desde


distintas perspectivas la problemtica implicada en la evaluacin del aprendizaje
de los estudiantes. Nos gua la idea de que no puede haber un aprendizaje cabal
si no se acompaa de una evaluacin eficaz y rigurosa, pues aprender y evaluar
son dos caras de la misma moneda del saber. El libro pretende facilitar al profe-
sorado estrategias y pautas prcticas para llevar a cabo una evaluacin adecuada
de los aprendizajes de los estudiantes. Se han tratado de combinar de forma
equilibrada los fundamentos tericos y tcnicos de la evaluacin con la vertien-
te aplicada, incluyendo todo un conjunto de ejemplos, casos prcticos e ilustra-
ciones que permitan un acercamiento a lo que realmente ocurre en el da a da
del aula. Se trata, en suma, de un libro con vocacin aplicada y prctica, basado
en casos reales, pero sin que ello suponga olvidarse de los fundamentos sobre
los que descansan las estrategias de evaluacin propuestas.
El texto ha sido distribuido en 16 captulos. Se empieza con una invitacin al
anlisis de la problemtica singular que cada uno tiene sobre la evaluacin.
Sigue un estudio diacrnico de su evolucin a lo largo de la historia de la edu-
cacin, con el fin de llegar a una definicin de lo que hoy se entiende por eva-
luacin. En este punto nos detenemos para estudiar dicha definicin, analizan-
do separadamente sus componentes. Se aclara el sentido de la medida en
educacin, primero con un pormenorizado estudio de distintos instrumentos
para recoger informacin sobre los resultados conseguidos por los alumnos,
completado con una serie de caractersticas psicomtricas que deben tener
dichas pruebas, as como unas directrices deontolgicas sobre su uso, y, en
segundo lugar, con la manera de formular juicios para valorar dichos resultados
en forma de calificacin. Finaliza el anlisis de dicha definicin, c00 el estudio
de un tercer aspecto fundamental, a la par que comprometido para el profesor,
la toma de decisiones, que supone una aproximacin deontolgica a la tarea
evaluadora, dadas las consecuencias que de la misma pueden derivarse para el
alumno. Este tercer aspecto, esencial de toda evaluacin de aprendizajes, trata
10 La evaluacin de aprendizajes

tambin de ayudar y dar respuesta al profesorado que a menudo se siente poco


ap(jyado ante su responsabilidad evaluadora. El profesor no est solo y, aunque
con singular responsabilidad, en modo alguno debe constituirse en agente ni-
co de las consecuencias de la evaluacin, lo que s debe asegurar el profesor es
su objetividad y las garantas de su modus operandi. Nuevas reflexiones podran
incorporarse al entorno de la toma de decisiones, por ejemplo, la pretensin de
identificar igualdad de oportunidades con igualdad de resultados, o el
impacto producido por la ampliacin del perodo de enseanza obligatoria. El
estudio sobre la toma de decisiones se completa con un anlisis sobre las Cla-
ses de evaluacin. En el ltimo captulo, se ofrece un resumen de los distintos
pasos del proceso evaluador. Para facilitar la comprensin de la terminologa
que se usa a lo largo del libro, se aade un glosario que incluye una amplia
gama de trminos relacionados, no slo con la evaluacin, sino tambin con
otras tareas docentes, tales como la programacin, las estrategias de enseanza-
aprendizaje, la accin tutorial, etc. Todo ello se enriquece con una seleccin
actualizada de referencias bibliogrficas. En su conjunto, el libro constituye una
continuacin y actualizacin de otro publicado anteriormente por los autores
sobre La evaluacin en el aula.
Esperamos que la lectura del libro permita que los profesores de todos los
niveles, desde la Educacin Primaria hasta la Universidad, reflexionen sobre el
sentido mismo de la evaluacin y, as, vayan conformando una equilibrada apro-
ximacin a su tarea evaluadora, de forma que les ayude a desprenderse de este-
reotipos, modas pasajeras y prejuicios. En cuanto a los profesores de etapas de
educacin obligatoria, les ayudar a analizar la estrecha vinculacin que la eva-
luacin tiene con la atencin a la diversidad, imprescindible en dichas etapas,
concretada en una programacin flexible y en unas estrategias metodolgicas
adaptadas a los alumnos. El libro tambin puede ser de gran ayuda para los
alumnos que cursan estudios universitarios sobre educacin, tales como maes-
tros, logopedas, educadores sociales, pedagogos y psiclogos, entre otros, dado
que como futuros evaluad ores en distintos mbitos, deben conocer las reglas
fundamentales de la evaluacin.

Los autores
551ntZION5IHdV 510
NOI)Vn1VA5I
I V1 V ONHO.L N5I
lDl.LVW5I1aOHd
I
La problemtica relacionada con la evaluacin, tanto desde el punto de vista
terico como prctico, no suele dejar indiferente a nadie; es ms, a menudo se
convierte en una autntica palestra de confrontacin tanto ideolgica como
tcnica (Zabalza, 1989: 235). Como otros fenmenos educativos, la evaluacin,
con todo lo que conlleva, sufre peridicos vaivenes en lo que se refiere a su
valor y consideracin.
Con el fin de que cada lector, de acuerdo con su experiencia y sus conoci-
mientos, subraye, elimine o ample lo que considere oportuno en relacin con
este tema, en los prrafos siguientes, y antes de iniciar su estudio sistemtico,
se recoge una miscelnea de opiniones que suelen orse en los centros de ense-
anza y se leen en la bibliografa especializada.
En todas las publicaciones que abordan la evaluacin educativa se mencio-
nan problemas asociados. Los interesados encontrarn esta amplia problemti-
ca en tratados ya clsicos sobre evaluacin que muchos autores han ido apor-
tando a lo largo de la historia de la educacin; entre otros, es obligado citar a
Adams (1983), Bloom Hasting y Madaus (1975), Cronbach (1972), Ebel YFrisbie
(1977), Gronlund (1973), Lafourcade (1977), Popham (1978), Scriven (1967),
Stufflbean y Shinkfield (1985), Tenbrink (1981), Thorndike y Hagen (1969),
Tyler (1950). Tambin, como ms cercanos a nuestro entorno: Barber (1999),
Casanova (1997), Monedero (1998), Sabirn (1999) y Zabalza (1989).
Opiniones referentes a aspectos varios y diversos: exmenes; juicios de valor
sobre el rendimiento de los alumnos; fines de la evaluacin; programacin, cali-
ficacin y evaluacin; desfase entre la teora y la prctica; dificultades y lmites
de la evaluacin; su funcin de control y seleccin.
1. Destacan las opiniones sobre los exmenes, en los que, para algunos, se
concentran todos los diablos de la educacin. As, se dice que los exmenes
producen ms efectos negativos que positivos, que son represivos y suponen
un instrumento de poder, que reflejan un estilo de enseanza conservador y
autoritario, que producen ansiedad y provocan secuelas muy negativas en la
personalidad y desarrollo de los alumnos; en fin, a veces se ven como una ame-
naza que desmotiva y llega a alienar y daar el propio autoconcepto, por lo que
se declaran incompatibles con una educacin que pretenda ayudar a'realizarse
14 La evaluacin de aprendizajes

al alumno. Luchar contra los exmenes fue una de las consignas estudiantiles de
Mayo del 68.
Otros, sin embargo, acuden al sentido comn para demostrar que la mayora
de los alumnos no sufre estos daos. Efectivamente, dicen, una mala nota dada
a un alumno que se ha esforzado puede causarle un perjuicio, pero normal-
mente las malas calificaciones se asignan a los alumnos que no han estudiado; y
los alumnos que no se esfuerzan suponen un problema mayor que los que estu-
dian, trabajan y se preocupan, por lo que no hay que corregir la evaluacin, sino
la instruccin.
Por otro lado, aaden, una preocupacin moderada por los exmenes es
siempre beneficiosa: el aprender a enfrentarse con situaciones problemticas
que la vida va a deparar, como son los exmenes, es una parte necesaria de la
maduracin. Los problemas de los alumnos que fracasan suelen ser de otra
ndole, y no se van a solucionar suprimiendo los exmenes.
Casi nadie dice que en la enseanza reglada puede haber instruccin sin
evaluacin, incluso para algunos sta llega a ser la pieza clave del sistema edu-
cativo: no puede haber enseanza y aprendizaje si no hay unas metas que alcan-
zar, y si stas no se valoran; es decir, ensear, aprender y evaluar son partes
interrelacionadas del ciclo de instruccin. Sin embargo, desde otras posiciones,
aunque moderadas, se insiste en la sustitucin de algunos instrumentos de eva-
luacin, y se llega a decir que se podra educar mejor sin exmenes formales;
no obstante, en la prctica parece difcil encontrar alternativas.
2. La emisin de juicios de valor sobre los alumnos y sobre la calidad de sus
tareas se suele basar en una informacin elemental o en una percepcin muy
genrica sobre su personalidad; es decir, se critica la tendencia en la prctica
evaluadora a reducir el espectro de informaciones y, por tanto, a simplificar los
juicios de valor. Para Gimeno (1988: 377): la importancia de las notas y de las
evaluaciones escolares desde un punto de vista social, acadmico y personal
para los alumnos contrasta con la simplicidad de los procesos por los que se
adjudican a los alumnos; unos procesos que tienen mucho que ver con una
tpica conducta simplificada de toma de decisiones por parte del profesor.
En este sentido, algunos estudios sealan cmo la toma de decisiones se realiza
frecuentemente urgida por exigencias administrativo-institucionales y por las
necesidades del momento, sin una oportuna elaboracin de acuerdo con algn
modelo estructurado.
3. Se suele considerar tambin que los instrumentos de evaluacin se usan
a menudo con fines distintos para los que fueron diseados; por ejemplo, prue-
bas destinadas a identificar logros de los alumnos se utilizan como variable
exclusiva para valorar centros o profesores.
Si la eficacia de la instruccin se juzga desde instancias externas slo a partir
de las respuestas en los exmenes, surge en los profesores la tentacin de prepa-
rar a los alumnos para lo que se les va a exigir en las pruebas; tanto ms si las con-
secuencias de las malas notas recaen personal y directamente en el profesor. La
Problemtica en tomo a la evaluacin de aprendizajes 15

excesiva influencia de los exmenes hace que puedan modificarse las calificacio-
nes: la prctica puede ir desde capacitar a los alumnos exclusivamente en los con-
tenidos de los que se van a examinar o ensear las respuestas de lo que se va a
preguntar, hasta subir la nota; lo que muestra que el fin influye en la enseanza.
Otras veces, es el mismo profesor el que decide incluir en las calificaciones
factores distintos del grado de adquisicin de objetivos de aprendizaje (Stig-
gins, Frisbie y Griswold, 1989). Se conceden notas altas como premios y bajas
como castigos, convirtindolas as en instrumentos de control en clase. El uso
de las calificaciones para estos propsitos se acepta slo si revierte indirecta-
mente en una mejor disposicin hacia el aprendizaje (una asignatura que no se
califica se convierte en una mara); porque, de lo contrario, se estara comuni-
cando a los alumnos que se prima ms el comportamiento social que el apren-
dizaje de las metas del programa de la escuela.
En general, se admite por muchos que los alumnos que hacen ms esfuerzo
y demuestran ms deseo de aprender deben ser recompensados por ello; por
lo que un reto significativo para todo profesor es encontrar formas de premio,
distintas a las calificaciones, que puedan estimular a los alumnos a actuar cerca
de los niveles ptimos de su capacidad cognitiva. Esta no es una tarea fcil,
puesto que los alumnos responden de manera diferente a las palabras de elo-
gio, a las notas oficiales, a las caras sonrientes ya privilegios especiales.
Slo si desarrollar actitudes de los alumnos hacia algo o su disposicin a
esforzarse figuran entre los objetivos de aprendizaje programados, y si el profe-
sor ha planificado procedimientos instruccionales para ayudar a los alumnos a
desarrollar estos comportamientos, se puede juzgar apropiado considerados en
la asignacin de las calificaciones.
4. La presin sobre profesores y alumnos para alcanzar calificaciones altas
ha llevado a disear currculos dirigidos por los exmenes, es decir, a suprimir
aquellos temas o materias que no se van a controlar, con lo que los exmenes se
convierten en programacin. As, se critica que a veces se ensea para aprobar
exmenes, ms que para alcanzar unos objetivos basados en unos intereses per-
sonales o en unos valores o necesidades sociales. De aqu el aforismo de que
los que construyen las pruebas controlan el programa )~en ltimo trmino, el
aprendizaje de los alumnos. Parece que esto ha influido en las prcticas educati-
vas ms de lo conveniente.
5. Con frecuencia se seala que hay un gran desfase entre la teora y la
prctica; incluso entre los materiales disponibles y esa misma prctica. Las cau-
sas son muy complejas: burocracia escolar, presin de tiempo, prejuicios acien-
tficos, actitudes tpicas de profesores y alumnos conformadas por aos de
experiencia escolar, inercia y rutina de las tcnicas de evaluacin tradicional,
etc. Esto no se puede corregir ni fcilmente ni muy de prisa.
A este desfase contribuye no poco la confusin patente en la bibliografa y
en la normativa al respecto, como lo pone de manifiesto Juan Manuel lvarez
Mndez (1994: 316) cuando escribe:
16 La evaluacin de aprendizajes

Esfcil encontrarse con t(!j.'tosque van matizando sucesivamente el concepto de


evaluacin, implicando en lo que aparentemente es una simple adjetivacin,
funciones y formas de evaluacin muy dispares. Aparecen trminos que aluden a
la evaluacin como inicial, diagnstica, formativa, continua, personalizada,
predictiva, sumativa, final; normativa, criterial, global, individualizada, siste-
mtica. Ms recientemente (MEC [1989] Diseo Curricular Base. Educacin Pri-
maria, Madrid, MEC) se habla de evaluacin puntual, integral e integradora,
uniforme o pluriforme, cualitativa, cuantitativa, interna, externa. ltimamente
y ya en la literatura especializada aparecen conceptos de nueva incorporacin
tales como evaluacin iluminativa, procesual, etnogrfica, de producto, respon-
diente, ideogrfica, participante, democrtica, burocrtica ... Muchos trminos
superponen significados, otros los ocultan, otros los confunden, otros los in ter-
cambian. En otros casos, las interpretaciones que se hacen de ellos los hacen dife-
rentes sin modificar su forma lingustica; en otros, a los mismos trminos se les
asignan funciones y fines diferentes hacindolos irreconocibles, y en otros la
coincidencia slo se da en la expresin pero aluden a referentes totalmente dis-
tintos... No faltan casos donde la confusin es total, pero sobre ella se articulan
discursos que desconciertan a quienes se aproximan o intentan comprender el
estado de la cuestin. La paradoja es que el profesor que debe resolverla eva-
luacin de cada da en el aula contempla abrumado este desconcierto termino-
lgico como espectador de su propio espectculo sobre un escenario en el que l
acta. Todo lo cual hace ver que la evaluacin no es una sola cosa sino varias,
aunque se ejerzan al amparo de un mismo rtulo.

6. Debido al deterioro del concepto de evaluacin educativa, con demasia-


da frecuencia tienden a identificarse evaluacin y calificacin. Es posible que
las posiciones extremas, que proponen desterrar la calificacin, hayan surgido
del hecho de que la prctica tradicional haya entrado en una rutina divorciada
de una teora rigurosa que, por un lado, la depure y,por otro, la avale.
7. Las dificultades a la hora de evaluar objetivos que incluyen algunos tipos
de capacidades, supone, ms que una opinin, una preocupacin generalizada.
La mayora de las pruebas se mueven en torno a una memorizacin comprensi-
va; pero hay otros muchos procesos mentales o capacidades cognoscitivas
importantes susceptibles de aprendizaje y que, por tanto, se deberan evaluar;
por ejemplo, el pensamiento crtico, la creatividad, etc. Sin embargo, a veces
resulta casi imposible explicitar sus indicadores, por lo que es difcil evaluados.
Los procesos de aprendizaje que experimenta un alumno tienen efectos tre-
mendamente importantes, pero con frecuencia son intangibles, sutiles e impre-
decibles; incluso algunos de estos efectos pueden no aparecer hasta mucho
tiempo despus de dejar la escuela. La imposibilidad prctica de medidos con
alguno de los tests disponibles en la actualidad, puede impedir la necesidad de
medidos, por importantes que sean.
Especialmente complicados son los problemas de la evaluacin de habilida-
des manuales o capacidades psicomotrices. Por un lado, se necesitan tiempos
reales a veces muy largos; por otro, resulta difcil especificar bien los comporta-
mientos elementales de que se componen para poder evaluados. con el fin de
proponer al alumno los procesos remediales para cada uno por sep:lr:ldo.
Problemtica en torno a la evaluacin de aprendizajes 17

Pero sobre todo faltan estrategias para evaluar las capacidades afectivas. Con
demasiada frecuencia se califican contenidos actitudinales sin base objetiva, por
lo que no es extrao que tales calificaciones estn tan des prestigiadas y devalua-
das, tanto para profesores como para alumnos.
8. Frente a las crticas de algunos autores referentes a las limitaciones de la
evaluacin, otros sealan que stas van ms all de lo racional: porque no se
pueden medir algunos logros educativos, se concluye que no se puede medir
ninguno; porque no se pueden operativizar todos los fines educativos, se relega
todo intento de operativizacin previa y necesaria para una medida adecuada;
porque la maduracin de una persona transciende la educacin formal, ni se
intentan controlar los logros de la misma; porque se defiende que la evaluacin
debe ser un instrumento de investigacin didctica y de informacin, se olvidan
otros pasos intermedios y, en todo caso, indispensables para realizar tal investi-
gacin, como es la medida rigurosa y explcita de los aprendizajes.
9. Por ltimo, los que defienden como fin de la evaluacin informar al alum-
no de su logros y causas, sin valoracin por parte del profesor, censuran lo que
la evaluacin tiene de control y seleccin. A este respecto Gimeno (1981: 217),
recogiendo el sentir de otros muchos autores, escribe que la evaluacin debera
tener como funcin bsica: "... de cara al alumno, una informacin que le
ayude a progresar hacia el autoaprendizaje, ofrecindole noticia del estado
en que se encuentra y las razones del mismo, para que coja l mismo este
dato como gua de autodireccin, meta de toda educacin.
* * *

Hasta aqu algunas de las opiniones ms persistentes sobre la evaluacin


educativa. A continuacin nos proponemos es tudiaria con rigor. Para ello es
necesario tener respuestas claras a una serie de cuestiones. En primer lugar,
tendramos que preguntamos si es posible evaluar; y en caso de que nuestra
respuesta fuese, como es presumible, afirmativa, seguir preguntndonos por el
qu, quin, cmo, cundo y, sobre todo, para qu evaluar. En los prrafos
siguientes trataremos estas cuestiones para ir respondindolas con ms ampli-
tud a lo largo de la presente publicacin.
1. Es posible evaluar? Es conveniente, necesario y til hacerla? La cuestin
no es discutir a favor o en contra de la evaluacin, sino centrarse en el tipo de
evaluacin que cada situacin requiere segn los diferentes diseos curriculares
y las exigencias administrativas.
De todas maneras, para tomar una postura es imprescindible llegar antes a
una definicin o al menos a una descripcin que no caiga en extremismos. Si
tratamos de definirla exhaustivamente, corremos el riesgo de producir una for-
mulacin tan complicada que resultar vlida slo para un grupo especializado
de investigadores. Pero un enfoque ms reducido corre tambin el peligro de
fijarse nicamente en la calificacin como actividad que los profesores ejercen
ms frecuentemente.
La evaluacin de aprendizajes

Para llegar a una definicin equilibrada, ayuda analizar su relacin con los
dems elementos del currculo, programacin y metodologa, as como con los
fines para los que se emplea.
a) Se suele admitir que la evaluacin marca la diferencia entre un currculo
de una sola direccin, de profesor a alumno, en consecuencia asimtrico
o balstica en palabras de Bell (1981), y un proceso interactivo simtri-
co que proporciona feedback y provoca cambios tanto en profesores
como en alumnos.
La evaluacin sirve tambin para relacionar los otros elementos del currcu-
lo es decir, para relacionar los medios con los efectos que produce la
educacin, juzgando la pertinencia y eficacia de ambos.
Modificar un programa, o incluso unas estrategias de enseanza, sin cam-
biar el sistema de evaluacin, tiene todas las probabilidades de no condu-
cir a nada. Por el contrario, la experiencia dice que, si se modifica el siste-
ma de evaluacin, aun sin modificar explcitamente el programa de
enseanza, es mayor la repercusin sobre el aprendizaje. A esto se refie-
re el aforismo ya citado de que quien controla el examen controla el pro-
grama que se lleva a cabo.
Es importante la planificacin previa de un sistema de evaluacin que
pueda servir de base a la preparacin de un programa. La evaluacin nos
da una medida del nivel del que se parte, el nivel al que se llega y del
progreso realizado. Pues bien, este proceso debe comenzar ya en el mis-
mo momento de la programacin de objetivos de aprendizaje, precisan-
do en la formulacin de los mismos el criterio, grado de perfeccin o
nivel aceptable de la actuacin esperada del alumno.
b) Los fines explcitos de la evaluacin se enumerarn al tratar del para qu
evaluar; pero, adems, una serie de fines se esconden tras el currculo
oculto. Por citar uno, el prestigio de la institucin: no siempre tal prestigio
logrado a travs de la evaluacin es de absoluto inters para los centros,
ya que algunos no lo han adquirido por el resultado de sus exmenes,
sino por una larga tradicin; por el contrario, otros centros acostumbran a
dar a conocer el porcentaje de alumnos que tiene xito en pruebas de
todo tipo, como medio para consolidar su prestigio.
Todo ello, fines y relacin con los otros elementos curriculares, puede dar
pistas para formular una adecuada definicin de evaluacin.
2. Qu: Qu intentamos evaluar? La evaluacin educativa puede recaer
sobre sistemas, instituciones, docentes, etc. En el presente trabajo nos centra-
mos exclusivamente en el estudio de la evaluacin de aprendizajes de los alum-
nos en el marco de una instruccin formal. Para asegurar la validez de esta eva-
luacin, es decir, para evaluar realmente lo programado, es necesario, entre
otros requisitos, describir rigurosamente las capacidades y los contenidos cien-
tficos especificando los indicadores pertinentes. Comprende, por consiguiente,
Problemdtica en torno a la evaluacin de aprendizajes 19

un anlisis de objetivos, una formulacin de los grados de consecucin acepta-


dos y un diseo de situaciones de aplicacin.
3. Quin: Debemos tambin tener respuestas sobre los sujetos que inter-
vienen en la evaluacin. Deben intervenir slo los protagonistas de la instruc-
cin, profesores y alumnos, o tambin otros agentes externos? Se debe conti-
nuar admitiendo que al profesor le corresponde la construccin de pruebas y el
anlisis de datos; al alumno, la autocorreccin y la autoevaluacin; y a las Juntas
de Evaluacin, en las etapas que as lo exige la ordenacin educativa, la inter-
pretacin global de datos y la toma de decisiones?
4. Cmo: Problemtica en torno a los instrumentos de evaluacin. Hay que
considerar: el formato y el nmero de preguntas necesario; el tipo de interpre-
taciones que se van a hacer de los resultados; el referente que se va a utilizar,
un grupo normativo o un criterio absoluto.
Si la interpretacin va a ser normativa, la descripcin de lo que se va a eva-
luar puede ser ms general, aunque siempre haya que definir fronteras; en
muchos casos, el contenido cientfico general de los materiales de instruccin
basta para marcar los lmites de la prueba. Si la interpretacin va a ser de domi-
nio, la especificacin ha de ser mayor, describiendo por separado los elementos
que lo componen, capacidad y contenido. Por ltimo, para hacer una interpre-
tacin criterial, hay que formular de modo preciso los objetivos de aprendizaje
y controlar adecuadamente cada uno de ellos mediante una nota dada a partir
de varias preguntas.
Conviene sealar que cuando se hace una evaluacin por objetivos, al con-
trario que cuando se hace una evaluacin de dominio, no se puede acudir a una
muestra, ni hacer deducciones o extrapolaciones sobre las capacidades y conte-
nidos no examinados a la hora de interpretar las calificaciones; hay que contro-
lar todas y cada una de las capacidades y contenidos reflejados en los objetivos.
5. Cundo: Hay que decidir en qu momentos se realiza la evaluacin: ini-
cial, intermedia, continua, final.
6. Para qu: Para qu evaluamos? A los fines ya mencionados al hablar del
currculo oculto, aadimos los que ms a menudo se citan explcitamente.
a) Control: La evaluacin tiene como fin el control del proceso de instruc-
cin. Diferenciar y certificar el fracaso y el xito de los logros instruccio-
nales de los alumnos ha sido su papel tradicional.
b) Motivacin: Las investigaciones han demostrado que, cuando un estu-
diante est verdaderamente motivado, su actuacin est mucho ms cer-
ca del mximo de sus posibilidades. La buena disposicin para aprender
es un elemento indispensable para conseguido.
Son muchos los factores que intervienen en la motivacin (lvarezet al.,
1999). Un estudiante est ms motivado, por ejemplo, cuando acepta los
objetivos que se le proponen; pero es superfluo decir que la evaluacin
en general y, en particular, el grado de xito en un examen estn tambin
La evaluacin de aprendizajes

directamente unidos a la motivacin. Los alumnos tienden a estudiar ms


cuando preparan un examen, y estudian ms intensamente aquello que
esperan que caiga.Si los alumnos conocen de antemano que se les va a
examinar, los requisitos del examen y, sobre todo, si el examen consigue
medir bien los logros de los alumnos respecto a los objetivos pertinen-
tes, entonces su influencia motivadora ser definitivamente ms til.
Los exmenes deben considerarse como motivacin extrnseca y otros
factores, como las expectativas y las necesidades, como motivacin
intrnseca. Como ambas contribuyen al aprendizaje, el suprimir una de
ellas producira una disminucin en el rendimiento de muchos alumnos.
Para algunos afortunados, la motivacin intrnseca puede ser tan fuerte
que por s misma sea suficiente para provocar los esfuerzos necesarios
para aprender; para otros, la motivacin provocada por los exmenes es
indispensable para estudiar.
c) Feedback para los profesores: La evaluacin permite al profesor detectar
si los alumnos han asimilado bien lo que trataba de comunicarles y hacer
un juicio sobre las tcnicas de enseanza utilizadas, lo que posibilita la
correccin de su modo de ensear. Adems, el proceso de construir las
pruebas es una ocasin para que los profesores revisen y precisen la pro-
gramacin.
d) Feedback para los alumnos: Permite al alumno informarse de sus apren-
dizajes, es decir, le hace saber lo que ha aprendido y lo que le falta por
aprender, descubriendo sus deficiencias. A veces se insiste excesivamen-
te en lo no conseguido. Los fallos no tienen por qu ser ms informati-
vos que los logros; no se deben ignorar, pero hay que subrayar tambin
los logros positivos.
Se sabe que tenemos tendencia a realizar y repetir actividades en la medi-
da en que van seguidas de cierto xito. Este fenmeno se conoce como
Leydel Efecto de Thorndike. En concreto, los estudiantes llegan a dar-
se cuenta de que ciertos tipos de conducta estn asociados al xito certi-
ficado por las buenas notas. As, si los alumnos son juzgados por su nivel
de conocimiento a travs de pruebas que exijan exclusivamente memo-
ria, tendrn tendencia simplemente a memorizarlos. Por el contrario, si
las pruebas requieren que los estudiantes interpreten datos, apliquen
principios y resuelvan problemas, estos mismos estudiantes trabajarn de
otra manera para tener xito en este tipo de pruebas. A la larga, el siste-
ma de evaluacin utilizado determina en gran medida el tipo de actividad
a la que se entregarn durante el aprendizaje.
e) Ttulo: La evaluacin supone tambin una responsabilidad social, de la
que se deriva la que tienen los profesores frente a la misma sociedad al
evaluar, dado que en algn momento la evaluacin supondr la conce-
sin de ttulos por parte de la Administracin.
* * *
Problemtica en tomo a la evaluacin de aprendizajes 21

A partir de aqu, intentaremos profundizar en el significado que se le ha ido


atribuyendo al concepto de evaluacin a lo largo de la historia de la educacin
-sobre todo en las tres ltimas dcadas, en que muchos autores han ido subra-
yando y seleccionando distintas formas y funciones de la evaluacin educativa
para formular su propia definicin-, para contestar la primera pregunta, si es
posible evaluar, con el fin de optar por una definicin que sintetice las mejores
aportaciones. A continuacin estudiaremos el resto de las cuestiones aqu plan-
teadas, para analizar los elementos que la constituyen con objeto de depurar
sus posibles defectos, redescubrir su concepto y sus funciones autnticamente
educativas dentro de una teora coherente que refuerce las intuiciones y las
rutinas cotidianas del aula y, sobre todo, dentro de una prctica asequible a
cualquier profesor que necesite perfeccionar la suya.
Con todo ello, pretendemos que los profesores mejoren su competencia en
la evaluacin educativa; lo que se puede concretar en los siguientes estndares,
adaptados de los Standards for Teacher Competence in Educational Assess-
ment of Students, elaborados por una comisin de expertos designados por las
tres asociaciones educativas ms representativas de Estados Unidos: American
Federation of Teachers, National Council on Measurement in Education y Natio-
nal Education Association.
1. Eleccin de mtodos de evaluacin: Los profesores tienen que saber ele-
gir mtodos de evaluacin pertinentes, tiles, tcnicamente correctos e impar-
ciales. En este sentido, deben comprender, por un lado, cmo una evaluacin
vlida puede ayudar a diagnosticar necesidades educativas a nivel individual y
grupal, disear adaptaciones curriculares individuales y grupales, proporcionar
un adecuado feedback a los estudiantes y motivades, etc.j por otro lado, tam-
bin deben ser conscientes de que determinados enfoques evaluativos pueden
ser incompatibles con algunos objetivos, afectando negativamente a la toma de
decisiones acerca de los estudiantes.
2. Elaboracin de mtodos de evaluacin: Si bien los profesores emplean
a veces instrumentos elaborados por otros, lo ms frecuente es que utilicen los
que ellos mismos generan. Por este motivo, deben asimilar y seguir principios
adecuados para analizar la calidad de los mtodos de evaluacin y elaborados.
3. Aplicacin de los resultados de la evaluacin: No es suficiente que los
profesores sean capaces de seleccionar y elaborar buenos mtodos de evaluacin,
tambin deben estar preparados para aplicar, interpretar y analizar los resultados
de pruebas objetivas, abiertas y diagnstico, identificando as los puntos fuertes y
dbiles del aprendizaje de sus alumnos, con el fin de estimular su desarrollo edu-
cativo y no incrementar innecesariamente sus niveles de ansiedad.
4. Elaboracin de procedimientos para la calificacin: Calificar,como ele-
mento esencial de la evaluacin, es parte indispensable de la tarea docente. As
pues, los profesores deben ser capaces de disear e implememar procedimien-
tos para generar cali.ficacionesa partir de puntuaciones obtenidas por los alum-
nos, asegurndose de q~e sus calificaciones sean racionales, imparciales y justi-
ficadas, evitando formas sesgadas, tales como utilizadas como castigo.
22 La evaluacin de aprendizajes

5. Toma de decisiones educativas: Los profesores deben ser capaces de uti-


lizar de forma efectiva los resultados de las evaluaciones para tomar decisiones
educativas, no slo en clase sobre los estudiantes, sino tambin en la comuni-
dad local sobre aspectos escolares, y en la sociedad en general sobre el sistema
educativo.
6. Comunicacin de los resultados de la evaluacin: Los profesores tienen
que informar habitualmente sobre los resultados de las evaluaciones a los estu-
diantes, a los padres o a otras personas autorizadas. As, para hacerla con efica-
cia, los profesores deben ser capaces de utilizar la terminologa adecuadamente
y explicar con claridad su significado, limitaciones e implicaciones.
7. Identificacin de evaluaciones no ticas o ilegales: La imparcialidad, los
derechos de todos los implicados y la tica profesional deben presidir todas las
actividades de la evaluacin educativa, desde la planificacin inicial y la recogida
de informacin hasta la comunicacin de las decisiones tomadas. Por esta
razn, los profesores deben estar bien informados sobre sus responsabilidades
ticas y legales, y deben ser conscientes de que algunos procedimientos de eva-
luacin pueden ser incorrectamente utilizados con consecuencias perjudiciales
para los alumnos, tales como violacin del derecho a la privacidad o uso inade-
cuado de los resultados de los exmenes de los alumnos para otros fines como
valorar la labor docente de los profesores.
"AI.l") n051
NOI)"n'''AEI
I 510
OJ.dEl)NO) '510 NOI)n'OAEI
I
OlnlJd'i)
Podramos decir de manera sencilla, que no simple, que la historia de la evaluacin
educativa es la historia del referente, defmido por Barbier (1993: 71) como aque-
llo en relacin con lo cual se produce o es susceptible de producirse eljuicio de
valor, es decir, del eje de referencia por el que se valora un proceso de ensean-
za-aprendizaje. Unas veces este referente es implcito y otras explcito, unas veces
es externo al proceso mismo y otras est inserto en l; siempre estuvo all donde
se produca una valoracin de algn elemento del proceso educativo.
Cuando el referente es implcito, una de las tareas bsicas es identificar, defi-
nir y precisar los factores que lo constituyen, para evitar subjetivismos o arbitra-
riedades y reducir el campo del llamado currculo oculto. Por el contrario,
cuando es explcito, est expresado a travs de unos indicadores precisos y sue-
le aparecer relacionado con las finalidades o metas educativas. A lo largo de la
historia de la educacin, esas finalidades han ido cambiando y, en consecuencia,
tambin lo han hecho los ejes de referencia.
En unos casos, el referente de la evaluacin educativa cumple una funcin
nomottica y, en otros, selectiva. La funcin nomottica servir para encontrar
regularidades que permitan pronosticar comportamientos futuros y est rela-
cionada con la valoracin normativa (cap. 13), que determina el rendimiento de
los alumnos a partir de las regularidades del grupo. La funcin selectiva clasifi-
car a los alumnos en ms o menos competentes, por lo que est ms relaciona-
da con la valoracin criterial (cap. 13).
Desde otro punto de vista, el desarrollo de la evaluacin educativa, superada
la poca precientfica, no surge espontneamente, sino que est ligada a los
diversos modos de hacer ciencia, a los paradigmas cientficos.

LOS COMIENZOS DE LA EVALUACiN


EDUCATIVA: LA EVALUACiN PRECIENTFICA 1.

Los sistemas de enseanza, desde la Antiguedad hasta la Edad Contempornea,


crearon un gran nmero de procedimientos de instruccin, que an siguen
influyendo en la actualidad. Sin embargo, no parece que los docentes de estas
26 La evaluacin de aprendizajes

escuelas hayan utilizado para la evaluacin referentes explcitos, sino que se


valoraban los logros a partir de referentes implcitos, fueran stos sociales o
econmicos, casi siempre con funciones selectivas. Se evala sin una teora
expresa de la evaluacin.
Dubois (1970) y Coffman (1971) citan los procedimientos que ya se emplea-
ban en la China Imperial alrededor del segundo milenio a. C. para seleccionar a
los aspirantes que iban a formar parte del alto funcionariado. Por su parte, Sund-
berg (1977) considera que en la Biblia hay un pasaje que bien pudiera tomarse
como una evaluacin, cuando Geden selecciona a unos luchadores empleando
pruebas situacionales. En el mundo clsico griego, Platn, en su libro VII de la
Repblica, nos presenta un sistema de enseanza en el cual la promocin es
consecuencia de una evaluacin claramente selectiva. McReynold (1975), ade-
ms, estima que el Tetrabiblos, obra atribuida a Ptolomeo, es el libro de evalua-
cin ms importante de la Antiguedad. En la poca romana, Cicern, en su obra
De Oratore, ya tiene en cuenta lo que en la actualidad llamaramos evaluacin
formativa (cap. 15): el futuro orador ha de desarrollar sus talentos naturales y
adquirir aquellos otros de los que carece, ambos descubiertos mediante una
tarea de discernimiento. Por fin, san Agustn, en el tratado De Magistra, indica
que han de establecerse criterios que permitan distinguir entre un sano realismo
y un pedante verbalismo, con el fin de comprobar si el discpulo ha captado la
esencia de las cosas no a travs de vanas palabras, sino de leyes vlidas.
En la Edad Media aparecen los exmenes con un carcter ms formal. En tor-
no a ellos se centra todo el sistema universitario. As, por ejemplo, la prueba para
llegar a magister,llamada inceptio,era un claro examen oral pblico en donde
el aspirante deba demostrar sus conocimientos en presencia de un tribunal; sin
embargo, los fracasos en estos exmenes eran poco frecuentes, ya que slo acce-
dan a ellos los alumnos que obtenan el visto bueno previo de sus maestros.
En el Renacimiento, como aportacin significativa sobre la evaluacin propia
de nuestro entorno, mencionaremos la obra Examen de ingenios para las
ciencias, de Juan Huarte de San Juan, publicada en Baeza en el ao 1575, en la
que ya se plantea la posibilidad de seleccionar a los individuos. Su procedimien-
to selectivo supone que los hombres difieren por sus habilidades, y que stas se
fundan en diferencias de naturaleza; las cuales, a su vez, son apreciables a travs
de exmenes fsicos. Con Juan Huarte, la observacin se convierte en instru-
mento bsico para llevar a cabo la evaluacin.
Con el tiempo, las prcticas en los exmenes fueron conformando un con-
junto de normas que las disposiciones de instituciones docentes fueron enri-
queciendo. As se introducen los exmenes escritos que se regulan con toda
minuciosidad mediante criterios de evaluacin para cada nivel y grado. Especial-
mente interesantes son los criterios que se recogen en Ratio atque Institutio
Studiorum (1598, Npoles, Tarquinio Longo), publicado en edicin bilingue por
Gil (1992). Este estado de cosas es el que llega a la poca de la Ilustracin. En el
ltimo cuarto del siglo XVIII, el pensamiento enciclopedista y la Revolucin Fran-
Evolucin del concepto de evaluacin educativa 27

cesa favorecen el derecho de todos los ciudadanos a la educacin, y tambin


plantean la exigencia de que el acceso a la especializacin se condicione a la
comprobacin -evaluacin- de los mritos individuales.
Ya en la primera mitad del siglo XIX se asiste a un cambio con la instauracin
de los sistemas nacionales de educacin vinculados a la concesin de diplomas
garantizados por el Estado; el ejemplo ms claro es el sistema educativo napo-
lenico. Tales diplomas se lograban despus de superar un programa de exme-
nes, que dio lugar al examen de Estado; lo que capacitaba para desempear
determinados puestos sociales y, en algunas ocasiones, eran el instrumento id-
neo para determinar la jerarqua en la sociedad y aumentar el poder social (Bar-
bier, 1993). Tal es el caso de los ttulos de bachillerato concedidos por el gobier-
no francs a los que deseaban ser funcionarios civiles o militares. Lo mismo
ocurra en Inglaterra con las comisiones reales que evaluaban los servicios
pblicos de instruccin, y cuyo referente evaluador era econmico y de ajuste
social. Surge as, segn Weber, un sistema de exmenes que consagra una prepa-
racin especfica para satisfacer las necesidades de una nueva sociedad jerrqui-
ca y burocratizada. En este sentido, dice Max Weber (Weber, M. [1956] Wirschaft
und Gesellschaft, T. II, Berlin, Kinpenhauer und Witsch, pg. 735; citado por Bar-
bier, 1993): un sistema de exmenes jerarquizados, que consagra un entrena-
miento especfico y que permite la aparicin de carreras especficas (..), Jn la
Europa moderna, en relacin con el desarrollo de las necesidades de una
organizacin burocrtica, que intenta poner en correspondencia individuos
jerarquizados y comparables con lajerarqua de lospuestos ofrecidos.
En este tiempo influyen poderosamente concepciones educativas y sociales
como el Positivismo de Comte (1795-1857) y el Sociologismo de Durkheim
(1858-1917). Los fenmenos sociales adquieren la categora de realidades obje-
tivas que rigen los procesos del desarrollo humano. Tienen el doble carcter de
metas que deben ser alcanzadas y de condiciones genricas de la existencia. En
este sentido, se convierten en los nicos criterios de la evaluacin que actan
como referentes, unas veces explcitos y, las ms de ellas, implcitos. La conduc-
ta se mide tanto por lo que tiene que lograr como por lo que en ella interviene
y la moldea de distintas maneras. No obstante, esas pruebas evaluativas quedan
perfectamente integradas en el racionalismo acadmico europeo, preocupado
casi exclusivamente de la instruccin acadmica.
Mientras, empiezan a aplicarse en Amrica las primeras tcnicas evaluativas.As
en 1845, Horace Mann (1845) dirige una evaluacin basada en tests de papel y
lpiz, que llegan a implantarse en las escuelas de Bastan. Fisher, en 1864, siguien-
do el camino iniciado por Mann, contribuye a hacer las evaluaciones con referen-
tes ms objetivos y explcitos respecto a determinadas destrezas lectoescritoras.
Este modo de evaluar no responde a la aplicacin de un enfoque terico o
paradigma. La evaluacin se reduce ms bien a un modo de hacer basado en
prcticas rutinarias, que frecuentemente usan instrumentos de medida de poca
fiabilidad.
28 La evaluacin de aprendizajes

2. POCA DE lOS TESTS PSICOlGICOS

Se puede afirmar que el perodo de inicio y posterior desarrollo de los tests


constituye el primer paso hacia una presentacin cientfica de la evaluacin; pri-
mero fuera del mbito docente, para ms tarde ir introducindose de forma
paulatina en las escuelas.
Es a partir de 1869 con Galton (fecha de publicacin de su Hereditarius
Genius), y sobre todo con la fundacin por Thurstone en Chicago en 1935 de la
Psychometric Society, cuando empieza el desarrollo de muchas de las tcnicas
de evaluacin psicolgica, a la vez que se estudian las condiciones psicomtri-
cas de fiabilidad y validez de los tests.
Galton, influenciado por el paradigma rasgos o factores propio de la Psicolo-
ga diferencial imperan te, se interesa por la medida de las diferencias individuales
de carcter psicolgico y crea el testcomo mtodo prcticO y rpido para medir
las peculiaridades de cada individuo, frente a la lentitud de otros procedimientos
de anlisis basados en patrones yen tipologas fsicasy psquicas.
El uso en la Psicologa del modelo de rasgos o factores y; en consecuencia,
su aplicacin a la evaluacin est ligado al triunfo del evolucionismo de Darwin,
as como a la buena imagen del darwinismo social propuesto por H. Spencer.
Precisamente, el abandono de aquellos patrones psicofsicos en el campo de
la Psicologa favorece la elaboracin y desarrollo de tests ms ligados a la prcti-
ca docente. As, las ideas reformistas de Rice (Ayers, 1918) le llevan a compro-
bar, hacia 1887, los conocimientos de ortografa de unos 30.000 estudiantes,
usando pruebas objetivas; investigacin que es considerada como la primera
evaluacin formal sobre un programa educativo. Siguieron experiencias seme-
jantes con tests aplicados a otras materias, como la Aritmtica.
En esta misma poca, Cattell (1861-1934), autor del trmino test mental y
que pasa por ser uno de los primeros defensores de la medida objetiva de los
tests, introduce un procedimiento de evaluacin basado en la experimentacin
y; por tanto, repetible y comparable. Sin embargo, el test mental, tal como era

entendido por Cattell, estaba an ligado al asociacionismo ingls; de ah, la falsa


creencia de pensar que los factores intelectuales se podan medir a travs de
aspectos psicofsicos. Esta tendencia de aplicacin de las prcticas psicolgicas
a la instruccin se ve reforzada gracias a las publicaciones de Thorndike (1904)
sobre las facultades mentales y su medida, y a la aparicin de tests estandariza-
dos. Entre estos tests estandarizados se pueden citar: Escala para la escritura a
mano de los nios de Thorndike, Test de razonamiento aritmtico de Stone,
Test de Escritura de Thorndike y de Ayers, Test de Ortografa de Ayers, Escala
para el Dibujo de Thorndike, y otros tests y escalas como las de Courtis, Hille-
gas, Buckingham, etc.
A partir de 1900, empezaron a adquirir importancia en Europa los estudios
de Binet (1857-1911) sobre tests normativos y estandarizados para evaluar las
Evolucin del concepto de evaluacin educativa 29

capacidades cognitivas. El desarrollo de este tipo de pruebas se vio favorecido


en Francia por la promulgacin de la ley sobre enseanza obligatoria, que distri-
bua a los nios por niveles a lo largo del sistema educativo, utilizando tests nor-
mativos. Con Binet empiezan los anlisis de los procesos mentales superiores
mediante procedimientos sencillos, a travs de tareas que pueden realizarse
fuera de los laboratorios.

Aos ms tarde, a causa de las necesidades de reclutamiento y de la asigna-


cin de puestos de responsabilidad, mando y manejo de instrumentos tcnicos
que exiga la situacin de urgencia presentada por la Primera Guerra Mundial,
surge la elaboracin de tests colectivos de inteligencia general: el Alfa (para los
lectoescritores), el Beta (para los analfabetos), y de cuestionarios e inventarias
de personalidad, siendo el primero el de Woodworth (Phillips, 1974).
Al trmino de la guerra, los tests psicolgicos se ponen al servicio de fines
sociales. Durante la dcada que va de 1920 a 1930, denominada perodo de los
tests, se idean tests estandarizados, entre los que se pueden citar las bateras de
test de aprovechamiento, el Stanford Achivement Test-1922 y las pruebas objeti-
vas de McCall-1922, Ruch-1929, Rusell-1930 y otros, para medir toda clase de
destrezas escolares con claros referentes objetivos externos y explcitos, basa-
dos en procedimientos de medida de la inteligencia, con los que se realizan eva-
luaciones a grandes colectivos de escolares. Estas aplicaciones estandarizadas
son sorprendentemente bien acogidas en e! mbito educativo. An ms, McCall
(1920) propone que los maestros construyan sus propias pruebas objetivas, en
vez de confiar exclusivamente en las propuestas por especialistas externos.
El final de este perodo se puede fijar hacia los aos cuarenta del siglo pasa-
do, cuando los tests psicolgicos se perfeccionan con el desarrollo del clculo
estadstico y con e! anlisis factorial, lo que permite identificar los rasgos menta-
les subyacentes.
En Estados Unidos hacia los aos cincuenta, surge un movimiento antitest
que critica, entre otros aspectos, el que se centre exclusivamente en los alumnos
y apenas en los currculos, lo que provoca la aparicin de nuevas alternativas.

LOS INICIOS DE LA EVALUACiN


CIENTFICA EDUCATIVA 3.

La Docimologa (neologismo, de! griego DOKLI.JlX;m = probar, propuesto por


Pieron, 1968, para designar e! estudio cientfico de los mtodos de evaluacin; Pie-
ron, 1969, y Bonboir, 1974, recogen en sus publicaciones las ideas principales
de esta corriente evaluativa), que se inicia en Francia hacia 1920 y que pervive
como corriente independiente hasta bien entrada la dcada de los cuarenta en
que toma carta de ciudadana con Tyler, supone un primer intento de concep-
30 La evaluacin de aprendizajes

tualizacin de la evaluacin educativa. Critica la baja calidad de los exmenes y


la imprecisin de las calificaciones, debido a la variabilidad de las informacio-
nes, a la heterogeneidad de los criterios empleados y, en fin, al divorcio entre
lo que se ensea y las metas de la instruccin. La evaluacin dependa, en lti-
mo trmino, de la preparacin acadmica y del talante ms o menos exigente
del profesor.
Como solucin, propone unas prescripciones -docimologa prescriptiva-
que ayuden a superar la subjetividad de la valoracin: a) elaboracin de taxono-
mas para formular objetivos; b) diversificacin de fuentes de informacin: ex-
menes, expedientes acadmicos, tcnicas de repesca y tests; c) unificacin de
criterios de correccin a partir del acuerdo entre los correctores de las pruebas;
d) revisin de los juicios de valoracin mediante procedimientos tales como la
doble correccin o la media de distintos correctores.

4. LA REFORMA TYLERIANA

Algunos consideran a Tyler como el padre de la evaluacin educativa, ya que fue


el primero en dar una visin metdica de la misma, superando, desde el paradig-
ma conductista como corriente entonces en boga, la mera evaluacin psicolgi-
ca. Entre 1930 y 1945, en el famoso Eight-far Study de la Universidad del Estado
de Ohio (Smith y Tyler, 1942), plantea la necesidad de una evaluacin cientfica
que sirva para perfeccionar la calidad de la educacin. Como resultado de estos
estudios, publica en 1950 su obra ms famosa, a saber, Tyler, R. W (1950) Basic
principies of curriculum and instruction. Chicago: University of Chicago Press
(en lo que se refiere a la evaluacin, es obligado citar tambin: Tyler.1967), en la
que hace una clara exposicin de lo que entiende por currculo, integrando su
mtodo sistemtico de evaluacin educativa. El intento de Tyler es presentar un
currculo racional delimitado por cuatro cuestiones:
1. Qu objetivos desea conseguir la escuela?
2. Qu actividades educativas se pueden aplicar para lograr esos objetivos?
3. Cmo pueden organizarse de manera eficaz esas experiencias?
4. Cmo podemos comprobar si se alcanzan los objetivos?

OBJETIVOS
(1)

ACTIVIDADES ORGANIZACiN EVALUACiN


(2) (3) (4)
Evolucin del concepto de evaluacin educativa 31

La evaluacin educativa, dice Tyler (1973: 109), es aquel proceso que tiene
por objeto determinar en qu medida han sido alcanzados los objetivos pre-
viamente establecidos. Como consecuencia, precisa las siguientes condiciones
de una buena evaluacin: a) propuesta clara de objetivos; b) determinacin de
las situaciones en que se estima que el alumno manifiesta la conducta esperada;
c) eleccin de instrumentos apropiados de evaluacin, normalmente tests; d)
interpretacin de los resultados de las pruebas; e) determinacin de la fiabili-
dad y objetividad de las medidas.
Podra representarse este proceso con el siguiente esquema:

Especificacin de objetivos

COMPARACiN

Elaboracin de pruebas

Resultados de las pruebas

Es de advertir que Tyler, aunque no lo desarrolla, alude tambin a que la


valoracin de objetivos de aprendizaje debe traer como consecuencia una toma
de decisiones sobre los aciertos o fracasos de la programacin y sobre la posibi-
lidad de su perfeccionamiento; aspecto que retornarn, entre otros, Cronbach y
Stufflebeam.
Para Tyler,el eje de referencia de la evaluacin son los objetivos, por lo que
proporciona criterios suficientemente claros para su explicitacin, aspecto este
que en 1924 desarroll Franklin Bobbitt, mejor Henry Harap en la misma dca-
da, y racionaliz luego Tyler. En los aos cincuenta, Benjamin Bloom y David
Krathwohllo ejemplificaron en los mbitos cognoscitivo y afectivo, respectiva-
mente; y fue perfeccionado por Robert Mager (1977), que introduce en la for-
mulacin de los objetivos, adems del verbo de accin que expresaba la con-
ducta, el nivel de perfeccin deseable de las metas previstas. Se han de tener en
cuenta: las necesidades e intereses del alumno, las necesidades de la sociedad,
las peculiaridades de las ciencias que se estudian y las propuestas de la Psicolo-
ga del Aprendizaje.
A pesar de que se han de considerar todos estos elementos, a la hora de
proponer los objetivos educativos, se suele elegir como punto de partida prefe-
rente alguno de ellos. As, Tylerse plantea la siguiente disyuntiva: Laescuela ha
de servir para que los jvenes se adapten a la sociedad o, por el contrario, para
que el educando desarrolle su propia individualidad interaccionando con el
32 La evaluacin de aprendizajes

entorno? La respuesta condiciona la seleccin de objetivos y, por tanto, del refe-


rente. Hay que sealar que Tyler,lo mismo que sus coetneos, est influido por
Dewey, quien considera que la escuela debe perseguir el desarrollo individual,
teniendo en cuenta, no obstante, que el proceso educativo es un proceso socia-
lizador y, por ello, sigue determinadas reglas sociales. El nio aprende por su
relacin con el entorno, y es all donde recoge las herencias culturales, pero
stas no son tan fuertes como para determinar la personalidad del alumno.
Las reformas tylerianas no se aplicarn de un modo inmediato (a Espaa lle-
gan con la Ley General de 1970). En la dcada de los cincuenta, perodo que
Stufflebeam (Stufflebeam y Shinkfield, 1987) llama poca de la inocencia o de
la <<irresponsabilidadsocial por el despilfarro consumista y las grandes inversio-
nes militares que contrastan con la miseria de las zonas rurales, se experimenta
una expansin educativa incontrolada: as se promocionan en educacin nue-
vos tipos de instituciones que proporcionan un amplio abanico de servicios
educativos de toda ndole, desde la educacin para la salud mental y fsica hasta
la tcnico-comercial. Sin embargo, la aportacin de la evaluacin a la mejora de la
calidad de la enseanza y de los servicios educativos es escasa, debido sobre
todo a la falta de referentes adecuados. Se escribe de evaluacin, pero estas dis-
cusiones apenas tienen influencia en el perfeccionamiento de la labor instruc-
ciona!.
Las propuestas tylerianas se desarrollarn posteriormente. En este sentido
se ha de interpretar la aparicin de la Enseanza Programada de Skinner y
Crowder (Fernndez de Castro, 1973), en la que el alumno se va autoevaluando
a medida que va obteniendo xito en el desarrollo de los programas. En la mis-
ma lnea profundizan Hilda Taba (1974) y Popham y Baker (1970).

EL PERFECCIONAMIENTO DE LA ACTIVIDAD
5. EVALUATIVA: LA TOMA DE DECISIONES

A principios de los aos sesenta, resultaba muy llamativo el divorcio entre las
acciones del proceso instructivo y los referentes que servan para valorado. La
crisis econmica obligaba a cuestionar muy seriamente la rentabilidad de las
inversiones educativas, lo que provoc la proyeccin de la eficacia de esquemas
de evaluacin empresariales al mundo educativo por parte de autores como
Cronbach, Suchman, Scriven, etc.
Esta visin crtica, junto al sndrome Sputnik, condujeron, en 1965, a esta-
blecer en Estados Unidos el Acta de la Educacin Elemental y Secundaria
(ESEA)ya crear el National Study Comitte on Evaluation. Tomaban definitiva-
mente cuerpo nuevas conceptualizaciones al establecer una evaluacin que no
slo pretende constatar el rendimiento del alumno relacionando los resultados
con los objetivos, sino que introduce ya explcitamente la toma de decisiones
Evolucin del concepto de evaluacin educativa 33

en relacin no solamente con el aprendiz, tambin con los programas. La evalua-


cin pasa de ser externa a considerarse como parte del mismo proceso educativo.
Ya es patente la formulacin de una teora explcita sobre la evaluacin en el
mbito propiamente educativo, con referencias al origen y finalidades instructi-
vas segn diversas concepciones ideolgicas.
Cronbach (1963, 1971) Y Cronbach y Snow (1969) hacen una crtica de las
evaluaciones al uso por su carencia de relevancia y utilidad. Defienden que la eva-
luacin, adems de basarse en objetivos explcitos, debe ser principalmente una
ayuda para que los educadores tomen decisiones acerca de cmo educar, desta-
cando y elaborando lo que en Tylerhaba quedado como mera sugerencia. Laeva-
luacin, segn Cronbach (1963), es la recopilacin y uso de informacin a fin de
adoptar decisiones en cuanto a los programas educativos. Introduce, as, frente al
uso tradicional de la evaluacin fmal o del producto, cuya decisin nica era la
promocin o repeticin de curso de los alumnos, el uso de la evaluacin del pro-
ceso, enriquecindola con nuevos tipos de decisiones: a) decisiones sobre la
mejora de la metodologa: estrategias y materiales de instruccin; b) sobre el
alumno: necesidades, seleccin, promocin, agrupacin, progresos, deficiencias,
etc.; c) sobre la calidad del sistema escolar: profesores, organizacin, etc.
Suchman (1967) profundiza en la conviccin de que la evaluacin debe
basarse en datos objetivos que sean analizados con metodologa cientfica, mati-
zando que la investigacin cientfica es preferentemente terica y; en cambio, la
investigacin evaluativa es siempre aplicada. Su principal propsito es descubrir
la efectividad, xito o fracaso, de un programa al compararlo con los objetivos
propuestos y; as, trazar las lneas de su posible redefinicin.
Esta investigacin evaluativa, para Suchman, debe tener en cuenta: a) la
naturaleza del destinatario del objetivo y la del propio objetivo; b) el tiempo
necesario para que se realice el cambio deseado; c) el conocimiento de si los
resultados esperados son dispersos o concentrados; d) los mtodos que han de
emplearse para alcanzar los objetivos.
Suchman, adems, aboga por defender tambin los evaluadores externos,
dado que los profesores, al estar muy implicados en los procesos instrucciona-
les, pueden tergivesar la evaluacin.
Metfessel y Michael (1967) se sitan dentro del enfoque tyleriano, pero
sin olvidar la consideracin de la toma de decisiones de Cronbach. Su aporta-
cin se reduce a estructurar un modelo evaluativo en etapas, dirigidas por un
evaluador externo pero con la participacin del propio profesor. En esas etapas
se articulan una serie de elementos que empiezan a considerarse consustancia-
les a la evaluacin: la formulacin de objetivos, la seleccin de instrumentos de
evaluacin, el anlisis de las informaciones recogidas y las recomendaciones
sobre posibles cambios en los programas.
Scriven (1967, 1974, 1975 Y 1983) adelanta los planteamientos de una eva-
luacin que aminora la importancia de los objetivos y la desplaza hacia las nece-
34 La evaluacin de aprendizajes

sidades educativas. Esta innovacin aparecer con ms fuerza ms tarde como


uno de los enfoques de la evaluacin cualitativa. Scriven pas a la historia de la
educacin por haber sido el primero en formular la distincin entre evaluacin
sumativay formativa (cap. 15).
Los resultados obtenidos en una evaluacin deben considerarse buenos o
malos, no slo de acuerdo con la consecucin de los objetivos que se preten-
den, lo que da lugar a la evaluacin final o sumativa, que hace un juicio de
valor sobre los efectos de la enseanza en e! alumno; tambin segn las necesi-
dades del alumno, es decir, lo que merezca la pena evaluar, lo que da lugar a la
evaluacin formativ3.,que recae, con intencin de mejorarlos, sobre la metas,
contenidos, procesos, procedimientos, actitudes, etc., tanto del profesor como
del alumno.
Owens (1971 y 1973) YWolf (1974 y 1975) desarrollan el llamado mtodo
contrapuesto, que intenta iluminar los aspectos ms importantes de un pro-
grama siguiendo un proceso dialctico en e! que dos grupos de evaluadores,
con referentes distintos, investigan los pros y los contras para contraponerlos.
Este enfoque pretende ser ms eficaz para identificar objetivos originalmente
no previstos y para perfeccionar la toma de decisiones en el campo de la educa-
cin.
Stufflebeam (1967) Y Shinkfield (1985) consideran que la evaluacin es vc-
tima de una grave enfermedad causada por el escepticismo, la ausencia de
directrices, la psima calidad de la prctica evaluativa, etc.
Para superar este estado de cosas, es necesario reformar el concepto de eva-
luacin y todo lo que ello implica, con objeto de definir el qu, e! cmo y e!
para qu se han de valorar los programas educativos. As, Stufflebeam y Shink-
field (1987: 163) consideran que la evaluacin es un proceso para identificar,
obtener y proporcionar informacin til y descriptiva acerca del valor y el
mrito de las metas, la planificacin, la realizacin y el impacto de un objeto
determinado, con elfin de servir de gua para la toma de decisiones, solucio-
nar los problemas de responsabilidad y la comprensin de los fenmenos
implicados, todo ello resumido en el acrnimo CIPP: evaluacin del contexto,
del input, de! proceso y del producto.
Pero aaden que en una evaluacin interna se corre el riesgo de realizar una
falsacin de! programa que se quiere evaluar. Por ello, indican que es necesario
valorar tambin la propia evaluacin, es decir, desarrollar una metaevaluacin
con normas estandarizadas, de manera que se manifiesten las conclusiones
objetivas no slo de la accin evaluada, sino tambin de la misma evaluacin.
Evolucin del concepto de evaluacin educativa 35

LOS EVALUADO RES DE LA NUEVA OLA 6.

En 1972, McDonald y Parlett convocan en Inglaterra una Conferencia de Evalua-


dores que se celebra en Cambridge y a la que asisten, entre otros, Hamilton y
Stake. Al trmino de la conferencia, se hizo pblica una declaracin de intencio-
nes que refleja el comienzo de la corriente de la evaluacin cualitativay la pos-
tura de los que Stenhouse (1984) llama evaluadores de la nueva ola. Todos estos
autores se hallan cerca del paradigma cognitivo. Esto supone que para evaluar hay
que hacer un anlisis de las estrategias cognitivas, as como del empleo de tcni-
cas proyectivas que pongan de manifiesto los estados mentales del alumno.
Todas las teoras que surgen en este momento coinciden en sealar la fragili-
dad del modelo de objetivos, ya que reduce la evaluacin del proceso instructi-
vo a trminos maniqueos de xito o fracaso, sin llegar a comprender toda la
riqueza del mismo. Ante la excesiva parcelacin de objetivos y fijacin de proce-
sos de enseanza-aprendizaje, acentan la libertad intrnseca del sujeto e inten-
tan elevar esta visin a paradigma que sirva para sustentar una prctica evalua-
dora, en el marco de una educacin cuya finalidad no siempre es conseguir
productos de uso. Hagamos, dicen, una escuela en la que se equilibren dos
mundos, el de la eficacia y el de la libertad. Este posicionamiento, que evolucio-
na buscando un nuevo sentido de la evaluacin desde perspectivas cognitivas y
sociolgicas, es slo una manifestacin de una polmica mucho ms amplia
entre dos paradigmas, el conductista y el cognitivo.
McDonald (1971 y 1973) es el autor del llamado enfoque halstica, en el
que todas las informaciones relativas al currculo son igualmente importantes.
No se puede evaluar teniendo slo en cuenta determinados datos, aunque
stos sean tan importantes como los rendimientos de los alumnos. La tarea del
evaluador, que es externo, consiste en obtener y comunicar esas amplias y varia-
das informaciones. Sern los agentes que reciben esa informacin, profesores y
autoridades educativas, quienes tomen las decisiones correspondientes.
Parlett (1972) y Hamilton (1977) critican tambin el modelo de una evalua-
cin por objetivos, ya que se muestra inadecuado para comprender la compleji-
dad educativa y, en consecuencia, insuficiente para una toma de decisiones.
Proponen la llamada evaluacin iluminativa, que tambin tiene en cuenta la
totalidad del currculo, es decir, su fundamentacin, evolucin, realizaciones,
dificultades y, adems, sus ventajas e inconvenientes en las ms diversas situa-
ciones escolares. Aunque estiman que el fin de la evaluacin es tomar decisio-
nes, las tareas del evaluador, como ya haba indicado McDonald, se deben redu-
cir fundamentalmente a recoger informacin neutral para iluminar las
dificultades del currculo. Para ello se usan la observacin, las encuestas en for-
ma de entrevistas y cuestionarios, el anlisis de documentos, etc. La toma de
decisiones se somete a la participacin democrtica de todos los afectados, ya
que la evaluacin ha de tener en cuenta los intereses de todos aquellos a quie-
nes afecta el currculo.
36 La evaluacin de aprendizajes

Stake (1967, 1975 Y 1976), corno reaccin a la nocin tylerianade la evalua-


cin preocupada por la fiabilidad de las puntuaciones y la validez de las prediccio-
nes, evaluacin que llama <preordenada, y desde la declaracin de intenciones
de la citada conferencia de Cambridge, aspira a una evaluacin orientada a la
naturaleza compleja y dinmica de la educacin que establezca una diferenciacin
entre datos relativos a antecedentes, actividades en clase y resultados o efectos.
Considera corno antecedente cualquier condicin previa al proceso de ensean-
za-aprendizaje que pueda estar relacionada con los resultados. Las actividades o
transacciones son las diversas interacciones entre profesor y alumno, alumno y
alumno, familiar y orientador, etc.; la sucesin, en suma, de compromisos que
supone el proceso educativo. Los resultados, corno fuente de informacin, se
refieren a las mediciones del influjo de la instruccin sobre profesores, asesores,
etc., y, por supuesto, sobre los alumnos. El siguiente esquema simboliza este
modelo, completado a partir del que presenta Stenhouse (1987):

o realmente han
(Las yoperaciones
observadas
Operaciones
e(5deseados
ecomo
deseados
:::l
acontecido)
planeadas oQ) verdaderamente
Antecedentes observados
Antecedentes
Resultados
Relacin
(Las
(Los emprica
condiciones
se han existen)
resultados
obtenido) que
que
esea
peraciones
Operaciones
actividades
o, ro "O"O
Q)
que pasen)
como 'uro
<..>
actividades
Relacin emprica
elacin
egar)
stir) lgica
ue
gica

Todo ello da lugar a la evaluacin respondente, cuya finalidad es ayudar al


cliente,al alumno, a superar tanto sus problemas corno los defectos del currcu-
lo establecido para solucionrselos; lo que exige que el evaluador responda a
las demandas que se le presentan negociando, mediante una comunicacin
continua con el cliente, lo que debe hacerse; Amal, del Rincn y Latorre
(1992) desarrollan ampliamente el modelo de Stake.
Stenhouse recoge las recomendaciones de la conferencia de Cambridge
sobre la evaluacin en el Humanty Currculum Project (Stenhouse, 1981); sin
Evolucin del concepto de evaluacin educativa 37

embargo, est en contra de la distincin entre evaluador externo y el que desa-


rrolla el currculo, porque los nicos que pueden evaluado son los mismos pro-
tagonistas, profesores y alumnos. y tambin, aunque reconoce sentirse deudor
de las aportaciones de los evaluadores de la nueva ola, critica la falta de clari-
dad de sus criterios para la valoracin del currculo, por lo que propone la con-
sideracin de los siguientes aspectos:
a) La evaluacin de un currculo consiste ms en aclarar su significado que en
calcular su valor. y esto slo puede determinarse mediante la observacin
emprica de lo que ocurre en el aula (criterio de significado).
b) Es necesario estudiar su potencial, el para qu ..., en relacin con el per-
feccionamiento de capacidades, motivacin, etc. (criterio de potencial).
c) Hay que considerar los problemas que el currculo plantea en la prctica;
interesantes por su rentabilidad, en la medida en que sean susceptibles
de repetirse en diferentes situaciones o porque adquieran especial rele-
vancia (criterio de inters).
d) El evaluador debe poner en relacin el potencial y el inters del currculo
con las condiciones contextuales y ambientales de la realidad prctica de
la escuela o del aula. Ello permite anticipar las consecuencias de las deci-
siones que se tomen en un mbito determinado (criterio de condiciona-
lidad).
e) Es necesario estimar el valor de un currculo respecto de las innovacio-
nes y cambios deseados en la educacin en general o en una escuela en
particular (criterio de elucidacin).
Eisner (1988) que, antes de ser profesor de educacin, fue pintor, propone
sustituir, o al menos complementar, la evaluacin basada en planteamientos
cientficos por informes educativos periciales inspirados en las prcticas de los
crticos de arte. Afirma que la pericia, tambin en educacin, es el arte de la per-
cepcin que supone la comprensin de las caractersticas de una realidad com-
pleja; ser perito en vinos, por ejemplo, es ser capaz de distinguir las sutilezas de
las diversas denominaciones y aadas a partir de datos gustativos, visuales y
cenestsicos. La crtica, por otro lado, es el arte de la comunicacin; el crtico es
un perito que no se contenta con comprender las cualidades de un objeto o
suceso, tambin pretende revelar a otros menos iniciados lo que l ha descu-
bierto; en nuestro caso, la compleja realidad educativa y sus consecuencias. La
crtica pericial que propone Eisner implica hacer una descripcin vvida y deta-
llada de la realidad educativa que se quiere evaluar por medio de representacio-
nes no slo numricas, tambin literarias, visuales estticas o dinmicas, etc.,
cada una adecuada para una determinada situacin. El mismo Eisner, sin embar-
go, confiesa que estos mtodos cualitativos son sutiles y requieren arte; ade-
ms, resulta compleja la verificacin de sus conclusiones.
38 La evaluacin de aprendizajes

LA EVALUACiN EDUCATIVA DESDE


7. LA PSICOLOGA DEL APRENDIZAJE

Desde Tylerhasta nuestros das ha habido mltiples aportaciones de la Psicolo-


ga del aprendizaje al campo de la evaluacin educativa; aportaciones que se
pueden relacionar tambin, reduciendo los matices, con los paradigmas con-
ductista y cognitivo, que, como hemos visto, han inspirado la mayora de los
modelos evaluativos.

7.1. Enfoquecondudual
Prescindiendo de posturas extremas, como la de Watson, que casi nunca entra-
ron en el mbito educativo, es uno de los enfoques que sigue influyendo en las
evaluaciones docentes. Considera que los comportamientos de un sujeto son
fundamentalmente una consecuencia de lo que aprende. Lo mental es cualitati-
vamente similar a la conducta manifestada; por consiguiente, la evaluacin se
basa en el estudio de la conducta observable que puede ser comprobada por
observadores independientes.
Como la conducta queda definida por el binomio estmulo-respuesta, es decir,
por la relacin entre los factores ambientales -estimulos- y los factores conduc-
tuales -respuestas-, la obtencin de la informacin sobre esa conducta consis-
te en un anlisis (coincide con el modelo A-B-C,es decir anlisis del comporta-
miento [B=behavior], sus antecedentes [A]y sus consecuentes [C]), cuyas fases,
segn Peterson (1968), son: a) observacin sistemtica de la conducta, en nuestro
caso de los aprendizajes del alumno; b) observacin sistemtica de la condicin-
estmulo que precede al comportamiento; c) manipulacin experimental de una
condicin que est relacionada funcionalmente con la conducta; d) observacin y
registro posterior de los cambios en el comportamiento.
La evaluacin conductual se realiza bsicamente a partir de una valoracin
criterial (cap. 13), y los criterios se toman de la fuente sociolgica del currculo.
Se trata, por tanto, de comprobar la presencia o ausencia de aquellas conductas
o de aquel conjunto de repertorios conductuales precisados en objetivos opera-
tivos que vienen exigidos por la sociedad.
El enfoque conductual desemboca fundamentalmente en la evaluacin
cuantitativa, que histricamente se redujo de hecho a la medida del xito o fra-
caso de los resultados del aprendizaje con valoraciones criteriales sumativas
(cap. 15), por mucho que sus defensores manifiesten en teora que este tipo de
evaluacin no tenga que reducirse a una clasificacin de alumnos por su capaci-
tacin" sino que, slo a partir de la valoracin de rendimientos, se puede y
debe llegar al anlisis y a la valoracin de la metodologa empleada, de la com-
Evolucin del concepto de evaluacin educativa 39

petencia del profesor, de la organizacin del centro, del sistema tutorial y, en


general, de todos los elementos del proceso de instruccin.
Un avance de este planteamiento se produce con el enfoque neoconductual,
representado sobre todo por Gagn (1970), tambin por Gagn y Briggs (1976),
para quien la evaluacin no slo ha de tener en cuenta las conductas observa-
bles, sino tambin las capacidades implcitas en los objetivos propuestos de
acuerdo con las caractersticas individuales de cada aprendiz.

Enfoquecognitivo 7.2.

Este enfoque est representado por Ausubel (1976) y tambin por Ausubel y
Sullivan (1980), que consideran que la evaluacin ha de tener en cuenta el modo
en que los sujetos representan e! conocimiento en sus estructuras previas.
Esta forma de evaluar (Greeno, 1980) viene determinada por la necesidad
de utilizar en la evaluacin las mismas tcnicas de representacin que los profe-
sores usan para ensear y los alumnos para aprender conceptos, mtodos y
destrezas propios de su proceso de aprendizaje. Estas tcnicas son las redes
semnticas que sirven de gua para formular las pruebas de evaluacin.
Posner (1979) tambin se vali de las redes semnticas para explorar lo que
saban sus alumnos antes y despus de un proceso de enseanza-aprendizaje.
Antes, para comprobar los conocimientos previos con respecto a los objetivos
nuevos que se iban a transmitir; y despus, para valorar la modificacin de las
estructuras previas y la forma en que se ha integrado la nueva informacin.
En una lnea muy parecida, Novaky Gowin (1988) utilizan para evaluar aprendi-
zajes los mapas conceptuales mediante la comparacin entre el mapa conceptual
elaborado por e! alumno y un modelo establecido previamente por e! profesor.
Tambin sugieren, en la lnea de Posner, la posibilidad de comparar los mapas con-
ceptuales de! alumno antes y despus del proceso de instruccin.
La conclusin ms importante que se puede obtener a partir de este enfo-
que es la necesidad de evaluar teniendo como referente los conocimientos pre-
vios del alumno, que constituirn la base para la valoracin de los nuevos
aprendizajes, para establecer a partir de los mismos los avances conseguidos y
la posterior toma de decisiones.

LA PRCTICA EVALUATIVA
EN LA ACTUALIDAD 8.

Sin contar la prctica evaluativa acrtica, heredera del racionalismo academicista


europeo, que se reduce a proponer exmenes y a dar notas repitiendo como
40 La evaluacin de aprendizajes

profesores el modelo que han soportado como alumnos, nos encontramos con
que actualmente an subsisten en una extraa convivencia muchos de los enfo-
ques o modos de evaluar conductuales,neoconductuales y cognitivos que han
ido apareciendo a lo largo de la historia de la educacin, algunos de los cuales
han sido objeto de estudio en el presente captulo. Podramos decir que cada
una de esas aproximaciones evaluativas mantiene hoy lo que de ms relevante y
prctico haba en ellas. Como novedad relativa en la actualidad, se pueden citar
los matices que introducen tres nuevos enfoques.

8.1. La evaluacincualitativa

Unas fuertes influencias sociolgicas con matices ideolgicos y orientaciones


cognitivistas dan lugar a la evaluacin cualitativa, entre cuyas caractersticas se
pueden sealar las siguientes:
a) Se subraya la importancia de los procesos sobre los productos del apren-
dizaje. Lo decisivo no es lo que el alumno aprende, sino ms bien cmo
lo est aprendiendo. Esta concepcin del proceso instruccional en que el
alumno es el protagonista, justifica la predileccin por el uso de la eva-
luacin formativa (cap. 15).
b) Se recoge tambin como funcin principal de la evaluacin el proporcio-
nar una informacin holstica o global, y de ah la necesidad de evaluar
todos aquellos factores que afectan al proceso instructivo: presupuestos,
condiciones, estilos, estrategias y ritmos de aprendizaje, rendimientos,
relacin entre esfuerzo y resultados, etc., y, en general, los distintos inte-
reses de los sectores implicados mediante un tratamiento democrtico
de la informacin, es decir, teniendo en cuenta las aportaciones de pro-
fesores, alumnos y dems agentes educativos.
c) La evaluacin es bsicamente personalizada y se hace de acuerdo con los
intereses y aptitudes de cada alumno. Se usan los presupuestos metodo-
lgicos de la investigacin etnogrfica (descripcin de un modo de vida,
de una cultura, teniendo en cuenta el punto de vista de los nativos), que
recoge mltiples informaciones a travs de escalas de observacin y con-
trol, informes de observadores externos, encuestas en forma de entrevis-
tas y cuestionarios, anlisis de tareas, estudio de casos, etc. No cabe el
uso de las tpicas pruebas objetivas o de ensayo. La evaluacin cualitativa
no queda codificada en una calificacin al estilo tradicional, sino ms
bien en un informe (Stenhouse, 1987: 140): Siyo como estudiante me
fo del juicio de mi profesor, deseo ms bien una crtica que una califi-
cacin. En el caso contrario, deseara ms una calificacin que una
crtica". Lo que late debajo de este texto es la vieja polmica entre el uso
de mtodos cuantitativos y cualitativos. Los defensores de la evaluacin
cualitativa ven tambin en la atribucin de nmeros a las realidades edu-
Evolucin del concepto de evaluacin educativa 41

cativas una fuente de engao (Santos Guerra, 1988); es de advertir que el


trmino nmeros lo refieren tambin a los eufemismos de apto,
insuficiente, etc.
La evaluacin cualitativa aparece aplicada de un modo claro en el modelo de
investigacin-accin (Kemmis, 1988, cita a Collier, 1945, ya Lewin, 1946, 1947
Y 1952, como los iniciadores de la investigacin en la accin), que puede defi-
nirse como el proceso por el que los prcticos -profesores- pretenden resol-
ver sus problemas de un modo cientfico, con el fin de dirigir, corregir y evaluar
las consecuencias de sus decisiones. Esta metodologa resucita en los aos ochen-
ta con la corriente denominada de animacin pedaggica (Barbier, 1977) y en
los proyectos de investigacin cooperativa (Cabrera, Espn y Rodrguez, 1988;
Ward y Tikunoff, 1982), iniciativas ambas para poner en marcha y evaluar los pro-
yectos de innovacin educativa. Estas corrientes, como es sabido, han sido objeto
de diversas matizaciones. R. Neira (2002) seala como de especial inters las
observaciones de Carr (1989, 1990) Ylas de Elliott (1990,1993).

La evaluacin basada en el currculo 8.2.

Actualmente se oye tambin la expresin evaluacin curriculaf, aunque, como


confiesan algunos de sus defensores (Tucker, 1985), poco hay de nuevo en ella,
a no ser su preocupacin por evaluar los rendimientos insuficientes y proponer,
siguiendo las exigencias de la evaluacin formativa (cap. 15), una intervencin
para superar esas deficiencias. Empez a emplearse en Estados Unidos por los
mismos aos en que en Europa aparecieron los evaluadores de la nueva ola,
aunque es difcil determinar el grado de influencia mutua y en qu sentido fue.
Ambos toman el currculo como referente de la evaluacin educativa. Ocurre
que consideran que los currculos deben ser abiertos, es decir, deben variar de
un centro a otro y, en consecuencia, tambin los referentes de la evaluacin. Se
podra resumir, por tanto, este enfoque en el aforismo: Evala lo que enseas,
y ensea lo que evalas. Son tantos los modelos que han aparecido bajo la eti-
queta de evaluacin curricular y, por otro lado, tan repetitivos en sus plantea-
mientos, que nos vemos obligados a remitimos a las referencias bibliogrficas:
Modelo Gickling-Thompson (1985), Modelo Blankenship (1985), Modelo
Howell-Morehead (1987), Modelo Salvia-Hughes (1990). Citamos aparte el
Modelo de Carrascosa el al. (1991) porque integra las aportaciones de muchos
de ellos. En este modelo se destaca que los rendimientos del alumno deben
analizarse teniendo en cuenta al propio alumno y su estilo de aprendizaje y,
sobre todo, los elementos fsicos, sociales y personales del contexto curricular.
Como todos estos modelos, defiende una evaluacin formativa (cap. 15) e
intenta integrar conceptualizaciones y prcticas tan diversas como el anlisis
conductual, los tests de rendimiento, la teora de la construccin de tests, las
aportaciones de la psicologa cognitiva y de la psicologa social, etc.
42 Laevaluacinde aprendizajes

8.3. La evaluacinadaptativa

En este apartado pretendemos apuntar las tendencias que se detectan actual-


mente en la investigacin y el desarrollo de la evaluacin educativa.
Lo primero que cabra sealar, porque va a teir todo lo dems, es que tanto
la investigacin bsica como la aplicada en el campo de la medicin educativa
gozan en la actualidad de una excelente salud. Basta echar una ojeada a lo que
se publica en las revistas internacionales especializadas o a los congresos anua-
les ms representativos, tales como los de la American Educational Research
Association (AERA)o la National Council on Measurement in Education
(NeME), para constatado. No est de ms subrayar este inters actual por el
rigor y la objetividad en la medicin educativa, puesto que no siempre ha sido
as, especialmente en nuestro pas. En lneas generales, se asume que sin una
medicin educativa rigurosa no puede haber una educacin eficiente. Medir
con precisin para ensear con rigor podra ser el lema de los tiempos que
corren. Ese sera el escenario; pero, cules son los problemas candentes y los
focos de debate actuales que ocupan a investigadores y profesionales? Vemos-
lo, yendo de lo ms general a lo ms especfico.
En los ltimos 20 aos ha tenido lugar un enorme desarrollo de la tecnologa
psicomtrica, que ha impulsado y potenciado la construccin y anlisis de los ins-
trumentos de medida en las ciencias sociales, la educacin incluida (Linn, 1989),
con la aparicin de la familiade modelos englobados bajo la denominacin genri-
ca de Teora de Respuesta a los tems (Hambleton, Swaminathan y Rogers, 1991;
Lord, 1980;Muiz, 1997a;Van der Linden, 1997). Este nuevo enfoque ha permitido
dar solucin a un viejo problema central que no encontraba una salida adecuada
dentro del marco de la aproximacin clsica; a saber: la Teora de Respuesta a los
tems (TRl) va a permitir evaluar a las personas en una determinada variable sin
necesidad de utilizar la misma prueba para todas ellas. Esto ser posible debido a
que los modelos de la TRl expresan en la misma mtrica puntuaciones obtenidas
por medio de pruebas distintas, lo cual era imposible bajo la ptica clsica. Ntese
que, dentro del acercamiento clsico, si se desea comparar a dos personas en una
variable, ha de aplicrseles el mismo test; si bien es verdad que, para sortear este
escollo, se venan utilizando algunos remedios estadsticos que funcionaban razo-
nablemente bien en la prctica. Expresado en pocas palabras, los modelos de la
TRl generan mediciones invariantes respecto de las pruebas utilizadas para obte-
nedas. Esta importante caracterstica liberaliza el uso de los instrumentos de eva-
luacin, permitiendo una medicin ajustada al sujeto, mediante la adaptacin de la
prueba a las caractersticas de la persona evaluada. Esta propiedad, en conjuncin
con los potentes ordenadores personales, va a dar lugar a la revolucin tecnolgica
ms importante de los ltimos aos en el campo de la medicin educativa: los
TestsAdaptativos Informatizados (TAl).
Valindose de amplios bancos, que recogen la elaboracin continua de tems
para reponedos y actualizados, y mediante los TAl, se aplica a cada persona el
Evolucin del concepto de evaluacin educativa 43

test que mejor se adapta a sus caractersticas. Las ventajas que esto conlleva son
enormes, tanto en la precisin de las mediciones como en el tiempo invertido,
incluso en la satisfaccin de los examinados, que de este modo se enfrentan a
pruebas acordes con su nivel, por lo que se minimizan los aspectos frustrantes
que lleva anejos toda evaluacin. En algunos pases, este tipo de evaluacin se
est imponiendo rpidamente por las ventajas que ofrece tanto para el examina-
dor como para los examinados (Olea, Ponsoda y Prieto, 1998, 1999; Muiz,
1996; Renom, 1993, 1997; Van der Linden y Glass, 2000; Wainer, 1990). El uso
de los TAl plantea todo un conjunto de problemas tcnicos nuevos sobre los
que trabajan intensamente los especialistas en la actualidad. Cabra citar, por
ejemplo, la nueva forma de estimar la fiabilidad mediante la Funcin de Infor-
macin, que permite calcular la precisin de las pruebas para los distintos nive-
les de la variable medida, en vez de ofrecer un valor global como haca el coefi-
ciente de fiabilidad clsico; o los nuevos mtodos para evaluar el sesgo de los
instrumentos de medida, en la actualidad rebautizados como Funcionamiento
Diferencial de los tems (Camilli y Shepard, 1994; Fidalgo, 1996; Holland y Wai-
ner, 1993).
Un campo clsico de la medicin educativa como son los TestsReferidos al
Criterio (Berk, 1984; Glaser, 1963; Muiz, 2003; Popham, 1978), ha cobrado un
nuevo impulso gracias a la TRl, sobre todo en lo relativo a la estimacin de la
fiabilidad, mediante la funcin de informacin, la cual posibilita un estableci-
miento ms riguroso de los puntos de corte, de modo que minimicen los erro-
res al clasificar a las personas segn dominen o no el criterio/dominio evaluado.
Los mtodos para establecer los puntos de corte de forma rigurosa siguen
generando en la actualidad abundantes investigaciones, dada la relevancia que
ello puede tener para la vida acadmica y profesional de muchas personas
(Berk, 1986, 1996; Cizek, 1996; Muiz, 2003). Otro campo clsico que ha sido
muy potenciado por la irrupcin de la TRl ha sido la construccin de los tems
(Haladyna, 1994; Osterlind, 1998), al convertirse stos en la unidad de medicin
y anlisis en detrimento del test, como queda bien patente en la propia denomi-
nacin de la TRl. Asimismo, la construccin automtica de tems y tests por
ordenador (Hambleton, Slater, Narayana y Setiadi, 1996) es otra lnea en la que
se trabaja activamente.
Si bien las lneas y temas sealados ocupan las energas de la mayora de
investigadores y profesionales en la actualidad, a la vez que constituyen el para-
digma dominante en la medicin educativa, existen otros anlisis y posiciona-
mientas que pugnan por abrirse paso. Es el caso, por ejemplo, de todo lo rela-
cionado con la tica y deontologa de la evaluacin educativa, y es que de poco
vale una tecnologa de evaluacin poderosa sin las riendas tico-deontolgicas.
No hay que olvidar que se evala a personas y sobre ellas se toman decisiones,
de modo que toda precaucin en este sentido es poca. Los profesores, amn de
otros colectivos relacionados con la educacin, y la propia administracin debe-
ran ser conscientes de la necesidad de una buena preparacin en la tecnologa
de la evaluacin, lo que redundara en beneficios para el proceso educativo y
44 La evaluacin de aprendizajes

para los alumnos evaluados. En este sentido, son muy interesantes las directri-
ces elaboradas por la federacin de profesores americanos y otras asociaciones
sobre las competencias requeridas por los profesores para evaluar a los alum-
nos (American Federation of Teachers, 1990), as como las directrices para el
uso adecuado de los tests en mbitos educativos elaboradas por varias organiza-
ciones educativas Goint Committee on Testing Practices, 1988).
Finalmente, no se puede pasar por alto el chisposo debate surgido en tor-
no a lo que ha dado en llamarse un tanto pretenciosamente evaluacin autn-
tica (Bravo y Fernndez del Valle, 2000; Hakel, 1998; Powell, 1990), como si
otras formas de evaluar no lo fuesen. Los partidarios de este enfoque argumen-
tan a favor de una evaluacin alejada de situaciones estandarizadas en cuanto a
formato de respuesta de las pruebas y otros aspectos, abogando por dar un
mayor realismo al proceso evaluativo, para acercar la evaluacin lo ms posible
a la situacin real que se pretende medir. En realidad, esto no es nada nuevo,
pues tcnicas como el muesfreo de conductas reales en el puesto de trabajo o
la utilizacin de centros de evaluacin en los que se simulan las condiciones
reales son bien conocidos y utilizados en psicologa industrial y del trabajo des-
de hace mucho tiempo. En el mbito educativo, dos formas de evaluacin en
esta lnea autntica seran la evaluacin de rendimientos (Performance
Assessment) y el portafolio. En la evaluacin de rendimientos, se trata de eva-
luar a travs de ejecuciones concretas del examinado, en vez de utilizar pruebas
estandarizadas. En el caso del portafolio, la idea es que el alumno presente un
portafolio o carpeta en la que incluya todos los trabajos que considere oportu-
nos para demostrar su preparacin en un determinado campo. De entrada, la
idea de introducir realismo en el proceso evaluativo parece razonable, pero su
implementacin en la prctica conlleva numerosos problemas an no bien
resueltos, como es la estimacin de la fiabilidad de las evaluaciones o su eleva-
do coste en tiempo y dinero. El debate sigue abierto y, hoy por hoy, no hay evi-
dencia emprica de que estas alternativas ofrezcan mediciones ms fiables y vli-
das que las aportadas por las evaluaciones convencionales estandarizadas; y
stas y otras propiedades psicomtricas son irrenunciables, hgase la evaluacin
en nombre del principio que se haga. Al hilo de este planteamiento de la eva-
luacin autntica, se reabren viejas polmicas, como el uso de los tems de
eleccin de respuesta frente a los de respuesta construida (Hakel, 1998; Oster-
lind, 1998), o se retornan otras latentes como la surgida en torno a la validez
consecuencial (Messick, 1989), relativa a si el estudio de la validez debe o no
de incluir las consecuencias del uso de los tests. Nadie duda de que vigilar el
uso adecuado de los tests es de suma importancia, pues la mayora de los 21:>U-
50S se producen ms por la mala prctica que por fallos en las propiedades psi-
comtricas de las pruebas (Frederiksen, Mislevyy Bejar, 1993; Gonzlez-Rom y
Espejo, 2003; Prieto y Delgado, 1996, 1999, 2003); pero el que esto sea as no
parece avalar que haya que incluir las consecuencias del uso de los tests en los
anlisis de validez, pues ello sacara la validez del mbito tcnico y cientfico
donde se encuentra para alojada en el ms resbaladiZO de los valores. Mezclar
Evolucin del concepto de evaluacin educativa 45

ambos tipos de problemas no parece que vaya a ser beneficioso ni para la vali-
dez ni para la mejora del uso de los tests.
Adems de estas razones, la utilizacin de aplicaciones informticas enrique-
cidas con medios audiovisuales e internet est potenciando de manera insospe-
chada la utilizacin de bancos de pruebas objetivas de estructuras varias (Pars-
hall y Balizet, 2001; parshall, Davey y pashley, 2000; Zenisky y Sireci, 2000).
Queden ah estos apuntes generales sobre algunos de los temas que ms aten-
cin estn recibiendo actualmente en el campo de la medicin educativa. Otros
muchos podran citarse, lo que pone de manifiesto la gran actividad investigadora
que est teniendo lugar en este mbito con tan fuertes implicaciones sociales.

LA EVALUACiN EN EL SISTEMA
EDUCATIVO ESPAOL 9.

Los interesados podrn encontrar en lvarez Mndez (1994) una interesante


exploracin diacrnica documentada de la evaluacin escolar a lo largo de los
sistemas educativos espaoles,
Aqu es obligado citar la Ley General de Educacin de 4 de agosto de 1970
ya que, introduciendo cambios radicales y novedosos en diferentes aspectos,
hace que en el sis~ema educativo espaol pueda hablarse con propiedad de eva-
luacin. Es ms, en fechas posteriores, apenas ha habido modificaciones rele-
vantes en lo que se refiere a la evaluacin del rendimiento educativo.
A partir de dicha Ley,la educacin general se considera no ya como un pro-
ceso selectivo, sino de formacin integral del alumno: De acuerdo con esto,
segn la Orden de 16 de noviembre de 1970, la eval\lacin se concibe como
una actividad sistemtica, integrada en el procesp educativo, cuya finalidf1d
es el mejoramiento del mismo mediante un conocimiento, lo ms exacto posi-
ble, del alumno en todos los aspectos de su perso.nalidad y una informacin
ajustada sobre el proceso educativo, sobre losfactores personales y ambienta-
les que en ste inciden, Es, pues, ahora cuando la normativa empieza a conside-
rar una serie de aspectos referentes a la evaluacin:
Consiste en una apreciacin cualitativa que, como parte de la propia
actividad educativa y mediante un seguimiento continuo del alumno, ha
de servir para valorar tanto su formacin como su capacidad de aprendi-
zaje posterior, Desde este momento, la evaluacin deja de considerarse,
pues, como un apndice del proceso y ajeno a l mismo, como una con-
tinua realizacin de exmenes y como un mero procedimiento selectivo,
Sus funciones han de ser de diagnstico, pronstico, orientacin y pro-
mocin; y ha de servir para establecer tanto dicha promocin como la
recuperacin o la repeticin,
46 La evaluacin de aprendizajes

Ha de ser hecha primordialmente por el profesor, pero se habla tambin


de la autoevaluacin del alumno como medio para que ste llegue a
conocer su propio proceso de aprendizaje.
Debe llevarse a cabo de modo permanente, evaluacin continua, que ha
de tener su peso en la valoracin del curso; aunque, para esta ltima, se
considera tambin el resultado del examen final previsto en la Ley.
Segn la etapa educativa, la evaluacin quedar formalmente expresa en
los boletines de notas en tres, cuatro o cinco ocasiones a lo largo del
curso.
Sin embargo, debido entre otras cosas al peso de la tradicin, en la realidad
del aula este concepto de evaluacin se fue desvirtuando, alejndose as de los
aspectos formativos que contena la Ley.De hecho, por ejemplo, la evaluacin
se sigui asentando en los exmenes tradicionales, y la evaluacin continua se
convirti realmente en una continua evaluacin, es decir, en una continua reali-
zacin de pruebas.

A modo de conclusin

El desarrollo y la constitucin de las prcticas evaluativas a lo largo de la historia


de la educacin han supuesto la pervivencia selectiva de una serie de enfoques
y modelos, muchos con mayor incidencia en la investigacin educativa que en
la prctica de la evaluacin docente, que se han ido sucediendo, reiterando y
superponiendo hasta llegar a la realidad actual, como hemos ido viendo en las
pginas precedentes.
En un primer perodo precientfico, la evaluacin, sin fundamento terico
alguno, se reduca fundamentalmente a la comprobacin del rendimiento esco-
lar con objeto de determinar la posible promocin de los alumnos hacia come-
tidos diversos. La evaluacin era espontnea e interna al aula, ya que al profe-
sor, por el hecho de serio, se le supona una competencia incuestionable para
evaluar a sus alumnos. La preocupacin se centraba en desarrollar instrumentos
adecuados; primero fueron los exmenes orales y luego se evolucionar hacia
los escritos tipo ensayo.
El perodo de los tests supuso un avance significativo, no slo por la intro-
duccin de las pruebas objetivas en la escuela, sino sobre todo porque, aunque
evaluar segua siendo comprobar rendimientos, se ampla el campo a la perso-
nalidad, inteligencia, actitudes, etc., y a la vez se introduce la evaluacin externa
al aula.
Fue a partir de Tylercuando la evaluacin educativa se estructura y teoriza, a
partir del paradigma conductista, para convertirse en un proceso que tiene por
fin determinar en qu medida han sido alcanzados los objetivos; es decir, a la
Evolucin del concepto de evaluacin educativa 47

comprobacin segua una valoracin que pona de manifiesto el grado de cohe-


rencia que exista entre los resultados esperados y los obtenidos. Evaluar empe-
zaba a ser comprobar resultados para emitir, segn unos criterios de referencia,
un juicio de valor que se plasmaba en una calificacin.
En un perodo posterior de reflexin, en el que se intenta introducir en la
escuela la eficacia empresarial, se aade formalmente un nuevo elemento a la
evaluacin, la toma de decisiones.
A partir de ahora, en que la evaluacin se consideraba casi definitivamente
estructurada, la preocupacin se centr en debatir sobre la calidad y cantidad
de informacin necesaria para realizar una adecuada valoracin y posterior
toma de decisiones. El contenido de las informaciones, sobre todo en el racio-
nalismo acadmico europeo, haba re cado restrictivamente sobre los rendi-
mientos. Precisamente, el movimiento docimolgico se explica como un inten-
to de perfeccionar ese academicismo.
Durante la euforia conductista, la valoracin y toma de decisiones se aplic a
los resultados reflejados en una conducta final observable formulada en forma
de objetivo operativo, lo que se super con las aportaciones neoconductistas
aplicndolas tambin a las capacidades implcitas en los objetivos.
Desde la perspectiva del paradigma cognitivo, estos modelos de la pedago-
ga por objetivos empiezan pronto a ser considerados insuficientes para sumi-
nistrar referencias apropiadas que nos permitan tomar buenas decisiones. Sur-
ge as la dialctica entre la exactitud y la riqueza; es decir, nos interesa ms que
la evaluacin sea exacta o que abunde en matices y consideraciones? La tensin
hacia el rigor haba llevado a insistir en la objetividad, en el control de las situa-
ciones, en la automatizacin de la correccin, en la reduccin de la evaluacin a
las conductas observables y cuantificables, en la importancia de la fiabilidad de
los datos obtenidos, etc.; as surgieron las pruebas objetivas, los tests estandari-
zados, la observacin mediante sistemas de categoras operativizadas, etc.
Otra valoracin desde el cognitivismo sobre estos planteamientos la recoge
Zabalza (1989) que, en primer lugar, subraya cmo la evaluacin no debe ser un
hecho puntual; sino un conjunto de pasos que se condicionan mutuamente, se
ordenan secuencialmente, son un proceso, actan de modo integrado y consti-
tuyen un sistema. En segundo lugar, la evaluacin no se ha de separar del pro-
ceso de enseanza-aprendizaje, dado que no es un apndice independiente en
dicho proceso, sino que forma parte del mismo y tiene un papel especfico con
respecto al conjunto de componentes que integran la enseanza como un todo,
est en un sistema.
En el sistema educativo, la evaluacin ha de servir tambin para recabar y
analizar datos respecto de sus elementos relevantes: objetivos, medios que se
utilizan, tareas que se llevan a cabo en el aula, relaciones de comunicacin que
se establecen, organizacin, e incluso la propia evaluacin que se realiza. Y
como todo el proceso de enseanza est orientado a la consecucin de deter-
48 La evaluacin de aprendizajes

minados aprendizajes por parte del alumno, al evaluar stos, no slo algn tipo
de aprendizaje sino su desarrollo global, debemos valorar por aadidura su efi-
cacia como sistema total.
De evaluar restrictivamente conductas finales observables de los alumnos se
pasa as, desde posiciones cognitivistas, a planteamientos evaluativos globales
de cariz cualitativo; en donde la evaluacin se entiende ms como comprensin
profunda e iluminacin de las caractersticas de los alumnos, teniendo en cuen-
ta todas sus formas de representacin tanto en los procesos como en los pro-
ductos del aprendizaje.
Estas exigencias siguen aumentando hasta llegar a solicitar cada vez ms
informacin sobre aspectos de la personalidad del alumno, desde la perspectiva
de la Psicologa cognitiva y, desde la perspectiva sociolgica, sobre las circuns-
tancias que le rodean; y hasta reclamar una apertura conceptual que d cabida
en la evaluacin a resultados no previstos y acontecimientos imprevisibles. Esto
es, evaluacin ms all de los objetivos y de la realizacin correcta de una activi-
dad (exigencia que tiene sus races en la nocin vygotskyana del ZDp,citada en
el cap. 15), enfocada al tipo de ayuda que el aprendiz necesita. La dificultad de
explicitar todo ello para que no quede en una arbitrariedad subjetiva y en
estructurado para poder ser interpretado lleva en algunos casos al desaliento y,
en definitiva, al abandono de la toma de decisiones externa al alumno. El eva-
luador se tendr que limitar a recoger informacin de manera neutral para que
sean los interesados los que las tomen. Despus de tan largo camino, evaluar se
reduce a informar.
Desde la perspectiva cuantitativa, sin abandonar nunca la posterior toma de
decisiones externa, tambin se sinti la necesidad de ampliar el campo de las
informaciones, que se mantuvieron, no obstante, parceladas y operativizadas. A
esto responde la aparicin de taxonomas que distinguen mltiples capacidades
para fijar como eje de referencia aspectos de carcter cognoscitivo, psicomotriz
o afectivo.

* * *

Aun corriendo el riesgo de simplificar excesivamente la realidad y de dibujar


una caricatura, a veces ms expresiva que los detalles de una fotografa, ensaya-
mos una clasificacin de los anteriores enfoques y modelos de evaluacin en
dos grandes tendencias (un amplio y matizado estudio de los diversos enfoques
y modelos educativos se puede encontrar en R. Neira, 1999); bien entendido
que los rasgos que se atribuyen particularmente a ambas no significan en la rea-
lidad exclusin en la otra tendencia, sino nfasis propio.
Tendencia cuantitativa: Entre los autores que podemos encuadrar en esta
tendencia se encuentran Tyler,Thorndike, Skinner, Gagn, etc. Su enfoque edu-
cativo en general, y respecto a la evaluacin en particular, se enmarca dentro de
los siguientes rasgos caractersticos:
Evolucin del concepto de evaluacin educativa 49

a) El fin de la educacin es alcanzar un repertorio de objetivos explicitados,


preferentemente en los mbitos cognoscitivo y psicomotriz; teniendo tam-
bin en cuenta indirecta e implcitamente otros mbitos de la personalidad
individual y social que sirven de referente criterial externo a la evaluacin.
b) La organizacin escolar est orientada hacia una mayor eficacia, con
objeto de lograr mejoras progresivas en las metas y mtodos previamen-
te establecidos.
c) El currculo est centrado en la estructura de las disczplinas.
d) El profesor es un instructor especialista de su materia.
e) La funcin principal de la evaluacin es medir, jerarquizar y seleccionar,
dando prioridad al rigor sobre la riqueza evaluativa. Cada etapa educativa
se concibe como una preparacin para la siguiente; por lo que, a medida
que se va ascendiendo en el sistema educativo, la evaluacin va eliminan-
do alumnos hasta quedar pocos en el vrtice, en una concepcin pirami-
dal de la educacin.
La evaluacin es esencial para la educacin, porque:
Todo proceso es analizable y se puede descomponer en procesos ms
elementales, con su entrada y su salida. La educacin es un proceso, a
veces muy complejo, y nuestro conocimiento actual del mismo es muy
imperfecto; por lo que no sabemos analizado y, por tanto, somos incapa-
ces de medir todos sus productos.
En principio, se puede afirmar que al menos los productos importantes
de la educacin -los rasgos esenciales de los objetivos de aprendiza-
je- son medibles. Si es un producto importante, debe producir un
cambio de comportamiento observable: es decir, una persona que ha
cambiado considerablemente, debe comportarse de una manera clara-
mente diferente. Si es observable, es medible, es decir, existe una base
para medido; porque lo fundamental de toda medida es una observa-
cin verificable en relacin con un referente. Hoy tenemos instrumentos
para medir algunos aprendizajes, aunque nos falten an instrumentos, uni-
dad, escala, cero, etc., para otros.
A las objeciones y ataques que se suelen formular contra la evaluacin
cuantitativa, responden con diversos argumentos. Por ejemplo: decir
que lo que un alumno sabe y puede hacer es ms importante que una
calificacin, implica la afirmacin falsa de que la calificacin no tiene
relacin con lo que sabe y puede hacer el alumno; y decir que los ex-
-~s no tienen valor educativo implica que las calificaciones deriva-
das de los exmenes no tienen relacin con las metas y objetivos pro-
puestos como sntesis de la educacin deseada.
La realioad, concluyen, es que los exmenes, y en general los instrumentos
de la evaluacin, ayudan a calificar,y la calificacin pretende ser un resumen de
los resultados de un proceso de aprendizaje, es decir, la valoracin del estado
50 La evaluacin de aprendizajes

interno del alumno, la medida de lo que es, sabe y puede hacer, indispensable
para una toma de decisiones adecuada.
Tendencia cualitativa: Entre los autores de esta tendencia se encuentran
Dewey, parlett, Stake, Stenhouse, etc. Su enfoque educativo en general, y res-
pecto a la evaluacin en particular, se enmarca dentro de los siguientes rasgos
caractersticos.
Los cuatro primeros apartados recogen algunas de las ideas que ya en abril
de 1952 intent exponer Rogers en la Universidad de Harvard. La conferencia,
que se hizo famosa aunque dur apenas 10 minutos, tuvo la virtud de exasperar
a los presentes ya muchos de los que luego tuvieron la oportunidad de enterar-
se de su contenido, y por ello se conoce como la bomba pedaggica de
Rogers.
a) El fin de la educacin es el desarrollo personal y social, hasta alcanzar
autoestima y seguridad, para llegar a un bienestar. El referente evaluador
no est siempre explicitado de forma plena y total, acentuando la liber-
tad de! sujeto y dejando un amplio margen a la subjetividad.
b) La organizacin escolar est orientada a favorecer laflexibilidad en pro-
gramas, objetivos, mtodos, etc.
c) El currculo est centrado en el cliente; el alumno, en sus necesidades
individuales, sentimientos, intereses, estilos de aprendizaje, etc.
d) El profesor es e! motivador yfacilitador de todo e! proceso de aprendi-
zaje.
e) La funcin principal de la evaluacin es la de diagnosticar y servir de
feedback para mejorar el rendimiento, dando prioridad a la riqueza
sobre el rigor evaluativo. Se concibe la educacin como permanente en
un sistema cerrado del que nadie sale. En vez de seleccionar, la evalua-
cin busca las condiciones que capaciten a cada individuo a alcanzar su
techo de desarrollo.
Por e! contrario, la evaluacin educativa clsica ejerce una influencia distractora
y hasta nociva sobre alumnos, profesores y el proceso de aprendizaje, porque:
En todo sistema fsico (partculas) o social (personas), cuando se introdu-
ce un elemento extrao para medido, se perturba, y puede llegar a des-
truir e! sistema. Ejemplos son e! termmetro que modifica la temperatura
de un vaso de agua, e! encuestador que distorsiona con su mera presencia
los comportamientos de los encuestados o e! examen para e! alumno.
Adems, los comportamientos mejores no se pueden describir porque
apenas si son observables; slo se miden los resultados menos nobles
de la educacin porque suelen ser ms fcilmente observables.
El individuo es capaz de dirigirse a s mismo, y de encontrar en su pro-
pia naturaleza su equilibrio (homeostasis) y sus valores, sin que nadie
decida por otros. Ponen el ejemplo de la nutricin infantil.
Evolucin del concepto de evaluacin educativa 51

La alienacin fundamental del hombre consiste en no ser fiel a s mis-


mo. Para agradar, para conservar la atencin de los dems, el hombre
llega a falsificar su experiencia; queda alienado por intentar adaptarse a
valores que no son los suyos. El alumno acta en los exmenes para
agradar a otros, sus padres y profesores.
En resumen, concluyen que para educar no se deben emitir juicios de valor:
no a los exmenes y a las calificaciones. Por la misma razn se deberan derogar
los diplomas en tanto que ttulos de competencia, indicadores del fin o conclu-
sin de algo que por definicin es un proceso continuo y sin fin, el aprendizaje.
Profesores, alumnos y evaluadores deben sentirse libres en el grupo para expo-
ner su punto de vista y sus ideas, pero sin imponerlas a los dems y sin temor a
ser rechazados. Por el contrario, la enseanza debe centrarse en los intereses de
los dems, y la evaluacin debe reducirse a la informacin y diagnstico de la
realidad escolar.

* * *

En un intento de buscar las claves que permitan explicar las diferencias y


entender mejor estas dos tendencias que hemos polarizado para un mayor con-
traste, aunque ya hemos dicho que es difcil establecer una lnea divisoria tan
neta, podemos hacer una reflexin sobre los aspectos ms subrayados en cada
una de ellas.
A veces se pueden confundir medida y prediccin (toda decisin lleva
implcta una prediccin). No es lo mismo medir la creatividad, la motivacin, el
inters, y por supuesto unos resultados en mbitos ms familiares como el cog-
nitivo y psicomotriz, que predecir, a partir de esta medida, los efectos que se
producirn en el futuro. Y la misma prediccin tiene diversos alcances: en tiem-
po, a corto (para la prxima evaluacin) ya largo plazo (para el resto de la vida
del alumno); y en profundidad, reducindose a comportamientos escolares
ms concretos o llegando a los ms humanos, personales y sociales.
La divergencia entre las dos tendencias extremas e incluso las matizaciones
intermedias que puedan hacerse, pueden atribuirse a que la cuantitativa se
fija preferentemente en la medida y en una prediccin a corto plazo (por ejem-
plo, para la prxima evaluacin, para el prximo parcial, para el prximo cur-
so), que ven como posible: S a la evaluacin, porque es posible medir apren-
dizajes; y la cualitativa en la prediccin a largo plazo (por ejemplo, para su
vida profesional), que ven como imposible: No a la evaluacin, o ms exacta-
mente, no a la evaluacin cuantitativa porque no podemos predecir nada y
menos imponer nuestras decisiones a otros; hay que inventar una nueva
evaluacin.
DejandQ aparte los planteamientos maximalistas de los que eliminan la valo-
racin, los juicios de valor externos, la toma de decisiones sobre otros y redu-
cen la evaluacin al acopio de informacin neutral, creemos que la evaluacin
52 La evaluacin de aprendizajes

educativa comprende ambos aspectos: evaluar es medir, y evaluar es predecir,


aunque ms bien a corto y medio plazo. Por lo que optamos por centrar la eva-
luacin no exclusivamente en la medicin de los resultados finales, sino en la
recogida de informacin sobre todas las variables cognitivas y afectivas que
intervienen en el proceso de aprendizaje -y en concreto sobre la capacidad de
atencin (selectiva y sostenida), los niveles de comprensin (conocimientos
previos y estrategias de representacin y de estructuracin de la informacin) y
aplicacin, as como sobre la expresin (oral y escrita) yel recuerdo a largo pla-
20-, como subrayan las tendencias cualitativas, pero cuantificadas en una
medida, como reclaman las tendencias cuantitativas: todo ello encaminado a
una toma de decisiones posterior a la medicin, con objeto de lograr una opti-
mizacin, tanto del proceso como de los resultados finales del aprendizaje. De
aqu que proponemos y adoptamos como definicin de evaluacin educativa la
siguiente: Proceso sistemtico, e integrado en la actividad educativa que
mide lo ms exactamente posible el estado actual del alumno, incluyendo
logros, estrategias de aprendizaje, factores personales y ambientales, etc., que
influyen en dicho aprendizaje, con objeto de llegar a una toma de decisiones.

La evaluacin educativa es la medida o comprobacin del gra-


do de consecucin de objetivos, lo que comporta una recogida
de informacin para emitir un juicio de valor codificado en una
calificacin, con vistas a una toma de decisiones.

En los captulos siguientes profundizaremos en estos tres elementos que


constituyen la evaluacin educativa: recogida de informacin, con un estudio
detallado de los distintos tipos de pruebas o instrumentos para recoger dicha
informacin, calificacin y toma de decisiones.
NOI)VINHO:lNI
I 510
VOI~O)E1H -1
NOI)V)nOEl
I NEIVOIOElIN V1
Existe un relativo escepticismo sobre la medida en la educacin. Esta actitud
viene en parte justificada por cierto rechazo ante el uso de conceptos estadsti-
cos que alejan a algunos profesores de su estudio y tambin porque, en muchos
casos, se mantiene la creencia de que en educacin la medida slo puede apli-
carse a aspectos poco importantes y no a atributos sutiles y cualidades esencia-
les. Las dificultades, sin embargo, que entraa la medida educativa pueden y
deben solucionarse satisfactoriamente, pues todo profesor necesita hacer medi-
das para apreciar la calidad de los aprendizajes de sus alumnos (Pidgeon y Yates,
1976). Para abordar el estudio de los dos primeros elementos de la evaluacin,
recogida de informacin y calificacin, que en conjunto constituyen la medi-
da, es conveniente hacer una transferencia clara del concepto de medida de las
ciencias empricas y de las matemticas a las ciencias sociales en general, y a la
educacin en particular. Por tanto, empezaremos recordando algunos de sus
aspectos fundamentales.
Variable: En primer lugar, debe tenerse en cuenta que todo aquello que
vara cualitativa o cuantitativamente es susceptible de ser medido. Es decir, se
podrn medir propiedades tales como la raza, la belleza, la temperatura o la lon-
gitud, siempre que en un momento dado se concreten en un elemento del con-
junto en que puede existir dicha propiedad, que llamaremos variable. Por ejem-
plo, la variable belleza se concreta en personas que son muy bellas, poco bellas;
la longitud se concreta en segmentos de 1,2 o 3 metros.
Defmicin de medida: De una manera descriptiva podemos decir que
medir es asignar a cada elemento de un conjunto un valor, numrico o no
numrico, y slo uno. As, si por un lado tenemos segmentos de distinta longi-
tud y, por otro, una serie de nmeros (1, 2, 3, 4), medir es asignar al primer seg-
mento el 1, al segundo el 2, y as sucesivamente. Esta asignacin suele hacerse
fijando, previa y convencionalmente, un origen o cero y una unidad o patrn,
para poder emitir un juicio comparativo entre cada segmento y dicha unidad.
En el diagrama siguiente, se fija de modo convencional el origen en el punto
O, y se llama 1 a la distancia OX; a partir de este momento, y por comparacin,
ya podemos asignar nmeros y, por tanto, medir los segmentos OY=2, OZ=3,
XY=l, XZ=2, YZ=1.
56 La evaluacin de aprendizajes

o x y z

Estas medidas son, en definitiva, juicios en los que se afirma que dichos seg-
mentos son iguales o dos/tres veces mayores que el patrn unidad.
Propiedades de la medida: En toda medida, si podemos realizar con las
variables unas ciertas operaciones, las propiedades de estas ltimas deben con-
servarse tambin en los nmeros que representan las medidas. Estudiaremos,
sin embargo, slo las dos que nos interesarn cuando hagamos las aplicaciones
a la medida en educacin.
1. Propiedad de orden: Si una cualidad es ms intensa que otra, los nme-
ros que representan estas cualidades deben ser tambin uno mayor que otro.
Por ejemplo, la medida de un segmento S) es 4, y la de otro S2es 2; si el pri-
mer segmento es mayor que el segundo, sus medidas tambin deben serio:

meS)) = 4 m(S2) = 2
meS)) > m(S2) 4 >2
[meS) es la medida del segmento S]

2. Propiedad de unin: Es la segunda propiedad de la medida que interesa


tener presente. El resultado de la unin o suma de las cualidades que no tengan
elementos comunes debe ser igual al resultado de la unin o suma de sus medidas.
En el ejemplo de los segmentos, si se unen dos de ellos no superpuestos, se
obtendr otro cuya medida es igual al resultado de sumar las medidas de los
segmentos originales:

meS)) + m(S2) =4 + 2 = m(S3)


[mS3 es la medida del segmento unin de SI y S2]

Escalas: Son escalas los distintos modos de asignar nmeros. Para medir las
variables, segn su naturaleza, hay que utilizar diferentes tipos de escalas, que
no siempre cumplen las dos propiedades mencionadas. Por tanto, nos interesa
destacar la clasificacin de las escalas de medida, indispensables para clarificar
posteriormente el concepto de medida en educacin.
La medida en educacin. 1. Recogida de informacin 57

1. Escala nominal: En la escala nominal, a cada elemento de un conjunto,


es decir, a cada concrecin de la cualidad variable, se le asigna un valor (numri-
co o no numrico). Esta asignacin significa que a elementos distintos corres-
ponden medidas (nmeros o smbolos) distintas. En las medidas que utilizan
esta escala, no se cumple la propiedad de orden y mucho menos la de unin.
Esta escala puede servir para clasificar.
Por ejemplo, para medir la variable raza, se
Blanca -----0._ O oB utiliza la escala nominal, en la que se puede asig-
--~.- IoN nar a la raza blanca el valor O (o B), Y a la raza
Negra
negra el valor 1 (o N); el OY el 1 no pretenden
significar que una sea mayor o superior a la otra.
2. Escala ordinal: Cuando se mide con la escala ordinal, tambin se asigna
a cada elemento un nmero (u otro smbolo no numrico); pero aqu un nme-
ro mayor que otro indica que la cualidad que representa sea tambin mayor o
superior. Se cumple en esta escala la propiedad de orden, pero sigue sin cum-
plirse la de unin.
Por ejemplo, para medir la variable belleza
se utiliza la escala ordinal. Se asigna a la persona m (Persona A) = 3 o M
ms bella el nmero 3 (o el smbolo M = Muy m (Persona B) = 2 o R
bella), ya la menos bella el nmero O(o el sm-
m (Persona C) = 1 o P
bolo N = Nada bella). Los elementos del con-
junto, las personas, aparecen ordenadas -pro- m (Persona D) = O o N
piedad de orden- de ms a menos bellas.
Sin embargo, la diferencia de belleza entre las personas a las que se les asig-
na el1 yel 2 no tiene por qu ser igual a la diferencia entre las que miden 2 y 3.
Tampoco el asignar un Osupone carencia total de belleza. y desde luego, no tie-
ne sentido el sumar la belleza de dos personas, como no lo tiene el sumar sus
medidas. En resumen, se cumple la propiedad de orden, sin que los intervalos
sean iguales, pero no se cumple la propiedad de unin. Esta escala puede servir
para ordenar.
3. Escala de intervalo: Coincide con la escala ordinal, pero aqu la igual
diferencia entre nmeros indica igualdad de diferencia de cualidad.

Podemos citar como ejemplo la escala de grados


m (TI) = 40 Celsius para medir temperaturas. Si las temperaturas de
m (T2) = 30 cuatro lquidos son de 40, 30, 20 Y10, aparecen ordena-
m (T3) = 20 das cumplindose la propiedad de orden; pero, ade-
ms, la igual diferencia entre 40 y 30, entre 30 y 20 Y
m (T4) = 10 entre 20 y 10 indica tambin igualdad de diferencia
entre sus temperaturas.
Como en la escala ordinal, el hecho de asignar a un lquido el valor O no
quiere decir que carezca de nivel trmico. Y tampoco se cumple la propiedad
58 La evaluacin de aprendizajes

de unin, pues no tiene sentido sumar temperaturas de los lquidos; si mezcla-


mos los dos primeros lquidos, evidentemente no se obtiene un lquido de tem-
peratura 40+30. Esta escala, que tambin sirve para ordenar, tiene en cuenta la
proporcionalidad.
4. Escala de cociente o razn: Las medidas en esta escala cumplen ambas
propiedades, de orden y de unin: la igualdad de diferencia entre dos medidas
indica igualdad de diferencia de cualidades, y el Osignifica carencia de atributo.
Sea la longitud. Al medir segmentos, se obtienen medi-
m (L1) =4 das de 4, 3, 2 Y 1, que los ordenan, segn la propiedad de
orden, de mayor a menor. La diferencia entre e! primero y
m(Lz)=3
el segundo, 4 y 3, es la misma que entre el segundo y el
m (L3)=2 tercero, 3 y 2. Si se unen el primero y el segundo, se obtie-
m (L4) = 1 ne un nuevo segmento cuya medida es 4+3, cumpliendo
la propiedad de unin. Adems, el valor O significa carencia
de longitud.

1. APLICACIONES A LA EDUCACiN

A continuacin estudiaremos cules de estos aspectos, propiedades y escalas,


podemos aplicar a la medida educativa para sacar las conclusiones oportunas.
Variables en educacin: Aprender es un cambio, continuo y con cierta
estabilidad, de unas estructuras y esquemas cognitivos previos, lo que permite
modificar y ampliar los conocimientos existentes para abordar otros aprendiza-
jes. Se enmarca dentro de una secuencia que pasa por tres momentos: recep-
cin, manejo e integracin de la informacin. El momento de la recepcin exige
que e! aprendiz preste atencin, el manejo de la informacin supone unos ade-
cuados conocimientos previos, as como estrategias adecuadas para estructurar
la informacin y, por ltimo, tarea esencialmente personal de! alumno, la inte-
gracin de la informacin en los esquemas preexistentes, lo que implica su
modificacin y ampliacin para poder ser aplicados de nuevo (lvarez y Soler,
1999).
Aque!, o aquello, que no puede cambiar no es sujeto de aprendizaje. Por tan-
to, es claro que e! aprendizaje tiene algo que ver con alguna variable. Es difcil
establecer si esa variable es e! estado interno de! aprendiz o alguna otra cualidad.
Sin embargo, como en cualquier caso, e! comportamiento o respuesta del alum-
no en los mbitos cognoscitivo, psicomotriz y afectivo es el indicador o expresin
externa observable de aquella variable, cualquiera que sea, se puede tomar e!
comportamiento observable como la variable de la medida en educacin.
En resumen, postulamos que, en e! contexto escolar, slo podemos llegar a
la variable educativa, el estado interno, a travs de! comportamiento externo
del aprendiz; aunque somos conscientes de que a cada estado interno del
La medida en educacin. 1. Recogida de infonnacin 59

aprendiz le puede corresponder un conjunto de comportamientos observables


(no diferenciables significativamente). De forma grfica puede expresarse de la
siguiente manera:

el . . k3,
k2, k'2' k"2
kp k'p
k'3' k"l
k"3

e2 .
e3

e n .. k,n k' n, k" n

Por ejemplo, la amplia gama de comportamientos (kl' k\, k\) que supone
hacer sumas disponiendo los sumandos de diversas maneras, realizando los clcu-
los por diversos procedimientos, etc., la relacionaramos con un estado interno
(el) del alumno; el hecho de que realice multiplicaciones tambin de diversas
maneras (k2, k'2, k"Z) lo asociaramos con otro estado interno del aprendiz (ez);
y as sucesivamente.
Variable y objetivo: Cada familia de comportamientos tambin se relacio-
na con un objetivo. Grficamente:

el . kp
k2, k'2'
k3, k'3'
k\, k"2."
k'\ .
k"3 01
03
O2
e2
e3 ..

Por ejemplo, la familia de comportamientos ~ (kl' k\, k"l) supone la consecu-


cin del objetivo (al) Sumar nmeros reales; la familia~, el objetivo (02) Mul-
tiplicar nmeros reales; la familia IS, el objetivo (03) Dividirnmeros reales.
Variable y aprendizaje: Si, como origen de la medicin, se fija un estado
inicial a travs de su correspondiente familia de comportamientos asociados:

eo" ko, k'o, k"o

y si los comportamientos Kl son la consecucin del primer objetivo al' los


comportamientos ~ la consecucin del segundo objetivo Oz, y as sucesiva-
mente de todos los objetivos formulados en una programacin, entonces el
cambio de comportamiento desde ~ a Kl' a~, etc., es la expresin observable
de la consecucin de los objetivos al' 0Z' etc., o tambin el indicativo de la dis-
60 La evaluacin de aprendizajes

tancia que queda por recorrer para alcanzados; como aparece en el siguiente
esquema:

(eO,el) . (~,kl) . 01
(eo,e) '111( . (~,kz) '111( . 0z
(eO,e3) . (~,k3) . 03

Cambio y medida: Si a cada par de estados, representados por sus indica-


dores observables, se le asigna un valor, estamos formulando un juicio, es decir,
estamos realizando una medida.
Por ejemplo, al alumno que alcanza el objetivo 1 se le asigna un 5 o un SF; si
alcanza el objetivo 2, un 7 o N; y si el objetivo 3, un 10 o SE:

5 7 10

Propiedades de la medida en educacin: De las dos propiedades de la


medida que citamos anteriormente, en educacin nunca se cumple la de unin,
y solamente a veces la de orden.
Sumar no se puede unir a multiplicar, ni tiene sentido el asignar un 5+ 7 al
que es capaz de realizar ambas operaciones. En consecuencia, no se cumple la
propiedad de unin, ya que no tiene sentido sumar estados internos, ni sus
comportamientos asociados, ni sus medidas.
Por otro lado, la propiedad de orden
slo se cumple cuando un objetivo supo- < <
ne los anteriores. En el caso ya tantas I el ez e3

veces citado, saber dividir (03) supone K < Kz < ~


ser capaz de multiplicar (Oz) , ya la vez 1
saber sumar (1), Grficamente, se 01 < 0z < 03
puede expresar con los esquemas
siguientes:
En este y pocos casos ms, se da una ordenacin inclusiva y se cumple la
propiedad de orden. En la mayora de los casos, los objetivos no tienen relacin
entre s o estn slo parcialmente solapados; por tanto, no se da dicha relacin.
Algunos ejemplos pueden ser:
La medida en educacin. 1. Recogida de informacin 61

MATEMTICAS: Calcular reas de figuras planas:

01: Crculo
Oz: Cuadrado

03: Rectngulo
04: Rombo
05: Trapecio
06: Sector circular
07: Corona circular
aa
O
LENGUA: Realizar composiciones escritas:

, 01: Descripcin
Oz: Narracin

VO
a-zlO
03: Dilogo
04: Cartas comerciales
05: Impresos

Las escalas en educacin: Puesto que en la medida educativa no se cum-


ple la propiedad de unin, no podremos utilizar la escala de cociente o razn;
no se pueden medir aprendizajes como se miden longitudes o masas. Por ahora
slo disponemos de dos escalas:
1. Escala ordinal o de intervalo: Slo en aquellos casos en que los objeti-
vos estn ordenados inclusivamente, es decir, cuando la consecucin de cada
objetivo lleva implcita la de los anteriores, y por tanto se cumple la relacin de
orden, est justificada la escala ordinal. Se puede asignar un nmero a cada par
de estados internos, o a cada par de sus indicadores.
Siguiendo con el ejemplo de las operaciones matemticas, los alumnos par-
ten de la situacin en que no saben operar (eN. Si el objetivo final es que
sean capaces de dividir nmeros reales, cuando con el cambio (e3/K) llegan a
divididos (03)' se les asigna 10 o SB; si su cambio de comportamiento va de
(eolKa) a (el/Kl) y son capaces solamente de sumados (01)' se les asigna 5 o SF;
en cuanto aprenden ms, cambien a (ez!Kz) y sean capaces de multiplicados
(Oz)' se les asigna un 7 o N.

(eO,el).ooI{ . (ko,kl) .. m(Ol) = 5 o SF

(eo,ez)" . (ko,kz)" m(Oz) = 7 o N

(eO,e3) (ko'~)" . m(O) = 10 o SB


62 La evaluacin de aprendizajes

Se est utilizando una escala ordinal, como la que se usa para medir la belle-
za. Sera ms discutible el uso de una escala de intervalo, como la utilizada para
medir temperaturas, ya que sera difcil sostener la igualdad de distancias entre
(er!Ko) H (e!K) H (e/Kz) H (e31Ks).En estos casos de inclusividad de los
objetivos, est justificado utilizar los cdigos tradicionales de O a 10 o de sus-
penso a sobresaliente de una escala ordina!.

O/l/suspenso 5/S/aprobado 7/N 10/S8



r

2. Escala nominal: En educacin, en la mayora de los casos no se cumple


la relacin de orden; por consiguiente, no queda otra alternativa que utilizar la
escala nominal; es decir, medir cada objetivo (O, O') por separado independien-
temente de los dems, codificndolo con 1/0, Apto/No Apto, Adquirido/NO
Adquirido. Si los alumnos saben calcular el rea del tringulo (Objetivo O) se les
asigna Apto; si no saben calcular el rea del crculo (Objetivo O') se les asigna
No Apto, que no tiene relacin con el anterior.

(eo,ej) =} (ko,k) =} O = 1/0 o Apto;No Apto

(Eo,Ej) =} (Ku,Kj) =} O' = 1/0 o Apto;No Apto

o Media ponderada

Recordemos que evaluar es medir para tomar decisiones y, a su vez, medir es


recoger informacin para emitir un juicio de valor, codificado generalmente en
una calificacin. Uno de los secretos de las buenas calificaciones es que estos
juicios de valor se basen en una abundante observacin controlada; dado que la
carencia de una buena informacin, o la que se reduce a la constatacin de
comportamientos aleatorios de los alumnos, convierte las calificaciones en
meras opiniones de los profesores. Una observacin controlada de los resulta-
dos vlidos y fiables necesita, pues, de un planteamiento sistemtico de los
diversos instrumentos de evaluacin.
Un resultado deducido de una buena observacin controlada y sistemtica,
cuando se aplica una escala ordinal o nominal, no ofrece dificultades especiales
de interpretacin para emitir un juicio de valor; sin embargo, en ocasiones hay
que globalizar varios resultados, obtenidos a partir de escalas nominales, en un
resultado nico. En estos casos, una solucin para poder hacer posteriormente
un juicio de valor es recurrir a la media ponderada, consistente en asignar un
La medida en educacin. 1. Recogida de informacin 63

coeficiente, igualo distinto, a cada objetivo que marque su peso especfico rela-
tivo; determinacin que, como cualquier otra, puede estar teida de subjetivi-
dad y restarle rigor.
Por ejemplo, si un alumno en una prueba no responde a las preguntas
correspondientes a los dos primeros objetivos, cuyos coeficientes son 10% para
el objetivo 01 y 30% para 02' pero lo hace a las de los dos ltimos, cuyos coefi-
cientes son 20% para 03 y 40% para 4, el resultado global [R] ser:

OBJETIVO (O) COEFICIENTE (P)

1 0,1 (10%) o
0,3 (30%) O
2
3 0,2 (20%) 10
4 0,4 (40%) 10

R= I p N = (0,1 x O) + (0,3 x O) + (0,2 x 10) + (0,4 x 10) = 6

Este 6" est ya afectado por los coeficientes. El rigor va quedando ms dete-
riorado en el caso de tener que hallar la media ponderada de resultados de par-
tes muy distintas de una materia, y ms aun si es de distintas asignaturas.
Es importante tener presente este modo de proceder cuasiautomtico, pero
subjetivo, para obtener los datos de la evaluacin educativa, con objeto de des-
mitificarlos de su aureola de precisin que con todo fundamento subrayan las
crticas conocidas. Porque la realidad es que muchos profesores, una vez que
llegan a un 4,5, se olvidan de sus ingredientes subjetivos y lo consideran como
los 4,5 m de longitud de una viga. Las medidas en educacin no son homog-
neas como las del orden fsico; difieren en las escalas y, por tanto, en la exacti-
tud de las unidades, en la situacin del cero, etc. Por todo ello, algunas de las
cosas que hacemos con los resultados de las correcciones de los exmenes,
tales como calcular medias, desviaciones, coeficientes de correlacin, slo tie-
nen sentido y valor si se las somete a una interpretacin adecuada. Es necesario
ser conscientes de las limitaciones de nuestras medidas, pero no por eso debe-
mos dejar de hacer lo que nos parece til; y una de esas cosas tiles es medir
los aprendizajes sin olvidar, no obstante, las licencias que nos tomamos.
Debemos tambin recordar que una misma medida puede representar
diversas cualidades (las familias de comportamientos antes mencionadas); un
4,5 no significa exactamente lo mismo en todos los alumnos.
Por ltimo, conviene reiterar una vez ms que la medida es un elemento de
la evaluacin, y la recogida de informacin es un aspecto de la medida, porque
a partir de ella debe emitirse un juicio de valor para poder tomar decisiones:
volver a estudiar la leccin, estudiar otros temas, pasar curso, repetir, etc. Y
deben tomarse no slo a partir del juicio o calificacin hecha con el resultado
64 La evaluacin de aprendizajes

numrico, sino de acuerdo, adems, con otros datos contextuales: aptitud,


situacin afectiva personal, etc. Por eso no se justifica la argumentacin de
muchos profesores cuando afirman: Siapruebo a este alumno con un 4,5, ten-
go que aprobar a todos los que lleguen a esta calificacin; porque, insistimos,
ni el 4,5 representa el mismo estado en todos los alumnos, ni los datos contex-
tuales que deben acompaar a la medida para tomar decisiones son los mismos
en todos los casos. El problema est en objetivarlos diferenciadamente.
La calificacin se tratar en el captulo 13 y la problemtica de la toma de
decisiones educativa en el 14. Ahora nos preocupa exclusivamente la recogida
de informacin y, en este sentido, son varios los mtodos para calcular una
media ponderada a partir de los resultados de varias respuestas; mtodos que,
por supuesto, y al igual que los objetivos, deben ser conocidos previamente por
los alumnos. Se dan varias opciones.
a) En primer lugar, se puede considerar que los resultados de cada prueba
[N] no son compensables y, en consecuencia, se requiera un mnimo,
por ejemplo de 5, en cada pregunta para calcular resultados.
Si Ni < 5, no se tienen en cuenta los resultados parciales superiores a
5 para calcular el resultado global, quedndose en O, en 1 o en 4
como mximo.
Si Ni ~ 5, se calcula el resultado global [R] por medio de alguno de
los procedimientos detallados en los casos siguientes de preguntas
compensables.
Si se considera, por el contrario, que los resultados parciales [N] son
compensables, el resultado global [R] se calcula por medio de la frmula
general: R = L (Pi X N), en donde R es el resultado global, P el coeficien-
te o peso atribuido a cada prueba, N es el resultado de cada prueba y
L la suma de los productos (P x N). Se contemplan varias posibilidades.
b) Las preguntas son equivalentes. Es el sistema ms simple y el ms fre-
cuentemente usado. Por ejemplo, en un examen de 4 preguntas: P1 = P2 =
= P3 = P4 = 25%, Yse da 10 a cada respuesta buena, 5 a las regulares y O
a las malas.
Si contesta todo bien: (0,25 x 10) + (0,25 x 10) + (0,25 x 10) + (0,25 x
x 10) = 10.
Si contesta dos bien y dos mal: (0,25 x 10) + (0,25 x 10) + O + O = 5.
Si contesta dos regular y dos mal: (0,25 x 5) + (0,25x 5) + O + O = 2,5.
c) Las preguntas no son equivalentes, ya que algunos profesores creen que
ciertos tems deben valer ms que otros porque controlan objetivos ms
importantes, tienen una mayor dificultad, son de mejor calidad o requie-
ren ms tiempo. En este caso, a cada pregunta se le asigna un coeficiente
segn un criterio que puede ser:
- Emprico: Basado en resultados tabulados de otros tems equivalentes.
La medida en educacin. 1. Recogida de informacin 65

- Estimado: Basado en la experiencia del profesor o, mejor, de varios


profesores.
- Establecido: No tiene en cuenta los resultados previos reales, sino
que se determina a priori segn el perfil establecido de competencia
que se supone debe poseer un especialista.

Por ejemplo, en un examen de 4 preguntas: P1 = 50%, P2 = 25%, P3 = 20%,


P4 = 5%:
Si contesta las dos primeras mal y las dos ltimas bien: + +
+ (0,2 x 10) + (0,05 x 10) = 2,5.
Si, por el contrario, contesta las dos primeras bien y las dos ltimas
mal: (0,5x10) + (0,25 x 10) + + = 7,5.
O tambin, en un examen de tems VerdaderolFalso y Eleccin Mltiple,
el profesor puede decidir que cada tem EM debe valer el doble que cada
tem VIF.

Por razonable que en apariencia parezca dar este peso diferente a cada pre-
gunta, algunos autores sostienen que tiende a tener efectos relativamente
pequeos y rara vez proporciona resultados ms vlidos o fiables. Los datos
de la tabla siguiente, tomada de Evaluation and Examination Service
(1982). (Evidence far nat weighting abjective test items, EES Memo n. 5I.
Iowa City, IA: University of Iowa), sobre los efectos de distintos pesos espe-
cficos de tems aplicados en cuatro exmenes, avalan esta afirmacin de
que no hay ventaja obvia cuando se usan pesos especficos distintos:

Examen 21
83
41alumnos
160
50
90
34
105
N N 8ien: especfico
tems
8(1-140)
8(1-45)
8(1-70)
Peso +4 Correlacin
===0,945
+1 0,976
00,983
+1
+1 ,923

En la tabla se recogen los pesos especficos diferentes que presentaron cua-


tro profesores para la correccin de sus exmenes. En la ltima columna,
aparece la correlacin entre los resultados obtenidos considerando las pre-
guntas equivalentes (pesos de + 1 y O) Y las corregidas usando los diversos
pesos especficos propuestos en la cuarta columna. El ordenamiento de los
66 La evaluacin de aprendizajes

alumnos fue prcticamente el mismo en todos los casos y las fIabilidades


Kuder-Richardson (Muiz, 2003) eran casi idnticas.
d) Otra propuesta para mejorar la fIabilidady validez de los resultados es fijar
un peso especfico diferente para cada distractor de las PO. Por ejemplo:
Un nio se qUf!jade dolor agudo y sensibilidad en el bajo abdomen, con nusea.
Qudebe hacer la madre?
a) Darle un laxante.
b) Meterlo en la cama.
c) Llamar al mdico.

Nota: Elegir la alternativa a) supone -1, la b) un Oy la c) un + 1.


Tambin en este caso los resultados experimentales han sido decepcionan-
tes, y pocas veces se han encontrado ganancias en fiabilidad y validez apre-
ciables y consistentes (Downey; 1979). Con el agravante de que, si la mayo-
ra de los profesores, aun especialistas, tienen sufIcientes dificultades para
construir buenos tems cuyas respuestas sean simplemente buenas o malas,
hacerlos con distractores de distinto valor parece una tarea imposible.
e) La mejora de exmenes a travs de la adicin de buenos tems equiva-
lentes les parece a algunos una propuesta ms prometedora. As, Sabers
y White (1969) afIrman que el clculo de la media ponderada supone un
esfuerzo que no merece la pena, ya que corregir sin estas diferentes pon-
deraciones ahorra tiempo y; adems, los resultados equivalentes son ms
fciles de interpretar. Proponen, en cambio, que se pueden obtener las
mismas ventajas aadiendo ms tems; es decir, si un examen cubre dos
objetivos, uno de los cuales se considera que es dos veces ms importan-
te -no precisamente ms difcil- que el otro, es preferible escribir ms
preguntas, por ejemplo el doble de tems, del ms importante. Esto dar
resultados ms fiables y vlidos que si se escribe el mismo nmero de
tems para cada objetivo, pero los del ms importante se valoran el
doble. Sin embargo, no est claro que el mismo argumento se pueda
aplicar a los objetivos ms complejos, para concluir que dar a los tems
ms difciles un valor extra rebaja la eficacia tanto del tem en particular
como la del examen en su totalidad.
Recogiendo las opciones anteriores, se puede concluir que una buena
regla para mejorar las pruebas es aumentar el nmero de las preguntas
ms importantes -lo que equivale implcitamente a una media pondera-
da- y;adems, no ponderarlas todas necesariamente de la misma forma;
todo ello condicionado al tiempo disponible para realizar el examen.

o Correccin del azar

En relacin con el peso de los tems, es necesario considerar la distorsin que


las respuestas acertadas por azar introducen en los resultados, aspecto ste
especialmente importante en las pruebas objetivas (cap. 4). Tal distorsin debe
67
La medida en educacin. 1. Recogida de informac~n

ser corregida con objeto de eliminar o reducir en lo posible la ganancia que


resulta de la adivinacin ciega. En otras palabras, se intenta no dar esperanza
de ventaja al alumno que adivina a ciegas sobre e! que no lo hace.
Supongamos que un alumno contesta a ciegas 100 tems V;F (Cap. 5). Pues-
to que hay slo dos posibles respuestas, una correcta y otra falsa, se puede
esperar que e! alumno podra acertar 50 por azar. Otro alumno, que no sabe
menos que el anterior pero que no se expone a adivinar a ciegas, no contesta
ninguna pregunta y, por tanto, recibe un O. Sin la correccin del azar, el resulta-
do del primer alumno sera mayor que e! de! segundo, cuando los dos debieran
ser iguales.
Para corregir el resultado conseguido por azar por e! primer alumno, es nece-
sario restar de su calificacin una cantidad igual a la que se espera que gane por
azar. Puesto que en un examen con tems V;F se puede esperar que el alumno
responda una cuestin mal por cada una que conteste bien, e! nmero de res-
puestas incorrectas se resta de! nmero de las correctas. Si las preguntas, en vez
de dos respuestas, tienen tres, se espera que el alumno d dos respuestas inco-
rrectas por cada una correcta; en este caso, para hacer la correccin del azar,
habra que restar, del nmero de respuestas correctas, la mitad del nmero de
respuestas incorrectas. Si los tems de EM (cap. 6) tienen cuatro posibles alterna-
tivas a cada pregunta con una correcta, la relacin de respuestas incorrectas a
correctas es de 3 a 1, y la correccin del azar exigira restar, de! nmero de res-
puestas correctas, 113 del nmero de respuestas incorrectas.
Esto nos lleva a la siguiente frmula general de correccin de! azar:
(En donde R es el resultado global, B es el nmero de tems
correctamente contestados, M los tems incorrectamente con-
R=B-~ testados, d el nmero de distractores u opciones de los tems,
d -1 Si se desea referir la nota a una escala de 10, basta con dividir
el resultado por el nmero total de tems de que se compone
el examen y multiplicado por 10.)
Es fcil ver que esta frmula se convierte en R=B-M en el caso de dos alter-
nativas (V;F), o R=B-M/3 en el caso de tems EM de cuatro alternativas.
En vez de penalizaD) al alumno que adivina, se podra premiar al alumno
que no lo hace; es decir, siguiendo con e! mismo supuesto, en vez de restar 50
unidades de! resultado de! que adivina a ciegas, se podran sumar 50 unidades al
resultado de quien no lo hace. Esto tambin eliminara la ventaja esperada de
adivinar a ciegas. La hiptesis en este caso es que, si el que no adivina hubiera adi-
vinado, dara la respuesta correcta a 1/2 de los tems V;F. En tems EM de tres
alternativas, el que no adivina dara respuestas correctas a 1/3 de los tems.
La lgica de esto lleva a otra frmula general para corregir el azar:
(En donde R' es el resultado global corregido de acuerdo con
R1 = B- O los tems omitidos, B es el nmero de respuestas correctas, O
d el nmero de tems omitidos, d es el nmero de distractores.)
68 La evaluacin de aprendizajes

De nuevo, la frmula se convierte en R'=B+O/2 en el caso de tems VIF,y


R'=B+O/4 en el caso de tems EM de cuatro alternativas.
Si se aplican las dos formas de correccin del azar a unos mismos resulta-
dos, se obtendrn resultados corregidos distintos, pero perfectamente correla-
cionados: a un resultado ms alto que otro obtenido por el primer mtodo,
corresponde tambin uno ms alto obtenido por el segundo. Sin embargo, el
valor medio (los de omisin sern mayores) y su variabilidad (los de omisin
sern ms variables casi siempre) sern diferentes.
Por otra parte, conviene sealar que, si no se omiten tems, los resultados
corregidos del azar mediante la resta de una fraccin de las respuestas incorrec-
tas correlacionan perfectamente con los resultados no corregidos; es decir, con
el nmero de respuestas correctas. Lo cual supone que la magnitud de los efec-
tos de una correccin del azar depende de la proporcin de tems omitidos. La
aplicacin de cualquiera de las dos frmulas slo tendra un efecto relevante si,
por parte de algn alumno, se omitiera un considerable nmero de tems.
Como los resultados en los que no se corrige el azar dan una especial venta-
ja al alumno arriesgado y listo,su validez como medida de logros de aprendi-
zaje disminuye. Sin embargo, en contra de lo que a veces se cree, la correccin
del azar no pretende penalizar al que deduce las respuestas, sino simplemente
anular la posible ventaja que pueda tener el alumno que adivina a ciegas sobre
el que no contesta tems por desconocer la respuesta. Si no se corrige el azar,
los alumnos expertos en hacer exmenes saben que no tienen nada que per-
der, y quiz algo que ganar, si intentan responder todos los tems. Por el contra-
rio, si se corrige, no respondern los tems en los que vean pocas posibilidades
de acertar.
Por ltimo, se sealan algunas consideraciones que deben tenerse en cuenta
al corregir el azar en pruebas objetivas:
a) La probabilidad de obtener un resultado alto adivinando a ciegas es
muy pequea. Nadie saca matrcula por casualidad.
b) Los alumnos mejor preparados tienden siempre a evitar la adivinacin a
ciegas. La correccin del azar evita o reduce la tentacin de adivinar tam-
bin en los alumnos mal preparados.
c) No hay que confundir la adivinacin a ciegas con la deduccin racional
de la respuesta correcta, adivinacin no a ciegas, que, como tal, se puede
recomendar a los alumnos.
d) Esta deduccin racional puede proporcionar una informacin til sobre
el nivel general de conocimientos de los alumnos.
La medida en educacin. 1. Recogida de informacin 69

INSTRUMENTOS DE EVALUACiN 2.

Se trata de estudiar los formatos o tipos de pruebas con los que se puede reco-
ger la informacin sobre el rendimiento de los alumnos. Ostedind (1998) defi-
ne instrumento de evaluacin como un instrumento de medida que propone
al alumno un estmulo y una forma prescriptiva de emitir una respuesta, a partir
de la cual se puede deducir la consecucin de un objetivo de aprendizaje; dicho
de otro modo, se entiende por instrumentos de evaluacin aquellos recursos
que, en diferentes situaciones, facilitan identificar modos de actuacin como
indicadores para medir el grado de consecucin de objetivos de aprendizaje.
Estas situaciones no deben limitarse a las pruebas orales y escritas. El recurso
ms tradicional o novedoso y e! indicio ms pequeo que ayuden a un docente
a comprender mejor a un alumno, o que ayuden a un alumno a comprenderse
mejor a s mismo, deben considerarse como vlidos, siempre que en alguna
medida puedan estimarse. Conviene, por tanto, esforzarse en obtener todos los
indicios a travs de todos los medios apropiados.
Dado que a los objetivos de aprendizaje no se accede de modo inmediato,
se usan instrumentos que proporcionen datos a partir de los cuales se pueda
inferir si el alumno los ha alcanzado. Los diversos modos de actuacin de los
alumnos servirn como indicadores del grado de consecucin de los objetivos,
aunque indicadores aislados no sirven para evaluar la complejidad del compor-
tamiento de un alumno. De ah la necesidad de ir integrando todas las informa-
ciones que se puedan obtener a travs de los diversos instrumentos de evalua-
cin; diferentes de las actividades de enseanza-aprendizaje en la medida en
que pretenden valorar el grado de consecucin de unos objetivos. Tanto unos
como.otras incluyen procesos mentales sobre contenidos cientficos, pero difie-
ren en e! fin para el que se usan: en un caso son estrategias de aprendizaje y en
otro, instrumentos de evaluacin que pretenden provocar una respuesta defini-
da de! alumno. Una situacin que supusiera cualquier respuesta, como en algu-
nos casos la observacin y las encuestas, permitira considerada como instru-
mento de evaluacin slo desde un punto de vista analgico.
Por tanto, la evaluacin de aprendizajes necesita una amplia gama de instru-
mentos -tests o exmenes compuestos por tems, preguntas o pruebas (trmi-
nos con significados diferenciados, pero que usamos indistintamente)-que
respondan a ciertas cualidades, con el fin de que los datos obtenidos puedan
valorarse y significar algo para e! propio alumno, para el profesor, para la institu-
cin educativa y para la sociedad que, en ltima instancia, ha establecido la
estructura educativa. Y no vale apelar a refugiarse en la connotacin peyorativa
que la palabra examen encierra para, por ello, estar en contra de los mismos;
porque todo profesor examina y califica.
Disear situaciones para comprobar la consecucin de objetivos de aprendi-
zaje es una tarea de gran importancia en educacin. Aunque siempre hubo y
sigue habiendo otros protocolos, esta tarea frecuentemente se reduce a cons-
70 La evaluacin de aprendizajes

truir preguntas de manera precisa y breve para poder deducir, de las respuestas
de los alumnos, conclusiones vlidas y fiables sobre la adquisicin de objetivos
referidos a capacidades de diversos mbitos, en especial los cognoscitivos. Es
una tarea difcil, entre otras razones porque, con frecuencia, los tems se redu-
cen a una simple frase que ofrece pocas oportunidades para describir un con-
texto que aclare su significado; por otra parte, tampoco es fcil establecer la
indispensable relacin entre pregunta y objetivo que reduzca las fuentes de
error y aumente la validez y fiabilidad de los resultados. Todo ello es un reto a la
creatividad y experiencia del profesor.
El anlisis de los exmenes corrientemente utilizados muestra que, a veces,
las preguntas adolecen de muchos defectos, entre los que podemos citar (Guil-
bert, 1989):
1. Futilidad: Se entiende por futilidad la poca importancia de las pregun-
tas. La prueba pierde utilidad cuando el nmero de preguntas que emplea cons-
tituya una pequea muestra de todas las posibles.
Ms grave es el conservadurismo que obliga al alumno a responder de acuer-
do con los prejuicios o incluso las posibles ideas desfasadas del examinador.
2. Ambigiiedad: La ambiguedad del lenguaje empleado puede hacer que
el alumno tenga que dedicar ms tiempo a la comprensin de la pregunta que a
respondeda, con el riesgo aadido de no contestar a lo que se le pide.
Esta ambiguedad resulta mayor cuando existen errores en la redaccin de
las preguntas, o cuando constituyen una trampa que enmascara datos necesa-
rios para dar la adecuada respuesta. Por otra parte, la formulacin defectuosa
delos tems puede dar pistasy sugerir las respuestas a los alumnos.
3. Complejidad: Por un lado, la complejidad de la materia puede hacer
que la bsqueda de la respuesta correcta suponga ms dificultad de la prevista.
Ms grave, sin embargo, es la complejidad de las instrucciones: ciertas pruebas
incluyen algunas tan complejas o variadas (cada pregunta lleva unas distintas),
que lo que se evala es mucho ms la aptitud del alumno para descifrar las ins-
trucciones que el nivel real de sus conocimientos y su capacidad para utilizados.
Esto es especialmente importante en las llamadas pruebas objetivas (PO).
4. xito en los exmenes: Sobre todo en las pruebas objetivas (PO), los
alumnos desarrollan un sexto sentido que les lleva a predecir las preguntas
que van a salir, su estilo, su forma, etc.
Otros alumnos, con la ayuda de una buena expresin escrita pero carente de
contenido, pueden disimular la ausencia de conocimientos y acabar por influir
en el corrector, hasta el punto de que ste juzgue las palabras y no los conoci-
mientos.
Para evitar estos y otros posibles defectos, es esencial que quien construye
una prueba, tanto si se trata de una prueba libre (PL) como de una prueba obje-
tiva (PO), la someta a un anlisis crtico y siga una serie de instrucciones.
La medida en educacin. 1. Recogida de informacin 71

Clasificacin: Los instrumentos de evaluacin de aprendizajes pueden cla-


sificarse segn diversos criterios. Si se tiene en cuenta la situacin en que se
encuentra el alumno en el momento de someterse al control, se pueden clasifi-
car en instrumentos directos, en los que se interrumpe el proceso de aprendi-
zaje (exmenes escritos, orales, etc.); yen instrumentos indirectos o circunstan-
ciales, con los que se evala la adquisicin de conocimientos sin interrumpir el
proceso de enseanza-aprendizaje (observacin espontnea o estructurada,
etc.).
El criterio ms frecuente de clasificacin, sin embargo, es la forma de las pre-
guntas del profesor, que condiciona la libertad que tiene el alumno para res-
ponder; segn esto, se distinguen las siguientes clases de instrumentos de eva-
luacin, que estudiaremos con detalle:

1. PRUEBAS OB]ETNAS (PO)


1.1. VERDADERO/FALSO (VIF)
1.2. ELECCIN MLTIPLE (EM)
1.3. V/F MLTIPLE (V/F mltiple)
1.4. RESPUESTAS COMBINADAS (Re)
1.5. EMPAREJAMIENTO (EP)
1.6. CLASIFICACIN (CL)
1.7. RESPUESTA DOBLE (RD)
1.8. RESPUESTA LIMITADA (RL)
1.9. PROBLEMAS CIENTFICO-MATEMTICOS (CM)
2. PRUEBAS LIBRES (PL)
2.1. RESPUESTAABIERTA (RA)
2.2. PRUEBAS MIXTAS (PM)
2.3. EXAMEN ORAL (EO)
2.4. PRUEBA PRCTICA REAL (PR)
2.5. PROYECTO (PY)
2.6. SIMULACIN (SM)
3. PRUEBAS DIAGNSTICO (PD)
3.1. OBSERVACIN (OB)
3.2. ENCUESTA (EN)

Segn esta ltima clasificacin, podra hablarse de un continuo desde las


pruebas objetivas (PO) hasta las pruebas diagnstico (PD). El constructor de un
test puede aumentar o disminuir la libertad del alumno para contestar. Cuanto
ms se limita la libertad, ms fiabilidad podr tener el test, y a la inversa. Los
tems podran entonces ordenarse a lo largo de este continuo: en un extremo
estaran las PO que imponen ms limitaciones; a continuacin los tems de res-
puesta limitada (RL) (clasificadas como PO, pero en las que el alumno tiene ya
que construir su respuesta) y las pruebas libres (PL); yen el otro extremo no
habra prcticamente limitacin, como es el caso de la observacin (OB) y las
72 La evaluacin de aprendizajes

encuestas (EN) que hemos llamado, a falta de un ttulo mejor, PD, pruebas en
sentido analgico, ya que en algunos casos se admite cualquier respuesta.

LIMITACIONES . LIBERTAD

P. Objetivas R. Limitada P. Libres P. Diagnstico

En los captulos siguientes se hace un estudio pormenorizado de cada uno


de estos instrumentos de evaluacin.
SltAI~5Ir80 Slt851nHd
Las pruebas objetivas (PO) tienen como denominador comn que el alumno,
previa elaboracin mental acompaada a veces de una construccin material,
elige la respuesta entre una serie de alternativas que se le proporcionan.
Son muchas las crticas a las PO, aunque la mayora se reducen a malentendi-
dos en casos aislados que se transmiten de unos a otros y se perpetan. Dichas
crticas raramente vienen avaladas por datos experimentales sin prejuicios, a
pesar de que estos datos seran relativamente fciles de obtener. Profesores con
experiencia han demostrado repetida y continuamente que un experto puede
transformar en PO casi todos los exmenes que se ponen en nuestras aulas; y
que las PO, lejos de disminuir la capacidad discriminativa de los tems y la fiabili-
dad de las calificaciones, las aumentan. Por ello, en gran parte, carecen de senti-
do muchas de las crticas atribuidas vulgarmente a las PO. Una buena revisin
puede consultarse en el libro de Phelps (2005).
1. Artificialidad: Todo examen al uso supone siempre cierta artificialidad.
Por esta razn algunos proponen, como alternativa a las pruebas escritas, la rea-
lizacin de pruebas reales (PR). Sin embargo, dichas propuestas pocas veces
consideran el costo en tiempo y personal que implica llevar a cabo el proceso,
la fiabilidad de las calificaciones y otras limitaciones inherentes a la tareas de las
PR, lo que las hace inviables en la mayora de los casos.
Dentro ya de las pruebas escritas, no es cierto que las PO favorezcan slo, ni
especficamente, la memorizacin de detalles triviales: las PO pueden presentar
problemas nuevos que deben resolverse mediante la comprensin y aplicacin.
Adems, no es defendible la posicin maniquea de que el aprendizaje o es
memorstico o es significativo; por otra parte, el aprendizaje memorstico no es
divertido, promete premios poco duraderos, por lo que, a poco que se haga, la
mayora de alumnos y profesores tienden espontneamente a evitado.
Por todo ello, al menos hay que poner en entredicho la crtica de que las PO
facilitan al alumno acotaciones, simplificaciones y otras ayudas que las reducen
a medir exclusivamente conocimientos artificiales, alcanzados slo mediante
alguna forma de aprendizaje memorstico.
2. Seleccin versus construccin: La mayor parte de las buenas PO
requiere que el alumno, mediante un pensamiento creativo y original, desarro-
76 La evaluacin de aprendizajes

lle los fundamentos para elegir entre las varias alternativas que se le presentan.
Por ello, si las PO estn bien construidas, no permiten responder correctamente
a partir slo del mero reconocimiento, de la memoria rutinaria o de la asocia-
cin verbal no significativa.
No est claro que el proceso mental resultara diferente si no se sugirieran
respuestas y si la tarea pedida fuera la produccin material de una respuesta, no
la eleccin de la que es correcta. Producir una respuesta no es necesariamente
una tarea ms compleja y ms difcil, o ms indicadora de los logros, que esco-
ger la mejor de las alternativas disponibles (Quellmalz et al., 1980). Hogan
(1981), a travs de una revisin de la investigacin relacionada con la compara-
cin entre las respuestas abiertas (RA) y las PO, desde Patterson (1926) hasta
nuestros das, lleg a la siguiente conclusin: "En la mayora de los casos, se
encontr que las medidas obtenidas a travs de RAy PO eran equivalentes, o
casi equivalentes, definidas por su intercorrelacin, dentro de los lmites de
sus respectivas fiabilidades. Ms an, las medidas de PO no slo son conside-
rablemente ms fciles de calificar, sino que casi siempre son ms fiables que
las de las RA. Sin embargo, a pesar de las abrumadoras pruebas empricas de
las conclusiones recogidas por Hogan, muchos profesores continan ignorn-
dolas y persisten en la creencia de que en sus particulares situaciones las RAy
las PO producen medidas de cualidades completamente distintas.
Por todo lo anterior, se pueden cuestionar en gran medida las crticas de que
en las PO, al sugerir posibles respuestas, es el profesor quien hace la parte ms
importante de la tarea; de que el alumno realiza una actividad menos vlida, al
limitarse a seleccionar una informacin sin construida; de que, finalmente, las
PO sean ms superficiales y menos realistas para evaluar el conocimiento que
los exmenes clsicos, llamados tcnicamente respuestas abiertas (RA).
3. Adivinanza: Es preciso subrayar que el azar de que caiga lo que el
alumno sabe -azar siempre implcito en la eleccin de toda muestra de pre-
guntas que el profesor selecciona para todo tipo de exmenes- afecta ms a
las pruebas libres (PL), pues los exmenes clsicos tienen menos preguntas;
mientras que las PO se prestan mejor a hacer un barrido ms amplio de la
materia de examen.
Respecto del azar ms tpico de las PO, el derivado de adivinar la respuesta,
hay que distinguir entre adivinanza informada y adivinanza ciega. La primera
proporciona indicaciones vlidas de logros: cuanto ms sepa el alumno, es ms
probable que sus conjeturas informadas sean correctas. En cuanto a la segunda,
los alumnos muy motivados, en una prueba de dificultad adecuada y con tiem-
po suficiente, harn pocas adivinanzas ciegas en un examen de PO; pues saben
que, por poco que piensen, esto es ms seguro y rentable que adivinar ciega-
mente la respuesta correcta. Adems, Ebel (1968) y Hills y Gladney (1968)
demostraron que, para comprobar la consecucin de logros, las calificaciones
en el intervalo del azar no son significativamente diferentes de aquellas otras
libres del azar.
Pruebas objetivas 77

As pues, la opinin de que las PO estn sometidas a grandes errores por la


conjetura y la adivinanza hay, al menos, que considerada con muchas reservas.
4. Coste: Las PO son un instrumento costoso para grupos pequeos de
alumnos. Se aconsejan sobre todo cuando hay que evaluar una poblacin
numerosa de alumnos, y se consideran casi imprescindibles en situaciones en
que no coinciden el que ensea, el que construye la prueba y el que la corrige.
* * *

Aun los mayores entusiastas de las PO no defienden que sean perfectas.


Admiten, como lo hacemos nosotros, que pueden tener ciertas deficiencias y
que, en general, no son tan fiables ni tan significativamente discriminantes
como debieran ser. Pero estamos persuadidos de que no se debe abandonar su
uso hasta que se encuentre un recambio con menos defectos.
La relacin entre el proceso de construccin de un test y su validez es com-
pleja. Aunque las normas para construir tems no sean por s mismas aval sufi-
ciente, s son un marco que facilita la construccin de tems de calidad que pro-
porcionen interpretaciones vlidas.
El proceso de construccin de cualquier formato de tem, que debe proponer-
se de tal manera que un profesor preparado pueda seguido y repetido, debe
empezar por la explicitacin de lo que se va a comprobar, es decir, la variable que
se quiere medir. Como en un contexto acadmico se har una valoracin criterial,
esta variable es un objetivo de aprendizaje explicitado a travs de unos indicado-
res observables (la problemtica de la programacin, en general, y de la formula-
cin de objetivos, en particular, se puede encontrar en lvarez, Soler, Gonzlez-
Pienda, Nez y Gonzlez-Castro, 2004). Aunque es sta una condicin obvia, es
una de las ms difciles de cumplir, por lo que es frecuente que los profesores la
ignoren o afirmen que los objetivos los tienen implcitamente en su mente; pero
es imprescindible tambin explicitados antes de establecer las preguntas. Poste-
riormente, supuesto el objetivo, a la hora de formular las preguntas, en la prctica
suele ser ms fcil usar los materiales de enseanza (libros, apuntes, etc.) como
fuente de ideas que deducidas directamente de los objetivos de aprendizaje.
Conseguir el mximo de relacin entre el tem y el objetivo evaluado, rela-
cin que influye directamente en la validez y fiabilidad de los resultados obteni-
dos, no es fcil. Determinada requiere, adems de dominar la materia y la
expresin, un gran conocimiento de los aspectos psicolgicos de la capacidad
medida. He aqu algunos ejemplos que ponen de manifiesto esta falta de rela-
cin entre tem y objetivo:
al. Un metro de un cierto tejido cuesta 3 . 'Cuntos euros cuestan 5 m?
a) 8
b) 10
* c) 15
d) 35
78 La evaluacin de aprendizajes

a2. Un metro de un cierto tejido cuesta 3 euros. Cuntos euros cuestan 500 cm?
a) 0,8
b) 1
* e) 1,5
d) 3,5

Nota: Si se trata de evaluar el objetivo comprender el concepto de propor-


cionalidad directa, valdra el al, pero no el a2, que requiere adems el conoci-
miento de unidades.

b1. Considerar el siguiente diagrama para responder la pregunta:

Qu clase de imagen aparece en el dibujo?


a) Real
* b) Virtual
e) Negativa
d) Fragmentada

b2. Considerar el siguiente diagrama para responder la pregunta:

Qu clase de lente producir los rayos representados?


a) Convexa
* b) Cncava
e) Pigmentada
d) Polarizada

Nota: En los tems b1 y b2, adaptados de Osterlind (1998, pg 108 de la 3a


reimpresin de 1994), si el objetivo evaluado es clasificar lentes, slo el b2, que
pregunta sobre las clases de lente, es vlido; el b1 interroga sobre la imagen,
por lo que est relacionado con otro objetivo.
Otras veces la falta de relacin entre tem y objetivo se debe a imprecisiones
en la expresin. Por ejemplo:
el. Lee el prrafo y contesta la pregunta siguiente:
Pruebas objetivas 79

Todos alabaron su estudio sobre el hombre porque era realmente comprensivo,


porque trataba ampliamente e integraba muy diversos aspectos de la personali-
dad humana, de las grandezas y debilidades del hombre.
Qusignifica el trmino comprensivo?
a) Que es tolerante
b) Que incluye
c) Que es sensible
d) Que conoce

Nota: No est claro si lo que se pretende es comprobar si se conoce el signi-


ficado de una palabra o la capacidad de determinar su significado en un contex-
to. La palabra comprensivo en su acepcin ms comn hace referencia a la
tolerancia, pero en este contexto se refiere a la idea de inclusin.
Las PO presentan diversos formatos, de los que analizaremos con ms deta-
lle el verdadero/falso (y1F) y eleccin mltiple (EM); posteriormente, citaremos
otros tipos de PO.
OS'V:l/OH5IOVOH5IA
SV851nHd
Los tems verdadero/falso (V/F) se conocen tambin como respuestas de dos
alternativas; en ellas el alumno califica la formulacin de una proposicin
como verdadera [V]o falsa [F]. Un ejemplo:
al. Con respecto a nuestro planeta, la atmifera es su:
1. Envoltura area [F]
2. Envoltura gaseosa '" [V]
3. Soporte qumico [F]
4. Eifera de vapor [V]
5. Esfera tropocoidea [F]

A primera vista, las preguntas o tems V/F pueden parecer ms fciles de lo


que realmente son. La razn por la que algunos tienen a los tems V/F en baja
estima es porque creen que existen mtodos mejores para medir aprendizajes.
Juicio no compartido por muchos especialistas, que consideran los tems V/F un
instrumento simple y directo para medir objetivos esenciales de la educacin
formal; lo argumentan diciendo que la mayora del conocimiento humano est
expresado a travs de proposiciones, de las que se puede decir que son verdade-
ras o falsas. Muchas veces el dominio que un alumno tiene de un rea particular
de conocimiento queda patente por su capacidad para juzgar la verdad o false-
dad de las proposiciones relacionadas con el rea en cuestin.
A veces se altera el protocolo y se proponen, como sugiere Goring (1971),
alternativas a V/F tales como:

a2. Contestar con S/NOa la pregunta siguiente:

Esmenor (1- ~r ~r que (1- ? .


[S/NO]

a3. Ante cada una de las afirmaciones siguientes, contestar con H si se trata de
un hecho, y O si se trata de una opinin:
Republicano es el sistema de gobierno imperante en Francia [H/O]
84 La evaluacin de aprendizajes

1. CONSTRUCCiN

A. Proceso: El proceso de construccin de tems VIF,de manera anloga a la


de otros formatos, se puede resumir en los cuatro pasos siguientes:
1. Objetivo: Es imprescindible tener a la vista la variable u objetivo de
aprendizaje que se quiere evaluar.
2. Fuentes de las preguntas o tems: Como se dijo al hablar en general
de las PO, suele ser ms fcil usar los materiales de enseanza (libros, apuntes,
etc.) como fuente de ideas para las preguntas, que deducidas directamente de
los objetivos de aprendizaje. Por ejemplo, una fuente podra ser el siguiente
prrafo de un libro (Fernndez, 1982: 195):'
Desde el siglo XVI el Japn est gobernado por un schogn, cargo asignado a la
familia de los Tokugawa, (..) mientras los emperadores viven arrinconados, en
una especie de exilio dorado, en su palacio de Kyoto. El Japn vive una larga
poca feudal, con unos seores poderosos, los tokugawa y grandes vasallos, los
daimios. El pas se cierra a toda influencia occidental, a cualquier innovacin
econmica o cambio social. Algunos elementos de transformacin, como la con-
versin de los samurais o guerreros en una elite intelectual, el surgimiento de
una economa monetaria ( ..) y la penetracin de algunos elementos occidenta-
les, (..) no son suficientes para alterar una sociedad inmvil, ajena y hostil a la
evolucin del mundo.

3. Proposiciones: A partir de la informacin que ofrecen estos materiales


instruccionales, debemos seleccionar una muestra de las ideas ms representi-
vas, es decir, hacer un resumen en unas pocas proposiciones.
Por ejemplo, en el prrafo anterior, se pueden identificar las dos proposicio-
nes siguientes:
El schogunato supone en elJapn:
- Una etapa de rgimen feudal, donde elpoder imperial no tiene eficacia.
- Una sociedad inmvil, ajena y hostil al mundo exterior.

4. Formulacin de los tems: Hay que empezar formulando dos expre-


siones paralelas y opuestas de cada aspecto, es decir, transformar las proposi-
ciones seleccionadas en pares de posibles tems VIF, uno verdadero y otro falso,
para luego seleccionar uno.
As, a partir de cada proposicin seleccionada puede formularse una gran
variedad de tems VIF.Si no son la mera reproduccin de las frases originales,
los tems pueden evaluar algo ms que la memorizacin vaca de lo estudiado.
He aqu algunos tems formulados a partir de las proposiciones del prrafo
anterior:
al. El schogunato, por s mismo, no limit la eficacia del poder imperial
japons [F}
a2. El schogunato limit la eficacia del poder imperialjapons [V}
Pruebas verdadero/falso 85

bl. Generalmente el schogunato supuso en elJapn una sociedad unida


por intereses nacionales [F]

b2. El schogunato supuso para elJapn una sociedad dispersa en intereses


particulares [V]

B. Instrucciones: Estas instrucciones pueden referirse a la presentacin


de las preguntas y de las respuestas de los alumnos, a la duracin del examen, al
rigor en las expresiones cientficas, etc. Las instrucciones claras son tanto ms
necesarias cuanto menor sea el nivel de desarrollo del alumno. En todo caso,
no es necesario repetidas en cada examen; cada profesor, al principio del pro-
ceso de instruccin, marca las reglas del juego.
C. Normas: Discriminar entre los que saben y los que no saben es la nor-
ma bsica para lograr que los tems cumplan lo mejor posible su cometido. Los
que saben deben ser capaces de responder a las preguntas correctamente. Los que
no saben deben encontrar las respuestas errneas atractivas. Construir tems
que discriminen de esta manera exige una cierta especializacin. A ello pueden
ayudar las siguientes sugerencias, agrupadas en tres apartados: cualidades que
deben tener las ideas recogidas en los tems V/F, homogeneidad de las expresio-
nes y otros recursos tiles.
1. Cualidades de las ideas: Son sugerencias sobre los contenidos que se
recogen en los tems.
1.1. Ideas importantes: Las proposiciones deben ser el reflejo de aspec-
tos importantes de algo que merezca la pena saber. He aqu tems V/F que ilus-
tran esta cualidad; los primeros son aceptables, los segundos pobres:
al. El toro es un smbolo fundamental de la poesa amorosa de Miguel
Hernndez, hasta el punto de identificarse plenamente con l en
algunos poemas """""""""."""."""".""."""""""""" [V]

a2. Miguel Hernndez trabaj en Madrid como ayudante de Jos Mara


de Cossioen la enciclopedia taurina que preparaba para la editorial
Espasa-Calpe """"""'''''''''''''''''''''''''' [V]

Nota: La referencia biogrfica de trabajar con Cosso en la enciclopedia taurina


es poco relevante para la potica de Miguel Hernndez; sin embargo, el toro como
smbolo potico es bsico para comprender parte de la mejor obra hernandiana.
bl. Se puede disolver ms azcar en un litro de agua caliente que en un
litro de agua fra """'" "'''''''''''''''''''''' [V]

b2. Algunas sustancias se pueden disolver en otras [V]

Nota: Afirmaciones como la b2 son demasiado generales como para decir


algo til; el tem bl, por el contrario, se ofrece como una buena pregunta para
controlar la comprensin de una importante relacin.

1.2. Comprobacin de capacidades cognoscitivas: Examinar el apren-


dizaje significativo es comprobar el dominio que una persona tiene de una
materia. Por otro lado, dominar una materia no es almacenar una coleccin mis-
86 La evaluacin de aprendizajes

celnea de elementos separados, sino integrados en una estructura que se pue-


da usar para tomar decisiones, sacar conclusiones lgicas o resolver problemas.
Que el alumno recuerde simplemente palabras sin significado, frases vacas o
aprendidas rutinariamente, no debe ser suficiente para permitir que pueda dar
una respuesta correcta. Es un error bastante extendido el creer que los tems
V;F slo pueden comprobar la memorizacin de datos como los siguientes:

al. Un cuerpo sumergido en un fluido experimenta una fuerza hacia


arriba igual al peso delfluido desplazado [V]

a2. Un cuerpo sumergido en un fluido experimenta unafuerza hacia


arriba igual a la mitad del peso delfluido desplazado [F]

Nota: Estos tems, que presentan al alumno expresiones usuales como afir-
macin verdadera o alguna alteracin como afirmacin falsa, se pueden apren-
der de memoria, por lo que son indicadores de una simple memorizacin vaca.
Por el contrario, los tems siguientes usan como indicadores de la compren-
sin de un principio que se reconozca en algunas parfrasis no usuales:
b1. Si un objeto con un determinado volumen se rodea de un lquido o gas,
lafuerza que experimenta hacia arriba es igual al peso del volumen
del lquido o gas [V]

b2. Lafuerza hacia arriba sobre un objeto rodeado por un lquido o gas es
igual al rea de la superficie del objeto multIPlicada por la presin del
fluido que lo rodea [F]

Como alternativa para comprobar la comprensin, se puede pedir al alumno


que lo identifique en una situacin concreta:
c1. Lafuerza de empuje sobre un cm3 de plstico es exactamente igual a
la que hay sobre un cm3 de hierro, cuando ambos est sumergidos
en~ M
c2. Si un objeto insoluble se sumerge en variosfluidos de diferente
densidad, la fuerza de empuje sobre dicho objeto variar de manera
inversamente proporcional a la densidad de losfluidos [F]

Con este formato tambin se pueden presentar problemas difciles que exi-
jan una capacidad de aplicacin compleja; por ejemplo:
d1. El trmino siguiente en la serie 3, 4, 7, 11, 18 es 29 [V]

d2. Si los lados de un trapecio son nmeros enteros consecutivos, y si el


lado menor es uno de los dos ladosparalelos, entonces el rea del
trapecio es 18 unidades cuadradas [V]

1.3. Respuesta defendible: Las afirmaciones verdaderas, as como las fal-


sas, deben ser hechas de tal modo que los expertos no tengan problema alguno
en distinguidas. Por ejemplo:
Se conoce como germanias al:
al. movimiento de tipo social de la regin valenciana durante los
primeros aos del siglo XVI [V]
Pruebas verdaderoljalso 87

a2. hermanamiento que se estableca generalmente entre los nobles


valencianos durante la baja Edad Media [F]

Nota: Evidentemente, no hay posible discusin sobre la veracidad o falsedad


de estos tems, ya que las germanas, tanto en Valencia como en Mallorca,
tuvieron un carcter eminentemente social, -no as las comunidades de Casti-
lla, cuyo carcter era ms bien poltico-, adems de suponer un enfrentamiento
entre stas, formadas por artesanos, y los ricos burgueses y la pequea nobleza.
S es cierto, empero, que el trmino germana significaba hermandad, pero
esto no es suficiente, por s mismo, para hacer verdadera la opcin a2.
Hay que evitar, en todo caso, tems que puedan plantear una discusin. Por
ejemplo:
a3. Las estrellas emiten luz que parpadea [?]

Nota: Una persona bien informada puede juzgarlo como falso porque no es
la luz enviada por las estrellas la que parpadea; sino que, a causa de las pertur-
baciones en la atmsfera, la luz de las estrellas parece que parpadea.

1.4. Respuesta no obvia: Para responder correctamente debe necesitarse


un conocimiento especializado, no debe ser algo de sentido comn. A un alum-
no sin conocimiento adecuado, una respuesta falsa de un tem bien construido
debe parecerle tan plausible como una verdadera. La respuesta correcta debe
parecer obvia slo a aquellos que dominan la materia del examen. He aqu un
tem de sentido comn:
al. Los alimentos congelados de alta calidad pueden estropearse al
cocinarlos [V]

Nota: Quin puede dudar de la posibilidad de cocinar mal cualquier tipo de


alimento? El tem es tan obviamente verdadero, que no permite discriminar
logros de aprendizaje altos o bajos; suena a frase introductoria de captulo de
libro que se va a desarrollar posteriormente.
Esta norma aparece ms claramente ilustrada en los tems siguientes:
a2. Aadiendo soluto, una disolucin saturada sepuede convertir en
sobresaturada [F]

a3. Una disolucin sobresaturada contiene ms soluto por unidad de


volumen que una disolucin saturada [V]

Nota: Parece razonable creer que, aadiendo ms soluto a una disolucin satu-
rada, se puede conseguir una sobresaturada (a2). El que ha estudiado el tema
sabe que el solmo que se aade a una disolucin saturada no se disuelve; slo
evaporando el disolvente o enfriando, se puede conseguir que una disolucin
saturada pase a sobresaturada. El alumno que contesta nicamente por sentido
comn lo har de manera errnea. Sin embargo, el mismo sentido comn induce
al alumno mal preparado a contestar correctamente el tem a3, por lo que no
cumple de forma adecuada la funcin de comprobar el aprendizaje.
88 La evaluacin de aprendizajes

Desde el punto de vista opuesto, se puede usar una lgica superficial para
enmascarar la respuesta correcta, o incluso sugerir la incorrecta. Por ejemplo:
a4. Unapelota de goma de lOOg flota sobre la superficie de una piscina de agua
de manera que exactamente la mitad est sumergida. Para sumergirla completa-
mente se necesita unafuerza adicional hacia abajo de 50 g [F]
Nota: La pelota, de 100 g de masa, est sumergida hasta la mitad, lo que da a
la mitad de 100 una verosimilitud superficial considerable. La verdad es que si
su peso, provocado por los 100 g, la sumerge hasta la mitad, se necesitarn
otros 100 g para sumergida toda.

2. Homogeneidad: Se recogen las sugerencias sobre la necesaria homoge-


neidad, tanto externa como interna, de las expresiones.
2.1. Concisin: La idea debe expresarse sin ambigiledades ni imprecisio-
nes de lenguaje; debe reducirse a una sola proposicin con oraciones cortas y
tan simples, concisas y claras como lo permitan las recomendaciones anterio-
res. Debe, adems, tener un significado completo, dependiendo totalmente del
contenido interno, no del contexto externo, que en este formato no suele exis-
tir. Por todo lo cual, cada palabra del tem es importante.
Un tem que se centra en un solo objetivo es generalmente ms conciso, y
por tanto ms fcil de entender y ms eficaz para evaluado, que el que se basa
en varios. A esto se debe que el primero de los siguientes sea ms fcilmente
inteligible que los otros dos:
al. La sal disuelta en agua sepuede recuperar evaporando el disolvente . [V]

a2. La sal se disuelve en agua caliente y sepuede recuperar evaporando


el disolvente [V]

a3. La sal se disuelve en agua caliente; el azcar en aguafra [V]

2.2. Determinantes especficos: Los profesores sin experiencia suelen


usar palabras extremas como siempre o nunca en las afirmaciones falsas,
mientras que usan atenuantes tales como <<algunos, con frecuencia o <<general-
mente en las afirmaciones verdaderas. Resultan, as, expresiones que ayudan a
los expertos en hacer exmenes a contestar bien aun desconociendo la materia.
Laverdad es que trminos tales como alguno y generalmente proporcio-
nan datos irrelevantes en las proposiciones verdaderas; pero, en las falsas, indu-
cen respuestas incorrectas en los alumnos mal preparados.
Por el contrario, expresiones tales como todo o nunca en afirmaciones
verdaderas pueden inducir, tambin, respuestas incorrectas de los alumnos mal
preparados.
Teniendo todo esto en cuenta, se recomienda usar estos trminos al revs,
para confundir a los expertos en hacer exmenes, es decir, formular afirmacio-
nes que, acompaadas de siempre o nunca, sean verdaderas y otras que,
acompaadas de generalmente o con frecuencia, sean falsas. As:
Pruebas verdaderoljalso 89

al. Las afirmaciones verdaderas, generalmente, discriminan ms que las


falsas [F]

a2. El schogunato, con frecuencia, alent elpoder imperialjapons [F]

a3. El trmino germana, en la regin valenciana y durante el siglo XVI,


siempre signific hermandad .................................................................. [V]

Nota: Evidentemente, lo que discrimina en un examen son las respuestas fal-


sas, ya que las respuestas contestadas como verdaderas por todos los alumnos
manifiestan el elemento comn, no el discriminatorio, entre ellos. Por otro
lado, el shogunato, como hemos visto anteriormente en el texto de Fernndez
(198Z), lejos de alentar el poder imperial japons, lo arrincon en una especie
de exilio dorado. En cambio, los tems anteriores, formulados con las expresio-
nes generalmente (al) y con frecuencia (aZ), les dan cierto aire de veracidad
que ayuda a atraer hacia ellas a los expertos en tems. En cambio, en el ltimo
(a3), el aadido siempre, por su connotacin absoluta, les har dudar de su
veracidad.

3. Recursos: Se recogen otros recursos para formular tems V/F.


3.1. Frases familiares: En las afirmaciones falsas es conveniente usar fra-
ses familiares que suenen a verdad. En este sentido, las expresiones por s mis-
mo, muy poco o nada dan un tono de sinceridad y correccin a la afirma-
cin que oculta su falsedad al que no sabe. La falsedad de las siguientes
proposiciones se basa precisamente en este recurso:
al. Los versos de arte menor son los usados por poetas menores o de
segundo orden [F]

a2. Todosintagma, por s mismo, es una unidad de comunicacin con


sentido completo [F]

3.2. Preconceptos: Hacer que la respuesta falsa recoja algn preconcepto


o creencia popular incorrecta sobre el tema de la pregunta.
La ansiedad de los alumnos en los exmenes disminuye la eficacia de un
test como instrumento para medir logros [F]

Nota: Muchos alumnos sienten ansiedad en los exmenes, pero a la mayora


esto les ayuda, ms que impide, a ejecutarlos con su capacidad mxima.

3.3. Evitarnegaciones: El tem no debe incluir una negacin artificial. Las


afirmaciones esencialmente verdaderas no deben convertirse en falsas aadien-
do simplemente una negacin. Un no aadido artificialmente puede pasar
inadvertido. Por otra parte, las frases negativas suelen crear ms confusin que
las afirmativas. Por ejemplo, la negacin aadida al tem aZ lo hace innecesaria-
mente ms confuso que el al:
al. El soneto estformado por dos cuartetos y dos tercetos [V]

a2. El soneto no estformado por dos cuartetos y dos tercetos [F]


90 La evaluacin de aprendizajes

3.4. Ms aftrmaciones falsas que verdaderas: Conviene saber que, en


caso de duda, los alumnos tienden a aceptar ms que a rechazar las afirmacio-
nes; por lo que las afirmaciones falsas, ms que las afirmaciones verdaderas,
suelen discriminar a los alumnos que saben de los que no saben CBarkery Ebel,
1981). Por consiguiente, parece que debe incluirse una mayor proporcin de
afirmaciones falsas, quiz hasta un 60 o 70%. Aunque los alumnos conozcan esta
regla, la tcnica produce sus frutos.
Como consideracin final a estas sugerencias, debemos recordar que un
profesor no hace exmenes para que los alumnos contesten mal; lo que se pre-
tende es conseguir una correcta discriminacin entre los que dominan y no
dominan una determinada materia. La nica razn por la que un profesor utiliza
estos recursos, que hacen las respuestas incorrectas atractivas a los que no
saben, es que las respuestas correctas indiquen verdaderamente el logro que
intentan evaluar.

2. APLICACiN

Consideradas las ventajas e inconvenientes que ofrecen estas pruebas V/F, con-
viene recordar las circunstancias que potencian su aplicacin.
Aunque tem por tem los V/F tienden a no discriminar entre alumnos de
alto y bajo rendimiento acadmico, en conjunto, una hora de examen con bue-
nos tems V/F suele ser tan efectiva como con otros formatos, como los EM
CEbel, 1980). Por consiguiente, se deben aplicar cuando se dispone de poco
tiempo para preparar un examen, ya que los V/F son relativamente fciles de
escribir, al reducirse a referencias sencillas que se suelen comunicar sobre la
materia en una clase oralmente o por escrito.
Sin embargo, estas pruebas V/F deben evitarse en las siguientes circunstancias:
a) Cuando no se puedan controlar razonablemente las consecuencias de la
adivinanza. No obstante, la influencia de la adivinanza ciega disminuye confor-
me el examen tiene ms tems; la probabilidad de conseguir una calificacin
moderadamente buena, digamos de 70, en un examen de 100 tems V/F por adi-
vinacin slo ciega es menor de 1/1.000. Los exmenes acadmicos de 100
tems V/F han mostrado unos coeficientes de fiabilidad de 0,85 y 0,95. Esto avala
la conclusin de que buenos tests V/F no tienen por qu verse viciados por el
azar CEbely Frisbie, 1977).
b) Cuando se limiten a comprobar la memorizacin de datos triviales; ya
que en este caso los alumnos se concentran en recordar datos aislados con un
aprendizaje memorstico rutinario, ms que en un aprendizaje significativo para
comprender y desarrollar un pensamiento crtico. En favor de esta censura, se
citan tems tpicos del formato V/F como los siguientes:
Pruebas verdaderoljalso 91

al. El autor del Quijote es Cervantes [V]

a2. Lafrmula qumica del agua es HP [V]

a3. En el Sistema Solar hay seisplanetas [F]

Nota: Si fueran estas las nicas preguntas que se pudieran hacer con tems
V/F, ciertamente seran de poco valor. Sin embargo, como qued claro al hablar
de las normas de construccin, es posible hacer preguntas que controlen la
capacidad de los alumnos para memorizar datos significativamente, compren-
der conceptos y principios, e incluso aplicados.
e) Cuando no se pueda evitar la ambigiiedad. La ambiguedad no es un
defecto inherente a los tems V/F. Ms an, debemos distinguir entre ambigue-
dad intrnseca y ambiguedad aparente.
La ambiguedad aparente puede deberse a errores en el conocimiento de los
alumnos. Este tipo de ambiguedad es no slo inevitable, sino que puede ser
til, haciendo que la tarea de responder sea ms difcil para el mal estudiante
que para el bien preparado, lo que ayuda a discriminar entre los dos.
La ambiguedad intrnseca, que causa dificultades tanto al experto como al
aprendiz, es posible que no siempre pueda ser eliminada, puesto que a veces el
lenguaje conlleva cierto grado de imprecisin; pero en las formulaciones utiliza-
das en los tems V/F debe ser reducida al mximo.
Por supuesto que es verdad la acusacin de que hay tems V/F ambiguos y
carentes de significacin. Una causa puede ser que los profesores a veces
extractan frases de los libros de texto para usarlas como tems; y; sin embargo,
aun en un libro de texto bien escrito, pocas de sus frases tomadas literalmente
se podran convertir en buenos tems, ya que muchas de ellas se limitan a reco-
ger la estructura y la organizacin del discurso. Otra es caer en la imprecisin
por querer llevar hasta el lmite la norma de la concisin y ser excesivamente
breves: la brevedad imprecisa lleva a peores consecuencias que la verbosidad
clara. Escribir buenos tems V/F es ms una tarea de construccin creativa que
de mera copia.
Hay que prevenirse contra una gran fuente de ambiguedad: la incertidum-
bre, por parte tanto del alumno como del profesor, de los estndares de la
verdad en este tipo de tem. Un tem con una idea no completa, con algn tipo
de carencia, no tiene por qu considerarse falso. Si el profesor consigue comu-
nicar este extremo, por ejemplo en las instrucciones generales de los procedi-
mientos que va a usar en la evaluacin, y el alumno lo comprende y acepta
como una regla ms del juego, la tarea del examinador ser ms fcil y habr
ms posibilidades de enriquecer las pruebas de evaluacin en general, y los
tems V/F en particular, con afirmaciones verdaderas que no son completas. No
obstante, hay que evitar afirmaciones que caigan en una zona indefinida entre la
verdad y la falsedad. Por ejemplo:
al. El sujeto concuerda en nmero y persona con el verbo [V]
92 La evaluacin de aprendizajes

Nota: Esta afirmacin se considera por generalizacin como verdadera o


aceptablemente verdadera, no siendo completamente cierta; pues, por ejem-
plo, en una oracin copulativa con el verbo ser, ste puede concordar con el
atributo, no con el sujeto: Eso son habladuras.
a2. El verbo referido a dos o ms sujetos singulares unidos por la
conjuncin disyuntiva oconcierta en plural con todos ellos [?]

Nota: Esta afirmacin sera inaceptable, pues queda indefinida entre verda-
dero y falso; dado que, sin ser falsa (Le atraan la belleza o la dote de la
joven), el verbo tambin puede concordar en singular (Le atraa la belleza o la
dote de la joven), expresando en uno y otro caso un matiz de estilo, segn se
sienta la disyuncin. Incluso, a veces, la conjuncin o no tiene un valor pro-
piamente disyuntivo, sino aclarativo o explicativo, con lo que el verbo ha de
concordar en singular (El protagonista o personaje principal de la pelcula
hace una gran interpretacin).
Otra fuente de ambiguedad es el hecho de que en los tems V/F las afirma-
ciones generalmente son absolutas sin un contexto que las matice, y los alum-
nos tienen que buscar puntos de referencia alternativos en su estructura men-
tal. El tem V/F que dice: ElAneto es una montaa alta lleva al alumno a
buscar picos altos, de manera que la altura del monte Aneto se pueda juzgar en
relacin con las alturas de otras montaas. En este caso, yen muchos otros si se
cree conveniente, es sencillo liberar los tems de toda ambiguedad introducien-
do explcitamente una comparacin dentro de la pregunta. As, por ejemplo:
al. El monte Aneto es una montaa alta [?]

a2. El monte Aneto es una montaa ms alta que el Naranjo de Bulnes [V)

O tambin:

bl. Las tareas que se hacen en casa son de mayor calidad [?]

b2. Las tareas que se hacen en casa son de mayor calidad que las hechas
m~ M
d) Cuando se estime que perjudican el aprendizaje. Los crticos de los
tems V/F afirman que su uso tiene efectos nocivos para el aprendizaje, por
varias razones.

En primer lugar, dicen que la manera categrica con que se presentan y cali-
fican las respuestas puede proporcionar al alumno la falsa nocin de la simplici-
dad del conocimiento, al establecer dicotomas artificiales para su valoracin.
En segundo lugar, acusan a las preguntas V/F de exponer al alumno al apren-
dizaje de conocimientos errneos. La presentacin de afirmaciones falsas como
si fueran verdaderas puede tener el peligro de exponer al alumno a los errores,
facilitando as que los recuerden. Sin embargo, Ross (1947: 349) concluy que
los efectos de sugestin negativa en los tems V/F son mucho menores de lo
que a veces se presume y que quedan ampliamente compensados con los efec-
Pruebasverdaderoifa~o 93

tos positivos, cuando afirma: Que lasfalsas afirmaciones sean peligrosas o no


depende en gran manera del contexto en que se presentan. Una afirmacin
falsa en un libro de texto, hacia el que la actitud tpica de cualquier alumno
es de aceptacin pasiva y acrtica, puede ser muy seria. Pero la situacin es
diferente con los tems V/E En stos, la actitud de los alumnos es de reto activo
y crtico". A ello se aade elfeedback de la correccin.
Resumiendo, pues, podramos decir que los tems V/F, bien construidos,
pueden contribuir, como las otras PO, a evaluar logros educativos.
i'dl.L,nW
.1 NOI))i'i
.1
iO SY8inHd
I
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
J
Los tems de eleccin mltiple (EM) son pruebas en las que el alumno debe
slo seleccionar una de entre un conjunto de posibilidades limitadas.
En su forma ms completa constan de unas instrucciones; un dibujo, grfico
o texto con la informacin necesaria; una base o enunciado, que presenta un
problema, con una frase incompleta o preferentemente una pregunta; una serie
de alternativas, es decir, distractores o respuestas plausibles incorrectas, y la res-
puesta correcta. Las alternativas pueden ser frases completas, fragmentos de
oraciones o incluso palabras aisladas o nmeros. Un ejemplo, adaptado de
Osterlind (1998, pg. 35 de la Y reimpresin de 1994), de las distintas partes de
untem EM:
INSTRUCCIONES: Usar el dibujo explicado en el texto para contestar la pre-
gunta.
DIBUJO:

r~JJI~lllJ,,,_
TEXTO: Se hizo un experimento que consisti en hacer flotar un
cuentagotas en un frasco lleno de agua. Al cabo de una
hora, se anot el nivel que haba alcanzado el agua dentro
del cuentagotas, A continuacin se calent el frasco
durante 30 segundos,
BASE: Qu van'able se modific en el expen'mento?
DISTRACTORES: a) Laforma del cuentagotas.
b) El nivel de agua en elfrasco.
c) El intervalo de tiempo entre la toma de temperatura.
RESPUESTA: d) La temperatura del aire y del agua en elfrasco.

Con frecuencia no son necesarios tantos detalles, por lo que el tem se pre-
senta en forma abreviada, con la base o enunciado y las alternativas (a veces
tambin se les llama distractores, aunque es mejor reservar este trmino para
las respuestas incorrectas).
98 La evaluacin de aprendizajes

BASE: De las actividades que realiza el profesor, cul pertenece


a la evaluacin?

DISTRACFORES: a) Seleccionar contenidos.


b) Formular objetivos.
c) Elegir metodologa.

RESPUESTA: d) Recoger datos del proceso educativo.

Existe una serie de variedades, entre las que citamos las siguientes:
Escoger la nica respuesta correcta: Es la variedad ms popular y acon-
sejable.
al. Qu es la neviza?
a) Polvo de nieve cado en el mismo da.
b) Una variante del hielo cristalizado.
* c) Nieve comprimida que se hace hielo.
d) La abrasin del hielo cristalizado.

En muchas de las ms importantes preguntas que se pueden hacer, es preferi-


ble formular no una nica respuesta correcta (dado que a veces es difcil, dentro
de los lmites razonables de un tem EM, formular esa nica respuesta absoluta-
mente vlida), sino la mejor respuesta, la ms correcta o la ms completa en la
gradacin de respuestas vlidas que se presenta. As pues, las alternativas pueden
contener alguna correccin o relevancia, aunque una debe ser ms completa o
ms relevante. Las menos correctas o menos completas, que aisladamente se
podran considerar como verdad -por ejemplo, en un formato VF-, en rela-
cin con las otras alternativas en un formato EMse tratan como incorrectas. Aun-
que en un tem EMde nica respuesta correcta se sobren tiende que es la mejor
entre las propuestas, este extremo es mejor explicitarlo; por ejemplo:
a2. Qu afinnacin caracteriza meior la poesa de san Juan de la Cruz?
a) Es una poesa escrita en liras.
b) Su poesa utiliza sabiamente las aliteraciones y otros recursos sonoros.
* c) Es una poesa amorosa, profunda y mstica.
d) Su poesa es un dilogo incontaminado con este mundo.
a3 Cul es la meior definicin del trmino ejido?
a) Campo de proPiedad comunal en el monte de pasto.
*
b) Campo cercano a un pueblo, para uso comn de sus habitantes.
c) Campo de proPiedad comunal para explotacin ganadera.
d) Campo comunal situado a la vera del ro.

Eliminar la opcin incorrecta: Ms adelante se harn precisiones sobre


esta variedad.
a4. Se dice que un cuerpo NO est cargado cuando tiene:

a) Exceso de electrones.
b) Defecto de electrones.
c) Un determinado potencial.
*
d) Igual nmero de protones que de electrones.
Pruebas de eleccin mltiple 99

Base comn: Se aprovecha una misma informacin para hacer varias pre-
guntas sobre ella.
a5. Una nia de 8 meses de edad ingresa en el hosPitalpor el escaso aumento de
peso, a pesar de su apetito voraz. La presencia de esteatorrea y neumona del
lbulo superior derecho sugierefibrosis qustica.
1. Si este diagnstico es correcto, sera de esperar que los resultados de la prueba
del sudor manifestaran concentraciones:
a) Baja de Na+y elevada de Gr.
b) Normales de Na+y Gr.
c) Elevada de Na+y normal de el-.
*
d) Elevadas de Na+y Gr.
2. Lospadres de la nia desean saber si otros hijos que pudieran tener naceran
con fibrosis qustica. Debe indicrseles que la probabilidad en tanto por ciento
de que sus siguientes hijospadezcan la enfermedad es aproximadamente de:
a) 100
b) 50
c) 33
* d) 25

CONSTRUCCiN 1.

A. Proceso: El proceso de construccin de tems EM, anlogo al citado en los


V/F, se puede resumir en los siguientes pasos:
1. Objetivo: Como en cualquier situacin de evaluacin, es indispensable
fijar claramente y tener a la vista el objetivo que se va a valorar.
2. Proposiciones: Como se dijo al hablar en general de las PO y en particu-
lar de los tems V/F, los EM se construyen mejor y ms adecuadamente a partir
de ideas recogidas en los materiales de instruccin. Por ejemplo:
al. El universo en que nos movemos se trata de un espacio hostil a la vida, tal
como hoy la entendemos.
a2. El embrin del parlamentarismo actual hay que buscarlo en el mayor poder
que, cada vez, los barones y terratenientes fueron acumulando, y que forz
a los monarcas a formar asambleas.

3. Formulacin de tems: Para desarrollar tems EM a partir de proposi-


ciones como las anteriores, es necesario:
a) Formular una pregunta o una afirmacin incompleta que encierre clara-
mente un problema sobre la proposicin; es la base o enunciado del
tem.

b) Proporcionar una respuesta aceptable a la pregunta, expresada con pocas


y bien eSCDgidas palabras.
100 La evaluacin de aprendizajes

c) Proporcionar varias respuestas plausibles pero incorrectas a la pregunta;


son los distractores.
Siguiendo esta secuencia, se pueden desarrollar tems como los que siguen:
al. El universo, en que nos movemos, es un espacio:
a) azul, que facilita la vida del planeta Tierra.
*
b) hostil a la vida, tal como hoy la entendemos.
c) generalmente cargado de materia continua, que transmite la vida.
d) que, generalmente, proporciona vida por transmisin asinttica.
a2. Cul es el embrin del parlamentarismo actual?
a) Las Cruzadas, que permitieron a los europeos conectar con las culturas
orientales, de donde incorporaran el hecho de parlamentar.
b) La influencia de la Iglesia, elemento puramente europeo en la confor-
macin cultural del siglo XliI.
*
c) El cada vez mayor poder que los barones y terratenientes fueron acumu-
lando y que forz a los monarcas aformar asambleas.
d) El creciente poder de la burguesa, que exigi resolver sus diferencias y
conseguir sus acuerdos en parlamentos asamblearios.

B. Instrucciones: Hay que distinguir las instrucciones generales de las de


cada tem. Es especialmente importante que las instrucciones generales, que se
refieren de manera uniforme a toda la prueba, sean claras; por ejemplo: tiempo
disponible, dnde y cmo responder, criterios de calificacin, etc. Los alumnos
se adaptan y acostumbran con rapidez. Vale aqu tambin lo dicho acerca de las
pruebas V/F.
e. Presentacin: En un conjunto de tems, la opcin correcta debe estar
repartida entre las distintas ubicaciones posibles, evitando toda tendencia que
pueda ser descubierta por el experto en exmenes, que tendra as una pista
indebida (Moreno, Martnez y Muiz, 2004, 2006). Cada profesor tiene una ten-
dencia a colocada en un lugar determinado. A veces y sobre todo si la correcta
es la primera en ser construida, puede tenderse a dejada como la primera
opcin; otras veces se extrema la precaucin haciendo que no aparezcan nunca
o casi nunca en esta ubicacin. Evtese cualquiera de esas tendencias u otras
que distorsionen un reparto equitativo, haciendo que cada posicin de la res-
puesta correcta tenga una misma proporcin, de tal modo que, en el conjunto
de la prueba, una no aparezca ms a menudo que otra; con cuatro distractores,
por ejemplo, a la a) debe correspondede una cuarta parte de los tems.
Se pueden hacer varias versiones de las mismas pruebas con slo colocar los
distractores en distinto orden.
D. Normas: Nos centramos, sencillamente, en aquellas sugerencias espec-
ficas para formular y presentar buenos tems EM, que en ciertos aspectos son
comunes a todas las PO. La mayora de ellas reflejan conclusiones prcticas a las
que han llegado expertos en construidos, y en algunas se aaden justificaciones
racionales. Sin embargo, slo unas pocas han sido contrastadas en investigacio-
nes rigurosas, siempre difciles de hacer en esta materia. No suelen ser grandes
Pruebas de eleccin mltiple 101

los efectos de obviar alguna de estas sugerencias; sin embargo, los profesores
llegan a formular mejores preguntas si conocen y siguen estas sugerencias que
si las desconocen o las desprecian.
A continuacin, aportamos algunas de ellas para elaborar la base del tem;
posteriormente, trataremos de las respuestas.

Construccin de la base: La funcin de la base o enunciado del tem es fami-


liarizar al alumno con el problema que se le propone, por lo que el propsito
de su sintaxis es comunicar significados explcitos tan eficazmente como sea
posible. Pocos textos escritos se leen tan atentamente para comprender su sig-
nificado, explcito o implcito, como las PO; se miran con lupa.
Es difcil exponer los criterios para construir buenos tems EM. En cualquier
caso, no se pueden reducir a comprobar una lista de normas, una por una. La
competencia para construidos, adems del dominio de la materia, el rigor en el
uso del vocabulario y de la expresin escrita, las estrategias instruccionales y las
tcnicas complejas de produccin de PO, suponen una comprensin profunda
de la capacidad de los alumnos para interpretar y responder los distintos tems
y una gran originalidad para crear situaciones de evaluacin adecuadas. Popham
(1984) afirma que llega a ser un arte.
Estos criterios se pueden reducir a que las preguntas sean claras ypertinen-
tes. Sin embargo, nos aventuramos a detallar algunas sugerencias que ayuden a
construir tems precisamente con dichas cualidades, agrupadas en tres aparta-
dos: las caractersticas que deben tener las ideas que se recogen en los tems
EM,las caractersticas de la informacin con que se explicitan y otras caracters-
ticas complementarias.
1. Ideas: Se resumen las caractersticas que deben tener los datos y con-
ceptos que se vierten en los tems EM.
1.1. Novedades: Es deseable evitar en los exmenes el uso de las mismas
preguntas y problemas que se usaron durante la explicacin. Por el contrario,
introducir preguntas y situaciones problemticas nuevas, incluso imposibles,
refuerza al alumno que intenta comprender lo que se le ense y penaliza al
alumno superficial. Consideremos este ejemplo:
f
Al usar la ecuacin e = 1/2 g para calcular el tiempo que tarda un cuerpo en
caer desde una altura h a la tierra, qu factor introducir mayor error?
a) Variacin de g.
* b) Variacin de la resistencia del aire.
c) gpara grandes alturas y la resistencia del aire para alturas menores.
d) La resistencia del aire para grandes alturas y gpara alturas menores.

Nota: La variacin de la resistencia del aire puede hacer que el movimiento


sea uniforme y llegar a invalidar totalmente la ecuacin que se refiere al movi-
miento uniformemente acelerado. Pedir que los alumnos predigan lo que pasa-
ra en circunstancias poco usuales, o incluso imposibles, es una buena manera
102 La evaluacin de aprendizajes

de medir su comprensin de los principios pertinentes. Este tipo de tarea con-


sigue identificar al alumno que puede responder a partir de una total compren-
sin de los principios sin tener que recurrir a clculos tediosos.
1.2. Pregunta directa: Con frecuencia es preferible una pregunta directa,
expresada en forma interrogativa, ya que no slo ayuda a presentar al alumno
un problema ms especfico, sino que tambin puede centrar la intencin del
examinador para evitar distractores irrelevantes que no vengan a cuento. Hay,
pues, que expresar la base del tem tan directa, exacta y simplemente como sea
posible, evitando lo innecesariamente complejo. Por ejemplo:
aJ. Desde el punto de vista econmico, cul de estas propuestas para mantener
la paz mundial supone el menor respaldo hacia la capacidad militar de la
energa atmica?
a) Debe construirse una fuerza policial internacional.
b) Deben adaptarse programas permanentes de entrenamiento militar uni-
versal.
* c) Deben aumentarse los efectivos de lasfuerzas militares vigentes.
d) Las naciones democrticas deben constituir una alianza militar.

Nota: El significado de la base de este tem, aun despus de leerla cuidado-


samente, no est claro. La confusin se produce porque tiene un enfoque nega-
tivo y parece combinar dos premisas diferentes para emitir un juicio: la econo-
ma y la energa atmica.
Se recomienda tambin utilizar la forma impersonal y evitar dirigirse al alum-
no en segunda persona. Es mejor la formulacin impersonal del ejemplo b2 que
la del b1:
bJ. De acuerdo con las normas sanitarias, cules son losprimeros auxilios que
debesprestar a un epilptico?
b2. Culesson losprimeros auxilios que se deben prestar a un epilptico?
a) Mantenerlo tendido de espaldas.
b) Colocarlo de lado.
c) Darle de beber.
*
d) Introducir algo entre sus dientes.

1.3. Respuesta definida: En su forma ideal, la respuesta a un tem EMdebe


ser lo suficientemente correcta, de manera que no admita diferencias de opinin,
ni se fundamente en afIrmaciones cuya validez puedan contradecir expertos com-
petentes en la materia. Sin embargo, no hay que evitar preguntas importantes por
el hecho de que no haya una respuesta completamente correcta; se trata de la
variedad de escoger la mejor respuesta antes mencionada.
Aunque los examinadores puedan deducir sus tems de proposiciones que
no son absolutamente verdad, sino slo muy probables, las preguntas de la base
deben tener respuestas definidas. Las preguntas indefinidas pueden proporcio-
nar temas de discusin, pero no son buenos tems para evaluar logros; por
ejemplo:
Pruebas de eleccin mltiple 103

al. 'Qusuceso ha sido de mayor importancia en la historia de Espaa?


a) El descubrimiento de Amrica.
b) La unificacin, con Granada y Navarra, de los reinos peninsulares.
c) La expulsin de losjudos.
d) La romanizacin hasta el Norte peninsular.

Nota: No es fcil que los expertos se pongan de acuerdo en cul de estos


sucesos es el de mayor importancia en la historia de Espaa. La importancia de
un suceso depende del punto de vista de la persona que hace el juicio y del
contexto en el que lo juzga.
La base de un tem puede pedir opiniones de los expertos; sin embargo, no
es aconsejable pedir opiniones de los alumnos. stos, obviamente, dan siempre
su opinin sobre lo que consideran correcto e importante, pero sus respuestas
estn tambin siempre expuestas a crtica y correccin si difieren de lo que
piensan los expertos.
Cuando es relevante examinar los puntos de vista, del profesor o de algn
autor singular, distintos de los libros de texto que usan los alumnos, hay que
definido especificando en la base del tem la fuente de autoridad. Expresiones
tales como ,<Deacuerdo con la explicacin del profesor o De acuerdo con
Fulano de Tal,por ejemplo, pueden ser necesarias para establecer el marco de
referencia en el que los alumnos deben responder.
a2. Con respecto a la invasin musulmana de Hispania, Carmen Codoer dice
que se trat de:
* a) Ocupacin por capitulacin.
b) Conquista militar.
c) Alianza de cooperacin.
d) Invasin pacfica.

Nota: No se pregunta una teora generalizada, sino la opinin de una autora.


Tales situaciones, sin embargo, no deben ser frecuentes, ya que las buenas
preguntas EM deben tratar de ideas generalmente admitidas como importantes
y significativas.
2. Informacin completa: El segundo grupo de sugerencias se refiere a
la necesidad de dar al alumno claramente toda la informacin que necesita para
responder la pregunta.
2.1. Base autosuficiente: Es lo ms determinante y caracterstico de los
buenos tems EM. El enunciado de la base debe incluir una idea completa, es
decir, lo principal del contenido, ya que al desplazado a las diferentes opciones
obligara a leer una excesiva cantidad de texto a veces redundante, lo que pue-
de dificultar una adecuada comprensin del tem. Si se eliminan los distractores
de un tem EM, automticamente debe transformarse en una respuesta abierta
(RA).A continuacin transcribimos tres ejemplos:
al. frica del Sur:
a) Est cubierta en su mayor parte de bosques tropicales.
104 La evaluacin de aprendizajes

b) Una de sus industrias es la extraccin de diamantes.


c) Est rodeada de pases polticamente hostiles.
d) Lafalta de transportes entorpece el desarrollo de su economa.

Nota: La base, fricadel Sur, sin los distractores no tiene sentido. Hasta
que el alumno lea todas las respuestas, no sabr a qu se refiere la pregunta. La
formulacin de la base es ambigua, lo que produce frustracin en los alumnos
proporcionando medidas no fiables.
a2. Sealar la afirmacin correcta:
a) La anfora consiste en repetir una palabra al comienzo de un mismo
verso.
b) Versosde arte menor son los escritos segn la regla del ars minore.
c) La estructura mtrica de la lira es 7a ] ]B 7b 7a ] ]B.
* d) La sinresis consiste en formar un falso diPtongo en una palabra dentro
de un verso.

Nota: Es ste un protocolo que se usa con frecuencia. En realidad es un tem


V(F presentado como EM, por lo que, en la medida de lo posible, se debe evitar
porque contradice la norma que estamos comentando: la base no proporciona
toda la informacin, por lo que, eliminando los distractores, el tem no tiene
sentido.
Moreno et al. (2004) lo ilustran proponiendo dos versiones del mismo tem;
a saber, una primera (a3) des aconsejable y una segunda versin (a4) corregida
conforme a esta directriz.
a3. En Fsica, sublimacin:
a) Supone un cambio de materia slida a maten'a gaseosa.
b) Se refiere a un cambio de materia lquida a materia slida.
c) Consiste en un cambio de materia gaseosa a materia lquida.
d) Es un cambio de materia lquida a materia gaseosa.
a4. En Fsica, se denomina sublimacin a un cambio de materia:
* a) Slida a gaseosa.
b) Lquida a slida.
c) Gaseosa a lquida.
d) Lquida a gaseosa.

2.2. Condiciones: Es necesario introducir todas las condiciones para


hacer que la respuesta sea correcta, por ejemplo:
Qu cambio ocurre en la composicin del aire en una habitacin cerrada e ilu-
minada, en la que los nicos seres vivos son plantas verdes creciendo?
a) Aumenta el C02y disminuye el 02"
*
b) Disminuye el C02y aumenta el 02"
c) Aumentan ambos, el C02y el 02"
d) Disminuyen ambos, el C02y el 02"

Nota: Este tem en su formulacin original deca: Qu cambio ocurre en la


composicin del aire en la que crecen plantas verdes? Slo es posible contes-
Pruebas de eleccin mltiple 105

tar la pregunta si se aade que la habitacin est iluminada de manera que ten-
ga lugar la fotosntesis, que est cerrada de forma que la composicin del aire
no va a ser neutralizada por la ventilacin, y que no hay otros seres vivos que
puedan consumir el oxgeno ms de prisa de lo que se produce.
Pero, a veces, para asegurarse de que el tem tenga una respuesta correcta,
los examinadores reducen sus dimensiones hasta tal punto que el problema se
diluye. Por ejemplo, es difcil dar una respuesta coherente a: Qu razones lle-
varon a la Repblica Democrtica Alemana a levantar en 1961 el muro de
Berln? Sin embargo, si se limita la pregunta con la siguiente condicin: Qu
explicacin de la accin de levantar el muro de Berln por la DDR dio el
peridico Frankfurter Allgemeine el 25 de agosto de 1961?, es relativamente
fcil contestada, pero deja de tener valor.
2.3. Introducciones: Abunda en la norma anterior. A veces son necesarias
frases de introduccin para describir la escena o el contexto. Tales frases difie-
ren de los prembulos instruccionales y escaparates retricos que se mencio-
nan al hablar de suprimir lo irrelevante.
Si son necesarias muchas ideas descriptivas y cualificadoras, combinar las
descripciones con las preguntas en una misma oracin probablemente hace la
base del tem ms compleja. Se puede conseguir una expresin ms clara pre-
sentando estas descripciones e informaciones previas en frases de introduccin
separadas; en otra se hace la pregunta. Por ejemplo:
al. Hace unos 200 millones de aos la superficie seca de la Tierra no se presenta-
ba separada en los actuales continentes, sino que se presentaba unida en un
solo continente denominado:
a) Mundo Antiguo.
b) Eurasia.
* c) Pangea.
d) Atlntida.

Nota: La base se podra hacer de forma ms sencilla, diciendo: Hace unos


200 millones de aos la superficie seca de la Tierra no se presentaba separa-
da en los actuales Continentes, sino unida en un solo continente. Cmo se
llama esta superficie seca de la Tierra?
a2. Cuando miramos al mundo como un todo, est claro que el problema del
progreso econmico realmente es el ms importante. Esta afirmacin se cla-
sifica como:
* a) juicio de valor.
b) Conclusin cientfica.
c) Hecho establecido.
d) Analoga.

Es especialmente importante el modo de presentacin de tems que inclu-


yen textos o grficos. El ejemplo bl incluye un texto yel b2 un grfico:
bl. Leer el texto siguiente para contestar la pregunta:
106 La evaluacin de aprendizajes

1. Estaba sentado al borde de la carretera.


2. El campo arda bajo el sol y una neblina velaba las montaas.
3. La sombra de las moreras flanqueaba la calzada y las vias confor-
maban un paisaje requemado y sediento.
4. Me renda la fatiga y pensaba en los compaeros de trabajo y en los
problemas que habamos discutido no haca mucho.
5. Hoy le dije a todos que pensaba de que deberamos de hablar con
Juan.
6. Solo l tiene la solucin: Conoce nuestros problemas y siempre estuvo
a nuestro favor.
7. Es lo mejor que podemos hacer.

Qu expresin es la adecuada para corregir la 5?


a) Hoy les dije a todos que pensaba de que deberamos hablar con Juan.
* b) Hoy les he dicho a todos que pensaba que deberamos hablar con Juan.
c) Hoy le dije a todos que pensaba que deberamos de hablar con Juan.
d) Hoy le he dicho a todos que pensaba que deberamos hablar con Juan.

b2. Usar el diagrama siguiente para responder la pregunta:


E

e
En el diagrama se ve un crculo con centro Ay cuatro puntos B, C, D, E en su cir-
cunferencia, tales que los arcos BE = DE = 2BD.
Cul es el valor del ngulo agudo BAD en grados?
a) 64
b) 70
* c) 72
d) 75

2.4. Suprimir lo irrelevante: Aunque se puede aprender mucho durante


un examen, la inclusin deliberada de materiales de enseanza en las situaciones
de evaluacin puede reducir su eficacia,sin que aumente su valor instructivo.
Con mayor razn, deben evitarse los detalles y prembulos retricas que
slo sirven de escaparate o escenario y no ayudan al alumno a comprender la
pregunta que se le hace. Por ejemplo:
Mientras planchaba su traje, Anselmo se quem en la mano accidentalmente con
la plancha caliente. Esto se debi a un proceso de transferencia de calor por:
* a) Conduccin.
Pruebas de eleccin mltiple 107

b) Radiacin.
c) Conveccin.
d) Absorcin.

Nota: La introduccin sugiere que el tem trata de un problema prctico;


pero, realmente, la pregunta se refiere slo a una terminologa cientfica.
3. Otras caractersticas: Se aaden por ltimo otras sugerencias para
lograr que el tem sea claro y pertinente.
3.1. Pistas inintencionadas: Este aspecto se recoge de nuevo al hablar
de la homogeneidad de los distractores. Hay que evitar indicios que puedan
contribuir a sugerir la respuesta correcta. Es fcil eliminar estas pistas si el pro-
fesor est sobre aviso. Sin el conocimiento adecuado, se puede adivinar la res-
puesta asociando elementos de la base con una de las respuestas, o identifican-
do algn elemento comn en las alternativas para elegir la que no lo tenga.
En algunos casos, palabras clave de la base, o sus sinnimos, se repiten o
estn relacionadas con trminos de la respuesta correcta. Por ejemplo:
al. Qu obra pertenece a la literatura mstico-religiosa del siglo XVI espaol?
* a) Noche Oscura del Alma.
b) La Ilustre Fregona.
e) El Caballero de Olmedo.
d) Fuenteovejuna.

Nota: El trmino almade la respuesta correcta est relacionado con la lite-


ratura mstico-religiosa de la pregunta.
Las preguntas deben ser tambin independientes, de manera que el enun-
ciado de una pregunta no tiene que dar pistas para responder otra:
bl. Culde estos insectos es un himenptero?
a) Saltamontes.
b) Abeja.
e) Escarabajo.
d) Mosquito.

b2. La abeja es un himenptero porque:


a) recogepolen de lasflores.
b) tiene dospares de patas.
e) tiene metamorfosis completa.
d) carece de patas en el abdomen.

Nota: La segunda pregunta da pistas para contestar la primera.

3.2. Negaciones: Las negaciones resultan especialmente atractivas a los


examinadores porque son fciles de formular aadiendo un no a los materia-
les de instruccin. Sin embargo, las preguntas formuladas negativamente son
confusas, ya que requieren que el alumno elija una respuesta que no es verdad
o no es caracterstica, complicando, as, la comprensin de un tem, como apa-
108 La evaluacin de aprendizajes

rece en el siguiente enunciado: En situaciones difciles, qu no debe dejarse


de no hacer? (Moreno et al., 2004). Por tanto, salvo que se pretenda evaluar el
dominio de las negaciones, debera ser sustituido por otro ms entendible
como el siguiente: En situaciones difciles, qu debera evitarse?. Por todo
ello, se aconseja evitar las negaciones en la medida de lo posible. Si es preciso
incluidas, se debe subrayar la expresin negativa para atraer la atencin del
alumno (NO, FALSA).
El origen de una Era Glacial debe buscarse en la concomitancia de varias cau-
sas, entre las que NO est:
a) La variacin de la rbita terrestre.
b) El efecto albedo.
c) La variacin de inclinacin del eje terrestre.
* d) Lafusin atmoifrica del C02y los rayos ultra violeta.

3.3. Dificultad dosificada: Cualquier pregunta que sea excesivamente


fcil o excesivamente difcil para un grupo de alumnos no discrimina sus niveles
relativos de logro.
Los distractores simplistas perjudican a los mejores alumnos, ya que sus
conocimientos adicionales interfieren con la respuesta que se puede dar a par-
tir de la mera informacin que proporciona el tem. El alumno slo puede adivi-
nar aproximadamente el grado de conocimiento adicional que se le presupone.
Se llama inhibicin pro activa a la situacin en que el alumno, para solucionar
un tem, aporta conocimientos ms all de la intencin del profesor (Lefrancois,
1988). Este factor supone una discriminacin negativa en contra de los mejores
alumnos, que se debe tener en cuenta a la hora de construir tems. Por ejemplo:
al. Encul de los siguientes ejemplos se produce un cambio qumico?
a) Relmpago.
b) rbol quemndose.
c) Nieve derritindose.
d) Arcoiris.

Nota: El alumno que conozca superficialmente las propiedades del cambio fsi-
co y qumico sealar la b). Sin embargo, un alumno con mayores conocimientos
reconocer que los casos a) y d) son ejemplos de cambios elctricos y qumicos;
nicamente en el caso e) no hay cambio qumico, sino slo de estado fsico.
En general, la base se puede hacer ms fcil hacindola ms general, o ms
difcil hacindola ms especfica. El par de tems siguientes ilustra cmo la gene-
ralizacin o la concrecin de una pregunta puede usarse para controlar su difi-
cultad:
bl. Un arancel es un impuesto sobre:
a) bienes races.
*
b) bienes importados.
c) herencias.
d) donaciones.
Pruebas de eleccin mltiple 109

Nota: Basta una nocin difusa sobre aranceles para responder correctamente
a esta pregunta general; sin embargo, es necesario un mayor conocimiento sobre
los aranceles para responder correctamente el siguiente tem ms concreto:
b2. Un arancel altamente proteccionista sobre coches japoneses en la UE benefi-
cia ms directamente a:

a) los fabricantes japoneses de coches.


b) los ciudadanos europeos que compran cochesjaponeses.
c) la administracin de los pases de la UE.
*
d) los fabricantes de coches de la UE.

Construccin de respuestas: Una vez terminada la base del tem, hay que
escribir la respuesta correcta as como un conjunto de distractores o respuestas
incorrectas. El propsito de los distractores es discriminar entre los alumnos
que dominan y no dominan una materia. Para ello, el distractor debe ser una
alternativa lgica y plausible que parezca tener relacin con la pregunta. El
alumno inteligente descartar por ridculos los distractores demasiado alejados
de la pregunta; con ello se reduce el nmero de distractores reales. Se pueden
emplear varias tcnicas para preparar distractores plausibles, sin proporcionar
pistas que ayuden al alumno no preparado a contestar correctamente; entre
otras, se pueden citar las siguientes:
1. Usar afirmaciones verdaderas que no contestan directamente a la pre-
gunta.
2. Emplear expresiones familiares estereotipadas que tengan alguna asocia-
cin con los trminos usados en la pregunta y que parezcan atractivas a
los alumnos simplemente por un recuerdo vago de haber odo aquellas
palabras alguna vez.
3. Definir la clase de cosas a la que deben pertenecer todas las respuestas
alternativas. Por ejemplo, si se pregunta lo que enfra un refrigerador
elctrico, la clase de posibles respuestas se define como cosas que pue-
den causar el enfriamiento y los distractores seran: hielo, aire en movi-
miento, expansin de un gas, etc.
4. Utilizar los errores cometidos por los alumnos en exmenes clsicos (RA)
y de respuesta limitada (RL);aunque a veces no compensa por el trabajo
que esto supone (Loree, 1948).
He aqu algunas sugerencias para generar buenos distractores en tems EM,
agrupadas por su homogeneidad interna y externa, y completadas con otros
recursos que suelen utilizar los expertos.

1. Homogeneidad interna: Puesto que las opciones intentan ser respues-


tas a la misma pregunta, deben estar relacionadas con ella. Por tanto, hay que vigi-
lar que los distractores y la respuesta correcta sean homogneos internamente.
1.1. Contenido: Una falta de paralelismo en las alternativas puede llevar a
los malos alumnos a la respuesta correcta; por tanto, los distractores deben ser
110 La evaluacin de aprendizajes

relativamente semejantes por su contenido. Desafortunadamente, este no es


siempre el caso; por ejemplo:
al. La llamada Reconquista de Espaa comenz en:
* a) Covadonga.
b) la rebelin de los godos sometidos.
c) la coronacin de pelayo como rey de Asturias.
d) la doctrina cristiana de liberacin.

Nota: La primera respuesta se refiere a un lugar, la segunda y tercera res-


puesta se refieren a un hecho y, por fin, la cuarta a una ideologa. En las cuestio-
nes de este tipo, no es difcil encontrar ejemplos en los que varias respuestas
sean correctas.
a2. La principal diferencia entre la poesa de Carcilaso y la de san Juan. de la
Cruz es que uno escribi:
a) ms obras que otro.
b) goglasy epstolasy otro no.
c) estancias y sonetos y otro no.
* d) sobre el amor humano y otro sobre el amor divino.

Nota: Slo la respuesta correcta realmente presenta una diferencia relevan-


te; dado que el valor potico no es cuestin de cantidad ni de en qu gnero
potico o estrofa se escriba. Sin embargo, en este caso, el diferente tema amo-
roso es muy significativo.
Las alternativas deben ser adems exclusivas e independientemente correc-
tas. No se puede aceptar:
a3. La carne puede conservarse en salmuera debido a que:
a) la sal es un veneno para las bacterias.
b) las bacterias no pueden resistir la accin osmtica de la salmuera.
c) la sal altera la composicin qumica de los alimentos.
d) la salmuera protege a la carne del contacto con el aire.

Nota: La b) es una explicacin de la a), por lo que se pueden sealar ambas


como correctas.

1.2. Matizarlos datos: Cuanto ms homogneas sean las respuestas, ms


difcil y; consecuentemente, ms discriminante ser el tem. Por el contrario,
una manera de transformar un tem difcil para hacerla ms fcil es proporcio-
nar varios datos en las alternativas; por ejemplo, utilizar el nombre de dos per-
sonas que respondan a las condiciones de la pregunta (basta saber uno de ellos
para responder correctamente).
Quautores son conocidos por sus descripciones de Castilla?
* a) Azorn y A Machado.
b) Carda Larca y Cernuda.
c) Miguel Hernndez y Salinas.
d) Fernndez Flrez y Cabriel Mir.
Pruebas de eleccin mltiple 111

1.3. Distractores plausibles: Es obligado evitar alternativas jocosas, fre-


cuentes entre los exmenes que los profesores proponen a sus propios alum-
nos, ya que suelen ser alternativas desperdiciadas por absurdas. Por ejemplo:
En economa} ahorro es meter dinero en un calcetn.
El uso de distractores que son claramente ms fciles que la respuesta
correcta se critica a veces porque permite al alumno responder con xito por
eliminacin de los incorrectos. Sin embargo, los alumnos que pueden respon-
der bien de esta manera generalmente saben ms que los que no pueden hacer-
la; por tanto, la capacidad de discriminacin de un tem no queda invalidada
por esta circunstancia. Por supuesto, un distractor que es absurdo o muy poco
plausible contribuir escasamente o nada a la eficacia del tem.
Hay dos razones por las que el proceso de eliminacin no est generalmente
desechado por los especialistas en evaluacin.
En primer lugar, la funcin de los tests es principalmente contribuir a medir
los logros globales en un rea de estudio. Identificar exactamente qu cosas
sabe o ignora un alumno es de importancia secundaria en una evaluacin suma-
tiva, aunque sea necesario cuando se desea una evaluacin formativa.
En segundo lugar, el conocimiento y la capacidad que se necesitan para eli-
minar alternativas incorrectas pueden estar ntimamente relacionados al conoci-
miento o capacidad que se necesitaran para seleccionar la alternativa correcta.
En la prctica, pocos tems EM se pueden responder correctamente por mera
eliminacin de las alternativas incorrectas. No es probable que un alumno que
ignora totalmente la respuesta correcta tenga el conocimiento suficiente para
eliminar con certeza las alternativas incorrectas. El que un alumno responda de
una manera reflexiva, escogiendo la respuesta mejor a travs de un proceso
racional, debera elogiarse ms que criticarse. Por estas razones, parece razona-
ble concluir que responder por eliminacin no se debe considerar como un
problema serio.
1.4. Concisin: La brevedad de las respuestas simplifica la tarea del alum-
no eliminando una fuente irrelevante de dificultades. Las respuestas breves tien-
den tambin a centrar la atencin en las diferencias esenciales entre las alterna-
tivas. En igualdad de condiciones, el tem EM con respuestas ms breves son
preferibles a las demasiado complicadas; aunque no hay que sacrificar la impor-
tancia y significado de las preguntas para ganar brevedad en las respuestas.
Cuando las respuestas son largas y complejas, los alumnos tienen dificultad
en comprender y mantener en la memoria las diferencias esenciales entre las
alternativas. Un ejemplo de lo dicho sera:
al. La geografia sistemtica difiere de la regional principalmente en que:
a) La geografia sistemtica trata, principalmente, de la geografia fsica,
mientras que la geografa regional se refiere esencialmente al campo de
la geografa humana.
b) La geografa sistemtica estudia una regin sistemticamente, mientras
que la regional se refiere a la descripcin de una regin.
112 La evaluacin de aprendizajes

*
c) La geografa sistemtica estudia un solo fenmeno en su distribucin
sobre la tierra para llegar a generalizaciones de la geografa regional,
que estudia la distribucin defenmenos en un rea dada.
d) La geografa sistemtica es la manera moderna cientfica de estudiar la
diferenciacin de la superficie de la tierra, mientras que la geografa
regional es la manera tradicional y descriptiva de estudiar la distribu-
cin defenmenos en el espacio.

Nota: Esta pregunta se puede expresar mejor: "Qucaracterstica de la geo-


grafa sistemtica la distingue esencialmente de la geografa regional?
Otro ejemplo; si el propsito de un tem es controlar la comprensin de la
palabra monogamia, el tem b2, ms conciso, ser mejor que el bl:
b1. Qu es monogamia?
a) Negarse a contraer matrimonio.
b) El matrimonio entre una mujer y varios hombres.
c) El matrimonio entre un hombre y varias mujeres.
* d) El matrimonio entre un hombre y una mujer.
b2. Cmose llama la forma de matrimonio en el que una mujer se casa con un
hombre?
a) Maridanza.
b) Endogamia.
c) Exogamia.
* d) Monogamia.

2. Homogeneidad externa: Los distractores deben ser tambin homog-


neos externamente.
2.1. Elaboracin gramatical: Es necesario cuidar la correccin gramatical
(gnero y nmero); el simple descuido ortogrfico o gramatical puede dismi-
nuir la eficacia de la pregunta. La forma interrogativa en la base, preferible a las
frases incompletas, ayuda a no introducir incoherencias gramaticales.
al. Las diferencias pequeas entre organismos de la misma clase se conocen
como:
a) Herencia.
* b) Variaciones.
c) Adaptacin.
d) Seleccin natural.

Nota: El plural diferencias de la base sugiere que la respuesta correcta esta-


r tambin en plural, lo que se cumple en la respuesta b).
Conviene que todas las alternativas tengan la misma complejidad y que su
extensin sea aproximadamente la misma. Hay una tendencia a escribir las res-
puestas correctas de forma ms cuidadosa e inclusiva que los distractores. As:
a2. Enqu difieren las prendas de ropa de la moda de las mujeres de 1990 de la
de 1900?
a) Muestran ms belleza.
b) Muestran ms variedad.
Pruebas de eleccin mltiple 113

c) Son msfciles de limpiar.


*
d) Son ms cmodas, se trabaja mejor con ellas, se puede uno mover ms
fcilmente y, en general, son menos restrictivas.

Nota: La profusin de detalles de la respuesta correcta la hacen indeseable-


mente obvia.
Dar todas las pistas relevantes, es decir, las tiles para los alumnos prepara-
dos, y evitar las irrelevantes es una importante destreza necesaria para construir
tems EM. Sin embargo, no es censurable incluir deliberadamente pistas en los
distractores para equivocar a los alumnos expertos en contestar PO, pero mal
preparados en la materia. Por ejemplo:
a3. De las teoras sobre la desaparicin de los dinosaurios, sealar la que hoy se
tiene como verdadera. Los dinosaurios se extinguieron:
a) porque llegaron a alcanzar un tamao demasiado grande con respecto
a su cerebro.
b) porque comieron como alimento plantas no deseablespara su dieta.
c) porque los mamferos comieron sus huevos.
*
d) por la colisin de un asteroide con la Tierra.

Nota: En las respuestas a), b) y c) se usa el pretrito perfecto simple o pretri-


to indefmido, que fcilmente se liga al mismo tiempo de la pregunta. Sin embar-
go, la respuesta correcta es la d), en la que no se usa tiempo verbal alguno.
2.2. Elementos comunes: Hay que evitar reiteraciones de palabras inne-
cesarias e introducir los elementos comunes en la base, sin repetir palabras en
los distractores. Esto coincide con la norma de formular una idea completa en
la base. Cuando todas las respuestas empiecen por las mismas palabras, hay que
considerar la posibilidad de incluidas en la base; por ejemplo:
al. 'Cules la definicin de vena?
* a) Un vaso sanguneo que lleva la sangre al corazn.
b) Un vaso sanguneo que lleva sangre roja.
c) Un vaso sanguinea que lleva sangre oxigenada.
d) Un vaso sanguneo que lleva sangre desde el corazn.

Nota: Este tem se puede mejorar, incluyendo la frase incompleta: Una vena
es un vaso sanguneo que lleva sangre ... en la base. A veces la repeticin de
palabras ayuda a clarificar el tem, pero en ste, como en otros casos, la repeti-
cin parece excesiva e innecesaria.
Conviene tambin eliminar los artculos en las alternativas que no sean fra-
ses completas, ya que pueden dar pistas no deseables. El ejemplo bl es mejor
simplificado como el b2:
bl. Qu rgano del cuerpo se puede extirpar sin peligro de la vida?
a) El hgado.
b) El corazn.
c) Elpncreas.
* d) Un rin.
114 La evaluacin de aprendizajes

b2. a) Hgado.
b) Corazn.
c) Pncreas.
* d) Rin.

Cuando sean homogneas, hay que incluir las unidades de las respuestas en
la base. Por ejemplo, es preferible la formulacin de c2 a la de cl:
cl. Calcular la superficie de un cuadrado de 2m de lado:
a) 2m2
* b) 4m2
c) 6m2
d) 8m2
c2. Cul es la superficie en m2 de un cuadrado de 2m de lado?
a) 2.
* b) 4.
c) 6
d) 8.

2.3. Estructuracin: El conjunto de opciones de cada tem debe estar


organizado y ordenado de modo coherente.
En este sentido, la desorganizacin del contenido de las opciones en el
siguiente tem, adaptado de Moreno el al. (2004), obliga al sujeto a hacer un
trabajo previo que le distrae del cometido al que debera dedicarse, que no es
otro que identificar la respuesta correcta si la conoce.
al. Son propiedades deseables de los tests:
a) Control, validez y fiabilidad.
b) Fiabilidad, eficiencia y validez.
c) Eficiencia, objetividad y control.
d) Eficiencia, control y objetividad.

Sera ms adecuado evitar esa tarea previa organizando el tem como en el


siguiente ejemplo:
a2. Son propiedades deseables de los tests:
a) Validez, fiabilidad y control.
*
b) Validez, fiabilidad y eficiencia.
c) Objetividad, fiabilidad y eficiencia.
d) Objetividad, control y eficiencia.

Por la misma razn, si la pregunta exige una respuesta cuantitativa, es nece-


sario organizar adecuadamente las opciones escribiendo respuestas que repre-
senten intervalos a lo largo de una misma escala.
Hay cuestiones en que es ms importante la relacin, o el conocimiento del
orden de la magnitud a nivel general, que el valor preciso cuantitativo.
bl. En cunto se estim (X) la cantidad de petrleo descubierto en nuevos cam-
pos al final de los aos setenta, en comparacin con ro la cantidad extrada
de los pozos en los mismos aos?
Pruebas de eleccin mltiple 115

a) Xfue prcticamente O.
*
b) Xfue la mitad de y
c) Xfue prcticamente igual a Y
d) X fue mayor que Y

Por ltimo, aunque de ordinario las alternativas deben presentarse al azar,


las cifras (nmeros, fechas, etc.) es conveniente disponedas en orden de mayor
a menor o viceversa. Esto ayuda a eliminar confusin y errores en los alumnos.
b2. Cuntas sflabas tiene un verso alejandrino?
a) 8.
b) 11.
* c) 14.
d) 16.

2.4. Distractores no especficos: Cuando al profesor no se le ocurren


distractores en nmero suficiente, un recurso comn para completados es aa-
dir como alternativa final todas las anteriores o ninguna de las anteriores.
El uso de todas las anteriores como respuesta correcta es adecuada slo si
todas las alternativas precedentes son respuestas enteramente correctas; ya que
conociendo que una sola de las anteriores es incorrecta, queda descartada. Yal
contrario, se puede intuir como respuesta correcta si el alumno conoce la
mayora de los distractores.
La respuesta ninguna de las anteriores es particularmente til en tems
aritmticos o de ortografa en donde lo correcto y errneo son inequvocos;
por ejemplo:
Sumar 54 + 14:
a) 40.
b) 48.
c) 60.
*
d) Ninguno de los anteriores.

Tambin se pueden usar cuando haya muchas alternativas de las que se


explicitan tres, por ejemplo, y el resto se engloba en ninguna de las anterio-
res. En esto se basa el formato de las respuestas combinadas (Re).
En resumen, conviene restringir el uso de estas formas a los tems en los
que se d una razn positiva que lo justifique. Y en todo caso, debe evitarse que
siempre o nunca sean correctas; de lo contrario, su uso se convierte en una pis-
ta al mal alumno experto en exmenes, que sabe que todos y ninguno de los
anteriores casi nunca es la respuesta correcta.
3. Recursos: Finalmente se sealan otros recursos y estrategias para lograr
buenos distractores.
3.1. E..xplicacionesaadidas: Enriquecer las preguntas de manera que se
deban contestar, adems de con so no, con una explicacin aadida.
116 La evaluacin de aprendizajes

Es la proporcin entre los ingresos discrecionales y disponibles, generalmente,


mayor en la casa de un jubilado que en la de un recin casado? Por qu?
a) S, porque los jubilados tienen unos intereses de ahorro mayores para
gastar.
b) S, porque los jubilados no prevn gastos futuros considerables (vivienda,
colegios, etc.) para los que tener que ahorrar.
c) No, porque las pensiones no llegan para cubrir los gastos fijos de losjubi-
lados.
* d) No, porque los ingresos disponibles son siempre mayores, por definicin.

3.2. Combinar elementos: Usar combinaciones de elementos para obte-


ner varias alternativas. Como acabamos de decir, es el fundamento del formato
Re. Dos respuestas pueden ocasionalmente convertirse en cuatro de la siguien-
te forma:
a) SloX.
b) Slo y
c) Ambos, X e Y
d) NiXni y
As:

En la reproduccin de las plantas gimnospermas intervienen:

a) Yemas.
b) Esporas.
c) Ambos medios: yemas y esporas.
*
d) Ninguno, ni esporas ni yemas.

Tambin, si cada uno de los dos elementos tiene diferentes valores, por
ejemplo, subir/bajar y rpido;1ento, se pueden combinar para obtener cuatro
alternativas:
a) Sube rpidamente.
b) Sube lentamente.
c) Baja rpidamente.
d) Baja lentamente.

3.3. Distractores en lneas diferentes: Las diferentes partes del tem,


instrucciones, base y alternativas, deben presentarse en la misma pgina. De
todas maneras, es ms conveniente escribir las opciones en lneas diferentes, y
no uno a continuacin de otro. Las respuestas en tndem ahorran espacio, pero
son mucho ms difciles de comparar que las presentadas en columna. Por
ejemplo: Qu es un abadejo?: * a) pez; b) abad mal encarado; c) mala califi-
cacin; d) plano inclinado.
La distribucin horizontal de las opciones puede ser adecuado, sin embargo,
en los casos en los que, ms que diferenciar las opciones, interese que sean per-
cibidas como una graduacin de posibilidades, como ocurre en el siguiente
tem adaptado de Moreno et al. (2004):
Pruebas de eleccin mltiple 117

Indique su grado de acuerdo con utilizar dinero pblico para proyectos de explo-
racin espacial:
a) Nada b) Poco c) Bastante d) Mucho

3.4. Nmero de distractores: Cuantos ms distractores, ms discrimina-


r el tem; pero los buenos distractores no se nos ocurren fcil e inmediatamen-
te. Ebel y Frisbie (1977) recomiendan ms tems con menos distractores, que
menos con ms distractores. Aunque no hay un nmero mgico de alternativas,
algunos autores (Moreno el al.) 2004) admiten como suficientes tres opciones,
otros en cambio aconsejan, siempre que sea posible y cumpliendo las directri-
ces aqu analizadas, escribir cuatro opciones o, lo que es lo mismo, una respues-
ta y tres distractores para cada tem.
En resumen, a la hora de escribir la Base de un tem EM se deben tener en
cuenta las siguientes directrices:
1. Cualidades de las preguntas:
1.1. Introducir ideas nuevas.
1.2. Hacer preguntas directas.
1.3. Hacer preguntas con respuestas definidas.
2. Informacin completa:
2.1. Redactar bases autosuficientes.
2.2. Enriquecer la base con condiciones.
2.3. Aadir frases de introduccin.
2.4. Suprimir lo irrelevante.
3. Otras caractersticas:
3.1. Evitar pistas.
3.2. Evitar negaciones.
3.3. Dosificar la dificultad.
Para construir las alternativas:
1. Homogeneidad interna:
1.1. Desarrollar contenido semejante.
1.2. Matizar datos.
1.3. Formular distractores plausibles.
1.4. Redactar expresiones concisas.
2. Homogeneidad externa:
2.1. Cuidar la elaboracin gramatical.
2.2. Reunir los elementos comunes en la base.
2.3. Ordenar las opciones.
2.4. Restringir los distractores no especficos.
3. Otros recursos:
3.1. Aadir explicaciones.
118 La evaluacin de aprendizajes

3.2. Combinar elementos.


3.3. Escribir los distractores en lneas diferentes.
3.4. Seleccionar nmero de distractores.

2. APLICACiN

Estas pruebas EM ofrecen ventajas e inconvenientes que deben ser tenidos en


cuenta. El formato de tems EM ha resistido la prueba del tiempo: ha superado
crticas y vencido alegaciones de ser superficiales, ambiguos y susceptibles de
ser contestados por azar; por lo que sigue siendo el mejor considerado, el ms
popular y ms utilizado de las PO. Su aplicacin resulta til por varias razones:
a) Permiten medir con precisin y sin ambiguedades procesos intelectuales
superiores: orden, seleccin, anlisis, sntesis, etc.; es decir, todos los objetivos
del mbito cognoscitivo, a excepcin de la capacidad de expresin, tan impor-
tante en muchas materias, pero no tan evaluada realmente en nuestras aulas
como se pretende. Aunque para ello hay que recurrir a indicadores indirectos,
limitacin que es comn a la mayora de los instrumentos de evaluacin.
b) Los alumnos creen que los EM son menos ambiguos que los V;F o Rl.
Los profesores, por su parte, encuentran ms fcil poder defender sus respues-
tas correctas. Todo ello contribuye a una interpretacin precisa que asegura su
objetividad y aumenta su fiabilidad y validez.
Pueden facilitar el azar; pero parecen, tanto a alumnos como a profesores,
menos susceptibles de errores provocados por la adivinanza que otros forma-
tos. De todas maneras, este inconveniente se puede reducir siguiendo las suge-
rencias dadas sobre su construccin.
Adems, como ya se apunt en el captulo 3, la estadstica permite corregir
el azar al calcular la calificacin por medio de frmulas tales como:
M
N=B---
d -1
En donde: N = calificacin.
B = nmero de tems bien contestados.
M = nmero de tems mal contestados.
d = nmero de distractores.
e) Su preparacin colegial, en equipo, permite una crtica constructiva de
las preguntas. No intervienen necesariamente los constructores de la prueba en
su correccin, por lo que su calificacin es fcil y rpida. Se prestan tambin a
anlisis estadsticos tiles.
d) La muestra de objetivos que se pueden evaluar con tems EM es ms
amplia que con otros formatas. Y se pueden detectar por separado niveles de
Pruebas de eleccin mltiple 119

competencia en cada objetivo para ofrecer unfeedback, tanto al alumno corno


al docente, propio de una evaluacin formativa.
Pero, al mismo tiempo, deben tenerse en cuenta algunos inconvenientes
para evitarlos. Por otro lado, debemos decir que casi todas las crticas que se
hacen a las PO son extensivas a las EM.

e) La construccin de buenos tems EM requiere una preparacin laboriosa,


una competencia y prctica no comunes; en definitiva, una especializacin a
veces inasequible a la mayora de los profesores.
f) Se critica que no facilitan la valoracin de datos y conceptos, reduciendo
el conocimiento a lo que se puede encerrar en afirmaciones simples, con el
peligro de vulgarizarlo al sugerir que a cada problema le corresponde una y slo
una respuesta. Sin embargo, basta con examinar la evidencia de las interpreta-
ciones vlidas de los resultados obtenidos por cientos de tems bien construi-
dos para llegar a la conclusin de lo infundado de estas crticas (Osterlind,
1998).

COMPARACiN TEMS V/F y EM 3.

Hay semejanzas sustanciales entre los dos tipos de tems. En los tems EM hay
implcitamente una afirmacin verdadera y varias falsas, por lo que controlan
los objetivos de manera semejante; y cuando los tems EM se transforman en
V/F, y viceversa, las calificaciones obtenidas por grupos semejantes de alumnos
se correlacionan tanto corno lo permiten sus ndices de fiabilidad (Frisbie,
1973).
Una diferencia obvia es el nmero de alternativas que se le ofrecen al alum-
no; pero precisamente esta diferente concrecin y definicin de la tarea presen-
tada suele hacer ms difcil juzgar si una afirmacin aislada es verdadera o falsa
en los tems V/F, que juzgar por comparacin cul de varias alternativas es la
mejor respuesta en los EM.
Sin embargo, hay circunstancias en que ambos formato s no son equivalen-
tes, sino que, por el contrario, se aconseja uno de ellos, corno ilustran los ejem-
plos de la tabla siguiente:
A. Para los tems que se basan en proposiciones, es indiferente el formato.
B. Cuando hay slo dos alternativas plausibles, por razones obvias es prefe-
rible el formato V/F. La preferencia por el formato EM ha llevado muchas
veces a presentar corno EM lo que es una coleccin de tems V/F.
e. Cuando los tems no se basan en proposiciones, es preferible el formato
EM.
120 La evaluacin de aprendizajes

c)
b)
a) Obedece
Se
Cambiar VERSINEM
unacompone lalasimagen
elipse. leyes.
de clulas que se M
vivas
(F)muy
forma 2b.4b.
3b. de
Un
1b. animales
correctora
2a.
La3a.
en
que
luz
4a.
La
x2/9Un
tener
sevirus
principal
virusque
Es+se
grfica
obedece
paga
vivas
El ...................................
caracterstica
forma
un
y2/4=1
sus
muy
VERSINVlF
1a. La es
principal
clulas
llega
mejor es acambiar
puedede
trabajo
compone
funcin
de
las en un
funcin
plantas
cambiar
la
es
impuestosla
leyes
grandes
grfica de la
ciudadanodevivir
es
retina
de ola
buen
retina
cnica
una
la queunams
lacantidad
de
clulas
el una
solamente
imagen
parbola
elipse lente
...........
una
.........
lente
que
.................
cnica el que
................... M
M
(F)(F)
...
........ (F)
buen
e
dad
o de ciudadano?
en de
la
clulas
retina.
luz que c) Se puedenlas
obedecer
ciudadano reproducir
leyes
que el hecho solos.
...................
de
cnica
atos 3. x2/9+ las2.siguientes
igual y2/4=1
deCul
4. de
utilidadseCul es la
NOprincipal
representa C.
B.carac-
es tems
afirmaciones funcin
que se deacomodan
una mejor al formato VlF EM
SVAI.L:lraO SVa5lnHd :la
SOdl.L SOH.LO
V/F MLTIPLES 1.

En los tems V/F mltiples, los alumnos responden decidiendo la correccin o


incorreccin de cada afirmacin por separado. Se pueden considerar como
varios tems V/F con una base comn, o tambin como un tem EM con varias
alternativas correctas; lo que cambia es la forma de presentacin. Puede ser ver-
dad cualquier nmero de alternativas asociadas, pero no existe un motivo por
el que tenga que mantenerse constante a lo largo de una prueba. Por ejemplo:
al. La monadologa refleja una concepcin de la sustancia que, segn Leib-
nitz, podra ser calificada como:
a) Una teora mecanicista [F}
b) Una teora pantesta [F}
c) Una teora dinamicista [V}
d) Una teora pluralista [V}
a2. La monadologa refleja una concepcin de la sustancia que, segn Leib-
nitz, podra ser calificada como una teora:
a) Mecanicista.
b) Pantesta.
* c) Dinamicista.
* d) Pluralista.

Nota: El al es un tem con formato V/F mltiple. El a2 es el mismo tem con


formato EM en el que existen dos alternativas correctas la c) y d), por lo que el
proceso mental que debe hacer el alumno es el mismo en ambos casos.
Aplicacin: Al aplicados, el profesor debe evitar protocolos que repitan el
mismo nmero de respuestas verdaderas. Los alumnos perciben generalmente
los V/F mltiples ms fciles que los EM.Adems, presentan la ventaja de poder
controlar un tema con ms extensin, porque los alumnos pueden responder a
tres tems V/F mltiples en el tiempo que necesitan para responder uno EM de
respuesta nica.
124 La evaluacin de aprendizajes

2. RESPUESTASCOMBINADAS

Las respuestas combinadas (RC) son una variante que sintetiza los formato V/F y
EM. Se proponen varias alternativas como en los tems V/F mltiples, pero lue-
go se agrupan para pedir, en formato EM, la combinacin correcta. Por ejemplo:
Entre los hechos de intervencin de Felipe 11en la poltica interior de Francia, se
pueden citar:
A La candidatura de Eugenia de Montijo al trono francs.
B. El tratado de Vervins.
e El tratado de la Isla de los Faisanes, en Bayona.
D. El tratado de Chateau-Chambrsis.
E. Lapresencia de Margarita de Parma en los Estados Generales de Francia.
Elegir la combinacin correcta:
a)AyB
b)ByC
* c) ByD
d)DyE

Aplicacin: La investigacin que compara los tems EM, V/F mltiple y RC


llega a la conclusin de que estos ltimos requieren ms tiempo de preparacin
y respuesta, son menos eficaces y dan calificaciones menos fiables. En general,
los alumnos los perciben ms difciles, prefieren los tems EM y V/F mltiples,
por lo que no conviene, en este tipo de tems, introducir una complejidad inne-
cesaria.

Las RC pueden justificarse cuando el profesor, queriendo uniformar todos


los tems de un examen a formato EM, no encuentra distractores adecuados.

3. EMPAREJAMIENTO

Las preguntas de emparejamiento (EP), o pruebas por pares, se componen de


dos listas, una de premisas y otra de respuestas, e instrucciones claras para
emparejar ambas listas.
Se puede usar una gran variedad de combinaciones premisas-respuestas:
fechas y sucesos, conceptos y definiciones, escritores y obras, magnitudes y uni-
dades, cantidades y frmulas, trminos y zonas numeradas de un dibujo, etc.
al. Escribir la unidad alIado de la magnitud que corresponda:
l. Resistencia elctrica ..... (A)Amperio
2. Intensidad de corriente ..... (C) Culombio
3. Carga elctrica ..... (V) Voltio
4. Diferencia de potencial ..... (W] Watio
5. Potencial ..... () Ohmio
Otros tipos de pruebas objetivas 125

6. Potencia elctrica .
7. Trabajo elctrico .

En las instrucciones se puede pedir que se escriba la respuesta alIado de la


premisa, como en el tem al, o en lugar aparte (In, ZA,3C, 4V,etc.) para facilitar
la correccin. Tambin se puede reducir a formato EMcomo en el tem siguiente:
a2. Relacionar algunos Hechos histn'cos o periodos representativos (nmeros)
con las Edades o grandes divisiones de la Historia (letras maysculas):
Hechos:
l. Pinturas rupestres y Edad de los Metales.
2. Procesos socialmente conflictivos como la Revolucin Francesa y la Revolu-
cin Americana.
3. Nacimiento de organizaciones internacionales, guerras, crisis mundiales,
colonialismos y nacionalismo.
4. Micnico Antiguo, la sociedad esclavista, el Alto Imperio y el Cristianismo
primitivo.
5. La Hgira, Carlomagno y las Cruzadas junto con el precapitalismo comer-
cial.
6 El Barroco, la Ilustracin, la Reforma protestante y el precapitalismo
comercial.
Edades:
A Prehistoria
B. Edad Antigua
C. Edad Media
D. Edad Moderna
E Edad Contempornea
Elegir el apartado en que estn correctamente relacionadas las Edades con los
Hechos:
a) lA, 2E, 3G, 4E, 5B, 6D
b) lB, 2D, 3E, 4G, 5A, 6E
c) lA, 2E, 3D, 4G, 5B, 6E
* d) lA, 2E, 3E, 4B, 5G, 6D

Construccin: He aqu algunas sugerencias para construidas:


a) Homogeneidad: Conviene elegir premisas y respuestas de forma que su
contenido sea homogneo, es decir, que traten de una sola categora; cuando no
se observa esta norma, aparecern fcilmente pistas de solucin. Por ejemplo:
Situar los siguientes elementos en sus correspondientes partes del cuerpo huma-
no:

Partesdel cuerDohumano: Elementos:


l. Brazo A Bceps
2. Cabeza B. Falange
3. Cuello C. Hgado
4. Dedo D. Tibia
5. Pierna
6 Tronco

Solucin: Al, B4, C6, D5.


126 La evaluacin de aprendizajes

Nota: Laheterogeneidad de los elementos que se presentan, huesos, mscu-


los y vsceras, facilita el establecer, casi por sentido comn, la relacin que se
pide.
b) Brevedad: Aunque en muchos casos ambas listas se pueden intercam-
biar sin dificultad, el uso de las frases ms largas como premisas y las ms cortas
como respuestas facilita al alumno la tarea de encontrar la pareja correcta.
Se recomienda, adems, que no sea excesivo el nmero de premisas y res-
puestas. Aumentar el nmero de respuestas ms all de 4 o 5 reduce el azar
muy poco, ya que la diferencia en las probabilidades de dar una respuesta
correcta por azar entre tems de 5 y de 6 respuestas es slo de un 0,03 (Ebel Y
Frisbie, 1977). La prctica recomienda proponer 6 o 7 premisas para emparejar
con 4 o 5 respuestas, o viceversa.
c) Longitud de las listas: Se recomienda no usar el mismo nmero de
respuestas y premisas, para eliminar el peligro del emparejamiento perfecto en
el que el ltimo se puede deducir de los anteriores. Por ejemplo:
Relacionar, emparejando autores y perodos literarios:
1. Fray Luis de Len A Barroco
2. Gngora B. Realismo
3. Espronceda e Romanticismo
4. Galds D. Renacimiento

Solucin: ID, 2A, 3G, 4B.

Nota: Sabiendo 3, la ltima se puede acertar por exclusin.


d) Orden alfabtico o numrico: Ordenar tanto las premisas como las
respuestas en orden alfabtico o numrico evita dar pistas no pretendidas.
Aplicacin: Aunque a veces pueden medir comprensin de conocimientos,
generalmente miden memorizacin de informacin factual especfica: nombres,
fechas, etiquetas, etc.
Tienen la ventaja de reducir el nmero de preguntas en un examen, concen-
trando la atencin en aspectos concretos de temas particulares, y proporcionar
muchas respuestas calificables independientes por pgina o por unidad de tiem-
po de examen, pero pocas veces debe todo un examen consistir en tems EM.

4. CLASIFICACiN

El formato de clasificacin (CL) consiste, de manera semejante a los tems EP,en


una lista de respuestas que hay que clasificar entre las premisas que se propor-
cionan; pero difieren de ellos en que, mientras en los tpicos tems EP cada res-
puesta se empareja con una sola premisa, en los tems CL la misma premisa se
empareja con ms de una respuesta. Por ejemplo:
Otros tipos de pruebas objetivas 127

al. Instrucciones: Localizar cada suceso (respuestas ordenadas con nmeros)


con el perodo en que sucedieron (premisas ordenadas con letras):
A Antes de Cristo (a. C)
B. Despus de Cristopero antes de la invasin islmica (711 d. C.)
C Despus de la invasin islmica, pero antes de que Coln llegase a Amrica
(1492)
D. Despus de que Coln llegase a Amrica, pero antes de la Revolucin Fran-
cesa (1789)
E. Despus de la declaracin de la Revolucin Francesa (1789)
1. La batalla de Las Navas de Tolosa k
2. El asentamiento agrcola en el Levante espaol A
3. La Escuela de Traductores de Toledo """'"'''''''''''''''''''''''''''''''''''''''''''''''''''' k
4. La expulsin de los moriscos "" , 12
5. El nacimiento de Francisco de Quevedo 12
6 La instauracin de la I Repblica espaola !i
a2. Instrucciones: Calificar cada una de las afirmaciones siguientes con:
A La afirmacin es verdadera, si se da la condicin.
B. La afirmacin es verdadera, independientemente de la condicin.
C. La afirmacin es falsa, si se da la condicin.
D. La afirmacin es falsa, independientemente de la condicin.
E. No es posible determinarlo sin ms datos.
1. A(i'rmacin: La fuerza de atraccin o repulsin entre cargas es inversa-
mente proporcional al cuadrado de sus distancias,
Condicin: si las cargas son cuantitativa mente iguales.
2. Afirmacin: La direccin del flujo de electrones a travs de un conductor es
irreversible,
Condicin: aunque se permuten las cargas en los terminales.
3. Afirmacin: Dospartculas cargadas se repelen,
Condicin: si se aproximan suficientemente.
4. Afirmacin: Una partcula cargada negativamente repele a otra partcula
cargada positivamente,
Condicin: si la carga negativa de la partcula es mayor.
5. Afirmacin: Dos objetos cargados se repelen mutuamente,
Condicin: si ambos atraen de manera semejante objetos cargados.
Solucin: Correctas lB, 2G,3E, 4D, 5A

Nota: Es claro que no es suficiente memorizar conceptos, sino una gran


comprensin del tema, para responder este tem de eL.

RESPUESTADOBLE 5.

Las preguntas de doble respuesta CRD)son una combinacin de V;F,donde se


comprueba la memorizacin, y emparejamiento posterior CEP),con lo que se
comprueba la comprensin. Por ejemplo:
128 La evaluacin de aprendizajes

En las afirmaciones siguientes, sealar si son verdaderas [V} ofalsas [F}:


El origen de una era glacial debe buscarse en:
A Laglaciartosis producida por lospolos [F]
B. Las variaciones de la rbita terrestre [V]
C. Las variaciones de inclinacin del eje terrestre [V]
D. Lafusin de los rayos ultra violeta y el CO2 .................................................. [F]
E. El efecto albedo [V]
E El efecto invernadero [F]

Ahora escoger,de entre las siguientes, las causas que expliquen cada una de las
afirmaciones sealadas como verdaderas.
1. La eclptica terrestre.
2. El movimiento de campos magnticos polares, que suponen diversas radia-
ciones incidentes en la meteorologa fra.
3. La diferencia de potencial calorfico de polos y ecuador.
4. La reflexin de los rayos solares durante el verano por la nieve acumulada
durante el invierno.
5. Lafiltracin espacial de variantes trmicas estelares.
6 La desviacin del movimiento rotacional, que supone la incidencia solar en
zonas ms o menos amplias de lospolos.
7. El enfriamiento progresivo producido por la capa de CO;!que impide la nor-
mal refrigeracin ambiental del planeta.
Solucin: B1, C6, E4.

6. RESPUESTALIMITADA

En las preguntas de respuesta limitada (RL)se pide una respuesta abierta y cor-
ta. Aunque son preguntas abiertas, por ser stas muy limitadas, ya que se exige
un dato predeterminado y preciso; suelen considerarse como PO. Si preguntan
una frase, debe ser corta y especfica. Los tems que exigen respuestas ms lar-
gas se clasifican ms bien como respuesta abierta (RA). He aqu algunos ejem-
plos:
Elpseudnimo de Jos Martnez Ruiz es:(lzorn.
Culesson los moifemas del verbo?Tiempo. modo. Dersona nmero v asDecto.
Escribir el nombre comn de los siguientes compuestos qumicos:
A CaCO] Caliza
B. NaCI Sal
C. C1fl22011 Azcar
D. NH] Amonaco

Construccin: Deben tenerse en cuenta los siguientes consejos prcticos:


a) Respuesta nica: Hay que expresar la pregunta de manera que obligue
a una nica respuesta, cualquiera que sea la forma en que aparezca. Por ejem-
plo, consideremos la cuestin: "Coln descubri Amrica en ;
Otros tipos de pruebas objetivas 129

se hace para que el alumno responda en el ao 1492,pero se pueden obtener


respuestas como en Carabela. O la pregunta: Ques carbn?, de la que se
espera carbono con impurezas, puede sugerir respuestas tales como mate-
ria vegetal petrificada o una fuente de energa. Si parece que pueden darse
respuestas conceptualmente distintas para una misma pregunta, debe revisarse
su redaccin y reformularse, con objeto de prevenir la indefinicin de lo que se
examina y la consecuente dificultad en calificar, y de reducir a una las posibles
respuestas hasta que desaparezca la ambiguedad. En consecuencia, las pregun-
tas anteriores se pueden reformular:
al. En qu ao descubri Coln Amrica?
a2. Cul es el elemento qumico fundamental del carbn?

b) La respuesta antes que la pregunta: El centro de una RL es la res-


puesta, por lo que se debe pensar primero en ella y, a continuacin, escribir la
pregunta apropiada para dicha respuesta.
Eliminar algunas palabras de frases de libros de texto para convertidas en
tems de RLtiene el peligro de producir ambigliedades, al prescindir del contexto
en que estn escritas. Por ejemplo, la frase mutilada: Las tormentas se forman
cuando columnas de aire suben a alturas ms fras es una pregunta
ambigua porque tiene como posibles respuestas correctas ms caliente, ms
bajo y hmedo.
c) Preguntas directas: Las formulaciones interrogativas facilitan contestar
de una manera ms concisa y clara que las frases incompletas. Por ejemplo:
Los dos elementos constitutivos de la oracin son ~

se puede transformar fcilmente en forma interrogativa ms clara:


Cules son los dos elementos constitutivos de la oracin?

d) Evitarpistas: La expresin msfras en la pregunta anterior sobre las


tormentas sugiere la pista de que el aire, antes de elevarse, debe haber sido
ms caliente.
Los espacios en blanco son otra pista comn no deseada, pues ayudan al
alumno a determinar la extensin de las respuestas, por lo que deben trazarse
con la misma longitud. Un ejemplo de ello puede ser el siguiente:
Los ttulos de las dos novelas de Clarn son y ~

Nota: El primer espacio pequeo, reservado a La Regenta, y el grande, para


Su nico hijo, facilitan el tem sobre todo a los alumnos que no estn seguros
de los ttulos.

e) Concisin: Conviene expresar el tem tan concisamente como sea posi-


ble, sin perder la claridad de la pregunta. El exceso de palabras malgasta el tiem-
po del alumno y puede crear confusin.
130 La evaluacin de aprendizajes

f) Evitar expresiones convencionales o usuales: Esto favorece el estu-


diar memorsticamente, ms que comprender las ideas. Por ejemplo:
al. Dos rectas perpendiculares a la misma recta contenidas en el mismo plano
son entre s _

Una versin mejor de esta pregunta sera:


a2. Si se trazan dos rectas perpendiculares a la misma recta en una hoja de
papel, las dos rectas son _

Aplicacin: Los tems RL tienen un lugar en la evaluacin educativa: son


fciles de construir; se ven mucho menos afectados por el azar facilitado por la
eleccin aleatoria de las respuestas, aunque ms por el azar que supone la selec-
cin limitada de la muestra; y, si el grupo de alumnos es razonablemente peque-
o, el trabajo de correccin no es excesivamente pesado. Es el formato que
debe elegirse cuando los alumnos tienen problemas de lectura o escritura.
Los tems RLson eficaces para comprobar el recuerdo de datos, entre otros,
nmeros, personas, lugares, procesos, palabras en idiomas extranjeros o smbo-
los matemticos, qumicos, msicos o lgicos, que constituyen un substrato
importante de todo conocimiento. Por ello se usan frecuentemente en materias
y niveles de enseanza donde hay que aprender vocabularios bsicos en temas
tales como ortografa, geografa y aritmtica, y en aquellas partes de la ciencia
donde hay que aprender nombres de estructuras y smbolos. Pero el conoci-
miento abarca ms, mucho ms que los datos que se pueden reducir a una sola
palabra, frases cortas y nmeros. Por lo tanto, los tems RL controlan mucho
menos que otros formatos y, como consecuencia, mientras que cualquier tem
RLpuede transformarse en V/F o EM, slo unos pocos tems V/F o EM se pue-
den convertir en RL.

7. PROBLEMAS CIENTFICO-MATEMTICOS

Los problemas cientfico-matemticos (CM), a veces mal llamados problemas


numricos, son un formato de prueba frecuente en materias en las que se estu-
dian relaciones cuantitativas.
Es una prueba peculiar que no se suele clasificar entre las PO, ya que, aun-
que excepcionalmente se puede presentar en formato EM para que el alumno
elija entre varias alternativas de procesos o resultados, por lo comn debe no
slo hacer una elaboracin mental, sino registrar materialmente tanto el proce-
so para solucionado como el resultado. No obstante, es frecuente considerada
como variante del formato de respuesta limitada (RL), ya que la respuesta que
el alumno debe construir suele estar previamente acotada. Es esta la razn por
la que tampoco se le clasifica como respuesta abierta (RA),a no ser en aquellos
casos en que el alumno tiene que crear un proceso indito para resolvedos.
Otros tipos de pruebas objetivas 131

Los problemas CM proporcionan la base de una gran variedad de tems y


son una buena manera de comprobar la comprensin y la aplicacin, en con-
traste con la mera memorizacin de conocimientos. Esto, junto al hecho de que
las respuestas sean concisas y fcilmente calificables, supone que los problemas
CM sean un formato muy popular de examen. Con la ventaja aadida de que se
pueden construir diferentes versiones de los mismos problemas slo con modi-
ficar los datos y su forma de presentacin.

Construccin: En general, a la hora de construirlos se debe tener en cuenta


que el problema represente todo y slo lo que se quiere comprobar, y que no se
introduzcan simplificaciones ni complejidades inintencionadas. La dificultad est
en precisar los dos aspectos que se suelen considerar en los problemas CM, es
decir, el proceso seguido y el resultado obtenido. No se pueden dar normas defi-
nitivas para formularIos; sin embargo, las siguientes pautas pueden ayudar.
a) Enunciado claro: Hace unos aos se hizo un estudio para comprobar
si la inclusin de datos irrelevantes en los problemas de Fsica mejoraba la eva-
luacin; esta hiptesis se basaba en la premisa de que los problemas de la vida
real incluyen datos relevantes y no relevantes: si slo se proporciona la informa-
cin que se necesita, facilita su posible solucin a los alumnos menos capaces.
Las conclusiones de esta investigacin demostraban que la inclusin de los
datos irrelevantes no mejoraba los tems, que generalmente eran ya lo suficien-
temente complicados sin ellos (Ebel y Frisbie, 1977).
Por consiguiente, hay que expresar el enunciado del problema de la manera
ms clara (afirmaciones simples y directas) y concisa (eliminacin de palabras
innecesarias, comentarios y datos irrelevantes) que permita lo que se quiere
evaluar; no obstante, hay que tener en cuehta que en algunos casos la interpre-
tacin de la complejidad de un enunciado es parte de lo que se quiere evaluar.
As, para controlar el clculo, conviene introducir nmeros tan complejos
como sea necesario. Por el contrario, si el fin del tem es controlar slo la com-
prensin, no la capacidad de clculo, hay que simplificar el enunciado usando
nmeros lo ms simples posible; por ejemplo:
al. Cul es el rea de un rectngulo cuya base es 3 cm y su altura 4 cm?
a2. Cul es el rea de un rectngulo cuya base es l,23.lrr cm y su altura
2,82. ~h05cm?
Nota: Si ambos tems pretenden comprobar el mismo objetivo, compren-
der la frmula del rea del rectngulo, el peso de clculo en el segundo hace
que suponga otras capacidades, pero no sea ms relevante como medida de
dicho objetivo.
Cuando sea necesario, se debe especificar tambin el grado de precisin de
las respuestas, por ejemplo, slo el orden de la magnitud o la cantidad exacta;
ya que, si los alumnos no estn seguros de lo que se les pide, la medida de lo
que son capaces de hacer ser menos vlida.
132 La evaluacin de aprendizajes

b) Dividir problemas: Se puede reestructurar el enunciado para dividir


un problema complejo en varios, cada uno con un apartado, cuando sea tcni-
camente posible hacerla sin dirigir sensiblemente el proceso de solucin. Ten-
dremos as indicadores de logros parciales, lo que mejorar la fiabilidad de las
calificaciones. Consideremos los siguientes dos tems:
al. El ao pasado Fernando vendi 60 coches a un precio medio de 9.000 . Pre-
tende vender este ao el 50% ms de coches. Si Fernando gana una comisin del
10% en cada venta, cunto ms ganar este ao si alcanza sus objetivos?

a2. El ao pasado Fernando vendi 60 coches a un precio medio de 9. 000 . Pre-


tende vender este ao el 50% ms de coches. Fernando gana una comisin del
10% en cada venta.

a) Cuntos coches espera vender este ao?


b) Cunto gan con las ventas del ao pasado?
c) Cunto espera ganar con las ventas de este ao?

Nota: Aunque aparentemente iguales, son problemas distintos; habr que


proponer uno u otro segn el objetivo que se pretenda comprobar.
SElHBI1 SYBElnHd
Lo especfico de las pruebas libres (PL) o abiertas es la libertad de expresin del
alumno, que ha de organizar sus propios conocimientos, seleccionar lo ms
importante y manifestar su creatividad y originalidad, integrando en un todo
armnico los elementos de su respuesta. No hay que elegir, en consecuencia,
una respuesta determinada previamente, como en las PO. Sin embargo, al
igual que stas, suponen tambin objetividad y elaboracin, requisitos impres-
cindibles de toda prueba. En este extremo estn de acuerdo la mayora de los
autores.
No es tan unnime, sin embargo, el consenso en lo que se refiere a la pre-
tensin de que existen objetivos exclusivamente evaluables a travs de las PL:
algunos los extienden a todos los que tienen que ver con el anlisis, sntesis y
valoracin crtica; otros, en cambio, los reducen a los relacionados con la capa-
cidad de expresin, porque defienden que el pensar y razonar no es exclusivo
de este tipo de prueba.
Al enfrentarse a las PL, los alumnos deben dominar un amplio bagaje de
conocimientos que les permita exponer datos, mtodos y conceptos, organizar-
los de manera lgica y coherente, relacionados y expresar todo ello de forma
adecuada. Por ello, quienes prefieren las PLa las PO sealan a menudo que tales
aspectos proporcionan informacin sobre la naturaleza y calidad de los proce-
sos mentales de los alumnos, as como una mejor indicacin de los logros de
aprendizaje. Esta apreciacin se resume, en definitiva, en que construir es ms
que seleccionar (cap. 4), en la falsa creencia de que slo se construye en las PL,
y no en las PO; cuando en estas ltimas, obviamente, el alumno tambin sigue
un proceso mental de construccin -siempre necesario para la seleccin de la
respuesta entre una serie de alternativas-, que a veces no se materializa.
Son muchos los formatos que responden al esquema de las PL. Trataremos
en primer lugar de las pruebas o preguntas de respuesta abierta, como formato
ms representativo de las caractersticas de este tipo de pruebas. En el captulo
9 presentaremos otros tipos de PL.
136 La evaluacin de aprendizajes

1. RESPUESTAABIERTA

Las preguntas de respuesta abierta (RA),conocidas tambin con los nombres de


pruebas de respuesta libre, de ensayo, tradicionales o examen clsico, son el
formato de PLms popular y an el ms utilizado, sin que esto quiera decir que
estas pruebas constituyan siempre el mejor instrumento de evaluacin. Sus or-
genes pueden rastrearse ya hacia el ao 1115 a. C. en la China Imperial (Coff-
man, 1971), y constituyen la nica prueba de formato escrito que se us casi sin
interrupcin hasta principios de nuestro siglo. Sin duda, tienen que encerrar
grandes ventajas para obtener la sancin de la tradicin.
Hay muchas razones que justifican su popularidad; entre otras, se adaptan a
todo objetivo de aprendizaje, imposibilitan responder por azar, es ms difcil
copiaf. En todo caso, las ventajas de las RApresuponen la aplicacin de una
tcnica muy minuciosa en su elaboracin y correccin, que nos proponemos
detallar en las pginas siguientes.
Sin embargo, es preciso, desde el primer momento, destacar algunos aspec-
tos negativos de su aplicacin que hacen que, con excesiva frecuencia, se
improvisen malas preguntas, con el consiguiente desprestigio. Entre otros, los
siguientes: la ignorancia de las normas de construccin y correccin, la idea
general de que son ms econmicas, el abuso de la comodidad que represen-
ta su aparente facilidad de redaccin y su menor tiempo de preparacin, la
necesidad de hacer menos preguntas ms generales. Por todo ello, y en buena
lgica, las crticas al examen clsico deben atribuirse ms bien a estas preguntas
mal elaboradas.
Otra circunstancia negativa es la aparente seguridad en la que se puede
escudar el profesor cuando no tiene que mostrar su propia versin de las res-
puestas: en estos casos, las posibles deficiencias de una RA,al contrario de las
de una PO, siempre patentes, quedan ocultas y no estn disponibles para ser
observadas y criticadas.
Contribuye tambin a su mal uso el hecho de que la dificultad intrnseca de
las preguntas se pueda reconsiderar con posterioridad; es decir, las bases de califi-
cacin, siempre decisin personal del docente, algunos no las expresan al pro-
poner las RA y, aun cuando se expliciten y hagan pblicas previamente, en la
mayora de los casos las calificaciones otorgadas se pueden justificar y defender
ante los alumnos. Esto permite controlar el nivel general de las notas y su distri-
bucin, al ajustar con posterioridad los resultados para que aprueben y suspen-
dan un nmero determinado de alumnos, independientemente de la dificultad
de las preguntas. Se puede as matizar, ms fcilmente que con PO, la valoracin
criterial con la normativa.

Construccin: A la hora de construir preguntas de RA,se deben tener en


cuenta los siguientes aspectos:
Pruebas libres 137

1. Objetivo: Es necesario tener a la vista, como en las PO, las variables que
se quieren medir. Subrayamos aqu esta condicin, ya que sin objetivos explci-
tos es casi imposible construir PO; sin embargo, a veces, resulta ms fcil for-
mular preguntas de RAsin hacer una detenida y previa consideracin de lo que
se pretende evaluar. Muchos de los rasgos que se dicen medir con las RA,tales
como la originalidad, no se suelen definir claramente por la especial dificultad
de explicitar sus indicadores; por ejemplo, se llega a valorar la creatividad o el
pensamiento crtico, aunque sea difcil concretar los rasgos que pueden permi-
tir su medicin (Fernndez Garrido, 1980; Forteza. 1974; Olea, 1993).
2. Instrucciones: Las instrucciones claras son tanto ms necesarias cuanto
menor sea el nivel de desarrollo del alumno. En todo caso, como ya dijimos al
hablar de las PO, no se deben repetir en cada examen; cada profesor marca
al principio las reglas del juego. Estas instrucciones, que pueden referirse a la
presentacin de las preguntas y de las respuestas de los alumnos, al rigor en las
expresiones cientficas, a la duracin del examen, etc., a menudo condicionan la
misma dificultad de la prueba.
3. Normas: Buscamos la fuente de inspiracin de las normas de construc-
cin precisamente en las deficiencias que se deben evitar.
Las limitaciones ms serias de las RAcomo medidas de logros se refieren a la
fiabilidad de las calificaciones obtenidas con ellas. Recordemos que baja fiabili-
dad significa que hay inconsistencia entre las calificaciones obtenidas de prue-
bas propuestas sucesivamente, o calificaciones independientes del mismo exa-
men. Las conclusiones de una serie de investigaciones (Stalnaker, 1966) ponen
de manifiesto que distintos correctores competentes e independientes asignan
a menudo puntuaciones diversas a la misma RA;cada corrector tiene su estilo
propio de calificacin: lo que para unos es importante, puede seda menos para
otros. Incluso el mismo corrector asigna puntuaciones distintas a la misma
prueba cuando ha mediado un determinado perodo de tiempo.
Son tres las principales causas de esta baja fiabilidad que pueden ayudar a
identificar mejor las normas de construccin.
a) La muestra limitada de contenido cubierto por el examen. En compara-
cin con las PO, se han hecho pocos estudios experimentales de la fiabili-
dad de las muestras de RA;en parte por la dificultad de obtener en ellas
calificaciones suficientemente objetivas. Ruch (citado por Ebel y Frisbie,
1977) puso de manifiesto que hay una relacin directa entre la extensin
de la muestra de tareas en un examen y la precisin con que pueden
diferenciarse los niveles de logros. Es obvio que la suerte del alumno en
ser preguntado sobre lo que sabe supone, cuantos menos tems tenga el
examen, un fctor que influye ms en la calificacin que recibe.
b) La indefinicin de las tareas propuestas en las preguntas. En muchas RA,
la tarea indicadora del logro y la base para juzgado no estn especificadas
de manera fcil de entender. Cuanto ms detalladas y explcitas sean, tan-
138 La evaluacin de aprendizajes

to para el alumno como para el profesor, ms objetivas y fiables sern las


calificaciones que se obtienen de las RA.
c) La subjetividad. Aunque las RAse pueden calificar fiablemente cuando se
corrigen con cuidado, se admite casi sin discusin que la subjetividad
influye en mayor medida en las calificaciones de este tipo de pruebas.
La limitacin de la muestra y la indefinicin de tareas, como causas de la fal-
ta de fiabilidad de las RA,sugieren precisamente una serie de normas para evi-
tadas, mejorando su construccin; mientras que la subjetividad orienta ms
bien la correccin. De las normas de construccin hablaremos a rengln segui-
do y ms adelante de los aspectos de la correccin.
Algunas normas de construccin son tan obvias que no merece la pena ni
citadas. Por ejemplo, el hecho de que las preguntas se refieran a un conoci-
miento esencial; es decir, hay que hacer preguntas o proponer tareas que
requieran que el alumno demuestre no slo la reproduccin de cualquier
contenido presentado en los libros de texto o durante la explicacin, aunque
muchos diran que esto no es poco. Con otras palabras, para hacer las pregun-
tas, sera conveniente no slo mirar hacia atrs e inspirarse en lo que se dijo
en clase, sino mirar hacia delante y preguntar aplicaciones importantes de lo
aprendido.
Otras sugerencias, no tan obvias, son las siguientes:
a) Respuestas breves: En general, los logros de aprendizaje en un campo o
materia especficos se pueden apreciar mejor cuanto mayor sea el nmero de
preguntas o tareas propuestas en el examen. Es cierto, sin embargo, que a veces
la respuesta a una sola pregunta compleja entraa ya una integracin coherente
de elementos variados de aprendizaje. El problema surge cuando la intencin es
incidir en esos elementos aislados, que suponen relacin de mltiples logros, y
tanto alumno como profesor tratan la respuesta como un todo ms o menos inte-
grado; desvirtuando, en consecuencia, la perspectiva analtica inicial de la prueba.
Surge, entonces, el dilema: Pocas preguntas de amplio recorrido, o muchas
y ms delimitadas? En el primer caso, se resiente la fiabilidad, se restringe la
amplia base de la materia a pocas parcelas determinadas, y se corre el peligro
de no construir una muestra lo suficientemente representativa. En el segundo,
las RAse acercaran ms a las PO, con la consiguiente prdida de las ventajas de
seleccin y sntesis que las RAconllevan.
No es fcil, pues, categorizar. Se recomienda, no obstante, dar preferencia a
ms preguntas y ms especficas, con objeto de conseguir una mayor fiabilidad
mediante una muestra ms representativa y una menor ambiguedad. En el caso
de estimar necesario hacer preguntas de amplio recorrido, el profesor ha de
sopesar la justificacin de su valor intrnseco y la probable prdida de fiabilidad
de las calificaciones.
b) Tareas deftnidas: Algunos profesores ocasionalmente proponen pre-
guntas de contestacin indeterminada, ya que, dicen, las conclusiones que
Pruebas libres 139

sacan los alumnos no es lo importante; lo importante es, ms bien, la evidencia


en la que basan sus conclusiones y la lgica de sus argumentos. Sin embargo,
no es aconsejable hacer preguntas en cuya respuesta los expertos puedan no
estar de acuerdo. Las preguntas de contestacin indeterminada y controvertida
son ms propias de actividades y ejercicios durante la instruccin, que de situa-
ciones para evaluar aprendizajes, ya que las diferentes opiniones y prejuicios
personales pueden influir considerablemente en la evaluacin de las respuestas
de los alumnos. Incluso ms, la ausencia de una buena respuesta puede hacer
que la pregunta quede invalidada para juzgar logros.
Por el contrario, debe definirse lo que se le pide al alumno tan completa y
especficamente como sea posible, para ayudade a organizar sus conocimientos
y capacidades, inmediatamente en el examen y mediatamente en su estudio
personal; pero sin interferir con la medida de los objetivos, y menos facilitada, o
darle ms libertad que la necesaria para medir los logros pretendidos.
Para ello, debe expresarse la pregunta sin ambiguedades, de manera que los
alumnos comprendan totalmente lo que se espera que hagan. No hay que limi-
tarse a preguntar slo un contenido, Las Leyes de Newton, ni tampoco una
capacidad, Decir todo lo que sepas, sino simultneamente ambos aspectos del
objetivo seleccionado. Por ejemplo, si se trata de objetivos de comprensin:
enumerar algo, definir/o, dar las razones, explicar, resumir, comparar y
definir, qu, cmo, cunto; y resolver, analizar, disear un plan, valorar,
criticar una realidad, en caso de que el objetivo se refiera a capacidades ms
complejas, Goring (1971) y Gronlund (1974) distinguen y califican, a nuestro
juicio errneamente, las preguntas de memorizacin y comprensin como
Restringidas.y las de sntesis y valoracin como Libres.Puede ayudar el aa-
dir una explicacin inspirada en los criterios con que se va a evaluar la respues-
ta; por ejemplo, en vez de preguntar escuetamente Definir metfora, es pre-
ferible Definir los distintos tipos de metfora ilustrndolos con ejemplos.
A este propsito, se cuenta que un alumno aseguraba que se le haba suspendido
en Fsica injustamente. Se le da una nueva oportunidad; el profesor le formula la
aparentemente clara, escueta y directa pregunta: Cmo se puede calcular la altu-
ra de un edificio por medio de un barmetro. Haba transcurrido casi una hora
sin que el alumno hubiera escrito una sola lnea, por lo que el profesor le invita a fIr-
mar y entregar el examen para no perder ms tiempo. El alumno le sorprende dicien-
do que se lo est pensando, porque tiene tantas respuestas que le es difcil decidirse
por una. El profesor, entre incrdulo y molesto, se ofrece a ayudarle en su decisin,
para lo que le pide sus hipotticas respuestas. Empieza entonces el alumno a enu-
meradas: En primer lugar, se me ocurre que puedo colgar el barmetro de una
cuerda e ir soltndolo lentamente desde arriba; y luego medir la longitud de la
cuerda usada. Puedo tambin ir subiendo por las escaleras del edificio y con el bar'
metro ir haciendo seales en la pared; tendramos as la altura del edificio en "uni-
dades de barmetro". Si hoy no estuviera nublado, podramos medir la sombra del
edificio y la del barmetro en la acera; los tringulos semejantes nos llevaran a
poder calcular tambin la altura del edificio. Si adems disponemos de un cronme-
tro, tirando el barmetro desde lo ms alto y midiendo el tiempo que tarda en lle-
gar al suelo, deduciramos el espacio recorrido, o sea, la altura del edificio; el pro-
140 La evaluacin de aprendizajes

blema es que slo vale para una vez. La siguiente es de nivel superior, pero quizs
se me admita: colgando el barmetro de una pequea cuerdecita para formar un
pndulo y midiendo el perodo en la cima y en la base, llegaramos, a travs del
valor de "g", a la altura del edificio. Pero reservo para el final la que ms me gusta:
supongo que el edificio ser importante y tendr portero; me dirigira a l y le dira:
Sr. Portero, tengo un barmetro fenomenal; si me dice la altura del edificio, se lo
regalo. El alumno dio seis respuestas, pero no la que pretenda el profesor, relacio-
nada con la presin atmosfrica. La pregunta no era tan clara.

Si la respuesta permite variacin en extensin y detalle, pero la decisin


sobre ellas por parte del alumno no es una variable relevante, el profesor debe
adelantarse y especificadas. Por otro lado, si el formato de las respuestas es sig-
nificativo, debe explicitarse en las instrucciones; as, se va imponiendo el exigir
que el alumno exprese su respuesta en forma de hypertexto. En lvarez y Soler
(1999) se estudia con detalle esta forma de estructurar la informacin; otros
autores, como Novak y Gowin (1988), ya citados en el captulo 2 al hablar del
enfoque cognitivo de la evaluacin, y Belmonte (1996), sugieren el formato ms
ambiguo de mapa conceptual.
e) Preguntas opcionales: Se recomienda no formular preguntas opciona-
les; ya que, si cada alumno elige preguntas diferentes, la base para comparar
resultados se debilita, el abanico de las calificaciones tiende a cerrarse y; como
consecuencia, ser menor su discriminacin y fiabilidad.
Algunos insisten en justificar las preguntas opcionales diciendo que hacen el
examen ms justo. Pero si todas las cuestiones son importantes, no es injusto
pedir que los alumnos respondan a todas ellas. Ms an, la oportunidad de ele-
gidas puede ayudar a los alumnos menos preparados y perjudicar a los mejor
preparados distrayndolos, es decir, perdiendo tiempo en elegir las opciones
en vez de abordar directamente las respuestas. Estas conclusiones quedan justi-
ficadas por la investigacin, desde que Meyer (1939) encontr que, cuando a
alumnos universitarios se les dio la oportunidad de omitir 1 de 5 RA,sorpren-
dentemente slo el 58% de ellos omitieron la pregunta que responderan peor.
Las preguntas opcionales pueden justificarse cuando los alumnos han tenido
diversas oportunidades de instruccin en distintos temas. Pero incluso en tales
situaciones, varios exmenes calificados por separado pueden seguir siendo
preferibles a un examen comn con preguntas optativas para dar una sola califi-
cacin.
d) Pilotar la respuesta: Se trata de no limitarse a confeccionar una gua
de correccin, indispensable si tiene que corregir un profesor distinto del que
construy la prueba, sino de ir ms all, hasta elaborar por anticipado un esbo-
zo de las posibles respuestas esperadas; es decir, redactar la respuesta ideal o
recopilar las respuestas que suelen y pueden dar los buenos alumnos. La venta-
ja es tener un punto de referencia complementario para lograr uniformidad en
la calificacin.
El hecho de pilotar la prueba es tambin una ocasin para que el profesor
reflexione sobre la calidad de lo que pregunta y la forma de preguntado, lo que
Pruebas libres 141

puede sugerir matices adicionales para mejorarla, hacindola ms o menos fcil


y ms discriminante.
e) Criterios de calificacin: Al formular la pregunta, se debe ya clarificar
su valor y asignarle al menos una calificacin global.

Correccin: Hemos dicho que una de las causas de la falta de fiabilidad, y


por tanto una de las crticas ms frecuentes a las RA,es la que se refiere a la sub-
jetividad de su correccin. El corregir con objetividad es uno de los problemas
de las RA,porque su eficacia como medida de aprendizajes depende primaria-
mente del proceso de correccin. La competencia del profesor es crucial para la
calidad de este proceso, pero incluso profesores competentes pueden hacer
cosas sin darse cuenta de que numerosos factores influyen en que los resulta-
dos sean menos fiables. Para citar algunos: fatiga, prisa, humor, primeras impre-
siones, efecto halo, desgaste de la sensibilidad (un error juzgado como grande
en el primer examen puede parecemos insignificante despus de haberlo ledo
muchas veces en los exmenes siguientes), etc.
Junto a la subjetividad, se aade el inconveniente del mucho tiempo y el gra-
do de atencin que requieren del corrector.
Para paliar estas deficiencias, adems de las sugerencias de construccin ya
mencionadas, vamos a estudiar unos mtodos y normas de correccin que, en
definitiva, refuerzan dichas sugerencias.
En general, se proponen dos procedimientos para corregir RA:el holstico y
el analtico; lo que se completa con una serie de normas para minimizar la
subjetividad de la correccin. En la actualidad, se estn desarrollando tcnicas
informticas para la correccin automatizadas; vase, por ejemplo, Shermis y
Burstein (2003).
a) Mtodo holstico: En el mtodo holstico, a veces llamado impresin
global, se asigna una puntuacin teniendo en cuenta la calidad global de la res-
puesta. Para entenderlo, puede valer la analoga del tasador de coches de
segunda mano, que hace la valoracin globalmente a partir de un indicador fun-
damental, el ao de matriculacin; y la matiza con datos tales como kilmetros
de rodaje, ciudad de matriculacin y la demanda del mercado. De la misma
manera, se puede calificar, por ejemplo, un comentario de texto por la impre-
sin de conjunto, basada principalmente en la consistencia del contenido, y
matizada por aspectos como enfoque del tema, estructura y graduacin de las
partes, conclusiones aceptables, etc.
Se presta ms para hacer una valoracin normativa relativa que criterial
absoluta, que es la ms frecuente en la evaluacin acadmica.
El mtodo holstico se puede perfeccionar haciendo una correccin por
grupos: El profesor, con una primera lectura superficial de cada respuesta, hace
una clasificacin provisional, mediante la comparacin con las otras que va
corrigiendo, y coloca los exmenes, por ejemplo, en tres grupos [Alto-Medio-
142 La evaluacin de aprendizajes

Bajo] o [Buenos-Dudosos-Malos]. Despus de terminar esta primera lectura


rpida, se vuelven a leer ms detenidamente los exmenes de cada montn
para colocados en grupos subdivididos como [Muy buenos-Buenos-Satisfacto-
rios-Malos-Muy malos] o [A-B-C-D-E],correspondientes a las notas definitivas
literales o numricas, como aparece en la siguiente figura:

b) Mtodo analtico: Se llama analtico porque descompone cada pregun-


ta en partes, encerrando cada parte una serie de elementos cruciales o categor-
as, que deben ser identificados y calificados separadamente. La presencia o
ausencia de estos elementos en cada parte de las respuestas dadas por el alum-
no determina la puntuacin; es decir, el profesor, al corregir, aade o suma
puntos por cada elemento que aparece, o resta puntos por cada elemento ine-
xacto, irrelevante o que falta.
Esto supone realizar previamente lo que se conoce como anlisis de conte-
nido. Berelson (1952) y; ms recientemente, Kripendorff (1980) han aportado
sucesivas definiciones de esta tcnica, que consiste en la descripcin analtica,
cualitativa y cuantitativa del contenido que se manifiesta en una comunicacin.
Este tipo de anlisis se aplica a una comunicacin verbal o escrita en la que pue-
dan distinguirse: aspectos formales como claridad de pensamiento, ordenacin
o sistematizacin de las ideas; aspectos gramaticales como vocabulario, estruc-
tura de las frases, ortografa, correccin del lenguaje; aspectos originales: nove-
dad en los enfoques, en la estructuracin, etc. Por consiguiente, es necesario:
distinguir las categoras que se van a observar; describir claramente esas catego-
ras para captar su presencia o ausencia en la comunicacin; asignar una pun-
tuacin a cada elemento o categora.
Los puntos que se van restando de la calificacin mxima se pueden atribuir,
por ejemplo, a alguna combinacin de las siguientes deficiencias:
a) Hay afirmaciones incorrectas.
b) Se omiten ideas importantes necesarias.
c) Se incluyen afirmaciones correctas, pero con poca o ninguna relacin
con la pregunta.
d) Se llega a conclusiones no vlidas, ya sea por errores en el razonamiento
o por una errnea aplicacin de principios.
Pruebas libres 143

e) Una mala expresin escrita oscurece el desarrollo y la exposicin de las


ideas.
E) Hay errores flagrantes en la ortografa y en las reglas de la expresin
escrita.
La clave o gua usada en la correccin analtica defme criterios absolutos y,
as, proporciona calificaciones preparadas preferentemente para una valoracin
criterial. Por supuesto, estas calificaciones absolutas se pueden matizar con
valoraciones normativas relativas, estableciendo comparaciones interindividua-
les. Con todo ello se pueden analizar las respuestas para dar a los alumnos indi-
caciones detalladas de sus fallos, dentro de un enfoque de la evaluacin ms
formativo que sumativo.
La correccin analtica permite, adems, prestar atencin a la organizacin,
integracin y relaciones entre los elementos cruciales que aparecen en la res-
puesta. Pero cuando estas relaciones son complejas o sutiles, la correccin ana-
ltica puede volverse demasiado incmoda y tediosa para ser eficaz.
La cualidad de las calificaciones obtenidas con mtodos analticos depende
de la capacidad del docente para formular la clave de calificacin y de la capaci-
dad y cuidado para aplicarla del que corrige. En todo caso, para realizar este
tipo de correccin, hay que tener una personalidad detallista y minuciosa, bas-
tante experiencia y, sobre todo, tiempo para hacerla.
Por estas razones, a primera vista el mtodo analtico parece mejor; sin
embargo, no siempre es as, ya que en algunos casos es tan laborioso y las ven-
tajas son tan poco significativas que no merece la pena ponerlo en prctica,
pues se obtienen los mismos resultados y las calificaciones son tan fiables con el
mtodo holstico, ms simple y ms rpido.
c) Correccin horizontal: Supone corregir por preguntas en vez de por
alumnos. Esto significa que el profesor corrige primero las respuestas de todos
los alumnos a la pregunta 1, antes de pasar a la pregunta siguiente. Talprocedi~
miento es indispensable, obviamente, en el mtodo hoHstico. Tambin tiene
ventajas en la correccin analtica, puesto que concentrarse en una cuestin
cada vez ayuda a no tener que hacer transposiciones mentales, activar capacida-
des y promover juicios especiales distintos al ir cambiando de pregunta (Hales y
Tokar, 1975).
Hay tambin ms probabilidad de que los efectos de fatiga, humor, etc., afec-
ten a todos los alumnos por igual, y es ms fcil interrumpir la correccin sin
consecuencias, una vez que se haya terminado de corregir una pregunta en
todos los alumnos.
d) Identidad del alumno: Si es posible, hay que ocultar a quien corrige la
identidad del alumno. Idealmente, se deben dar instrucciones para que las res-
puestas a diferentes preguntas se escriban en hojas aparte, identificadas slo
por un cdigo. Estas hojas se clasifican en grupos por preguntas para la correc-
cin y se renen por alumnos para la calificacin final. Este procedimiento pue-
144 La evaluacin de aprendizajes

de reducir la posibilidad de que prejuicios, el nombre, la fama o el efecto


halo, asociado con las calificaciones del mismo alumno en otras preguntas del
examen, influyan en la asignacin de calificaciones.
e) Calificaciones independientes: Para conseguir calificaciones indepen-
dientes, al menos dos profesores tienen que corregir cada pregunta o una
muestra, sin saber lo que ha asignado el otro.
La correccin independiente que lleve a una correlacin entre pares de cali-
ficaciones en cada pregunta es la nica comprobacin de la objetividad, y por
tanto de fiabilidad, de la calificacin en este tipo de pruebas. Puesto que es dif-
cil de hacer y lleva bastante tiempo, no se suele llevar a cabo.
f) Objetivo y expresin: Es importante distinguir entre una RA y una
composicin escrita. Mientras que ambas usan la escritura como medio de
expresin, la primera se centra en el contenido expresado en y con la escritura.
En la composicin escrita, en cambio, sin merma de la consideracin de los
aspectos del contenido (ideas, invencin, fabulacin, etc.) y su estructura orga-
nizativa (coherencia, cohesin), se valoran tambin otros aspectos ms forma-
les, tanto normativos como estilsticos. Por tanto, mientras en las RAla expre-
sin escrita es fundamentalmente un medio de comunicar contenidos
cientficos; en las pruebas o trabajos de composicin, entendida sta como for-
ma y contenido, la expresin escrita constituye un fin en s mismo.
Es importante, pues, tener en cuenta la distincin entre los fines de las RAy
la valoracin de la expresin escrita, de manera que las pruebas de ensayo den
calificaciones que representen logros de aprendizaje en dominios de contenido
importantes, no habilidades en composicin.
Sin embargo, hay siempre interferencias entre las valoraciones de las RAy la
expresin escrita. Esto conlleva, a la vez, aspectos positivos y negativos. La expre-
sin escrita es una capacidad importante que las RAfavorecen; no obstante,
stas pueden proporcionar tambin una prctica de mala expresin, apresura-
da, mal concebida, etc. Ms an, la mejor o peor expresin escrita puede influir
en el corrector cuando enjuicia el contenido de la respuesta. Una escritura uni-
forme, legible y fluida, mediante frases bien construidas, puede compensar
algunas deficiencias en el objetivo (Chase, 1979; Hughes, Keeling y Tuck, 1983);
por otro lado, incorrecciones ortogrficas, gramaticales o sintcticas pueden
influir negativamente.
En ocasiones, incluso la extensin de las respuestas, especialmente desde la
perspectiva de los alumnos, se ve en relacin con las calificaciones: cuanto ms
largas sean aquellas, ms altas sern stas; segn la imagen popular de corregir
a peso.
Por otra parte, los alumnos ocasionalmente pueden usar sus habilidades de
expresin para compensar su falta de conocimiento. A veces, transforman sutil-
mente la pregunta para que les sea ms fcil contestada; si lo hacen bien, el pro-
fesor no se dar cuenta de la sustitucin. Otras, el alumno se puede concentrar
Pruebas libres 145

ms en la forma que en el fondo, en la presentacin elegante de unas pocas ideas


simples, con la esperanza de que esto aparte la atencin del profesor de su falta
sustancial de conocimiento.
No todos los profesores se dejan engaar con facilidad, aunque todos debe-
mos ser conscientes de estas posibles interferencias. Y lo ms frecuente es que
los alumnos que necesitan ms la ayuda de estos engaos son los menos capa-
ces para usar estas tcnicas.
Aplicacin: La construccin de buenas RA,que respondan a lo expresado
en pginas anteriores, es una tarea tan difcil como construir buenas PO. A par-
tir de esta conviccin, se pueden formular las siguientes sugerencias:
a) Utilizar RApara evaluar los objetivos de aprendizaje que otros formatos
no pueden valorar eficazmente.
b) Acudir a RAcuando no compense el esfuerzo de construir otros formatos
de PO; por ejemplo, cuando es el mismo profesor el que ensea, cons-
truye las pruebas y las corrige, y tiene pocos alumnos, y se pasa todo el
da con ellos.
c) Preferir RAcuando no se pueda garantizar el copiar, el azar, etc., al aplicar
PO.

d) No utilizarlas si se dispone de poco tiempo. La calidad de la prueba baja


excesivamente si hay que responder mucho en poco tiempo: la prisa
impide al alumno pensar y organizar.
Las recomendaciones iran en sentido contrario, es decir, no dejarse llevar
de la rutina para proponer RAen circunstancias tales como cuando son muchos
los alumnos que hay que evaluar; se dispone de un banco de pruebas objetivas;
son distintos los profesores que ensean, los que construyen las pruebas y los
que las corrigen.
S:lH811 SV8:1nHd :la
SOdl~ SOH~O
PRUEBAS MIXTAS 1.

Las pruebas mixtas (PM) pueden combinar las ventajas del examen clsico (RA)
con las de las pruebas objetivas (PO). No son dos exmenes sin relacionar, sino
uno solo presentado mediante dos formas secuenciadas y complementarias:
examen tradicional y prueba objetiva con formato EM o RL. El alumno ha de
resumir y transcribir en PO lo que ya escribi en su RA,con lo que se consigue
tener constancia escrita de su razonamiento a disposicin del corrector.
Ejemplos:
al. Objetivo: Comprender el concepto de funcin continua en un punto.
Prueba libre (RA): Explicar el concepto de funcin continua en un punto.
Prueba objetiva (EM) (ejemplificacin parcial de la PO):

[(x)= lim
lirn.funcin x->a
d) * b)
1. e)
x->a
x~a
x->a
liIll
Una [(xl x~a
lim
= =y[(al
=[(xl
[(a)
f(x) [(xl
[(al es continua en el punto a si:
al

A
..
2. 'Cul seria la grfica de una funcin continua en x = 2?

m1
y y

2 m
2

f(2l = 3
O

f(2l = 2
,-i
~
f(2) = 2
~ t
f" no est definida en
x=2

a) *b) C) d)

a2. Objetivo: Aplicar conceptos de mecnica.


Prueba libre (RA): Resolver, en hoja aparte, los problemas que se proponen.
Prueba objetiva (RL): Despus de resolver cada problema, transcribir lo que se
pide:
150 La evaluacin de aprendizajes

1. Se lanza verticalmente hacia arriba un proyectil con una velocidad de 150 mis;
calcular el tiempo que tarda en subir al punto ms alto.
Datos: v =
E--f
cuaclOn utz'1'zzad a: t =
Resultado: t = s

2. Un volante que est en reposo empieza a girar con una aceleracin de


5 radls2 durante 20 min; en este instante se le aplica un freno que le comuni-
ca una aceleracin negativa de 12 radls2. Calcular: a) la velocidad mxima
alcanzada; b) el nmero de revoluciones totales dadas; y c) el tiempo que
tarda en pararse desde que se le aplica elfreno.
a) Ecuacin utilizada: w =
Resultado: w max = radls
b) Resultados Darciales:
Radianes antes defrenar=
Radianes despus defrenar=
Vueltastotales=

c) Ecuacin utilizada: t =
Resultado: t = s

Aplicacin: Se pueden entregar ambas pruebas, RAy PO, simultneamente;


o proponer en primer lugar que el alumno desarrolle la RAcon un amplio mar-
gen de tiempo y, transcurrido el mismo, entregarle la PO para que la responda
en un tiempo limitado (alrededor del 25% del tiempo de la RA). Se corrige la
PO, y se acude a la RAcuando se tengan dudas, no se entienda algo de la PO o
se quieran evaluar razonamientos.

2. EXAMEN ORAL

Los exmenes orales (EO) han sido los primeros instrumentos de evaluacin
utilizados para comprobar rendimientos de aprendizajes; fue el formato predo-
minante aun antes de la aparicin de las instituciones educativas.
La prctica docente es prdiga en el uso de preguntas orales que sirven para
ayudar al aprendizaje, as como de instrumento de evaluacin. Por supuesto,
estos propsitos estn con frecuencia relacionados, y a veces son inseparables,
particularmente cuando la naturaleza de la evaluacin es formativa ms que
sumativa.
Las preguntas orales como estrategias de enseanza sin la formalidad del
examen oral pueden cumplir, entre otras, las siguientes funciones:
a) De repaso para, antes de una prueba, revisar y reformular lo mal aprendido.
b) De introduccin en sesiones de discusin y debate. Las preguntas ayu-
dan a provocar la participacin de los alumnos, activan sus conocimien-
tos previos y modelan estrategias metacognitivas.
Otros tipos de pruebas libres 151

c) De animacin del pensamiento creativo; es decir, para facilitar oportunida-


des de que los alumnos piensen crtica y creativamente. Por ejemplo, pre-
guntar ,,yentonces qu? o "si estuvieras afnico y no pudieras hablar en
tres meses por prescripcin facultativa, cmo se debera modificar el
programa de Arte Dramtico en el que participas?, para ir ms all de la
mera formulacin de un dato, mtodo o principio y estimular el uso de
nuevos conocimientos mediante un nivel ms alto de pensamiento.
Aqu, sin embargo, nos interesan ms las preguntas como instrumento de
evaluacin. En su forma clsica, son un formato de prueba libre que consiste en
un dilogo con un examinador que plantea preguntas generalmente no relacio-
nadas entre s (en el cap. 10, se menciona la relacin que existe entre el examen
oral y la entrevista); por ello se adaptan mejor a objetivos de reconocimiento y
comprensin de un conjunto miscelneo de conocimientos aislados, no estruc-
turados, que el alumno debe repentizar.
La funcin evaluativa que el interrogatorio oral parece lograr mejor que
otros formatos es valorar la situacin inicial de los alumnos para poner en prc-
tica unos determinados procedimientos instruccionales. A partir de pistas no
verbales que leen en las caras de los alumnos, los profesores formulan frecuen-
temente preguntas orales sucesivas, completadas con contrapreguntas adapta-
das a las respuestas de los alumnos, para hacer diagnsticos sobre la raz de los
problemas de aprendizaje; es decir, saber si a los alumnos les falta informacin,
tienen un error conceptual o han entendido mal un proceso, y as poder reajus-
tar las estrategias de enseanza.
La improvisacin inherente al dilogo ofrece, por aadidura, una gran flexi-
bilidad para tener en cuenta circunstancias atenuantes de los fallos o pasar de
los puntos fuertes a los puntos dbiles del alumno. En suma, las preguntas ora-
les pueden muy bien ser la primera tcnica que activa inclusores con objeto de
empezar una unidad de instruccin y la ltima de sntesis para cerrarla.
Una dificultad obvia es su estandarizacin, por lo que resulta difcil dejar
constancia de las preguntas de los profesores y de las respuestas de los alum-
nos; ello puede dar pie a grandes desconfianzas (Contreras, 1990), sobre todo si
el examen no es pblico.
Por otra parte, la fuerte incidencia del azar, al no preguntar lo mismo a todos
los alumnos, y la valoracin subjetiva del profesor suelen ofrecer pocas garan-
tas de fiabilidad y objetividad en las calificaciones. Para mejorarlas, son especial-
mente importantes los mtodos para formular las preguntas y registrar las res-
puestas, que estudiaremos a continuacin.
2.1. Clasificacin de las preguntas: El aspecto que ha recibido ms
atencin de los investigadores hace referencia a la clasificacin de las preguntas.
Entre las muchas que se han utilizado, podemos citar las siguientes:
1. Libertad: Clasificacin de las preguntas segn el grado de libertad que
dan al alumno para responder.
152 La evaluacin de aprendizajes

a) Cerradas o convergentes: Se dirigen hacia respuestas preestablecidas,


o se dan en la misma pregunta pautas de la respuesta. Ejemplo: ,,Cul es
la frmula de la longitud de la circunferencia?.
b) Abiertas o divergentes: Dejan al alumno la exploracin libre de la res-
puesta. Ejemplo: "ste es el problema ...; proponga cuantas soluciones
posibles se le ocurran para resolverlo. Esto no quiere decir que el profe-
sor no se imagine la respuesta; pero es importante que no la condicione,
ya que hay alumnos que, acostumbrados a complacer al profesor, buscan,
aun en las respuestas que se dicen libres, lo que ms pueda agradarle.
2. Funcin: Clasificacin segn la funcin de la pregunta.
a) Evaluacin: Para obtener feedback de si los objetivos han sido alcanzados.
b) Metodolgicas: Como estrategia para alcanzar nuevos objetivos.
c) Procedimiento: No se espera una respuesta referente al aprendizaje.
Ejemplo: ,,Todoel mundo oye bien?,,,Osfalta algn libro de consulta?.
3. Capacidades: Clasificacin de las preguntas segn la capacidad con la
que se relacionan (Sanders, 1966, es una referencia obligada y clsica de esta
taxonoma, inspirada en la de Bloom; tambin se puede mencionar Walter Mon-
roe citado en Nrici, 1970).
Memoria: Preguntas cerradas y convergentes en las que se busca que el
alumno reproduzca una informacin exactamente como la recibi. No se piden
reflexiones propias, sino slo reconocer una comparacin leda, repetir datos,
procedimientos, definiciones, etc., introducindolas con trminos tales como
qu, cmo, cundo? Ejemplo: ,,Quin invent la bombilla?.
Comprensin: Preguntas convergentes con cierta dosis de divergencia en
las que se pide realizar operaciones mentales como:
Traduccin: Cambiar el lenguaje o forma de la informacin. Ejemplo:
"Exprsalo con tus propias palabras.
Interpretacin: Descubrir relaciones entre datos explcitos. Ejemplo:
,,Cules la diferencia entre verbos regulares e irregulares?.
Extrapolacin: Se pide usar una informacin para sacar conclusiones.
Ejemplo: "Cules son los dos trminos siguientes de la sucesin 1, 4,9, 16 ..?.
Aplicacin: Estas preguntas requieren resolver problemas mediante la
identificacin de datos y seleccin de generalizaciones previamente aprendidas.
Anlisis: Se preguntan relaciones implcitas a travs de razonamientos
inductivos o deductivos; por ejemplo, relaciones causa-efecto, punto de vista
del autor, etc. Ejemplo: ,,Cules la idea principal de lo que se ha ledo?.
Sntesis: Requieren creatividad y originalidad para llegar a conclusiones
nuevas; para lo que se necesita tener una base slida de conocimientos, una
mente inquisitiva, sensibilidad ante los problemas, etc. Existe, sin embargo, la
dificultad de evaluar la respuesta.
Otros tipos de pruebas libres 153

Valoracin: Esperan un juicio (bueno/malo, correcto/incorrecto, etc.) sobre


hechos de acuerdo con unos criterios. Por tanto, suponen tener criterios, cono-
cer datos y comparados. Se puede pedir valorar conocimientos: ,,Porqu crees
que sta es una buena solucin para poner en marcha este motor?; o actitu-
des: ,,Cmote sientes con la negativa de tus compaeros a tu invitacin?.

2.2. Construccin: A pesar de las afirmaciones altamente retricas sobre


su utilizacin para provocar y valorar capacidades mentales de orden elevado,
las conclusiones de las investigaciones ponen de manifiesto que la naturaleza
de la comunicacin en las clases permanece en un nivel de preguntas que
requieren mera memorizacin y, en algunos casos, comprensin literal CEbel y
Frisbie, 1977).
Razones de estas deficiencias pueden ser la carencia de buenos modelos, la
creencia de que son fciles de realizar, la falsa consideracin de su intrascen-
dencia para planteadas como tema de estudio, la escasa preparacin del profe-
sorado respecto de su formulacin, etc.
He aqu algunas sugerencias para hacer preguntas que propongan retos de
cierta profundidad a los alumnos, y as ofrezcan una informacin significativa-
mente vlida para tomar decisiones instruccionales:
a) Formulacin de la pregunta: Elegir los trminos adecuados para que
la pregunta represente el nivel taxonmico deseado. Las preguntas bsi-
cas empiezan por quin, qu y cundo: Quin escribi El Quijote?,
Cundo se escribi La Celestina? En cambio, las preguntas que exigen
alguna relacin suelen emplear los trminos cul, por qu y cmo:
Cul es el argumento ms convincente?, Por qu es este editorial ms
persuasivo que aquel?, Cmo se expresaron los Derechos Humanos en
la Carta de la Naciones Unidas?
b) TIempo de espera: Los profesores tienden a esperar muy poco antes de
volver a formular o hacer nuevas preguntas; el tiempo medio transcurrido
entre el fm de la pregunta y la nueva intervencin del profesor es de un
segundo. Generalmente, adems, la nueva pregunta es ms simple y de
nivel inferior a la original. Rowe (1969, 1974) ha mostrado que se pueden
obtener grandes beneficios con slo aumentar el tiempo de espera a cuatro
o cinco segundos. As, los alumnos aumentarn la confianza en s mismos,
realizarn ms digresiones e interrogantes en voz alta, que exteriorizarn al
hacer ms preguntas, darn respuestas ms largas, espontneas y apropia-
das, aadiendo ms razones para avalar sus deducciones. Por su parte, las
habilidades de los profesores para hacer preguntas mejorarn; entre otras
cosas, centrarn las estrategias de enseanza en el alumno y aprendern a
mantener el nivel taxonmico a lo largo de una secuencia de preguntas.
c) Constancia: Se debe seguir preguntando al mismo alumno aunque res-
ponda mal. Si es necesario facilitar la tarea en un primer momento, con-
viene formularle una nueva pregunta ms bsica, para continuar con
154 La evaluacin de aprendizajes

otras, hasta volver a la pregunta original, de acuerdo con la tradicin


mayutica. Los alumnos a quienes se olvida despus de responder mal,
aprenden dos cosas: las preguntas que se les hacen a ellos no deben ser
demasiado importantes y que, la prxima vez, cuanto antes respondan
mal, ms pronto les dejarn en paz.
d) No-voluntarios: El preguntar slo a los voluntarios hace que los tmidos
sigan sindolo, que los que no atienden sigan sin atender y que la
audiencia de aprendices se reduzca a los listos, constantes o muy motiva-
dos. Pedir, en cambio, que unos alumnos parafraseen o reformulen las
respuestas dadas por otros fuerza una atencin constante por parte de
todos, fortalece y promueve una comprensin ms profunda, y propor-
ciona oportunidades adicionales para una evaluacin formativa.
e) Planificacin: La mayora de las buenas preguntas orales son tan difci-
les de formular como el hecho de escribir buenos tems. La mayora de
los profesores no somos capaces de improvisar buenas preguntas, por lo
que las espontneas tienden a promover un nivel de conocimiento
memorstico ms que de comprensin y aplicacin. Por ello, algunos pro-
fesores preparan preguntas y las escriben en sus guas de clase.

2.3. Registro de datos: Si las respuestas a las preguntas orales se van a


usar en una evaluacin sumativa, se necesita llevar un registro permanente, que
es preferible hacer de inmediato, no confiado a la memoria. Por supuesto, si las
respuestas se van a usar enseguida para una evaluacin formativa, el registro
ser menos necesario.
Los fines de las preguntas y la naturaleza de las respuestas dictan las caracte-
rsticas de las formas de registro que se deben usar (las formas de registro son
similares a las que se proponen en el cap. 10, al hablar de la observacin). A
manera de ejemplo, se ofrecen dos tablas que se disearon para fines distintos.
En la primera se registra el tipo de pregunta que se hace a cada alumno y las
respuestas correctas (las preguntas se sealan con una marca /; y las respuestas
correctas con 0). Esto permite al profesor determinar el tipo de preguntas ms
usado, la participacin de cada alumno, el xito en general y en cada tipo de
respuesta; el profesor puede tambin detectar si se olvida o atiende excesiva-
mente a algn alumno:

/0Valoracin
/00
0/0/ Explicaciones
Predicciones
Aplicacin/
Memorizacin
/
NATURALEZA
Comprensin/
de datos,
DE LAS PREGUNTAS
Otros tipos de pruebas libres 155

La tabla siguiente trata de mostrar, ms que la naturaleza de las preguntas, la


cantidad y calidad de la participacin y de las respuestas de los alumnos:

///
relacin
Sin
Centrada en// el tema
// Relacionada
con NATURALEZA
reformulada
parcialmente
Pregunta DE LAS
/ PREGUNTAS

2.4. Aplicacin: Se aconseja este tipo de examen cuando sea necesaria, o


al menos conveniente, la presencia directa del alumno; cuando haga falta una
apreciacin simultnea independiente de varios examinadores; y cuando se
requiera juzgar la capacidad de intervencin en pblico, necesaria para el poste-
rior ejercicio profesional.
Se desaconseja el examen oral, sin embargo, para realizar una evaluacin sis-
temtica de un repertorio de objetivos o si el nmero de estudiantes es grande,
por el excesivo coste de tiempo en relacin con el valor limitado de las informa-
ciones aportadas.

PRUEBA PRCTICA REAL 3.

(Un proceso para evaluar trabajos de alumnos universitarios se puede encontrar


en Contreras, 1990.)
Aunque siempre debemos pretender que los alumnos no se queden en un
saber qu, sino que lleguen a un saber cmo, esto es importante sobre todo
en algunas materias, como las tecnolgicas, para las que no es suficiente un
dominio de objetivos del mbito cognoscitivo, fundamentalmente terico, sino
que incluyen objetivos del mbito psicomotriz con aspectos eminentemente
prcticos.
Par evaluar estos objetivos en prueba prctica real (PR), el estudiante tiene
que realizar presencialmente tareas que requieren la aplicacin de destrezas en
circunstancias semejantes a las requeridas en la vida profesional. El profesor
realiza una observacin directa de la actividad del alumno, que con frecuencia
supone un coste elevado de tiempo de observacin (es de aplicacin aqu lo
que se dice en el cap. 10, al hablar de la observacin). Algunos ejemplos de PR
son realizar operaciones:
156 La evaluacin de aprendizajes

- Clnicas, como controlar la presin arterial.


- Informticas, como manejar un pe.
- De laboratorio, como hacer pesadas, valoraciones y disecciones.
- De campo, biblioteca, etc.
Aplicacin: Se aconseja evaluar a travs de PRcuando sea necesario:
a) Verificar la actitud, capacidad y reacciones de los alumnos ante situacio-
nes complejas que necesitan de varios sentidos.
b) Apreciar cmo el alumno se enfrenta con problemas reales en el labora-
torio, taller o a la cabecera del enfermo, en contraste con la aplicacin
rutinaria de procesos o recetas prefabricadas.
Se desaconseja, sin embargo, en el caso de experiencias que:
c) Requieran individuos singulares no uniformes, tales como personas (por
ejemplo, en el caso de enfermos que pueden demostrar ms o menos
buena voluntad), animales, plantas, piezas nicas.
d) Supongan un riesgo para alguno de los que intervienen, es decir, para los
mismos alumnos, pacientes o profesores.
e) Sean grupos numerosos de alumnos y sea difcil para los examinadores
observar a los candidatos durante las pruebas, justo en el momento en
que hacen la demostracin de las aptitudes requeridas.

4. PROYECTO

En un perodo de tiempo variable, el estudiante debe realizar una actividad o


tarea profesional que tendr como resultado un producto para evaluar. Vale
como estrategia de enseanza-aprendizaje o evaluacin.
Aunque aparentemente se den las circunstancias adecuadas para utilizar este
formato de evaluacin, dado su elevado coste, slo se podr llevar a la prctica
cuando haya un equilibrio del coste con la informacin recibida tanto por pro-
fesores como por alumnos. En todo caso, es imprescindible establecer una rela-
cin de confianza con los alumnos para evitar posibles fraudes.
Mediante el proyecto (PY) se pueden evaluar objetivos de habilidades com-
plejas, tales como anlisis, sntesis y valoracin, concretados, entre otros, en los
siguientes aspectos:
- La responsabilidad del compromiso personal.
- Hbitos de trabajo individual y en grupo.
- Dominio de los matices interdisciplinares de una tema donde se pongan
de manifiesto conexiones entre varios aspectos de una asignatura, entre
varias asignaturas o entre lo acadmico y la vida real.
Otros tipos de pruebas libres 157

- Capacidades de comunicacin (sntesis, estructuracin, presentacin de


la informacin).
Interesa ms el producto que el modo de actuar del estudiante; sin embar-
go, el profesor, al examinar el producto, puede hacer tambin una evaluacin
indirecta, deduciendo el proceso seguido.
Ejemplos:
- Investigaciones de campo o bibliogrficas, informes, etc.
- Diseos de la organizacin de un taller, empresa, etc.
- Realizaciones de disecciones, cortes, preparaciones de laboratorio,
mecanismos, piezas, etc.
No existe un solo tipo de Proyectos, ni una sola manera de realizados
(Carrasco, 1991). En todo caso, el profesor debe proponer objetivos claros y
asequibles de su asignatura, as como un esquema de trabajo; o tambin pue-
den seleccionarse entre los que propongan los alumnos. Si no se formulan pre-
viamente unos objetivos y un esquema de trabajo, el formato se convierte en
prueba diagnstico (PD) (cap. 10) de las tareas, apuntes personales, trabajos
cotidianos, que cada alumno realiza dentro de su proceso normal y habitual de
aprendizaje.

SIMULACiN 5.

El 2 de noviembre de 1963, el profesor J. P.Hubbard, Director Ejecutivo del Natio-


nal Board of Medical Examiners (NBME),propuso las caractersticas de este ins-
trumento de evaluacin en la conferencia: prograrnmed Testing in the Exarnina-
tions of the NBMEE,pronunciada en un Congreso organizado por Educational
Testing Service de la Universidad de Princeton, NewJersey (McGuire, 1976).
El fm de la simulacin es medir, por simulacin tan fiel como sea posible, la
solucin de una situacin-problema cambiante, que evoluciona cronolgica-
mente durante horas o das, y que representa vicariamente un caso real propio
de la competencia profesional. Se trata sobre todo de objetivos que incluyen
capacidades de tipo cognoscitivo superior y psicomotriz.
Sustituye a la observacin directa del comportamiento del alumno ante una
situacin real, especialmente en aquellos casos en que su duracin es larga o
encierra peligros para el alumno (es el caso de prcticas de laboratorio) o para
la situacin simulada (como en algunos casos clnicos).
El mtodo tiene caractersticas comunes con las PO, tales como su alto nivel
de objetividad y la posibilidad de correccin mecanizada o informatizada.
Recuerda tambin ciertos aspectos de la enseanza programada, en la que el
candidato avanza a travs de una serie de problemas consecutivos.
158 La evaluacin de aprendizajes

La situacin real se presenta por escrito en casos sencillos; se incluyen ejem-


plos en el Anexo 1. En casos ms complejos, la presentacin hay que hacerla a
travs de robot, ordenador, vdeo, diapositivas o pelculas. Como ejemplos, sir-
ven el manejo de artilugios relacionados con la marina y la aeronutica, o casos
clnicos con objeto de evaluar la capacidad del estudiante de medicina para
detectar o interpretar convenientemente sntomas anormales, de llegar a un
diagnstico razonable y demostrar un juicio vlido en la eleccin de una tera-
putica, como el que se incluye en el Anexo 2. El alumno debe seguir el proce-
so a lo largo del tiempo, dando respuestas y tomando decisiones ante cada
paso, en forma de PLo PO.
En las formas de simulacin menos elaboradas, elfeedback a las respuestas
de los alumnos se da al final. El peligro en las formas ms elaboradas es que la
desviacin puede ser grande si cada respuesta depende de la anterior. En estos
casos, el alumno debe conocer inmediatamente las consecuencias de sus res-
puestas, para pasar a la eleccin siguiente; por lo que hay que ir proporcionan-
do las soluciones por escrito, y mejor a travs de programas informtico s inte-
ractivos. A la hora de corregir, se pueden penalizar las respuestas incorrectas;
por ejemplo: las respuestas correctas se valoran con + 1, las incorrectas con-1
y las indiferentes con O.
Otros tipos de pruebas libres 159

ANEXO I
SIMULACiN DE QUMICA ANALTICA

Objetivo de aprendizaje: Identificar cationes en una disolucin problema


siguiendo la marcha del HJ.
Enunciado: Un problema lquido tiene reaccin alcalina, fuerte olor a
amonaco e intenso color azul. Se verifican los ensayos siguientes:
a) Una parte se acidula con HCI, obtenindose un abundante precIpitado
que se disuelve en ligero exceso de HCI, permaneciendo insoluble una
parte pequea del mismo, de color blanco.
b) En la disolucin clorhdrica, ajustada la acidez, se pasa HJ y se obtie-
ne precipitado amarillo. No hay ni siquiera indicios de precipitado
negro.
c) El precipitado (b) se trata por Sx(NH)i Se disuelve slo parte de l,
aunque se aada exceso de polisulfuro.
d) La solucin (c) se acidula con HCI: PreCiPitado amarillo insoluble en
HCI concentrado.
e) En la solucin procedente de separar el precipitado (b), se aade amo-
naco y se pasa HJ. PreCIpitado negro .
.f) En el filtrado procedente de (e) se aade fosfato sdico. PreCiPitado
blanco.
Qu iones puede contener el problema y cules existen con seguridad?
SOLUCIN:A partir de losfenmenos que nos ofrecen los datos experimen-
tales del enunciado, vamos sacando conclusiones sobre los cationes que no
existen o es posible que existan, hasta llegar a la solucin final.

ENSAYO NO EXISTE POSIBLE

Cu2+
Lquido pH>7 CrOt amarillo K+, AsOl, MoOt
Olor NH3 Sn2+,Sb,Pb J- blanco wot, VOi,
Color azul Hg2+ J- negro Ag+
A3+, Bi3+, Cr3+, Fe3+ Ca2+, Sr2+, Ba2+
C02+, Ni Zn2+, Cd2+, Mn2+
J- coloreados Mg2+

J- blanco con HCI VP4 J- azul K+, AsOl, MoOt


Se disuelve parte wot
Ag+
Ca2+, Sr2+, Ba2+
Zn2+, Cd2+, Mn2+
Mg2+
160 La evaluacin de aprendizajes

ENSAYO NO
Ag+
MoOt,j,
EXISTE
POSIBLE
wot,j,
Zn2+ ,j, blanco
EXISTE
Mn2+,j,
Ca2+
K+,AsO/
AsO/oCd2+verde
Mg2+
K+,AsO/,j, pardo
negro
amarillo
K+
Ca2+,
Ag+
Zn2+, Sr2+, Ba2+
Cd2+,
K+,AsO/,j, Mn2+
Ca2+,Sr2+,Ba2+
amarillo
g+ Sr2+, Ba2+
Ca2+,
Zn2+,
Mg2+
Mg2+, Sr2+,
Cd2+,
,j,
Cd2+ Ba2+
Mn2+
amarillo

SEGUROS: Cu2+, AsO/ Cd2+, Ca2+ Mg2+


POSIBLES: K+, Ag+, Sr2+, Ba2+

ESQUEMA

PH > 7, NH3, color azul


+
HCI

____ ~A~ ~
a ppdo. t t dln. a
blanco +
se disuelve parte HzS
~ ~A~ _
b ppdo. t t dln. b
amarillo
+
Sx(NH,J2

c ppdo. ~ dln. ppdo. ~ dln.


permanece + negro +
amarillo Hel Na3P04

d ppdo. ~ dln. ppdo. ~ dln.


amarillo blanco
Otros tipos de pruebas libres 161

ANEXO 11

CASO CLNICO
(preparado por el profesor J. P. Grangaud, Taller de Docimologa
de Timimoun, Argelia, 6-16 de febrero de 1977, Guilbert, 1989)

Objetivo de aprendizaje: Atender por orden de prioridad a varios enfer-


mos que se presentan simultneamente.
Enunciado del caso: Cuando llega a la sala de espera de la consulta
externa de pediatra, encuentra Vd. a 15 nios acompaados por sus
madres. Estos nios presentan las caractersticas siguientes:
1. Un nio de 3 aos que presenta una afeccin del cuero cabelludo.
2. Un lactante de 6 meses que presenta una diarrea sin signos evidentes
de deshidratacin.
3. Un recin nacido de 10 das, ictrico.
4. Un nio de 8 aos, febril.
5. Una nia de 3 aos hipertrmica y con disfagia.
6 Una madre con un recin nacido bajo su manto.
7. Una nia de 15 meses, que presenta tos y fiebre.
8. Un lactante de 2 meses, con diarrea desde hace una semana, y que
presenta signos evidentes de deshidratacin.
9. Un lactante de 6 meses, ciantico, disneico y febril.
10. Un nio de 5 aos que presenta una bradipnea respiratoria con que-
jido.
11. Un muchacho de 14 aos con un flemn en la mano.
12. Una nia de 6 aos con dolores abdominales desde hace 15 das.
13. Un lactante de 7 meses para una revisin sistemtica.
14. Un nio de 8 aos, no disneico, que consulta por palidez.
15. Un nio de 7 aos que presenta una artritis de rodilla derecha.
QUEHARA VD. EN ESTE MOMENTO? (No tiene derecho ms que a una
eleccin)

ETAPA A:

DECISiN CONSECUENCIAS

1. Comenzar su consulta 5 minutos despus del comienzo de la con- -1


examinando a los enfer- sulta, la enfermera le llama a la sala de
mos por orden de llegada. espera. El estado de uno de los nios se ha
agravado.
(ESCOJA OTRA ACCiN)

2. Hacer tomar la tempera- Durante este tiempo uno de los nios hace -1
tura, pesar y tallar a una parada respiratoria.
todos los nios. (ESCOJA OTRA ACCiN)
162 La evaluacin de aprendizajes

NOTA

3. Examinar con prioridad Seale los tres nios que debe examinar en I +1
a algunos de estos primer lugar.
nios. (PASE A LA ETAPA B, DONDE ELEGIR
ESTOS NIOS ENTRE LOS 15 QUE FIGU-
RAN EN LA LISTA)

Mientras hace el traslado, uno de ellos pre- I -1


4. Enviar a radiologa a los senta un sncope.
nios 7,9 Y 10. (ELEGIR OTRA ACCiN)

SELECCIONE
congestionado.
Pliegue
campos
90 Amin;
DESCRITOS
(PASE cutneo
LA pulmonaresLOS
Temperatura:
ETAPA ENe) EL
D)
E) NIOS 40,8QUE
Temperatura:
abdominal. NECESITAN
35C;
Globos subictericia
DELoculares ATENCiNconjuntival
Yhundidos. INMEDIATA ENTRE
..........................
Extremidades
.........................................................................................
ENUNCIADO C. Focos de
CASO estertores crepitantes
NUMERADOS en ambos
DEL1 ALfras
15.(+1) LOS
.. (+1)
9.
10. Peso:
Mientras
3.
8.
4.
5.1.Se
Bajo
le
La 7,60;
CONSECUENCIAS
7. 2.
6.
Se Mientras
llama
el
enfermera
le
Peso:
Un llama
nio Altura:
lemanto
aausculta
4,100;est
la
hace sala
de
Vd.64
la
aurgentemente
lale
Altura:
unasala le
de
llama cm;
llaman
de
parada
56 Permetro
examinando
madre
espera con
aencuentra
urgentemente
espera
cm; donde
respiratoria
Permetro
sala craneal:
urgencia 44 cm; Frecuencia respiratoria:
......................................................
.............................................................................................
la.........................................................................
a este unnio,
recin otronacido
demuere deen10 la das
sala ciantico
de35,8
esperaC.(-1)
de..................................................................
un
en nio
craneal:
espera
la sala presenta
..................................................
39 cm;espera convulsiones
Temperatura: NOTA
y(O)
............
............................. ..(-1)
(-1)
(O)
Otros tipos de pruebas libres 163

11. Durante el examen, otra madre irrumpe en la consulta con su hijo. El nio
presenta convulsiones ...................................................................................... (-1)
12. 15.
14.
13. Un
Se nio
Es llamado
Hayleun hace
con
llama
nio una
con
con parada
urgencia respiratoria
a la asala
urgencia
convulsiones de
en espera
la sala la
desalaen de
espera la...................................................
sala
espera de espera (-1) (-1)
.............................
...................................................
.........................................

1. Proceder al interrogato- Mientras Vd. interroga a la madre, la disnea I -1


rio de la madre. se agrava y el nio se congestiona ms.

2. Explorar al nio por Durante el examen del nio la cianosis I O


completo. aumenta.

3. Pedir unos anlisis sis- En el momento de la puncin venosa el I -1


temticos. nio hace una parlisis respiratoria.

4. Hacer inmediatamente (PASE A LA ETAPA F) I +1


tratamiento sintomtico.

NOTA
ETAPAD: tico.
El: nio
Durante Apresenta
respiratoria.
(PASE el
CONSECUENCIAS
LA -1
+1
unnio,
examen,
ETAPA
O colapso.
el nio
G) se una
vuelve cian-
Mientras pincha al hace parlisis ,
in; Frecuencia
urgencia.
urea
QUE cardaca:
y glucemia.
HARA VD. CON180.ESTE NIO(8) EN ESTE MOMENTO?
Fr- 4. Hacer
2. Hacer una
inmediatamente
exploracin
164 La evaluacin de aprendizajes

ETAPA E: cin.
en Mientras
convulsiones.
El
(PASE
La NOTA
nio AseLApone
Temperatura ETAPA
interroga+1aH)
-1
ciantico
asciende
O durante
la madre
a 41,5 ela pun-
el nio entra
,
CONSECUENCIAS
QUE HARA VO. CON ESTE NIO (9) EN ESTE MOMENTO?
er
er inmediatamente un
una exploracin 3. Practicar una puncin

-1
+1
+1 la
Hecho.
ETAPAFnaturaleza
naturaleza
cantidad
calentarle?
congestio-
lquido,
Inscriba en yde del enema.
Hecho. -1carie?
+1 Jlalala
O-1
TRATAMIENTO
ETAPAH
Nio
Hecho
Nio
Para
Intil.
Hecho.
Inscriba Not
no
ETAPAG
InscribanoNot.
Not
Prescripcin+1
enANULADA
O
enEtapa
con- aIde
la
sinEtapa
laRESIDENTE.
Tiene
PRESCRIPCiN
sube
laLa POR
36,5e yperfu-
Temperatura
Para la
EL can- su
ya
larefres-
naturaleza
cantidad
Temperatura
ANULADO
lquido,
Etapa
inoportuna.
perfusin
gestionado.
K lade
lade
PORy
nado.
La cianosis
desaparece.
36,2e del lquido
CiN
41,5e.
LADA.
flujo. ANU-
PRESCRIP-
su flujo.
4. Dar oxgeno.
Otros tipos de pruebas libres 165

TRATAMIENTO
Inscriba
ANULADO. rios
Noto
la
ETAPAG
en
Not.
PRESCRIPCiN
Ninguna +
-1
+1
-11-1
1 -1
-1
-1
O-1
indi-O
O Sin
Antibitico
-utilizable indicacin.
Ningn
Sobre en
suficientes
No tiene
ETAPAF
tiene el
ANULADO.
ANULADO.
la no
crite-
crite-
PRESCRIPCiN
ANULADO.
ANULADA.
indicacin.
cacin.
EtapaJ.
Etapa
qu
posologa Ken
criterio.
cri- la ANULADO.nistracin.
cacin. va de admi-
posologa
la etapa K yla
posologa y
LADA.
nistracin.
MOMENTNEA-
MENTEANU-
rapia.
ina.
uccina-
micina.

ETAPA 1:

ETAPAJ:

I ETAPA K:
O)I.LSON~Vla SV851nHd
'"
j

j
Los profesores dedican casi una tercera parte de su tiempo a tareas relacionadas
con la valoracin (Stiggins, 1988); as, administran exmenes formales, aplican
otros mtodos orientados a recoger datos, hacen juicios y toman decisiones
durante la instruccin.
Profesores de todos los niveles consideran importante y crucial para aumen-
tar el conocimiento de sus alumnos (Dorr-Bremme y Herman, 1986) la informacin
obtenida por mtodos diferentes a los exmenes tradicionales. La aplicacin de
estos otros instrumentos de evaluacin, que agrupamos como pruebas diagns-
tico (PD), supone el dominio de una serie de tcnicas particularmente tiles en
aquellas reas donde no es fcil hacer valoraciones por mtodos convenciona-
les. Recogemos aqu de manera resumida los aspectos de aplicacin ms fre-
cuente en contextos acadmicos de dos de estas tcnicas: la observacin (OB) y
la encuesta (EN), ya que los interesados pueden ampliar fcilmente su estudio
en las referencias bibliogrficas citadas y, en general, en la extensa bibliografa
disponible.

OBSERVACiN 1.

La observacin se muestra como uno de los mtodos ms eficaces de recogida


de informacin sobre la conducta; puede ser espontnea o estructurada (la pro-
blemtica de las tcnicas de observacin est ampliamente tratada por Anguera,
1981, 1983, 1985, 1987, 1991a y 1991b).

Observacin espontnea 1.1.

La mayora de las observaciones que hacen los profesores en el aula son inci-
dentales. Tales observaciones son muy tiles para una evaluacin formativa y
suelen constituir el primer paso para, ms tarde, hacer una observacin planifi-
cada.
170 La evaluacin de aprendizajes

Sin embargo, uno de los principales defectos de esta observacin espont-


neaes el proporcionar una visin tnel: vemos a los alumnos que llaman ms
nuestra atencin, y pasan desapercibidas reacciones y actuaciones menos llama-
tivas, que quiz sean importantes, de otros. He aqu algunos factores que pue-
den ayudar a evitado y a realizar una observacin espontnea ms eficaz:
a) Prever una ajustada descripcin de la situacin observada y tener en
cuenta sus circunstancias.
b) Verificar de modo reiterado y conveniente las informaciones obtenidas;
de lo contrario, no pueden considerarse representativas.
Es claro que estos factores ya plantean la necesidad de una estructuracin
ms decantada, transformando as la observacin de espontnea en planificada.

1.2. Observacinestrudurada

Las observaciones estructuradas o planificadas pretenden obtener informacio-


nes ms precisas, por lo que dan resultados ms objetivos y son de mayor valor
educativo que los obtenidos en una observacin espontnea. Para ello es preci-
so seguir unas pautas y utilizar unos instrumentos apropiados.

o Pautas de observacin

1. Subjetividad: Mirar con orejeras y mirar sin ver son expresiones comu-
nes que traducen la manera selectiva de mirar que, sin darse cuenta, practican
algunos observadores. Para superar esta posible subjetividad, una de las pautas
ms utilizadas es conseguir un acuerdo entre jueces, valorando las diferencias
halladas en el total de conductas registradas por ellos en el perodo total de
observacin. A partir de las frecuencias extremas detectadas, se proponen fr-
mulas para su correccin (Anguera, 1983; Fernndez Ballesteros, 1983; Cabrera
y Espn, 1986).
2. Imparcialidad: Las expectativas formadas a partir de nuestra experien-
cia previa son mejor observadas que aquellos sucesos que se ven como si fue-
sen ajenos. Por consiguiente, otra pauta de observacin ser no dejarse llevar
por la tendencia natural a fijarse en detalles familiares al observador, o a con-
centrarse en aquellos aspectos de un suceso que mejor encajan en nuestros
preconceptos.
3. Reactividad: Se refiere a la modificacin de la conducta que pueden
sufrir los sujetos observados por el solo hecho de saberse observados. Por con-
siguiente, entre las interferencias causales de la reactividad, que conviene ami-
norar, se pueden mencionar: la modificacin del marco natural producida por
el sistema de observacin, la introduccin de otros estmulos nuevos en el
Pruebas diagnstico 171

ambiente, algunas caractersticas de la personalidad de sujetos especialmente


impresionables y de las conductas o aprendizajes que se van a observar.
4. Concrecin: Se obtendr una informacin ms vlida en la medida en
que los comportamientos que se quieran observar se definan por rasgos ms
concretos, claros y medibles. Tambin es conveniente que los observadores
compartan el mismo sistema terico de referencia.
5. Error de indulgencia: Se define como la tendencia general a hacer los
primeros juicios con ms generosidad. Por consiguiente, una sola y primera
observacin no es indicador cierto de la cualidad tpica de una tarea; son nece-
sarias observaciones repetidas sobre tareas similares para obtener pruebas de
su consistencia.
6. Codificacin: Los sistemas de codificacin de la observacin ms efica-
ces son los ms fciles de aplicar porque contienen pocas variables de observa-
cin y emplean cdigos simplificados.

o Instrumentos de observacin

1. Plantilla de observacin: Los instrumentos ms frecuentemente usados


en la observacin estructurada son las plantillas, casi siempre personales, de
diverso tipo, en las que se van haciendo las anotaciones de manera sistemtica y
organizada.
Un ejemplo de plantilla para observar El libre uso de los ltimos 10 minu-
tos de clase es la siguiente, que recoge un nmero de categoras suficiente-
mente pequea, una formulacin clara de los comportamientos y una forma
sencilla de registro:

FECHA: 11 octubre 11 1I
CLASE:
PERIODO:
ltimos
Entre
11
11111
11
11
1111111111
1111111
111111
11111 Historia
3 10 Y 5 del final
5 minutos
el minuto
materias ...............................

2. Registro anecdtico: Consiste en la descripcin de comportamientos


que se consideran importantes. Las caractersticas que debe poseer un buen
registro anecdtico son: establecer un comportamiento tpico basado en varias
ancdotas, limitar cada ancdota o incidente a un hecho concreto, indicar las
172 La evaluacin de aprendizajes

circunstancias necesarias para una buena informacin y registradas. Estadillos


para hacer registros anecdticos podran ser los siguientes:

Nombre: Fecha:
Lugar: Nombre: Incidente
Comentario Clase:

Clase:
Incidente: Fecha

Comentario:

Nota: Tambin se puede dejar el reverso de la ficha para los comentarios.


El hacer un registro detallado de todos los incidentes puede ser muy laborio-
so; con frecuencia, es ms realista disponer de estadillos sencillos similares a este:

Alumno: Comentario
Observador
Incidente
Lugar Clase:

3. Lista de corroboraciones: A veces se encuentra citada sin traducir


como check-list. Consiste en una relacin nominal de conductas que enmar-
can la observacin. Este instrumento es til para evaluar aquellas destrezas que
pueden dividirse en una serie de actuaciones o comportamientos claramente
definidos. A la hora de su elaboracin debe identificarse la conducta que se
desea evaluar, traducida a un conjunto de comportamientos que se puedan
observar, ordenados y utilizar un procedimiento sencillo para indicar su presen-
cia o ausencia. Ejemplos de lisca de corroboraciones para Valorar el trabajo en
Pruebas diagnstico 173

clase podran ser los siguientes, el primero para cada alumno y el segundo
para un grupo de alumnos de un aula:

Alumno: _
.. '., TIEMPOS J >
', ...... 2" Semana
Semana 13 Semana
4aSemana
33 ..... < ..,

B. Colabora
D.
C. Presenta tareas ..........
en trabajos

Aula: .

13 I 2" 33 13 I 23 33 13

Juan .

Laura .

4. Escalas estimativas o calificativas: Enriquecen la lista de corrobora-


ciones, que se limita a sealar la presencia o ausencia de una caracterstica
observada, indicando el mayor o menor grado en que aparece. Estas escalas
admiten varios modos de presentacin:
4.1. Escala numrica: Asigna un nmero a cada grado de los comporta-
mientos observados; por ejemplo, para el mismo objetivo de Valorar el traba-
jo del alumno en clase:

43
2 5
B. Colabora
D.
C. Presenta tareas
en los trabajos en grupo
174 La evaluacin de aprendizajes

Debe haber un acuerdo previo sobre el significado de cada nmero, por


ejemplo:

5 Excelente 5 Siempre
4 Bueno 4 Casi siempre
3 Normal 3 Con frecuencia
2 Deficiente 2 Pocas veces
1 Muy deficiente 1 Nunca

Otras maneras de presentar escalas numricas:

+3 +2 +1 o -1 -2 -3

EXCELENTE MUY DEFICIENTE

8 7 6 5 4 3 2

EXCELENTE MUY DEFICIENTE

4.2. Escala grfica: Difiere de la anterior en que sustituye los nmeros


por smbolos. En realidad, lo nico que cambia es la presentacin. Estas escalas
tienen la ventaja de ser ms expresivas que las numricas. Por ejemplo:
Colabora en los trabajos comunes:

AA A D DD

Total acuerdo De acuerdo Indiferente Desacuerdo I Total desacuerdo

4.3. Escala descriptiva: Describe con ms detalle los grados de cada com-
portamiento. Estas escalas ayudan a evitar juicios demasiado genricos y preci-
pitados, lo que permite una evaluacin ms objetiva; por ejemplo, para evaluar
Laatencin en clase:

-no
5. Siempre se con -frecuencia.
2.
4.3.
con
1. Reacciona
-Se
entiende.
atencin.
IIamarle
distrae.
Se
ASe
-aPregunta
siempre
del
Nolas Es
frecuencia.
veces
distrae
continuamenteintil
respondesi la
distrae
profesor.
bien
preguntas se
Pruebas diagnstico 175

5. Escalas de actitud: Mencin especial merecen las llamadas escalas de


actitud, que recuerdan las listas de corroboraciones y las escalas de estimacin,
pero en las que es el mismo sujeto observado el que hace los registros. Evaluar
actitudes no es fcil, pero eso no significa que debamos renunciar a su valora-
cin (la problemtica de la evaluacin de actitudes est tratada, entre otros, por
los siguientes autores: Manning y Rosenstock, 1971; Dawes, 1975; Hills, 1981:
Hoover, 1977; Rosales, 1981; Morales, 1988; Bolvar, 1992). Estas escalas parten
de la idea de que las actitudes se pueden inferir de las opiniones expresadas
por los mismos sujetos y de que su medida se puede representar mediante
una nota numrica. Se suelen emplear las siguientes escalas.
5.1. Escala Ordenada de Intervalos Iguales (Thurstone y Chave,
1929): Recuerda la lista de corroboraciones. La construccin de una escala de
este tipo se inicia con la recopilacin de un gran nmero de enunciados que
expresen aspectos de la actitud que se est considerando. Formulados esos
enunciados -unos 100 al menos-, se pide a un nmero de jueces -25
como mnimo- que los clasifiquen en tres grupos segn consideren que sean
favorables, neutrales u hostiles a la actitud que se va a evaluar. Seguidamente se
clasifican los de cada grupo en subgrupos, de forma que resulten nueve catego-
ras en total: extremadamente favorable, favorable, moderadamente favorable;
favorable-neutral, neutral, neutral-hostil; moderadamente hostil, hostil y extre-
madamente hostil. Se considera buen tem o enunciado aquel en el que coin-
ciden los jueces acerca de su posicin en la escala. Finalmente, se seleccionan
de 15 a 25 buenos tems que cubran las nueve posiciones de la escala.
A continuacin transcribimos un ejemplo parcial, puesto que, como hemos
dicho, los reales constan de 15 o 25 tems, cuyo objetivo es La actitud haca
los exmenes:

VALOR
Los
La
No exmenes
preparacin
se 9,0
se
dedeben
deben
1,S
debe obligar
son evitar
incluir
exmenes
ayudan
a nadie
la mejor OPINIONES
porque
pruebas
consume
a estudiar
aestrategia
hacer
con son alienantes.
optativas.
unaprendizaje.
exmenes.
ms
de tiempo y unas
profundidad.
..

energas que es mejor emplear en otras actividades.


3,0
6,0
7,S
4,S

Se presentan los tems ordenados al azar, no las valoraciones, para que los
sujetos sealen las opiniones con las que estn de acuerdo. La media de los valo-
res de las opiniones elegidas es la medida de su actitud. Los resultados, ms
176 La evaluacin de aprendizajes

que un valor absoluto, indican la posicin relativa del individuo dentro del
grupo.
5.2. Escala de Acuerdo o Concordancia (Likert, 1932): La escala
Likert, que consiste tambin en una lista de enunciados, es el mtodo ms
extendido para las mediciones de actitud. Las dos diferencias fundamentales
entre esta escala de Likert y la de Thurstone son las siguientes: la valoracin de
los tems se basa en datos empricos, no en la opinin previa de los jueces; y
el sujeto no seala simplemente si est de acuerdo o no con cada opinin, sino el
grado de su acuerdo, generalmente de 1 a 5, de manera semejante a la Escala
numrica.
Debe procurarse que los enunciados, relacionados con la actitud que se
quiere evaluar, estn formulados de forma afirmativa. Para evaluar la misma
Actitud hacia los exmenes, se presentaran una serie de tems, por ejemplo:

Los exmenes se deben evitar porque son alienantes:

5 4 3 2

Muy de acuerdo De acuerdo Indiferente En desacuerdo Muy en


desacuerdo

"Los exmenes son la mejor estrategia de aprendizaje:

5 4 3 2

Muy de acuerdo De acuerdo Indiferente En desacuerdo Muyen


desacuerdo

5.3. Diferencial semntico: Se considera, en general, como un buen ins-


trumento para medir las actitudes positivas y negativas. Se utiliza para ello una
lista de adjetivos y sus antnimos a travs de siete intervalos.
Para su construccin, deben tenerse en cuenta los siguientes pasos:
Determinar la actitud-objetivo que se quiere medir.
Seleccionar unos 10 pares de adjetivos que tengan que ver con la actitud
que se pretende medir.
No escribir siempre los positivos a la derecha y los negativos a la izquier-
da; ms bien, intercambiarlos al azar. Esto evita la rutina del que va a con-
testar.
- Dar instrucciones de cmo se contesta este tipo de escala, si se aplica a
personas poco entrenadas.
Algunos pares de adjetivos utilizados en escalas semnticas, que Osgood,
Suci y Tannenbaum (1957) clasifican en evaluativos, de grado y de actividades,
son los siguientes:
Pruebas diagnstico Activo
Esttico
Grande
Positivo
Escaso
Cierto
Mnimo
Fro
Positivo
Enfadado
Pasivo
Interesante
Indeciso
Tenso
Clido
Sano
Valioso
Adecuado
Bueno
Enfermizo
Amistoso
Relevante
Profundo
Dinmico
Perfecto
.Informativo
Mximo
Fuerte
Resuelto
til
ACTMDADES:
Justo
Significativo
Relajado
Dbil
Tranquilo
Preparado
Objetivo
Negativo
Improvisado GRADO: 177

El ejemplo siguiente, tomado de Filella e Immegart (1972), est pensado


para evaluar la actuacin de un grupo o equipo:

1. La participacin en el trabajo por parte de todo los miembros del equipo fue:
(7) MXIMA MNIMA (1)

2. El inters en el trabajo puesto por todos los miembros del equipo fue:
(7) GRANDE ESCASO (1)

3. Elliderazgo del grupo estuvo estructurado:


(7) CONSCIENTEMENTE _ ESPONTNEAMENTE (1)

4. Elliderazgo del grupo fue:


(7) COMPARTIDO CONCENTRADO
EN UNOS POCOS (1)

5. El inters mostrado por los miembros del equipo por las ideas de los dems fue:
(7) GRANDE ESCASO (1)

6. La libertad de los miembros del equipo para expresar abiertamente sus ideas fue:
(7) GRANDE ESCASA (1)

7. La atencin puesta por los miembros del equipo a su tarea fue:


(7) MXIMA MNIMA (1)

8. La eficacia de los miembros del equipo para llevar a cabo su tarea fue:
(7) GRANDE ESCASA (1)

9. La or'Janizacin para el trabajo fue:


(7) MUY ELABORADA _ SIN ELABORACiN (1)
178 La evaluacin de aprendizajes

10. El proceso del trabajo del equipo fue:


(7) MUY PREPARADO _ IMPROVISADO (1)

11. El entendimiento entre los miembros del equipo fue:


(7) PERFECTO _ ESCASO (1)

12. El grupo funcion:


(7) COMO UN EQUIPO COMO UNA SUMA
DE INDIVIDUALlDADES (1)

5.4. Otras escalas: Son muchas las variantes de escalas que se encuentran
en la bibliografa especializada. La mayora son de escasa aplicacin en el con-
texto educativo que aqu nos interesa, por lo que nos limitamos a citadas: la
escala de anlisis jerrquico de Guttman (Edwards, 1957), la escala de Lunn
(1969), las comparaciones emparejadas (Thurstone, 1947). Una buena revisin
actual puede consultarse en Dunn-Rankin, Knezek, wallace y Zhang (2004).

2. ENCUESTA

La encuesta (EN) pretende obtener datos a partir de procedimientos de interro-


gacin (Davis, 1975; Hunkins, 1972; Cohen y Manion, 1990; Colas y Buenda,
1992). Se suelen clasificar en dos grupos: entrevista y cuestionario.

2.1. Entrevista

La entrevista es una comunicacin verbal y no verbal entre dos o ms personas,


que se lleva a cabo presencialmente en un marco espacio-temporal concreto y
con unos objetivos previamente establecidos (Gaeta, 1975, estudia la entrevista
en un contexto educativo y SilvaMoreno, 1987, en un contexto conductual ms
general). Por medio de la entrevista pueden evaluarse aptitudes, actitudes y
objetivos de aprendizaje, en cuyo caso se convierte en un Examen Oral, que se
estudi entre otras pruebas libres en el captulo 9.
Clasificacin: Se proponen diversos criterios para clasificar las entrevistas.
1. Fines: Segn los fines que se persiguen, las entrevistas pueden ser:
a) De investigacin: Buscan fundamentalmente la recogida de informacin
significativa sobre una cuestin que intentamos investigar.
b) De intervencin: Buscan informacin sobre los problemas actuales del
sujeto, y su relacin con la historia personal del mismo. Pueden dividirse,
a su vez, en:
Pruebas diagnstico 179

Diagnsticas, para alcanzar una informacin del entrevistado que


permita determinar las causas de un problema.
De tratamiento, cuando pretenden influir en un cambio de conducta
o situacin del sujeto entrevistado.
La distincin entre diagnstico y tratamiento es ms bien formal, pues la
intervencin de todo diagnstico inicia un tratamiento.
2. Estructura: Segn e! protocolo, la entrevista puede ser:
a) Estructurada: Cuando el protocolo se prepara cuidadosamente; es poco
espontnea, pero permite cuantificar los resultados.
b) Semiestructurada: El entrevistador sigue un protocolo previamente esta-
blecido, pero puede flexibilizar e! orden e incluso introducir preguntas
nuevas.
c) Libre: El contenido, el orden y la formulacin de las preguntas no estn
determinados; se emplean preferentemente para obtener una informa-
cin inicial exploratoria.
Proceso: El proceso de una entrevista se puede descomponer en tres fases
o momentos:
1. Preparacin: Determinar los objetivos. Se ha de delimitar con claridad
cul es la finalidad de la entrevista. Esto conlleva que se confeccione una buena
gua acorde con el nivel de estructuracin.
2. Realizacin: Aplicar la entrevista. Para ello, e! entrevistador ha de domi-
nar una serie de tcnicas en relacin con la comunicacin, la comprensin de la
personalidad del entrevistado y de la situacin. Entre otras, estrategias verbales:
silencios, repeticin, aclaracin, reflejo de sentimientos, interpretacin, explica-
cin, estmulo, sugerencias, persuasin, confianza y seguridad; y no verbales:
aceptacin, comprensin, sinceridad, adecuado contacto visual, posicin de!
cuerpo, situacin espacial y calidez de las expresiones faciales.
3. Conclusin: Debe realizarse una sntesis de lo tratado. Toda entrevista va
seguida de la elaboracin de una serie de conclusiones sobre los objetivos que se
han alcanzado, en qu medida se han alcanzado y las tareas para e! futuro.

Cuestionario 2.2.

El cuestionario es un tipo especial de entrevista. Puede utilizarse en una rela-


cin presencial, en cuyo caso nos encontraramos ante una entrevista estructu-
rada; o puede ser contestado sin intervencin directa del encuestador, lo que se
podra considerar como una entrevista a gran escala.
Clasificacin: Los modos de las respuestas determinan las distintas clases
de cuestionarios. Reproducen la clasificacin de tems mencionada en el captu-
180 La evaluacin de aprendizajes

lo 3, con la peculiaridad, compartida por todas las PD como instrumentos de


evaluacin por analoga, de que no hay respuesta correcta predeterminada,
sino que todas tienen valor como informacin sobre la situacin que se evala.
As, aparecen los siguientes cuestionarios:

Dicotmicos (A)
Mltiples excluyentes (B)
CUESTIONARIOS Cerrados (2)
Mltiples no excluyentes (C)
Mixtos (3)
{Abiertos (1) { Clasificacin (D)

1. Cuestionarios abiertos: Son cuestionarios construidos con preguntas


de respuesta abierta (RA).
Ejemplo: Qupiensa Vd. sobre el modo de evaluar que usan los profesores
de Matemticas en su Centro?
2. Cuestionarios cerrados: Son cuestionarios con distintos tipos de PO,
por lo que, dentro de este tipo de cuestionarios, existen, a su vez, una serie de
categoras:
A. Dicotmicos: Cuestiones formuladas con alguno de los protocolos de los
tems V/F.
Ejemplo: Tiene vd. inters por el estudio de las Matemticas? [S/NO].
B. Alternativas mltiples excluyentes: Cuestiones con formato EM de nica
respuesta.
Ejemplo: En qu debe basarse la evaluacin escolar?
a) Los ejercicios de clase.
b) Los exmenes tradicionales.
c) Laspruebasobjetivas
d) Trabajo de investigacin.

C. Alternativas mltiples no excluyentes: Cuestiones con formato EM de


varias respuestas.
Ejemplo: En qu momentos los profesores debieran comunicar a sus
alumnos sus decisiones evaluativas?
a) Despus de la sesin de evaluacin.
b) En pblico.
c) Despus de cada actividad de aprendizaje.
d) Privadamente.

D. Clasificacin: Se pide al encuestado que valore las alternativas, de tal for-


ma que la respuesta implique un orden en las categoras presentadas en el cues-
tionario; excepcionalmente, se puede pedir que sean proporcionadas por el
mismo encuestado.
Pruebas diagnstico 181

Ejemplo: Segn tu opinin, cita por orden de preferencia las disczplinas


que ms contribuyen a tu formacin.
1 Educacin Fsica.
2D Sociales.
3 Matemticas.
3. Cuestionarios mixtos: Se trata de aadir alguna pregunta abierta al
final de una pregunta cerrada. Tienen las ventajas de ambos tipos de pruebas.
Ejemplo: Valora con Excelente(E) / Bueno(B) / Correcto(C) / Pobre(P) / No
puedo juzgar (Nj) los materiales siguientes:
A Texto: E/B/C/P/N]
B. Clases: " E/B/C/P/N]
C. Prcticas: E/B/C/P/N]
D. Bibliografa: E/B/C/P/N]

Aadir las razones para haber elegido la valoracin "Pobre:

o Confeccin de cuestionarios

1. Factores: Una vez delimitado el campo de estudio, una primera tarea con-
siste en identificar las variables o factores que lo configuran. Se pueden utilizar
para ello diversos procedimientos como definicin de conceptos, construccin
de indicadores de presencia o ausencia de los factores, etc.
2. Preguntas: La bondad de un cuestionario se juzga por la clase de pre-
guntas que se proponen y por su adecuada formulacin. Las preguntas de un
cuestionario recaen sobre aquellas variables o factores respecto a los cuales
deseamos tener informacin. Cuando se formulan las preguntas, es convenien-
te seguir una serie de reglas prcticas:
a) La pregunta ha de ser clara y concreta, evitando palabras de significado
confuso y ambiguo, o trminos excesivamente tcnicos y poco usuales.
Cuando la informacin deseada depende de un factor excesivamente
complejo, es preferible utilizar varias preguntas. Ese ideal de claridad exi-
ge tambin prescindir de frases negativas y de aquellas otras que condi-
cionan la respuesta.
b) Las preguntas han de tener aceptabilidad social. Esto supone evitar pre-
guntas inadecuadas porque exijan una informacin confidencial, o pon-
gan de manifiesto la ignorancia o falta de informacin del sujeto.
c) Es conveniente seguir una adecuada distribucin de las preguntas. As, la
tcnica del embudo propone formular preguntas generales para pasar,
a continuacin, a otras ms concretas.
d) Por su parte, el fenmeno de la irradiacin -influencia de la pregunta
anterior- aconseja usar preguntas amortiguadoras que corten una
182 La evaluacin de aprendizajes

posible influencia y que, a la vez, permitan volver a la batera o conjun-


to de preguntas sobre la cuestin que se estaba abordando.
e) Un cuestionario debe incluir preguntas filtro que permitan eliminar
otras posteriores.
3. Poblacin y muestra: Una tercera tarea es determinar la muestra y la
poblacin, a qu sujetos se va a aplicar la muestra y con cuntos se va a realizar
el cuestionario.
Es conveniente empezar por realizar una reduccin provisional de! cuestio-
nario para sometedo a una prueba tcnica o pretest. Los resultados del anlisis
de este pretest contribuirn a completar una presentacin definitiva.
4. Otras exigencias metodolgicas: Hay que tener en cuenta tambin e!
modo de administrado, que impone unas pautas de aplicacin, la computacin
y codificacin de los resultados y el anlisis de las conclusiones de acuerdo con
los objetivos.
Presentacin del cuestionario: Cuando se presenta un cuestionario
deben tenerse en cuenta las siguientes consideraciones:
a) Aspecto externo:
No demasiadas preguntas por pgina.
- Separar grupos o bloques de preguntas.
- Dejar espacio suficiente para las respuestas abiertas.
- Dibujar espacios (cuadros) para las respuestas cerradas.
b) Secuencia de las cuestiones:
- Agrupacin lgica de preguntas por temas: hechos o acciones, inten-
ciones, opiniones, motivos, etc.
- Colocar estratgicamente preguntas f1ltro.
- Para evitar e! efecto irradiacin, introducir, cuando se cambie de
tema, preguntas amortiguadoras.
c) Hoja de datos:
- Prever la posible mecanizacin.
- Prever la tabulacin en histograma, tabla de doble entrada, etc.
- Eliminar preguntas intiles, repetidas, imposibles de tabular.
d) Instrucciones:
- Explicar objetivos y razones del cuestionario.
- Claridad y concrecin acerca de la contestacin a cada pregunta.
- Indicacin sobre el cmo y el dnde se debe contestar.
- Aadir un tem-muestra al principio.
5VBElnHd 5'" Ela
5V)I~5IHEI~)VHV)
I
Todo instrumento de evaluacin ha de cumplir algunos requisitos para su consi-
deracin, estudio y aplicacin. Entre otros, las propiedades psicomtricas; pero
no slo tales propiedades, tambin otras caractersticas necesarias para una
buena confeccin y utilizacin de las pruebas. De las propiedades psicomtricas
con sus mtodos de estimacin ms usuales y de las otras caractersticas, se tra-
tar brevemente en el presente captulo; para finalizar con una normativa deon-
tolgica actualizada sobre la evaluacin educativa.

PROPIEDADES PSICOMTRICAS 1.

Los tests y pruebas, para poder ser utilizados de una forma adecuada como ins-
trumentos cientficos de medida, han de reunir una serie de propiedades y
requisitos mtricos (Muiz, 2003), de los que citamos los siguientes:

Fiabilidad 1.1.

Es la precisin con la que una prueba mide una variable dada. Se proponen
diversas formas para realizar una estimacin emprica del coeficiente de fiabili-
dad:

a) Repeticin de la prueba: Consiste en la aplicacin del mismo test en


dos ocasiones distintas al mismo grupo de alumnos. La medida de la fiabilidad
del test quedar puesta de manifiesto por el grado de correlacin entre las cali-
ficaciones resultantes de la doble aplicacin. Tal correlacin se expresa por
medio del coeficiente de correlacin de Pearson, que muestra el grado de esta-
bilidad de los resultados para un perodo de tiempo:

L ZXZy
rXY [1]
N
186 La evaluacin de aprendizajes

En donde: Zx = puntuacin tpica de un alumno en la la prueba

(Zx = x ;x x)
Zy = puntuacin tpica de un alumno en la 2a prueba

(Zy=Y;y YJ
N = nmero de alumnos.

b) Formas paralelas: Se mide la fiabilidad mediante dos presentaciones


diferentes del mismo test; es decir, en la segunda ocasin no se aplica la misma
prueba, sino otra equivalente. La correlacin entre los resultados de las dos
pruebas se llama coeficiente de fiabilidad, que tambin se expresa por el coefi-
ciente de correlacin de Pearson.
c) Dos mitades: Cuando se construye e! test, se divide en dos mitades
equivalentes y se hace una sola aplicacin. En este caso, e! coeficiente de fiabili-
dad se calcula con la frmula de Spearman-Brown [4], en la que n = 2, resultan-
do la expresin siguiente (Muiz, 2003):

2 Pxx'
Pxx' = 1+ Pxx' [2]

donde Pxx' es la correlacin entre las dos mitades del test.

d) Coeficiente alfa: Mide la consistencia interna de un test. La frmula,


establecida por Cronbach (1951), es una generalizacin realizada a partir de la
frmula de Kuder-Richardson-20 (Muiz, 2003):

[3]
n - 1 0'2x
ex = n [1 - J~l cr~J

En donde: n = nmero de tems de! test.

Lcrj = suma de las varianzas de los n tems.


cr~ = varianza de las puntuaciones en el test.

Factores que afectan a la fiabilidad: Para que las pruebas sean ms fia-
bles, conviene que el profesor tenga en cuenta los siguientes factores:
a) Longitud: La fiabilidad de una prueba o test es mayor si se incrementa
e! nmero de tems similares para comprobar el mismo objetivo. En principio,
cuantos ms tems se utilicen, es decir, cuanto mayor sea la longitud de la prue-
ba, mayor ser la fiabilidad.
Caractersticas de las pruebas 187

A partir de la fiabilidad del test original, se puede medir ese aumento de fia-
bilidad mediante la frmula de Spearman-Brown (Muiz, 2003):

npxx'
[4]
Pxx' =1+ (n - 1) Pxx'

En donde: Pxx' = fiabilidad del test alargado.


Pxx' = fiabilidad del test original.
n = nmero de veces que se ha alargado el test.

b) Variabilidad: Cuando aumenta la variabilidad de las calificaciones, la fia-


bilidad tambin aumenta.

Validez 1.2.

Es el grado de precisin con el que la prueba utilizada mide verdaderamente


aquello para lo que fue diseada como instrumento de evaluacin.
El punto de referencia que ha de tener en cuenta el profesor para medir la
validez de un examen deben ser los objetivos.
Se distinguen diferentes clases de validez; se habla de validez de contenido,
de prediccin y de constructo. Sin embargo, la validez es un concepto nico; las
citadas clases son ms bien evidencias de las que se puede inferir la validez
(Osterlind, 1998).
Validez de contenido: Hay validez de contenido cuando la muestra de
tems de la prueba es lo suficientemente representativa para evaluar el objetivo
que se pretende.
En la construccin de la prueba, el profesor ha de tener en cuenta los ndi-
ces de dificultad y de discriminacin de los tems propuestos.
Validez de prediccin: Trata de mostrar la medida en que una prueba pre-
dice o estima una actuacin o conducta futura, llamada criterio. Para ello se uti-
lizan las tcnicas de regresin simple y mltiple (Muiz, 2003). La regresin
simple intenta pronosticar el criterio a partir de un solo test; la regresin mlti-
ple, a partir de varias medidas predictivas.
Validez de constructo: Se refiere a la recogida de evidencia emprica que
garantice la existencia de un constructo de acuerdo con las condiciones propias
de cualquier modelo o teora cientfica. En el mbito psicolgico, se han utiliza-
do dos procedimientos para obtener datos acerca de la validez de constructo, el
anlisis factorial y la matriz multirrasgo-multimtodo (Muiz, 2003).
188 La evaluacin de aprendizajes

1.3. Dificultad

Se entiende por ndice de dificultad (ID) de un tem la proporcin de sujetos


que lo aciertan de aquellos que han intentado resolverlo. Vara de Oa 100.
El ndice de dificultad del tem vendra dado por la siguiente frmula
(Muiz,2003):
A
ID = - x 100
N [5]

En donde: ID = ndice de dificultad.


A = nmero de sujetos que aciertan el tem.
N = nmero de sujetos que han intentado resolver el tem.

1.4. Discriminacin

Se dice que un tem discrimina si distingue entre aquellos sujetos que puntan
alto en la prueba y los que puntan bajo. En consecuencia, el ndice de discrimi-
nacin (IDs) se define como la correlacin entre las puntuaciones de los sujetos
en el tem y sus puntuaciones en la prueba (Muiz, 2003).
El ndice de discriminacin, que vara de -1 a + 1, permite determinar en
qu medida una pregunta es selectiva para distinguir un grupo competente de
un grupo incompetente. Cuanto ms elevado es este ndice, la pregunta permi-
te diferenciar mejor dichos grupos.
Si un test, por ejemplo, se compone de preguntas con altos ndices de dis-
criminacin, asegura una clasificacin discriminativa de los estudiantes segn su
nivel de actuacin. Dicho de otra manera, el test no concede ventajas a los alum-
nos dbiles respecto de los fuertes; ms bien ayuda a reconocer a los mejores
estudiantes. Esto, por tanto, slo quiere decir que una pregunta separa a los
alumnos en la misma direccin (discriminacin positiva) que el resto del exa-
men, o en direccin contraria (discriminacin negativa).
Uno de los procedimientos para establecer el ndice de discriminacin es el
siguiente: con las pruebas ya corregidas, se hacen dos grupos: mejores califica-
ciones y peores calificaciones. El ndice de discriminacin vendr dado por la
siguiente frmula:

IDs = As - Ar
N [6]
2

En donde: IDs = ndice de discriminacin.


~ = nmero de aciertos del grupo superior.
Caractersticas de las pruebas 189

Al = nmero de aciertos del grupo inferior.


N = nmero total de sujetos corregidos.

* * *

Muchos de estos clculos vienen facilitados por programas informticos para


PC como el ITEMAN (comercializado por Assessment Systems Corporation),
que permite calcular todo tipo de ndices de los tems. Otros programas son El
Sistema Integrado de Procesado de Test elaborado por Daz, Neira, Alguero,
Brugos, Garca, varez y Soler (1999) y el ITEM (pomes y Arguelles, 1991) que
proporciona un servicio de anlisis de resultados; entre otros:
a) Nmero de aciertos, fallos y omisiones, puntuacin absoluta y puntua-
cin tipmcada de los individuos.
b) Calificacin media, desviacin tpica y fiabilidad de la prueba.
c) Correccin de acierto casual y deteccin de fraude.
Adems, el programa dispone de un servicio de archivo de hasta 999 prue-
bas diferentes, con 999 individuos, 150 tems por prueba y cinco opciones por
tem, con la posibilidad de copiar, fusionar, depurar y modificados.

OTRAS CARACTERSTICAS 2.

Los instrumentos de evaluacin deben cumplir tambin otros requisitos, entre


los que se suelen citar los siguientes (Ebel y Frisbie, 1977, y sobre todo en la 1a
edicin de 1965, citada por Guilbert, 1989, estudian ampliamente la relacin
entre las diversas caractersticas de un examen):
Pertinencia: Grado de coherencia entre los criterios establecidos en la selec-
cin de las preguntas y sus fines. Las preguntas deben ser pertinentes en relacin
con el inters general de un tema, y no consecuencia del gusto y capricho del exa-
minador. La nocin de pertinencia se aproxima a la de validez de contenido.
Equilibrio: Grado de concordancia entre la proporcin de las preguntas
que se seleccionan para cada uno de los objetivos y lo que sera una proporcin
ideal a juicio de expertos.
Representatividad: Es el equilibrio entre preguntas y objetivos, no multi-
plicar preguntas para un aspecto y olvidar otros.
Equidad: Grado de concordancia entre las preguntas del examen y los obje-
tivos tratados en la enseanza.

Claridad: Supone unos enunciados en los que aparezca la informacin


necesaria con expresiones directas simples, eliminando palabras innecesarias y
datos poco relevantes.
190 La evaluacin de aprendizajes

Objetividad: Grado de concordancia entre el juicio del examinador y lo


que, segn criterio de especialistas independientes y competentes, constituye
una buena respuesta.
Practicabilidad: Est determinada por las circunstancias, especialmente
espacio-temporales, necesarias para la construccin, administracin, calificacin
e interpretacin de los resultados de un examen. Dicho de otra manera, debe
ser posible elaborar, responder y corregir la prueba. Este aspecto no debe pre-
valecer sobre la validez.
Eficiencia: Es la cualidad de un examen que permite el mayor nmero
posible de respuestas independientes por unidad de tiempo.
Tiempo: Un instrumento de evaluacin ser menos fiable si, porque se dis-
pone de poco tiempo, provoca la introduccin de factores que distorsionen;
por ejemplo, poco rigor, aproximacin, riesgo, etc. El tiempo de examen puede
ser un factor decisivo que condiciona su dificultad. Hay que escoger ms bien
problemas que necesiten una reflexin (comprensin, anlisis), pero cuya solu-
cin pueda expresarse en un tiempo relativamente breve.
Extensin: La fiabilidad de un instrumento de evaluacin puede aumentarse
(frmula de 5pearman-Brown, citada al hablar de los factores que afectan a la
fiabilidad) por adicin de nuevas preguntas equivalentes a las del test original.
Especificidad: Cualidad que hace que un alumno que no ha seguido las
enseanzas que han servido para construir el instrumento de evaluacin, obten-
ga un resultado similar al esperado nicamente por azar.

RELACiN ENTRE
3. LAS CARACTERSTICAS DE UN EXAMEN

Las propiedades y caractersticas hasta aqu citadas guardan entre s una estre-
cha dependencia, de las que destacamos algunas.
Validez y fiabilidad: Para que un instrumento de evaluacin sea vlido
debe ser a la vez pertinente y fiable. La fiabilidad es una condicin necesaria,
pero no suficiente, para la validez. As, resultados vlidos deben ser fiables, pero
resultados fiables no son necesariamente vlidos. En consecuencia, los resulta-
dos poco fiables influyen en el grado de validez. Por otra parte, una prueba pue-
de a menudo volverse ms vlida si se aumenta su fiabilidad.
Validez y pertinencia: El concepto de pertinencia corresponde, ms o
menos, al de validez de contenido. El modo de establecer una y otra es anlogo.
Por definicin, una pregunta es pertinente si sirve a la validez del tem, y un
tem es pertinente si respeta las especificaciones de los objetivos establecidos
durante su planificacin.
Caractersticas de las pruebas 191

Pertinencia y equilibrio: El equilibrio no es ms que una subcategora del


concepto de pertinencia.
Pertinencia y equidad: Si el tem se construye a partir de los objetivos, es per-
tinente por definicin. En la hiptesis contraria, este tem no es pertinente y; en con-
secuencia, tampoco es vlido. Es equitativo en el primer caso, e injusto en el segun-
do. Sin embargo, un examen puede ser equitativo sin ser pertinente (vlido de
contenido) en la medida en que corresponde bien a lo tratado durante la ensean-
za; lo que sucede es que no se deriva suficientemente de los objetivos propuestos.
Equidad, especificidad y fiabilidad: Una prueba no puede ser equitativa
si no es primero especfica. Por otra parte, la especificidad, as como la equidad
por razones anlogas, afectar a la fiabilidad de los resultados.
Fiabilidad, discriminacin, extensin, homogeneidad (de las pre-
guntas) y heterogeneidad (de los estudiantes): La fiabilidad est influida
por la discriminacin de los estudiantes, el nmero de tems, la similitud de los
tems para medir un competencia dada y las diferencias de los estudiantes en
relacin con esa competencia.
El poder discriminatorio de una pregunta est directamente influido por su
nivel de dificultad. As, el ndice medio de discriminacin de un tem se ver
igualmente afectado por la homogeneidad de las preguntas y por la heteroge-
neidad de los estudiantes. La equidad y la especifiCidad van a influir tambin
en el poder de discriminacin del tem. Se ha demostrado que un test con un
ndice medio de dificultad del 50% tiene grandes probabilidades de ser fiable,
en lo que concierne a su consistencia interna y homogeneidad.
Formato y capacidad: El formato de la pregunta no condiciona el proceso
mental que se pretende evaluar. Ningn instrumento de evaluacin tiene la
exclusividad cuando se trata de medir los procesos intelectuales ms elevados y
complejos. La forma de la pregunta no determina la naturaleza del proceso inte-
lectual requerido para poder contestada.
Otra cosa es que las conclusiones de la investigacin al respecto ponen de
manifiesto que los exmenes reales de nuestras aulas, sean pruebas libres (PL) o
pruebas objetivas (PO), ponen en juego sobre todo la memoria y pocas veces
exigen que el alumno haga un razonamiento.
Formato y aprendizaje: El que la naturaleza del examen afecte a la prepa-
racin que de l hace el alumno viene atestiguado por la experiencia, la razn y
la investigacin.
En relacin con la influencia de los exmenes en el estudio y el aprendizaje,
la cuestin realmente importante es cmo estas diferencias afectan a sus logros.
A falta de investigaciones adecuadas, nos aventuramos a formular las siguientes
inferencias:
a) El tipo de estudio y logro que un formato de examen estimula depende
probablemente ms de las preguntas que se hacen que de la manera en
que deban respondedas los alumnos.
192 La evaluacin de aprendizajes

b) En la medida en que los exmenes en diferentes formatos miden los mis-


mos tipos o aspectos de logros, estimulan el mismo mtodo de estudio y
tienen los mismos efectos en los logros.
Muchos factores, diferentes de los exmenes, afectan a cmo y con qu xi-
to estudian los alumnos. Estos factores interaccionan de maneras complejas
para facilitar o inhibir el aprendizaje. Por tanto, es muy pequea la probabilidad
de que la investigacin demuestre alguna vez claramente qu forma de examen,
respuesta abierta (RA) o prueba objetiva (PO), produce una influencia ms
beneficiosa en el estudio y el aprendizaje.
Dificultad y capacidad: Se tiene tendencia a confundir la dificultad de
una pregunta con la complejidad del proceso intelectual que mide; sin embar-
go, no hay relacin entre ellas. Una pregunta que slo requiera memoria puede
ser ms difcil, a causa de la naturaleza excesivamente especializada de la infor-
macin exigida, que una pregunta que requiera interpretacin de datos; y al
contrario, una aplicacin de principios puede ser ms fcil, si los principios son
familiares al alumno y si los datos que se han de interpretar son simples, que la
simple memorizacin de un principio complejo.
Dicho de otro modo, la dificultad de una pregunta y la complejidad de las
instrucciones que la acompaan no estn necesariamente unidas a la naturaleza
del proceso intelectual puesto en juego.
El cuadro siguiente (versin simplificada de la propuesta por Cormier, 1977)
resume las relaciones entre las principales caractersticas que debe tener un
examen:

VALIDEZ

~
FIABILIDAD PERTINENCIA

~
OBJETIVIDAD DISCRIMINACiN

~
DIFICULTAD PRACTICABI LIDAD

Para que una prueba sea vlida, es necesario que sea pertinente y fiable; pero
puede ser fiable y no vlida. De manera semejante, para que sea fiable, ha de ser
objetiva y discriminante; lo contrario no es verdad. Para que discrimine, debe
poder llevarse a la prctica y tener un ndice de dificultad adecuado, no viceversa.
Caractersticas de las pruebas 193

PRINCIPIOS TICOS Y DEONTOLGICOS


DE LA EVALUACiN 4.

El cdigo de la American Psychological Association, 1992 (APA)dedica un apar-


tado completo a los distintos aspectos de la evaluacin, del que presentamos,
adaptadas a los docentes, las siguientes directrices (Muiz, 1997b).
1. Evaluacin en un contexto profesional: Los profesores nicamente lle-
van a cabo evaluaciones en el contexto de su tarea docente; adems,
dichas evaluaciones educativas se basan en una informacin suficiente
para proporcionar una fundamentacin adecuada de sus conclusiones..
2. Competencia y uso apropiado de evaluaciones: Los profesores, por un
lado, elaboran, aplican, puntan, interpretan o usan tcnicas de evalua-
cin de manera que tanto su proceder como los fines perseguidos son
apropiados de acuerdo con las conclusiones actualizadas de investiga-
ciones acerca de la utilidad y pertinencia de dichas tcnicas; y, desde
otro punto de vista, se abstienen del uso inapropiado de tcnicas de
evaluacin y toman medidas razonables para evitar que se use inadecua-
damente la informacin proporcionada por estas tcnicas; esto incluye
el abstenerse de facilitar las puntaciones de los exmenes y otros datos a
personas ajenas a los estudiantes.
3. Construccin de exmenes: Los profesores, al construir exmenes, utili-
zan procedimientos cientficos y conocimientos profesionales actualiza-
dos para su diseo, estandarizacin, validacin, reduccin o eliminacin
del sesgo y recomendaciones de uso.
4. Uso de la evaluaciones: Los profesores, al aplicar, puntuar, interpretar,
o utilizar tcnicas de evaluacin, conocen su fiabilidad, validez, estudios
sobre la estandarizacin y resultados y aplicaciones adecuadas. Adems,
son conscientes de los lmites de la certidumbre con la que pueden
hacerse diagnsticos, juicios y predicciones acerca de las personas, por
lo que intentan identificar las situaciones en las cuales determinadas
tcnicas de evaluacin o normativas no deben ser aplicadas, o pueden
requerir un ajuste, debido a caractersticas de la persona tales como
gnero, edad, raza, etnia, nacionalidad, religin, orientacin sexual, dis-
capacidad, idioma o estatus socioeconmico.
5. Interpretacin de los resultados de la evaluacin: Al interpretar los
resultados de la evaluacin, los profesores tienen en cuenta los distintos
aspectos de las pruebas y las caractersticas de la persona evaluada que
puedan afectar sus juicios o reducir la presin de sus interpretaciones.
6. Personas no cualificadas: Los docentes no promueven el uso de tcni-
cas de evaluacin educativa por parte de personas no cualificadas.
194 La evaluacin de aprendizajes

7. Pruebas obsoletas y resultados desfasados: Los profesores no basan sus


decisiones en medidas y pruebas obsoletas, inapropiadas para los objeti-
vos de sus programaciones.
8. Calificacin e interpretacin: Los profesores, que ofrecen procedi-
mientos de calificacin o evaluacin a otros docentes, describen con
precisin la finalidad, normas, validez, fiabilidad y aplicaciones de los
procedimientos, as como cualquier cualificacin especial aplicable a su
uso.
9. Explicacin de los resultados de la evaluacin: Los profesores garanti-
zan una explicacin de los resultados, utilizando un lenguaje que pueda
entender la persona evaluada u otra persona legalmente autorizada.
10. Mantenimiento de la seguridad de los tests: Los profesores se esfuerzan
para mantener la integridad y seguridad de los exmenes de acuerdo
con la legislacin vigente y los requerimientos del cdigo tico.
SVB:lnHd :la O)NVB
Un Banco de Pruebas es un archivo de preguntas vlidas para comprobar
con fiabilidad la consecucin de un repertorio de objetivos de aprendizaje.
La confeccin y, en su caso, la informatizacin de un Banco de Pruebas debe
servir principalmente para poder disear un examen de caractersticas deter-
minadas por el profesor. Un repertorio de pruebas propuesto directamente a
los alumnos puede tener el peligro de llevades a estudiar para el examen y,
as, viciar su funcin de control del aprendizaje y, en general, de todo el pro-
ceso de instruccin. Ensear y estudiar para el examen es una mala prctica,
porque todo examen representa una muestra de los muchos tems posibles
de una programacin para deducir, por extrapolacin, si el alumno ha apren-
dido bastante ms que la mera solucin de unos pocos tems. Aprender ni-
camente las respuestas hace que la prueba global d una indicacin equivo-
cada del rendimiento del alumno y resta significado a la calificacin basada
en tales resultados.
Las caractersticas de un Banco de Pruebas, en general, son las siguientes:
1. Clasificacin: Para poder localizadas fcilmente, las pruebas deben
estar bien clasificadas, ya que lo que no est clasificado no existe. A continua-
cin, glosamos algunos criterios recomendables para clasificar las pruebas de
un banco.
1.1. Objetivo: Cada pregunta debe estar relacionada con un objetivo de
aprendizaje, identificado al menos esquemticamente, por un lado, con un con-
tenido cientfico y, por otro, con la capacidad o proceso mental que el alumno
debe realizar sobre dicho contenido. Creemos que as es ms fcil localizados.
Aunque en teora podran figurar ms, se recomienda que la capacidad de
los objetivos de referencia sea la comprensin, es decir, preguntas que preten-
den comprobar si el alumno es capaz de traducir afirmaciones a diferentes len-
guajes o a distintos grados de abstraccin, de interpretar datos, mtodos o con-
ceptos y de extrapolados. Tambin se suelen considerar objetivos cuya
capacidad es la aplicacin, es decir, si el alumno es capaz de identificar las limi-
taciones del mbito de aplicacin de un principio, de seleccionar la frmula
adecuada y de relacionada con la situacin problema para sacar conclusiones en
casos concretos.
198 La evaluacin de aprendizajes

En consecuencia en los bancos no se suelen utilizar objetivos que encie-


rren capacidades ms complejas, como analizar, sintetizar o valorar (lvarez,
Soler, Gonzlez-Pienda, Nez y Gonzlez-Castro, 2004); pero sobre todo ha de
evitarse la simple memorizacin, por lo que es indiferente, en la mayora de los
tems, que el alumno los realice con o sin libros; incluso con stos es posible
que, si no domina la materia, le resulte ms difcil realizar el examen, debido a
la confusin que le puede producir una consulta en un tiempo limitado.
1.2. Nivel: Es obvio que las pruebas deben enmarcarse en una programa-
cin contextualizada en un nivel.
1.3. Diseo: Es la caracterstica ms crtica y la que da unidad a un conjun-
to de pruebas. Se trata de explicitar, por un lado, la generalizacin de la situa-
cin en que se va a situar al alumno (se podr materializar en una serie casi
indefinida de pruebas) para que demuestre la adquisicin del objetivo corres-
pondiente; dicho de otra manera, son los indicadores observables para poder
deducir la adquisicin de dicho objetivo. En teora se pueden concebir varios
diseos distintos para comprobar el mismo objetivo.
Por otro lado, concreta tambin el formato del tem. Si el formato es de elec-
cin mltiple (EM), hay que recordar que la base debe ser autosuficiente, es
decir, deben permitir, eliminando los distractores o con una simple adaptacin
gramatical, utilizadas automticamente como preguntas clsicas de respuesta
abierta (RA).Otra alternativa es la utilizacin de estos tems como pruebas mix-
tas, exigiendo que el alumno justifique la eleccin de su respuesta o incluso por
qu elimina las incorrectas. A veces, cuando se desea hacer un amplio barrido
de varios conceptos, se fuerza el formato EM para convertido en respuestas
combinadas.
1.4. Otras caractersticas: En cada prueba, es til aadir lo siguiente:
a) Diagnstico, es decir, la respuesta correcta a cada tem, y todas aquellas
consideraciones que se crean necesarias para corregidos. Se ahorrar
tiempo y esfuerzo si, al mismo tiempo que se formula el tem, se escribe
la respuesta. Es recomendable consignadas aparte para no condicionar la
resolucin de las cuestiones.
b) Observaciones, tales como tiempo de aplicacin, recursos que se per-
mita utilizar a los alumnos, etc., y sobre todo alternativas de interpreta-
cin o dificultades especiales que encuentran los alumnos debido a sus
preconceptos.
c) Anlisis: Se recogeran en este campo los resultados del estudio psico-
mtrico del tem, es decir, los ndices de dificultad, discriminacin y
dems datos de inters de la historia de aplicacin de cada tem.
2. Codificacin: En los bancos, cada prueba debe quedar identificada
con un cdigo. En los ejemplos que incluimos al final del captulo, est formado
por una letra y seis nmeros para significar los extremos siguientes:
Banco de pruebas 199

2.1. Capacidad: La letra corresponde a la capacidad. Para ello es obligado


referirse a la taxonoma de capacidades propuesta por el equipo de Bloom
(1972). En esta taxonoma, tantas veces criticada, con frecuencia crpticamen-
te citada y hasta el momento no mejorada, se ordenan las capacidades cog-
noscitivas del 1 al 6 (1-Memorizacin, 2-Comprensin, 3-Aplicacin, 4-Anli-
sis, 5-Sntesis y 6-Valoracin). Puesto que en los ejemplos que aqu incluimos
solo se pretende comprobar la comprensin y la aplicacin, el cdigo de las
pruebas empieza con una e (comprensin) o una a (aplicacin) respectiva-
mente.
2.2. Objetivo: Los primeros dos dgitos hacen referencia al nmero
de orden del objetivo de aprendizaje de la programacin de aula correspon-
diente.
2.3. Diseo: Los dos dgitos siguientes recogen el diseo (01, 02, etc.).
2.4. Prueba: Hemos reservado los ltimos dgitos para identificar cada
prueba (desde el 01 al 99; si se prevn ms de 100 pruebas equivalentes del
mismo objetivo y diseo, habra que reservar tres o ms dgitos).
Por ejemplo, una prueba identificada con c.30.02.05 quiere decir que preten-
de comprobar comprensin (c); se refiere al objetivo (30); recoge el diseo
(02) de los posibles para comprobar dicho objetivo; y en el banco figura en el
lugar quinto (05).
3. Utilizacin: En el captulo 16, recogemos una serie de consideracio-
nes necesarias para llevar a la prctica el proceso de examinar; aqu adelanta-
mos algunas. Es obvio que, para comprobar la consecucin de un objetivo de
aprendizaje, hay que incluir alguna prueba clasificada dentro de dicho objeti-
vo. El conocimiento, producto del aprendizaje significativo, no est ato miza-
do; por el contrario, se almacena de una manera relacionada en racimos de
conocimientos afines. Por esta razn, aunque el objetiVO tiene siempre un
carcter general y la prueba un carcter particular, se propone la hiptesis de
que, seleccionando una muestra de pruebas, incluso pertenecientes a cual-
quiera de los posibles diseos, se puede extrapolar, de su xito, la consecu-
cin de todo el objetivo. Esta hiptesis, as como la determinacin del nme-
ro de pruebas equivalentes necesarias para lograr una observacin controlada
de la que deducir resultados vlidos y fiables, es necesario sometarla a la
oportuna investigacin.
Conviene tener en cuenta que, al seleccionar algunos de estos tems para
confeccionar un examen, habr que modificar el orden de los distractores para que,
como ya se subray, el nmero de veces que aparece la respuesta correcta en
cada posicin se equilibre.
200 La evaluacin de aprendizajes

4. Ejemplos de bancos
4.1. Matemticas (Teresa y Luengo, 1996)
OBJETIVO (4)
CAPACIDAD: Comprensin.
CONTENIDO: Concepto de derivada de una funcin en un punto.
DISEO (1): Se trata de comprobar si se comprende el concepto de deriva-
da de una funcin en un punto, para lo cual se propone en primer lugar que se
seleccione las expresiones que corresponden a la derivada de f en un punto
determinado y, haciendo uso del resultado obtenido y conocidos los valores
que toma la funcin en las proximidades del mismo, se estime el valor de la
derivada de la funcin en dicho punto.

PRUEBA c.04.01.01
1) Qu expresiones entre las que siguen corresponden a la derivada de la fun-
cin f en x = 1?

1. lim f(x) - f(l)


x-H x- 1
2 .llm------
. f (1 + h) -
h~O h
f (1)
3. 1im [f (x + h) - f (h)]
x~l

4. 1im f(l) - f(h)


h~O h
a) 1Y2
b) 1 Y3
c) 2 y4
d) 3 y4

2) Si de la funcin f se conocen los datos que figuran en la x.. f(&


tabla de la derecha, cul sera el valor estimado de f'(l)? 0,8 3,64
0,9 3,81
a) 1
b) 2 0,95 3,9025
1 4
c) 3
1,01 4,0201
d) 4
1,1 4,21
1,15 4,32
Banco de pruebas 201

PRUEBA c.04.01.02

De la funcin f se conocen los datos que figuran en la tabla K.. fC&


de la derecha. -0,15 1,08
-0,10 1,069
-0,01 1,0097
O 1
0.01 0,9897
0,1 8,87
0,15 0,789

1) Cules de las expresiones que siguen corresponden a la derivada de f en el


punto x = O?

1. l. lm------
f(O + h) - f(O)
h-tO h
2 1 lID
. _f_(x_) _-_1
x-tO X

3. 1iID f(x) - f(O)


x-tO X - O

4 l' lID f(h) - 1


h-tO h
a) Slo la 1 y la 3
b) Slo la 2 y la 3
c) Slo la 3 y la 4
d) Todas

2) Teniendo en cuenta los valores de f que figuran en la tabla, cul sera el


valor estimado de f' eO)?
a) -2
b) -1
c) O

d) 1
202 La evaluacin de aprendizajes

OBJETIVO (4)
CAPACIDAD: Comprensin.
CONTENIDO: Concepto de derivada de una funcin en un punto.
DISEO (2): Para comprobar si se comprende el concepto de derivada de
una funcin, se propone que, con la ayuda de la grfica de la funcin y conoci-
dos los valores que toma en las proximidades de un punto, se estime el valor de
la derivada de la funcin en dicho punto, como el lmite de los cocientes
f(x) - f(a) . ,
----- (pendlentes de las secantes que se apoyan en el).
x-a

PRUEBA c.04.02.01

La grfica de ms abajo corresponde a la funcin f, de la que se conocen ade-


ms los valores que figuran en la tabla siguiente:

x fW-
3 1,25
5 3,25
5,5 4,0625
5,9 4,8025
6 5

1) Cul es el valor de la pendiente de las secantes AB, donde la abscisa de B va


tomando los valores x de la tabla, desde x = 3 hasta x = 5,9?
a) 1,25; 1,75; 1,875; 1,975
b) 2,25; 2,45; 2,475; 2,495
c) -2,25; -2,45; -2,475; -2,495
d) -1,25; -1,75; -1,875; -1,975

2) En consecuencia, de las afirmaciones que siguen, cul puede ser cierta?

a) lim f(x) = 2
x-t6

b) e (6) =2
c) f(3) = -1,25
d) lim f(x) = -2,5
x-t3
Banco de pruebas 203

PRUEBA c.04.02.02

A determinada funcin f le corresponden la grfica de la derecha y los valores


que figuran en la tabla siguiente:

2\;
25,75
OO-
5,4375
5,724
5,64 2

5
2,5
2,05
2,2 I~I

1) Cul es el valor de la pendiente de las secantes AB, donde la abscisa de B va


tomando los valores x de la tabla, desde x = 5 hasta x = 2,05?
a) -1; 1,75 ; 1,950; 1,975
b) 1; -1,75; -1,950; -1,975
c) 1,25; 0,625; 0,55; 0,52
d) -1,25; -0,625; -0,55; -0,52

2) Teniendo en cuenta el resultado obtenido, cul de las afirmaciones que


siguen puede ser cierta?
a) lirn
x--.2
f(x) = -1/2
b) f~ (2) = -112
c) lirn
x--.2
f(x) = 5
d) f' (5) = 5/4
204 La evaluacin de aprendizajes

OBJETIVO (5)
CAPACIDAD: Aplicacin.
CONTENIDO: Derivabilidad de una funcin en un punto. Clculo de
lmites. Derivadas laterales.

DISEO (1): Para comprobar si se sabe aplicar el concepto de derivada de


una funcin en un punto, procurando controlar el proceso de resolucin, a tra-
vs de varias preguntas y a partir de la expresin de una funcin, debe proce-
derse al clculo de las derivadas laterales y decidir sobre la derivabilidad de la
misma en dicho punto.

PRUEBA a.05.01.01
x
Considrese la funcin dada por f (x) = --
1+ Ixl
1) Cul es el valor de las derivadas laterales de f en x=O?
a) e (0)= f~ (0)= 1
b) e (0)= f~ (0)=-1
c) e (0)= -1 Yf~ (0)= 1
d) f~ (0)= 1 Yf~ (0)=-1

2) Es derivable f en x = O? En caso afirmativo, cul es el valor de su derivada


enx = O?

a) S, y su derivada en x = O es l.
b) S, Ysu derivada en x = O es-l.
c) No, al ser distintas las derivadas laterales de f en x = O.
d) No, al estar definida f por medio de valores absolutos.

PRUEBA a.05.01.02

si x:/:.O
Dada la funcin f(x) = {--" Sl X = O

1) Cules de las expresiones que siguen son correctas?

1. f' (O)= lim f(h)


+ h---*O+ h
2.
,
f_ (O) = hm
. --
1
t---*o- 1+ e
3. f'(O) =lim~
x---*o 1+ e

4. f'(O) =O
Banco de pruebas 205

a) 1Y2
b) 1 y4
c) 2y3
d) Todas

2) Cul es el valor de las derivadas laterales de f en x = O?


a) f~ (O) = f~ (O) = O
b) f~ (O) = f~ (O) = 1
c) e (O) = O; f~ (O) = 1
d) f~ (O) = 1; f~ (O) = O

3) Es derivable f en x = O? En caso afirmativo, cul es el valor de su derivada


enx = O?

a) S, y su derivada en x = O es O
b) S, Ysu derivada en x = O es 1
c) No, al ser distintas las derivadas laterales de f en x =O
d) No, al no estar definida f en x = O
206 La evaluacin de aprendizajes

OBJETIVO (5)
CAPACIDAD: Aplicacin.
CONTENIDO: Derivabilidad de una funcin en un punto. Clculo de
lmites. Derivadas laterales.

DISEO (2): Para comprobar si se sabe aplicar el concepto de derivada de


una funcin en un punto y con el fin de controlar el proceso de resolucin, a
partir de la expresin de una funcin, con el apoyo de la grfica de la misma y
a travs de varias preguntas debe procederse al clculo de las derivadas laterales
y decidir sobre la derivabilidad de la misma en dicho punto.

PRUEBA a.05.02.01

La funcin f(x) = sen Ixl tiene por grfica la


que figura a la derecha:

1) Cul es la expresin de la funcin deri-


vadaf'(x)?

a) f'(x) = eas Ixl, para x #- O

b) f'(x) = leas xl
e)
f'(x) = { - eas x para x>
x~O
d)
f'(x) = {- eos
eas x para x >
<O

2) Cul es el valor de las derivadas laterales de f en x = O?


a) f~ (O) = f~ (O) = -1
b) f~ (O) = f~ (O) = 1
c) e (O) = -1; f~ (O) = 1
d) f~ (O) = 1; f~ (O) = -1

3) En el caso de que exista, cul es el valor de f' (O)?


a) -1
b) 1
c) No existe, al no ser f derivable en x = O
d) No existe, al no ser f continua en x = O
Banco de pruebas 207

PRUEBA a.05.02.02

La grfica de la derecha corresponde a la


funcin dada por f(x) = I x31.

1) Cul es la expresin de la funcin deri-


vada f'(x)?

a) f'(x) = {-3X~ Sl x>


3x s~ x ~O

b) f' (x) = { -3x3X~ Sl


s ~ x>
x ~ O
O

e) f'(x) = 13x21
d) f'(x) = 3x2

2) Cul es el valor de las derivadas laterales de f en x = O?


a) e (O) = f~ (O) = o
b) e (O) = f~ (O) = _00
c) e (O) = f~ (O) = +00
d) e (O) = -00; f~ (O) = +00
3) En el caso de que exista, cul es el valor de feO)?
a) -00
b) +00
c) O

d) No existe
Diagnstico: 4.01.01.1-a) / 4.01.01.2-b) / 4.01.02.1-d) / 4.01.02.2-b) /
4.02.01.l-a) / 4.02.01.2-b) / 4.02.02.1-d) / 4.02.02.2-b) / 5.01.01.1-a) /5.01.01.2-a)
/ 5.01.02.1-a) / 5.01.02.2-d) / 5.01.02.3-c) / 5.02.01.l-d) / 5.02.01.2-c) /5.02.01.3-
c) / 5.02.02.1-a) / 5.02.02.2-a) /5.02.02.3-c)
208 La evaluacin de aprendizajes

4.2. Fsica (Garca Mendoza y Soler, 1994)


OBJETIVO (4)
CAPACIDAD: Comprensin.
CONTENIDO: Cinemtica. Composicin de movimientos.
DISEO (1): Se propone una situacin problema en la que el mvil est
sometido a dos movimientos independientes. La dificultad de las distintas prue-
bas es consecuencia de que en unas se dan los datos directamente, con lo que
se puede deducir la respuesta de forma inmediata; mientras que en otras el
alumno debe deducir los datos que no se le dan expresamente.
Se pide identificar las clases de movimientos y las variables que intervienen
en cada uno, para as deducir las caractersticas (tiempo, trayectoria, velocidad,
etc.) del movimiento compuesto. No se tiene en cuenta el efecto Coriolis.

PRUEBA c.04.01.01

Desde lo alto de un precipicio se lanzan


horizontalmente y a la vez tres piedras (A, B
Y C) con distintas velocidades. Cul llega ~" ........
antes al suelo?
\"::;~:~~:~,
...
..
,
a) A ~..... '. .'.
"0 -
. --
-

b)
c)
B
C
~ ~'-
.. . . -
-

d) llegan todas a la vez

PRUEBA c.04.01.02

Un cazador experimentado apunta, con un


rifle sin alza, a la cabeza de un mono que se
encuentra a una distancia de 300 m en una
rama de un rbol. En el momento justo del
disparo, el mono se deja caer al suelo.
Entonces la bala:
a) Dar en la cabeza del mono.
b) Dar en el cuerpo del mono.
e) Pasar por encima de la cabeza del mono si la velocidad es alta.
d) Pasar por encima de la cabeza del mono siempre.

PRUEBA c.04.01.03

Un velero se mueve con velocidad constante en un mar en calma. Se deja caer


un cuerpo desde lo alto del palo mayor. El cuerpo chocar contra el suelo:
a) Delante del palo mayor.
b) Detrs del palo mayor.
e) Justo en la vertical del punto de lanzamiento.
d) No se puede afirmar nada sin saber la velocidad de velero.
Banco de pruebas 209

PRUEBA c.04.01.04

Una persona va en una moto con velocidad constante. Suelta una de sus manos
y lanza verticalmente hacia arriba una bola de acero, dejando la mano extendi-
da. Labola caer:
a) Detrs del motorista, si la velocidad de la moto es grande.
b) Delante del motorista.
c) En la mano que la lanz.
d) Detrs del motorista siempre.

PRUEBA c.04.01.05

Un nadador que es capaz de mantener una velocidad constante de 1 m.s-1 res-


pecto al agua en reposo, desea atravesar un ro cuya corriente tiene una veloci-
dad de 1 m.s-1. Para hacerla en el menor tiempo posible, debe nadar en una
direccin:
a) Perpendicular a la corriente.
b) Que forme un ngulo de 45 con la corriente y sentido aguas arriba.
c) Que forme un ngulo de 45 con la corriente y sentido aguas abajo.
d) Tarda el mismo tiempo sea cual sea la direccin de marcha que elija.

PRUEBA c.04.01.6

Se dispara un proyectil formando un ngulo de 30 con la horizontal. Qu gr-

h
fica representa correctamente el espacio horizontal X recorrido por el proyectil
en funcin del tiempo?

x x
x

a) b) c) d)

PRUEBA c.04.01.07

Un nio lanza con un tirachinas una piedra a un pjaro que vuela horizontal-
mente a una altura de H m. El tiempo transcurrido desde que la piedra golpea
al pjaro hasta que ste choca contra el suelo slo depende de:
a) Velocidad que lleva el pjaro.
b) Altura H.
c) Altura H y velocidad que lleva el pjaro.
d) Distancia entre el nio y el pjaro en el momento del impacto y altura H.
210 La evaluacin de aprendizajes

PRUEBA c.04.01.08

Un defensa golpea un baln hacia la puerta contraria. La aceleracin del baln


durante el vuelo:
a) Es mxima en el punto ms alto de la trayectoria.
b) Es la misma en todo el recorrido.
c) Es mayor en el trayecto de subida que en el de bajada.
d) Es cero en el punto ms alto de la trayectoria.

PRUEBA c.04.01.09
~ ~ ~
Al golpear un baln se le comunica una velocidad inicial Va = Si + lO} . En el
punto ms alto de su trayectoria la velocidad y la aceleracin toman los valores:
a~~~j jj
SiOj ~ -9,S
10 -9,S
9,S
9,S
~
~

Se dispara un proyectil formando un ngulo de 30 con la horizontal. Qu


magnitud, referida al proyectil, permanece constante?
a) Vector velocidad.
b) Componente horizontal del vector velocidad.
c) Componente vertical del vector velocidad.
d) Mdulo del vector velocidad.

Diagnstico 4.01.0l-d) / 4.01.02-a) / 4.01.03-c) / 4.01.04-c) / 4.0l.05-a) /


4.01.06-b) / 4.01.07-b) / 4.01.0S-b)/ 4.01.09-b) /4.01.10-b)
Banco de pruebas 211

4.3. Qumica (pereda y Soler, 1994)


OBJETIVO (44)
CAPACIDAD: Aplicacin.
CONTENIDO: Electroqumica. Electrolisis.
DISEO (1): Se pide la aplicacin de los principios de la electrolisis a casos
concretos llegando a deducciones cuantitativas.

PRUEBA a.44.01.01
Tres cubas electrolticas idnticas contienen disoluciones acuosas diluidas de
igual concentracin de HC1, HZS04 y Hl04. Si se hace pasar la misma cantidad
de electricidad, en cul de ellas se recoger ms volumen de hidrgeno en
c.n.?

a) HCl
b) HZS04
c) Hl04
d) Igual en las tres

PRUEBA a.44.01.02

En la figura se observan dos cubas electro- + -


lticas idnticas con sendas sales: NiClz y
NiC13, fundidas. Con estos datos, qu se + +
puede afirmar sobre los depsitos en cada
una?

a) Se deposita la misma masa de


NiCI2 NiCls
nquel en ambas.
b) Se deposita el mismo nmero de
equivalentes de nquel en ambas.
c) Se deposita ms masa de nquel en la de NiC13.
d) Se precisa conocer la carga que circula para determinar si hay diferen-
cias.

PRUEBA a.44.01.03
En la electrolisis de una sal de oro desconocida, se obtuvieron 3,09 g de oro
haciendo pasar 4.550 C. Cul es el eq-g del in oro en dicha sal?
Dato: 1 F = 96.500 C
a) 49,25 g
b) 65,66 g
c) 98,5 g
d) 197g
212 La evaluacin de aprendizajes

PRUEBAa.44.01.04

En la electrolisis controlada de AuCl3 se desprende Clz en un electrodo y se


deposita Au en el otro. Indicar cuntos moles de electrones se necesitan para
que se deposite 1 mol de Au y en qu electrodo tendr lugar ese depsito.
a) 3 moles en el ctodo.
b) 3 moles en el nodo.
c) 1 mol en el ctodo.
d) 1 mol en el nodo.

PRUEBA a.44.01.05

Sabiendo que EONi2+/Ni = -0,25 v y EOclz/cl = -1,36 v, qu potencial mnimo se


requiere para electrolizar una disolucin acuosa de NiClz en condiciones estn-
dar?

a) 0'11 v
b) 1,61 v
c) 2,22 v
d) 2,51 v

Diagnstico: 44.01.01-d) / 44.01.02-b) / 44.01.03-b) /44.01.04-a) /44.01.05-b)


Banco de pruebas 213

4.4. Biologa (Brcena, llana y Olaizola, 1994)


OBJETIVO (6): Describir la morfologa de la clula y la fisiologa de sus
orgnulos.
CAPACIDAD: Comprensin.
CONTENIDO: Morfologa y fisiologa celular.
DISEO (1): Se pregunta sobre la relacin entre distintas estructuras celula-
res y sus funciones.

PRUEBA c.06.01.01

Cul es el camino correcto que ha de seguir una protena sintetizada por un


ribosoma para llegar al interior de una vacuola digestiva?
a) Ribosoma, hialoplasma, lisosomas y vacuola.
b) Ribosoma, hialoplasma, mitocondria y vacuola.
c) Ribosoma, retculo endoplasmtico rugoso, retculo endoplasmtico
liso, aparato de Golgi, lisosoma y vacuola.
d) Ribosoma, reticulo endoplasmtico liso, lisosoma, aparto de Golgi y
vacuola.

PRUEBA c.06.01.02

me qu tipo de clulas es propia una pared celular cutinizada?


a) Todas las clulas animales.
b) Clula vegetal adaptada a un medio seco.
c) Clula vegetal adaptada a medio hmedo.
d) Clula vegetal de tejidos conductores como el xilema.

PRUEBA c.06.01.03

Una clula vegetal se caracteriza por:


a) Tener pared celular de celulosa y cloroplastos.
b) Presencia de membrana plasmtica y ausencia de pared celular.
c) Ausencia de pared celular y gran abundancia de mitocondrias.
d) Presentar su ADN disperso por el protoplasma.

Diagnstico: 6.01.01-c) / 6.01.02-b) /6.01.03-a)


214 La evaluacin de aprendizajes

4.5. Geologa (Brcena, Dona y Olaizola, 1994)


OBJETIVO (4): Describir los procesos de la Tectnica Global.
CAPACIDAD: Comprensin.
CONTENIDO: Laestructura de la corteza terrestre y la tectnica de placas.
DISEO (1): Se proponen varias definiciones y/o caractersticas y se pide
que se relacionen con el nombre que reciben.

PRUEBA c.04.01.01
Cmo se define una dorsal medio-ocenica?
a) Grandes cordilleras marinas de plegamiento.
b) Acumulaciones de lava basltica con claras anomalas trmicas positivas.
c) Geosinclinales en los que se estn produciendo el plegamiento de
rocas sedimentarias.
d) Fosas submarinas en las que la corteza ocenica subduce.

PRUEBA c.04.01.02

Cmo se define una placa litosfrica?


a) Fragmento de la corteza en forma de casquete esfrico.
b) Fragmento de litosfera limitado por fallas transformantes.
c) Una estructura en forma de casquete esfrico cuyo lmite inferior es la
astenosfera.
d) Una porcin de la corteza ocenica en movimiento.

Diagnstico: 4.01.01-b) /4.01.02-c)


Banco de pruebas 215

4.6. Filosofa (Ordez, 1996)


OBJETIVO (4)
CAPACIDAD: Aplicacin.
CONTENIDO: Convencionalismo de los sofistas.

DISEO (1): Resolver una serie de casos relacionados con el concepto de


convencionalismo poltico y tico.

PRUEBA a.04.01.01
Segn el convencionalismo poltico, cul es el origen de las leyes polticas?
a) La convencin de las voluntades de los dioses.
b) El acuerdo social de la mayora.
c) Las leyes dadas por e! acuerdo de los fundadores de la polis.
d) El Logos o Razn Universal.

PRUEBA a.04.01.02

Pero, segn yo creo, la naturaleza misma demuestra que esjusto que elfuer-
te tenga ms que el dbil. Los valores morales, como la justicia, se fundamen-
tan segn los sofistas en la:
a) Voluntad del ms fuerte o en la voluntad de la mayora.
b) Astucia de los dioses, que son ms fuertes que los humanos.
c) Conciencia de cada superhombre.
d) Imposicin de las tradiciones populares de las culturas dominantes.

PRUEBA a.04.0l.03

Si cualquier hombre criado en sociedad, nos dice el sofista, se encontrase


con hombres en estado natural, aorara la presencia de Euribatos y Frinon-
das -dos ejemplos de hombres malvados-. Segn Protgoras, y atendiendo
al anterior texto:

a) El hombre es social por naturaleza, como dice Aristteles.


b) La educacin es necesaria para transformar a un hombre en ser social.
c) La educacin no consiste en transformar las opiniones inconvenientes
en convenientes.
d) La educacin no tiene sentido si el hombre es medida de todas las
cosas.

PRUEBA a.04.01.04

El bien y la verdad en e! plano tico dependen del mayor o menor grado de pla-
cer que nos proporcionan y del poder establecido. El resto de las normas mora-
les son:

a) Consecuencia de! temor a los dioses, impuesto por la religin.


b) Una gua para aceptar la muerte y el dominio del poderoso.
216 La evaluacin de aprendizajes

c) Una imposicin de los usos y costumbres sociales del pueblo conquista-


dor.
d) El resultado de un acuerdo, y posiblemente antinaturales.

PRUEBA a.04.01.05

La admisin por los sofistas de la convencionalidad de las leyes polticas estaba


suponiendo la existencia de unos valores muy propios de la cultura occidental.
Cules eran?
a) El progresismo en las legislaciones y en los pueblos.
b) El acceso a la lectura y escritura.
c) El rgimen democrtico y de libertades.
d) La existencia del derecho y de la magistratura.

PRUEBA a.04.01.06

En el fondo no tenis idea de los valores del hombre, y por eso no sois con-
ductores sino seductores, deca Platn de los sofistas. Segn esta crtica, el
requisito de acuerdo de la mayora, es suficiente para que algo se convierta en
ley?
a) S, porque los acuerdos de la mayora marcan el bien comn.
b) No, porque los acuerdos pueden estar equivocados.
c) S, porque eso es lo que se requiere para que algo sea ley
d) No, porque aparte de los acuerdos, se requiere que la ley sea justa.

Diagnstico: 4.01.01-b) / 4.01.02-a) / 4.01.03-b) / 4.01.04-d) / 4.01.05-c) /


4.01.06-d)
NOI)lf)I:lI'lf) -11
.1
NOI)lf)n051 N5I"0105l1l\lln
.1
Despus de haber estudiado el primer elemento de la evaluacin y, a su vez, de
la medida, es decir, la recogida de datos con un estudio pormenorizado de los
distintos instrumentos para recoger dichos datos, abordamos ahora el segundo,
la valoracin, codificada generalmente en una calificacin.
Como ya hemos subrayado, la recogida de informacin es condicin indis-
pensable para llegar a conocer el estado de los alumnos en un momento dado;
sin ella la evaluacin queda en mera opinin del profesor. Si bien en la prcti-
ca docente se valoran los datos conforme se van recogiendo durante la correc-
cin de pruebas -se califica al corregir-, conviene tener en cuenta que el
mero resultado de dicha informacin, aunque sea numrico, no tiene significa-
do por s mismo, no es an una calificacin; cuyo significado se deriva no del
carcter cuantitativo de tales datos, sino del valor que se les asigna en un con-
texto acadmico. As, por ejemplo, 5 problemas o 50 pruebas objetivas bien
resueltos de un total de 10 problemas o 100 pruebas, respectivamente, son
resultados numricos sin significado inherente; hay que valorados para conver-
tir el 5 y el 50 en calificacin de suspenso o aprobado. En conclusin, la califica-
cin es un juicio de valor en el que se comparan los datos obtenidos en la reco-
gida de informacin, que reflejan el cmo es de lo que se va a evaluar, con
unos determinados parmetros de referencia, que indican el cmo debera
ser (Zabalza, 1989); es decir, los criterios con que se van a comparar los datos
obtenidos.
Elegir esta base de referencia, llamada a veces normotipo, parece algo ino-
cuo e intrascendente; sin embargo, es una decisin fundamental en la tarea de
todo profesor y conlleva consecuencias significativas, por lo que es importante
entender las diferencias de los procedimientos para corregir pruebas que se
presten a un tipo de valoracin ms que a otro, y que cualquiera de stos com-
porta virtualidades y riesgos. Aunque son varias las formas para llegar a la valo-
racin de datos, se suelen citar dos: valoracin normativa y criterial; si bien
sucesivas matizaciones en ambos casos pueden dar pie a una lista ms amplia
de normotipos (Hills, 1981).
Se oye con frecuencia que las buenas pruebas se construyen para hacer un
solo tipo de valoracin: si el estndar por el que se opta es el absoluto, los ins-
220 La evaluacin de aprendizajes

trumentos de evaluacin deben servir para una interpretacin criterial; si el


relativo, para una normativa. En la prctica docente se suelen llevar a cabo
ambas de forma espontnea, haciendo matizaciones normativas a las valoracio-
nes criteriales.
1. Valoracin normativa (entre los muchos autores que la tratan se
pueden citar: Ebel y Frisbie, 1977; Rodrguez Diguez, 1980; Zabalza, 1989):
Cuando referimos los resultados a otros individuos para obtener un significa-
do, estamos haciendo una valoracin normativa o relativa. Otros autores
hablan de normotipo estadstico,>. El trmino quiere decir normal, que tie-
ne una connotacin de tpico, usual o promedio. As, la valoracin normati-
va supone comparar los resultados de una persona con su grupo de referen-
cia: est por encima o por debajo, un poco o muy por encima? Por ejemplo,
si para interpretar las puntuaciones de un alumno, comparamos el rendimien-
to del mismo con el rendimiento de los otros, estamos haciendo una valora-
cin normativa. sta se basa, pues, en unos criterios relativos que discrimi-
nan a los sujetos de acuerdo con una distribucin de resultados de todos los
que han realizado la prueba.
Las pruebas construidas para hacer este tipo de valoracin se conocen con
el nombre de pruebas normativas, y su aplicacin ms frecuente es la ordena-
cin de personas en concursos, oposiciones, etc. Aquilatando un poco ms, a
veces se llama valoracin propiamente normativa a la que se hace entre indivi-
duos y grupos, y de tratamiento a la que se hace entre grupos.
Es obvio que la calificacin obtenida mediante una valoracin normativa
depende mucho de la naturaleza del grupo con el que se compara. Una persona
puede pertenecer a la vez a varios grupos y, consiguientemente, su situacin
relativa puede variar de un grupo a otro: alumnos con una actuacin satisfacto-
ria podran fracasar en un grupo brillante; por el contrario, un grupo de malos
alumnos podra permitir el xito de incompetentes. Mediante una valoracin
normativa, los alumnos quedarn siempre clasificados en dos grupos: los
admitidos y los excluidos; sin la seguridad de que los admitidos sean, adems,
competentes.
Las calificaciones en todos los sistemas se suelen codificar en diez nmeros
o cinco letras para expresar varios niveles de logro; en ste, el cdigo 10/NSB
indica actuacin excelente; 7/B/N, ms que media; 5/C/S, media; 4/D1I, por
debajo de la media o insuficiente; y O/E/MD,logros muy deficientes.
En las calificaciones conseguidas por este mtodo, suelen ser pocos los
que queden en el lmite de poder recibir una nota ms alta; en este caso, los
profesores reciben menos quejas y peticiones de los alumnos para revisar
exmenes en busca de algn punto extra con que subir de 4 a 5 o de 5 a 7. Si
la distribucin de resultados es muy dispersa, probablemente se obtendrn
calificaciones similares por cualquier mtodo de calificacin relativa; sin
embargo, cuando los resultados estn ms concentrados, puede ser injusto
para algunos alumnos, dado que con una leve revisin podran mejorar sus
La medida en educacin. 11. Calificacin 221

calificaciones. Por ello, este mtodo de calificar no es aconsejable en situacio-


nes acadmicas.
Por otra parte, este tipo de calificacin se complica por la necesidad de esta-
blecer cuotas arbitrarias para cada categora. Las cuotas pueden asignarse
mediante cortes hechos en una lista de alumnos ordenados por sus resulta-
dos: hasta el primero se califican con SB, hasta el segundo con N, y as hasta
MD. La principal falacia de este sistema es que no es fcil que exista un criterio
objetivo que permita 'delimitar la extensin y decidir la localizacin de los cor-
tes. Qu proporcin de notas deben ser SB, N, S, etc.? En toda valoracin
normativa hay siempre implcito algn tipo de criterio que se relativiza en la
comparacin con el grupo. Una dificultad aadida es el hecho de que alumnos
con logros semejantes queden con calificaciones distintas en virtud del criterio
de corte utilizado.
Un modo de asignar cuotas de calificacin relativa es mediante la desviacin
tpica, que permite determinar cortes segn la proporcin de alumnos que
queramos obtenga las distintas calificaciones de 5B, N, 5, lo MD. Para determi-
nar los sitios de corte a partir de la desviacin tpica, un criterio puede ser el
siguiente (Ebel y Frisbie, 1977):
Para la calificacin S (actuacin media), se suma y se resta a la media la
mitad de la desviacin tpica. Se obtiene as el intervalo para la califica-
cin S.
Para determinar la calificacin que separa las notas SBy N, se suma la des-
viacin tpica al extremo superior del intervalo de las notas 5.
Para el corte de las notas I-MD, se resta la misma cantidad del extremo
inferior de las S.
Finalmente, conviene revisar al alza o a la baja los casos que caen en los
lmites (casos frontera), teniendo en cuenta el nmero de pruebas reali-
zadas, la calidad de las puntuaciones o algn otro dato relevante de los
logros.
Si el nmero de alumnos fuese lo suficientemente elevado para poder supo-
ner que la distribucin de las calificaciones es normal, este mtodo nos dara
los siguientes porcentajes: 38,3% para los 5, 24,1% para los N e 1y 6,7% para los
5ByMD.
La tabla de la pgina siguiente recoge un ejemplo de las puntuaciones de los
40 alumnos de una clase de Historia del Arte:
222 La evaluacin de aprendizajes

1 4
2
3
9
8
5 Lxf
40
20
32
54
27
21
12
2
4 = Lx2f
324
256
243
200
147
36
2
80 = 1296
8
212

1 Se calcula la media de todas las puntuaciones:


LX. f;. 212
x: = 1 = -- = 5,3
N 40
2 Se calcula la desviacin tpica:

-
(j-~~ ~~f;. _ x:2 = ~ 11296
40 _ (5, 3)2 = 2, 07

. d d e d'1C
Y1a mIta h a d eSVIaClon
.. , tlpIca:
,. 2, 7 = 1,03
--
2
3 Para determinar los sitios de corte:
Intervalo de calificaciones S: (S,3 - 1,03 , S,3+ 1,03) = (4,27, 6,33).
Observamos que hay 17 alumnos con puntuaciones en este intervalo (S a 6),
que representan el 42,S% de los 40 alumnos.
Corte de las calificaciones SB-N: (6,33 + 2,07 = 8,4).
Sern calificados con N los alumnos cuyas puntuaciones estn en el interva-
lo (6,33,8,4), y con SBlos que tengan ms que 8,4.
Observamos que hay 7 alumnos con N (los de 7 y 8), que representan el
17,S%;y 3 alumnos con SB (los de 9), que representan eI7,S%.
Corte de las calificaciones I-MD: (4,27 - 2,07 = 2,2).
Sern calificados con I los alumnos cuyas notas estn en el intervalo (2,2,
4,27), y con MD los que tengan menos de 2,2.
Hay 9 alumnos con I (los de 3 y 4), que representan el 22,5%; Y4 con MD
(los de 1 y 2), que representan el 10%.
La medida en educacin. II. Calificacin 223

En resumen:
SE: 7,5% (3)
N: 17,5% (7)
S: 42,5% (17)
1:22,5% (9)
MD: 10% (4)
Obsrvese que los porcentajes son parecidos a los que obtendramos si la
distribucin fuese normal con un nmero suficiente de alumnos.

2. Valoracin criterial (entre los muchos autores que la tratan se pue-


den citar: Ebel y Frisbie, 1977; Rodrguez Diguez, 1980; Zabalza, 1989): Se basa
en unos criterios absolutos que permitan valorar la competencia de una perso-
na. Fue Glaser (1963) quien us por primera vez el trmino para destacar la
necesidad de pruebas que puedan describir la posicin del aprendiz respecto
de un programa y no de un grupo.
Se realiza una valoracin criterial cuando la comparacin se establece en
relacin a un marco de referencia externo de estndares absolutos, el cual
determina los requisitos qe ha de reunir lo evaluado (aprendizajes, institucio-
nes, etc.). Obviamente, en la evaluacin de aprendizajes estas referencias son
los objetivos. Este tipo de valoracin permite evaluar la actuacin de una perso-
na segn un nivel determinado para, sin tener que comparada con otras, esta-
blecer si posee competencia en una tarea dada. Es posible, por tanto, declarar
aptos a todos los alumnos; y tambin, tericamente, suspender a todos. As
pues, de acuerdo con varias gradaciones, y en un sentido absoluto, la califica-
cin encierra un significado de lo que la persona puede hacer.
Despus de 40 aos, el trmino criterio sigue siendo confuso, en parte
debido a que se usa con diferentes significados; por lo que algunos autores
sugieren que se utilicen otras expresiones, como la valoracin de dominio de
una muestra o de cada uno de los objetivos de aprendizaje.
Se habla, as, de dominio de un repertorio de objetivos cuando las pregun-
tas de un examen se refieren a todos y cada uno de esos objetivos fijados de
antemano; y de dominio de una muestra para describir valoraciones absolutas
de exmenes que slo representan algunos de los objetivos programados. En
este segundo caso, la valoracin ha de centrarse en la proporcin de objetivos
conseguidos, aunque se deben extrapolar deducciones sobre los objetivos no
recogidos en la muestra. De todas maneras, no es fcil determinar la muestra de
un dominio, especialmente en ciencias sociales, ms que en las experimenta-
les y Matemticas.
En suma, cuando se habla de dominio, se hace referencia a una valoracin
criterial que se aplica bien cuando el examen refleja todos los objetivos, bien
cuando slo aparece una muestra. Es la valoracin ms frecuente en situaciones
acadmicas, aunque a menudo viene matizada por la valoracin normativa: los
224 La evaluacin de aprendizajes

estndares absolutos se suelen modificar ms o menos explcitamente segn la


calidad del grupo, tal como se indic anteriormente.
En general los profesores, por razones tericas, prefieren estas calificaciones
absolutas a las relativas; sin embargo, encuentran difcil, y en algunos casos arbi-
traria, la tarea de establecer estndares. Para hacer valoraciones absolutas, se
proponen dos mtodos:
a) Porcentajes: El primero consiste en otorgar las calificaciones segn
los porcentajes de objetivos que domina el alumno. As, una calificacin de
80% significa que se domina el 80% de los objetivos de aprendizaje pedidos
en la prueba.
Generalmente, los porcentajes se convierten ms tarde en notas numricas
o literales al compararlos con los estndares establecidos por el profesor. Por
ejemplo, a los alumnos con calificaciones entre el 95 y 100% se les da un SE;
entre el 85 y 94%, un N; entre el 75 Yel 84%, un S; y as sucesivamente.
La restriccin, ms que en el nmero de alumnos elegibles para recibir cada
una de las posibles notas, se encuentra aqu en el rango de las calificaciones;
por lo que una primera dificultad, semejante a la citada al hablar de la valora-
cin normativa, viene dada por las razones para determinar el intervalo de
cada nota: por qu para los SE se decide el 95, en vez del 90 o el100%?
Otra gran dificultad es la costumbre de usar porcentajes fijos en el tiempo.
No parece lgico que permanezcan constantes a lo largo de todo un curso, es
ms defendible establecer porcentajes variables; por ejemplo, que el rango de
los SE sea 95-100% para el primer trimestre, 88-100% para el segundo, 85-100%
para el tercero y 90-100% para el examen final.
Una tercera dificultad de las calificaciones porcentuales es la situacin que
se crea cuando la mejor nota de un examen es excesivamente baja, por ejemplo
68%. En este caso, algunos profesores no se complican la vida con preguntas
tales como era el examen demasiado difcil?, estudiaron poco los alumnos?,
no se ense bien?, e introducen directamente ajustes sustituyendo la califica-
cin perfecta, 100%, por la ms alta conseguida, el 68%. Aunque este reajuste
sirva de alivio a los afectados, se establece as un nuevo dominio con una serie
de interrogantes: cmo se puede definir este nuevo dominio?, qu interpreta-
cin til se puede hacer de las nuevas calificaciones?
b) Objetivos: Un segundo mtodo de calificacin absoluta es el basado en
la relacin entre el nmero y dificultad de las cuestiones de una prueba y los
objetivos programados. Este mtodo depende de los juicios del profesor para
establecer el tipo y la cantidad de conocimiento que los alumnos deben demos-
trar para conseguir cada nota. Entraa los siguientes pasos:
En primer lugar, el profesor ha de describir, preferiblemente por escrito,
los objetivos que debe haber alcanzado el alumno para pasar por los
pelos y asignarle la calificacin de aprobado mnimo o S, para obtener
una nota de N, de SE, etc.
La medida en educacin. 11. Calificacin 225

Con las descripciones en la mano, el profesor lee el primer tem de la


prueba y decide si un alumno con slo el mnimo de logro debe ser
capaz de responded o correctamente. Si es as, se registra una S; en caso
contrario, la pregunta se califica como de nivel superior, N o en su caso
SB; y se aplica el mismo procedimiento al tem 2, 3, etc. El proceso con-
tina hasta clasificar todos los tems.
La cuota estimada para un S se determina sumando el nmero de sm-
bolos S que se escribieron junto a los tems. Supongamos que en este
caso resulte 29. A continuacin se suman los smbolos N, a los que se
aade 29 para obtener la calificacin corte para una actuacin de N. Y as
hasta que se haya determinado una calificacin de corte para cada nota.
En resumen, podra resultar:
SB = 48-50
N = 40-47
S = 29-3'9
1 = 17-28
MD = 0-16
La clave final se puede obtener ajustando 2 o 4 puntos hacia abajo las
cuotas estimadas, segn la longitud de la prueba. Este ajuste pretende
corregir, en favor del alumno, el posible error de que nuestras estima-
ciones no sean fiables. As, con un ajuste de 2 puntos, los resultados
para obtener desde 1 a SB en nuestro ejemplo son, respectivamente, 15,
27,38 y 46.
En el caso de preguntas abiertas o problemas cientfico-matemticos, prue-
bas que no se puntan con 1/0, sino que admiten una gradacin de puntos, este
extremo ha de tenerse en cuenta a la hora de clasificados con S, N, SB, etc., y
decidir el mnimo nmero de puntos que debe conseguir un alumno en cada
nota.
Este mtodo, sin embargo, tiene tambin sus limitaciones. A veces resulta
difcil que profesores de una misma materia y de un mismo curso se pongan de
acuerdo sobre los conocimientos que se deben mostrar en cada lugar de la
escala de notas y, por consiguiente, en la clasificacin de los tems. No obstante,
se puede llegar a consensos aceptables si los profesores estn dispuestos a defi-
nir la actuacin estn dar por escrito y si son capaces de proporcionar unas razo-
nes defendibles para sus juicios clasificatorios (Terwilliger, 1989).
3. Calificacin por referencia al propio alumno (Rodrguez Diguez,
1980; Zabalza, 1989): Si la valoracin se realiza desde la perspectiva de la evolu-
cin del mismo sujeto, se habla a veces de calificacin por diferencia o normo-
tipo individualizado: se valoran las ganancias que el alumno ha manifestado a
partir de una determinada lnea base (LB).
Algunos profesores consideran esto ms justo, sobre todo en el caso de
alumnos con necesidades educativas especiales (n.e.e.) en etapas de educacin
226 La evaluacin de aprendizajes

obligatoria (lvarez y Soler, 1998; lvarez, Gonzlez-Pienda, Nez y Soler,


1999). Para estimar esa cantidad de cambio y crecimiento, se utilizan pruebas
antes y despus de la intervencin. Sin embargo, son pocas las pruebas escola-
res lo suficientemente buenas como para ofrecer medidas fiables de ganancias a
corto plazo en los logros individuales de alumnos.
Adems de la fiabilidad, hay otros problemas con las medidas del crecimiento.
Por una parte, para la mayora de los fmes educativos, es ms til el conocimiento
del nivel de un alumno en relacin con un programa o con el de sus compaeros,
que el saber si ese alumno ha cambiado ms o menos rpidamente que los otros
a lo largo de un perodo de entrenamiento; por otra, los alumnos con capacidad
medio-alta, cuando saben que la calificacinse obtiene mediante el grado de cre-
cimiento, aprenden de inmediato que sus calificaciones en el pretest deben ser lo
ms bajas posible para permitirles mayor ganancia.
4. Calificacin por contrato: Supone un acuerdo entre profesor y alum-
no en el que se especifican los logros que ste debe alcanzar y qu nota se le
asignar si los consigue. Taylor (1980), que revis ms de cien informes en los
que se describe la calificacin por contrato, concluye que sta, aunque se pre-
senta de mltiples formas, hasta el extremo de que cada maestro inventa su
propio sistema, tiene un sitio permanente entre los mtodos para asignar notas.
Este tipo de calificacin se adapta mejor a alumnos con buen nivel intelectual
y con motivacin de logro. Por otro lado, es ms eficaz con clases pequeas y
programas flexibles, en los que los alumnos tienen la opcin de seguir intereses
individuales. En todo caso, el contrato ha de redactarse siempre por escrito,
para que no haya ningn malentendido sobre lo que se debe hacer, cmo,
cundo y por quin.
5. Valoracin de nivel mnimo: Exige sealar un nivel mnimo, aun-
que, segn el mtodo empleado para fijado, implcitamente se est usando una
norma relativa o un criterio absoluto. Un ejemplo sera proponer una prue-
ba para determinar qu alumnos podran seguir con aprovechamiento un curso
de lgebra: si se selecciona el 20% mejor (16 de una clase de 80), se est utili-
zando una norma; si, en cambio, se seleccionan todos los alumnos que hayan
alcanzado unos determinados objetivos, se recurre a un criterio de dominio.
Ejemplos de nivel mnimo podran ser los siguientes: Se requiere una
media de 6,5 para entrar en Medicina; los que saquen ms de 8,5 de media
no necesitan ir al examen final. Un caso extremo de esta valoracin es la califi-
cacin determinada por el resultado mnimo; as, si los resultados parciales fue-
ron [5, 6, 7 Y8], la calificacin es 5.
Hasta aqu un breve estudio de la medida en educacin, con sus dos
dimensiones de recogida de datos y su valoracin, imprescindibles para abordar
con cierta garanta el tercer elemento, y ms complejo, la toma de decisiones,
que estudiaremos a continuacin.
v AIJ.V)n051
NOI)Vn'VA5I
.1
V1 N5I
S5INOISI)5IO 510 VIlUOJ.
La toma de decisiones es algo que est presente en todo momento a lo largo
del proceso de instruccin. Sin embargo, aqu nos centramos fundamentalmen-
te en su estudio como tercer elemento esencial de toda evaluacin y que sigue
al juicio de valor sobre los resultados codificado en la calificacin, de acuerdo
con la definicin de evaluacin por la que hemos optado (cap. 2).
Una decisin se define como una eleccin entre distintas acciones posibles,
lo que supone disponer de alternativas para poder elegir la ms adecuada de
acuerdo con algn criterio. Tal eleccin viene casi siempre acompaada
de determinadas circunstancias de conflicto, incertidumbre y, en definitiva, de
riesgo; lo que ha de hacer reflexionar al que la toma sobre la transcendencia
que puedan tener sus consecuencias. A esto hay que aadir que podemos no
conocer todas las alternativas, que no estn en todo momento a nuestro alcan-
ce o que, en fin, no siempre exista un nico criterio. Por otro lado, la verdad es
que no siempre se busca lo mejor, quiz por aquello de que lo mejor es ene-
migo de lo bueno.
Una decisin, tambin las educativas, la puede tomar una persona, como en
estos momentos es el caso del profesor nico en la Educacin Primaria y la
Enseanza Universitaria, o un grupo, como es el caso de las Juntas de Evalua-
cin exigidas por el ordenamiento legal para la Educacin Secundaria.
En las pginas siguientes nos proponemos estudiar la problemtica de la
toma de decisiones grupal, aunque tambin se tratar la individual, en el con-
texto educativo, a travs de los siguientes apartados: clases de decisiones, enfo-
que racional del proceso y herramientas de formulacin y seleccin de alternati-
vas, para terminar con algunas sugerencias sobre un proceso prctico aplicable
a lasJuntas de Evaluacin.

CLASES DE DECISIONES 1.

En los procesos de evaluacin se manejan distintas decisiones, cada una de las


cuales tiene sus peculiaridades. Simplificando el anlisis, se podra afirmar que
existen dos clases de decisiones: las selectivas y las modificativas.
230 La evaluacin de aprendizajes

1. Decisiones selectivas: Las decisiones selectivas estn relacionadas con


las funciones atribuidas a una evaluacin sumativa (cap. 15). En muchos casos
son irreversibles, por lo que se ha de procurar una especial precaucin y pru-
dencia para que su adopcin ofrezca las mximas garantas de justicia, adecua-
cin y objetividad. Se suelen considerar como decisiones selectivas, entre otras,
las siguientes:
a) Promocin: Tal decisin es la consecuencia de una integracin de juicios
o calificaciones parciales. En general no slo se decide quines promo-
cionan, tambin se establecen diferencias de calidad entre los que pro-
mocionan.

b) Concesin de premios: Tienen este carcter las matrculas de honor, los


premios final de carrera, la seleccin de candidatos para determinados
eventos como olimpiadas de Matemticas o Fsica, etc.
c) Repeticin: La repeticin de un curso o asignatura suele ser una decisin
conflictiva para quienes la toman y para quienes la sufren. De ah la
importancia de acompaada de un informe, haciendo ver al alumno el
riesgo de fracaso futuro si se le promocionase; as como de un plan de
accin para que no se vuelvan a repetir las mismas deficiencias.
2. Decisiones modificativas: Las decisiones modificativas estn relacio-
nadas con la evaluacin formativa (cap. 15), ya que tienen en cuenta el rendi-
miento del alumno para determinar unas actividades de recuperacin, preferen-
temente individualizadas, condicionadas e inspiradas por una simple
orientacin, o por una modificacin diversificadora en la programacin o en la
metodologa. Estas decisiones pueden ser ejecutivas o consultivas (Barbier,
1990).
2.1. Ejecutivas: Son aquellas en las que se asume la responsabilidad de lle-
vadas a la prctica por medio de un plan de intervencin y seguimiento (lvarez
et al., 1999). Las decisiones ejecutivas pueden referirse a diversos mbitos:
a) Decisiones metodolgicas: Mectan directamente al alumno, pero van
ms all del veredicto tradicional que se limitaba a discriminar entre alumnos
que valen y no valen. Se pueden citar, entre otras, las siguientes:

D~cisiones-pronstico: Teniendo en cuenta los conocimientos del alum-


no, su capacidad de trabajo y otras aptitudes, se pronostica sobre posibi-
lidades futuras; lo que se utiliza para disear y recomendar un plan edu-
cativo adecuado.

Decisiones de orientacin: Determinan ayudas para desarrollar las apti-


tudes innatas de los alumnos, incrementar sus hbitos de estudio y, en
definitiva, obtener resultados satisfactorios (G. Vidal y G. Manjn, 1992).
Decisiones de modificacin de conducta: Complementan las decisiones
de orientacin y pretenden potenciar o eliminar determinados compor-
tamientos. Entre las conductas que han de ser potenciadas estn el
aumento de atencin, el hbito de concentracin, etc.; entre las que hay
Toma de decisiones en la evaluacin educativa 231

que eliminar estn la falta de disciplina, la asistencia incontrolada, la


pasividad en el aula, etc.
Decisiones didcticas: Pretenden promover la construccin personal de
conocimientos significativos mediante asimilacin receptora o mediante
aprendizaje por descubrimiento, tomar en consideracin los conoci-
mientos previos del alumno, adecuar la enseanza a los estadios menta-
les del alumno, combinar la prctica con la teora, etc.
Decisiones motivacionales: Buscan incrementar el inters y la satisfac-
cin de los alumnos en el aprendizaje. Son decisiones didcticas que se
suelen tratar aparte por su importancia. Por ejemplo, mostrar la utilidad
que tienen las tareas que se van a realizar, favorecer que el alumno opte
por ejercitar las estrategias de aprendizaje que le sean ms apropiadas,
explicitar la formulacin de objetivos, los instrumentos de evaluacin y
los criterios de calificacin.
Decisiones asignativas: Se encarga a una persona una funcin o cometido.
b) Decisiones institucionales: Las decisiones institucionales son aquellas
que se toman teniendo en cuenta el conjunto de una institucin, antes que los
valores y necesidades particulares del individuo. Suelen ser procedimentales
porque intentan modificar modos de actuar, tales como:
Proceso de evaluacin: Las funciones de la evaluacin, los instrumentos
de recogida de informacin, la temporalizacin de los exmenes.
Dinmica de las reuniones: Tcnicas de anlisis de las deficiencias y pro-
blemas individuales y grupales; herramientas de eleccin de soluciones
a dichos problemas; distribucin de responsabilidades del Tutor, delJefe
de Estudios, de los profesores.
Sistemas de control y seguimiento de las decisiones.
2.2. Consultivas: La evaluacin educativa termina muchas veces con deci-
siones no ejecutivas. Ocurre esto cuando las soluciones que pueden subsanar
los malos resultados rebasan la responsabilidad del que las toma. Es entonces
cuando aparecen las llamadas decisiones modificativas de' propuesta o sencilla-
mente consultivas. La decisin se limita a la elaboracin de un informe dirigido
al rgano competente con capacidad para ejecutadas para que estime y adopte
la puesta en prctica de lo que se le propone. Otras, por el contrario, dan lugar
a la peticin de datos que sirvan de apoyo a los evaluadores; tal es el caso de los
que se piden a equipos de orientacin, tutores, padres, etc. Son decisiones de
este estilo las relativas al:
a) Alumno: Reglamento Interno, faltas de asistencia, condiciones materiales
y organizativas, masificacin, tratamiento de la diversidad, etc.
b) Profesor: La especializacin y perfeccionamiento didctico, el profesora-
do de apoyo y sustitucin, la formacin del profesorado, etc.
232 La evaluacin de aprendizajes

c) Proyecto curricular de centro: Estrategias especiales para conseguir obje-


tivos difciles o subsanar lagunas por la falta de coordinacin con los cur-
sos anteriores.
d) Organizacin: Horario, equipo psicopedaggico, intervencin de la Jefa-
tura de Estudios, etc.

EL ENFOQUE RACIONAL DE TOMA


2. DE DECISIONES

Conviene recordar que las decisiones educativas las puede tomar una persona o
un grupo. En todo caso, es difcil hacer buenas tomas de decisiones, y ms
cuando las circunstancias de riesgo o incertidumbre son acusadas o cuando,
findose de la propia experiencia y capacidad, se resuelven de manera intuitiva.
Los resultados, en cambio, suelen ser ms eficaces y la probabilidad de acier-
to mayor, sobre todo en el caso de la toma de decisiones grupal, cuando se tie-
nen en cuenta unas reglas inspiradas en teoras psicolgicas y prcticas empre-
sariales. Estas reglas se materializan en el enfoque de toma de decisiones
racional, que Zerilli (1978: 103) define del siguiente modo: La decisin es un
proceso racional continuo mediante el cual partiendo de ciertos datos y efec-
tuando un anlisis y valoracin sobre la conveniencia y las consecuencias
de las soluciones alternativas posibles, respecto a un determinado objetivo, se
llega a efectuar la eleccin final.
Este enfoque expresa siempre una sistematizacin y en muchos casos refleja
tambin un proceder espontneo real que, aunque aparentemente resulte artifi-
cial y tedioso a los profesores nuevos, llega a automatizarse de una manera
natural en profesores habituados.
El enfoque racional de los procesos de evaluacin educativa viene marcado
preferentemente por un carcter grupal, ya que son grupos de docentes los que
toman las deCisiones en los Departamentos, Seminarios, Claustros y Juntas de
Evaluacin. Existen mltiples razones que justifican muy positivamente este
extremo (Huber, 1984):
Los grupos suelen tener ms informacin y mayor capacidad para usada
correctamente que la que puede atribuirse a una persona.
La aceptacin de una decisin tiende a ser ms completa cuando se ha
intervenido en el proceso de tomada.
A todo esto hay que aadir la ventaja que tiene para la institucin la
experiencia que sus miembros adquieren con esa participacin grupal
en la toma de decisiones.
Por el contrario, una de las desventajas que ms afecta a las decisiones
grupales es el consumo de mucho tiempo y el desnimo que esto inspira.
Toma de decisiones en la evaluacin educativa 233

El enfoque racional se presenta estructurado en las siguientes tres fases:


1a Fase: Problema: Una toma de decisiones es una consecuencia de la apa-
ricin de un problema que hay que resolver; por ejemplo, un suspenso o rendi-
miento insatisfactorio de! alumno. Es obvio que sin e! acuerdo de que existe un
problema no puede abordarse su solucin. Pero no son tan obvias las dificulta-
des aadidas, a causa de que la perspectiva del problema sea diferente desde el
punto de vista de cada miembro de! grupo. De ah que una reunin puede
resultar ineficaz si en el grupo no existe la comunicacin debida para llegar a
compromisos comunes.
Esta comunicacin, como elemento previo e imprescindible al anlisis del
problema, se facilita cuando el grupo est jerarquizado, y adopta una dinmica
en las intervenciones yen los procedimientos. As, por ejemplo, en las Juntas de
Evaluacin, el tutor puede anunciar el tema, el tiempo que se le asignar y e!
orden de intervenciones; el Jefe de Estudios puede actuar de secretario toman-
do nota y resumiendo las decisiones tomadas.
Supuesta esta dinmica, para llegar a una buena decisin es preciso analizar
el problema, lo que podr realizarse a travs de los siguientes tres pasos depen-
dientes y complementarios:
1. Deteccin del problema: El primer paso consiste en detectar e! pro-
blema, es decir, en darse cuenta de que una situacin determinada constituye
un conflicto que ha de resolverse. En la prctica educativa el problema aparece,
con cierta facilidad, en los resultados insatisfactorios de los alumnos.
2. Recopilacin de datos: El segundo paso en este anlisis consiste en
recopilar datos que ayuden a definir la situacin problemtica. Se trata de iden-
tificar los factores clave que la delimitan.
3. Objetivo: El ltimo paso de esta fase es traducir el problema a objetivo
en trminos de resultado deseado.
2a Fase: Soluciones: En esta fase se distinguen tambin tres pasos comple-
mentarios.
1. Causas: Esta segunda fase empieza con la investigacin de las causas: se
pretende establecer una relacin entre e! problema suscitado y sus posibles
causas. Suele ser lo ms difcil y lo que puede invalidar todo e! proceso. En algu-
nas-ocasiones, se encontrar una nica causa; en otras, una combinacin de dos
o ms. En general, el profesor se pregunta por las posibles causas de una califi-
cacin negativa: mala preparacin, poco tiempo de estudio, escasa atencin,
deficiencias en la enseanza, deficiencias en las tcnicas de estudio, etc. Ayuda a
encontrar causas la atribucin de variables a distintas dimensiones; lo que se
puede reducir a la informacin sobre capacidades bsicas, conocimientos espe-
cficos y estrategias de estudio (cap. 15). As, por ejemplo, a la dimensin ren-
dimiento general insatisfactorio, pueden atribuirse variables como falta de
atencin, lagunas, poco tiempo de estudio, etc.; ya la dimensin insuficiencia
en el dominio del lenguaje histrico, pueden atribuirse variables como falta
234 La evaluacin de aprendizajes

de retencin, falta de expresin lingustica, problemas de relacin con el profe-


sorado, etc.
2. Soluciones opcionales: El segundo paso consiste en identificar solu-
ciones, sugeridas precisamente por las causas del problema, que sirvan para
alcanzar el objetivo propuesto. Por ejemplo, qu soluciones son las que efecti-
vamente serviran para alcanzar el nivel de suficienca en el dominio del
lenguaje histrico?
La importancia de la bsqueda de soluciones opcionales se pone de mani-
fiesto por el hecho de que, con frecuencia, la decisin resulta inapropiada por
no haber considerado todas las alternativas posibles.
El nmero de alternativas depende en gran medida de la naturaleza de la
decisin. As, en las decisiones de seleccin slo hay dos alternativas: aceptar o
rechazar; por ejemplo, una Junta de Evaluacin acepta o rechaza que un alum-
no tenga matrcula de honor. En cambio, en las decisiones de tratamiento o
modificativas existen ms alternativas; por ejemplo, a los profesores se les pre-
sentan diversas opciones para elegir tareas de recuperacin.
3. Eleccin de la mejor alternativa: Una vez exploradas las opciones, se
trata de elegir una alternativa que al menos ayude mejor que cualquier otra a
superar las posibles deficiencias. Por experiencia se sabe que existen decisiones
evidentes que se toman con mucha facilidad y otras, en cambio, que exigen
muchas deliberaciones y atinadas reflexiones. Esto se debe fundamentalmente a
las siguientes razones, citadas en el Proyecto Inteligencia Harvard (Mega,
1992):
Es extremadamente dificil tomar decisiones cuando se desconoce qu
resultados producirn las diversas opciones.
Si todas las soluciones opcionales llevan a un resultado favorable, o
todas tienen aspectos desfavorables, tambin es difcil optar por alguna
de ellas.
En cambio, cuando una opcin produce resultados claramente mejores
que otros, no resulta difcil elegir.
La alternativa elegida puede gozar de diferentes grados de aceptacin, tanto
entre los individuos sobre los que va a recaer como entre los que la van a llevar
a cabo. La mejor alternativa es la que viene determinada no slo por la calidad,
sino tambin por la aceptacin; a saber, buena decisin = calidad x acepta-
cin.
3a Fase: Plan de accin: Una cosa es tomar una decisin y otra llevada a la
prctica. Por lo tanto, una vez seleccionada la alternativa que ms satisfactoria-
mente resuelve el problema, es necesario elaborar un plan de accin en el que
queden organizadas unas tareas y en el que se establezca un sistema de segui-
miento.
Toma de decisiones en la evaluacin educativa 235

HERRAMIENTAS DE TOMA
DE DECISIONES 3.

Se han elaborado diferentes tcnicas para cada una de las fases de la toma de
decisiones que describiremos a continuacin agrupndolas en torno a tres cla-
ses: anlisis, seleccin y plan de accin, Todas ellas son de aplicacin en las
situaciones de toma de decisiones grupal, algunas tambin para realizadas indi-
vidualmente.
1. Tcnicas de anlisis (Blasco, 1990; Delbecq, Van de Ven y Gustafson,
1975): Son instrumentos de exploracin cuyo fin es precisamente detectar posi-
bles alternativas de problemas, causas, soluciones, etc. Son muchas las que se
pueden encontrar en la bibliografa especializada; por ejemplo, rboles de per-
tenencia, anlisis de grficos, estratificacin de datos. Aqu describiremos con
ms detalle cuatro: las dos primeras de carcter ms general, el brainstorming
para grupos pequeos y el Phillips 66 para grupos ms numerosos; las dos
ltimas ms especficas y complementarias de las anteriores, ya que pueden uti-
lizarse en sus grupos.
a) Brainstorming o tormenta de ideas (Anzieu y Martn, 1975; Ciri-
gliano y Villaverde, 1982): Se apoya en la teora psicolgica de la asociacin de
ideas por contigiiidad, semejanza o contraste, por lo que se rompe la barrera de
lo inconsciente, se estimula la facultad creadora y; al activar procesos asociativos
y reforzar la capacidad de comunicacin, ayuda a descubrir ideas originales,
aumentando la informacin elaborada. El brainstorming se sita en los meca-
nismos de la induccin, desarrollando una actitud interrogativa, poniendo de
manifiesto las preocupaciones de los miembros de un grupo acerca de las posi-
bles alternativas de formulacin de problemas o de sus soluciones.
Para ello se organiza un grupo pequeo, entre 5 y 10 personas, concebido
para presentar ideas divergentes, sin restricciones o inhibiciones debidas a difi-
cultades procedimentales de ejecucin, ni a limitaciones de aptitudes o de habi-
lidades. Todas las ideas son aceptadas sin ponedas en tela de juicio, a menos
que choquen con las reglas acordadas, por ejemplo, en cuanto al tiempo de dis-
cusin, o que tiendan a menoscabar las contribuciones de los otros.
Aunque el brainstorming es relativamente libre, es posible limitado; as,
una sesin de promocin de ideas sobre un campo amplio de problemas, cau-
sas o soluciones puede continuar con otra sobre algn aspecto ms restringido.
Es indispensable, por un lado, que el grupo sea homogneo y est integrado
por individuos relativamente maduros que se conozcan suficientemente bien
como para crear una atmsfera en la que sea aceptable la completa libertad de
expresin; por otro lado, es tambin necesario disponer de suficiente tiempo
para encarar el tema de una manera relajada y sin tensiones, porque no se nece-
siten inmediatamente resultados,
236 La evaluacin de aprendizajes

Supuesta la familiaridad con la tcnica, y ya dentro de las normas prcticas


de funcionamiento, el moderador deber:
Indicar claramente el campo de ideas que se habr de abarcar.
Cerciorarse de que alguien tenga la responsabilidad de llevar un registro
de las ideas expresadas.
Ayudar a establecer y hacer cumplir las reglas acordadas.
Establecer el tiempo lmite de la discusin.
Asignar el turno cuando dos o ms personas deseen hablar al mismo
tiempo.
Animar a participar a los que tengan dificultades en liberarse del miedo
o la timidez.
Luchar para crear la atmsfera que provoque ideas divergentes.
b) Phillips 66 CAntunes, 1975; Anzieu y Martn, 1975; Cirigliano y Villa-
verde, 1982): Esta tcnica, descrita y divulgada por J. Donald Phillips, de la Uni-
versidad del Estado de Michigan, tiene en comn con la anterior el hecho de
que es muy til para descubrir todos los entresijos de un supuesto, facilitando
la confrontacin y el esclarecimiento de los puntos de vista de todos los miem-
bros del grupo; pero se distingue en que permite descomponer un grupo gran-
de en unidades pequeas, en donde es ms fcil crear una atmsfera informal
que facilite la participacin de todos los presentes, liberndolos de sus inhibi-
ciones y permitiendo incluso que puedan llegar a ser protagonistas; es difcil
permanecer annimo en un grupo pequeo. De este modo se rompe la frialdad
y se obtiene rpida y ordenadamente la participacin de un auditorio grande en
una cuestin determinada.
En esencia, consiste en dividir un grupo en otros ms pequeos, de cuatro a
seis integrantes, con el propsito de discutir o analizar un tema durante un
tiempo breve. El 66 alude a grupos de seis personas que discuten un tema
durante seis minutos.
Dentro ya de las normas prcticas de funcionamiento, hay que conceder
siempre unos minutos para elegir un presidente, con el fin de propiciar la inte-
gracin en los subgrupos, y un secretario-informante para llevar un registro e
informar al pleno. Uno de ellos actuar, adems, de coordinador, que deber:
Asegurarse de que todos estn familiarizados con el procedimiento, por
qu se emplea, el tiempo que se concede y lo que se espera alcanzar.
Hacer la divisin del grupo, de manera que se rompan vnculos previos.
A menudo esto se consigue disponiendo con anticipacin los asientos, o
acudiendo al procedimiento de numerarse.
Explicitar oralmente o por escrito el tema en cuestin.
Moverse entre los subgrupos y estar a su disposicin para aclarar posi-
bles dudas y determinar los logros.
Toma de decisiones en la evaluacin educativa 237

Si la cantidad de subgrupos, o la falta de tiempo, impide elaborar un


informe completo, facilitar medios y ampliar el tiempo para ordenar las
ideas en orden de importancia y pertinencia. Siempre se debe avisar
antes de dar por finalizado el tiempo.
Recoger los informes de cada grupo (escritos y orales), clasificados y
preparar un resumen. En este punto el procedimiento debe ser flexible
para recoger los condicionamientos que impone el tamao de la reu-
nin, los tipos de preguntas que se discuten, el empleo que se hace de
ellas, etc.
Asegurarse de que todos los puntos de vista significativos sean llevados
al grupo general.
c) QDCC (Kepner y Tregoe, 1983): Es una tcnica complementaria del
brainstorming y del Phillips 66, ya que en ambas los participantes pueden utili-
zada para elaborar alternativas y conclusiones. Propone que el problema, las
causas, las soluciones, etc., se describan en detalle desde cuatro perspectivas, a
cada una de las cuales se responde con una doble salida, indicando qu es y
qu no es en relacin con:
QU: Identidad, qu es? o de qu se trata?
DNDE: Ubicacin en el espacio, en dnde surge?
CUNDO: Ubicacin en el tiempo, cundo ocurre u ocurri?
CUNTO: Magnitud o extensin, qu extensin tiene?, qu abarca?
Un ejemplo esquemtico de tal tcnica pudiera ser el siguiente:

ES NO ES

QU insatisfactorio
-En otros
Literatura
Rendimientoevaluacin
la 1alos
Disciplinario
Historia
Integracin
Historia:
Literatura:
En otras
Todos cursosescolar
evaluacin
yescolar
3a evaluac.
asignaturas
2aobjetivos
2a

d) Diagrama causa-efecto o de Ishikawa (Blasco, 1990): Por su forma,


se conoce tambin como espina o raspa de pescado. Tiene el mismo carcter
de complementariedad que la tcnica anterior QDCC, pero aade la virtualidad de
sistematizar las posibles causas y soluciones de un problema, agrupndolas por
familias y jerarquizndolas; orientando, as, el anlisis hacia las ms fundamentales.
238 La evaluacin de aprendizajes

TAREA
DEL FAMILIA
ALUMNO

Trastornos de atencion/motivacin Bajo nivel cultural


Trastornos perceptivos No valoracin del estudio

CALIFICACiN
NEGATIVA

Deficiencias de aptitudes Metodologa inapropiada


Deficiencias lingOsticas Objetivos

CAPACIDAD
DEL ESCUELA
ALUMNO

2. Tcnicas de seleccin (pokras, 1992; Simon y Albert, 1979): Son herra-


mientas que ayudan a abandonar alternativas de problemas, causas, soluciones,
etc., para concentrarse en unas pocas; en la conviccin, como dice el principio
de Pareto, de que los elementos crticos de cualquier conjunto constituyen una
minora. Este principio se traduce en la regla 80/20, que se suele ilustrar con el
ejemplo de que el 80% de los problemas se pueden explicar mediante el 20%
de las causas. De manera semejante a las de anlisis, son muchas las tcnicas de
seleccin que aparecen en la bibliografa especializada; por ejemplo, la Matriz
de prioridades y el Criterio ABC. En ste se clasifican ordenadamente las alter-
nativas de un problema y se da importancia a las clasificadas como A; en cam-
bio, las B se consideran como meramente instrumentales, y las C se relegan por
su escasa incidencia. Por su mayor posibilidad de aplicacin en el contexto edu-
cativo, nos detenemos, sin embargo, en el voto ponderado, en la matriz de cla-
sificacin por criterios yen el anlisis de fuerzas.
a) Voto ponderado (Anzieu y Martn, 1975): Consiste en presentar y
comentar una serie de cuestiones, estudiadas anticipadamente por cada uno de
los miembros del grupo, y votadas de forma ponderada, segn la importancia
que cada uno les d a partir de sus diferentes aspectos. Por ejemplo, se conside-
ran tres alternativas, que cada miembro del grupo califica con un 1, 2 o 3; el
grupo selecciona la alternativa ms votada, en este caso la P, como aparece en
la tabla siguiente:
Toma de decisiones en la evaluacin educativa 239

Alternativas I Profesor A I Profesor B I Profesor e I Profesor D

1a 3 3 2 9

2a 2 2 3 8

3a 3 2 7

b) Matriz de clasificacin por criterios (Pokras, 1992): Se trata de adop-


tar unos criterios para seleccionar la alternativa ms plausible. Los criterios pue-
den ser la consideracin de las consecuencias de la eleccin: beneficios, recom-
pensas, conclusiones, perjuicios, etc.; o tambin la jerarquizacin de opciones
segn criterios como la mejor, la ms factible, la ms fiable, etc. En una tabla de
doble entrada quedan incluidas en vertical las posibles alternativas, y en hori-
zontallos criterios de ponderacin materializados en una puntuacin que pue-
de ir, por ejemplo, de Oa 5.

CRITERIOS 2 3 TOTAL

ALTERNATIVAS

1a o 3 5 8

2a 5 7

La decisin recaer sobre aquella alternativa que ms puntuacin numrica


alcance. Es una tarea en la que resaltan los atractivos de la decisin tomada, as
como las crticas a las alternativas rechazadas. La opcin elegida pasara por ser
la alternativa ideal o, al menos, la que ms se acerca.
c) Anlisis de fuerzas (pokras, 1992): Se analiza cada alternativa bajo los
siguientes aspectos:
Positivas: Con qu alternativas aminoramos o resolvemos el problema?
Negativas: Con qu opciones aumentamos o empeoramos el problema?
Incgnitas: Qu desconocemos del problema que pueda ser definitivo
para encontrar una solucin?
Al final se comparan los resultados del anlisis: Son o tienen la misma rele-
vancia todas las alternativas?, qu alternativa se presenta como ms factible?,
qu alternativa tiene ms apariencia de ser la adecuada?, qu cantidad de ries-
go conlleva cada alternativa?, en cul se confa ms?
Los resultados del anlisis para cada tipo de accin alternativa se recogen en
una tabla como la siguiente:
240 La evaluacin de aprendizajes

Alternativas Positivas
Comparacin
Incgnitas
(Desventajas)
Negativas

2"

Todas estas tcnicas no se utilizan como mtodos nicos, sino como tcni-
cas complementarias a otras ms tradicionales en el campo de la educacin
para buscar una mayor profundidad y amplitud de las alternativas, debido a las
aportaciones de todos los integrantes del proceso instructivo.
3. Tcnicas para disear un plan de accin: A este fm se puede emplear
la siguiente herramienta, que es una versin ms o menos simplificada del
PERT,siglas que corresponden a Program Evaluation and Review Technique, y
que se refiere al camino crtico de un calendario de un plan de accin que espe-
cifica las fechas, personal implicado, orden de las operaciones, etc., para conse-
guir una meta determinada. Se pueden encontrar aplicaciones al contexto edu-
cativo en Pokras (1992).
Se empieza teniendo presentes las respuestas a una serie de preguntas
hechas en las fases de anlisis y seleccin, tales como: cul es el objetivo de la
decisin en trminos de comportamiento?, qu actividades son necesarias para
alcanzado?, quin ser el responsable de cada una?, en qu orden se realizar
cada actividad y cunto tiempo supondr cada una?, qu recursos son necesa-
rios?, qu criterios se adoptan para medir si el objetivo se ha conseguido?
A continuacin, se ordenan las acciones que se consideran imprescindibles
para llevar a la prctica la decisin tomada, as como la indicacin de las personas
responsables, el sistema de seguimiento, los recursos y tiempos. El conjunto de
tales actuaciones y propuestas constituye un detallado plan de accin que, en el
caso de ser muchas o complejas, se puede recoger en una tabla como la siguiente:

DECISiN TOMADA:
Persona Recursos
Tiempo responsable
Tcnica de seguimiento

2"
Acciones

Es conveniente tambin tener en cuenta la ley de Murphy: Todo aquello


que tenga posibilidades de fracasar, fracasar. Por eso, el plan se puede
completar anticipando los posibles fallos que, si se considera til, se pueden
Toma de decisiones en la evaluacin educativa 241

recoger en una hoja de previsin donde figure lo que puede fallar, cmo se
puede evitar que ocurra y cmo se rectificar el fallo si ocurre.

JUNTAS DE EVALUACiN 4.

Algunos profesores se muestran muy contentos porque ya han superado eso de


dictar notas en las sesiones de evaluacin, y dicen que se dedican a evaluar, lo
que en muchos casos quiere decir a hablar de los alumnos. Pero, sobre qu se
habla? Fulanito es muy inteligente, pero muy vago; no le doy sobresaliente porque
no estudia. Menganito, el pobre, no puede ms, hace todo lo que puede, as que le
vaya aprobar (Brincones, 1990: 230).

La cita refleja en gran medida la realidad de muchas Juntas de Evaluacin, en


donde se hacen comentarios, pero no se evala porque no se toman decisiones
sobre los resultados ni sobre las estrategias de enseanza. Tampoco se evalan
las programaciones en muchas reuniones de departamentos docentes, porque
no se toman decisiones ni sobre la extensin de los programas ni sobre la
secuencia de los objetivos. Sin embargo, en aquellos casos en que el proceso de
evaluar incluye la toma de decisiones, por un lado, cambian sustancial mente las
actuaciones de los citados rganos docentes y, por otro, se enriquecen y perfec-
cionan los contenidos conceptuales y procedimentales no slo de los alumnos,
sino tambin de los profesores.
Todo grupo debe adoptar un proceso racional -inicialmente debe ser sen-
cillo- de toma de decisiones y obligarse disciplinadamente a seguido sin
improvisar excesivas modificaciones sobre la marcha. Esto no se contradice con
la conveniencia de dedicar peridicamente un tiempo a analizar el proceso para
ir introduciendo mejoras ms complejas.
La estructura de cada fase del proceso debe utilizar, en primer lugar, una tc-
nica de anlisis que permita formular todos los posibles problemas, causas,
soluciones, etc.; para reducidos posteriormente a las alternativas ms viables
mediante una tcnica de seleccin. Es decir, un proceso en zigzagque sucesi-
vamente se abra de modo creativo a todas las alternativas para luego sacrificar la
mayora de ellas con objeto de concentrarse en el problema ms importante y
en la solucin ms viable.
A manera de ejemplo, se sugiere el siguiente para un escenario restringido al
mbito de los aprendizajes, que es el ms frecuente en las Juntas de Evaluacin.

Decisiones previas 4.1.

Para agilizar el proceso formal de toma de decisiones en la Junta de Evaluacin,


se deben tomar en el foro adecuado una serie de decisiones previas, ms fciles
242 La evaluacin de aprendizajes

por no ser irreversibles, por lo que se pueden rectificar cuantas veces se estime
oportuno. Son fundamentalmente tres, como aparece en el siguiente esquema:

Organizacin Datos
Opciones funcional

1. Opciones: Adems de clarificar las metas, objetivos, estrategias de ins-


truccin, etc., hay que decidir si se ofrece a los alumnos la opcin de elegir
entre asignaturas optativas; y; luego, dentro de cada asignatura, si se les ofrece
un nico programa a todos, o tambin programas diversificados, en los que los
objetivos complementarios se calificaran con una gama completa de notas (de
O a 10) y los mnimos con una restringida (de O a 5), o sencillamente con un
apto/no apto.

Asignatura Asignatura
Obligatoria Optativa

Programa Programa
nico Complem.lnico

Ayuda tambin tener presente un catlogo de las clases de decisiones que se


van a considerar.
2. Organizacin funcional: Se trata de atribuir una funcin a cada miem-
bro del grupo y disear la dinmica de las reuniones.
3. Datos: Decidir qu datos se van a llevar a la Junta, es decir, las califica-
ciones numricas o literales, simples o matizadas. A continuacin se ofrecen
Toma de decisiones en la evaluacin educativa 243

diferentes modelos de informes, para matizar las calificaciones insatisfactorias,


que los profesores se comprometen a aportar a la Junta de Evaluacin.

MODELO A

CURSO:
A
A
P
C
PC . SOCIALES
MATEMTICAS
LENGUA
EVALUACiN:
NOMBRE

CATEGORAS (Siglas)
1. Conceptuales (C):
(M) Memorizacin: No recuerda datos.
(1<) Comprensin: No los comprende.

2. Procedimentales (P):
(R) Aplicacin: No es capaz de resolver cuestiones.
2. Afectivas (A):
(T) Atencin: Es incapaz de mantener una atencin sostenida.
(1) Inters: No demuestra inters.

(O) Otras causas que hay que explicar en un informe ms detallado:


- Aptitud deficiente para la materia.
- Problemas personales.
- Falta de base.
- No dedica tiempo al estudio.
- Falta de orden, puntualidad, disciplina, etc.
- Desconoce tcnicas de estudio adecuadas.

MODELO B

72548
10
CURSO: 96
3 1 ASIGNATURA

NOMBRE

CATEGORAS:
1. Bajo nivel de aptitudes. 6. No entrega los trabajos a tiempo.
2. Retraso en el aprendizaje. 7. Aparentemente no estudia.
3. Falta de inters. 8. Deficiencias en el recuerdo de datos.
4. Nivel de atencin bajo. 9. Deficiencias de comprensin.
5. Problemas personales. 10. Deficiencias de aplicacin.
244 La evaluacin de aprendizajes

4.2. Proceso

Los pasos del ejemplo que estamos sugiriendo se simbolizan en el siguiente dia-
grama:

Psiclogo
Mdico
Departa-
mento

Plan de accin Controles

1. Tcnicas: Las tcnicas de anlisis y seleccin que se aplican a lo largo


del proceso se simbolizan en el diagrama de la siguiente manera:
EXPLORACIN:Brainstorming o Phillips 66, dependiendo del
~ nmero de personas, completado con QDCC o diagrama causa-
efecto.

<> SELECCINBINARIA:Sencillamente s/no.

V SELECCINMLTIPLE:Voto ponderado.

C) PERTsimplificado.

c=J OPERACIONESdecididas en procesos previos.


2. Pasos: La secuencia de pasos simbolizada en el diagrama, que a primera
vista puede antojarse compleja, pero que en realidad muchos califican hasta de
obvia, es la siguiente:
O. Datos sobre alumnos con calificaciones insatisfactorias, aportados segn

el modelo de informe adoptado en las decisiones previas.


Toma de decisiones en la evaluacin educativa 245

1. Problema:
1.1. Enumerar, por medio de un brainstorming o Phillips 66 completado
con QDCC, los problemas planteados por los datos aportados.
1.2. Filtrar, por medio de una seleccin simple s/no, solo los susceptibles
de decisiones ejecutivas; es decir, los problemas relacionados con el aprendiza-
je. El resto de problemas, enviados al rgano competente (Jefatura de Estudios,
Departamento, Gabinete de Orientacin, etc.).
1.3. Seleccionar un problema de aprendizaje por medio de la seleccin pon-
derada o matriz de clasificacin por criterios.
2. Soluciones:
2.1. Formular todas las posibles causas del problema seleccionado por
medio de un brainstorming o Phillips 66.
2.2. Formular todas las soluciones sugeridas por las causas detectadas a tra-
vs de brainstorming o Phillips 66 completado con diagrama causa-efecto.
2.3. Aplicar criterios no slo cognoscitivos (capacidad demostrada de com-
prensin, aplicacin, etc., de contenidos), sino tambin afectivos (inters, apti-
tudes, etc.), de acuerdo con el modelo de recogida de datos decidido previa-
mente.
2.4. Seleccionar la mejor alternativa por medio de la seleccin ponderada o
de la matriz de clasificacin por criterios.
3. Plan de accin: Concretar las acciones, personas responsables de cada
accin, sistema de seguimiento, recursos y tiempos.
4. Introducir las mejoras adecuadas en las decisiones previas y los pasos del
proceso, con el fin de empezar a recoger nuevos datos para la sesin siguiente.
NOI)Vn'VA:I:la S:lS,")
.1
Son varios los criterios que se pueden adoptar para determinar las distintas cla-
ses de evaluacin (Rodrguez Diguez, 1980). Entre otros, conviene citar el sis-
tema que se evala (dando lugar a la evaluacin interna y externa), el momento
de aplicacin (evaluacin inicial, intermedia y final) y los fines y funciones de la
evaluacin (evaluacin formativa y sumativa).

SISTEMA EVALUADO 1.

Se habla de evaluacin interna y externa, segn el grado de pertenencia del


evaluador al sistema evaluado. Si se considera la evaluacin referida al aprendiz,
se habla de auto y de heteroevaluacin. En la heteroevaluacin, cuyo estudio
ocupa gran parte de la presente publicacin, el profesor evala al alumno. Sin
embargo, uno de los objetivos de la educacin es tambin capacitar a ste a
reflexionar sobre s mismo, ms cuando la capacidad de valorar es un compo-
nente indispensable de todo aprendizaje. Por todo ello, el profesor debe ayudar
al alumno a que, a partir de la heteroevaluacin del profesor y de otra serie de
datos, sea capaz de valorar sus propios procesos de aprendizaje y de tomar sus
decisiones, con objeto de conformar esquemas personales vlidos para poder
usados en el futuro cuando se enfrente a situaciones anlogas. En esto consiste
justamente la autoevaluacin que, aunque a menudo pueda ser imprecisa, no es
muy difcil de conseguir, dado que cualquier alumno posee siempre un juicio
subjetivo de lo que hace; tanto ms exacto cuanto ms avanza en el sistema
educativo.
Si se considera como sistema la clase, aparece como interna la evaluacin
ordinaria integrada en el Proyecto Curricular, que es responsabilidad de los
profesores implicados en el proceso de instruccin; y como externa en diver-
sos grados las distintas clases de evaluacin asistida, que suponen el asesora-
miento o intervencin de orientadores especializados (Garca Vidal y Gonzlez
Manjn,1992).
250 La evaluacin de aprendizajes

Se pueden considerar otros sistemas de referencia como el centro o todo el


sistema educativo, dando lugar a otras clases de evaluacin interna y externa.

2. TIEMPO DE APLICACiN

Un segundo criterio es el momento en que se aplica dentro del proceso de ins-


truccin. En este sentido se puede hablar de evaluacin inicial, intermedia y
final. La evaluacin intermedia yfinal pueden asimilarse respectivamente a la
evaluacinformativa y sumativa que consideraremos posteriormente clasifica-
das desde otro criterio; sin embargo, la evaluacin inicial, con caractersticas
claramente formativas, tiene un perfil diferencial, por lo que pasamos a estu-
diada a continuacin.
La evaluacin inicial, conocida tambin como evaluacin diagnstica, es
la que proporciona informacin sobre el alumno para tomar decisiones antes
de comenzar un proceso de instruccin.
1. Tipos de diagnstico: Se suelen considerar, en primer lugar, varios
tipos de diagnstico (Brueckner y Bond, 1971).
a) General: Su finalidad es bsicamente preventiva, con objeto de determi-
nar la situacin de cada alumno antes de iniciar un proceso de instruc-
cin y asegurar, as, que las caractersticas de la enseanza se ajusten a las
propias del aprendizaje. Se refiere, pues, a todo el grupo, y ha de hacerse
sobre las distintas variables que se consideren relevantes. No puede
reducirse, por ello, a un test que se pasa el primer da de clase; sino que
ha de extenderse a un cierto perodo de tiempo, que puede coincidir
con el repaso inicial por el que los alumnos van recordando y activando
dichas variables. Como parte esencial del proceso ordinario de progra-
macin, es la que afecta ms directamente al profesor.
b) Analtico: Busca aumentar el conocimiento de las variables y de los
alumnos que presentan cualquier tipo de problemas, con objeto de que
tales problemas puedan ser identificados y precisados lo mejor posible y,
as, tratados adecuadamente. Su finalidad es, pues, fundamentalmente
correctiva. Puede ser llevado a cabo por el profesorado con o sin la inter-
vencin de otros especialistas.
c) Individual: Se refiere a alumnos con dificultades en el aprendizaje (DA)
o necesidades educativas especiales (n.e.e.) (lvarez et al., 1999), con
frecuentes y generalizados fracasos. Para llevado a cabo, se aconseja una
actuacin conjunta del profesorado y de otros especialistas (Prez]uste y
G. Ramos, 1989).
2. Contenido del diagnstico: En segundo lugar, hay que considerar el
contenido de la informacin necesaria para todo diagnstico. Se reduce bsica-
Clases de evaluacin 251

mente a lo que Halwachs (1975) designa con la expresin estructuras de acogi-


da, que indica el conjunto de conductas, representaciones y maneras de razo-
nar propias del alumno que conforman la estructura en la que se inserta y orga-
niza el nuevo conocimiento que va adquiriendo.
No existe un consenso sobre los aspectos que deben ser objeto de esta eva-
luacin, ni siquiera dentro de una misma teora del aprendizaje (lvarez Rojo,
1984; Buisn y Marn, 1984; Garca Vidal y Gonzlez Manjn, 1992; Prez]uste y
Ramos, 1989). Tradicionalmente, se ha entendido como la evaluacin de una
serie de capacidades bsicas, fundamentalmente cognitivas, relacionadas con
los logros acadmicos. Ms tarde, se insisti ms bien en la necesidad de eva-
luar conocimientos previos especficos y pertinentes para los nuevos aprendiza-
jes. Desde otras perspectivas, se ha puesto de relieve la importancia de los
esquemas de conocimientos previos, es decir, los inclusores en nomenclatura
de Ausubel, encaminados a los nuevos aprendizajes y a la organizacin y planifi-
cacin de la enseanza.
Pero hay autores que critican la excesiva preponderancia de las variables de
carcter cognitivo, olvidndose de evaluar otras no cognitivas, tales como los
factores motivacionales y afectivos, cuya importancia en el mbito educativo ha
sido probada empricamente.
Otros van ms all y critican la evaluacin diagnstica que se centra exclusiva-
mente en los niveles actuales del desarrollo del alumno en un momento concreto y
no considera sus potencialidades a travs de la mediacin de los otros. As,Vygotsky
(1964) (lvarezy del Ro, 1990) mantiene la teora de la construccin social de la
inteligencia, que integra los conceptos de <<zonade desarrollo real (ZDR),definida
por las tareas que el sujeto desarrolla de un modo autnomo, y zona de desarrollo
prximo (ZDP) o conjunto de acciones que el sujeto puede hacer con la ayuda de
otros. Estos conceptos implican las siguientes consecuencias en la evaluacin en
general y; en particular, en la evaluacin inicial: las pruebas al uso que utilizan los
evaluadores slo miden el nivel de rendimiento efectivo del alumno en la ZDR. Sin
embargo, desde esta perspectiva se postula un planteamiento ms dinmico de la
evaluacin; es decir, comprobar no slo el aprendizaje efectivo del alumno, sino
tambin su nivel de competencia o potencial de aprendizaje en la ZDP (Fernndez-
Ballesteros, Campllonch, Calero y Be1chi,1991, elaboran la evaluacin del potencial
de aprendizaje basndose en los planteamientos de Feuerstein).
En resumen, los controles para una evaluacin diagnstica deberan propor-
cionar, al menos, informacin sobre:
a) Capacidades bsicas.
b) Habilidades o capacidades aplicadas de atencin, comprensin, aplica-
cin, etc.
c) Estilo de aprendizaje.
d) Competencia curricular o conocimientos especficos relaCionados con el
programa: conceptos base, procedimientos cientficos, etc.
252 La evaluacin de aprendizajes

3. Instrumentos: Por ltimo, comunes a otras clases de evaluacin, los


instrumentos de la evaluacin diagnstica: pruebas objetivas, exmenes con-
vencionales, observacin espontnea y estructurada con listas de control y esca-
las de estimacin, anlisis de tareas y de contenido, modelos referenciales, etc.
Es importante destacar que esta forma de evaluar diagnstica para conocer
al alumno y planificar la enseanza no debe interrumpirse al iniciar el proceso
de enseanza-aprendizaje, sino que tiene continuidad en la evaluacin interme-
dia o formativa que estudiamos a continuacin.

3. FINES DE LA EVALUACiN

Un criterio importante de clasificacin es el que considera el fin para el que se


evala, a saber, la clase de decisiones que se toman. As, si se utiliza para tomar
decisiones modificativas, es decir, para mejorar el proceso de instruccin, la
evaluacin tiene una funcin Formativa; y si para tomar decisiones ejecutivas
finales sobre los resultados del aprendizaje, la evaluacin tiene una funcin
Sumativa (estos trminos los us por primera vez Scriven, cf. Cap. 2, aunque
los sistematiz y elabor el equipo de Bloom, 1975). Como acabamos de decir,
a veces se identifica la evaluacin Formativa con la intermedia y la Sumativa con
la final; aunque guarden alguna relacin, difieren sustancialmente en cuanto
que las segundas dependen del tiempo y las primeras de la funcin. Conviene,
por tanto, profundizar en su estudio para no caer en el error de quedarse en el
significado aparente de estos trminos y llegar a conclusiones como que la eva-
luacin Sumativa no contribuye tambin a la formacin de los alumnos.
3.1. Evaluacin formativa: Del estudio de la medida aplicada a la educa-
cin (cap. 3), se deduce que la nica medida que resiste una crtica rigurosa es
aquella que se refiere a cada objetivo por separado, para determinar el grado de
adquisicin de cada uno de ellos, y cuya calificacin se expresa en trminos de
Apto;No Apto de una escala nominal. Este tipo de medida es el punto de parti-
da para entender la evaluacin formativa.
Adems, para poder tomar las dedsiones modificativas propias de la evalua-
cin formativa, es decir, para mejorar el proceso de enseanza-aprendizaje, es
necesario emitir a lo largo de dicho proceso de manera inmediata juicios, con
una valoracin criterial, no slo respecto de cada objetivo, sino incluso de
aspectos parciales e implcitos; lo que, a su vez, exige obtener una informacin
adecuada sobre el grado de adquisicin de cada uno por separado.
Todo ello va a condicionar tanto la recogida de informacin como la valora-
cin, exigiendo para la evaluacin formativa una serie de caractersticas que nos
proponemos analizar en los prrafos siguientes.
Clases de evaluacin 253

a) Detectar deficiencias en el aprendizaje: La evaluacin no debe limi-


tarse slo a jugar un papel sancionador y convertirse en una serie de obstculos
que los estudiantes tienen que vencer; ya que, en estas circunstancias, la evalua-
cin se transforma, de hecho, en la fuente prioritaria de motivacin, o mejor
diramos de inquietud, de los alumnos, y la enseanza recibida se relega a un
papel totalmente secundario. Lo que preocupa entonces nicamente al alumno
es saber cmo sacar mejores calificaciones y tener xito en la obtencin de cer-
tificados con el menor gasto posible.
El profesor debe intentar convencer al alumno de que el fin de la instruccin
no es slo obtener un ttulo, y que el fin de la evaluacin no es nicamente per-
mitide el conseguido. La evaluacin formativa empieza siendo un control de la
calidad y eficacia de cada paso del proceso de enseanza-aprendizaje, pero no
para sancionar, sino para analizar y diagnosticar lo que se debi aprender y no
se logr. Se aplica a zonas de este proceso con alguna unidad y que influyen en
la eficacia del resto del proceso.
b) Detectar causas: Esta evaluacin se preocupa de todos los elementos
del proceso de enseanza-aprendizaje. Implica no slo un anlisisy diagnstico del
aprendizaje en s, de los aspectos parciales no asimilados de los objetivos; sino
que, en continuidad con la evaluacin inicial, lleva asociados otros elementos
complementarios, sobre todo las causas de los fallos, tales como aptitudes y
capacidades bsicas, habilidades aplicadas, estilo y estrategias de aprendizaje no
adecuadas, as como la posibilidad de entrever otros factores contextuales, tales
como aspectos mdicos, psicolgicos, familiares y ambientales que pueden
influir en el aprendizaje. El elemento medir queda reducido a detectar fallos y
causas sin tener necesariamente que cuantificados.
c) Mejorarel proceso de instruccin: Lo ms importante es su caracte-
rstica de no ser un veredicto final, sino ms bien un diagnstico de la situacin
del alumno durante su proceso de aprendizaje respecto a cada objetivo por
separado para ayudade a alcanzados; llegando, ms all de los objetivos, a anali-
zar las necesidades y valorar hasta qu punto se han satisfecho. En la evaluacin
formativa el elemento toma de decisiones adquiere una importancia decisiva,
porque trata de decisiones modificativas para mejorar todo el proceso de ins-
truccin.
Supone continuar con las pruebas de diagnosis durante y a lo largo del pro-
ceso de aprendizaje, antes de que termine (entonces ya no tiene remedia), que
ayudan a parcelar el proceso de instruccin e ir alcanzando cada paso secuen-
cialmente y por caminos ms o menos directos, y alternativos, al ritmo de cada
uno.
Es, por un lado, unfeedback para los alumnos. Si el fallo se detecta slo en
una minora de alumnos, a partir de los resultados de la evaluacin formativa,
cada uno de ellos obtiene informacin (porque l mismo se da cuenta, o por-
que se lo indica el profesor) del camino que le queda por recorrer en el logro
de las metas propuestas; y as, segn el progreso realizado o la ausencia del mis-
254 La evaluacin de aprendizajes

mo, puede ajustar las actividades para aprender, introducir posibles correccio-
nes y procesos alternativos remediales para continuar su aprendizaje. Este tipo
de evaluacin debe hacer competir al alumno consigo mismo, y no con otros
alumnos, con el fin de luchar contra sus deficiencias. Tiende a promover un
desarrollo personal adecuado.
Es, por tanto, un ingrediente del proceso de aprendizaje; pero tambin es
un complemento natural de una buena enseanza, ya que es unfeedback para
los profesores; porque, si el fallo se detecta sistemticamente en una mayora
de alumnos, habr que orientar los remedios hacia el programa para revisado y
precisado, y hacia la metodologa para introducir las correcciones oportunas en
las estrategias de enseanza. Esta evaluacin requiere un espritu ms positivo
de cooperacin de todos los grupos implicados y una integracin de todos los
elementos. No debe, de ninguna manera, ser utilizada por el profesor para san-
cionar.
d) TIempo de aplicacin: Como consiste en evaluar tanto las estrategias
de aprendizaje como el rendimiento conseguido por el alumno 'durante la ins-
truccin, desde el momento en que aborda el aprendizaje hasta que termina,
mediante controles precisos, ms o menos formales, la evaluacin debe ser per-
manente.
Esta nocin ha sido a menudo mal traducida, como evaluacin continua, y
peor interpretada: hay profesores que la entienden como una continua evalua-
cin, dedicando ms tiempo a examinar que a otras actividades educativas y
manteniendo al alumno constantemente sobre ascuas. Hay otros profesores,
y alumnos, por el contrario, que la entienden como si un apto justificase siem-
pre la adquisicin de todos los objetivos previos; por ejemplo, un aprobado en
Qumica en el 2 trimestre, justifica toda la Fsica del 1er trimestre. Esto se
podra aceptar en caso de resultados positivos de objetivos inclusivos con rela-
cin de orden (cap. 3) (un aprobado en dividir justifica sin ms el aprobado en
sumar y multiplicar); pero no en el caso de resultados negativos (un suspenso
en dividir no asegura tambin un suspenso en multiplicar y sumar), o de objeti-
vos no inclusivos sin relacin de orden (el caso citado de Fsica y Qumica); de
esta forma, la adquisicin de unos objetivos enmascara la de otros totalmente
distintos y sin relacin.
En resumen, la evaluacin formativa es una evaluacin permanente para
determinar el grado de adquisicin de cada objetivo, y detectar tanto los aspec-
tos NO asimilados, como las causas para reajustar y optimizar los logros y el
proceso de enseanza-aprendizaje.
Otras coordenadas que completan el perfil de la evaluacin formativa son:
e) Nivel de generalizacin: Como se fija ms en la adquisicin de cada
objetivo o incluso de aspectos parciales de los objetivos, el nivel de generaliza-
cin de las pruebas es mnimo, de manera que todas y cada una de las capacida-
des y de los contenidos importantes, aun implcitos, de los objetivos deben
quedar reflejados en algn control de la evaluacin formativa.
Clases de evaluacin 255

f) Seleccin y construccin de pruebas: La diferencia esencial entre


evaluacin formativa y sumativa no est en el formato ni en el contenido de
las pruebas, sino en cmo se usan para promover el progreso del aprendizaje
del alumno. Por tanto, se podrn adoptar pruebas informales o formales,
semejantes a las de la evaluacin sumativa. Al contrario que en sta, las pre-
guntas de la evaluacin formativa pueden repetirse curso tras curso porque
no influyen en decisiones irreversibles; es ms, es conveniente repetidas
siempre que se hayan mostrado vlidas como indicadores de las deficiencias
de aprendizaje.
Para construir una prueba de evaluacin formativa, como en la planificacin
de toda evaluacin, ayuda construir un diagrama que muestre jerrquicamente
los objetivos que hay que evaluar o una tabla de especificaciones (cap. 16),
reflejo de la matriz capacidades/contenidos de programacin. Por ejemplo, si un
alumno es incapaz de resolver problemas, el diagrama nos puede sugerir que
controlemos si se debe a dificultades de comprensin del lenguaje o al conoci-
miento del procedimiento cientfico; o tambin, si un alumno falla en la traduc-
cin latina de una texto de Cicern, el diagrama nos puede sugerir que contro-
lemos las preguntas que se hacen sobre el anlisis morfolgico, el anlisis
sintctico, el conocimiento del significado de las palabras, la tcnica de bsque-
da en el diccionario, etc.
g) Calificacin: No se trata de dar un certificado final, ni de reflejar los
resultados en un acta oficial. La calificacin se hace por medio de una valora-
cin criterial o de dominio objetivo a objetivo, y se reduce a un Apto/No apto
completado con un informe ms o menos formal, pero inmediato, aspecto ste
esencial de la evaluacin formativa, con diagnstico de fallos y causas.
A partir de estas calificaciones, el mismo alumno puede hacer su propio
diagnstico de su estado de aprendizaje; y el profesor, proporcionar instruccio-
nes detalladas para su recuperacin. Una manera estndar de planificado se
representa en la tabla siguiente, en la que se ofrece, primero, la respuesta
correcta, a continuacin, bajo las columnas Texto h y Texto2,fuentes de infor-
macin asequibles al alumno y, por ltimo, otras estrategias alternativas de recu-
peracin preferentemente individualizadas, tales como estudios dirigidos, MAV,
programas informatizados, etc.
256 La evaluacin de aprendizajes

; Oviedo,
Barna. MAC,
Pregunta minutos.
Estbanez
Documental
Guadalaviar.
la
deGeografa
donde
Informtico
Planeta
Texto
Serie
Cf.:
Universidad
manifestacin
El
papella
cap.5, dinmica
Turia
BUp,
MAC. enMAV:
2Apuntes
oen
movimiento
10Texto
clase,
Leccin
Albacete,
Atlas
Milagroso,
Vicens-Vives,
tecnnico;
CC.NN.
Enciclopedia
adj.
topogrfico,
del
(1976)Anlisis
mapa
tectnicas,
interpretacin
Tamargo,
de
mapaKyoto,
(Grfico
Puyol,
(1992),
las
pgs.
(1984):
AA.W.
Respuesta yJ.
1Ecos,
7",
Escolar,
AA.W.
R. J.ea
Barna,
Cualquier
Espaa:
fsico
placas
milimetrado.)
Programa
AA.W(1994)
Geografa
aparezca
para estudiar
83ss.
El
(1980)50
de
un Lae
de 7.yDISA-EI
formacin del
representacin,
Espaa,
del
relieve
pg. siglo
Mundo, 49. su
pg.
XXI, 28.
Tebar
pgs. Flores,
13, 14 Y
,
1358.
Espaa Ebro.
Levante-
Madrid,
prof.: MEC,
Lminas,
Depresin
elaborado
(1993)
el
Espaa! del
por

3.2. Evaluacin sumativa: Del estudio de la medida aplicada a la educa-


cin (cap. 3), se deduce que la valoracin final de un repertorio de objetivos,
reflejada en una calificacin a partir de unos resultados calculados a travs de
una media ponderada, da lugar a una evaluacin cuyo concepto, en compara-
cin con la evaluacin formativa, no es unvoco sino analgico; es decir, tiene
aspectos comunes y aspectos diferenciados. Aqu, el rigor de la medida queda
mediatizado por la subjetividad que siempre est implcita en la ponderacin.
Clases de evaluacin 257

Esta clase de medida, junto con las exigencias administrativas y sociales, es la


base de la evaluacin sumativa, que conlleva una serie de caractersticas que
nos proponemos analizar en los prrafos siguientes.
a) Medir:Reiteramos que la diferencia esencial entre la evaluacin formativa y
sumativa no est en el formato o en los contenidos de las pruebas, sino en el fin
para el que se usan. Sin embargo, las decisiones asociadas a la evaluacin sumativa
exigen que el elemento medir quede cuantificado en una calificacin criterial
final, mientras que el elemento toma de decisiones suele quedar reducido a la
decisin selectiva de poder pasar de tema, de curso, etc.; aunque no es infrecuen-
te que tenga tambin consecuencias formativas para alumnos y profesores.
b) Juicio sobre el resultado: La evaluacin sumativa es una accin des-
pus de que se preocupa de dar un juicio del trabajo del aprendiz en relacin
con algo fijo, mediante la comparacin de los objetivos y los resultados. Pero
dicho juicio no da pistas e informacin suficientes sobre las necesidades de
ajuste y cambio para que el alumno llegue a las metas propuestas no alcanza-
das; aparte de que no tiene ya la oportunidad de recuperar las eventuales defi-
ciencias de aprendizaje, como sucede en la evaluacin formativa.
e) Tiempo de aplicacin: Los controles son ms espaciados que en la
evaluacin formativa. Se suelen realizar al final de una unidad ms o menos lar-
ga, a final de trimestre, de curso, etc.
En resumen, la evaluacin sumativa es la evaluacin final que emite un jui-
cio sobre el alumno (a veces, aunque menos frecuentemente, tambin sobre
el profesor o el currculo) en relacin con el resultado del aprendizaje, refle-
jado en una calificacin globalizada de un repertorio de objetivos, y de la
que se sigue una toma de decisiones ejecutiva, a veces implcita.
Ejemplos de estas decisiones son:
- Ests en condiciones de pasar al tema siguiente, al curso siguiente, de
ejercer la profesin, etc..
- Por ahora no ests en condiciones de seguir; por tanto, tienes que
repetir y volver a empezar el tema, el curso, etc..
Otras coordenadas que completan el perfil de la evaluacin sumativa son:
d) Nivel de generalizacin: Se fija preferentemente en la comprobacin
de una muestra de objetivos, porque esto suele ser suficiente para tomar las
decisiones que le son propias. Por ejemplo, en la evaluacin sumativa se contro-
la globalmente si el alumno es capaz de interpretar grficas con objeto de deci-
dir si ha de pasar al tema, al objetivo o al curso siguiente; en cambio, en la eva-
luacin formativa debe comprobarse parceladamente si el alumno es capaz de
localizar puntos en un sistema de coordenadas, interpretar mximos, mnimos y
puntos de inflexin, etc., con objeto de mejorar las posibles deficiencias en
algunos de estos aspectos. No obstante, es obvio, como hemos reiterado, que
se puede aprovechar la evaluacin sumativa para fines formativos.
258 La evaluacin de aprendizajes

e) Justificacin: Aparte de razones y exigencias administrativas y sociales,


se basa tambin en la posible prediccin de xitos futuros; es decir, se presupo-
ne que las decisiones de promocin de la evaluacin sumativa que se toman a
partir de la superacin de unas materias y cursos sirven de prediccin de resul-
tados suficientes en otras materias y cursos. Claro que esto supone, por un
lado, evidencia de la relacin entre objetivos de distintos cursos y, por otro, que
no se modificarn en cursos siguientes ni el contenido ni el mtodo ni las estra-
tegias de aprendizaje de los alumnos. De todas formas, como norma general, de
los resultados de una evaluacin, no deben sacarse consecuencias predictivas
demasiado amplias, ni a muy largo plazo.
Ejemplos:
- Un alumno aprobar Ingls de un curso si est capacitado para empe-
zar con xito el Ingls del curso siguiente.
- La asimilacin de capacidades operativas en Aritmtica o lgebra pue-
den predecir los resultados en lgebra superior.
- La asimilacin de capacidades como la comprensin de problemas bio-
lgicos proporciona una base para predecir futuros aprendizajes en la
misma materia, Biologa, e incluso en otras como Fsica o Qumica.
La razn de esta relacin no es clara, puede deberse a la capacidad del alum-
no, a determinadas estrategias de aprendizaje o a otras relaciones del aprendi-
zaje con el desarrollo o con el contexto.
f) Construccin de pruebas: En primer lugar hay que decidir qu muestra
de objetivos se va a evaluar; es decir, qu casillas o puntos de interseccin de la
matriz capacidades/contenidos (cap. 16). Para ello pueden ayudar algunos criterios
como los siguientes: agrupar objetivos segn contenido o capacidades, seleccionar
slo los que incluyan otros objetivos aunque sea implcitamente, seleccionar los
necesarios para etapas siguientes, etc. Y luego hay que construir situaciones con
indicadores vlidos sobre la consecucin de los objetivos seleccionados.
g) Calificacin: Aqu ya no se considera objetivo a objetivo, como en la
evaluacin formativa, sino que se trata de medir el dominio de un repertorio de
objetivos a travs de una muestra significativa. Lavaloracin criterial de dominio
de una muestra de objetivos es propia de la evaluacin sumativa, as como la
valoracin criterial que controla el dominio de objetivo a objetivo es propia de
la evaluacin formativa.
Para calcular la calificacin en una evaluacin sumativa, es necesario tener
en cuenta, por un lado, el valor que se le da a cada pregunta del examen y, por
otro, la correccin del azar cuando sea posible; aspectos estudiados al hablar de
la medida (cap. 3 y 13).
h) Contexto: La evaluacin sumativa se ve rodeada con frecuencia de una
serie de factores con textuales que tienden a distorsionarla; entre otros, el secre-
to profesional del profesor, el intento por parte de otros miembros de la comu-
nidad educativa (padres, alumnos, etc.) de asalto a ese baluarte y, sobre todo,
Clases de evaluacin 259

la ansiedad en los alumnos, aspecto ste difcil de evitar. Se cuenta que en un


cementerio sobre la lpida de un valeroso guerrero rezaba: <~qu yace el que
nunca tembl, y alguien aadi un grafito:Porque nunca se examin.
Prcticamente todos los estudiantes experimentan alguna ansiedad antes de
un examen. Esto lo demostr ya en 1929 Cannon cuando comprob la presencia
de azcar en la orina despus de exmenes importantes. El azcar, como se sabe,
es un indicador fIsiolgico de una fuerte reaccin emocional. Estas reacciones dis-
traen la atencin-concentracin y conducen al seguimiento inadecuado de las ins-
trucciones y a una mala interpretacin de pistas informativas obvias.
Autores que han estudiado la ansiedad ante los exmenes han distinguido en
ella dos aspectos: preocupacin por la actuacin personal y emocin o reacciones
intrnsecas y neurlgicas ante los exmenes (Hembree, 1988). La preocupacin
parece proceder del miedo a las consecuencias negativas como resultado de la
actuacin en los exmenes. Es decir, los alumnos con ansiedad pueden temer que
sus malas calillcaciones condicionen su futuro y provoquen rechazo de los com-
paeros, padres y profesores, ridculo o prdida de respeto. Desde este punto de
vista, no se debera llamar ansiedad de los exmenes, porque no es el examen el
que produce tales sentimientos; es la respuesta anticipada y no deseada que pue-
de resultar de una mala calillcacin lo que es la fuente de tal ansiedad. Esto lo
confIrma el hecho de que los que se someten a exmenes de manera annima o a
pruebas que no tienen consecuencias personales, no suelen mostrar ninguno de
los bloqueos que aparecen en los alumnos con ansiedad ante los exmenes.
No es probable que se encuentre una respuesta simple y universal a las cues-
tiones relacionadas con las causas y curacin de la ansiedad ante los exmenes,
dado que los seres humanos son complejos y las situaciones en las que se les
examina son diversas; sin embargo, combinando los resultados de investigacio-
nes realizadas al respecto (Hembree, 1988; Tryon, 1980) y las observaciones
comunes del comportamiento humano, podemos ofrecer algunas generaliza-
ciones que parecen razonables:
a) Hay una correlacin negativa entre el nivel de preparacin y el nivel de
ansiedad ante exmenes. Los mejor preparados tienden a ser menos
ansiosos cuando se enfrentan a cualquier tipo de prueba.
b) Hay una alta correlacin positiva entre el nivel de ansiedad y el nivel de
aspiracin. Los ms ansiosos ante un examen tienden a ser los que tie-
nen ms necesidad o deseo de hacerla bien.
c) Grados moderados de ansiedad facilitan y mejoran la actuacin en ex-
menes. Grados ms extremos suelen empeorarla.
d) Cuanto ms familiarizado est un alumno con un tipo de prueba, es
menos probable que sea vctima de ansiedad extrema.
e) La ansiedad puede ser til educativamente si se distribuye, a un nivel
relativamente bajo, a lo largo del curso, en vez de concentrada a niveles
relativamente altos justo antes y durante los exmenes. Una enseanza
260 La evaluacin de aprendizajes

buena cuenta con dosificar controladamante una energa estimulada por


la ansiedad de los exmenes.
MacKeachie (1988: 7), despus de ms de 30 aos de investigaciones relaciona-
das con la ansiedad y las estrategias de estudio, ha concluido que la pobre actua-
cin de los alumnos ansiosos se suele deber a unas malas tcnicas de estudio:
Me he preocupado de alumnos cuya actuacin se ve dificultada por una excesiva
ansiedad ante exmenes de logros ... pero aunque estos alumnos hayan aprendido a
relajarse y controlar sus sentimientos de ansiedad, su actuacin no mejora. Nues-
tras conclusiones ms recientes indican que tales alumnos obtienen malos resulta-
dos en los exmenes no porque estn ansiosos, sino porque estn mal preparados.
Los alumnos muy ansiosos estudian, pero lo hacen de manera ineficaz:, memorizan-
do detalles y reducindose a leer apuntes y textos una y otra vez.

Es evidente que un alumno con un alto grado de ansiedad presenta un bajo


autocontrol que, desde el punto de vista del rendimiento supone dificultades
en el hbito de estudio, en el empleo adecuado del tiempo disponible, etc. Las
ayudas para este tipo de estudiantes varan segn los diversos enfoques adopta-
dos. Algunos programas se centran en mejorar estrategias de aprendizaje, y
otros en entrenar el autocontrol y en la modificacin de los procedimientos
negativos que se desencadenan en los momentos previos.
El programa ms conocido es el entrenamiento en inoculacin del estrs
(Meichenbaum, 1975), que ensea al estudiante a comprender la naturaleza de
sus reacciones de estrs y a reconocer cundo se pone nervioso y cmo supe-
rarlo. Primero practica estas habilidades en una situacin imaginaria y luego las
lleva a situaciones reales.
Para finalizar, resumimos en el diagrama siguiente la comparacin entre la
evaluacin formativa y sumativa:

Objetivo

Ev.
Formativa
Ev.
Sumativa
Clases de evaluacin 261

En realidad, los profesores practicamos de modo espontneo la evaluacin


sumativa, y aprovechamos la informacin en ella obtenida para llevar a cabo
ocasionalmente elfeedback de la evaluacin formativa. Sera conveniente incre-
mentar de forma progresiva esta ltima hasta aproximarse a la utopa que
defiende la permanencia en el tiempo de la evaluacin formativa y la reserva de
momentos para la evaluacin sumativa.
NOI)Vn1VA:I V1:1a
'"
OS5I)OHd 1:1
La evaluacin debe realizarse segn un proceso que sirva de gua de trabajo
para construir una prueba, aplicada, valorada, tomar las decisiones oportunas e
informar de ellas a los alumnos, lo que puede materializarse mediante los pasos
siguientes (los interesados encontrarn en Ebel y Frisbie, 1977, un clsico
imprescindible cuando se trata de evaluacin de aprendizajes, interesantes
matices, diseminados a lo largo de su obra, sobre los pasos de este proceso,
que han inspirado muchas de las ideas que aqu recogemos):
1. Planificacin.
2. Seleccin del formato de los tems.
3. Construccin de los tems.
4. Ejecucin.
5. Correccin y calificacin.
6. Toma de decisiones.
7. Revisin.

PLANIFICACiN 1.

Tabla de especificaciones 1.1.

Para planificar un examen, sobre todo cuando los resultados se van a valorar cri-
terialmente, como es el caso ms frecuente en situaciones acadmicas, una de
las estrategias que se usa a menudo es empezar estableciendo una tabla de doble
entrada, conocida como tabla de especificaciones o matriz de evaluacin,
que recoja los objetivos que se van a evaluar directamente. Con independencia
de la taxonoma de capacidades y de la estructura de contenidos adoptadas, no
es necesario examinar de todos los objetivos, sino slo de una muestra. El
conocimiento, producto del aprendizaje significativo, no est atomizado; por el
contrario, se almacena de una manera relacionada en racimos de conocimien-
tos afines. Por esta razn, se puede concluir que, seleccionando una muestra
representativa, se puede extrapolar de su xito, la consecucin de toda una pro-
gramacin. Si la materia es breve, la muestra se puede seleccionar mentalmen-
te; en caso de exmenes ms amplios, ayuda hacer una representacin escrita
266 La evaluacin de aprendizajes

colocando los diferentes contenidos que se van a evaluar en las filas, y las capa-
cidades en las columnas.
En los ejemplos siguientes, la primera tabla reproduce una matriz de pro-
gramacin con el nmero de objetivos de dicha programacin, y la segunda
una tabla de especificaciones en la que el nmero de objetivos se ha traducido a
nmero de elementos de un examen, localizados en las celdas:

MATRIZ DE PROGRAMACiN

6O
11
3
5
25
34
28
35
4
13
28
5
1
12
22 1118
111 132
1. Lectura
O 33
16
20
18 4
2
1
5
O

(Tabla de especificaciones)

2III 2
3
O
O 131
I3419
O21
3
1O2
11
18
O 96 64
910
8
12
7 2
3
I O TOTAL
4. Sustantivo
El proceso de la evaluacin 267

Estos elementos, cantidades o porcentajes de la tabla de especificaciones,


no deben interpretarse necesariamente como preguntas o tems separados,
sino tambin como cuestiones parciales de preguntas ms complejas; por ejem-
plo, un tem sencillo para controlar la memorizacin de una definicin puede
valer 1, y otro que encierre varias cuestiones, 3. En un examen de 2 tems,
representaran respectivamente el 25 y el 75% de la tabla.
La TABLADE ESpecificaciones proporciona una visin general de la muestra
que se va a evaluar, as como la importancia relativa de cada categora de capaci-
dades y contenidos. En nuestro ejemplo, de los 132 objetivos propuestos en la
matriz de programacin, se controlan slo 64, distribuidos en 10 preguntas o
elementos para controlar memorizacin, 11 para comprensin, etc.; y 7 sobre
lectura, 8 sobre ortografa, etc., como aparece en la matriz de evaluacin.
Haciendo una revisin de las entradas de dicha matriz por filas y columnas,
se puede matizar la proporcin adecuada para evaluar las capacidades que se
busquen para cada contenido.
En todo caso, las preguntas o cuestiones del examen que figuran en la tabla
de especificaciones deben quedar definidas a partir de los objetivos de aprendi-
zaje localizados en las celdas de la matriz de programacin, atendiendo funda-
mentalmente a los siguientes factores:
a) Objetivos: Deben recogerse en la muestra los objetivos importantes. La
importancia se puede deducir tanto de las capacidades adecuadas al desarrollo
de los alumnos como de los contenidos cientficos; as, en general debe haber
ms tems para controlar comprensin y aplicacin que memorizacin, y un
contenido con 8 temas debe representar el doble de tems que otro con 4.
b) TIempo dedicado a la instruccin: Por regla general, una materia que
ocup 6 horas de clase debe representar aproximadamente el doble de tems
que otra de 3 horas.
e) Prerrequisitos: Si unos objetivos se consideran como base necesaria
para unidades didcticas futuras, deben representar ms tems que otros no
considerados como prerrequisito.
d) Otras oportunidades de evaluacin: Si un objetivo puede evaluarse
de nuevo en una prueba posterior, su control puede posponerse; no as otro
que no se va a volver a ver. Esta seleccin puede quedar condicionada tambin
si el objetivo debe controlarse por medio de una respuesta abierta y los exme-
nes posteriores, por alguna razn, van a consistir en pruebas objetivas.

Nmerode preguntas 1.2.


Las capacidades y contenidos reflejados en la tabla de especificaciones da pistas
sobre el nmero de preguntas de cada objetivo, como acabamos de ver; sin
268 La evaluacin de aprendizajes

embargo, se pueden considerar, adems, otros criterios complementarios para


determinar el nmero de preguntas de un examen.
a) Duracin del examen: Por lo general, cuanto mayor sea el tiempo dis-
ponible y ms largo sea el examen, las calificaciones resultarn ms fiables; sin
embargo, esta afirmacin, por razones obvias, no puede extrapolarse indefinida-
mente, por lo que no es adecuado ni conveniente un examen de excesiva dura-
cin: para un nio, 60 minutos, y para un universitario, 3 horas empieza a consi-
derarse excesivo. En consecuencia, el nmero y la complejidad de las preguntas
que han de ser incluidas en un examen vienen condicionados por este tiempo
disponible.
A partir de esta limitacin, parece lgico confeccionar una prueba con un
nmero adecuado de preguntas, de modo que todos los alumnos, haciendo el
examen a un ritmo normal, tengan tiempo suficiente para responderlas. Y ello
por varias razones.
En primer lugar, porque la velocidad en contestar, a no ser en aquellos casos
en que se considere como un objetivo, no sirve como indicador de logros de
aprendizaje. Quiz los tests rpidos sean adecuados en situaciones especficas y
excepcionales, pero no habituales. En este sentido, alguna investigacin educa-
tiva demuestra que no hay correlacin entre velocidad y logros. As, por ejem-
plo, la siguiente tabla CEbely Frisbie, 1977), que relaciona la velocidad y la califi-
cacin de un examen de 125 tems verdadero/falso realizado por 100 alumnos.
La media es 96,1. A los 50 minutos haban terminado 10 alumnos; el ltimo tar-
d 120 minutos.

Orden de finalizacin 32
24
956
965
35
940
964
948
955
27
31
52
968
942
40
30
25
1.010
Suma
Rango................................
de.............................
decalificaciones
calificaciones

La suma de las calificaciones de los 10 alumnos que terminaron primero el


examen fue 965. La mejor calificacin de este grupo fue 105; la peor, 70; por
tanto, su rango de calificaciones fue de 35 unidades. De acuerdo con la tabla, se
puede apreciar cmo, aunque el rango de calificaciones vara bastante de grupo
a grupo, no se observa una tendencia a que los alumnos obtengan una califica-
cin ms alta segn el tiempo empleado en hacer la prueba.
El proceso de la evaluacin 269

Una segunda razn que aconseja dar tiempo suficiente para contestar es que
la ansiedad que los alumnos sufren en los exmenes, ya alta de por s en prue-
bas sin lmite de tiempo, se acenta ante exmenes que hay que realizar en
poco tiempo o en un tiempo muy justo.
En resumen, una prueba se considera adecuada cuando la mayora de los
alumnos disponen de tiempo para contestar a todas las preguntas. Aunque no
hay normas generales, los especialistas en evaluacin consideran inadecuado
por rpido un examen si menos del 90% de los alumnos tiene tiempo para con-
testar todas las preguntas.
En todo caso, el nmero de cuestiones que un alumno puede contestar en
un tiempo determinado depende de varios factores; por ejemplo, del tipo de
preguntas, de la mayor o menor complejidad del proceso requerido para poder
responderlas y de los hbitos de trabajo y experiencia del alumno (uno puede
quiz terminar un examen en la mitad del tiempo que necesita otro). Por ello,
no es fcil determinar qu tiempo se requiere para contestar a unas determina-
das cuestiones. Normas como estimar un minuto para cada tem de eleccin
mltiple o 30 segundos para un tem verdadero/falso son generalizaciones
sin fundamento. Slo la experiencia de proponer pruebas semejantes en con-
textos semejantes puede ayudar a decidir el tiempo necesario para realizar un
examen.
b) Muestra de preguntas: Hemos dicho al tratar de la tabla de especifica-
ciones que basta controlar una muestra significativa de objetivos para poder
sacar conclusiones de toda una programacin. Adems, es obvio que en los ex-
menes tampoco se incluyen todas las preguntas posibles que sugieren aquellos
objetivos seleccionados; aunque, por lo comn, cuantas ms preguntas conten-
gan, ms fiables van a ser las calificaciones. En terminologa estadstica, los
tems de un examen constituyen una muestra de una poblacin mucho ms
amplia. As, una prueba que consista en la localizacin en un mapamundi de
100 capitales se podra construir seleccionando una de cada 5 capitales de las
500 que se han estudiado en clase. Estas 500 capitales constituyen la pobla-
cin, de las que se seleccionan las 100 como muestra representativa de las
500. Conviene insistir en que la poblacin a la que nos referimos ahora no son
los objetivos (en este caso, el objetivo sera nico: localizar capitales en un
mapamundi), sino el conjunto de todas las preguntas que se pueden hacer
para comprobar los objetivos.
Consideremos un alumno al que, por una parte, se le pide localizar las 500
capitales y sita correctamente 325 (65%); y, por otra, de las 100 capitales de la
muestra, localiza bien 68 (68%). La diferencia entre el 65% de la poblacin y el
68% de la muestra se conoce como error de muestreo.
En este ejemplo, la poblacin de las preguntas est definida, 500 capitales;
pero no ocurre as en la mayor parte de los casos, en los que no se dispone de
una relacin predefinida y limitada para elegir una muestra representativa de las
preguntas. Sin embargo, las que se utilizan para cualquier prueba son tambin
270 La evaluacin de aprendizajes

una muestra, dado que suponen slo una parte de las que se podran utilizar. El
problema, pues, estriba en elegir una muestra adecuadamente representativa
de una poblacin terica de las cuestiones correspondientes a un tema.
Por consiguiente, toda prueba no deja de ser una muestra, por lo que su
calificacin est tambin sujeta a sus errores: cualquier muestra perfectamente
seleccionada al azar estar sujeta a los errores de muestreo simplemente por-
que es una muestra. Sin embargo, una muestra grande estar por lo comn ms
cercana al parmetro poblacin que otra ms limitada, y los errores debidos a
ella sern menores.
En resumen, es importante seleccionar una muestra de pruebas significativa,
a sabiendas de que los errores inherentes de muestreo estarn presentes en
prcticamente todas las calificaciones educativas; aunque no estn producidos
por errores al hacer el muestreo.
Por ltimo, conviene hacer una consideracin ms sobre el nmero de pre-
guntas. Hay que sealar que depende tambin del factor interpretacin que se
va a hacer de los resultados: una calificacin criterial necesita una muestra ms
amplia que una normativa. Como orientacin, hay autores que establecen como
mnimo 3 preguntas para evaluar un objetivo criterialmente; pero slo 2 si la
interpretacin va a ser normativa.

SELECCiN DEL FORMATO


2. DE LAS PREGUNTAS

Adems de determinar el nmero de preguntas de un examen, hay que decidir


la forma de cada una de ellas. El siguiente cuadro ofrece sugerencias, que de
ninguna manera pretenden ser criterios rgidos, para seleccionar el formato
segn la capacidad que se va a evaluar.
En l se observa que los objetivos con capacidades cognoscitivas y afectivas
se pueden evaluar a travs de indicadores indirectos; no as los relacionados
con capacidades psicomotrices. Tambin aparece que la evaluacin de las capa-
cidades cognoscitivas admite una enorme gama de pruebas objetivas, libres y
algunas de diagnstico; la de las afectivas, por el contrario, se reduce a las prue-
bas diagnstico; y la de las psicomotrices, preferentemente a las pruebas reales
y simuladas.
El proceso de la evaluacin 271

Indirectos

P. Objetivas P. Reales
P. Diagnstico Simulacin
Verdadero/Falso
Eleccin Mltiple

Respuesta limitada
Problemas

P. Libres
Respuesta abierta
Pruebas mixtas
Examen oral
Prueba prctica
Proyecto

Adems del cuadro anterior, las caractersticas citadas en el anlisis de cada


formato de tem pueden servir como criterios para seleccionado en cada caso.
Allse deduca que se deben elegir pruebas de respuesta abierta cuando:
El profesor es el mismo que ensea, construye y corrige el examen.
El grupo de alumnos es pequeo.
El examen no se va a volver a usar.
Se quiere comprobar la expresin escrita.
Se va a controlar un repertorio de objetivos de aprendizaje cuyas capaci-
dades estn formuladas con palabras tales como describir, disear, hacer
grficas, desarrollar, explicar y, en general, las que requieren alguna for-
ma de produccin por parte del alumno que no puede ser demostrada a
travs de pruebas objetivas.
El profesor desea explorar ms los procesos de los alumnos que medir
los resultados.
El profesor se siente ms capacitado para calificar crticamente un ensayo
que para construir pruebas objetivas.
Hay ms tiempo para corregir los exmenes que para preparados.
272 La evaluacin de aprendizajes

Por el contrario, se debe elegir algn formato de prueba objetiva cuando no


es el mismo profesor el que ensea, construye y corrige el examen y el grupo
de alumnos es numeroso, etc.

3. CONSTRUCCiN DE LAS PRUEBAS

Conocidas las tcnicas de construccin de los distintos formatos, conviene


tener en cuenta los siguientes aspectos a la hora de redactadas.
a) Dificultad: Un primer aspecto importante que hay que considerar es el
nivel de dificultad requerida en cada prueba; dificultad que debe estar determi-
nada previamente mediante su aplicacin a un grupo de control.
En general, los tems demasiado fciles y demasiado difciles no contribuyen
especialmente a discriminar los logros de los alumnos. En cuanto a los difciles,
a no ser que el profesor sea capaz de hacer preguntas sencillas sobre situacio-
nes complejas, no suelen tener una sola respuesta correcta definida, por lo que
no discriminan a los alumnos. En relacin con los fciles, casi todos, incluso los
menos preparados, los contestarn; por lo que su efecto es aadir una cantidad
constante a las calificaciones de cada alumno obtenidas con una valoracin cri-
terial para subidas artificialmente.
b) Orden de las preguntas: Si el tiempo de examen es amplio, el orden
de las preguntas apenas tiene efectos en los resultados. Sin embargo, si el tiem-
po se restringe, es preferible presentar las preguntas en orden de dificultad cre-
cienu:, pues es lgico suponer que las preguntas ms fciles del principio redu-
cirn la ansiedad de los alumnos ante el examen. Parece tambin lgico agrupar
las preguntas referidas a un mismo conjunto de contenidos.
e) Componentes de la nota: Otro aspecto que debe tenerse en cuenta es
la combinacin de los componentes de la nota.
Cuando un profesor ha de planificar pruebas escritas y orales, trabajos, parti-
cipacin en clase y otras referencias para calificar un curso, un perodo de eva-
luacin, un bloque temtico, etc., cada uno de estos indicadores ha de tener el
peso apropiado con objeto de obtener una calificacin de mxima validez. No
resulta fcil, sin embargo, hacer una ponderacin adecuada del valor de cada
componente para la nota final. Se pueden ofrecer, no obstante, algunas orienta-
ciones.
En principio, y teniendo en cuenta que siempre es preferible usar varias y
diferentes clases de indicadores de logro, relevante cada uno de ellos para dife-
rentes objetivos, en igualdad de condiciones habra que dar mayor peso a los
componentes que impliquen una nota ms fiable. Si, por otra parte, y como
ocurre con frecuencia, todos los componentes tienen una correlacin alta y sir-
ven para medir de forma conjunta todos los objetivos importantes, su pondera-
El proceso de la evaluacin 273

cin, como es obvio, entraa menos problemas. Sin embargo, cuando algn
componente sirve para evaluar objetivos nicos, relevantes por ser nicos, no
por su mayor o menor importancia, su peso debe ser superior al asignado a
otros que cubren varios objetivos iguales. Hay que sealar tambin que los
objetivos ms importantes han de ser evaluados mediante ms componentes,
con objeto de resaltar su importancia en la nota final.

EJECUCiN 4.

La celebracin de los exmenes plantea pocos problemas; no obstante, tienen


tan importantes consecuencias que no est de ms que profesores y alumnos
sepan cmo pueden realizarlos mejor. Hay buenas obras (Acosta, 1982; Allipran-
di, 1972; Clifford, 1969; Dez, 1989; Gmez y Garca, 1991; Maddox, 1970; Rown-
tree, 1982) que pueden proporcionar interesantes ayudas, de las que aqu trans-
cribimos algunas consideraciones.
a) Instrucciones: Dado que el tiempo de examen resulta siempre escaso
para la mayor parte de los alumnos, es necesario aprovecharlo al mximo. Por
ello conviene que las instrucciones para la prueba -tales como, tiempo dispo-
nible, cuntas y qu tipo de 'preguntas va a tener, cmo se va a calificar, cmo
usar la hoja de respuestas, instrucciones especficas para responder alguna pre-
gunta, material que se permite utilizar (diccionario, calculadora, etc.)- estn
dadas de antemano y mejor por escrito, que el material que se haya de entregar
a los alumnos est bien organizado con objeto de repartirlo rpidamente, y que
se eviten en lo posible los avisos de ltima hora. De este modo, sin duda, cundi-
r ms el tiempo previsto para el ejercicio.
Ya durante la celebracin del examen, el profesor ha de aclarar posibles
ambiguedades que surjan en la transcripcin de las instrucciones o del ejerci-
cio; sin caer, no obstante, en la tentacin de orientar las respuestas. Obvia decir
que, en caso de hablar con algn alumno, ha de ser siempre discretamente para
no molestar a los dems.

b) Exmenes anunciados o por sorpresa: Algunos profesores gustan de


hacer exmenes por sorpresa, sin previo aviso, considerando que as consiguen
que los alumnos estudien regularmente y no se dediquen a empollar a ltima
hora. Quiz la sorpresa sea un factor vlido, pero slo en circunstancias muy
especficas. Por otra parte, el empollar el da antes puede valer para exmenes
que slo requieran memorizacin superficial, pero no cuando se evalan capa-
cidades ms complejas.
Es preferible, para que los estudiantes saquen de su estudio el mximo pro-
vecho, no slo preparar concienzudamente el examen para los alumnos, sino
tambin preparar a los alumnos para el examen. Por ello, conviene que stos
sepan siempre con tiempo suficiente que van a tener un examen y en qu va a
274 La evaluacin de aprendizajes

consistir ste, as como otros aspectos que se consideren necesarios para dar
respuesta a las preguntas lgicas que suelen hacerse ante cualquier prueba. Con
ello, adems, se reduce su ansiedad.
c) Habilidades para hacer exmenes: No es infrecuente que los alum-
nos que no saben hacer exmenes rindan por debajo de lo esperado. Por ello,
el profesor ha de procurar que tengan en cuenta, entre otras, las siguientes con-
sideraciones:
1. El alumno debe leer o escuchar atentamente las instrucciones del exa-
men y seguidas al pie de la letra.
2. Debe interpretar las palabras clave de cada pregunta: definir, describir,
justificar, ete., y todo, siempre, a veces, ete.
3. Debe conocer y considerar los criterios de calificacin: cunto vale
cada pregunta?, quitan puntos las respuestas errneas?, se puede
dejar alguna pregunta sin responder?, etc.
4. Debe tener en cuenta la importancia de la legibilidad y la limpieza, cir-
cunstancias que pueden influir en todo corrector.
5. Debe adoptar una buena postura fsica.
6. Debe afrontar la prueba con la mejor disposicin mental posible; lafati-
ga de un estudio atropellado a ltima hora puede pasar recibo.
7. Debe asignar a cada pregunta un nivel de dificultad (muy difcil, regular,
fcil) y, consecuentemente, un tiempo a cada una para poder responder
a todas.
8. Debe saber que en las pruebas objetivas por lo general se penaliza el
adivinar; sin embargo, ha de intentar deducir razonadamente las res-
puestas a todas las preguntas.
9. Si ha de reflejar sus respuestas en una hoja aparte, como suele ser el
caso de las pruebas objetivas, debe comprobar concienzudamente las
marcas para asegurarse de que corresponden a lo que realmente quiere
contestar.
10. En pruebas libres debe reflexionar y organizar sus respuestas antes de
empezar a redactadas: en primer lugar, hacer un esquema de las ideas
principales y, luego, desarrollado. Adems, se aconseja escribir siempre
algo adecuado en todas las preguntas.
11. Aadir,siempre que sea conveniente, diagramas, grficos, recuadros, etc.
12. Debe repasar sus respuestas para detectar y corregir los errores. Est
demostrado que el cambio de respuestas tiende a mejorar las califica-
ciones cuando tal cambio, ms que a adivinanza al azar, responde a nue-
vas intuiciones (Crocker y Benson, 1980; Mueller y Wasser, 1977).
13. Para evitar las faltas de ortografa, en caso de duda, utilizar sinnimos o
perfrasis.
El proceso de la evaluacin 275

d) Escribir O dictar: En general, la mejor presentacin de cualquier for-


mato de examen es entregado impreso o fotocopiado. As sucede casi siempre
con las pruebas objetivas; en cambio, las pruebas libres y los problemas cientfi-
co-matemticos a veces se escriben en el encerado o se dictan al principio del
examen.
En ocasiones, se dicta cada pregunta y se da un tiempo de respuesta antes
de pasar a la siguiente. Esto permite marcar el ritmo de los alumnos y asegurar
que todos puedan responder a todas. Algunos estudios sealan que en estos
casos los resultados son semejantes a cuando ellos siguen su ritmo. Es ms, si
las preguntas se hacen a una velocidad razonablemente rpida, se pueden pre-
sentar ms y obtener as calificaciones ms fiables para un mismo perodo de
examen. Sin embargo, esta modalidad tiene tambin sus desventajas: se presio-
na ms a los alumnos; no pueden volver sobre las respuestas para corregidas;
su atencin no est siempre tan fija en la hoja de examen, dificultando as la
vigilancia, etc.
e) Exmenes con o sin libros: Las pruebas en las que se pueden utilizar
libros y apuntes se ven a veces como un modo de motivar al alumno para que
no estudie superficialmente de memoria, sino para que asimile e integre los
conocimientos; asimismo, obligan al profesor a construir preguntas que sirvan
por lo menos para evaluar comprensin y aplicacin. Por todo ello, este tipo de
pruebas tiene su razn de ser. Adems, los alumnos se dan pronto cuenta de que,
si no van al examen bien preparados, los libros les sirven de poco: el buscar
hechos y frmulas puede distraedes y quitades un tiempo necesario para res-
ponder adecuadamente las preguntas.
Kalish (citado por Ebel y Frisbie, 1977), sin embargo, en una comparacin
experimental de exmenes aparentemente iguales, con libros en un grupo y sin
ellos en otro, concluye que en realidad no son equivalentes, sino que miden
capacidades distintas. Adems, contradiciendo las creencias populares sobre los
exmenes con libros, sugiere algunas desventajas cuando seala que inducen a
reducir el esfuerzo para lograr una mayor comprensin y favorecen un estudio
ms superficial que se queda en saber, no las cosas, sino en dnde estn.
Las tareas para hacer en casa tienen en general las mismas caractersticas que
los exmenes con libros, con dos diferencias importantes: no hay lmite de tiempo
y no existe la seguridad de que representen niveles de logros personales, sino los
del ocasional profesor particular. Por otra parte, son tareas que normalmente se
ponen con el propsito de una evaluacin formativa, por lo que no deberan
entrar como componente de la calificacinde una evaluacin sumativa.
t) Reducir las oportunidades de copiar: En cualquier examen, el profe-
sor tiene una obligacin adicional: evitar que los alumnos copien para conse-
guir una calificacin mayor que la que les corresponde por su nivel de conoci-
mientos. Este problema, que a veces sugiere versiones jocosas dentro y fuera
del aula, tiene indudables componentes ticos, y por ello debe considerarse
con seriedad.
276 La evaluacin de aprendizajes

El trmino copiar puede abarcar gran variedad de actividades: mirar el exa-


men de un compaero que se encuentre situado cerca; usar libros, apuntes o
chuletas; soplar informacin durante la prueba; comunicarse con un telfo-
no mvil; introducir papeles con alguna pregunta desarrollada y escrita previa-
mente; robar exmenes; suplantar a otro alumno, etc.; pero todas ellas tienen
como fin el engao.
Cualquier alumno avispado dispone en algn momento de oportunidades
para copiar en exmenes de cualquier tipo y, aunque haya circunstancias que
puedan incitar a ello, ninguna lo justifica. Las propias circunstancias de la prue-
ba pueden ofrecer a veces ms tentaciones de copiar: cuando e! alumno entien-
de que la calificacin va a depender de factores poco relevantes y no va a dar la
verdadera medida de sus conocimientos, cuando un examen exija un conoci-
miento detallado y superficial o se considere desproporcionado en relacin con
la enseanza recibida, justificaen el alumno la intencin de copiar y le anima
a preparar chuletas. Por otra parte, comprobar cmo algn compaero ha sal-
vado la situacin copiando incita a otros a hacer lo mismo. De todos modos,
independientemente de las circunstancias, el engao no se buscara si todos los
alumnos reconocieran que siempre es deshonesto e injusto. De ah la responsa-
bilidad del profesor.
En ocasiones, e! copiar no es sino un ltimo intento desesperado por apro-
bar en circunstancias en que se da una importancia desmesurada a las califica-
ciones. Sin embargo, las calificaciones son, o debieran ser, smbolos de los
logros educativos; por ello, no pueden considerarse como coartada del engao
sin merma de su valor y del incentivo que para cualquier alumno supone una
buena calificacin conseguida honestamente.
Qu hacer para evitar en lo posible que los alumnos copien? De mano, han
de reconocer que e! copiar es deshonesto e injusto y, por ello, el acto en s mis-
mo es reprobable y merecedor de algn tipo de sancin; por otra parte, e! pro-
fesor no debe entender e! copiar como algo inevitable y como un comporta-
miento aceptable y normal en los alumnos. Es su responsabilidad poner los
medios necesarios para intentar evitar todo lo que facilite e! engao antes,
durante y despus de la prueba: guardar bien el ejercicio antes de su realiza-
cin; entregar exmenes distintos o con las preguntas, distractores, etc., dis-
puestos en distinto orden si los alumnos tienen que estar muy juntos; exigir e!
examen en hojas especiales selladas; vigilar durante la prueba, no tanto para
pescar a alguien, cuanto por su responsabilidad de defender a la mayora de
los alumnos que se comportan honestamente, etc. En todo caso, si un profesor
est seguro, fuera de toda duda, de que un alumno est copiando, no puede
pasado por alto; ha de obrar en consecuencia de! modo que se considere perti-
nente o segn se haya indicado en las instrucciones previas.
Elproceso de la evaluacin 277

CORRECCiN Y CALIFICACiN 5.

Una vez finalizado el examen, se procede a su correccin y calificacin, para lo


que conviene tener en cuenta las siguientes cuestiones:
a) Mtodos de correccin: Aspecto especialmente importante para
minimizar la subjetividad en la correccin de las pruebas libres. Se proponen
los mtodos holstico y analtico desarrollados en el captulo 8.
b) Factores que influyen en la calificacin: La evaluacin nunca es
completamente objetiva, siempre puede haber factores que influyan en uno u
otro sentido. Algunos como los siguientes (Guilbert, 1989):
1. La benevolencia y la rigidez: Ambos son factores harto conocidos por
cualquier profesor, y sobre todo por los alumnos. Un medio de contra-
rrestados consiste en que el profesor invierta en cierta medida su ten-
dencia habitual. As, por ejemplo, ante la rigidez, se han de considerar
ms calificaciones favorables que desfavorables:

Malo Mediano Bueno Muy bueno Excelente


Suspenso Aprobado Bien Notable Sobresaliente

Por el contrario, ante la benevolencia, se han de considerar ms califica-


ciones desfavorables:

Psimo Muy malo Malo Mediano Bueno

2. Efecto centrpeto: Consiste en la tendencia a evitar los juicios extremos,


con lo que se tiende a desplazar a los individuos hacia la media del gru-
po. Este efecto puede disminuirse mediante la utilizacin de una escala
ms amplia en el centro que en los extremos:

-10 -9 -8 -6 -4 o +4 +6 +8 +9 +10

3. Efecto halo: Por el que, de acuerdo con Thorndike, un aspecto particular


de una persona adquiere tal relevancia para el profesor, que va a influir
en la. evaluacin general de todos los aspectos, y viceversa. Este efecto
ser menor cuando la evaluacin verse sobre aspectos independientes.
4. Error lgico: Es un caso particular del efecto halo, y se produce por la
presuncin de que existe una relacin entre dos variables que se van a
evaluar; por ejemplo, se considera que si un alumno responde bien a las
278 La evaluacin de aprendizajes

preguntas de memoria, lo har igual de bien en cuestiones que requieran


comprensin o aplicacin. Este error puede disminuir si la evaluacin se
refiere no a abstracciones, sino a comportamientos observables.
5. Error por contraste y similitud: Una persona preocupada, por ejemplo,
por el orden, tendr tendencia a juzgar, por contraste, a las otras perso-
nas desordenadas, y viceversa. No es infrecuente, por otra parte, creer
que los dems deben ser como uno mismo.
c) Exigencias de las calificaciones: Las calificaciones sirven de base para
tomar decisiones relevantes sobre planes educativos, opciones de carreras y
dems condicionamientos importantes para los alumnos y para las propias insti-
tuciones educativas. Por otra parte, las calificaciones sirven tambin para esti-
mular, dirigir y recompensar los esfuerzos de los alumnos. Por todas estas razo-
nes, deben ser tratadas cuidadosamente, con precisin, y han de basarse en
pruebas y observaciones suficientes.
Hay quien minusvalora la importancia de las calificaciones, considerando
que lo que los alumnos aprenden es ms importante que la nota que consi-
guen. Nadie duda de que, por s mismo, lo verdaderamente valioso es el conoci-
miento que se ha llegado a adquirir; pero tal consideracin equivale a decir que
no existe relacin entre lo aprendido y la calificacin que el alumno recibe. y,
aunqu~ con excepciones, sabemos que no es as (cap. 2).
Quirase o no, las calificaciones estn presentes en todo sistema educativo.
Por ello, si pecan de imprecisin, el remedio no es minimizadas ni eliminadas,
-con ello no slo no se anula el problema, sino que se aaden otros-; ms
bien hay que dades su justo valor, asignadas con cuidado, procurar que mejo-
ren su validez y precisin, que informen lo ms exactamente posible de los
logros educativos e interpretadas adecuadamente.
Uno de los requisitos de un buen sistema de calificacin reclamado con ms
insistencia es que las notas indiquen tan precisamente como sea posible hasta
qu punto los alumnos han adquirido los objetivos de aprendizaje de un pro-
grama.
El que los profesores se dejen influir, ya sea conscientemente o sin sabedo,
por factores extraos a la hora de asignar calificaciones se atribuye, entre otras
causas, a la ausencia de definiciones claras, aceptadas y explcitas para cada
nota. En estos casos, los prejuicios e idiosincrasia de los profesores interfieren
en los criterios para calificar, las calificaciones terminan por no ser fiables y pue-
den inflarse o disminuirse, haciendo que su valor facial sea ms alto o ms bajo
que su valor real; por lo que el significado de las notas vara de profesor a profe-
sor, de curso a curso, de escuela a escuela (realidad generalmente constatada,
que recogen Stiggins et al., 1989).
Estudios como los de Starch y Elliot (citados por Ebel y Frisbie, 1977) sobre
la fiabilidad de las notas confirman la variabilidad de juicios basados en criterios
presumiblemente absolutos. Dieron copias idnticas de un examen de Ingls a
142 profesores, con instrucciones para calificados sobre 100 para el examen
El proceso de la evaluacin 279

perfecto. Las calificaciones asignadas al mismo examen se dispersaron entre el


50 Yel 98. Se obtuvieron resultados semejantes en exmenes de otras materias
como Geometra e Historia. No se puede generalizar esta situacin, pero existe
campo considerable para mejorar la uniformidad de criterios y, por tanto, la fia-
bilidad de las calificaciones.
d) El sistema de codificacin: La calificacin no es sino una codificacin
de la valoracin de los logros instruccionales alcanzados. Por tanto, se impone
seleccionar la escala, los registros, las plantillas y hacer uso de unos mismos
smbolos que han de ser claramente conocidos, valorados, definidos y com-
prendidos de igual modo por todos los miembros de una comunidad educativa.
En general, las codificaciones numrica y no numrica de la calificacin
representan dos extremos en trminos de precisin. Los defensores de un siste-
ma de letras o similar quieren subrayar el contraste entre una valoracin cualita-
tiva y una supuesta medicin rigurosa, sealando que las bases para determinar
las calificaciones no son lo suficientemente fiables para justificar la aparente
precisin de los nmeros.
Sin embargo, cuando es necesario tratar las calificaciones, como es el caso
del clculo de medias, las letras han de ser transformadas en nmeros. Adems,
cuando se utiliza la misma letra para un rango de calificaciones, algunas ms
altas que otras, se pierde realmente informacin; dado que a un S, por ejemplo,
sea alto o bajo segn el logro en que se base, se le da siempre el mismo valor
(5, por ejemplo) cuando se reconvierte a nmero. Lo dicho para el sistema de
letras sirve, obviamente, para calificaciones registradas como Apto, Progresa
adecuadamente, etc.
Otros se inclinan por las calificaciones numricas porque contribuyen a una
mayor precisin y a la larga ahorran tiempo.
Unos y otros sostienen generalmente que basta con distribuir los logros en
10 nmeros o 5 letras desde 10/NSB a O;E/MD(cap. 13). Sin embargo, de vez en
cuando aumenta el inters por refinar la escala de calificaciones aadiendo sig-
nos de + y- a las letras bsicas (por ejemplo: Apto+, SF- PA+, PA-), o fraccio-
nes decimales a los nmeros bsicos (por ejemplo: 4,5, 3,5). Y otras veces, por
el contrario, toma fuerza la nocin de que el problema de calificar se puede
simplificar usando menos categoras; sin advertir que la restriccin del nmero
de categoras reduce la informacin que conlleva la nota.
e) Notas nicas o mltiples: El logro, en la mayora de los programas,
supone la conjuncin de varios factores: conocimientos, capacidades y procedi-
mientos desarrollados, actitudes fomentadas, etc. Del mismo modo, son tam-
bin varios los indicadores de logro que sirven para determinar la nota, como
se mencion al hablar de sus componentes. Por ello, es lgico preguntarse si un
solo smbolo puede servir y hacer justicia a tantos y tan variados aspectos. De
hecho, hay profesores que estiman que no es posible y consideran la nota como
una especie de composicin incierta y variable; por ello, especialmente en los pri-
meros niveles de la Educacin Primaria, se inclinan por unas calificaciones ms
280 La evaluacin de aprendizajes

analticas y descriptivas en forma de informes escritos, cuadros, tablas, etc. Obvia-


mente, un informe escrito es mucho ms explcito y sirve mejor para comunicar
los progresos escolares que un simple nmero, una letra o una palabra; pero tam-
bin mucho ms laborioso.
Otra posibilidad para lograr mayor informacin es utilizar un sistema mlti-
ple: una nota para indicar el nivel acadmico alcanzado y otra, u otras, para
expresar aspectos tales como actitud, esfuerzo, etc. No obstante, las notas ml-
tiples requieren no slo una clara distincin de los aspectos que cada una
representa, tambin la seguridad de que el profesor dispone de informacin
vlida y suficiente de todos ellos. No es difcil pensar, sin embargo, que las notas
mltiples pueden quedar influidas por el efecto halo: un SB en conocimientos
predetermina una nota alta en actitudes.

6. TOMA DE DECISIONES

Una vez obtenidos los resultados y valorados con una calificacin, procede
tomar las decisiones oportunas, individual o grupalmente, siguiendo las obser-
vaciones que se recogen en el captulo 14.

7. REVISiN

Es prctica habitual el ofrecer una ltima oportunidad al alumno para que revise
las valoraciones y decisiones que el profesor hizo de sus ejercicios y, as, pueda
aportar nuevos datos para alcanzar una mejor evaluacin. Incluso algunos pro-
fesores dedican alguna clase a realizar esta revisin conjuntamente como un
medio ms de practicar una evaluacin formativa, que, por un lado, corrija erro-
res y, por otro, asegure un recuerdo ms duradero.
Para ello, es imprescindible planificar estas sesiones de revisin previamente
con una informacin detallada sobre los errores detectados en las respuestas y sus
posibles explicaciones; de lo contrario, se corre el peligro de desperdiciarlas con
largas y estriles discusiones sobre los merecimientos de un punto arriba o abajo.
Al mismo tiempo, si los resultados medios de los alumnos caen por debajo
de lo esperado, las decisiones deben dirigirse hacia los mtodos de enseanza y
de evaluacin; en especial, si los exmenes proporcionan informacin sobre el
fin para el que se proponen, si la formulacin de las preguntas adolece de algu-
na ambiguedad, si el grado de dificultad de las preguntas sobrepasa el lmite
aconsejable, etc. (cap. 15).
* * *
El proceso de la evaluacin 281

Hasta aqu el largo camino que va desde planificar el examen hasta que se
informa al alumno de sus logros y de las decisiones tomadas. Aunque a primera
vista puede parecer muy complicado, la verdad es que la mayora de los profe-
sores llegan fcilmente a automatizado. El peligro es ms bien que el proceso
de la evaluacin se convierta en una rutina que no tenga en cuenta las precisio-
nes que intentamos recoger en este y en los anteriores captulos.
Glosario

Abstracto: Se entiende, en contraposicin a Concreto, como grado de univer-


salidad; de ah que las definiciones se consideren abstractas y los ejem-
plos, concretos.
Actitudes: Se tiene una actitud cuando aparecen pensamientos y sentimientos
hacia cosas y personas que nos gustan o disgustan, atraen o repelen, por
lo que una actitud implica componentes cognitivos (conocimientos), afec-
tivos (sentimientos) y conductuales (acciones).
Activacin de la Informacin: Proceso mediante el cual se recuperan aque-
llos Inclusores necesarios para manejar nuevas Informaciones.
Adaptacin de Acceso: Vase Adaptacin Estratgica.
Adaptacin Curricular Individual: Cuando el grado de aprender del alum-
no es muy bajo, es decir, no tiene suficiente Capacidad, estamos ante
un perfil de necesidades educativas especiales (n.e.e.), cuya medida de
intervencin ms adecuada es la Adaptacin Curricular Individual
(ACr), en la que los alumnos siguen una programacin adaptada a su
competencia. Para concretar esta medida, a partir de un anlisis de su
programacin de referencia, se eliminan aquellos Objetivos de Aprendi-
zaje para los que el alumno no tiene capacidad, se modifican a la baja
aquellos otros para los que su capacidad es limitada y, por ltimo, se
incorporan Objetivos de Aprendizaje de cursos anteriores que necesite
repasar y reasimilar porque son Prerrequisitos para nuevos aprendizajes.
Estos objetivos que se incorporan constituyen el ncleo de la programa-
cin del aula de apoyo. En el caso de alumnos con n.e.e., asociadas a
altas capacidades, la intervencin ms adecuada es tambin la Adapta-
cin Curricular Individual pero eliminando Objetivos de Aprendizaje
muy repetitivos, modificando al alza los que estn dentro de sus posibili-
dades e incorporando Objetivos de Aprendizaje de cursos posteriores
que estos alumnos puedan ya abordar.
284 La evaluacin de aprendizajes

Adaptacin Estratgica: Se la conoce tambin como Adaptacin de Acceso y,


a veces impropiamente, como No significativa. De ah que hablemos de
Estrategias para desarrollar no slo Habilidades cognitivas, sino tambin
habilidades de apoyo al aprendizaje y habilidades de autorregulacin y
control. Por este motivo, las Adaptaciones Estratgicas van desde medidas
de adaptacin cognitiva y afectiva (entrenamiento en habilidades yestrate-
gias) hasta medidas de adaptacin material (eliminacin de barreras arqui-
tectnicas, comunicacin alternativa, lenguaje Braille, etc.). Con las medi-
das de adaptacin cognitiva y afectiva, se tratar de ayudar a que el alumno
llegue en las mejores condiciones posibles a los Objetivos de Aprendizaje
mediante el entrenamiento estratgico oportuno.
Adaptacin Grupal: Es una adaptacin con un carcter ms abierto, que trata
de ajustar el currculo segn diferentes criterios, como son la inteligencia
predominante del alumno o sus conocimientos previos.
Adaptacin Individual: Es el ajuste entre los grados y las formas de aprender
de un estudiante y la propuesta educativa elaborada para su curso y nivel.
El grado equivale a las Capacidades del alumno, concretadas tanto en sus
Habilidades cognitivas como de apoyo al aprendizaje, y la forma, por su
parte, equivale al Estilo de Aprendizaje del alumno, es decir, a su manera
peculiar de abordar el conocimiento. Las formas y grados de aprender van
a ser, pues, los que definan el perfil de los estudiantes, dando lugar a que
stos puedan tener mayores o menores dificultades en su aprendizaje y,
en consecuencia, a que puedan precisar propuestas curriculares ms o
menos adaptadas.
Adaptacin Curricular Grupal: Se conoce tambin como Diversificacin
Curricular. Cuando en los ltimos cursos de la educacin obligatoria, el
desfase de conocimientos es muy importante en un grupo considerable
de alumnos, la medida de intervencin ms ajustada es plantear una adap-
tacin general del Proyecto Curricular, eliminando temas en algn rea y
formulando Objetivos de Aprendizaje con carcter ms procedimental.
Ajuste Social: Capacidad de un sujeto para interaccionar con fluidez en la
relacin con los dems.
Ajuste Emocional: Capacidad de un sujeto para autorregular y controlar de
manera adecuada los estmulos del medio.
Aprender: Es ampliar las ideas previas, para lo que se necesita que el sujeto
pueda recibir la Informacin en buenas condiciones, pueda manejada e
integrada en sus estructuras de conocimiento para, as, aumentadas y
hacedas crecer.
Aprendizaje Memorstico: Informacin que est poco o nada relacionada
con los conceptos previos existentes en la Estructura Cognitiva del
aprendiz. En este sentido, como no se produce interaccin entre la infor-
macin nueva y la ya adquirida, cada fragmento o unidad de informacin
Glosario 285

tiene que almacenarse arbitrariamente en la estructura cognitiva. De todas


maneras, debe distinguirse entre aprender memorsticamente (no signifi-
cativamente) y aprender de memoria. Se aprende de memoria algo que
hay que recordar de la misma forma que en el mensaje original, por ejem-
plo, unas siglas como LOGSE,LRU,etc. Se puede aprender algo de memo-
ria con algn grado de significatividad.
Aprendizaje Significativo: Informacin que est relacionada con los Con-
ceptos Base o Inclusores que han sido convenientemente activados y que,
por tanto, est integrada y forma parte de la Estructura Cognitiva del
aprendiz, dispuesta para ser aplicada en nuevos procesos de aprendizaje.
Como es natural, el aprendizaje significativo admite grados, ya que los
nuevos conocimientos pueden estar ms o menos relacionados con ms o
menos conceptos inclusores y su aplicacin puede llegar a hacerse de
manera ms o menos independiente.
Aptitudes: Perfil de Capacidades que presenta un sujeto y que configura su
nivel intelectual.
Atencin a la Diversidad: Es el modelo educativo fundamentado en una con-
cepcin plural de la educacin que pretende que los Proyectos de Centro,
en especial en las etapas de educacin obligatoria, pasen, como afirma
Reigeluth, de la nocin darwinista de la supervivencia del ms apto, a la
nocin ms humanamente defendible de la supervivencia de todos y as
adquieran un carcter ms inclusivo.
Atencin Selectiva: Habilidad para discriminar sin error. Est muy condicio-
nada por variables perceptivas que dificultan la fijacin.
Atencin Sostenida: Habilidad para mantener la concentracin todo el tiem-
po que exija la tarea. Est muy condicionada por variables emocionales
que dificultan la autorregulacin y el control.
Autocontrol: Es la Capacidad para regular, sobre todo, aquellas situaciones que
presentan algn condicionante desde el punto de vista emocional. Mejora
cuando uno mismo es capaz de planificarse, dominarse y reforzarse.
Axiologa: Anlisis y valoracin de la conducta desde el punto de vista de los
Valores.
Banco de Actividades: Es un conjunto de actividades y tareas ordenadas por
habilidades y niveles de dificultad, con el fin de alcanzar unos Objetivos de
Aprendizaje.
Banco de Pruebas: Es un archivo de preguntas, o tems, vlidas para compro-
bar con fiabilidad la consecucin de un repertorio de Objetivos de Apren-
dizaje.
Calidad Educativa: La calidad referida a la educacin alude al modo de ser de
un Sistema que rena las tres caractersticas siguientes:
Descripcin y diseo claro de lo que se pretende conseguir.
286 La evaluacin de aprendizajes

Proceso a seguir para alcanzar los Objetivos propuestos.


Operaciones necesarias para introducir las modificaciones oportunas,
tanto en los procesos como en los resultados. La eficacia de los proce-
sos y de los resultados educativos se manifiesta en la integridad de su
planteamiento, en la coherencia de su realizacin y en la eficacia de los
resultados.

Capacidades: Son el conjunto de disposiciones de tipo gen tico que, una vez
desarrolladas a travs de la experiencia, dan lugar a las Habilidades inte-
lectuales.

Se han propuesto diversas clasificaciones o taxonomas de capacidades de


los mbitos afectivo, psicomotriz y cognoscitivo; de estas ltimas, la ms
completa es la propuesta por Bloom, cuyas principales categoras son:
Reconocer (memorizar): Reproducir una informacin tal y como fue pre-
viamente almacenada en la Estructura Cognitiva.
Comprender: Traducir o interpretar la Informacin recibida.
Aplicar: Usar una abstraccin (principio, regla, generalizacin, etc.) para
resolver un caso concreto.

Analizar: Fragmentar una informacin para hacerla ms clara y explcita.


Sintetizar: Deducir o inventar algo; en sentido estricto, una abstraccin.
Valorar: Formular juicios de Valor.
Carcter Propio: Recoge la inspiracin peculiar de la tradicin educativa de
un centro y de sus opciones pedaggicas.
Competencia Curricular: Conjunto de conocimientos necesarios para domi-
nar la programacin de un curso o nivel.
Comunicacin Educativa: Supone un proceso formal intencionalmente per-
fectivo que requiere, por parte del receptor, el acto de comprender el
mensaje transmitido y, por parte del comunicante, la emisin del mismo.
La bilateralidad de la comunicacin es una necesidad del proceso educati-
vo que se sustenta en una accin recproca que presupone la alternancia
de emisor y receptor de modo que uno participa, de algn modo, en la
vida del otro. La comunicacin educativa va ms all de los lmites impues-
tos por la simple instruccin (comunicar para ensear) y llega a lo ms
profundo de la personalidad humana (comunicar para formar y educar).
Conceptos: Son representaciones Abstractas y universales, almacenadas en la
mente y que gozan de cierta estabilidad, que posibilitan tratar cognosciti-
vamente a distintos ejemplares como miembros de una misma clase de
objetos, acciones, sucesos y smbolos.
Desde un punto de vista clsico asociativo, los conceptos, por ejemplo,
soneto, energa, circunferencia, ofrecen una representacin nica, vlida
para todas las especies y casos particulares de sonetos, energas y circunfe-
Glosario 287

rencias, de tal manera que todos los ejemplos del concepto tienen esos
atributos y ningn no-ejemplo los posee. Al conjunto de estas caracters-
ticas necesarias y suficientes de un concepto, se le conoce como rasgos
definitorios. Segn esta concepcin clsica, los conceptos se aprenden por
discriminacin entre los diversos elementos del objeto o fenmeno y la
posterior abstraccin de sus elementos comunes. Los hay ms o menos
semejantes al prototipo, por lo que el hecho de que algo encaje dentro
de una categora no es una cuestin de todo o nada, sino ms bien de gra-
do. Dicho de otra forma, no todos los ejemplos de un concepto son bue-
nos prototipos del mismo, por lo que, para presentar un concepto,
deben tenerse en cuenta estos diferentes niveles de bondad de los ejem-
plos. As, se podra discutir si la piedra en el borde de una mesa es mejor
prototipo de energa potencial que un muelle comprimido.
En la bibliografa se encuentra a veces el trmino conceptos con el signifi-
cado de contenidos conceptuales, sinnimo de Objetivos de Aprendiza-
je cuya capacidad es la memorizacin o la comprensin.
Conceptos Base: Conceptos previos cientficamente correctos, vlidos y valio-
sos que, una vez activados y convertidos en Inclusores, sirven como punto
de apoyo para organizar los nuevos conocimientos.
Concreto: Vase Abstracto.
Contenido: En la acepcin de contenido cientfico, son los datos (trminos y
hechos), mtodos (convencionalismos, clasificaciones, criterios, etc.) y
generalizaciones (conceptos, principios y teoras) propios de una materia
o rea del saber.
A veces, se utiliza tambin para significar los contenidos de la enseanza,
cuando se habla de bloques de contenido, contenidos conceptuales,
procedimentales yactitudinales.
Control Estimular: Habilidad para discriminar los elementos bsicos de un
conjunto. Esta habilidad est muy condicionada por aspectos perceptivos.
Creatividad: Es la Capacidad de la persona para realizar innovaciones valio-
sas. No es un don excepcional posedo por unos pocos talentos, sino una
cualidad que todos los hombres poseen en uno u otro grado.
Criterios de Promocin: Son las normas que condicionan el paso de un cur-
so, de un ciclo o de una etapa a la siguiente.
Diversificacin Curricular: Vase Adaptacin Curricular Grupal.
Diferenciacin Progresiva: Expresin usada por Ausubel para referirse a la
organizacin j~rrquica de las estructuras de conocimiento. No coincide
con la deduccin, puesto que induccin y deduccin se refieren a la
secuencia de adquisicin de conocimientos, y aqu se postula que, inde-
pendientemente del mtodo, la Informacin queda estructurada jerrqui-
camente.
288 La evaluacin de aprendizajes

Educacin a Distancia: Es un Sistema de comunicacin bidireccional o multi-


. direccional, basado en la accin sistemtica y conjunta de recursos didcti-
cos con el apoyo de una organizacin y una tutora, que, separados fsica-
mente del estudiante, propician en stos un aprendizaje cooperativo.
Educacin Formal: Es todo Sistema Educativo institucionalizado, jerrquica-
mente estructurado, que se extiende desde los primeros aos de vida has-
ta la Universidad y que tiene por objeto la consolidacin de las destrezas
bsicas, as como los Contenidos culturales fundamentales.
Educacin Informal: Es el influjo perfectivo que recibe la persona caracteriza-
do por su carencia de intencionalidad, su asistematicidad, inconsciencia y
procedencia de diversos agentes sociales.
Educacin no Formal: Se refiere a toda aquella actividad organizada, sistem-
tica, educativa, realizada fuera del Sistema oficial, que atiende necesidades
formativas especficas a grupos particulares de poblacin.
Educacin Personalizada: Alude explcitamente a la persona humana como
sujeto de educacin.
Educacin Reglada: Es aquel tipo de educacin que surge de la reflexin
racional y tcnica a fin de organizar las actividades proyectadas al perfec-
cionamiento de los educandos desde instituciones formalmente orienta-
das a esa finalidad.
Enseanza Expositiva: Mtodo por el que el profesor presenta un Contenido
informativo de tipo conceptual, organizado en su forma final, a travs de
unas Formas Primarias y Secundarias, para que el alumno lo relacione
con sus Conceptos Base. Responde a un aprendizaje inclusivo que suele
provocar niveles de procesamiento con cierto grado de significatividad.
Enseanza por Descubrimiento: En la Enseanza para el Aprendizaje por
Descubrimiento, el alumno, en lugar de recibir la Informacin elaborada
por el profesor, descubre, en los materiales que se le proporcionan, una
organizacin que no est explcitamente presente, produciendo as su pro-
pio conocimiento hasta llegar a integrado.
Eptome: Es, segn Reigheluth y Stein, la presentacin de las ideas fundamen-
tales que constituyen la parte ms esencial de lo que se va a ensear.
Escuela Comprensiva: Conocida tambin como Escuela Inclusiva, es aquella
que, sin educar en la igualdad, trata de ofrecer a todos lasmismas oportu-
nidades para ser diferentes.
Escuela Inclusiva: Vase Escuela Comprensiva.
Estilo de Aprendizaje: Es el conjunto de Estrategias Cognitivas y de estrategias
de apoyo que utiliza individualmente cada alumno a la hora de aprender.
Estrategias: Son una gua de acciones conscientes e intencionales dirigidas a la
consecucin de una meta. Debido a su intencionalidad, requieren cierto
grado de actividad metacognitiva.
Glosario 289

Estrategias Cognitivas: Procesos conscientes (memorizar, comprender, apli-


car, analizar, sintetizar, valorar crticamente) necesarios para poner en
prctica una Habilidad cognitiva.
Estrategias de Apoyo al Aprendizaje: Procesos conscientes (atender, moti-
var) necesarios para iniciar y mantener todo proceso de aprendizaje.
Estrategias de Autorregulacin: Son las que se ocupan del control personal
de los procesos cognitivos.
Estrategias Metacognitivas: Son las que favorecen el control consciente de la
actividad mental.
Estrategias Metodolgicas: Se refieren a la ejecucin planificada y deliberada
de aquellas actividades que, seleccionadas por consideradas ms apropia-
das para conseguir ciertos objetivos o fines, llevan a cabo, respectivamen-
te, el profesor o los alumnos.
Estrategias Motivacionales: Son las que predisponen al estudiante a apren-
der. Se desarrollan cuando las tareas potencian el inters, la percepcin de
la competencia y las atribuciones internas.
Estructura Cognitiva: Es aquella donde se produce el procesamiento, siem-
pre que existan los esquemas previos apropiados. Consta de registros sen-
soriales, Memoria de Trabajo o memoria a corto plazo y Memoria Perma-
nente o a largo plazo.
Evaluacin: La Evaluacin Educativa es la medida o comprobacin del grado
de consecucin de los Objetivos, lo que comporta una recogida de Infor-
macin para emitir despus un juicio de Valor codificado en una califica-
cin, con vistas a una posterior toma de decisiones.
Evaluacin Formativa: Es una evaluacin permanente para determinar el gra-
do de adquisicin de cada objetivo, y detectar tanto los aspectos no asimi-
lados, como sus causas y, as, poder reajustar y optimizar los logros y el
proceso de enseanza-aprendizaje.
Evaluacin por Pares: Sinnimo de Arbitraje Cientfico, es un proceso de eva-
luacin de los resultados de una investigacin que emergen en campos
concretos del conocimiento. Este proceso sanciona dicho conocimiento
convirtindolo en conocimiento certificado, es decir, conocimiento que ha
sido sometido a una crtica rigurosa por especialistas en el rea, que deter-
minan su originalidad y calidad, adquiriendo as un valor que se suma al de
su publicacin en una revista. Este valor corresponde, por un parte, a la
mayor visibilidad que adquiere una investigacin gracias a su circulacin
pblica y, por la otra, a la percepcin, por parte de los lectores, de la cali-
dad sancionada por miembros calificados de la comunidad cientfica. Por
lo general, la Evaluacin por Pares es realizada por rbitros annimos,
cuyos juicios son transmitidos al editor; de manera semejante, en algunas
ocasiones, los revisores no conocen el nombre de los autores, para as eli-
minar la subjetividad.
290 La evaluacin de aprendizajes

Evaluacin Sumativa: Es la evaluacin final que emite un juicio sobre el


alumno ea veces, aunque menos frecuentemente, tambin sobre el profe-
sor o el currculo) en relacin con el resultado del aprendizaje, reflejado
en una calificacin globalizada de un repertorio de objetivos, y de la que
se sigue una toma de decisiones ejecutiva, a veces implcita.
Finalidades Educativas: Son los Objetivos Generales de un centro que con-
cretan el Carcter ProPio en cuanto a lo que pretendemos en relacin
con toda la Comunidad Educativa. Las finalidades relativas a los alumnos
tendrn continuidad en los Objetivos Generales del Proyecto Curricular
de cada etapa.
Formacin: Significa cada uno de los pasos en el proceso de desarrollo y per-
feccionamiento de la personalidad. Tambin expresa el hecho de dar for-
ma a lo informe o facilitar la adquisicin de una nueva forma a lo ya forma-
do. En ambos casos, se entiende que la forma proporcionada, tanto la
incorporada de nuevo como la que se aade, son acciones perfectivas.
Grafo: Como variante de mapa conceptual, es la simbolizacin de un guin
donde, adems del orden lgico de la materia, se representan grficamen-
te las conexiones entre las distintas partes del guin, poniendo as de
manifiesto una primera aproximacin a la secuencia que se va a seguir en
el proceso de instruccin.
Habilidades: Son las Capacidades puestas en prctica, tanto de manera cons-
ciente como automtica. Para conseguir ser hbil, es preciso contar con la
capacidad potencial necesaria y con el dominio de ciertas Estrategias que
lleven al xito.
Hypertexto: Herramienta didctica que, adems de utilizar de manera minu-
ciosa las Estrategias de la Enseanza Expositiva para transmitir la Infor-
macin, presenta al alumno los Contenidos progresivamente diferencia-
dos con el fin de que los encaje adecuadamente en sus estructuras de
conocimiento previas.
Ideas Previas: Conocimientos iniciales que poseen los alumnos antes de
comenzar un proceso de instruccin o de enseanza-aprendizaje para
alcanzar unos determinados Objetivos de Aprendizaje.
Inc1usor: Es un concepto previo que se activa en la Estructura Cognitiva del
aprendiz, cuando accede a una nueva Informacin. Se distinguen varias
clases de inclusin; a saber, subordinada derivativa o de ampliacin, subor-
dinada correlativa o de modificacin, supraordinada y de simple relacin.
Informacin: Se entiende, en el contexto educativo, como todo Contenido
cientfico considerado objeto de estudio. Este contenido se puede concre-
tar en datos, mtodos y generalizaciones.
Instrumentos de Evaluacin: Son todos aquellos recursos que, en diferentes
situaciones, permiten medir el grado de consecucin de los Objetivos de
Aprendizaje.
Glosario 291

Jerarqua de Valores: Los Valores son mltiples. Hay valores tiles, econmi-
cos, vitales, intelectuales, religiosos, morales, estticos, etc. Entre s, man-
tienen relaciones de valor, es decir, establecen una jerarqua, un orden de
prelacin valioso, de modo que el cumplimento de uno debe prevalecer
sobre el otro. Cada valor se rige por el grado de preferibilidad o de no
indiferencia que le corresponde. Unos valores son terminales porque tie-
nen sentido en s mismos, y otros son instrumentales porque son medio
para conseguir otros. La promocin personal de una sensibilidad axiolgi-
ca y de una clara conciencia valorativa es la culminacin necesaria de una
verdadera educacin humana.
Lnea Base: Es la formada por el nivel de conocimientos que configuran el
estado inicial del alumno.
Memoria Permanente (MP): Es la parte de la Estructura Cognitiva donde se
integra la Informacin a largo plazo para posteriormente poder recupe-
rada.
Memoria de Trabajo (MT): Es un elemento de la Estructura Cogntiva donde
la Informacin se organiza en un breve plazo antes de integrada en la
Memoria Permanente.
Mtodo: Plan que realiza el docente tras considerar el conjunto de decisiones
tomadas respecto de la presentacin y transmisin del conocimiento, por
una parte, y en relacin tambin con las tareas que los alumnos han de
realizar para conseguir determinados objetivos. Cada mtodo abarca,
pues, las Estrategias de enseanza-aprendizaje, consideradas ms apropia-
das para conseguir ciertos Objetivos o fines.
Metodologa: Trata los Mtodos de Enseanza Expositiva y por Descubri-
miento.
Multicultural: Situacin en la que coexisten diversas culturas en cuanto con-
junto de ideas, Valores, sistemas de creencias y aspiraciones de una comu-
nidad que constituyen, en cada una de ellas, las bases culturales de su edu-
cacin.
Objetivo: Es una Capacidad sobre un Contenido; esto es, una accin cognos-
citiva, psicomotriz o afectiva sobre una realidad concreta.
Objetivo de Aprendizaje: Es un Objetivo que se puede evaluar directamente
a travs de algn indicador observable.
Objetivos de rea: Son los Objetivos Generales, de carcter disciplinar, en
donde se reflejan las metas a alcanzar en cada materia del currculo. En
algunos Sistemas Educativos, como el espaol, se formulan en primera
instancia en el currculo oficial vigente, aunque los centros tienen la facul-
tad de matizados.
Objetivo de Ciclo: Es el perodo de toma de decisiones, en orden a la promo-
cin; por ejemplo, en la Educacin Primaria del actual Sistema Educativo
espaol, es de dos cursos escolares.
292 La evaluacin de aprendizajes

Objetivos de Etapa: Son los Objetivos Generales, de carcter interdisciplinar,


en donde se reflejan las metas a alcanzar a travs de las diferentes materias
de cada Etapa. En el Sistema Educativo espaol, se formulan primero en el
currculo oficial, aunque los centros tienen la facultad de matizados de
acuerdo con sus Finalidades Educativas.
Objetivo General: Es un Objetivo, es decir, una Capacidad que el individuo
realiza sobre un Contenido, pero en el que la capacidad, al ser muy amplia
o el contenido muy extenso, no se puede evaluar directamente, sino a tra-
vs de Objetivos de Aprendizaje. Los Objetivos Generales se clasifican en
Objetivos de Etapa, de rea y de Ciclo.
Opcionalidad: sta se puede considerar como una variante ms comprometida
de la Optatividad y trata de dar respuesta a la inteligencia predominante de
cada alumno y a su nivel intelectual. Supone una eleccin que, aunque no
debiera impedir estudios futuros, los condiciona; de ah la necesidad de una
orientacin adecuada. Se suele iniciar en los ltimos cursos de la educacin
obligatoria, ofreciendo una enseanza con materias comunes para todos,
pero claramente diversificada con materias especficas para cada grupo de
alumnos segn sus intereses, Capacidades y nivel de competencia. Su con-
crecin se puede hacer mediante la implantacin de itinerarios rgidos,
obviamente ms econmicos, o teniendo en cuenta un planteamiento ms
acorde con la propuesta de las inteligencias mltiples, que requiere mayo-
res recursos y se fundamenta en el principio de la personalizacin curricular,
planteando las reas configuradas por especialidades.
Optatividad: sta, como respuesta a laAtencin a la Diversidad en la Educacin
Secundaria Obligatoria y, por supuesto, en los bachilleratos, en la Formacin
Profesional yen los estudios superiores, permite enriquecer y equilibrar el
currculo, dando cabida a las peculiaridades que presentan los alumnos; es
decir, supone una serie de materias que se pueden ofrecer con distintos
fines, tales como desarrollar alguna de las inteligencias mltiples que no
aparecen en el currculo bsico, alcanzar los Objetivos de Etapa por vas dife-
rentes a las previstas en las materias bsicas o realizar actividades que orien-
ten la eleccin de los estudios posteriores y el paso a la vida activa.
Organizadores: Son estructuras de conocimiento relacionadas entre s a nivel
interno, organizadores previos, y externo, organizadores secuenciales. Los
organizadores secuenciales son en realidad organizadores previos para el
resto del proceso de aprendizaje.
Preconceptos: Son concepciones errneas que distorsionan los nuevos apren-
dizajes y suelen estar en la base de no pocos fracasos acadmicos. Convie-
ne detectados cuanto antes para sustituidos por los cientficamente
correctos a travs del cambio conceptual.
Pregunta Problema: Estrategia motivacional que consiste en presentar un
caso, un enigma, etc., cuya solucin est en la explicacin que se va a dar
Glosario 293

posteriormente con alguna de las Estrategias propias de la Enseanza


Expositiva.
Prerrequisito: Es un Concepto previo tericamente necesario para abordar
una nueva Informacin.
Principio: Es una relacin entre Conceptos. Puede llamarse tambin hiptesis,
proposicin, regla, ley, etc. Generalmente los principios, y tambin las teo-
ras (relacin entre principios), describen causas o efectos, identificando
lo que suceder como resultado de un cambio dado (el efecto), o por qu
sucede algo (la causa).
Procedimientos: Son los Objetivos de Aprendizaje que tratan de desarrollar
Capacidades de aplicacin, anlisis, sntesis y valoracin crtica. Son sin-
nimos de contenidos procedimentales.
Procesos Algortmicos: Series de operaciones elementales que llevan, en un
nmero finito de pasos, a la solucin de un problema.
Programacin: Es el conjunto de metas y Objetivos de distinta consideracin.
Programacin de Aula: Es donde se formulan, a partir del currculo oficialvigen-
te, los Objetivos de Aprendizaje, de modo que posteriormente se secuen-
cien e integren en una Unidad Didctica. Para ello, se suelen proponer los
siguientes pasos: Explicitacin de Temas, Secuencia de los Temas en Cursos,
Guin de los Contenidos Cientficos, Relacin de Contenidos y Capacidades
y; finalmente, Formulacin de los Objetivos de Aprendizaje.

Proyecto Curricular: Se deriva de las Finalidades referentes a los alumnos y


consta de los Objetivos de Etapa, Criterios de Promocin (entre etapas,
ciclos y cursos), Objetivos de rea y Objetivos de Ciclo.
Proyecto de Centro: Vase Proyecto Educativo.
Proyecto Educativo: Es el marco general de referencia que vertebra un Cen-
tro Educativo y lo hace realidad organizada y culturalmente significativa
explicitando sus opciones y aspiraciones de una manera clara, coherente y
comunicable.
Procesos Heursticos: Operaciones de bsqueda no elementales, que no tie-
nen por qu resolver ntegramente un problema.
Prueba de Eleccin Mltiple: Son pruebas en las que el alumno debe selec-
cionar slo una de entre un conjunto de posibilidades limitadas.
Prueba Objetiva: Son aquellas pruebas en las que el alumno, previa elabora-
cin mental acompaada a veces de una construccin material, elige la
respuesta entre una serie de alternativas que se le proporcionan.
Prueba Libre: Lo especfico de estas pruebas es la libertad de expresin del
alumno, que ha de organizar sus propios conocimientos, seleccionar lo
ms importante, manifestar su creatividad y originalidad, integrando en un
todo armnico los elementos de su respuesta.
294 La evaluacin de aprendizajes

Prueba Verdadero/Falso: Se conocen tambin como respuestas de dos alter-


nativas; en ellas el alumno califica la formulacin de una proposicin
como verdadera o falsa.
Recepcin Activa: Supone mantener los receptores sensoriales bien dispues-
tos. Es, sobre todo, un esfuerzo por parte del sujeto por activar los Inclu-
sores adecuados para poder manejar la nueva Informacin que se est
procesando.
Reconciliacin Integradora: Es la secuencia expansiva de los Organizadores
de conocimiento a travs de los conceptos-puente y de las oportunas
aplicaciones intermedias. En la prctica, supone una construccin dinmi-
ca del conocimiento.
Reconocimiento de la Informacin: Capacidad de identificar correctamen-
te un elemento informativo sin error. Se relaciona con la Habilidad para
fijar estmulos en la Memoria Permanente.
Registro Sensorial: Elemento de la Estructura Cognitiva que recoge los est-
mulos informativos que llegan del exterior y los traslada a la Memoria de
Trabajo.
Reglamento de Organizacin y Funciones (ROF): Conocido tambin
como Reglamento de Rgimen Interior (RRI), recoge la estructura organi-
zativa de un centro.
Reglamento de Rgimen Interior (RRI): Vase Reglamento de Organiza-
cin y Funciones.
Respuesta Emocional: Se relaciona con la respuesta adaptativa o de evitacin
que muestra la persona ante estmulos externos estresantes, desagrada-
bles o nocivos.
Resumen: Recopilacin de todas las ideas que se han tratado a lo largo de una
exposicin. Se distingue del Sumario en que ste se refiere a las ideas que
se van a tratar posteriormente. Este nmero de ideas suele ser considera-
blemente amplio, por lo que tendr que hacerse superficialmente y en un
nivel abstracto. El resumen puede ayudar a la organizacin final de la
Informacin, previa a la integracin en la Estructura Cognitiva.
Secuencia Didctica: A veces se habla de secuencia elaborativa. Es la
secuencia lgica de una Informacin (datos, mtodos o generalizaciones)
que va de lo simple a lo complejo (ms partes y ms relacionadas secuen-
cialmente, lo que supone amplitud e inclusin).
Sentido Crtico: Es, segn Ibez-Martn, la expresin madura de la especfi-
ca cualidad del hombre de ser principio de sus acciones, lo que repercute
tanto en su actividad intelectual como en el ejercicio de su voluntad.
Singularidad: Es una cualidad de la persona que implica distincin, separa-
cin, diferencia, cuantitativa y cualitativa, en virtud de la cual, cada ser per-
sonal es diferente a los dems. Se opone a la universalidad.
Glosario 295

Sntesis: Estrategia para relacionar e integrar ideas. Hay que distinguir entre
sntesis de proceso o peridicas y sntesis de conjunto o final (efecto
zoom de la Teora de la Elaboracin). A travs de las sntesis peridicas,
el alumno es consciente en todo momento de la estructura informativa y
de la importancia de cada parte individual de conocimiento respecto a
otras partes relacionadas.
La sntesis final es una especie de recapitulacin o repaso rpido en el que
se muestra cmo la explicacin del tema responde a la pregunta o proble-
ma inicial. Es hacer una interpretacin de los conflictos suscitados en la
Pregunta Problema, consolidando as los objetivos propuestos.
Se entiende tambin por sntesis la Capacidad de deducir y crear, propia
de la taxonoma de Bloom.
Sistema: Es una realidad compleja en la que sus partes y elementos, diferencia-
dos, se relacionan entre s para alcanzar una finalidad comn.
Sistema Educativo: Es no slo el ordenamiento legal, determinado por las
leyes, rdenes y reglamentos de distinto orden que establecen las autori-
dades acadmicas, sino tambin la concepcin educativa que conlleva,
entre otras, la seleccin de Estrategias de enseanza y de aprendizaje. Un
Sistema Educativo se caracteriza por la coherencia entre sus fines, conteni-
dos (conocimientos, Actitudes, Valores), ambiente, estrategias didcticas y
organizacin, que se ponen en prctica en funcin de lograr las metas
deseadas.
Sobreaprendizaje: Es el proceso por el que, una vez que el material se apren-
de de memoria y se recuerda sin error, se vuelve a estudiar repetidamente.
Sumario: Es la presentacin previa de todas las ideas que se van a tratar poste-
riormente en una exposicin. Se distingue del Resumen en que ste se
refiere a las ideas que ya se han tratado. El nmero de ideas del sumario
suele ser considerablemente amplio, por lo que tendr que hacerse super-
ficialmente y en un nivel Abstracto.
Team Teaching: Es una manera de organizacin que afecta a los alumnos, divi-
dindolos, segn las exigencias de las actividades de enseanza-aprendiza-
je, en grupos (grandes, medianos, pequeos); y a los profesores quienes
se responsabilizan, en equipo, de determinadas tareas que facilitan la eva-
luacin mutua, por ejemplo observacin en el aula.
Tcnica Didctica: Conjunto estructurado y secuenciado de pasos derivados
de una seleccin de Estrategias suficientemente validada en la prctica.
Teoras del Aprendizaje: Son los modelos o paradigmas que sustentan cada
modo peculiar de entender el aprendizaje. Bsicamente son el Conductis-
mo, el Cognitivismo y el Constructivismo. Para el Conductismo, el apren-
dizaje se da a travs de asociaciones simultneas (contiguidad), o de aso-
ciaciones de la conducta con sus consecuencias (contingencia). Para el
296 La evaluacin de aprendizajes

Cognitivismo, el aprendizaje es un proceso de modificacin interno, con


cambios no slo cuantitativos, tambin cualitativos; y que se produce
como resultado de otro proceso interactivo, con un carcter claramente
intencional, entre la informacin que procede del medio y un sujeto acti-
vo. Por ltimo, el Constructivismo subraya un aspecto del Cognitivismo,
es decir, la continua reconstruccin de los aprendizajes mediante una
interna actividad por parte del alumno con el fin de poder atribuir nuevos
significados a las ideas previas.
Tranfer: Se produce cuando un aprendizaje determinado sirve y favorece a
otro u otros aprendizajes.
Unidad Didctica: Es una frmula para organizar la prctica de la enseanza y
el aprendizaje incluyendo las distintas partes del proceso de enseanza-
aprendizaje; a saber: Programacin, Metodologa y Evaluacin.
Valor: Es el carcter de preferible que tienen unas cosas sobre otras. Los valo-
res, en este sentido, constituyen el orden de lo preferible.
Referencias bibliogrficas 297

Referencias biliogrficas

AM:ERI(::AN
FEDERATION OF TEACHERS, NATIONALCOUNCIL ON MEASUREMENTIN
EDlJCA:TION& NATIONALEDUCATION ASSOCIATION (1990). Standards for tea-
chers competence in educational assessment of students. Washington, De: AFT.
AMERICAN PSYCHOLOGICAL ASSOCIATION (1992). Ethical principIes of psycholo-
gists and code of conduct. American Psychologist,51, 644-648.

ANGUERA, M. T. (1981). La Observacin (I): Problemas metodolgicos. En R. Fer-


nndez Ballesteros y J. A. 1. Carrobles (eds.): Evaluacin conductual: Metodolo-
ga y Aplicaciones (pgs. 292-333). Madrid: Pirmide.
ANGUERA,M. T. (1983). Manual de prcticas de observacin. Mxico: 'lIillas.
ANGUERA, M. T. (1985). Metodologa de la observacin en las Ciencias Humanas.
Madrid: Ctedra (3' ed.).

ANGUERA,M. T. (1987). Observacin en el aula. Barcelona: Guix.


ANGUERA, M. T. (ed.) (1991a). Metodologa observacional en la investigacin psi-
colgica, Vol.1, Fundamentacin (1). Barcelona: PPD.
ANGUERA, M. T. (1991b). La observacin como metodologa bsica de investigacin
en el aula. En O. Senz (ed.): Prcticas escolares. Propuestas de Proyectos
Curriculares y de investigacin-accin. Alicante: Marfll.
ANTUNES, C. (1975). Tcnicas pedaggicas de la dinmica de grupo. Buenos Aires:
Kapelusz.

ANZIEU, D. y MARTN, J. Y (1975). La dinmica de los grupos pequeos. Buenos


Aires: Kapelusz.
298 La evaluacin de aprendizajes

y LATORRE,A.(l992). Investigacin educatilla.Barcelo-

Psicologa educativa. Un punto de vista cognitivo. Mxico:

los procesos Barcelona: Pai-

recherche action dans l'institution educative. Paris: Gaut-

1. Y OLAIZOLA, S. (1994). Modelos de Pruebas para la Evalua-


Obietivos en el rea de Geologa y Biologa en el Bachiller Cientfico.
203-242.

BARKER,D. Y EBEL, R 1. (1981). <<A comparison of clifficultyand discrimination values of


selected true-false item types. Contemporary Educational Psychology, 7,35-40.
BELL,R. T. (1981). An Introduction to Applied Linguistics: Approaches and Methods
in Language Teaching. London: Batsford Academic and Educational.
BELMONTE,M. (1996). La Prctica de la Evaluacin en la Enseanza Secundaria Obli-
gatoria. Aplicacin al rea de Ciencias Experimentales. Bilbao: Mensajero (2' oo.).
BERELSON, B. (1952). Content analysis in communications research. NewYork: The
Free Press.

A (1984). Aguide to criterion-referenced test construction. Baltimore, MD:


Hopkins University Press.
A consumer's guide to setting performance standards on crite-
rion-referencedtests. Review of Educational Research, 56(1), 137-172.
Standard setting: the next generation.

BLOOM, B. S. (ed.)
de Examinadores
Conocimiento.

BLOOM, B. S., HASTING,]. T. Y MADAUS, G.(1975).Evaluacin del aprendizaje.


Buenos Aires: Troquel (orig. 1971).
BOUvAR, A. (1992). Los contenidos actitudinales en el currculo de la Reforma. Pro-
blemas y preguntas. Madrid: Escuela Espaola.
BONBOIR, A. (1974). La Docimologa. Madrid: Morata (orig. 1972).
Referencias bibliogrficas 299

BRAVO,A. YFERNNDEZ DEL VALLE,J. (2000). LaevaluacinconvencionaJ


los nuevos modelos de evaluacin autntica. Psicothema, 12(Supl.)
BRINCONES, 1. (1990). El
(comp.): Lecciones
Madrid: Universidad Autnoma.

des en el aprendizaje

research: ten years.Journal 01Currculum Studies, 21 (1), 85-90.


una ciencia crtica de la educacin. Barcelona: Laertes.

CARRASCO,J. B. (1991). Tcnicas y recursos para el desarrollo de las clases. Madrid:

CARRASCOSA,M. et al. (1991). Evaluacin 1. La evaluacin curricular del alumno. En


El alumno con retraso mental en la escuela ordinaria. Madrid: Centro Nacional
de Recursos para la Educacin Especial, MEC.
CASANOVA,M. A. (1997). Manual de Evaluacin Educativa. Madrid: La Muralla.
CBASE, C. 1. (1979). The impact ofachievement expectations and handwriting qua-
lity on scoring essay tests.]ournal 01Educational Measurement, 16, 39-42.
CIRIGLIANO, G. y VILLAVERDE,A.(1982). Dinmica de grupos y educacin. Buenos
Aires: Humanitas.

ClZEK, G. J. (1996). Setting passing scores. Educational Measurement: Issues and


practice, 15, 20-31.
CUFFORD, (1969). Los exmenes. Barcelona: Oikos-Tau (orig. 1964).

COFFMAN,WE.(1971). Essayexaminations. En R. L. Thorndike (ed.): Educational


Measurement.Washington, DC: American Council on Education (2nd ed.).
COHEN,L.yMANION, 1. (1990). Mtodos de Investigacin Educativa. Madrid: La
Muralla (orig. 1989).
COLAS, M.P.Y BUENDIA, 1. (1992). Investigacin Educativa. Sevilla: Alfar.
COLLlER,J. (1945). United States Indian administration as a laboratory af ethnic rela-
tions. Social Research, 12, 265-305.
CONTRERAS MUOZ, E. (1990). ElProfesor Universitario y la Evaluacin de los
Alumnos. Madrid: ICE de la Univ. Politcnica.
300 La evaluacin de aprendizajes

E. (1969). Individual Differences in Learntng AfJUltv as


Variables. Stanford, CA: Stanford University
Anlisis elemental de encuestas. Mxico: 'frillas (orig. 1971).
tcnicas de medicin de actitudes. Mxico: Limu-
1972).
A, VANDE VEN, A Y GUSTAFSON, D. (1975). Group Techniqueslor Prog-
Planning. Flenview, ILL: Scott, Foreman and Co.
NEIRA, A, ALGUERO, A, BRUGOS, J. A, GARCA,v., LVAREZ,L. y SOLER,
Integrado de Procesado de Tests. Aula Abierta, 74, 215-239.
estudiar. Madrid: ICCE.

y HERMAN,J. L. (1986). Assessing student achievement: A pro-


CSE Monograph Series in Evaluation, n. 11. Los Ange-
of California-Los Angeles.
DOWNEY, R. G. (1979). Item-options weighting of achievement tests: Comparative
study of methods. Applied Psychological Measurement, 3(4), 453-456.
DUBOIS, P.H. (1970). A History 01Psychological Testing. Boston: Allyn Bacon.
DUNN-RANKIN, P.,KNEZEK, G. A, WALLACE,S. y ZHANG, S. (2004). Scaling methods.
London: LEA.

EBEL, R. L. (1968). Blind guessing on objective achievement tests. Journal 01 Edu-


cational Measurement, 5, 321-325.

EBEL, R. L. (1980). Are true-false items useful?" En R. L. Ebel (ed.): Practical pro-
blems in educational measurement. Lexington, MA: D.C.Heath.

EBEL,
nosR.Aires:
L. YFRISBIE,
Guadalupe
D. A
(orig.
(1977).
1991).
Fundamentos de la medicin educacional. Bue-
EDWARDS,AL. (1957). Techniques 01 Attitude Scale Construction. New York: Apple-
ton-Century.
EISNER, E. W (1988). The Art 01 Educational Evaluation. A Personal View. London:
The Falmer Press.

La investigacin-accin en educacin. Madrid: Morata.


El cambio educativo desde la investigacin-accin. Madrid: Morata.
Referencias bibliogrficas 301

FERNNDEZ,A (1982). Historia del mundo contemporneo. Barcelona: Vicens Vives.


FERNNDEZ BALLESTEROS,R. (1983). Psicodiagnstico. Madrid: UNED.
FERNNDEZ-BALLESTEROS, R., CAMPLLONCH,]. M., CALERO, M. D. Y BELCH1, ].
(1991).EPA,Evaluacin del Potencial del Aprendizaje. Madrid: MEPSA.
FERNNDEZ DE CASTRO,]. (1973). La Enseanza Programada. Madrid: Consejo
Superior de Investigaciones Cientficas.
FERNNDEZ GARRIDO,]. (1980). La medida de la creatividad: Tipos de Instrumen-
tos, Problemtica y Perspectivas. Valencia: INCIE-ICE.
FlDALGO, A. (1996). Funcionamiento diferencial de los tems. En]. Muiz (coord.):
Psicometra. Madrid: Uni

_ roblemas referentes a la medida de la creatividad>.


eral y Aplicada, 131(29),1033-1055
FREDERIKSEN, N., MISLEvy' R. y BEJAR, 1. (1993). Testtheoryfor
.. Hillsdale, NY: LEA.
. A. (1973). Multiple-choice vs. true-false: A comparison of reliabilities and
rrent validities.Joumal ofEducationalMeasurement, 10,297-304.
'A, P.(1975). La dinmica de la entrevista enfuncin del tutor. Madrid: INCIE.
GAGN, R. M. (1970). Las condiciones del aprendizaje. Madrid: Aguila (orig. 1985).
GAGN, R. M. Y BRIGGS, L.]. (1976). La planificacin de la enseanza. Sus princi-
pios. Mxico: 'frillas (orig. 1973).
GARCA-MENDOZA,A. y SOLER, E. (1994). Banco de Pruebas. Tomo 1. Fsica. Mono-
grafa nm. 23 de Aula Abierta. ICE de la Universidad de Oviedo.
GARCAVIDAL,]. Y GONZLEZ MANJN, D. (1992). Evaluacin e Informe Psicope-
daggico. Madrid: Eos ..
GICKLING, E. E. & THOMPSON, V (1985). A personal view of curriculum-based
assessment. Exceptional Children, 52, 205-218.
GIL, E. (1992). El Sistema Educativo de la Compaa dejess. La Ratio studiorum.
Madrid: UPCO.

GIMENO SACRISTN,].
Madrid: Anaya. (1981). Teora de la Enseanza y Desarrollo del Currculo.

GIMENO
Madrid:SACRISTN,].
Morata. (1988). El Currculo: Una Reflexin sobre la prctica.
GLASER, R. 1. (1963). Instructional Technology and the measurement of learning
outcomes: some questions. American Psychologist,18,519-521.
GMEZ, P. C. y GARCA, A. (1991). Manual TTl. Procedimientos para aprender a
aprender. Madrid: Eos.
GONZLEZ-ROM, V y ESPEJO, B. (2003). Testing the midcl1e response categories
not sure, in between, and? in polytomous items. Psicothema, 15,278-284.
GORING, P. O. (1971). Manual de mediciones y evaluacin del rendimiento en los
estudios. Buenos Aires: Kapelusz.
302 La evaluacin de aprendizajes

learning, 1960-1980. One participants .observa-

evaluacin. en la enseanza. Mxico: 'frillas

Aprovechamiento. Mxico: 'lliIlas

Valladolid: ICE

evdluatingalternatives to tradi-

quality of preceding. responses on


subseql.~l1tresponses ta an essay question. Journal of

entre la physique du physicienet la


Pedagogie,33,19-29.
SWAMINATHAN,H. y ROGERS, H. J. (1991). Fundamentals of
Newbury Park, CA: Sage.
NARAYANA,P.YSETIADI, H. (1996). Construccin
conceptas bsicos, avances tcnicos y aplicaciones. En
:Psicometra. Madrid: Universitas.
Correlates, causes, effects, and treatment of test anxiety.
ofEducationalResearch, 58(1), 47-77.
Evaluacin y Medicin en Id Escueld. Mxico: Kapelusz (orig. 1976).
M. B. (1968). Predicting grades from below chance test sco-
JournCfIofEducational Measurement, 5, 45-53.
P. (1981). Relationship between free-response and choice-type tests of
achievement: A review oJthe literature. ERrC Document Reproduction Service

P. W y WAINER, H. (1993). Differential item functioning. HilIsdale, NJ:


Lawrence Erlbaum.

HOOVER, K.. H. (1977). values Education. Developing Values.EnL. Rubin (ed.):


Currculum Handbook. The Disciplines, Current Movementand lnstructional
Methodology. Bastan: Allyn & Bacon.
HOWELL, K. y MOREHEAD, M. (1987). Curriculum-based(waluationfor special and
remedial education. Columbus, OHIO: Merrill.
HUBER, p. (1984). Toma de decisiones en la gerencia. Mxico: Trillas (orig. 1980).
HUGHES, D. c., KEELING, B. YruCK, B. (1983). Effectsofachievement expectations
and handwriting quality on scoring essays. Journal of Educational Measure-
ment, 20, 65-70.
HUNKINS, F. P. (1972). Questioning strategies and techniques. Bastan: Allyn & Bacon.
]OINT COMMITTEE ON TESTING PRACTICES (1988). Code offair testing practices
in education. Washington, D. c.: APA.
Referencias bibliogrficas 303

KEMMIS, S. (1988). El Currculo: ms all de la teora de la reproduccin. Madrid:


Morata (orig. 1986).

KEP~;~. ~~'lr
TREGOE, B. (1983). El nuevo directivo
KRIPPENDORFF, K. (1980). Content analysis. An introttuc'tion
Beverly Hills, CA: Sage Publications.

LAFOURCADE, P.D. (1977). Evaluacin de los aprendizajes. Madrid: CinceL


LEFRANCOIS, G. R. (1988). Psychology for teaching. Belmont, CA: Wadsworth
(6thed.).
LEWIN, K (1946). <<Act
2,34-46.

LEWIN, K. (1947). Fee


tions, 1,147-153.
LEWIN, K. (1952). Group decision and Social change. En T. M. Newcomb y E. E. Har-
tley (eds.): Readings in Social Psychology. New York: Holt, Rinehart and Wmston.
UKERT, R. (1932). A Technique for measurement of attitudes. Archives of Psycho-
log)!, 140,44-53.
UNN, R. 1. (1989). Educational measurement. New York: MacMillan.
LORD, F. M. (1980). Applications of item response theory to practical testing prob-
lems. HilIsdale, NJ: Lawrence Erlbaum.
LOREE, M. R. (1948). A study of a technique for improving tests. Tesis Doctoral no
publicada, University of Chicago.
LUNN,]. C. B. (1969). The development of scales to measure junior school children's
atittudes. Br.j.Educ.Psychol.,39, 64-71.
MACKEACHIE,W J (1988). The need for study strategy training. En C. E. Weinstein,
E. T. Goetz y P. A. Alexander (eds.): Learning and study strategies. New York:
Academic Press.

MADDOX, H. (1970). Cmo estudiar. Barcelona: Oikos-Tau (6aed.) (orig. 1963).


MAGER, R. F. (1977). Formulacin Operativa de ObjetivosDidcticos. Madrid: Maro-
va (orig. 1962).
MANN, H. (1845). Boston Grammar and Writing Schools. Common SchoolJoumal,
7,19,October.

MANNING, S. A. y ROSENSTOCK, E. H. (1971). Elaboracin de escalas de actitudes y


psicofisica clsica. Mxico: liillas (orig. 1968).
McCAll, W A. (1920). <<ANew Kind of School Examination. joumal of Educational
Research, January.
McDONALD, B. (1971). The Evaluation of The Humanities Curriculum
holistic approach. Theory into Practice, 10(3), 163-167.
McDONALD, B. (1973). Humanities Currculum Project, Evaluation in currculum
development: twelve case studies, Schools Council Research Studies. London:
MacMillan Education.

McGUIRE, C. (1976). Construction and use of written simulations. Cuadernos de


Salud Pblica, 61, The Psychological Corporation.
304 La evaluacin de aprendizajes

San Francisco:

To11Ulde deci-

New

Bases tericas de la Evaluacin Educativa. Archidona,

(1988). Medicin de Actitudes en Psicologa y Educacin. San Sebas-

MARTNEZ, R J. y MUIZ, J..(2004). Directrices para la construccin de


Psicotbema, 16,490-497.
R,MARTNEZ,R].y MUIZ,] (2006). New Guide.lines for Developing
Items.Metbodology, 2(2),65-77.
MUEllER, D. J. YWASSER, V (1977). Implications of changing answers on objective
test items. oumal oi Educational Measurement, 14, 9-14.
MUIZ,]. (coord.) (1996). Psicometra. Madrid: Universitas.
MUIZ, J. (l997a).lntroduccin a la Teora de Respuesta a los tems. Madrid: Pirmide.
MUIZ,j. (1997b). Aspectos ticos y deontolgicos de la Evaluacin PSicolgica. En
ACordero (coord.):La Evaluacin Psicolgica en el ao 2000. Madrid: TEA.
MUIZ,]. (2003). Teora Clsica de los Tests. Madrid: Pirmide.
NERICI,I. G. (1970). Hacia una Didctica General Dinmica. Buenos Aires: Kape-
lusz (2' ed.) (orig. 1966).
NOVAK,J,D. y GOWIN, D. B. (1988). Aprendiendo a aprender. Barcelona: Martnez
Roca (orig. 1984).
OLEA,j.(1993).La evaluacin de la creatividad: Revisinycrtica.Tarbya, 3,81-98.
OLEA,]., PONSODA, V y PRIETO, G. (eds.) (1998).
Madrid: Pirmide.

OLEA,]., PONSODA, V y PRIETO, G. (eds.) (1999). infor11Ultizados. Fundamen-


tos y aplicaciones. Madrid: Pirmide.
ORDEZ,].]. (1995). Banco de Pruebas. Tomo 3. Monografa nm. 23 de
Aula Abierta. ICE de la Universidad de Oviedo.

OSGOOD, C., SUCI. G. y TANNENBAUM, P. (1957). Tbe measurement oi Meaning.


Urbana, Ill: University of Illinois Press.
Referencias bibliogrficas 305

OSTERIlND, S. J. (1998). Constructing test items: Multiple-Choice, Constructed-Re-


sponse, Performance, and otherformats. Baston: Kluwer Academic Publishers.
OWENS, T R. (1971). Application of adversary proceedings ta educational evaluatian
and decision making. Anual Congress of American Educational Research Asso-

ciation, New York, AERA.


OWENS, T. R. (1973). Educational evaluatian by adversary proceedings. En
House (ed.): School evaluation: Thepolitics and process. Berkeley: McCutchan.
PARLETT, M. R. (1972). Evaluating innovatians in teaching. En H. J. Butcher yE.
Reudd (eds.): Contemporary problems in Research in Higher Education. New
York: McGraw-Hil

7). Evaluatian as Illumination: A new appro-


novative programmes. En D. F. Hamilton et al. (eds.):
me. London: MacMillan Education.

, S. (2001). Audio computer-based tests: An initial frame- .


e use of sound in computerized tests. Educational Measurement:
'ractice,20(2), 5-15.
., DAVEY,T Y PASHLEY,P. (2000). Innovative item types for campute-
,. En W J. van der Linden y C. Glass (eds.): Computer adaptive tes-

'eory and practice. Boston: Kluwer Academic Publishers.


RSON, D. G. (1926). Do new and ald type examinations measure different
ental functions? School and Society, 24, 246-248.
DA, M. A. Y SOLER, E. (1994). Banco de Pruebas. Tomo 2, Qumica. Monografa
nm. 23 de Aula Abierta. ICE de la Universidad de Oviedo.
PREZ JUSTE, R. Y RAMOS,J. M. G. (1989). Diagnstico, evaluacin y toma de deci-
siones. Madrid: Rialp.
PETERSON, D. E. (1968). The clinical study of social behavior. New York: Appleton
c.e.,

PHELPS, R. (ed.) (2005). Defending standardized testing. London: LEA.


PHILUPS, R. e. (1974). Evaluacin y Educacin. Buenos Aires: Paids (orig. 1974).
PIDGEON, D. y YATES,A. (1976). Evaluacin y medida del rendimiento escolar.
Salamanca: Anaya.

PIERON, H. (1968). Vocabulaire de la psychologie. Pars: PUF.


PIERON, H. (1969). Examens et Docimologie. Paris: PUF.
POKRAS, S. (1992). Cmo resolver problemas y tomar decisiones sistemticamente.
Mxico: Grupo Editorial Iberoamrica (orig. 1989).
POMES, J. y ARGUELLES,B. (1991). Anlisis de tems de Opcin Mltiple. Zaragoza:
Servicio de Publicacianesde la Univ. de Zaragoza.
POPHAM, W J. (1978). Evaluacin basada en criterios. Madrid: Magisterio Espaol
(orig. 1978).

POPHAM, W J. (1984). Specifying the damain of content or behaviors. En R. A Berk


(ed.): Aguide to criterion-referenced test construction. Baltimore: Johns Hapkins.
POPHAM, W J. y BAKER, E. 1. (1970). Systematic Instruction. Englewood Cliffs, NJ:
Prentice Hall.
306 La evaluacin de aprendizajes

POSNER, G. J. (1979). Instrumentos para la investigacin y desarrollo del currculo:


Aportaciones potenciales a la ciencia cognoscitiva. PerfilesEducativos, 6, 17AO.
Performance assessment: Panacea or pandora 's box? Rockville,

tems. EnJ.Mujz (ed.): Psi-

aptitudes. EnJ.
aplica-

Anlisis de un

(1980). Effects of c1iscourse and response mode on the meas-


competence.journalofEducationalMeasurement, 19,241-258.
lnstitutio Studiorum (1598). Npoles: Tarquinio Longo, en edicin
Gil, E. (1992). El Sistema Educativo de la Compaa de jess. La
Studiorum. Madrid: UPCO.
RENOM, J. (1993). Testsadaptativos computerizados: fundamentos y aplicaciones.
Barcelona: PPU.

RENOM,]. (1997). Retos y Perspectivas de los Tests Adaptativos Informatizados. En


A. Cordero (coord.): La Evaluacin Psicolgica en el ao 2000. Madrid: TEA.
RODRGUEZ DIGUEZ, J. 1. (1980). Didctica General, 1. Objetivos y Evaluacin.
Madrid: CinceL

RODRGUEZ NElRA, T. (1980). Algunas consideraciones sobre la Evaluacin en el


"Proyecto para la Reforma de la Enseanza". Aula Abierta, 54, 3-14.
RODRGUEZ NElRA, T. (1999). Teorasy modelos de enseanza. Posibilidadesy lmi-
tes. Lrida: Milenio.
RODRGUEZ NElRA, T. (2002). Estructura y lmites gnoseolgicos de la investigacin-
accin crtica. Revista Espaola de Pedagoga, 50, 415-438.
ROSALES,C. (1981). Criteriospara una evaluacinformativa. Madrid: Narcea.
ROSS, C. C. (1947). Measurement in today's schools. Englewood Cliffs, NJ: Prentice
Hall (2nd ed.).
ROWE, M. B. (1969). Science, Silence and Sanctions. Science and Children,March, 11-
13.

ROWE, M. B. (1974). Wait-tme and reward as instructional variables, their influence


on language, logic and fate control: Part one-Wait time. joumal of Research on
Science Teaching, 11,81-94.
ROWNTREE, D. (1982). Aprende a estudiar. Barcelona: Herder ( 4a ed.) (orig. 1970).
SABERS, D. 1. Y WHITE, G. W (1969). The effect of differel1.tial weithing of individual
item responses on the predictive validity and reliability of an aptitude test.jour-
nal of Educational Measurement, 6, 93-96.
SABIRN, F. (dir.) (1999). El discurso y la prctica en Evaluacin. Zaragoza: ICE de
la Universidad de Zaragoza.
SALVIA,J. y HUGHES, C. (1990). Curriculum-based assessment: Testing what is
taught. NewYork: MacMillan.
Referencias bibliogrficas 307

SANDERS, N. (1966). Classroom Questions,


SANTOS GUERRA,M. A. (1988). Patologa de la evaluacin.educativa.lnfancia
Aprendizaje, 41, 143-158.
S.(1967). The methdology

(1942).Appraising and recording student progress.

(1967). The countenance of educational evaluation.Teachers


68, 523-540.
R. E. (1975). Program evallliltion: Particularly responsive evaluation. Occasio-nal
Paper,5, november. Kalamazoo, MI: Evaluations Center, Univ. Westem Michigan.
STAKE,R. E. (1976). Atheoreticalstatement of responsive evaluation. Studies in Ed-
ucational Evaluation, 2, 19-22.
STALNAKER, J. M. (1966). The essaytype examination. En E. F. Linquist
Educational Measurement. Washington, DC: American Council on Education.
STENHOUSE,1. (1987). Investigacin y desarrollo del Currculo. Madrid: Morata (2."
ed.) (orig. 1981).
STIGGINS, R. J. (1988). Revitalizing classroom assessment: The highest instrUctional
priority. Phi Delta Kappan, 69,363-368.
STIGGIN5, R.]., FRISBIE, D. A. YGRISWOLD, P.A. (1989). <<Insidehigh school grading
practices: Building a researchagenda. Educational Measurements: Issues and
Practice, 8(2), 5-14.
STUFFLEBEAM,D. 1. (1967). The use and abuse of evaluation in Title IlI. Theory
into PractiCe, 6, June, 126-133.

STUFFLEBEAM,J).L.ySHINKFIELD, .]. (1987). Evaluacin sistemtica. Guateri-


ca y prctica. Barcelona: Paids (orig. 1985).
SUCHMAN, E. A. (1967). EvaluativeResearch: Principlesand Practice in Public
Service and Social Action Programs. New York: Russell Sage Foundation.
SUNDBERG, N. D. (1977). Assessment ofperson. Englewood Cliffs, NJ:Prentice Hall.
TABA,H. (1974). Elaboracin del Currculo. Buenos Aires: Troquel (orig. 1962).
3C
308 La evaluacin de aprendizajes

TAYLOR,H. (1980). Contract grading. ERIC/TM Report No. 75. Princeton, NJ; ERIC
Clearinghouse on Tests, Measurement and Evaluation, ERIC Document Reproduc-
tion,Service No. ED 198 152.

TE~!::'~9;4~' (1981). Evaluacin. Gua prctica para profesores. Madrid: Narcea.


TERESA, C. y LUENGO, M. A. (1996). Banco de Pruebas. Tomo 4. Matemticas .
. Monografa nm. 23 de Aula Abierta. ICE de la Universidad de Oviedo.
TERWILUGER, J. S. (1989). Classroom standard setting and grading practices. Edu-
cational Measurements: lssues and Practice, 8(2), 15-19.
....THORNDIKE, E. L.-(1904). An lntroduction to the Tbeory of Mental and Social Meas-
urements. NewYork: Teachers College Press, Columbia University:
THORNDIKE, E. 1. YHAGEN, E. (1969). Measurement and Evaluation in Psychology
and Education. NewYork: John WIley & Sons (3rd ed.).
THURSTONE,1. 1. (1947). Vocationallnterest Schedule. NewYork: Psychological Cor-
poration.

THURSTONE, 1. 1. YCHAVE,E. J. Measz,.relnellt 'Attitti.de.Chicago: Uni-


versity of Chicago Press.

TRYON, G. S. (1980). The measurement tre:Uelnellt Review of


Educational Research, 50, 343-372.
TUCKER, J. A. (1985). Curriculum-based assessment: introdlucl:iorl. Exceptional
Children,52,199-204.
TYLER,R. W. (1973). Principios Bsicos del Currculo. Madrid: Santillana (orig. 1950).
TYLER, R. W. (1967). Changing concepts of educational evaluation. En R. E. Stake
(ed.): Perspectives of currculum evaluation (AERA Monograph Series Curricu-
lum Evaluation, 1). Chicago: Rand McNally:
VAN DER UNDEN, W.J. (1997). Handbook of Modern ltem Respanse Tbeory. New
York: Springer.
VANDER UNDEN, W.J. y GLASS, C. (eds.) (2000). Computer-adaptive testing, Tbeory
ang practice. Baston: Kluwer Academic Publishers.
VYGOSTSKY,1. (1964). Pensamiento y Lenguaje. Buenos Aires: Lanturo (orig. 1962).
WAINER, H. (ed.) (1990). Computer adaptive testing. Hillsdale. NT: Lawrence Erl-
baum.

WARD, B. YTIKUNOFF, W. (1982). Colaborative DC: National


Inst.of Educ.

WOLF,R. 1.(1974). The citizen as jurist: A new evaluation. Cit-


izen Action in Education, 4, december.
WOLF, R. 1. (1975). frial by jury. A new evaluation method. Ph;Delta, Kappan, 57,
november, 185-187.
ZABAIZA, M. A. (1989). Diseo y Desarrollo Currcular. Madrid: Narcea (3a ed.).
ZERILU,A. (1978). Fundamentos de organizacin y direccin general. Bilbao: Deusto.
ZENISKY,A. 1. YSIRECI, S. G. (2000). Technological innovations in large scale assess-
ment. Applied Measurement in Education, 15,337-362.

Anda mungkin juga menyukai