Anda di halaman 1dari 33

Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual.

Un siglo, el XX, de
inteso desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

Revista ELectr nica de Investigaci n


y EValuaci n Educativa

DESDE LOS TESTS HASTA LA INVESTIGACI N EVA-


LUATIVA ACTUAL. UN SIGLO, EL XX, DE INTENSO DE-
SARROLLO DE LA EVALUACI N EN EDUCACI N
(From tests to current evaluative research. One century, the XXth, of in-
tense development of evaluation in education)

por
Articles record Ficha art culo
Tom s Escudero Escor a
About authors Sobre los autores
(tescuder@posta.unizar.es)
HTML format Formato HTML

Abstract Resumen
This article presents a review and state of art about devel-
Este art culo presenta una revisi n cr tica del desarrollo
opment in educational evaluation in the XXth century. The
hist rico que ha tenido el mbito de la evaluaci n educa-
main theoretical proposals are commented
tiva durante todo el siglo XX. Se analizan los principales
propuestas te ricas planteadas.

Keywords Descriptores
Evaluation, Evaluation Research, Evaluation Methods; Evaluaci n, Investigaci n evaluativa, M todos de Evalua-
Formative Evaluation Summative Evaluation, Testing, ci n, Evaluaci n Formativa, Evaluaci n Sumativa, Test,
Program Evaluation Evaluaci n de Programas

Introducci n El an lisis la vamos a llevar a cabo bas ndo-


nos en tres planteamientos que podr amos ta-
En cualquier disciplina, la aproximaci n hist - char de cl sicos en la reciente literatura sobre
rica suele ser una v a fundamental para compren- el tema y que usamos indistintamente, aunque
der su concepci n, estatus, funciones, mbito, no tenemos la pretensi n de ofrecer un plan-
etc. Este hecho es especialmente evidente en el teamiento de s ntesis, sino de utilizaci n cabal
caso de la evaluaci n, pues se trata de una disci- de todos ellos, puesto que los tres plantea-
plina que ha sufrido profundas transformaciones mientos inciden sobre los mismos momentos y
conceptuales y funcionales a lo largo de la histo- movimientos claves.
ria y, sobre todo, a lo largo del siglo XX, en el
que principalmente ubicamos nuestro an lisis. En Un planteamiento, quiz s el m s utilizado en
este sentido, la aproximaci n diacr nica al con- nuestro contexto (Mateo y otros, 1993; Her-
cepto resulta imprescindible. n ndez, 1993), es el que ofrecen Madaus, Scri-

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 11


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

ven, Stufflebeam y otros autores, que en sus tra- los procedimientos que se empleaban en la
bajos suelen establecer seis pocas, empezando China imperial, hace m s de tres mil a os, para
su an lisis desde el siglo XIX (Stufflebeam y seleccionar a los altos funcionarios. Otros auto-
Shinkfield, 1987; Madaus y otros, 1991). Nos res como Sundbery (1977) hablan de pasajes
hablan de: a) poca de la reforma (1800-1900), evaluadores en la Biblia, mientras Blanco
b) poca de la eficiencia y del testing (1900- (1994) se refiere a los ex menes de los profe-
1930), c) poca de Tyler (1930-1945), d) poca sores griegos y romanos. Pero seg n McRey-
de la inocencia (1946-1956), e) poca de la ex- nold (1975), el tratado m s importante de eva-
pansi n (1957-1972) y f) poca de la profesiona- luaci n de la antig edad es el Tetrabiblos, que
lizaci n (desde 1973), que enlaza con la situa- se atribuye a Ptolomeo. Tambi n Cicer n y
ci n actual. San Agust n introducen en sus escritos concep-
tos y planteamientos evaluadores.
Otros autores como Cabrera (1986) y Salvador
(1992) citan tres grandes pocas, tomando como En la Edad Media se introducen los ex me-
punto de referencia central la figura de Tyler en nes en los medios universitarios con car cter
el segundo cuarto del Siglo XX. A la poca de m s formal. Hay que recordar los famosos
Tyler se le denomina de nacimiento, a las ante- ex menes orales p blicos en presencia de tri-
riores de precedentes o antecedentes y a la poste- bunal, aunque s lo llegaban a los mismos los
rior de desarrollo. que contaban con el visto bueno de sus profe-
sores, con lo que la posibilidad de fracaso era
Guba y sus colaboradores, sobre todo Yvonna pr cticamente inexistente. En el Renacimiento
Lyncoln, destacan distintas generaciones. Ahora se siguen utilizando procedimientos selectivos
estar amos en la cuarta (Guba y Lincoln, 1989), y Huarte de San Juan, en su Examen de inge-
que seg n ellos se apoya en el enfoque paradig- nios para las ciencias, defiende la observaci n
m tico constructivista y en las necesidades de los como procedimiento b sico de la evaluaci n
stakeholders (demandantes e implicados en la (Rodr guez y otros, 1995).
evaluaci n), como base para determinar la in-
formaci n que se necesita. La primera genera- En el siglo XVIII, a medida que aumenta la
ci n es la de la medici n, que llega hasta el pri- demanda y el acceso a la educaci n, se acent a
mer tercio de este siglo, la segunda es la de la la necesidad de comprobaci n de los m ritos
descripci n y la tercera la del juicio o valoraci n. individuales y las instituciones educativas van
elaborando e introduciendo normas sobre la
Tras el an lisis hist rico, como complemento y utilizaci n de ex menes escritos (Gil, 1992).
como revisi n de s ntesis del mismo, ofrecemos
un sucinto resumen de los enfoques evaluativos Entrado el siglo XIX se establecen los siste-
m s relevantes, de los distintos modelos y plan- mas nacionales de educaci n y aparecen los
teamientos que, con mayor o menor fuerza, vie- diplomas de graduaci n, tras la superaci n de
nen a nuestra mente cuando intentamos acotar lo ex menes (ex menes del Estado). Seg n Max
que es hoy en d a la investigaci n evaluativa en Weber (Barbier, 1993), surge un sistema de
educaci n ex menes de comprobaci n de una preparaci n
espec fica, para satisfacer las necesidades de
. Precedentes: Antes de los tests y de la una nueva sociedad jer rquica y burocratizada.
medici n En los Estados Unidos, en 1845, Horace Mann
comienza a utilizar las primeras t cnicas eva-
Desde la antig edad se han venido creando y luativas del tipo tests escritos, que se extien-
usando procedimientos instructivos en los que den a las escuelas de Boston, y que inician el
los profesores utilizaban referentes impl citos, camino hacia referentes m s objetivos y expl -
sin una teor a expl cita de evaluaci n, para valo- citos con relaci n a determinadas destrezas
rar y, sobre todo, diferenciar y seleccionar a es- lecto-escritoras. Sin embargo, no se trata toda-
tudiantes. Dubois (1970) y Coffman (1971) citan

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 12


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

v a de una evaluaci n sustentada en un enfoque c) El desarrollo de los m todos estad sticos


te rico, sino m s bien, algo que responde a pr c- que favorec a decisivamente la orientaci n
ticas en buena medida rutinarias y con frecuencia m trica de la poca (Nunnally, 1978).
basadas en instrumentos poco fiables.
d) El desarrollo de la sociedad industrial
Al final del siglo XIX, en 1897, aparece un tra- que potenciaba la necesidad de encontrar
bajo de J. M. Rice, que se suele se alar como la unos mecanismos de acreditaci n y selec-
primera investigaci n evaluativa en educaci n ci n de alumnos, seg n sus conocimientos.
(Mateo y otros, 1993). Se trataba de un an lisis
comparativo en escuelas americanas sobre el Consecuentemente con este estado de cosas,
valor de la instrucci n en el estudio de la ortogra- en este periodo entre finales del siglo XIX y
f a, utilizando como criterio las puntuaciones principios del XX, se desarrolla una actividad
obtenidas en los tests. evaluativa intensa conocida como testing ,
que se define por caracter sticas como las si-
. Los tests psicom tricos guientes:

En el contexto anterior, a finales del siglo XIX, Medici n y evaluaci n resultaban t rminos
se despierta un gran inter s por la medici n cien- intercambiables. En la pr ctica s lo se
t fica de las conductas humanas. Esto es algo que hablaba de medici n.
se enmarca en el movimiento renovador de la
metodolog a de las ciencias humanas, al asumir El objetivo era detectar y establecer dife-
el positivismo de las ciencias f sico-naturales. En rencias individuales, dentro del modelo del
este sentido, la evaluaci n recibe las mismas rasgo y atributo que caracterizaba las elabo-
influencias que otras disciplinas pedag gicas raciones psicol gicas de la poca (Fern ndez
relacionadas con procesos de medici n, como la Ballesteros, 1981), es decir, el hallazgo de
pedagog a experimental y la diferencial (Cabrera, puntuaciones diferenciales, para determinar
1986). la posici n relativa del sujeto dentro de la
norma grupal.
La actividad evaluativa se ver condicionada
de forma decisiva por diversos factores que con- Los tests de rendimiento, sin nimo de eva-
fluyen en dicho momento, tales como: luaci n educativa, se elaboraban para esta-
blecer discriminaciones individuales, olvi-
a) El florecimiento de las corrientes filos fi- d ndose en gran medida la representatividad
cas positivistas y emp ricas, que apoyaban a la y congruencia con los objetivos educativos.
observaci n, la experimentaci n, los datos y En palabras de Guba y Lincoln (1982), la
los hechos como fuentes del conocimiento evaluaci n y la medida ten an poca relaci n
verdadero. Aparece la exigencia del rigor cien- con los programas escolares. Los tests in-
t fico y de la objetividad en la medida de la formaban algo sobre los alumnos, pero no de
conducta humana (Planchard, 1960) y se po- los programas con los que se les hab a for-
tencian las pruebas escritas como medio para mado.
combatir la subjetividad de los ex menes ora-
les (Ahman y Cook, 1967). En el campo educativo destacan algunos ins-
trumentos de aquella poca, como las escalas
b) La influencia de las teor as evolucionistas de escritura de Ayres y Freeman, de redacci n
y los trabajos de Darwin, Galton y Cattel, apo- de Hillegas, de ortograf a de Buckingan, de
yando la medici n de las caracter sticas de los c lculo de Wood, de lectura de Thorndike y
individuos y las diferencias entre ellos. McCall y de aritm tica de Wood y McCall
(Planchard, 1960; Ahman y Cook, 1967; Ebel,
1977).

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 13


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

Sin embargo, fue en los tests psicol gicos don- ten textos y publicaciones que utilizan de ma-
de los esfuerzos tuvieron mayor impacto, siendo nera indisoluble evaluaci n y medida (Gron-
probablemente la obra de Thorndike (1904) la de lund, 1985).
mayor influencia en los comienzos del siglo XX.
En Francia destacan los trabajos de Alfred Binet, 3. El nacimiento de la verdadera evalua-
despu s revisados por Terman en la Universidad ci n educativa: La gran reforma
de Stanford, sobre tests de capacidades cogniti- tyleriana
vas. Ahora hablamos del Stanford-Binet, uno de
los tests m s conocidos en la historia de la psi- Antes de que llegara la revoluci n promovida
cometr a. por Ralph W. Tyler, en Francia se inicia en los
a os veinte una corriente independiente cono-
A os m s tarde, con las necesidades de reclu- cida como docimolog a (Pieron, 1968 y 1969;
tamiento en la Primera Guerra Mundial, Arthur Bonboir, 1972), que supone un primer acerca-
Otis dirige un equipo que construye tests colecti- miento a la verdadera evaluaci n educativa. Se
vos de inteligencia general (Alfa para lectoescri- criticaba, sobre todo, el divorcio entre lo ense-
tores y Beta para analfabetos) e inventarios de ado y las metas de la instrucci n. La evalua-
personalidad (Phillips, 1974). ci n se dejaba, en ltimo t rmino, en manos de
una interpretaci n totalmente personal del pro-
Tras la contienda, los tests psicol gicos se po- fesor. Como soluci n se propon a: a) elabora-
nen al servicio de fines sociales. La d cada entre ci n de taxonom as para formular objetivos, b)
1920 y 1930 marca el punto m s alto del tes- diversificaci n de fuentes de informaci n,
ting , pues se idean multitud de tests estandari- ex menes, expedientes acad micos, t cnicas de
zados para medir toda clase de destrezas escola- repesca y tests, c) unificaci n de criterios de
res con referentes objetivos externos y expl citos, correcci n a partir del acuerdo entre los correc-
basados en procedimientos de medida de la inte- tores de las pruebas y d) revisi n de los juicios
ligencia, para utilizar con grandes colectivos de de valoraci n mediante procedimientos tales
estudiantes. como la doble correcci n, o la media de distin-
Estas aplicaciones estandarizadas se acogen tos correctores. Como puede verse, se trata de
muy bien en los mbitos educativos y McCall criterios en buena medida vigentes actualmente
(1920) propone que los profesores construyan y, en alg n caso, incluso avanzados.
sus propias pruebas objetivas, para no tener que Pero quien es tradicionalmente considerado
confiar exclusivamente en las propuestas por como el padre de la evaluaci n educativa es
especialistas externos. Tyler (Joint Committee, 1981), por ser el pri-
Este movimiento estuvo vigente en paralelo al mero en dar una visi n met dica de la misma,
proceso de perfeccionamiento de los tests psico- superando desde el conductismo, muy en boga
l gicos con el desarrollo de la estad stica y del en el momento, la mera evaluaci n psicol gica.
an lisis factorial. El fervor por el testing de- Entre 1932 y 1940, en su famoso Eight-Year
creci a partir de los a os cuarenta e, incluso, Study of Secondary Education para la Progres-
empezaron a surgir algunos movimientos hiper- sive Education Association, publicado dos a os
cr ticos con estas pr cticas. despu s (Smith y Tyler, 1942), plantea la nece-
sidad de una evaluaci n cient fica que sirva
Guba y Lincoln (1989) se refieren a esta eva- para perfeccionar la calidad de la educaci n.
luaci n como a la primera generaci n, que puede La obra de s ntesis la publica unos a os des-
leg timamente ser denominada como la genera- pu s (Tyler, 1950), exponiendo de manera cla-
ci n de la medida. El papel del evaluador era ra su idea de curriculum , e integrando en l
t cnico, como proveedor de instrumentos de me- su m todo sistem tico de evaluaci n educativa,
dici n. Seg n estos autores, esta primera genera- como el proceso surgido para determinar en
ci n permanece todav a viva, pues todav a exis- qu medida han sido alcanzados los objetivos

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 14


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

previamente establecidos (v ase tambi n Tyler, ci n es m s amplia que el hacer expl cito este
1967 y 1969). cambio a los propios alumnos, padres y profe-
sores; es tambi n un medio para informar sobre
El curr culum viene delimitado por las cua- la eficacia del programa educacional y tambi n
tro cuestiones siguientes: de educaci n continua del profesor. Se trata,
seg n Guba y Lincoln (1989), de la segunda
a) Qu objetivos se desean conseguir?
generaci n de la evaluaci n. Desgraciadamen-
b) Con qu actividades se pueden alcanzar? te, esta visi n evaluativa global no fue
suficientemente apreciada, ni explotada, por
c) C mo pueden organizarse eficazmente aquellos que utilizaron sus trabajos (Bloom y
estas experiencias? otros, 1975; Guba y Lincoln, 1982).
d) C mo se puede comprobar si se alcanzan A pesar de lo anterior y de que las reformas
los objetivos? tylerianas no siempre se aplicaron de inmedia-
to, las ideas de Tyler fueron muy bien acogidas
Y la buena evaluaci n precisa de las siguientes por los especialistas en desarrollo curricular y
condiciones: por los profesores. Su esquema era racional y
a) Propuesta clara de objetivos. se apoyaba en una tecnolog a clara, f cil de
entender y aplicar (Guba y Lincoln, 1982;
b) Determinaci n de las situaciones en las House, 1989) y encajaba perfectamente en la
que se deben manifestar las conductas espera- racionalidad del an lisis de la tarea que comen-
das. zaba a usarse con xito en mbitos educativos
militares (Gagn , 1971). En Espa a, los plan-
c) Elecci n de instrumentos apropiados de teamientos de Tyler se extendieron con la Ley
evaluaci n. General de Educaci n de 1970.
d) Interpretaci n de los resultados de las Tras la Segunda Guerra Mundial se produce
pruebas. un periodo de expansi n y optimismo que Stuf-
flebeam y Shinkfield (1987) no han dudado en
e) Determinaci n de la fiabilidad y objetivi-
calificar de irresponsabilidad social , por el
dad de las medidas.
gran despilfarro consumista tras una poca de
Esta evaluaci n ya no es una simple medici n, recesi n. Se trata de la etapa conocida como la
porque supone un juicio de valor sobre la infor- de la inocencia (Madaus y otros, 1991). Se
maci n recogida. Se alude, aunque sin desarro- extienden mucho las instituciones y servicios
llar, a la toma de decisiones sobre los aciertos o educativos de todo tipo, se producen cantidad
fracasos de la programaci n, en funci n de los de tests estandarizados, se avanza en la tecno-
resultados de los alumnos, algo que retomar n log a de la medici n y en los principios estad s-
otros importantes evaluadores como Cronbach y ticos del dise o experimental (Gulliksen, 1950;
Sufflebeam unos a os despu s. Lindquist, 1953; Walberg y Haertel, 1990) y
aparecen las famosas taxonom as de los objeti-
Para Tyler, la referencia central en la evalua- vos educativos (Bloom y otros, 1956; Krath-
ci n son los objetivos preestablecidos, que deben wohl y otros, 1964). Sin embargo, en esta po-
ser cuidadosamente definidos en t rminos de ca, la aportaci n de la evaluaci n a la mejora
conducta (Mager, 1962), teniendo en cuenta que de la ense anza es escasa debido a la carencia
deben marcar el desarrollo individual del alum- de planes coherentes de acci n. Se escribe mu-
no, pero dentro de un proceso socializador. cho de evaluaci n, pero con escasa influencia
en el perfeccionamiento de la labor instruccio-
El objeto del proceso evaluativo es determinar nal. El verdadero desarrollo de las propuestas
el cambio ocurrido en los alumnos, pero su fun-

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 15


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

tylerianas vino despu s (Taba, 1962; Popham y nos. Para ello, es necesario interaccionar con
Baker, 1970; Fern ndez de Castro, 1973). ellos de manera m s frecuente y m s infor-
mal.
Ralph W. Tyler muri el 18 de febrero de
1994, superados los noventa a os de vida, tras Medio siglo despu s de que Tyler
siete d cadas de fruct feras aportaciones y servi- revolucionara el mundo de la evaluaci n
cios a la evaluaci n, a la investigaci n y a la edu- educativa, se observa la fortaleza, coherencia y
caci n en general. Unos meses antes, en abril de vigencia de su pensamiento. Como acabamos
1993, Pamela Perfumo, una estudiante graduada de ver, sus ideas b sicas, convenientemente
de la Universidad de Stanford, entrevist a Tyler actualizadas, se entroncan f cilmente en las
con el prop sito de conocer su pensamiento acer- corrientes m s actuales de la evaluaci n
ca del actual desarrollo de la evaluaci n y de los educativa.
temas controvertidos alrededor de la misma. Esta 4. El desarrollo de los sesenta
entrevista, convenientemente preparada, fue
presentada el 16 de abril de 1993 en la Conferen- Los a os sesenta traer n nuevos aires a la
cia de la AERA que tuvo lugar en Atlanta. evaluaci n educativa, entre otras cosas porque
Horowitz (1995) analiza el contenido y el signi- se empez a prestar inter s por algunas de las
ficado de la citada entrevista, destacando, entre llamadas de atenci n de Tyler, relacionadas
otros, los siguientes aspectos en el pensamiento con la eficacia de los programas y el valor in-
de Tyler al final de sus d as: tr nseco de la evaluaci n para la mejora de la
educaci n.
a) Necesidad de analizar cuidadosamente los
prop sitos de la evaluaci n, antes de ponerse a En esa poca surge un cierto conflicto entre
evaluar. Los actuales planteamientos de eva- la sociedad americana y su sistema educativo,
luaciones m ltiples y alternativas deben ajus- sobre todo porque los rusos iban por delante en
tarse a este principio la carrera especial, tras el lanzamiento del
Sputnik por la URSS en 1957. Aparece un cier-
b) El prop sito m s importante en la evalua- to desencanto con la escuela p blica y crece la
ci n de los alumnos es guiar su aprendizaje, presi n por la rendici n de cuentas (MacDo-
esto es, ayudarles a que aprendan. Para ello es nald, 1976; Stenhouse, 1984). En 1958 se pro-
necesaria una evaluaci n comprensiva de to- mulga una nueva ley de defensa educativa que
dos los aspectos significativos de su rendi- proporciona muchos programas y medios para
miento; no basta con asegurarse que hacen re- evaluarlos. En 1964 se establece el Acta de
gularmente el trabajo diario. educaci n primaria y secundaria (ESEA) y se
crea el National Study Comitte on Evaluation,
c) El portfolio es un instrumento valioso de cre ndose una nueva evaluaci n no s lo de
evaluaci n, pero depende de su contenido. En alumnos, sino orientada a incidir en los pro-
todo caso, hay que ser cauteloso ante la pre- gramas y en la pr ctica educativa global (Ma-
ponderancia de un solo procedimiento de eva- teo y otros, 1993; Rodr guez y otros, 1995).
luaci n, incluyendo el portfolio , por su in-
capacidad de abarcar todo el espectro de as- Para mejorar la situaci n y retomar la hege-
pectos evaluables. mon a cient fica y educativa, fueron muchos
los millones de d lares que desde los fondos
d) La verdadera evaluaci n debe ser idiosin- p blicos se destinaron a subvencionar nuevos
cr sica, adecuada a las peculiaridades del programas educativos e iniciativas del personal
alumno y el centro. En rigor, la comparaci n de las escuelas p blicas americanas encamina-
de centros no es posible. das a mejorar la calidad de la ense anza. (Po-
pham, 1983; Rutman y Mowbray, 1983; Weiss,
e) Los profesores deben rendir cuentas de su 1983). Este movimiento se vio tambi n poten-
acci n educativa ante los padres de los alum- ciado por el desarrollo de nuevos medios
tecnol gicos (audiovisuales, ordenadores...) y

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 16


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

nol gicos (audiovisuales, ordenadores...) y el de este movimiento de rendici n de cuentas, de


la ense anza programada, cuyas posibilidades responsabilidad escolar, diera lugar a una olea-
educativas despertaron el inter s entre los profe- da de protestas por parte del personal docente.
sionales de la educaci n (Rosenthal, 1976).
Otra dimensi n de la responsabilidad escolar
De la misma forma que la proliferaci n de nos la ofrece Popham (1980), cuando se refiere
programas sociales en la d cada anterior hab a al movimiento de descentralizaci n escolar
impulsado la evaluaci n de programas en el rea durante los ltimos a os sesenta y principios de
social, los a os sesenta ser n fruct feros en de- los setenta. Los grandes distritos escolares se
manda de evaluaci n en el mbito de la educa- dividieron en reas geogr ficas m s peque as,
ci n. Esta nueva din mica en la que entra la eva- y, por consiguiente, con un control ciudadano
luaci n, hace que, aunque sta se centraba en los m s directo sobre lo que ocurr a en las escue-
alumnos como sujeto que aprende, y el objeto de las.
valoraci n era el rendimiento de los mismos, sus
funciones, su enfoque y su ltima interpretaci n Como consecuencia de estos focos de in-
variar seg n el tipo de decisi n buscada. fluencia, se ampli considerablemente el fe-
n meno de la evaluaci n educativa. El sujeto
Buena parte de culpa de este fuerte mpetu eva- directo de la evaluaci n sigui siendo el alum-
luador americano se debi a la ya citada aproba- no, pero tambi n todos aquellos factores que
ci n de la Elementary and Secondary Act confluyen en el proceso educativo (el programa
(ESEA) en 1965 (Berk, 1981; Rutman, 1984). educativo en un sentido amplio, profesor, me-
Con esta ley se puso en marcha el primer pro- dios, contenidos, experiencias de aprendizaje,
grama significativo para la organizaci n de la organizaci n, etc.), as como el propio produc-
educaci n en el mbito federal de los Estados to educativo.
Unidos, y se estipul que cada uno de los pro-
yectos realizados con el apoyo econ mico fede- Como resultado de estas nuevas necesidades
ral deb a ser anualmente evaluado, a fin de justi- de la evaluaci n, se inicia durante esta poca
ficar subvenciones futuras. un periodo de reflexi n y de ensayos te ricos
con nimo de clarificar la multidimensionali-
Junto al desencanto de la escuela p blica, cabe dad del proceso evaluativo. Estas reflexiones
se alar la recesi n econ mica que caracteriza los te ricas enriquecer n decisivamente el mbito
finales a os sesenta, y, sobre todo, la d cada de conceptual y metodol gico de la evaluaci n, lo
los setenta. Ello hizo que la poblaci n civil, co- que unido a la tremenda expansi n de la eva-
mo contribuyentes, y los propios legisladores se luaci n de programas ocurrida durante estos
preocupasen por la eficacia y el rendimiento del a os, dar lugar al nacimiento de esa nueva
dinero que se empleaba en la mejora del sistema modalidad de investigaci n aplicada que hoy
escolar. A finales de los a os sesenta, y como denominamos como investigaci n evaluativa.
consecuencia de lo anterior, entra en escena un
nuevo movimiento, la era de la Accountability , Como hitos de la poca hay que destacar dos
de la rendici n de cuentas (Popham, 1980 y ensayos por su decisiva influencia: el art culo
1983; Rutman y Mowbray, 1983), que se asocia de Cronbach (1963), Course improvement
fundamentalmente a la responsabilidad del per- through evaluation, y el de Scriven (1967), The
sonal docente en el logro de objetivos educativos methodology of evaluation. La riqueza de ideas
establecidos. De hecho, en el a o 1973, la legis- evaluativas expuestas en estos trabajos nos
laci n de muchos estados americanos instituy la obligan a que, aunque brevemente, nos refira-
obligaci n de controlar el logro de los objetivos mos a ellas.
educativos y la adopci n de medidas correctivas
Del an lisis que Cronbach del concepto, fun-
en caso negativo (MacDonald, 1976; Wilson y
ciones y metodolog a de la evaluaci n, entresa-
otros, 1978). Es comprensible que, planteado as ,
camos las sugerencias siguientes:

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 17


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

a) Asociar el concepto de evaluaci n a la tudios de seguimientos, esto es, el camino


toma de decisiones. Distingue el autor tres ti- posterior seguido por los estudiantes que han
pos de decisiones educativas a las cuales la participado en el programa.
evaluaci n sirve: a) sobre el perfeccionamien-
to del programa y de la instrucci n, b) sobre f) Desde esta ptica, las t cnicas de eva-
los alumnos (necesidades y m ritos finales) y luaci n no pueden limitarse a los tests de
c) acerca de la regulaci n administrativa sobre rendimiento. Los cuestionarios, las entrevis-
la calidad del sistema, profesores, organiza- tas, la observaci n sistem tica y no sistem -
ci n, etc. De esta forma, Cronbach abre el tica, las pruebas de ensayo, seg n el autor,
campo conceptual y funcional de la evaluaci n ocupan un lugar importante en la evaluaci n,
educativa mucho m s all del marco concep- en contraste al casi exclusivo uso que se
tual dado por Tyler, aunque en su l nea de su- hac a de los tests como t cnicas de recogida
gerencias. de informaci n.

b) La evaluaci n que se usa para mejorar un Si estas reflexiones de Cronbach fueron im-
programa mientras ste se est aplicando, pactantes, no lo fueron menos las del ensayo de
contribuye m s al desarrollo de la educaci n Scriven (1967). Sus fecundas distinciones ter-
que la evaluaci n usada para estimar el valor minol gicas ampliaron enormemente el campo
del producto de un programa ya concluido. sem ntico de la evaluaci n, a la vez que clari-
ficaron el quehacer evaluativo. Destacamos a
c) Poner en cuesti n la necesidad de que los continuaci n las aportaciones m s significati-
estudios evaluativos sean de tipo comparativo. vas:
Entre las objeciones a este tipo de estudios, el
autor destaca el hecho de que, con frecuencia, a) Se establece de forma tajante la diferen-
las diferencias entre las puntuaciones prome- cia entre la evaluaci n como actividad me-
dio entre-grupos son menores que las intra- todol gica, lo que el autor llama meta de la
grupos, as como otras referentes a las dificul- evaluaci n, y las funciones de la evaluaci n
tades t cnicas que en el marco educativo pre- en un contexto particular. As , la evaluaci n
sentan los dise os comparativos. Cronbach como actividad metodol gica es esencial-
aboga por unos criterios de comparaci n de ti- mente igual, sea lo que fuera lo que estemos
po absoluto, reclamando la necesidad de una evaluando. El objetivo de la evaluaci n es
evaluaci n con referencia al criterio, al defen- invariante, supone en definitiva el proceso
der la valoraci n con relaci n a unos objetivos por el cual estimamos el valor de algo que se
bien definidos y no la comparaci n con otros eval a, mientras que las funciones de la eva-
grupos. luaci n pueden ser enormemente variadas.
Estas funciones se relacionan con el uso que
d) Se ponen en cuesti n los estudios a gran se hace de la informaci n recogida.
escala, puesto que las diferencias entre los tra-
tamientos pueden ser muy grandes e impedir b) Scriven se ala dos funciones distintas
discernir con claridad las causas de los resul- que puede adoptar la evaluaci n: la for-
tados. Se defienden los estudios m s anal ti- mativa y la sumativa. Propone el t rmino de
cos, bien controlados, que pueden usarse para evaluaci n formativa para calificar aquel
comparar versiones alternativas de un progra- proceso de evaluaci n al servicio de un pro-
ma. grama en desarrollo, con objeto de mejorar-
lo, y el t rmino de evaluaci n sumativa para
e) Metodol gicamente Cronbach propone aquel proceso orientado a comprobar la efi-
que la evaluaci n debe incluir: 1) estudios de cacia del programa y tomar decisiones sobre
proceso hechos que tienen lugar en el aula ; su continuidad.
2) medidas de rendimiento y actitudes
cambios observados en los alumnos y 3) es-

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 18


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

c) Otra importante contribuci n de Scriven no s lo analiza y describe la realidad, adem s,


es la cr tica al nfasis que la evaluaci n da a la la valora, la juzga con relaci n a distintos crite-
consecuci n de objetivos previamente estable- rios.
cidos, porque si los objetivos carecen de valor,
no tiene ning n inter s saber hasta qu punto Durante estos a os sesenta aparecen muchas
se han conseguido. Resalta la necesidad de que otras aportaciones que va perfilando una nueva
la evaluaci n debe incluir tanto la evaluaci n concepci n evaluativa, que terminar de des-
de los propios objetivos como el determinar el arrollarse y, sobre todo, de extenderse en las
grado en que stos han sido alcanzados (Scri- d cadas posteriores. Se percibe que el n cleo
ven, 1973 y 1974). conceptual de la evaluaci n lo constituye la
valoraci n del cambio ocurrido en el alumno
d) Clarificadora es tambi n la distinci n que como efecto de una situaci n educativa siste-
hace Scriven entre evaluaci n intr nseca y eva- m tica, siendo unos objetivos bien formulados
luaci n extr nseca, como dos formas diferen- el mejor criterio para valorar este cambio. As
tes de valorar un elemento de la ense anza. En mismo, se comienza a prestar atenci n no s lo
una evaluaci n intr nseca se valora el elemen- a los resultados pretendidos, sino tambi n a los
to por s mismo, mientras que en la evaluaci n efectos laterales o no pretendidos, e incluso a
extr nseca se valora el elemento por los efec- resultados o efectos a largo plazo (Cronbach,
tos que produce en los alumnos. Esta distin- 1963; Glaser, 1963; Scriven, 1967; Stake,
ci n resulta muy importante a la hora de con- 1967).
siderar el criterio a utilizar, pues en la evalua-
ci n intr nseca el criterio no se formula en A pesar de las voces cr ticas con la operativi-
t rminos de objetivos operativos, mientras que zaci n de objetivos (Eisner, 1967 y 1969; At-
s se hace en la evaluaci n extr nseca . kin, 1968), no s lo por la estructura de valor
que en ello subyace, sino tambi n por centrar la
e) Scriven adopta una posici n contraria a valoraci n del aprendizaje en los productos
Cronbach, defendiendo el car cter comparati- m s f cilmente mensurables, a veces los m s
vo que deben presentar los estudios de evalua- bajos en las taxonom as del dominio cognosci-
ci n. Admite con Cronbach los problemas t c- tivo, y de que se prestaba escasa atenci n a los
nicos que los estudios comparativos entra an y objetivos del dominio afectivo, que presentan
la dificultad de explicar las diferencias entre mayor dificultad de tratamiento operativo, el
programas, pero Scriven considera que la eva- modelo evaluativo de Tyler se enriquecer a
luaci n como opuesta a la mera descripci n mucho en estos a os, con trabajos sobre los
implica emitir un juicio sobre la superioridad o objetivos educativos que continuar an y perfec-
inferioridad de lo que se eval a con respecto a cionar an el camino emprendido en 1956 por
sus competidores o alternativas. Bloom y colaboradores (Mager, 1962 y 1973;
Lindvall, 1964; Krathwohl y otros, 1964; Gla-
Estas dos aportaciones comentadas influyeron ser, 1965; Popham, 1970; Bloom y otros, 1971;
decisivamente en la comunidad de evaluadores, Gagn 1971). Entre otras cosas aparecieron
incidiendo no s lo en estudios en la l nea de la nuevas ideas sobre la evaluaci n de la interac-
investigaci n evaluativa, a la que se refer an pre- ci n en el aula y sobre sus efectos en los logros
ferentemente, sino tambi n en la evaluaci n de los alumnos (Baker, 1969).
orientada al sujeto, en la l nea de evaluaci n co-
mo assessment (Mateo, 1986). Estamos ante la Stake (1967) propuso su modelo de evalua-
tercera generaci n de la evaluaci n que, seg n ci n, The countenance model, que sigue la l -
Guba y Lincoln (1989), se caracteriza por intro- nea de Tyler, pero es m s completo al conside-
ducir la valoraci n, el juicio, como un contenido rar las discrepancias entre lo observado y lo
intr nseco en la evaluaci n. Ahora el evaluador esperado en los antecedentes y transaccio-
nes , y posibilitar algunas bases para elaborar

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 19


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

hip tesis acerca de las causas y los fallos en los se ala para los primeros, adem s de los cono-
resultados finales. En sus sucesivas propuestas, cidos objetivos de describir la ejecuci n del
Stake se ir distanciando de sus posiciones ini- sujeto y tomar decisiones sobre si domina o no
ciales. domina un contenido, otro objetivo como es el
de valorar la eficacia de un programa.
Metfessell y Michael (1967) presentaron tam-
bi n un modelo de evaluaci n de la efectividad Desde finales de los sesenta los especialistas
de un programa educativo en el cual, a n si- se pronunciar n decisivamente a favor de la
guiendo el modelo b sico de Tyler, propon an la evaluaci n criterial, en cuanto que es el tipo de
utilizaci n de una lista comprensiva de criterios evaluaci n que suministra una informaci n real
diversos que los evaluadores podr an tener en y descriptiva del estatus del sujeto o sujetos
cuenta en el momento de la valoraci n y, por respecto a los objetivos de ense anza previstos,
consiguiente, no centrarse meramente en los co- as como la valoraci n de ese estatus por com-
nocimientos intelectuales alcanzados por los paraci n con un est ndar o criterio de realiza-
alumnos. ciones deseables, siendo irrelevantes, al efecto
de contraste, los resultados obtenidos por otros
Suchman (1967) profundiza en la convicci n sujetos o grupo de sujetos (Popham, 1970 y
de que la evaluaci n debe basarse en datos obje- 1983; Mager, 1973; Carre o, 1977; Gronlund,
tivos que sean analizados con metodolog a cien- 1985).
t fica, matizando que la investigaci n cient fica
es preferentemente te rica y, en cambio, la inves- En las pr cticas evaluativas de esta d cada de
tigaci n evaluativa es siempre aplicada. Su prin- los sesenta se observan dos niveles de actua-
cipal prop sito es descubrir la efectividad, xito ci n. Un nivel podemos calificarlo como la
o fracaso de un programa al compararlo con los evaluaci n orientada hacia los individuos,
objetivos propuestos y, as , trazar las l neas de su fundamentalmente alumnos y profesores. El
posible redefinici n. Esta investigaci n evaluati- otro nivel, es el de la evaluaci n orientada a la
va para Suchman debe tener en cuenta: a) la na- toma de decisiones sobre el instrumento o
turaleza del destinatario del objetivo y la del pro- tratamiento o programa educativo. Este
pio objetivo, b) el tiempo necesario para que se ltimo nivel, impulsado tambi n por la evalua-
realice el cambio propuesto, c) el conocimiento ci n de programas en el mbito social, ser la
de si los resultados esperados son dispersos o base para la consolidaci n en el terreno educa-
concentrados y d) los m todos que han de em- tivo de la evaluaci n de programas y de la in-
plearse para alcanzar los objetivos. Suchman, vestigaci n evaluativa.
adem s, defiende la utilizaci n de evaluadores
externos para evitar todo tipo de tergiversaci n . Desde los a os setenta: La consolida-
de los profesores muy implicados en los procesos ci n de la investigaci n evaluativa
instruccionales.
Si con algo se podr a caracterizar las aporta-
El nfasis en los objetivos y su medida traer ciones te ricas que nos ofrecen los especialis-
tambi n la necesidad de una nueva orientaci n a tas durante los a os setenta es con la prolifera-
la evaluaci n, la denominada evaluaci n de refe- ci n de toda clase de modelos evaluativos que
rencia criterial. La distinci n introducida por inundan el mercado bibliogr fico, modelos de
Glaser (1963) entre mediciones referidas a nor- evaluaci n que expresan la propia ptica del
mas y criterios tendr eco al final de la d cada de autor que los propone sobre qu es y c mo de-
los sesenta, precisamente como resultado de las be conducirse un proceso evaluativo. Se trata,
nuevas exigencias que a la evaluaci n educativa por tanto, de una poca caracterizada por la
se le planteaban. As , por ejemplo, cuando Ham- pluralidad conceptual y metodol gica. Guba y
bleton (1985) estudia las diferencias entre tests Lincoln (1982) nos hablan de m s de cuarenta
referidos al criterio y tests referidos a la norma, modelos propuestos en estos a os, y Mateo

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 20


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

(1986) se refiere a la eclosi n de modelos. Estos Metas . Adem s de los ya citados de Stake y
enriquecer n considerablemente el vocabulario Metfessell y Michael, que corresponden a los
evaluativo, sin embargo, compartimos la idea de ltimos a os sesenta, en esta poca destacan la
Popham (1980) de que algunos son demasiado propuesta de Hammond (1983) y el Modelo de
complicados y otros utilizan una jerga bastante Discrepancia de Provus (1971). Para estos au-
confusa. tores los objetivos propuestos siguen siendo el
criterio fundamental de valoraci n, pero enfati-
Algunos autores como Guba y Lincoln (1982), zan la necesidad de aportar datos sobre la con-
P rez (1983) y en alguna medida House (1989), gruencia o discrepancia entre las pautas de ins-
tienden a clasificar estos modelos en dos grandes trucci n dise adas y la ejecuci n de las mismas
grupos, cuantitativos y cualitativos, pero nosotros en la realidad del aula.
pensamos con Nevo (1983) y Cabrera (1986) que
la situaci n es mucho m s rica en matices. Otros modelos consideran el proceso de eva-
luaci n al servicio de las instancias que deben
Es cierto que esas dos tendencias se observan tomar decisiones. Ejemplos notables de ellos
hoy en las propuestas evaluativas, y que algunos son: probablemente el m s famoso y utilizado
modelos pueden ser representativos de ellas, pero de todos, el C.I.P.P. (contexto, input, proceso y
los diferentes modelos, considerados particular- producto), propuesto por Stufflebeam y colabo-
mente, se diferencian m s por destacar o enfati- radores (1971) y el C.E.S. (toma sus siglas del
zar alguno o algunos de los componentes del Centro de la Universidad de California para el
proceso evaluativo y por la particular interpreta- Estudio de la Evaluaci n) dirigido por Alkin
ci n que a este proceso le dan. Es desde esta (1969). La aportaci n conceptual y metodol -
perspectiva, a nuestro entender, como los dife- gica de estos modelos es valorada positivamen-
rentes modelos deben ser vistos, y valorar as sus te entre la comunidad de evaluadores (Popham,
respectivas aportaciones en los terrenos concep- 1980; Guba y Lincoln, 1982; House, 1989).
tual y metodol gico (Worthen y Sanders, 1973; Estos autores van m s all de la evaluaci n
Stufflebeam y Shinkfield, 1987; Arnal y otros, centrada en resultados finales, puesto que en
1992; Scriven, 1994). sus propuestas suponen diferentes tipos de eva-
luaci n, seg n las necesidades de las decisio-
Tambi n son varios los autores (Lewy, 1976;
nes a las que sirven.
Popham, 1980; Cronbach, 1982; Anderson y
Ball, 1983; De la Orden, 1985) los que conside- Una segunda poca en la proliferaci n de
ran los modelos no como excluyentes, sino m s modelos es la representada por los modelos
bien como complementarios y que el estudio de alternativos, que con diferentes concepciones
los mismos (al menos aquellos que han resultado de la evaluaci n y de la metodolog a a seguir
ser m s pr cticos) llevar al evaluador a adoptar comienzan a aparecer en la segunda mitad de
una visi n m s amplia y comprensiva de su tra- esta d cada de los setenta. Entre ellos destacan
bajo. Nosotros, en alg n momento nos hemos la Evaluaci n Responsable de Stake (1975 y
atrevido a hablar de enfoques mod licos, m s 1976), a la que se adhieren Guba y Lincoln
que de modelos, puesto que es cada evaluador el (1982), la Evaluaci n Democr tica de Mac-
que termina construyendo su propio modelo en Donald (1976), la Evaluaci n Iluminativa de
cada investigaci n evaluativa, en funci n del tipo Parlett y Hamilton (1977) y la Evaluaci n co-
de trabajo y las circunstancias (Escudero, 1993). mo cr tica art stica de Eisner (1985).
En este movimiento de propuestas de modelos En l neas generales, este segundo grupo de
de evaluaci n cabe distinguir dos pocas con modelos evaluativos enfatiza el papel de la
marcadas diferencias conceptuales y metodol gi- audiencia de la evaluaci n y de la relaci n del
cas. En una primera poca, las propuestas segu - evaluador con ella. La audiencia prioritaria de
an la l nea expuesta por Tyler en su planteamien- la evaluaci n en estos modelos no es quien
to, que ha venido a llamarse de Consecuci n de

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 21


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

debe tomar las decisiones, como en los modelos tados a la toma de decisiones: la evaluaci n
orientados a la toma de decisiones, ni el respon- como el proceso de determinar, obtener y
sable de elaborar los curr culos u objetivos, como proporcionar informaci n relevante para
en los modelos de consecuci n de metas. La au- juzgar decisiones alternativas, defendida por
diencia prioritaria son los propios participantes Alkin (1969), Stufflebeam y otros (1971),
del programa. La relaci n entre el evaluador y la MacDonald (1976) y Cronbach (1982).
audiencia en palabras de Guba y Lincoln (1982)
debe ser transaccional y fenomenol gica . Se Adem s, el concepto de evaluaci n de Scri-
trata de modelos que propugnan una evaluaci n ven (1967), como el proceso de estimar el
de tipo etnogr fica, de aqu que la metodolog a valor o el m rito de algo, es retomado por
que consideran m s adecuada es la propia de la Cronbach (1982), Guba y Lincoln (1982), y
antropolog a social (Parlett y Hamilton, 1977; House (1989), con objeto de se alar las dife-
Guba y Lincoln, 1982; P rez 1983). rencias que comportar an los juicios valora-
tivos en caso de estimar el m rito (se vincu-
Este resumen de modelos de la poca de eclo- lar a a caracter sticas intr nsecas de lo que se
si n es suficiente para aproximarnos al amplio eval a) o el valor (se vincular a al uso y
abanico conceptual te rico y metodol gico que aplicaci n que tendr a para un contexto de-
hoy se relaciona con la evaluaci n. Ello explica terminado).
que cuando Nevo (1983 y 1989) pretende realizar
una conceptualizaci n de la evaluaci n, a partir b) Diferentes criterios. De las definiciones
de la revisi n de la literatura especializada, aten- apuntadas anteriormente se desprende que el
diendo a los t picos qu es la evaluaci n? qu criterio a utilizar para la valoraci n de la in-
funciones tiene? cu l es el objeto de evalua- formaci n tambi n cambia. Desde la ptica
ci n?... no encuentra una nica respuesta a estas de la consecuci n de metas, una buena y
cuestiones. Es f cilmente comprensible que las operativa definici n de los objetivos consti-
exigencias que plantea la evaluaci n de progra- tuye el criterio fundamental. Desde la pers-
mas de una parte, y la evaluaci n para la toma de pectiva de las decisiones y situados dentro
decisiones sobre los individuos de otra, conducen de un contexto pol tico, Stufflebeam y cola-
a una gran variedad de esquemas evaluativos boradores, Alkin y MacDonald llegan a su-
reales utilizados por profesores, directores, ins- gerir incluso la no valoraci n de la informa-
pectores y administradores p blicos. Pero tam- ci n por parte del evaluador, siendo el que
bi n es cierto que bajo esta diversidad subyacen toma las decisiones el responsable de su va-
diferentes concepciones te ricas y metodol gicas loraci n.
sobre la evaluaci n. Diferentes concepciones que
Las definiciones de evaluaci n que acent -
han dado lugar a una apertura y pluralidad con-
an la determinaci n del m rito como obje-
ceptual en el mbito de la evaluaci n en varios
tivo de la evaluaci n, utilizan criterios es-
sentidos (Cabrera, 1986). A continuaci n desta-
t ndares sobre los que los expertos o profe-
camos los puntos mas sobresalientes de esta plu-
sionales est n de acuerdo. Se trata de mode-
ralidad conceptual.
los relacionados con la acreditaci n y el en-
a) Diferentes conceptos de evaluaci n. Por juiciamiento profesional (Popham, 1980).
una parte existe la cl sica definici n dada por
Los autores (Stake, 1975; Parlett y Hamil-
Tyler: la evaluaci n como el proceso de de-
ton, 1977; Guba y Lincoln, 1982; House,
terminar el grado de congruencia entre las
1983) que acent an el proceso de evaluaci n
realizaciones y los objetivos previamente es-
al servicio de determinar el valor m s que
tablecidos, a la que corresponden los modelos
el m rito de la entidad u objeto evaluado,
orientados hacia la consecuci n de metas.
abogan por que el criterio de valoraci n fun-
Contrasta esta definici n con aquella m s am-
damental sean las necesidades contextuales
plia que se propugna desde los modelos orien-
en las que sta se inserta. As , Guba y Lin-

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 22


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

coln (1982) refieren los t rminos de la compa- g) Diferencias en el papel jugado por el
raci n valorativa; de un lado, las caracter sti- evaluador, lo que ha venido a llamarse eva-
cas del objeto evaluado y, de otro, las necesi- luaci n interna vs. evaluaci n externa. No
dades, expectativas y valores del grupo a los obstante, una relaci n directa entre el eva-
que les afecta o con los que se relaciona el ob- luador y las diferentes audiencias de la eva-
jeto evaluado. luaci n es reconocida por la mayor a de los
autores (Nevo, 1983; Weiss, 1983; Rutman,
c) Pluralidad de procesos evaluativos de- 1984).
pendiendo de la percepci n te rica que sobre
la evaluaci n se mantenga. Los modelos de h) Pluralidad de audiencia de la evalua-
evaluaci n citados y otros m s que pueden en- ci n y, por consiguiente, pluralidad en los
contrarse en la bibliograf a, representan dife- informes de evaluaci n. Desde informes na-
rentes propuestas para conducir una evalua- rrativos, informales, hasta informes muy es-
ci n. tructurados (Anderson y Ball, 1983).
d) Pluralidad de objetos de evaluaci n. Co- i) Pluralidad metodol gica. Las cuestiones
mo dice Nevo (1983 y 1989), existen dos con- metodol gicas surgen desde la dimensi n de
clusiones importantes que se obtienen de la la evaluaci n como investigaci n evaluativa,
revisi n de la bibliograf a sobre la evaluaci n. que viene definida en gran medida por la di-
Por un lado, cualquier cosa puede ser objeto versidad metodol gica.
de evaluaci n y sta no deber a limitarse a es-
tudiantes y profesores y, por otro, una clara El anterior resumen recoge las aportaciones
identificaci n del objeto de evaluaci n es una a la evaluaci n en los a os setenta y ochenta, la
importante parte en cualquier dise o de eva- poca que se ha denominado poca de la pro-
luaci n. fesionalizaci n (Stufflebeam y Skinkfield,
1987; Madaus y otros, 1991; Hern ndez, 1993;
e) Apertura, reconocida en general por todos Mateo y otros, 1993), en la que adem s de los
los autores, de la informaci n necesaria en un innumerables modelos de los setenta, se pro-
proceso evaluativo para dar cabida no s lo a fundiz en los planteamientos te ricos y pr c-
los resultados pretendidos, sino a los efectos ticos y se consolid la evaluaci n como inves-
posibles de un programa educativo, sea pre- tigaci n evaluativa en los t rminos antes defi-
tendido o no. Incluso Scriven (1973 y 1974) nida. En este contexto, l gicamente, aparecen
propone una evaluaci n en la que no se tenga muchas nuevas revistas especializadas como
en cuenta los objetivos pretendidos, sino valo- Educational Evaluation and Policy Analysis,
rar todos los efectos posibles. Apertura tam- Studies in Evaluation, Evaluation Review, New
bi n respecto a la recogida de informaci n no Directions for Program Evaluation, Evaluation
s lo del producto final, sino tambi n sobre el and Program Planning, Evaluation News,..., se
proceso educativo. Y apertura en la considera- fundan asociaciones cient ficas relacionadas
ci n de diferentes resultados de corto y largo con el desarrollo de la evaluaci n y las univer-
alcance. Por ltimo, apertura tambi n en con- sidades empiezan a ofrecer cursos y programas
siderar no s lo resultados de tipo cognitivo, de investigaci n evaluativa, no s lo en post-
sino tambi n afectivos (Anderson y Ball, grados y programas de doctorado, sino tambi n
1983). en planes de estudio para titulaciones de primer
y segundo ciclos.
f) Pluralidad tambi n reconocida de las fun-
ciones de la evaluaci n en el mbito educati- . La cuarta generaci n seg n Guba y
vo, recogi ndose la propuesta de Scriven entre Lincoln
evaluaci n formativa y sumativa, y a adi ndo-
se otras de tipo socio-pol tico y administrati- A finales de los ochenta, tras todo este
vas (Nevo, 1983). desarrollo antes descrito, Guba y Lincoln
(1989) ofrecen una alternativa evaluadora, que
Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 23
Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

ofrecen una alternativa evaluadora, que denomi- b) Para llevar a cabo lo anterior se necesita
nan cuarta generaci n, pretendiendo superar lo una postura de descubrimiento m s que de
que seg n estos autores son deficiencias de las verificaci n, t pica del positivismo.
tres generaciones anteriores, tales como una vi-
si n gestora de la evaluaci n, una escasa aten- c) No se tienen en cuenta suficientemente
ci n al pluralismo de valores y un excesivo ape- los factores contextuales.
go al paradigma positivista. La alternativa de
d) No se proporcionan medios para valora-
Guba y Lincoln la denominan respondente y
ciones caso por caso.
constructivista, integrando de alguna manera el
enfoque respondente propuesto en primer lugar e) La supuesta neutralidad de la metodolo-
por Stake (1975), y la epistemolog a postmoder- g a convencional es de dudosa utilidad
na del constructivismo (Russell y Willinsky, cuando se buscan juicios de valor acerca de
1997). Las demandas, las preocupaciones y los un objeto social.
asuntos de los implicados o responsables (stake-
holders) sirven como foco organizativo de la Partiendo de estas premisas, el evaluador es
evaluaci n (como base para determinar qu in- responsable de determinadas tareas, que reali-
formaci n se necesita), que se lleva a cabo dentro zar secuencialmente o en paralelo, constru-
de los planteamientos metodol gicos del para- yendo un proceso ordenado y sistem tico de
digma constructivista. trabajo. Las responsabilidades b sicas del eva-
luador de la cuarta generaci n son las siguien-
La utilizaci n de las demandas, preocupaciones tes:
y asuntos de los implicados es necesaria, seg n
Guba y Lincoln, porque: 1) Identificar todos los implicados con
riesgo en la evaluaci n.
a) Son grupos de riesgo ante la evaluaci n y
sus problemas deben ser convenientemente 2) Resaltar para cada grupo de implicados
contemplados, de manera que se sientan pro- sus construcciones acerca de lo evaluado y
tegidos ante tal riesgo. sus demandas y preocupaciones al respecto.

b) Los resultados pueden ser utilizados en su 3) Proporcionar un contexto y una metodo-


contra en diferentes sentidos, sobre todo si es- log a hermen utica para poder tener en cuen-
t n al margen del proceso. ta, comprender y criticar las diferentes cons-
trucciones, demandas y preocupaciones.
c) Son potenciales usuarios de la informa-
ci n resultante de la evaluaci n. 4) Generar el m ximo acuerdo posible
acerca de dichas construcciones, demandas y
d) Pueden ampliar y mejorar el rango de la preocupaciones.
evaluaci n.
5) Preparar una agenda para la negociaci n
e) Se produce una interacci n positiva entre acerca de temas no consensuados.
los distintos implicados.
6) Recoger y proporcionar la informaci n
El cambio paradigm tico lo justifican estos necesaria para la negociaci n.
autores porque:
7) Formar y hacer de mediador para un
a) La metodolog a convencional no contem- forum de implicados para la negociaci n.
pla la necesidad de identificar las demandas,
preocupaciones y asuntos de los implicados. 8) Desarrollar y elaborar informes para ca-
da grupo de implicados sobre los distintos
acuerdos y resoluciones acerca de los intere-

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 24


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

ses propios y de los de otros grupos (Stake, Consecuci n de facilidades y acceso a la


1986; Zeller, 1987). informaci n (Lincoln y Guba, 1985).
9) Reciclar la evaluaci n siempre que queden 3) Identificaci n de las audiencias (Guba y
asuntos pendientes de resoluci n. Lincoln, 1982).
La propuesta de Guba y Lincoln (1989) se ex- Agentes.
tiende bastante en la explicaci n de la naturaleza
y caracter sticas del paradigma constructivista en Beneficiarios.
contraposici n con las del positivista.
Victimas.
Cuando se habla de los pasos o fases de la eva-
4) Desarrollo de construcciones conjuntas
luaci n en esta cuarta generaci n, sus proponen-
dentro de cada grupo o audiencia (Glaser y
tes citan doce pasos o fases, con diferentes subfa-
Strauss, 1967; Glaser, 1978; Lincoln y Gu-
ses en cada una de estas. Estos pasos son los si-
ba, 1985).
guientes:
5) Contraste y desarrollo de las construc-
1) Establecimiento de un contrato con un pa-
ciones conjuntas de las audiencias.
trocinador o cliente.
Documentos y registros.
Identificaci n del cliente o patrocinador
de la evaluaci n. Observaci n.
Identificaci n del objeto de la evaluaci n. Literatura profesional.
Prop sito de la evaluaci n (Guba y Lin- C rculos de otras audiencias.
coln, 1982).
Construcci n tica del evaluador.
Acuerdo con el cliente por el tipo de eva-
luaci n. 6) Clasificaci n de las demandas, preocu-
paciones y asuntos resueltos.
Identificaci n de audiencias.
7) Establecimiento de prioridades en los
Breve descripci n de la metodolog a a temas no resueltos.
usar.
8) Recogida de informaci n.
Garant a de acceso a registros y documen-
tos. 9) Preparaci n de la agenda para la nego-
ciaci n.
Acuerdo por garantizar la confidenciali-
dad y anonimato hasta donde sea posible. 10) Desarrollo de la negociaci n.

Descripci n del tipo de informe a elabo- 11) Informes (Zeller, 1987; Licoln y Guba,
rar. 1988).

Listado de especificaciones t cnicas. 12) Reciclado/revisi n.

2) Organizaci n para reciclar la investiga- Para juzgar la calidad de la evaluaci n, se


ci n. nos ofrecen tres enfoques que se denominan
paralelo, el ligado al proceso hermen utico y
Selecci n y entrenamiento del equipo eva- el de autenticidad.
luador.

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 25


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

Los criterios paralelos, de confianza, se deno- b) La evaluaci n es un proceso conjunto de


minan as porque intentan ser paralelos a los cri- colaboraci n.
terios de rigor utilizados muchos a os dentro del
paradigma convencional. Estos criterios han sido c) la evaluaci n es un proceso de ense an-
validez interna y externa, fiabilidad y objetivi- za/aprendizaje.
dad. Sin embargo, los criterios deban ser acordes
d) La evaluaci n es un proceso continuo,
con el paradigma fundamentador (Morgan,
recursivo y altamente divergente.
1983). En el caso de la cuarta generaci n los
criterios que se ofrecen son los de credibilidad, e) La evaluaci n es un proceso emergente.
transferencia, dependencia y confirmaci n (Lin-
coln y Guba, 1986). f) La evaluaci n es un proceso con resul-
tados impredecibles.
El criterio de credibilidad es paralelo al de va-
lidez interna, de forma que la idea de isomorfis- g) La evaluaci n es un proceso que crea
mo entre los hallazgos y la realidad se reemplaza realidad.
por el isomorfismo entre las realidades construi-
das de las audiencias y las reconstrucciones del En esta evaluaci n, se retienen las caracter s-
evaluador atribuidas a ellas. Para conseguir esto ticas del evaluador fruto de las tres primeras
existen varias t cnicas, entre las que destacan las generaciones, esto es, la de t cnico, la de ana-
siguientes: a) el compromiso prolongado, b) la lista y la de juez, pero estas deben ampliarse
observaci n persistente, c) el contraste con cole- con destrezas para recoger e interpretar datos
gas, d) el an lisis de casos negativos (Kidder, cualitativos (Patton, 1980), con la de historia-
1981), e) la subjetividad progresiva y f) el con- dor e iluminador, con la de mediador de jui-
trol de los miembros. La transferencia puede cios, as como un papel m s activo como eva-
verse como paralela a la validez externa, la de- luador en un contexto socio-pol tico concreto.
pendencia es paralela al criterio de fiabilidad y la Russell y Willinsky (1997) defienden las po-
confirmaci n puede verse como paralela a la tencialidades del planteamiento de la cuarta
objetividad. generaci n para desarrollar formulaciones al-
Otra manera de juzgar la calidad de la evalua- ternativas de pr ctica evaluadora entre los im-
ci n es el an lisis dentro del propio proceso, algo plicados, incrementando la probabilidad de que
que encaja con el paradigma hermen utico, a la evaluaci n sirva para mejorar la ense anza
trav s de un proceso dial ctico. escolar. Esto requiere por parte del profesorado
el reconocimiento de otras posiciones, adem s
Pero estos dos tipos de criterios, aunque tiles, de la suya, la implicaci n de todos desde el
no son del todo satisfactorios para Guba y Lin- principio del proceso y, por otra parte, el desa-
coln, que defienden con m s ah nco los criterios rrollo de aproximaciones m s pragm ticas de
que denominan de autenticidad, tambi n de base la conceptualizaci n de Guba y Lincoln, adap-
constructivista. Estos criterios incluyen los si- tadas a las distintas realidades escolares.
guientes: a) imparcialidad, justicia, b) autentici-
dad ontol gica, c) autenticidad educativa, d) au- 7. El nuevo impulso alrededor de Stuf-
tenticidad catal tica y e) autenticidad t ctica flebeam
(Lincoln y Guba, 1986).
Para terminar este recorrido anal tico-
Este an lisis de la cuarta generaci n de pode- hist rico desde los primeros intentos de medi-
mos terminarlo con los rasgos con los que defi- ci n educativa hasta la actual investigaci n
nen Guba y Lincoln a la evaluaci n: evaluativa en educaci n, queremos recoger las
recomendaciones que m s recientemente nos
a) La evaluaci n es un proceso sociopol tico. viene ofreciendo una de las figuras se eras de
este campo en la segunda mitad del siglo XX.

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 26


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

Nos estamos refiriendo a Daniel L. Stufflebeam, Para evaluar la educaci n en una sociedad
proponente del modelo CIPP (el m s utilizado) a moderna, Stufflebeam (1994) nos dice que se
finales de los sesenta, desde 1975 a 1988 presi- deben tomar algunos criterios b sicos de refe-
dente del Joint Committee on Standars for Edu- rencia como los siguientes:
cational Evaluation y actual director del Eva-
luation Center de la Western Michigan Univer- Las necesidades educativas. Es necesario
sity (sede del Joint Committee) y del CREATE preguntarse si la educaci n que se propor-
(Center for Research on Educational Accounta- ciona cubre las necesidades de los estudian-
bility and Teacher Evaluation), centro auspiciado tes y de sus familias en todos los terrenos a
y financiado por el Departamento de Educaci n la vista de los derechos b sicos, en este caso,
del gobierno americano. dentro de una sociedad democr tica (Nowa-
kowski y otros, 1985).
Recogiendo estas recomendaciones (Stuffle-
beam, 1994, 1998, 1999, 2000 y 2001), en las La equidad. Hay que preguntarse si el sis-
que se han ido integrando ideas de diversos eva- tema es justo y equitativo a la hora de pro-
luadores tambi n notables, no s lo ofrecemos porcionar servicios educativos, el acceso a
una de las ltimas aportaciones a la actual con- los mismos, la consecuci n de metas, el de-
cepci n de la investigaci n evaluativa en educa- sarrollo de aspiraciones y la cobertura para
ci n, sino que completamos en buena medida la todos los sectores de la comunidad (Kella-
visi n del panorama actual, rico y plural, tras gan, 1982).
analizar la cuarta generaci n de Guba y Lincoln.
La factibilidad. Hay que cuestionar la efi-
Se parte de los cuatro principios del Joint ciencia en la utilizaci n y distribuci n de re-
Committee (1981 y 1988), esto es, de la idea de cursos, la adecuaci n y viabilidad de las
que cualquier buen trabajo de investigaci n eva- normas legales, el compromiso y participa-
luativa debe ser: a) til, esto es, proporcionar ci n de los implicados y todo lo que hace
informaci n a tiempo e influir, b) factible, esto que el esfuerzo educativo produzca el
es, debe suponer un esfuerzo razonable y debe m ximo de frutos posibles.
ser pol ticamente viable, c) apropiada, adecua-
La excelencia como objetivo permanente
da, leg tima, esto es, tica y justa con los impli-
de b squeda. La mejora de la calidad, a par-
cados, y d) segura y precisa a la hora de ofrecer
tir del an lisis de las pr cticas pasadas y pre-
informaci n y juicios sobre el objeto de la eva-
sentes es uno de los fundamentos de la in-
luaci n. Adem s, la evaluaci n se ve como una
vestigaci n evaluativa.
transdisciplina , pues es aplicable a muchas
disciplinas diferentes y a muchos objetos diver- Tomando el referente de estos criterios y sus
sos (Scriven, 1994). derivaciones, Stufflebeam sumariza una serie
de recomendaciones para llevar a cabo buenas
Stufflebeam invoca a la responsabilidad del investigaciones evaluativas y mejorar el siste-
evaluador, que debe actuar de acuerdo a princi-
ma educativo. Estas recomendaciones son las
pios aceptados por la sociedad y a criterios de
siguientes:
profesionalidad, emitir juicios sobre la calidad y
el valor educativo del objeto evaluado y debe 1) Los planes de evaluaci n deben satisfa-
asistir a los implicados en la interpretaci n y cer los cuatro requerimientos de utilidad,
utilizaci n de su informaci n y sus juicios. Sin factibilidad, legitimidad y precisi n (Joint
embargo, es tambi n su deber, y su derecho, estar Committee, 1981 y 1988).
al margen de la lucha y la responsabilidad pol ti-
ca por la toma de decisiones y por las decisiones 2) Las entidades educativas deben
tomadas. examinarse por su integraci n y servicio a
los principios de la sociedad democr tica,
equidad, bienestar, etc.

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 27


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

3) Las entidades educativas deben ser valo- 9) La evaluaci n del contexto (necesida-
radas tanto por su m rito (valor intr nseco, ca- des, oportunidades, problemas en un rea,...)
lidad respecto a criterios generales) como por debe emplearse de manera prospectiva, para
su valor (valor extr nseco, calidad y servicio localizar bien las metas y objetivos y definir
para un contexto particular) (Guba y Lincoln, prioridades. Asimismo, la evaluaci n del
1982; Scriven, 1991), como por su significa- contexto debe utilizarse retrospectivamente,
ci n en la realidad del contexto en el que se para juzgar bien el valor de los servicios y
ubica. Scriven (1998) nos se ala que usando resultados educativos, en relaci n con las
otras denominaciones habituales, m rito tiene necesidades de los estudiantes (Madaus y
bastante equivalencia con el t rmino calidad, otros, 1991; Scriven, 1991)
valor con el de relaci n coste-eficacia y signi-
ficaci n con el de importancia. En todo caso, 10) La evaluaci n de las entradas (inputs)
los tres conceptos son dependientes del con- debe emplearse de manera prospectiva, para
texto, sobre todo significaci n, de manera que asegurar el uso de un rango adecuado de en-
entender la diferencia entre dependencia del foques seg n las necesidades y los planes.
contexto y arbitrariedad es parte de la com-
11) La evaluaci n del proceso debe usarse
prensi n de la l gica de la evaluaci n.
de manera prospectiva para mejorar el plan
4) La evaluaci n de profesores, instituciones de trabajo, pero tambi n de manera retros-
educativas, programas, etc, debe relacionarse pectiva para juzgar hasta qu punto la cali-
siempre con el conjunto de sus deberes, res- dad del proceso determina el por qu los re-
ponsabilidades y obligaciones profesionales o sultados son de un nivel u otro (Stufflebean
institucionales, etc. Quiz s uno de los retos y Shinkfield, 1987).
que deben abordar los sistemas educativos es
12) La evaluaci n del producto es el medio
la definici n m s clara y precisa de estos de-
para identificar los resultados buscados y no
beres y responsabilidades. Sin ello, la eva-
buscados en los participantes o afectados por
luaci n es problem tica, incluso en el terreno
el objeto evaluado. Se necesita una valora-
formativo (Scriven, 1991a).
ci n prospectiva de los resultados para
5) Los estudios evaluativos deben ser capa- orientar el proceso y detectar zonas de nece-
ces de valorar hasta qu medida los profesores sidades. Se necesita una evaluaci n retros-
y las instituciones educativas son responsables pectiva del producto para poder juzgar en
y rinden cuentas del cumplimiento de sus de- conjunto el m rito y el valor del objeto eva-
beres y obligaciones profesionales (Scriven, luado (Scriven, 1991; Webster y Edwards,
1994). 1993; Webster y otros, 1994).

6) Los estudios evaluativos deben proporcio- 13) Los estudios evaluativos se deben apo-
nar direcciones para la mejora, porque no bas- yar en la comunicaci n y en la inclusi n sus-
ta con emitir un juicio sobre el m rito o el va- tantiva y funcional de los implicados (stake-
lor de algo. holders) con las cuestiones claves, criterios,
hallazgos e implicaciones de la evaluaci n,
7) Recogiendo los puntos anteriores, todo es- as como en la promoci n de la aceptaci n y
tudio evaluativo debe tener un componente el uso de sus resultados (Chelimsky, 1998).
formativo y otro sumativo. M s a n, los estudios evaluativos deben
conceptualizarse y utilizarse
8) Se debe promover la autoevaluaci n pro- sistem ticamente como parte del proceso de
fesional, proporcionando a los educadores las mejora educativa a largo plazo (Alkin y
destrezas para ello y favoreciendo actitudes otros, 1979; Joint Committee, 1988; Stronge
positivas hacia ella (Madaus y otros, 1991) y Helm, 1991; Keefe, 1994) y de
fundamento para la acci n contra las
discriminaciones sociales (Mertens, 1999).
Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 28
Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

(Mertens, 1999). La evaluaci n para el desa- l gico desde el que se parte, pero apareciendo
rrollo (empowerment evaluation), que defien- claros y contundentes algunos elementos co-
de Fetterman (1994), es un procedimiento, de munes a todas las perspectivas como la contex-
base democr tica, de participaci n de los im- tualizaci n, el servicio a la sociedad, la diver-
plicados en el programa evaluado, para pro- sidad metodol gica, la atenci n, respeto y par-
mover la autonom a de los mismos en la reso- ticipaci n de los implicados, etc., as como una
luci n de sus problemas. Weiss (1998) nos mayor profesionalizaci n de los evaluadores y
alerta de que la evaluaci n participativa in- una mayor institucionalizaci n de los estudios
crementa la probabilidad de que se utilicen los (Worthen y Sanders, 1991).
resultados de la evaluaci n, pero tambi n la de
que sea conservadora en su concepci n, pues El propio Stufflebeam (1998) reconoce el
es dif cil pensar que los responsables de una conflicto de los planteamientos del Joint Com-
organizaci n pongan en cuesti n el fundamen- mittee on Standards for Educational Evalua-
to y el sistema de poder de la misma. Gene- tion con las posiciones de la corriente evalua-
ralmente su inter s es el cambio de cosas pe- dora denominada postmodernista, representada,
que as. adem s de por Guba y Lincoln, por otros reco-
nocidos evaluadores como Mabry, Stake y
14) Los estudios evaluativos deben emplear Walker, pero no acepta que existan razones
m ltiples perspectivas, m ltiples medidas de para actitudes de escepticismo y frustraci n
resultados, y m todos tanto cuantitativos co- con las pr cticas evaluadoras actuales, porque
mo cualitativos para recoger y analizar la in- existen muchos mbitos de aproximaci n y el
formaci n. La pluralidad y complejidad del desarrollo de est ndares de evaluaci n es
fen meno educativo hace necesario emplear perfectamente compatible con la atenci n a los
enfoques m ltiples y multidimensionales en diversos implicados, valores, contextos socia-
los estudios evaluativos (Scriven, 1991) les y m todos. Stufflebeam defiende una mayor
colaboraci n en la mejora de las evaluaciones,
15) Los estudios evaluativos deben ser evalua- estableciendo los est ndares de manera partici-
dos, incluyendo metaevaluaciones formativas pativa, pues cree que es posible la aproxima-
para mejorar su calidad y su uso y metaeva- ci n de planteamientos, con contribuciones
luaciones sumativas para ayudar a los usuarios importantes desde todos los puntos de vista.
en la interpretaci n de sus hallazgos y propor-
cionar sugerencias para mejorar futuras eva- Weiss (1998) tambi n toma posiciones pare-
luaciones (Joint Committee, 1981 y 1988; Ma- cidas cuando nos dice que las ideas constructi-
daus y otros, 1991; Scriven, 1991; Stuffle- vistas deben hacernos pensar m s cuidadosa-
beam, 2001). mente al usar los resultados de las evaluacio-
nes, sintetizarlas y establecer generalizaciones,
Estas quince recomendaciones proporcionan pero duda que todo haya que interpretarlo en
elementos esenciales para un enfoque de los es- t rminos exclusivamente individuales, pues
tudios evaluativos que Stufflebeam denomina existen muchos elementos comunes entre las
objetivista y que se basa en la teor a tica de que personas, los programas y las instituciones.
la bondad moral es objetiva e independiente de
los sentimientos personales o meramente huma- . Para concluir: s ntesis de enfo ues
nos. mod licos y metodol gicos de la evalua-
Sin entrar en el debate sobre estas valoraciones ci n y la ltima perspectiva de Scriven
finales de Stufflebeam, ni en an lisis comparati- Tras este an lisis del desarrollo de la evalua-
vos con otras propuestas, por ejemplo con las de ci n a lo largo del Siglo XX, parece oportuno,
Guba y Lincoln (1989), nos resulta evidente que a modo de s ntesis y de conclusi n, recoger y
las concepciones de la investigaci n evaluativa resaltar los que son considerados los principa-
son diversas, dependiendo del origen epistemo-

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 29


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

les modelos, planteamientos metodol gicos, di- como persuasiones mientras que House
se os, perspectivas y visiones de la evaluaci n (1983) se refiere a met foras .
en la actualidad. Su an lisis, de manera compac-
ta, es un complemento necesario para una visi n Norris (1993) apunta que el concepto de mo-
como la hist rica que, por su linealidad, tiene el delo se utiliza con cierta ligereza al referirse a
riesgo de ofrecer una imagen disciplinar artifi- concepci n, enfoque o incluso m todo de eva-
ciosamente fraccionada. luaci n. De Miguel (1989), por su parte, piensa
que muchos de los llamados modelos solamen-
Hemos visto que en la d cada de los setenta y te son descripciones de procesos o aproxima-
en sus alrededores se produce una especie de ciones a programas de evaluaci n. Darling-
eclosi n de propuestas evaluativas, que tradicio- Hammond y otros (1989) utilizan el t rmino
nalmente han venido siendo denominadas como modelo por costumbre, pero indican que no
modelos (Castillo y Gento, 1995) y en algunos lo hacen en el sentido preciso que tiene el t r-
casos como dise os (Arnal y otros, 1992) de in- mino en las ciencias sociales, esto es, apoy n-
vestigaci n evaluativa. Sabemos que existieron dose en una estructura de supuestos interrela-
varias decenas de estas propuestas, pero muy cionales fundamentada te ricamente. Final-
concentradas en el tiempo, en la d cada citada. mente diremos que el propio autor del modelo
De hecho, el asunto de los propuestos modelos CIPP, solamente utiliza esta denominaci n de
para la evaluaci n parece un tema pr cticamente manera sistem tica para referirse a su propio
cerrado desde hace cuatro lustros. Ya no surgen modelo (Stufflebeam y Shinkfield, 1987), utili-
nuevos modelos o propuestas, salvo alguna ex- zando los t rminos de enfoque, m todo, etc., al
cepci n como vemos m s adelante. referirse a los otros. Para nosotros, quiz s sea
el t rmino enfoque evaluativo el m s apropia-
A pesar de lo dicho, se sigue hablando de mo- do, aunque aceptemos seguir hablando de mo-
delos, m todos y dise os en la literatura especia- delos y dise os por simple tradici n acad mi-
lizada, sobre todo buscando su clasificaci n de ca.
acuerdo con diversos criterios, origen paradigm -
tico, prop sito, metodolog a, etc. Tambi n en las Nuestra idea es que a la hora de plantearnos
clasificaciones, no s lo en los modelos, existe una investigaci n evaluativa, no contamos to-
diversidad, lo que prueba que, adem s de dina- dav a con unos pocos modelos bien fundamen-
mismo acad mico en el terreno de la investiga- tados, definidos, estructurados y completos,
ci n evaluativa, todav a existe cierta debilidad entre los que elegir uno de ellos, pero s tene-
te rica al respecto. mos distintos enfoques mod licos y un amplio
soporte te rico y emp rico, que permiten al
Nosotros ya hemos se alado con anterioridad evaluador ir respondiendo de manera bastante
(Escudero, 1993), que coincidimos con Nevo adecuada a las distintas cuestiones que le va
(1983 y 1989) en la apreciaci n de que muchos planteando el proceso de investigaci n, ayu-
de los acercamientos a la conceptualizaci n de la d ndole a configurar un plan global, un orga-
evaluaci n (por ejemplo, el modelo respondiente, nigrama coherente, un modelo cient fica-
el libre de metas, el de discrepancias, etc.) se les mente robusto para llevar a cabo su evaluaci n
ha denominado indebidamente como modelos a (Escudero, 1993). Cu les son las cuestiones
pesar de que ninguno de ellos tenga el grado de que hay que responder en este proceso de cons-
complejidad y de globalidad que deber a acarrear trucci n mod lica? Apoy ndonos en las apor-
el citado concepto. Lo que un texto cl sico en taciones de diferentes autores (Worthen y San-
evaluaci n (Worthen y Sanders, 1973) denomina ders, 1973; Nevo, 1989; Kogan, 1989; Smith y
como modelos contempor neos de evaluaci n Haver, 1990), deben responderse y delimitar su
(a los conocidos planteamientos de Tyler, Scri- respuesta al construir un modelo de investiga-
ven, Stake, Provus, Stufflebeam, etc), el propio ci n evaluativa, los aspectos siguientes:
Stake (1981) dice que ser a mejor denominarlo

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 30


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

1) Objeto de la investigaci n evaluativa. 13) Evaluaci n de la propia investigaci n


evaluativa / metaevaluaci n.
2) Prop sito, objetivos.
Para definir estos elementos hay que buscar,
3) Audiencias/implicados/clientela. l gicamente, el apoyo de los diferentes enfo-
ques mod licos, m todos, procedimientos, etc.,
4) nfasis/aspectos prioritarios o preferentes.
que la investigaci n evaluativa ha desarrollado,
5) Criterios de m rito o valor. sobre todo en las ltimas d cadas.

6) Informaci n a recoger. Volviendo a los denominados modelos de los


setenta y a sus clasificaciones, podemos reco-
7) M todos de recogida de informaci n. ger algunas de las aparecidas en la ltima d -
cada en nuestro entorno acad mico, apoy ndo-
8) M todos de an lisis. se en distintos autores. As , por ejemplo, Arnal
9) Agentes del proceso. y otros (1992) ofrecen una clasificaci n de lo
que denominan dise os de la investigaci n
10) Secuenciaci n del proceso. evaluativa, revisando las de diversos autores
(Patton, 1980; Guba y Lincoln, 1982; P rez,
11) Informes/utilizaci n de resultados. 1983; Stufflebeam y Shinkfield, 1987). Esta
clasificaci n es la siguiente :
12) L mites de la evaluaci n.

a la - ipos de dise os de investi aci n educativa


Patton Guba y Lincoln P rez Stufflebeam y Autores
Perspectiva
(1980) (1982) (1983) Shinkfield (1987) creadores
Objetivos Objetivos Objetivos Objetivos Tyler (1950)
Emp rico- Rivlin (1971)
An lisis sistemas An lisis sistemas
anal tica Rossi y otros (1979)
M todo
Suchman (1967)
cient fico
CIPP CIPP CIPP Stufflebeam (1966)

Susceptibles Cr tica art stica Cr tica art stica Cr tica art stica Eisner (1971)
de comple-
mentariedad Adversario Contrapuesto Wolf (1974)

UTOS UTOS Cronbach (1982)


Respondente Respondente Respondente Respondente Stake (1975
Iluminativo Iluminativo Iluminativo Parlett y Hamilton (1977)
uman stico-
interpretativa
Sin metas Sin metas Sin metas Scriven (1967)
Democr tico MacDonald (1976)

Por su parte, Castillo y Gento (1995) ofrecen human sticos y hol sticos (mixtos). Una s nte-
una clasificaci n de m todos de evaluaci n sis de estas clasificaciones es la siguiente:
dentro de cada uno de los modelos (paradigmas),
que ellos denominan conductivista-eficientistas,

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 31


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

Tabla 2- Modelo conductista-eficientista


M todo/ Finalidad Paradigma domi- Contenido de Rol del
autor evaluativa nante evaluaci n evaluador
Consecuci n Medici n logro Cuantitativo Resultados T cnico externo
objetivos objetivos
Tyler (1940)

CIPP Informaci n Mixto C (contexto) T cnico externo


Stufflebeam para toma I (input)
(1967) decisiones P (proceso)
P (producto)
Figura Valoraci n Mixto Antecedentes, T cnico externo
(countenance) resultados y transacciones,
Stake (1967) proceso resultados
CSE Informaci n para Mixto Centrados en T cnico externo
Alkin (1969) determinaci n de logros de
decisiones necesidades
Planificaci n Valoraci n Mixto U (unidades de T cnico externo
educativa proceso y evaluaci n)
Cronbach producto T (tratamiento)
(1982) O (operaciones)

Tabla 3- odelo human stico


M todo/ Finalidad Paradigma domi- Contenido de Rol del
autor evaluativa nante evaluaci n evaluador
Atenci n al An lisis de Mixto Todos los Evaluador externo
cliente necesidades del efectos del de necesidades
Scriven (1973) cliente programa del
cliente
Contraposici n Opiniones para Mixto Cualquier aspecto rbitro externo
Owens (1973), decisi n del programa del debate
Wolf (1974) consensuada
Cr tica art stica Interpretaci n Cualitativo Contexto Provocador
Eisner (1981) cr tica de la Procesos externo de
acci n educativa emergentes interpretaciones
Relaciones de
procesos
Impacto en
contexto

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 32


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

Tabla 4- odelo hol stico


M todo/ Finalidad Paradigma domi- Contenido de Rol del
autor evaluativa nante evaluaci n evaluador
Evaluaci n Valoraci n de Cualitativo Resultado de Promotor externo
respondente respuesta a debate total de la interpreta-
Stake (1976) necesidades de sobre programa ci n
participantes por los implicados
Evaluaci n Interpretaci n Cualitativo Elementos que Promotor externo
hol stica educativa para configuran la de la interpreta-
MacDonald mejorarla acci n educativa ci n
(1976) por los implicados
Evaluaci n Iluminaci n y Cualitativo Sistema de Promotor externo
iluminativa comprensi n de ense anza y me- de la interpreta-
Parlett y Hamil- los componentes dio ci n
ton del programa de aprendizaje por los implicados
(1977)

Tambi n Scriven (1994) ofrece una clasifica- mente el objetivo perseguido, es el criterio de
ci n de los modelos anteriores , previamente a evaluaci n.
introducir su perspectiva transdisciplinar que A diferencia de Tyler, Stufflebeam ofrece
luego comentamos. Este autor identifica seis vi- una perspectiva m s amplia de los contenidos a
siones o enfoques alternativos en la fase explo- evaluar. Estos son las cuatro dimensiones que
siva de los modelos, adem s de algunas m s identifican su modelo, contexto (C) donde tiene
que denomina ex ticas y que se mueven entre lugar el programa o est la instituci n, inputs
los modelos de jurisprudencia y de experto. A (I) elementos y recursos de partida, proceso (P)
continuaci n comentamos sucintamente estas que hay que seguir hacia la meta y producto
visiones y los modelos que se adscriben a (P) que se obtiene. Adem s, se deja constancia
ellas. de que el objetivo primordial de la investiga-
La visi n fuerte hacia la toma de decisiones ci n evaluativa es la mejora, la toma de deci-
(Visi n A) concibe al evaluador investigando siones para la mejora de todas y cada una de
con el objetivo de llegar a conclusiones evaluati- las cuatro dimensiones antes citadas.
vas que le ayuden al que debe tomar decisiones. Scriven (1994) nos dice que Stufflebeam ha
Los que apoyan este enfoque se preocupan de si seguido desarrollando su perspectiva desde que
el programa alcanza sus objetivos, pero van m s desarroll el CIPP. Sin embargo, uno de sus
all , cuestion ndose si tales objetivos cubren las colaboradores en tal empresa, Guba, tom
necesidades que deben cubrir. Esta posici n es posteriormente una direcci n diferente, tal
mantenida, aunque no la hiciera expl cita, por como hemos visto al analizar la cuarta genera-
Ralph Tyler y extensamente elaborada en el mo- ci n de la evaluaci n (Guba y Lincoln, 1989).
delo CIPP (Stufflebeam y otros, 1971).
La visi n d bil hacia la toma de decisiones
Seg n el planteamiento tyleriano, las decisio- (Visi n B) concibe al evaluador proporcionan-
nes acerca de un programa deben basarse en el do informaci n relevante para la toma de deci-
grado de coincidencia entre los objetivos y los siones, pero no le obliga a emitir conclusiones
resultados. El cambio de los alumnos, habitual- evaluativas o cr ticas a los objetivos de los
programas. El representante te rico m s genui-

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 33


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

no es Marv Alkin (1969), que define a la evalua- poralizaci n prevista. Este modelo es muy cer-
ci n como un proceso factual de recogida y ge- cano al control de programas en sentido con-
neraci n de informaci n al servicio del que toma vencional; es una especie de simulaci n de una
las decisiones, pero es ste el que tiene que tomar evaluaci n.
las conclusiones evaluativas. Esta posici n es
l gicamente popular entre los que piensan que la La visi n de la descripci n f rtil, rica, com-
verdadera ciencia no debe o no puede entrar en pleta (Visi n D) es la que entiende la evalua-
cuestiones de juicios de valor. El modelo de Al- ci n como una tarea etnogr fica o period stica,
kin se conoce como CES (Centro para el Estudio en la que el evaluador informa de lo que ve sin
de la Evaluaci n), planteando las siguientes fa- intentar emitir afirmaciones valorativas o infe-
ses: valoraci n de las necesidades y fijaci n del rir conclusiones evaluativas, ni siquiera en el
problema, planificaci n del programa, evalua- marco de los valores del cliente como en la
ci n de la instrumentalizaci n, evaluaci n de visi n relativista. Esta visi n ha sido defendida
progresos y evaluaci n de resultados. por Robert Stake y muchos de los te ricos bri-
t nicos. Se trata de una especie de versi n na-
La visi n relativista (Visi n C) tambi n man- turalista de la visi n B, tiene algo de sabor re-
tiene la distancia de las conclusiones evaluativas, lativista y a veces parece precursora de la vi-
pero usando el marco de valores de los clientes, si n de la cuarta generaci n. Se centra en la
sin un juicio por parte del evaluador acerca de observaci n, en lo observable, m s que en la
esos valores o alguna referencia a otros. Esta inferencia. Recientemente se le ha denominado
visi n y la anterior han sido el camino que ha como visi n de la descripci n s lida, fuerte,
permitido integrarse sin problemas en el carro para evitar el t rmino rica, que parece m s
de la investigaci n evaluativa a muchos cient fi- evaluativa.
cos sociales. De hecho, uno de los textos m s
utilizados de evaluaci n en el mbito de las cien- Stake, en su primera etapa, es tayleriano en
cias sociales (Rossi y Freeman, 1993), toma pre- cuanto a concepci n evaluativa centrada en los
ferentemente esta perspectiva . objetivos planteados, proponiendo el m todo
de evaluaci n de la figura (Stake, 1967), como
Las visiones B y C son las posiciones de los rostro o imagen total de la evaluaci n. Esta gira
cient ficos entroncados con una concepci n libre en torno a los tres componentes, antecedentes,
de valores de la ciencia. En cambio, los que par- transacciones y resultados, elaborando dos
ticipan de la visi n A proceden de un paradigma matrices de datos, una de descripci n y otra de
diferente, probablemente debido a su conexi n juicio. En la primera se recogen de un lado las
acad mica con la historia, la filosof a de la edu- intenciones y de otro las observaciones y, en la
caci n, la educaci n comparada y la administra- segunda, las normas, lo que se aprueba y los
ci n educativa. juicios, lo que se cree que debe ser.
Hace unos a os Alkin (1991) revis sus plan- A mitad de los setenta, Stake se aleja de la
teamientos de dos d cadas atr s, pero sigui sin tradici n tayleriana de preocupaci n por los
incluir los t rminos de m rito, valor o val a; ter- objetivos y revisa su m todo de evaluaci n
mina definiendo un Sistema de Informaci n para hacia un planteamiento que l califica como
la Gesti n (Management Information System- respondente (Stake, 1975 y 1975a), asu-
MIS) para uso del que toma decisiones, pero no miendo que los objetivos del programa pueden
ofrece valoraciones al respecto modificarse sobre la marcha, con la finalidad
de ofrecer una visi n completa y hol stica del
Pero la forma m s simple de la visi n relativis- programa y responder a los problemas y cues-
ta (Visi n C) es la desarrollada en el modelo de tiones reales que plantean los implicados. Se-
discrepancia de evaluaci n de Malcolm Provus g n Stufflebeam y Shinkfield (1987), este mo-
(1971). Las discrepancias son las divergencias delo hizo de Stake el l der de una nueva escue-
con la secuencia de tareas proyectadas y la tem-

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 34


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

la de evaluaci n, que exige un m todo pluralista, Unidades (U) que son sometidas a evalua-
flexible, interactivo, hol stico, subjetivo y orien- ci n, individuos o grupos participantes.
tado al servicio. Este modelo sugiere la atenci n
al cliente propuesta por Scriven (1973), valo- Tratamiento (T) de la evaluaci n.
rando sus necesidades y expectativas.
Operaciones (O) que lleva a cabo el eva-
De manera gr fica, Stake (1975a) propone las luador para la recogida y an lisis de datos,
fases del m todo a modo de las horas de un reloj, as como para la elaboraci n de conclusio-
poniendo la primera en las doce horas y siguien- nes.
do las siguientes fases, el sentido de las agujas
Contexto en el que tiene lugar el programa
del reloj. Estas fases son las siguientes: 1) Hablar
y su evaluaci n.
con los clientes, responsables y audiencias, 2)
Alcance del programa, 3) Panorama de activida- En una investigaci n evaluativa concreta se
des, 4) Prop sitos e intereses, 5) Cuestiones y pueden dar varias unidades, varios tratamientos
problemas, 6) Datos para investigar los proble- y varias operaciones, en definitiva varios (uto),
mas, 7) Observadores, jueces e instrumentos, 8) dentro de un universo UTO de situaciones
Antecedentes, transacciones y resultados, 9) De- admisibles.
sarrollo de temas, descripciones y estudio de
casos, 10) Validaci n (confirmaci n), 11) Es- Ernie House (1989), un te rico y un pr ctico
quema para la audiencia y 12) Reuni n de infor- de la evaluaci n bastante independiente de
mes formales. El evaluador puede seguir las fa- corrientes en boga, tambi n marc el entronque
ses tambi n en sentido contrario del reloj o en social de los programas, pero se distingu a so-
cualquier otro orden. bre todo por su nfasis de las dimensiones m s
ticas y argumentales de la evaluaci n, quiz s
En el m todo respondente el evaluador ha de motivado por la ausencia de estas facetas en los
entrevistar a los implicados para conocer sus planteamientos de Cronbach y sus colaborado-
puntos de vista y buscar la confluencia de las res.
diversas perspectivas. El evaluador deber inter-
pretar las opiniones y diferencias de puntos de La visi n constructivista de la cuarta gene-
vista (Stecher y Davis, 1990) y presentar una raci n (Visi n F) es la ltima de estas seis vi-
amplia gama de opiniones o juicios, en lugar de siones que describe Scriven (1994), siendo
presentar sus conclusiones personales. mantenida por Guba y Lincoln (1989) y segui-
da por muchos evaluadores americanos y brit -
La visi n del proceso social (Visi n E) que nicos. Ya hemos visto anteriormente que esta
cristaliz hace algo m s de dos d cadas alrededor visi n rechaza una evaluaci n orientada a la
de un grupo de la Universidad de Stanford, diri- b squeda de calidad, m rito, valor, etc., y favo-
gido por Lee J. Cronbach (1980), resta importan- rece la idea de que ello es el resultado de la
cia a la orientaci n sumativa de la evaluaci n construcci n por individuos y la negociaci n
(decisiones externas sobre los programas y ren- de grupos. Esto significa, seg n Scriven, que el
dici n de cuentas), enfatizando la comprensi n, conocimiento cient fico de todo tipo es sospe-
la planificaci n y la mejora de los programas choso, discutible y no objetivo. Lo mismo le
sociales a los que sirve. Sus posiciones quedaban ocurre a todo trabajo an litico como el an lisis
claramente establecidas en noventa y cinco tesis filos fico, incluido el suyo. Scriven apunta que
que han tenido una enorme difusi n entre los el propio Guba ha sido siempre consciente de
evaluadores y los usuarios de la evaluaci n. las potenciales autocontradicciones de su
posici n.
En cuanto a los contenidos de la evaluaci n,
Cronbach (1983) propone que se planifiquen y De esta revisi n de Scriven quedan al margen
controlen los siguientes elementos: algunas posiciones evaluativas tradicionalmen-
te recogidas y tratadas por los analistas. As por

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 35


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

ejemplo, Schuman (1967) ofrece un dise o eva- distinta de la aludida visi n A y radicalmente
luativo basado en el m todo cient fico o, al me- diferente de las restantes.
nos, en alguna variaci n o adaptaci n del mismo.
Owens (1973) y Wolf (1974 y 1975) proponen En la perspectiva transdisciplinar, la investi-
un m todo de contraposici n o discusi n que gaci n evaluativa tiene dos componentes: el
sobre un programa llevan a cabo dos grupos de conjunto de campos de aplicaci n de la evalua-
evaluadores, partidarios y adversarios, para pro- ci n y el contenido de la propia disciplina. Al-
porcionar informaci n pertinente a quienes to- go parecido a lo que ocurre a disciplinas como
man decisiones. Eisner (1971, 1975 y 1981) la estad stica y la medici n. En definitiva, la
plantea la evaluaci n en t rminos similares al investigaci n evaluativa es una disciplina que
proceso de cr tica art stica. incluye sus propios contenidos y los de otras
muchas disciplinas; su preocupaci n por el
El propio Scriven (1967 y 1973) propon a hace an lisis y mejora se extiende a muchas disci-
a os centrar la evaluaci n en la atenci n al clien- plinas, es transdisciplinar.
te y no tanto en las metas previstas, puesto que
frecuentemente los logros no previstos son m s Esta visi n es objetivista como la A y defien-
importantes que los que figuran en la planifica- de que el evaluador determine el m rito o el
ci n del programa. Por ello, se suele denominar a valor del programa, del personal o de los pro-
su enfoque como evaluaci n sin metas. El eva- ductos investigados. En tal sentido, se debe
luador determina el valor o m rito del programa establecer de manera expl cita y defender la
para informar a los usuarios; se trata algo as l gica utilizada en la inferencia de conclusio-
como de un intermediario informativo (Scriven, nes evaluativas a partir de las premisas defini-
1980). cionales y factuales. As mismo, se deben per-
seguir las falacias argumentales de la doctrina
La evaluaci n iluminativa (Parlett y Hamilton, libre de valores (Evaluation Thesaurus, 1991).
1977) tiene un enfoque hol stico, descriptivo e
interpretativo, con la pretensi n de iluminar so- En segundo lugar, la perspectia transdisci-
bre un complejo rango de cuestiones que se dan plinar se orienta hacia el consumidor, m s que
de manera interactiva (Fern ndez, 1991). La eva- hacia el gestor o intermediario. No se trata de
luaci n democr tica de MacDonald (1971 y una orientaci n exclusiva hacia el consumidor,
1976), tambi n denominada hol stica, supone la pero s la consideraci n primera del consumi-
participaci n colaborativa de los implicados, dor como justificaci n del programa, y que el
siendo el contraste de opiniones de los implica- bien com n es la primac a de la evaluaci n. A
dos el elemento evaluativo primordial. partir de aqu , tambi n se produce informaci n
valiosa para el gestor que decide y se pueden
Scriven (1994) analiza las seis visiones cr ti- analizar los productos de un programa o insti-
camente y se muestra m s cercano a la visi n A, tuci n a la vista de sus objetivos. Esta posici n
la visi n fuerte sobre la toma de decisiones, re- no s lo ve legitimidad en la emisi n de conclu-
presentada fundamentalmente por el modelo siones evaluativas por parte del investigador,
CIPP de Stufflebeam y sus planteamientos, pues sino que ve necesidad de hacerlo en la gran
dice que es la m s cercana de todas a la visi n mayor a de las ocasiones.
del sentido com n, que es la que tienen los eva-
luadores trabajando con sus programas, de la Se trata tambi n de una visi n generalizada,
misma manera que los m dicos trabajan con los no justamente una visi n general, que incluye
pacientes, haci ndolo lo mejor posible, indepen- la generalizaci n de conceptos en el mbito del
dientemente del tipo y del estado general del conocimiento y la pr ctica. Desde esta perspec-
paciente. Scriven quiere extender esta visi n con tiva, la investigaci n evaluativa es mucho m s
una visi n o modelo que denomina transdiscipli- que la evaluaci n de programas e incide en
nar y que l califica como significativamente procesos, instituciones y otros muchos m s

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 36


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

objetos. De manera m s detallada, esta visi n sentido estricto. Pensamos que esta orientaci n
generalizada significa que: debe integrarse dentro de una orientaci n a los
implicados, donde existen distintos tipos y dis-
a) Los campos distintivos de aplicaci n de la tintas audiencias y, por supuesto, una muy im-
disciplina son los programas, el personal, los portante, son los usuarios en el sentido de Scri-
rendimientos, los productos, los proyectos, la ven, pero nos parece que la investigaci n eva-
gesti n, y la metaevaluaci n de todo ello. luativa hoy en d a tiene una orientaci n priori-
taria m s plural que la defendida por este au-
b) Las investigaciones evaluativas inciden en
tor.
todo tipo de disciplinas y en las pr cticas que
resultan de ellas. Referencias bibliogr ficas
c) Las investigaciones evaluativas se mueven Ahman, S. J. y Cook, M. D. (1967). Evaluating
desde niveles muy pr cticos hasta el nivel Pupil Growth. Principles of Tests Measure-
conceptual. ment. Boston, Ma.: Allyn and Bacon
Alkin, M. (1969). Evaluation theory develop-
d) Los distintos campos de la investigaci n ment. Evaluation Comment, 2, 1, 2-7.
evaluativa tienen muchos niveles de interco-
Alkin, M. (1991). Evaluation theory develop-
nexi n y solapamiento. La evaluaci n de pro-
ment: II. En M. McLaughlin, y Phillips (Eds.),
gramas, de personal, de centros, etc., tienen
Evaluation and education at quarter century
muchos puntos en com n.
(pp.91-112). Chicago: NSSE/ University of
El cuarto elemento distintivo de la visi n Chicago .
transdisciplinar de la evaluaci n es que se trata Anderson, S. B. y Ball, S. (1983). The profes-
de una visi n t cnica. La evaluaci n no s lo ne- sion and practice of program evaluation. San
cesita el apoyo t cnico de otras muchas discipli- Francisco, Ca: Jossey-Bass.
nas, sino que, adem s, tiene su propia metodolo- Arnal, J.; Del Rincon, D. y Latorre, A. (1992).
g a. La l gica de la s ntesis de resultados, las Investigaci n educativa. Fundamentos y Me-
consecuencias, etc., y la correcta ubicaci n en el todolog a. Barcelona: Labor
proceso de muchas t cnicas auxiliares en las que, Atkin, J. M. (1968). Behavioral Objectives in
probablemente, no es necesario ser un gran espe- curriculum design: A cautionary note. The
cialista, pero s tener un conocimiento cabal. Science Teacher, 35, 27-30.
Baker, L. R. (1969). Curriculum evaluation.
Esta perspectiva transdisciplinar de la investi- Review of Educational Research, 39, 339-358.
gaci n evaluativa de Scriven (1994), coincide en Barbier, J. M. (1993). La evaluaci n en los
gran medida con los planteamientos que de la procesos de formaci n. Barcelona: Paidos.
misma hemos defendido en otros momentos (Es-
Berk, A. R. (Ed.) (1981). Educational evalua-
cudero, 1996). Nosotros no tenemos unas posi-
tion methodology: The state of the art. Balti-
ciones contrarias a las otras visiones en la misma
more: The Hopkins University Press.
medida que las tiene Scriven y, de hecho, consi-
Blanco, F. (1994). La evaluaci n en la educa-
deramos desde una posici n pragm tica, que
ci n secundaria. Salamanca: Amas Edicio-
todas las visiones tienen puntos fuertes y que en
nes.
todo caso, aportan algo til para la comprensi n
conceptual y el desarrollo de la investigaci n Bloom, B. S., Engelhaut, M.D., Furst, E.J.,
evaluativa. Sin embargo, s que pensamos que Hill, W.H. y Krathwohl, D.R. (1956). Taxo-
esta moderna visi n de Scriven es s lida y cohe- nomy of educational objectives Handbook I;
rente y ampliamente aceptada en la actualidad. Cognitive domain. New York: Davis, McKay.
Bloom, B. S., Hastings, J. Th. y Madaus, F.
Una cr tica que podr a hacerse a este plantea- (1971). Handbook on formative and summati-
miento de Scriven est en el excesivo nfasis ve evaluation of student learning. New York:
relativo de la orientaci n al cliente, al usuario en McGraw-Hill.

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 37


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

Bloom, B.S., Hastings, T. y Madaus G. (1975). De Miguel, M. (1989). Modelos de investiga-


Evaluaci n del aprendizaje. Buenos Aires: Tro- ci n sobre organizaciones educativas. Revista
quel. de Investigaci n Educativa, 7, 13, 21-56.
Bonboir, A. (1972). La Docimologie. Paris: PUF. Dubois, P. H. (1970). A History of Psychologi-
Cabrera, F. (1986). Proyecto docente sobre t cni- cal Testing. Boston: Allyn Bacon.
cas de medici n y evaluaci n educativas. Barce- Ebel, R. L. (1977). Fundamentos de la medi-
lona: Universidad de Barcelona. ci n educacional. Buenos Aires: Guadalupe.
Carre o, H. F. (1977). Enfoques y principios Eisner, E. W. (1967). Educational objectives:
te ricos de la evaluaci n. Mexico: Trillas. Help or hindrance?. The School Review, 75,
Castillo, S. y Gento, S. (1995). Modelos de eva- 250-260.
luaci n de programas educativos. En A.Medina Eisner, E. W. (1969, Instructional and expres-
y L. M. Willar (Coord.), Evaluaci n de progra- sive educational objectives: their formulation
mas educativos, centros y profesores (pp.25-69). and use in curriculum. En J. Popham (Ed.),
Madrid: Editorial Universitas, S. A.. Instructional objectives (pp. 1-18). Chicago:
Chelimsky, E. (1998). The role of experience in AERA.
formulating theories of evaluation practice. Eisner, E. (1971). Emerging models for educa-
American Journal of Evaluation 19, 1, 35-55. tional evaluation. School Review, 2.
Coffman, W. E. (1971). Essay examinations. En Eisner, E. W. (1975). The perceptive eye: To-
R.L. Thorndike (Ed.) Educational Measurement. ward the reformation of educational evalua-
Washington , DC: American Council on Educa- tion. Stanford, Ca: Stanford Evaluation Con-
tion. sortion.
Cronbach, L. J. (1963). Course improvement Eisner, E. W. (1981). The methodology of qua-
through evaluation. Teachers College Record, litative evaluation: the case of educational
64, 672-683. connoisseurship and educational criticism.
Cronbach, L. J. (1982). Designing evaluations of Stanford, Ca: Stanford University .
educational and social programs. Chicago: Jos- Eisner, W. E. (1985). The art of educational
sey-Bass. evaluation. London: The Falmer Press.
Cronbach, L. J., Hambron, S.R., Dornbusch, Escudero, T. (1993). Enfoques mod licos en la
S.M., Hess, R.D., Hornick, R.C., Phillips, D.C., evaluaci n de la ense anza universitaria, Ac-
Walker, D.F. y Weiner, S.S. (1980). Towards tas de las III Jornadas Nacionales de Did ctica
reform in program evaluation: Aims, methods Universitaria Evaluaci n y Desarrollo Profe-
and institutional arrangements. San Francisco: sional (pp. 5-59). Las Palmas: Servicio de
Jossey-Bass. Publicaciones, Universidad de Las Palmas.
Cronbach, L. J. y Suppes, P. (1969). Research for Escudero, T. (1996). Proyecto docente e inves-
tomorrow's schools: Disciplined inquiry for tigador. Zaragoza: Universidad de Zaragoza.
education. New York: MacMillan. Fern ndez Ballesteros, R. (1981). Perspectivas
Darling-Hammond, L., Wise, AE, & Pease, SR hist ricas de la evaluaci n conductual. En R.
(1989). Teacher evaluation in the organizational Fern ndez, y J.A.I Carrobles. (Ed.), Evalua-
context: A review of the literature. En E. R. ci n conductual. Madrid: Ediciones Pir mide.
House (Ed.) New directions in educational eva- Fern ndez de Castro, J. (1973). La ense anza
luation (pp.203-253). London: The Falmer Pre- programada. Madrid: CSIC.
ss. Fern ndez, J. (1991). La evaluaci n de la cali-
De la Orden, A. (1985). Investigaci n evaluativo. dad docente. En A. Medina (Coord.), Teor a y
En Arturo De la Orden. (Ed.), Investigaci n m todos de evaluaci n. Madrid: Cincel.
educativa. Diccionario de Ciencias de la Educa- Fetterman, D. M. (1994). Empowerment
ci n (pp.133-137). Madrid: Anaya. evaluation. Evaluation Practice, 15, 1, 1-15.
Gagne, R. M. (1971). Las condiciones del
aprendizaje. Madrid: Aguilar.

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 38


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

Gil, E. (1992). El sistema educativo de la Com- Joint Committee on Standards for Educational
pa a de Jes s. La Ratio Studiorum . Madrid: Evaluation (1988). The personnel evaluation
UPCO. standards. Newbury Park, CA.: Sage.
Glaser, B. G. (1978). Theoretical sensitivity. Mill Keefe, J. (1994). School evaluation using the
Valley, Ca: Sociology Press. CASE-IMS model and improvement process.
Glaser, B. G. y Strauss, A. L. (1967). The disco- Studies in Educational Evaluation, 20,1, 55-
very of grounded theory. Chicago: Aldine. 67.
Glaser, R. (1963). Instructional technology and Kellaghan, T. (1982). La evaluaci n educativa.
the measurement of learning outcomes: some Bogot : Universidad Pontificia Javierana.
questions. American Psychologists, 18, 519- Kidder, L. H. (1981). Qualitative research and
521. quasi-experimental frameworks. En M. B.
Glaser, R. (Dir.) (1965). Teaching machines and Brewer y B. E. Collins, (Eds.), Scientific in-
programmed learning. Washington: National quiry and the social sciences. San Francisco:
Education Association. Jossey-Bass.
Gronlund, N. E. (1985). Measurement and eva- Kogan, M. (Ed.) (1989). Evaluating higher
luation in teaching. New York: MacMillan, education. London: Jessica Kingsley Publis-
Guba, G. E. y Lincoln, Y. S. (1982). Effective hers.
evaluation. San Francisco: Jossey Bass Publis- Krathwohl, R. D., Blomm, B.S. y Masia, B.B.
hers. (1964). Taxonomy of educational objectives.
Guba, E. G. y Lincoln, Y. S. (1989). Fourth Ge- Handbook II: Affective domain. New Cork:
neration Evaluation. Newbury Park, Ca.: Sage Davis McKay.
Publications Lewy, A. (Ed.) (1976). Manual de evaluaci n
Gullicksen, H. (1950). Theory of mental tests. formativa del curr culo. Bogot : Volun-
New York: Wiley tad/Unesco.
Hambleton, R. K. (1985). Criterion-referenced Lincoln, y. S. y Guba, E. G. (1985). Naturalis-
measurement.En Encyclopedia of Educational tic inquiry. Beverly Hills, CA: Sage.
Research. New York: McMillan. Lincoln, y. S. y Guba, E. G. (1986). But is it
Hammond, R. L. (1983). Evaluation at the local rigorous? Trustworthiness and authenticity in
level. En B. R. Worthen y J. R. Sanders, Educa- naturalistic evaluation. en D. D. Williams
tional Evaluation: Theory and Practice. Wort- (Ed.), Naturalistic evaluation. San Francisco:
hington, Ohio: Charles A. Jones Publishing Jossey-Bass.
Company. Lincoln, y. S. y Guba, E. G. (1988). Criteria for
Hern ndez, F. (1993). Proyecto docente e inves- assessing naturalistic inquiries as products.
tigador. Murcia. Paper presented at the American Educational
Horowitz, R. (1995). A 75-year legacy on as- Research Association, New Orleans, LA.
sessment: Reflections from an interview with Lindquist, E. F. (1953). Design and Analysis of
Ralph W. Tyler. The Journal of Educational Re- Experiments in Psychology and Education.
search, 89, 2, 68-75. Boston, Ma.: Houghton Mifflin Company.
House, E. R. (1983). How we think about evalua- Lindvall, C. M., (Ed.) (1964). Defining educa-
tion. En House, E. R., Philosophy of evaluation. tional objectives. Pittsburg: University of
San Francisco, Ca.: Jossey-Bass Pittsburgh Press.
House, E. R. (1989). Evaluating with validity. Macdonald, B. (1971). The evaluation of the
Newbury Park, Ca.: Sage. Humanities Curriculum Project: a holistic ap-
Joint Committee on Standards for Educational proach. Theory into Practice, 10, 3, 163-169.
Evaluation (1981, Standards for evaluations of Macdonald, B. (1976). Evaluation and the con-
educational programs, projects, and materials. trol of education. En D. Tawney (Ed.), Curri-
New York.: McGraw-Hill. culum evaluation today: trends and implica-
tions, 125-136. London: McMillan.

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 39


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

Madaus, G. F. y otros (1991). Evaluation Mo- School of Education , University of East An-
dels. Viewpoints on Educational and Human glia .
Services Evaluation. Hingham , Mass.: Kluwer- Nowalowski, Jeri, Mary Anne Bunda, Russell
Nijhoff Publishing. Working (1985). A Handbook of Educational
Mager, R. F. (1962). Preparing instructional ob- Variables. Boston: Kluwer-Nijhoff .
jective. Palo Alto, CA.: Fearon. Nunnally, J. C. (1978). Psychometric Theory.
Mager, R. F. (1973). An lisis de metas. M xico: New York: McGraw Hill.
Trillas. Owens, T. R. (1973). Educational evaluation
Mann, H., (1845). Boston Grammar and Writing by adversery proceedings. En E.R. House
Schools. Common School Journal, October, 7, (Comp.), School Evaluation: The Politics and
19. Process. Berkeley: McCutchan.
Mart nez de Toda, M. J. (1991). Metaevaluaci n Parlett, M. y Hamilton , d. (1977). Evaluation
de necesidades educativas: Hacia un sistema de as illumination: A new approach to the study
normas. Tesis doctoral. Madrid: Universidad of innovative programmes. En Hamilton D. y
Complutense. otros (Eds.), Beyond the numbers game. Lon-
Mateo, J. (1986). Proyecto docente e investiga- don: MacMillan.
dor. Barcelona: Universidad de Barcelona. Patton, M. Q. (1980). Qualitative Evaluation
Mateo, J. y otros (1993). La evaluaci n en el aula methods. Beverly Hills, Ca.: Sage
universitaria. Zaragoza: ICE-Universidad de Za- P rez, A. (1983). Modelos contempor neos de
ragoza. evaluaci n. En J. Gimeno y A. P rez, La en-
Mccall, W. A. (1920). A new kind of school se anza: su teor a y su pr ctica (pp. 426-449).
examination. Journal of Educational Research, Madrid: Akal
January. Phillips, R. C. (1974). Evaluation in education.
McReynold, P. (1975). Advances in Psychologi- Columbus, Ohio: Merril.
cal Assessment, vol. III.San Francisco: Jossey- Pieron, H. (1968). Vocabulaire de la psycholo-
Bass. gie. Paris: PUF.
Mertens, D. M. (1999). Inclusive evaluation: Pieron, H. (1969). Examens et Docimologie.
Implications of transformative theory for eva- PUF, Paris.
luation. American Journal of Evaluation, 20, 1, Planchard, E. (1960). La investigaci n
1-14. pedag gica. Madrid: Ediciones Fas.
Metfessel, N. S. y Michael, W. B. (1967). A pa- Popham, W. J. (1970). Establishing instructio-
radigm involving multiple criterion measures nal goals. Englewood Cliffs, N. J.: Prentice
for the evaluation of effectiveness of school Hall.
programs. Educational and Psychological Mea- Popham, W. J. (1980). Problemas y t cnicas de
surement, 27, 931-943. la evaluaci n educativa. Madrid: Anaya.
Morgan, G. (1983). Beyond method. Beverly Popham, W. J. (1983). Evaluaci n basada en
Hills, Ca: Sage. criterios. Madrid: Magisterio Espa ol, S. A..
Nevo, D. (1983). The conceptualization of Popham, W. y Baker, E. L. (1970). Systematic
educational evaluation: An analytical review of Instruction. Englewood Cliffs, NJ.: Prentice
the literature. Review of Educational Research, Hall.
53, 1, 117-128. Provus, M. (1971). Discrepancy evaluation.
Nevo, D. (1989). The conceptualization of For educational program improvement and
educational evaluation: An analytical review of assessment. Berkeley, Ca.: McCutchan Pu-
the literature. En E. R. House (Ed.), New blishing Co.
directions in educational evaluation. London : Rivlin, A. M. (1971). Systematic thinking for
The Falmer Press, 15-29. social action. Washington, D.C.: Brookings
Norris, N. (1993). Understanding educational Institute.
evaluation. London : Kogan Page/CARE,

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 40


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

Rodr guez, T. y otros (1995). Evaluaci n de los Smith, E. R. y Tyler, R. W. (1942). Appraising
aprendizajes. Aula Abierta Monograf as 25. and recording student progress. New York:
Oviedo: ICE-Universidad de Oviedo. Harper & Row,.
Rosenthal, J. E. (1976). Evaluation history. En S. Smith, N. L. y Haver, d. M. (1990). The appli-
B. Anderson, y otros (Eds.), Encyclopedia of cability of selected evaluation models to evol-
Educational Evaluation. San Francisco: Jossey ving investigative designs. Studies in Educa-
Bass Publishers. tional Evaluation, 16, 3, 489-500.
Rossi, P. H. y Freeman, H. (1993). Evaluation: A Stacher, B. M. y Davis, W. A. (1990). How to
Systematic Approach. Beverly Hills , Ca.: Sage. Focus on Evaluation. Newbury Park, Ca.: Sa-
Rossi, P. H. y otros (1979). Evaluation: A syste- ge.
matic approach. Beverly Hills , Ca.: Sage. Stake, R. E. (1967). The countenance of educa-
Russell, N. y Willinsky, J. (1997). Fourth genera- tional evaluation. Teacher College Record, 68,
tion educational evaluation: The impact of a 523-540.
post-modern paradigm on school based evalua- Stake, R. E. (1975a). Program evaluation: par-
tion. Studies in Educational Evaluation, 23, 3, ticularly responsive evaluation. Occasional
187-199. Paper, 5. University of Western Michigan.
Rutman, L. (Ed.) (1984). Evaluation research Stake, R. E. (1975b). Evaluating the arts in
methods: A base guide. Beverly Hills, Ca.: Sa- education: A responsive approach. Ohio: Me-
ge. rril .
Rutman, L. y Mowbray, G. (1983). Understan- Stake, R. E. (1976). A theoretical stament of
ding program evaluation. Beverly Hills, Ca.: responsive evaluation. Studies in Educational
Sage. Evaluation, 2 , 19-22.
Salvador, L. (1992). Proyecto docente., Univer- Stake, R. E. (1981). Setting standars for educa-
sidad de Cantabria. tional evaluators. Evaluation News, 22, 148-
Scriven, M. (1967). The methodology of evalua- 152.
tion. En Perspectives of Curriculum Evaluation, Stake, R. E. (1986). Quieting reform. Urbana:
(pp. 39-83). AERA Monograph 1. Chicago : University of Illinois Press.
Rand McNally and Company. Stenhouse, L. (1984). Investigaci n y desarro-
Scriven, M. (1973). Goal-free evaluation. En E. llo del curriculum. Madrid: Morata.
R. House (Ed.), School evaluation: The politics Stronge, J. H. y Helm, V. M. (1991). Evalua-
and process,(pp. 319-328). Berkeley, CA.: ting professional support personnel in educa-
McCutchan. tional settings. Newbury Park, Ca: Sage.
Scriven, M. (1974). Prose and cons about goal- Stufflebeam, D. L. (1966). A depth study of the
free evaluation. Evaluation Comment, 3, 1-4. evaluation requeriment. Theory into Practice,
Scriven, M. (1980). The logic of evaluation. In- 5, 3, 121-134.
verness , Ca.: Edgepress Stufflebeam, D. L. (1994). Introduction: Re-
Scriven, M. (1991, Evaluation Thesaurus. New- commendations for improving evaluations in
bury Park , Ca.: Sage U. S. public schools. Studies in Educational
Scriven, M. (1991a). Duties of the teacher. Ka- Evaluation, 20, 1, 3-21.
lamazoo, Mi.: Center for Research on Educatio- Stufflebeam, D. L. (1998). Conflicts between
nal Accountability and Teacher Evaluation. standards-based and postmodernist evalua-
Scriven, M. (1994). Evaluation as a discipline. tions: Toward rapprochement. Journal of Per-
Studies in Educational Evaluation, 20, 1, 147- sonnel Evaluation in Education, 12, 3, 287-
166. 296.
Scriven, M. (1998). Minimalist theory: The least Stufflebeam, D. L. (1999). Using profesional
theory that practice require. American Journal standards to legally and ethically release eva-
of Evaluation 19, 1, 57-70. luation findings. Studies in Educational
Evaluation, 25, 4, 325-334.

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 41


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de inteso
desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

Stufflebeam, D. L. (2000). Guidelines for deve- Walberg, H. J. y Haertel, G. D. (Ed.) (1990).


loping evaluation checklists. Consultado en The International Encyclopedia of Educatio-
www.wmich.edu/evalctr/checklists/ el 15 de Di- nal Evaluation. Oxford: Pergamon Press.
ciembre de 2002. Webster, W. J. y Edwards, M. E. (1993). An
Stufflebeam, D. L. (2001). The metaevaluation accountability system for school improve-
imperative. American Journal of Evaluation, 22, ment, Paper presented at the annual meeting
2, 183-209. (April) of the AERA. Atlanta, GA.
Stufflebeam, D. L., Foley, WJ, Gephart, WJ, Webster, W. J., Mendro, R.L. y Almaguer,
Guba, EG, Hammond, RL, Merriman, HO & T.O. (1994). Effectiveness indices: A value
Provus, MM (1971). Educational Evaluation added approach to measuring school effect.
and Decision-making, Itasca, Illinois : F. E. Studies in Educational Evaluation, 20, 1, 113-
Peacock Publishing. 137.
Stufflebeam, D. L. y Shinkfield, A. J. (1987). Weiss, C. H. (1983). Investigaci n evaluativa.
Evaluaci n sistem tica. Gu a te rica y pr ctica. M todos para determinar la eficiencia de los
Barcelona: Paidos/MEC. programas de acci n. M xico: Trillas,.
Suchman, E. A. (1967). Evaluative Research: Weiss, C. H. (1998). Have we learned anything
Principles and Practice in Public Service and new about the use of evaluation?. American
Social Action Programs. New York : Russell Journal of Evaluation, 19, 1, 21-33.
Sage Foundation. Wilson, A. R. J. (1978). La evaluaci n de los
Sunberg, N. D. (1977). Assessment of person. objetivos. En J. A. R. Wilson (Ed.), Funda-
Englewood Cliffs, N.J.: Prentice Hall. mentos psicol gicos del aprendizaje y la en-
Taba, H. (1962). Curriculum development. Theo- se anza (pp. 549-578). Madrid: Anaya..
ry and practice. New York: Harcourt Brace . Wolf, R. L. (1974). The citizen as jurist: A new
Thorndike, E. L,. (1904). An Introduction to the model of educational evaluation. Citizen Ac-
Theory of Mental and Social Measurements. tion in Education, 4.
New York: Teacher College Press, Columbia Wolf, R. L. (1975). Trial by jury: a new eva-
University . luation method. Phi Delta Kappa, 57, 185-
Tyler, R. W. (1950). Basic principles of curricu- 187.
lum and instruction. Chicago: University of Worthen, B. R. y Sanders, J. R. (1973). Educa-
Chicago Press . tional Evaluation: Theory and Practice. Wort-
Tyler, R. W. (1967). Changing concepts of edu- hington, Ohio: Charles a. Jones Publishing
cational evaluation. En R. E. Stack (Comp.), Company.
Perspectives of curriculum evaluation. AERA Worthen, B. R. y Sanders, J. R. (1991). The
Monograph Series Curriculum Evaluation, 1. changing face of educational evaluation,
Chicago: Rand McNally,. Theory into Practice, XXX, 1, 3-12.
Tyler, R. W., (Ed.) (1969). Educational evalua- Zeller, N. C. (1987). A rethoric for naturalistic
tion: New roles, new means. Chicago: Universi- inquiry. Ph. D. dissertation, Indiana Universi-
ty of Chicago Press . ty.

ABOUT THE AUTHORS / SOBRE LOS AUTORES

Tom s Escudero Escor a (tescuder@posta.unizar.es). Catedr tico del rea de M todos de Inves-
tigaci n y Diagn stico en Educaci n de la Universidad de Zaragoza. Es miembro de la Comisi n
de Coordinaci n T cnica del Plan de Calidad de las Universidades. Tiene un gran n mero de traba-
jos y publicaciones sobre evaluaci n educativa, particularmente sobre evaluaci n institucional.

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 42


Escudero Escorza, T. (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de
inteso desarrollo de la evaluaci n en educaci n. RELIEVE:, v. 9, n. 1, p. 11-43.
http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm

ARTICLE RECORD / FICHA DEL ART CULO

Escudero, Tom s (2003). Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de
intenso desarrollo de la evaluaci n en educaci n. Revista ELectr nica de Investigaci n y EVa-
Reference /
luaci n Educativa (RELIEVE), v. 9, n. 1.
Referencia http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm. Consultado en (poner fe-
cha).
Desde los tests hasta la investigaci n evaluativa actual. Un siglo, el XX, de intenso
Title / T tulo desarrollo de la evaluaci n en educaci n. [ From tests to current evaluative research.
One century, the XXth, of intense development of evaluation in education]
Authors / Autores Tom s Escudero Escorza
Review / Revista ELectr nica de Investigaci n y EValuaci n Educativa (RELIEVE), v. 9, n. 1
Revista
ISSN 1134-4032
Publication date /
2003 (Reception Date: 2003 January 10; Publication Date: 2003 Febr. 27 )
Fecha de publicaci n
This article presents a review and state of art about development in educational
evaluation in the XXth century. The main theoretical proposals are commented.
Abstract /
Este art culo presenta una revisi n cr tica del desarrollo hist rico que ha tenido el m-
Resumen
bito de la evaluaci n educativa durante todo el siglo XX. Se analizan los principales
propuestas te ricas planteadas..
Evaluation, Evaluation Research, Evaluation Methods; Formative Evaluation Sum-
Keywords mative Evaluation, Testing, Program Evaluation.
Descriptores Evaluaci n, Investigaci n evaluativa, M todos de Evaluaci n, Evaluaci n Formativa,
Evaluaci n Sumativa, Test, Evaluaci n de Programas
Institution / Universidad de Zaragoza (Espa a)
Instituci n
Publication site /
http://www.uv.es/RELIEVE
Direcci n
Language / Idioma Espa ol (Title, abstract and keywords in english)

Revista ELectr nica de Investigaci n y EValuaci n Educativa


(RELIEVE)
[ ISSN: 1134-4032 ]

Copyright 2002, RELIEVE. Reproduction and distribution of this articles it is authorized if the content is no
modified and their origin is indicated (RELIEVE Journal, volume, number and electronic address of the document). /
Copyright 2002, RELIEVE. Se autoriza la reproducci n y distribuci n de este art culo siempre que no se modifi-
que el contenido y se indique su origen (RELIEVE, volumen, n mero y direcci n electr nica del documento).

Revista ELectr nica de Investigaci n y EValuaci n Educativa [ www.uv.es/RELIEVE ] pag. 43