Anda di halaman 1dari 32

MINISTERIO DE EDUCACION

Lima, julio del 2001

N 2

4 La polmica tarea de evaluar la


calidad
4 Hacia una educacin basada en
evidencias
4 La poltica educativa peruana y
las evaluaciones intenacionales
4 Comentarios respecto a la
participacin del Per en el
Laboratorio Latinoamericano
de Medicin de la Calidad
Educativa
4 Cun diferentes son los
resultados de las pruebas de
matemtica y lenguaje en
Latinoamrica? Una mirada a
travs del Laboratorio
Latinoamericano de Evaluacin
de la Calidad Educativa
4 Cunto aprenden nuestros
estudiantes? Presentacin de la
Evaluacin Nacional del 2001
4 El Programa Internacional para
la Evaluacin de Estudiantes
(PISA-OCDE):
Se est formando capital
humano joven en el Per?

Crecer
REVISTA

+HA?AH
Lima, julio del 2001

no 2

NDICE

Presentacin

La polmica tarea de evaluar la calidad


Len Trahtemberg

Hacia una educacin basada en evidencias


Manuel E. Bello

La poltica educativa peruana y las evaluaciones


educacionales internacionales
Gilbert A. Valverde

10

Comentarios respecto a la participacin del Per en


el Laboratorio Latinoamericano de Medicin de la
Calidad Educativa
Juan Fernando Vega Ganoza

13

Cun diferentes son los resultados de las pruebas de


matemtica y lenguaje en Latinoamrica? Una mirada a
travs del Laboratorio Latinoamericano de Evaluacin
de la Calidad Educativa
Alberto Torreblanca

16

Cunto aprenden nuestros estudiantes?


Presentacin de la Evaluacin Nacional del 2001
Jos Rodrguez
Santiago Cueto

20

El Programa Internacional para la Evaluacion de


Estudiantes (PISA-OCDE):
Se est formando capital humano joven en el Per?
Silvana Vargas

25

Presentacin

urante su corta vida, la Unidad


de Medicin de la Calidad Educativa del Ministerio de Educacin ha administrado dos evaluaciones nacionales (en 1996 y 1998) y una internacional (en
1997). Esta ltima fue parte del estudio del Laboratorio Latinoamericano de Evaluacin de la
Calidad de la Educacin (LLECE) auspiciado por
la UNESCO.
A raz de estas evaluaciones, durante los dos
ltimos aos se han publicado 15 boletines informativos distribuidos a escala nacional, que adems estn a disposicin de los lectores interesados en el portal del Ministerio de Educacin1 .
Tambin se trabaj el contenido de estos boletines en talleres de discusin de resultados con
docentes; en los ms recientes, se trat el anlisis de temes de las pruebas de 1998 (ver boletines UMC 10 al 15).
Sin embargo, la publicacin que ms inters
ha despertado entre el pblico y los medios es,
de lejos, la de los resultados del estudio del
LLECE. Estos resultados aparecieron en el Boletn UMC 9 de febrero pasado. De seguro, este
inters se debe principalmente a dos hechos:
primero, la demora en publicar los resultados
(los otros pases que participaron de la mencionada evaluacin tuvieron acceso a los datos a
fines de 1998; el Per, ms de dos aos despus) y segundo, la posicin relativamente rezagada de los estudiantes peruanos respecto de

1
2
3
4

sus pares de varios pases de la regin. Pensamos


que el debate sobre estos resultados y sobre
todo sobre sus implicaciones no ha sido agotado y por eso lo hemos convertido en el tema
central del presente nmero de la revista Crecer.
Qu podemos aprender de los resultados del
estudio del LLECE? Tal es la pregunta que planteamos a nuestros tres primeros colaboradores:
Len Trahtemberg, especialista en diversos temas educativos, quien en el ltimo CADE2 present una propuesta educativa para el Per;
Gilbert Valverde, miembro del equipo tcnico
que elabor y analiz los resultados del Tercer
Estudio Internacional de Ciencia y Matemtica
(TIMSS) realizado en ms de cuarenta pases; y
Manuel Bello, decano de la Facultad de Educacin de la Universidad Cayetano Heredia y autor de un reciente balance de la educacin peruana que ser publicado como parte de la serie
Carta de Navegacin.3
Este nmero de Crecer incluye otros dos artculos sobre la evaluacin del LLECE. El primero est dedicado a describir algunas discrepancias tcnicas que el equipo a cargo de la evaluacin
en el Per sostuvo, en su momento, con la coordinacin del LLECE. Conocerlas puede ayudar
a formar una visin balanceada de las implicancias
de los resultados. El otro artculo analiza las diferencias de rendimiento entre los pases, indicando en qu casos se puede hablar de diferencias
estadsticamente significativas (es decir, que no

Ver contra cartula de esta revista para indicaciones sobre cmo acceder al portal.
Conferencia Anual de Ejecutivos.
Estos documentos han sido entregados al nuevo gobierno.
Programa Internacional para la Evaluacin de Estudiantes (Program for International Student Assessment).

son resultado del azar) entre los puntajes obtenidos en las pruebas.
Finalmente, incluimos dos artculos orientados a presentar los planes inmediatos de la UMC.
El primero presenta las caractersticas generales
de la tercera evaluacin nacional que se realizar en noviembre prximo. Estas caractersticas
han sido presentadas y discutidas con especialistas de todo el pas y pensamos que deben ser
compartidas con un pblico ms amplio. Tal vez
la particularidad ms importante de la prxima
evaluacin sea que por primera vez llegaremos
a escuelas rurales multigrado y unidocentes. Tambin es de destacar la variedad en el tipo de
preguntas que utilizaremos en las pruebas. El
segundo artculo presenta las caractersticas centrales de la evaluacin internacional PISA4 , de la
Organizacin para la Cooperacin y el Desarrollo Econmico (OCDE), dado que el Per se ha
comprometido a participar en ella. Los primeros
resultados de esta evaluacin se deberan publicar en diciembre del 2002.
La publicacin de estos artculos, como otras
actividades de la UMC, es parte de nuestro esfuerzo por generar, de manera sistemtica, informacin que pueda servir a diversos usuarios
como insumo en el proceso de identificacin de
acciones necesarias para mejorar la calidad de la
educacin peruana.

La polmica tarea de evaluar la calidad

Len Trahtemberg

Experto en educacin y Director General del Colegio Len Pinelo

abida cuenta que el movimiento de los estndares


de contenidos y rendimiento ya lleg al Per,
impulsado por los organismos internacionales, vale
la pena revisar algunos de sus antecedentes, fundamentos y objeciones para ubicarnos en el
mejor plano posible.
Estos organismos internacionales se han nutrido del debate interno en Estados Unidos iniciado hace unos aos como consecuencia de las
crecientes evidencias sobre el descenso en el
rendimiento que tuvieron los estudiantes de ese
pas que culminaron la secundaria en las dcadas
de 1970 y 1980. Las mediciones desalentadoras
que se obtenan con las pruebas NAEP y SAT
(Una nacin en riesgo, 1993), as como los bajos
resultados comparativos obtenidos frente a los
estudiantes europeos y asiticos en el TIMSS,
motivaron a los polticos norteamericanos a promover el establecimiento de estndares nacionales que sirvieran, a la vez, como metas y como
medidas de progreso hacia esas metas, para evaluar la educacin escolar de los estudiantes
norteamericanos.
Sin embargo, no todos los antecedentes acadmicos respaldaban el uso de las pruebas estandarizadas.
Por ejemplo,
un estu-

dio de cinco aos reportado en 1986 por Donald


Dorr-Bremme y Joan Herman, de la Universidad de California confirmado por otros estudios de 1990 y 1992 mostraron que los profesores entrevistados no usaban los resultados de
las pruebas para mejorar su enseanza, porque
no los consideraban una buena medida de lo
que ellos enseaban. Adems, los resultados llegaban meses despus de aplicadas las pruebas,
sin especificar el detalle de cada alumno, por lo
que no servan como retroalimentacin.
Lo paradjico era que a pesar de ello las
pruebas tenan un enorme impacto en la vida
del aula, porque los profesores se sentan obligados a ensear en funcin de ellas, ms an si sus
resultados definan sus promociones y bonificaciones. Ocurri entonces que los profesores
empezaron a entrenar a los alumnos para mejorar sus puntajes en estas pruebas, dejando de
lado aquellos temas que, siendo importantes, no
seran evaluados.
De la fracasada experiencia israel tambin
aprendemos los inconvenientes que ocasiona el
intento de generar igualdad de oportunidades a
partir de la exigencia de estndares iguales de
contenido y rendimiento para todos los alumnos. Los resultados de las pruebas segmentaron
a los alumnos en dos: los que lograron puntajes
altos (generalmente ms por su procedencia socioeconmica y cultural que por la labor del colegio) y los que lograron puntajes bajos, lo que
llev a etiquetar negativamente a los alumnos y
a los profesores de los colegios ms bajos. Los
resultados aumentaron la presin de los
padres por mandar a sus hijos a los mejores colegios pblicos y gener una gran
frustracin en quienes tenan que conformarse con los colegios de menores logros o
emergentes, especialmente los de zonas
perifricas que atendan a alumnos de procedencias tnicas o econmicas con desventajas
econmicas o sociales (hijos de pobres, hijos
de inmigrantes, etctera).
De qu estndares estamos hablando?
Hay tres tipos de estndares bsicos: los
estndares de contenidos (que se encuentran en

los programas oficiales), que establecen el listado de temas o competencias que deberan ser
aprendidos por todos los alumnos; los estndares
de desempeo, que definen los grados de avance
o niveles de logro alcanzados por los alumnos; y
los estndares sobre las oportunidades para aprender, referidos a los programas, profesores, equipos y otros recursos disponibles para que cualquier alumno pueda alcanzar los estndares de
contenido y desempeo.
La experiencia mundial ensea que, tomados como conjunto, los colegios ms pobres siempre alcanzan menores logros de desempeo que
los colegios econmicamente ms solventes. Sabemos que el nivel socioeconmico de las familias de los alumnos es un predictor directo de su
aprendizaje en el colegio. Por ello, medir a todos
con la misma vara resulta inequitativo y
discriminatorio, ya que a igualdad de logros esperados, el esfuerzo que deben hacer los alumnos pobres para alcanzarlos es mucho mayor
que el que deben hacer los alumnos de familias
bien dotadas. Los estndares nacionales pueden
crear la ilusin de que todos tienen una posibilidad razonable de alcanzar los mismos
estndares; pero como eso no va a ocurrir, se
tender a culpar a los profesores o a los alumnos
pobres por no haberse esforzado lo suficiente.
Esto termina privilegiando a los centros educativos privados de mayor nivel, cuyos alumnos exhibirn de manera natural los rendimientos
ms meritorios. No pocas voces habrn de surgir entonces para sugerir alguna forma de
privatizacin de la educacin.
Para qu se aplican estas pruebas?
Debemos clarificar para qu se aplican estas pruebas y qu se puede concluir a partir de ellas. En
el caso norteamericano, la racionalidad que sostiene el uso de las pruebas estandarizadas para
medir el avance en la adquisicin de los conocimientos o las competencias que harn que los
alumnos sean ms competitivos cuando ingresen al mercado laboral y tengan un impacto favorable en el desarrollo cientfico y econmico del
pas, choca con las evidencias de que quienes
obtienen altos puntajes en las pruebas no necesariamente son los alumnos mejor formados y
con mayores probabilidades de xito en sus desempeos extraescolares. Lo que realmente miden estas pruebas es la capacidad de los alumnos
de rendir bien en pruebas similares, nada ms.
Adria Steinberg, Roberta Tovey, y Howard
Gardner (Focus Series # 2, The Harvard
Educational Letter,1996) plantean que las pruebas estandarizadas solo enfocan el uso estrecho

del conocimiento que hace una cabeza individual en un momento determinado, pero son
psimos predictores del xito postescolar.
Por otro lado, sostienen que la mayora de
las pruebas evalan solamente las inteligencias
lingstica y lgico-matemtica, por ser las ms
fciles de medir, pero desconocen todas las otras
inteligencias de los estudiantes que pueden promover el xito en sus vidas. Como resultado de
ello, generalmente fallan en predecir cun bien
un alumno se desempear en los niveles
postsecundarios o en el puesto de trabajo. Mucho menos permiten hacer inferencias sobre el
desempeo del pas en su conjunto. Por ejemplo en el TIMSS los asiticos sacan puntajes muy
altos pero no alcanzan el desarrollo econmico,
cientfico y tecnolgico que logra Estados Unidos, que se ubica a media tabla.
La misma lnea de pensamiento la tiene el
experto norteamericano en economa de la educacin Dr. Henry Levin, de las universidades de
Stanford y Columbia. En su artculo publicado en
Educational Researcher (vol. 27, N. 4, mayo de
1998) l expresa su desacuerdo con quienes
han venido asumiendo una relacin positiva entre un incremento en los logros acadmicos (medidos en la forma de puntajes ms altos en las
pruebas estandarizadas) y el incremento en la
productividad del trabajador.
Levin sostiene que en la investigacin no
hay sustento alguno como para argumentar que
estndares ms altos y desempeos ms elevados en pruebas estandarizadas sean las claves
para una mayor productividad en el trabajo y
mejores ingresos en la vida laboral. l dice que
no hay duda de que a ms aos de educacin, el
adulto obtiene mejores ingresos; pero que eso
no implica que los nuevos estndares traern
consigo una mayor productividad en la economa.
Uniformizacin
Otro efecto lamentable de la estandarizacin de
contenidos es que al exponer a todos los colegios al mismo criterio de xito o calidad, se les
obliga a ceirse a ellos sacrificando su identidad y
orientacin particulares. Esto lleva a un perjudicial estrechamiento del currculo porque la administracin de estas pruebas y el uso de sus
resultados para otorgar estmulos econmicos a
los profesores y colegios alienta a los directores y
docentes a que se preocupen por ensear solamente aquello que aparecer en las pruebas,
para convertir a los alumnos en buenos
solucionadores de tests.
Esto es ms notorio aun en aquellos casos
en los que se usa la evaluacin computarizada,

porque esto desplaza a varias importantes reas


del currculo que son muy enriquecedoras para
los alumnos pero difciles (o imposibles) de evaluar mecanizadamente; por ejemplo, los programas de arte. Curiosamente, alumnos que desarrollan buenos programas de arte logran mejores
desempeos postescolares que muchos de aquellos que se dedican a la computacin. Adquirir
cualquier habilidad artstica requiere paciencia y
perseverancia, desarrollar sensibilidades especiales y adems alienta a los nios a ser confiados
en s mismos y autodisciplinados. Con seguridad,
estas son metas importantes del sistema educacional.
Qu tienen de positivo?
Quienes promueven estas pruebas ven en los
estndares una manera de elevar las exigencias
y con ello los rendimientos. Encuentran que sirven a la vez como metas y como medidas de
progreso hacia esas metas impulsando hacia arriba el desempeo de los alumnos. Adems, afirman, proporcionan proteccin al consumidor
mediante el suministro de informacin precisa a
estudiantes y padres.
Por otro lado, estos estndares nacionales
cumplen la funcin coordinadora de las diversas
partes del sistema educativo: los profesores que
preparan sus lecciones, las universidades que
forman profesores, los diseadores de programas para apoyar la educacin y los expertos que
preparan las pruebas de rendimiento.
Sin embargo, quienes se preocupan por la
igualdad de oportunidades confrontan lo anterior sosteniendo que estos estndares se convertirn en sobreexigencias para los grupos ms
dbiles, lo que a la larga llevar a producir mayores fracasos en los nios pobres, a facilitar su
estigmatizacin negativa y a promover la
privatizacin.
El Laboratorio de Medicin de Calidad de la
UNESCO (1997)
En el caso peruano, la decisin de incorporarnos
a un esquema de evaluacin comparativa internacional ha estado llena de errores de los cuales
es necesario sacar importantes lecciones.
a) Un primer gran error fue ingresar a la medicin comparativa internacional de manera
inconsulta y autoritaria, sin haberlo debatido
previamente en la comunidad educativa nacional para preparar el terreno para sacarle
provecho, y sin haber acumulado previamente suficiente experiencia nacional para
conocer sus alcances y limitaciones para el
caso peruano.

b) Otro gran error cometido estuvo en las inadecuadas estrategias de involucramiento de


los centros educativos de la muestra que
utiliz el Ministerio de Educacin a la hora
de aplicar las pruebas. Nuevamente de manera autoritaria y descorts, lejos de pedir la
colaboracin de los colegios se les conmin
a participar, sin beneficiarse de la motivacin
que podran haber comunicado los profesores a los alumnos participantes. Despus de
aplicadas las pruebas, no se les devolvi ni a
los profesores ni a los alumnos los resultados, por lo que no les han podido dar ningn uso. La publicacin de resultados
globales no sirve de manera especfica a cada
colegio participante.
c) Otro tremendo desacierto fue la argumentacin oficial para no publicar los resultados,
aduciendo atingencias tcnicas que lejos
de ser puestas a consideracin de los expertos junto con los resultados sirvieron
como excusa para ocultarlos, lo que tan solo
corrobor que el Per haba salido muy mal
(los resultados buenos no se esconden) y
que todo esto era una simple maniobra poltico-electoral. Adems, con el antecedente del uso de la infraestructura educativa
para fines electorales, se desacredit totalmente la Unidad de Medicin de Calidad y
cualquier documento que ella pudiera producir.
d) Si bien en los ltimos meses se han empezado a publicar los resultados globales y comparativos entre los pases que participaron
del Laboratorio de Medicin de la Calidad

de UNESCO 1997, mientras no se publiquen las preguntas no se podr saber realmente de qu tipo de habilidades, conocimientos o competencias carecen los alumnos
peruanos evaluados, por lo que quedan truncados el juicio correcto sobre el nivel de su
desempeo y la retroalimentacin destinada a superar las deficiencias.
e) Los resultados publicados respecto al psimo desempeo de los estudiantes peruanos en matemtica y lenguaje, o a que la
educacin privada rinde mejor que la pblica y a que sta va de mejor a peor desde las
zonas urbanas costeas monolinges hacia
las urbano-marginales y rurales bilinges de
sierra y selva, no nos dicen nada nuevo. Tantos millones de dlares invertidos para saber
aquello que poda haberse conocido con una
buena muestra nacional? Hasta qu punto
en esta era de la tercerizacin se justifica el
establecimiento de una burocracia ministerial para cumplir una tarea que poda entregarse a algunos centros de investigacin de
universidades?
f) Seamos claros: mientras el Per no salga de
su pobreza, sus logros educacionales (tomados como conjunto) no llegarn muy lejos y
todas las pruebas que se apliquen producirn la misma informacin ya conocida que
refleja la estratificacin educativa de la sociedad peruana. La medicin del impacto de
los factores asociados con el bajo rendimiento como son la tasa de alfabetizacin de adultos, el ndice de desarrollo humano, el producto bruto interno per cpita y el gasto en

educacin como porcentaje del gasto pblico corrobora esta presuncin.


Reflexin final
El nfasis en las pruebas nacionales convencionales puede terminar distrayndonos de asuntos ms centrales como la bsqueda de una educacin integral que procure el desarrollo personal,
social, cvico, cientfico, fsico, tico, artstico y esttico de los jvenes. Por lo tanto, si el movimiento por los estndares procurara identificar
los avances en esas reas podra ser muy interesante. Pero si eso es lo que se pretende, cmo
se lograr a partir del uso de los estndares y las
pruebas convencionales que pretenden medir
habilidades en lenguaje y matemtica?
Igualmente lamentable es que aun en lenguaje y matemtica, sabiendo que las pruebas
convencionales tienen severas limitaciones de
diseo, no se utilizan estrategias ms relevantes.
Por ejemplo, que el desempeo evaluado sea el
producto de una construccin original y no una
reproduccin del conocimiento ya existente, o
la habilidad para encontrar informacin y comunicar las ideas en forma coherente.
No hay que ser adivino para predecir que
esos objetivos sern retirados de los estndares
nacionales y nos quedaremos solamente con los
que se puedan medir uniformemente, como por
ejemplo los que se obtienen de las pruebas de
matemtica, lenguaje y ciencias.
Quiz trabajar con muestras ms pequeas
pero con evaluaciones ms integrales nos dara
informacin mucho ms significativa.

Hacia una educacin basada en evidencias


Manuel E. Bello

Decano de la Facultad de Educacin de la Universidad Peruana


Cayetano Heredia

l ao 2000 fue especialmente significativo para


los educadores peruanos, pues se abri una valiosa oportunidad para el conocimiento de la realidad educativa y el debate, a partir de la difusin
de los resultados de dos importantes evaluaciones: la de CRECER 1998, realizada a escala nacional por el Ministerio de Educacin1 , y la del
Laboratorio Latinoamericano de Evaluacin de
la Calidad de la Educacin (LLECE), realizado
por la UNESCO en trece pases del continente2 . Hasta noviembre del 2000 la nica medicin de alcance nacional disponible del rendimiento de los escolares era la de un estudio
realizado por el Ministerio de Educacin en 1981.
Desde 1981 han pasado veinte aos, durante los cuales los pases de la regin que ms
han avanzado en materia educativa han contado con evaluaciones peridicas del rendimiento escolar y de la calidad
educativa. En la medida que
se contine con esta sana
prctica de evaluar y divulgar los resultados, el hecho
de contar con resultados
confiables y pblicos servir para conocer y comprender la situacin real,
adoptar polticas y programas pertinentes basados en evidencias,
as como para juzgar
su eficacia y asignar
responsabilidades.
Los resultados
de una medicin o
dos no son suficientes por s solos para extraer
conclusiones firmes o para sustentar polticas
pertinentes y
eficaces. Se
requiere de
un sistema
integral de

observacin y evaluacin de la educacin, y de


una serie de experiencias sucesivas de medicin
del rendimiento escolar y de los factores que lo
condicionan, incluyendo la participacin del pas
en diversas pruebas internacionales, para conocer la verdadera situacin y las tendencias de un
asunto de tanta complejidad como es la educacin.
No es posible afirmar enfticamente, sobre
la base de la evaluacin de la UNESCO, que la
educacin peruana ha empeorado o que no ha
mejorado en los ltimos aos, puesto que se
carece de mediciones previas equiparables a la
del LLECE que sirvan para la comparacin. Se
puede tomar esta medicin como una lnea de
base, para fijar metas de desarrollo y para que las
prximas mediciones permitan evaluar los efectos de los esfuerzos recientes y los de los prximos aos.
Sin embargo, el anlisis de los resultados del
LLECE, asociado a los datos de CRECER 1998 y
a los antecedentes y referentes de contexto disponibles, permite realizar algunas reflexiones
diagnsticas e identificar asuntos que debieran
tenerse en cuenta con prioridad en las polticas y
estrategias de cambio a ser aplicadas en el perodo gubernamental que est por comenzar.
Proveer educacin bsica de calidad a todos
Los resultados peruanos del LLECE refuerzan la
tesis de que la ampliacin de la cobertura escolar
que en el Per ha llevado a que casi la totalidad de nias y nios entre 6 y 14 aos se incorporen a la escuela no ha resuelto el problema
del acceso a la educacin, en la medida que el
acceso a la escuela primaria no estara garantizando el logro de aprendizajes esenciales previstos en el currculo oficial. De la situacin anterior, de exclusin absoluta de la escuela de muchos
menores en edad escolar, se ha pasado a una
realidad de discriminacin de alumnas y alumnos
ms vulnerables al interior del sistema escolar.
Son muchos los nios y las nias que asisten durante algunos aos a la escuela slo para fracasar
o alcanzar un nivel de aprendizaje muy insuficiente. A pesar del esfuerzo de crecimiento realizado en las ltimas dcadas, el pas no est lo-

grando dar a todos la educacin de calidad que


se requiere para el desarrollo y que est prevista
como derecho en la Constitucin Poltica del Estado
Los ministros de Educacin de Amrica Latina y el Caribe, reunidos en Cochabamba (6 de
marzo del 2001), han reiterado que la educacin es ante todo un derecho bsico de las personas que los Estados, a travs de sus gobiernos,
tienen la responsabilidad ineludible de hacerlo
efectivo3 . Un derecho bsico de cada nia, de
cada nio, no importa en qu lugar del territorio
nacional haya nacido y est creciendo; un derecho que como bien han sealado los ministros
y conviene reiterar los gobiernos tienen la
responsabilidad ineludible de hacerlo efectivo.
Este derecho ya estaba reconocido por la
comunidad internacional desde el 10 de diciembre de 1948, cuando la Asamblea General de
las Naciones Unidas, reunida en Pars, aprob la
Declaracin Universal de los Derechos Humanos un mandato para todos los estados miembros que en su artculo 26 dice: Toda persona
tiene derecho a la educacin. La educacin debe
ser gratuita, al menos en lo concerniente a la instruccin elemental y fundamental. La instruccin
elemental ser obligatoria.
Si bien la evaluacin del LLECE presenta los
resultados en trminos comparativos, con referencia a normas y no a criterios, la ubicacin del
Per en las ltimas posiciones tanto en lenguaje
como matemtica y las marcadas diferencias de
rendimiento entre estudiantes de diferentes estratos (megaciudad, urbano y rural; privado y
pblico) indican que los nios y las nias de los
sectores mayoritarios, ms pobres y vulnerables
(escuela pblica, rural), no estn recibiendo una
educacin que satisfaga su derecho bsico al
aprendizaje de competencias culturales esenciales.
Principales resultados del LLECE en el Per
Las pruebas del LLECE fueron construidas a partir
de una identificacin de los objetivos y contenidos comunes encontrados en los planes curriculares de tercer grado de primaria de los pases
participantes en el estudio. Se construyeron dos
pruebas equivalentes de lenguaje y de matemtica, que fueron revisadas por expertos y validadas mediante una aplicacin piloto en todos los
pases. La prueba de lenguaje incluy reactivos
sobre comprensin lectora, prctica
metalingstica y produccin de textos; estos ltimos no fueron tomados en cuenta en la calificacin final. La prueba de matemtica puso el acento
en numeracin y operatoria con nmeros natu-

rales. Adems se aplicaron encuestas para conocer caractersticas de las alumnas y los alumnos, docentes y directivos, y cuestionarios sobre
los centros educativos4 , con el fin de explorar
factores asociados al rendimiento.
En el estudio del LLECE se previ realizar
comparaciones segn tamao del conglomerado poblacional (megaciudad un milln de
habitantes o ms, urbano y rural menos de
2500 habitantes) y segn el tipo de gestin
(pblico y privado). Las pruebas se aplicaron a
estudiantes de tercer y cuarto grado, para medir
la contribucin de un ao ms de escolaridad al
aprendizaje.
Los resultados consolidados del LLECE ubican a los estudiantes de tercer grado de Per en
el antepenltimo lugar en lenguaje y ltimo en
matemtica, con una mediana bastante por debajo de la media de los doce pases5 . Al comparar entre tercero y cuarto grados se observa un
aumento significativo en casi todos los pases, que
indicara que en cuarto grado muchos estudiantes estn completando los contenidos de tercero. El aumento en el caso del Per es mayor que
el del promedio de los dems pases, con lo cual
su posicin mejora pasando del puesto once al
noveno en lenguaje y del ltimo al penltimo en
matemtica. A pesar de ello, la mediana de los
alumnos del Per en cuarto grado se mantiene
por debajo de la media del conjunto de los pases.
La comparacin por estratos refleja la desigualdad de la educacin peruana, mayor que la
de muchos de los otros pases, pues en lenguaje
Per se ubica en sexto lugar cuando se trata de
megaciudades, antepenltimo en rea urbana y
ltimo en rea rural, siendo el nivel de rendimiento bastante ms bajo en este sector que en
los otros; en matemtica el puesto no vara, pero
s se aprecia de la mediana que el rendimiento
en rea rural es muy inferior al de las zonas
urbanas. La brecha entre megaciudad y urbano,
y entre urbano y rural en el Per es de las ms
grandes entre todos los pases, tanto en tercero
como en cuarto grado, tanto en matemtica como
en lenguaje. El patrn de diferenciacin es el
mismo en casi todos los pases, pero la brecha es
mayor en el Per que en la mayora de los dems.
La misma desigualdad se aprecia en los resultados peruanos al comparar sector pblico con
privado. La diferencia entre uno y otro es grande, pero adems la posicin comparativa de la
educacin pblica peruana con respecto a la de
los otros pases es peor que la de la educacin
privada: en lenguaje, los alumnos del sector pri-

vado se ubican en sexto lugar, con una mediana


ligeramente por arriba del promedio de todos
los pases, en contraste con el dcimo lugar en
que se ubican los del sector pblico; en matemtica, los del sector privado ocupan el octavo
lugar, en tanto que los de escuelas pblicas se
ubican ltimos. En general, los resultados de las
nias y los nios peruanos en la prueba de matemtica son ms deficitarios que los que alcanzaron en la prueba de lenguaje.
Significado de los resultados del LLECE
para el Per
Las diferencias encontradas segn estrato o conglomerado poblacional y segn tipo de gestin
coinciden con los resultados de mediciones anteriores realizadas en el Per6. La explicacin de
estas diferencias debe estar relacionada tanto con
las condiciones de educabilidad de los alumnos
asociadas a la situacin de pobreza y
marginalidad de sus familias como con la calidad de la gestin del sistema escolar y de la propia accin educativa en las escuelas. Ya se ha
dicho antes que en el Per los nios y las nias
ms pobres y vulnerables, ubicados sobre todo
en las ciudades pequeas y en las zonas rurales,
reciben la peor educacin escolar.
El concepto de educabilidad alude en este
caso al grado o nivel de desarrollo en cada individuo de caractersticas biolgicas y personales
que afectan su capacidad para beneficiarse en
mayor o menor medida de las oportunidades de
aprendizaje que le brinda la escuela. Se trata de
factores modificables en la poblacin a travs de
polticas sociales y superables en cada persona a
travs de estrategias compensatorias y de rehabilitacin 7 . Las deficientes condiciones de
educabilidad de las nias y los nios pobres del
Per seran una parte de la explicacin del bajo
rendimiento, puesto que, como seala Tedesco:
Por debajo de la lnea de subsistencia, los cambios
institucionales o pedaggicos no tienen impacto en
los resultados escolares de los alumnos8 .
En el caso del Per y otras sociedades, un
aspecto esencial del desarrollo cognitivo bsico
requerido para aprender en la escuela es el
desarrollo cultural y lingstico, puesto que muchos miles de nios y nias al ingresar a la escuela se encuentran con el predominio de una cultura y una lengua que no es la de ellos; con
frecuencia provienen de familias con padre y
madre analfabetos absolutos o funcionales, cuya
vida cotidiana no pasa por el uso del texto escrito
elemento medular de la escuela como recurso utilitario o recreativo; adems, muchas veces los patrones de relacin y de convivencia en

sus hogares son muy distintos de los que priman


en la escuela, que corresponden ms
cercanamente al estilo de vida de las familias de
las clases medias urbanas.
Otra parte de la explicacin de los bajos
niveles de rendimiento y las desigualdades reflejados en las pruebas del LLECE se encontrara
en las deficiencias de la gestin del sistema y de
las escuelas, y en la calidad de las prcticas educativas en las salas de clase. Un factor
condicionante principal de estos problemas es el
reducido presupuesto asignado a la educacin,
que destina una inversin anual por estudiante
muy inferior a la que se encuentra en otros pases de la regin9 . Pero, adems, los bajos niveles
de rendimiento y las desigualdades pueden atribuirse al marcado centralismo en la gestin del
sistema, as como a la ausencia de polticas eficaces orientadas explcitamente al fortalecimiento
de capacidades pertinentes en el mbito local y
del centro educativo y al logro de una mayor
equidad en los resultados educativos a travs de
una distribucin de recursos que privilegie a quienes enfrentan mayores carencias.
De otro lado, el rendimiento en matemtica
de las nias y los nios del Per aparece an
peor ubicado que el que alcanzan en lenguaje,
lo que reclama un tratamiento especial. Esta
mayor debilidad puede deberse a la menor atencin que se
ha dedicado en los
ltimos aos en el
Per a la enseanza
de la matemtica. Tanto en el proyecto llamado de Articulacin entre Educacin Inicial y
Primaria como en el proceso de modernizacin de
la educacin primaria de los
ltimos aos (nuevo currculo, capacitacin de docentes, etctera), se ha puesto
ms nfasis en el rea de comunicacin y en particular
en el aprendizaje de la lectura
y escritura que en el aprendizaje de la matemtica. As pues,
en el caso de los resultados de
matemtica, a la situacin general
descrita se agrega la severa debilidad curricular y metodolgica, terica y prctica, que se aprecia en el
Per en el mbito de la enseanza
de la matemtica.
La ventaja que logran los centros

educativos privados sobre los pblicos en el continente y en particular en el Per no pueden ser atribuidos fcilmente a una supuesta superioridad de la gestin privada sobre la pblica.
Las escuelas privadas, en comparacin con las
pblicas, reciben nios y nias con mejores condiciones de educabilidad, siendo sus recursos materiales y posibilidades operativas tambin mayores, por lo que el diferencial favorable en sus
resultados podra deberse a estos factores y no al
tipo de gestin. Las enormes diferencias sociales
y materiales entre la escuela privada y la pblica
no permiten relacionar los resultados de una y
otra con el tipo de gestin o la calidad de la prctica pedaggica en las aulas. Para comparar gestin privada y pblica habra que aislar todos los
otros factores que de un modo complejo y
holstico determinan el rendimiento de los alumnos.
Propuestas para mejorar
Las polticas para la superacin de los problemas
de falta de equidad y baja calidad de la educacin
primaria necesitan del soporte de la actuacin
eficaz de otros sectores del Estado responsables
de la salud, la alimentacin, la lucha contra la
pobreza, el cuidado y la crianza de
nias y nios

pequeos, en la medida que estos factores inciden de manera directa y profunda sobre las posibilidades de aprovechar las oportunidades que
la escuela brinda para aprender. Para decirlo una
vez ms con palabras de Tedesco, Si bien la
educacin es un factor de equidad social, ciertos
niveles bsicos de equidad social son necesarios
para que sea posible educar con posibilidades de
xito10 . La educacin y los educadores tienen que articularse con el conjunto de las polticas sociales y estrategias de superacin de la
pobreza.
Por otro lado, resulta urgente avanzar en la
descentralizacin de la gestin del sistema educativo y en el fomento de niveles crecientes de
autonoma, iniciativa, participacin y responsabilidad por los resultados en cada centro educativo, de modo que stos puedan demandar los
recursos y apoyos que correspondan a sus propios planes de desarrollo institucional y local. Esta
poltica general se debe complementar con otra
que apunte a la equidad, por medio de la asignacin de mayores posibilidades y recursos a las
zonas de mayor vulnerabilidad. Sera conveniente
declarar en emergencia la educacin rural y desarrollar un ambicioso plan integral de desarrollo
educativo con un firme respaldo poltico,
desde el nivel presidencial, que permita superar obstculos burocrticos o legales.
Adems de la prioridad a los estratos

sociales ms pobres, la evaluacin del LLECE y


otras llevan a considerar la necesidad de contar
con un fuerte programa nacional para el mejoramiento del ciclo educativo responsable del logro
de aprendizajes esenciales en el perodo de inicio de la escolaridad, que asegure la alfabetizacin de todos los nios y las nias del Per11 .
Dicho programa debera comprender la generalizacin de la educacin inicial escolarizada
desde los 4 aos de edad, la especializacin de
docentes en la atencin al ciclo que va de los 4
aos hasta el cuarto grado, la asignacin de los

Unidad de Medicin de la Calidad (noviembre


2000), boletn Crecer 5/6. Lima: Ministerio
de Educacin.
Laboratorio Latinoamericano de Evaluacin
de la Calidad de la Educacin (1998). Primer
estudio internacional comparativo sobre lenguaje, matemtica y factores asociados en tercer y cuarto grado de la educacin bsica. Santiago de Chile: UNESCO.
Declaracin de Cochabamba (6 de marzo de
2001), de los ministros de Educacin de Amrica Latina y el Caribe. PROMEDLAC VII,
UNESCO.
Para mayores detalles se recomienda consultar el informe contenido en el Boletn UMC 9
de la Unidad de Medicin de la Calidad del
Ministerio de Educacin, que se puede encontrar en la pgina web del Ministerio de Educa-

mejores profesores y profesoras de inicial y primaria a estos grados, el otorgamiento de bonificaciones e incentivos especiales a quienes trabajen con xito en estos grados especialmente
con poblaciones vulnerables, la inversin prioritaria en medios y materiales para este ciclo y el
fortalecimiento de la enseanza inicial de la matemtica, entre otras estrategias.
Por ltimo, una de las principales enseanzas del LLECE es que la informacin que proporcionan las evaluaciones es sumamente valiosa para alimentar el anlisis y la discusin sobre

6
7

8
9

cin del Per (http://www.minedu.gob.pe).


Los informes del LLECE se refieren a doce
pases y no a trece porque excluyen los resultados de Costa Rica.
Ver boletn Crecer 5/6 del Ministerio de Educacin del Per.
En la educacin especial tradicionalmente se
ha clasificado a los nios como educables o
entrenables, en funcin de una estimacin
bastante arbitraria de su potencial y los techos de su desarrollo, asociados a condiciones biolgicas o genticas supuestamente
inmodificables.
Juan Carlos Tedesco (1998), Carta informativa
del IIPE, vol. XVI, N 4. Pars: UNESCO.
Al respecto ver, por ejemplo, el estudio de
Jaime Saavedra y Pablo Surez presentado en
el boletn Anlisis y Propuestas N 4 (julio 2001),

los problemas y logros del sistema educativo. Es


de esperar que el Ministerio de Educacin siga
impulsando una poltica de construccin de un
sistema nacional de observacin y evaluacin de
la educacin, as como la participacin del Per
en estudios internacionales de la calidad educativa y logros de aprendizaje, para que en el futuro cercano el pas cuente con polticas educativas basadas en evidencias y evaluadas por sus
resultados.

publicado por GRADE (Grupo de Anlisis para


el Desarrollo, Lima) con el ttulo: Las familias
y el financiamiento de la educacin pblica en
el Per.
1 0 Obra ya citada.
1 1 El concepto actual de alfabetizacin incluye,
adems del dominio de la lectura y la escritura, la matemtica elemental y otros aprendizajes esenciales para seguir aprendiendo dentro y fuera de la escuela y para participar en la
vida social.

La poltica educativa peruana y las


evaluaciones educacionales internacionales

10

Gilbert A. Valverde

Ph. D., Universidad de Chicago, Profesor de Poltica Educativa en la Universidad del Estado de
Nueva York en Albany, y miembro del Grupo de Trabajo Sobre Evaluacin y Estndares del
Programa para Promover la Reforma Educativa en Amrica Latina (PREAL)

ran parte del debate en torno a la poltica educativa de cualquier parte del mundo tiene hoy una
dimensin internacional. Presidentes y ministros,
legisladores, asociaciones profesionales, autoridades responsables de la poltica educativa y otros
actores no gubernamentales se preocupan de
comparar las polticas, las prcticas y los resultados de un pas frente a los de otros.
Un ejemplo importante de esta tendencia
son las naciones que pertenecen a la Organizacin de Cooperacin y Desarrollo Econmico
(OCDE), que estn dedicadas a la recoleccin y
el uso de datos sobre el rendimiento comparativo de sus sistemas educativos y utilizan esta informacin como insumo importante para la determinacin de polticas en ese campo.
Conscientes de la naturaleza crecientemente
competitiva e internacional de la determinacin
de polticas, los pases en vas de desarrollo tambin recurren a la comparacin de sus sistemas
educativos ms all de sus fronteras, con el objetivo de generar informacin necesaria para el
proceso de determinacin de polticas nacionales.
La evidencia ms reciente de esto, entre los
pases en vas de desarrollo, son los esfuerzos del

Laboratorio Latinoamericano de Evaluacin de


la Calidad de la Educacin (LLECE), en los que el
Per ha participado. El LLECE viene a ser el
primer esfuerzo del Per por participar en evaluaciones internacionales, y al mismo tiempo es
el primer esfuerzo de este tipo en el mbito
regional. Como tales, ambos eventos deben ser
considerados hitos significativos.
El LLECE es el primer intento de aprovechar la considerable variacin de los sistemas
educativos de Amrica Latina para generar informacin pertinente a polticas para la regin; y
la participacin del Per representa el primer
reconocimiento formal a escala ministerial
de que sin la ayuda de comparaciones internacionales, las personas encargadas de formular
polticas podran permanecer cautivas de nociones limitadas en cuanto a lo que los estudiantes
logran y a cmo pueden obtenerse logros superiores.
La comparacin entre sistemas educativos
no es nueva en s. Los orgenes de esta labor se
remontan por lo menos a tiempos de los escritos
de filsofos presocrticos; y a medida que surgieron los sistemas educativos modernos, se origin
tambin una corriente de conocimiento que
compara las causas y los resultados de una variedad de prcticas y objetivos educativos diferentes. Pero, qu significa comparar sistemas educativos? Qu tipo de conocimiento proporcionan
los estudios comparativos de los logros en la educacin? Cmo difiere este conocimiento de las
conclusiones basadas nicamente en evaluaciones nacionales? Cmo puede informar este conocimiento a las polticas de educacin en el Per?
Todas estas preguntas deben ser abordadas mientras se intenta recoger lecciones de la participacin en el LLECE.
Los resultados del LLECE1 sugieren que la
situacin respecto a lo que los escolares aprenden en el Per es descorazonadora. Los escolares peruanos estn lejos de alcanzar las altas expectativas establecidas por los polticos y el
personal directivo del sector, los observadores

sociales y de la educacin, y ms importante


an sus padres. Si confiamos en los resultados
de la participacin peruana en el LLECE, tal parece que, en promedio, los estudiantes no estn
adquiriendo un dominio de las herramientas cognitivas fundamentales que les permita obtener
una ventaja competitiva en la economa global.
Por mucho que pueda ser cierto que todas las
evaluaciones se ven forzadas a medir solamente
un subconjunto de las muchas metas establecidas por los sistemas educativos, los resultados de
la prueba del LLECE sugieren de manera clara
que en algunas reas de contenidos en lenguaje
y matemtica los estudiantes peruanos podran
no estarse desempeando de manera tal que se
comparen favorablemente con sus semejantes
de otros pases de la regin.
El rendimiento de los estudiantes de tercer
y cuarto grados en el Per estuvo por debajo del
promedio obtenido por los pases que participaron en el LLECE; y aunque la diferencia de notas
entre el tercer y cuarto grados sugiere que un
importante aprendizaje tiene lugar entre esos
dos grados, una evaluacin sincera de la situacin general sugiere que la educacin peruana
puede mejorarse en muchos aspectos, y que tal
mejora es la prioridad ms urgente.
Adems, como es comn en muchos pases
que han tenido que llegar a aceptar sus pobres
resultados en tales evaluaciones, el Per ha realizado los esfuerzos que le tocaban a fin de identificar responsabilidades en cuanto a su fracaso.
Obviamente, al no haber otros datos disponibles, es imposible determinar si la educacin
peruana ha mejorado, empeorado o permanecido igual como resultado de recientes esfuerzos
de reforma. Hay muchas opiniones sobre esto,
pero se basan en juicios subjetivos e individuales

sobre la anterior calidad educativa en el Per, y


son por tanto difcilmente concluyentes.
Ms importante que tratar sobre lo que el
LLECE no puede aclarar sera centrarse en una
cuestin que s puede ayudar al Per a tomar
una direccin: reflejan los logros actuales de los
estudiantes peruanos las metas y los objetivos
que el Per ha trazado para ellos? Si mostrar
niveles altos de resultados en relacin con otros
pases latinoamericanos es una meta del sistema
educativo, es obvio que el camino a recorrer
para alcanzarla se muestra bastante largo.
Pero qu tipo de camino sera ste? Qu
pasos puede dar el Per para mejorar el desempeo de sus estudiantes en comparacin con
sus pares de la regin? Acaso el saber que a los
estudiantes peruanos les fue mal en las olimpiadas
cognitivas latinoamericanas nos indica de qu
manera podr el pas resultar mejor en el futuro?
Puede que haya bondades intrnsecas en las tablas de mrito y esto es sealado por los informes del LLECE que plantean que los resultados
indican la importancia estratgica de las inversiones en la educacin. Quizs si fuera muy difcil
justificar la inversin en este sector, estos
ordenamientos por mritos o rankings puedan
de hecho ser recursos importantes para quienes
abogan por la educacin. Sin embargo, hay suficiente informacin en el LLECE como para sugerir estrategias especficas de inversin en la
educacin peruana? Podemos distinguir qu inversiones en este sector podran resultar las de
mayor valor estratgico en el Per? Ms all de
los rankings, quizs el propsito de la participacin peruana en las evaluaciones educacionales
internacionales debera ser descubrir las variables que explican los altos rendimientos, con miras
a usar tal conocimiento en el diseo y la imple-

mentacin de polticas dirigidas a promover calidad y excelencia en los resultados.


Qu se aprendi, ms all del orden
de mritos o ranking encontrado en Latinoamrica? Los primeros informes del
LLECE evocaron algunos problemas de polticas en la regin y en el Per en particular.
Obviamente hay diferencias importantes en
los logros acadmicos de los estudiantes de
los diversos estratos geogrficos del pas,
en tanto que los estudiantes de las megaciudades se desempean mejor que los
de otros escenarios urbanos, y a su vez
estos ltimos se desempean mejor que
los estudiantes de las escuelas rurales. Esto,
adems de indicar que los estudiantes de
escuelas pblicas peruanas logran menores niveles promedio que los de colegios
privados, indica tambin que la equidad de los
resultados educativos contina siendo un motivo
de preocupacin para la poltica educativa. Desgraciadamente, los resultados siguen siendo solo
indicativos y proporcionan una escasa idea en
cuanto a qu caractersticas de las ciudades y de
las escuelas son las que ms probablemente estaran asociadas a los rendimientos ms altos. Es
cierto que hay indicios de que el capital social y
econmico de las familias est relacionado con el
rendimiento, pero stos no son, por supuesto,
factores que puedan ser manipulados por la poltica educativa. El reto consiste en identificar los
factores que s puedan ser afectados por los sistemas escolares, a fin de orientar bien las inversiones en educacin. Pero los primeros informes
del LLECE no son suficientes en este aspecto.
Luego del informe inicial2 , el LLECE sigui
realizando anlisis ms detallados para esclarecer la influencia de una serie de factores en los
resultados obtenidos en matemtica y lenguaje,
sobre la base de pruebas tomadas en tercer y
cuarto grados. Estos anlisis sealaron que las
altas tasas de repeticin de grado estaban asociadas a los bajos niveles de rendimiento promedio
Tambin sealaron una serie de factores que, a
escala regional, parecen estar asociados a la mayor efectividad de las escuelas. Sin embargo parece extrao que los factores escogidos como
implicancias de polticas fueran, en orden de
importancia:
1) determinar si Cuba se compara favorablemente, o no, con pases tales como Estados
Unidos y Canad (ninguno de los cuales se
ha desempeado bien en recientes pruebas internacionales de rendimiento!);
2) invertir en educacin preescolar (a pesar de
que solo se encontr un efecto estadstica-

11

mente significativo en tres pases en el


Per parece que si bien el impacto es significativo, ste result bajo y se present solo
en la prueba de lenguaje; y
3) invertir en una serie de factores escolares
tales como bajar la tasa alumnos/profesor,
mayor cantidad de materiales educativos,
profesores con mayor experiencia, mayores
niveles de capacitacin docente, etctera.
Aunque sea difcil discernir los valores respectivos de cada factor, es solamente en el caso
de este tercer punto que estaramos hablando
de algo parecido a verdaderas implicancias de
poltica; es decir, de resultados que proporcionan metas especficas para la poltica educativa.
Adems, para el caso del Per, la influencia de
estos factores fue muy baja y raras veces fue
estadsticamente significativa. De hecho, un estudio ms detallado de los informes del LLECE
muestra de manera consistente que existen buenas razones para estar preocupados por la educacin peruana, pero no hay suficientes datos
que ayuden a comprender cules son los aspectos ms dbiles o ms fuertes del sistema, o
qu factores podran ser manipulados con mayores probabilidades de conseguir un impacto
positivo en los resultados educativos.
Afirmar que los resultados de LLECE son
sugerentes en lugar de concluyentes no es una
crtica comprometedora, pues en educacin no
hay ejemplos de causalidad entre cualquier factor o factores y progreso acadmico. Todos
los resultados son cuestionables y hasta los resultados ms robustos pueden ser refutados. Sin
embargo, podramos esperar que tales evaluaciones examinaran ms rigurosamente las caractersticas del sistema educativo, de tal manera
que pudieran guiar las decisiones futuras en poltica educativa. La limitacin particular de estos

1
2

12

esfuerzos
est ms relacionada con la escasez de
informacin sobre variables
estratgicas para la determinacin de polticas educativas.
El LLECE es solamente un comienzo, y se espera que no sea
la ltima palabra en cuanto a esfuerzos peruanos de participar en evaluaciones internacionales. Las evaluaciones internacionales sirven de espejo para la
educacin peruana y sus resultados. Solo observando algo ms que los logros educativos nacionales, dichas evaluaciones permiten reflexionar
al margen de las creencias y prcticas puramente peruanas que pudieran estar muy arraigadas
o simplemente de moda. La comparacin con
otros sistemas educativos puede ayudar a acrecentar la comprensin cientfica de la educacin
en el Per.
La participacin peruana en el LLECE es un
primer esfuerzo del Per por establecer un punto de referencia referido al desempeo de sus
escuelas en relacin con sus semejantes de la
regin. Los resultados sugieren cules podran
ser eventualmente los beneficios de tales esfuerzos. El Per debera buscar participar en ms
estudios que proporcionen informacin sobre
cmo otros pases persiguen una serie de metas
educativas y cules son las caractersticas
sistmicas, las prcticas de instruccin y otros
insumos y procesos educativos que sirven para
avanzar hacia las diferentes metas, y con la esperanza de identificar los factores con el mayor po-

tencial estratgico para poner en marcha el cambio deseado. Mantener una apertura en cuanto
a lo que se puede aprender de tales estudios
har posible que este tipo de informacin signifique una contribucin al debate pblico sobre
polticas y prcticas que puedan promover una
visin claramente peruana de cmo debe ser un
sistema educativo equitativo y de alta calidad.

LLECE (1998). Primer estudio internacional comparativo. Santiago, Chile: UNESCO-OREALC; y Boletn UMC 9 (2001), Lima: Ministerio de Educacin.
Willms, J. Douglas y Marie-Andree Sommers (2000). Resultados Escolares en Amrica Latina. New Brunswick: Canadian Research Institute for Social
Policy y Laboratorio Latinoamericano de Evaluacin de la Calidad de la Educacin.

Comentarios respecto a la participacin del Per en


el Laboratorio Latinoamericano de Medicin de la
Calidad Educativa (LLECE)1

Testimonio de parte

Juan Fernando Vega Ganoza

PLANMED

uchos de quienes lean este artculo no entendern


el porqu del ttulo; para ellos es esta breve explicacin. Una serie de circunstancias han dado pie a un
clima de desconfianza frente a las declaraciones
del Ministerio sobre discrepancias tcnicas entre el
equipo peruano y el del Laboratorio, y la existencia
de observaciones al informe final. Este texto presenta los argumentos del equipo tcnico. Y lo hace
como un testimonio de parte porque aunque
quienes tuvieron esta tarea a su cargo no estn ya
en el Ministerio a quien redacta estas lneas le
toc ser el jefe de la oficina de la que depende la
Unidad de Medicin de Calidad desde su creacin. Pero este texto podra ser visto tambin como
el cumplimiento de la obligacin de facilitar informacin til respecto de un tema de inters pblico;
al fin y al cabo, la desconfianza se aliment de la
falta de comunicacin.
Cuando preparamos el Boletn UMC 9 en el
que se report los resultados de Per en el
LLECE2 , y atendiendo al clima aludido, optamos
por retirar del texto que habamos preparado las
secciones que daban cuenta de los lmites tcnicos encontrados. El objetivo era, precisamente,
no complicar la presentacin de un material que
haba sido largo tiempo retenido con explicaciones que sonaran a justificaciones construidas para
explicar la demora. El esfuerzo realizado qued
incompleto o fue infructuoso. El texto sigui siendo considerado exculpatorio por algunos de
nuestros lectores.
Pero adems se nos pas la mano y nos
excedimos de otra manera. Graficamos las distribuciones en forma de ranking, de la misma
manera como venamos hacindolo en los boletines sobre las pruebas nacionales, algo que el
informe original del LLECE no hizo. Y adicionalmente cometimos el error de no colocar el comentario tcnico del informe original3 que sealaba que las diferencias de puntaje
encontradas, salvo Cuba, no eran significativas4.
Esto permiti una lectura directa que se ha convertido en una imagen compartida: Per ocup los ltimos lugares en la prueba del Laboratorio de la UNESCO; y el estudio demuestra

que nuestra educacin es la peor del continente.


Existe una perspectiva cnica que bajo la lgica del no hay mal que por bien no venga acaba
justificando esa afirmacin ya que convoca atencin por el destino de la educacin nacional y
podra ayudar a justificar una mayor asignacin
presupuestal. Pero aunque pudiera ser conveniente, esa afirmacin es falsa y el juicio debe ser
ms complejo y matizado.
Otro artculo se ocupa, en esta misma revista, del tema de la significacin estadstica de las
diferencias5. En este texto quisiramos indicar las
dificultades que el equipo tcnico observ en la
realizacin del estudio, y algunas de las limitaciones que encontr en el resultado.
Historia y dificultades
El proyecto, siendo un programa internacional,
organiz una instancia de coordinacin que estableciera los acuerdos sobre los que se procedera. El LLECE preparaba la agenda y presentaba propuestas a estas reuniones; pero eran las
delegaciones de los pases miembros las que sancionaban los acuerdos.
Mucho del trabajo durante las reuniones de
coordinadores nacionales estuvo referido a asegurar decisiones consensuales para garantizar la
comparabilidad que la prueba requera. Se acord el diseo muestral, los instrumentos, el plan
de anlisis. Al respecto, hubo temas en los que
colectivamente se cambi acuerdos previos. Por
ejemplo, en la segunda reunin se cambi el
acuerdo de la primera respecto a que se elaborara un estndar consensuado respecto del que
medira los logros.
Otro asunto que se atendi fue el de la difusin; as, en la tercera reunin se acord que en
la siguiente se presentara el plan de anlisis, y de
difusin y uso de la informacin. En la cuarta se
acord la creacin de un comit editorial y un
texto que deca El Laboratorio no publicar ningn informe que no haya sido analizado y aprobado por el Comit Editorial. Este acuerdo no
se puso en prctica.

13

Nuestras observaciones comienzan en abril


de 1998 y estn referidas a los procedimientos
de certificacin de muestras6, y a la equivalencia
entre los dos formatos (A y B) de las pruebas7;
temas ambos sobre los que tenamos dudas. En
esta comunicacin tambin demandamos informacin sobre los procedimientos de ponderacin de los estratos muestrales, as como sobre
los procedimientos de construccin de escalas.
En julio de 1998 se realiza la quinta reunin y en ella el Laboratorio plante que las
demandas de Per no podan ser respondidas todava porque las bases de datos estaban incompletas, y se acord un cronograma
para presentacin de estos instrumentos tcnicos y de los resultados en los primeros quince das de septiembre porque se esperaba
que los pases hicieran sus comentarios antes
del 6 de noviembre de modo de poder publicar los resultados el 7 de diciembre.
Estos plazos no se cumplieron y el 7 de noviembre el LLECE nos hace llegar una comunicacin con los resultados de sus clculos, pero
sin el aparato tcnico que permitiera replicar la
estimacin y evaluar su comparabilidad. Pero
adems el texto de la comunicacin indicaba que
de no haber observaciones antes del 11 de noviembre se dara por aceptados los resultados y
autorizada la publicacin. Luego de tratar de
comunicarnos con el Laboratorio para que se
cumpliera los acuerdos de julio y objetar el pequesimo plazo para evaluacin, el ltimo da, el
11 de noviembre, remitimos una comunicacin
en la que solicitamos se posponga la publicacin
para realizar una reunin de coordinadores.
El Laboratorio public los resultados el 7 de
diciembre. En realidad haba un pie forzado substancial: en esta fecha se haba contratado una
videoconferencia internacional para presentar los
resultados en una importante reunin del Banco
Mundial. El texto tiene una nota en la que nuestra solicitud de postergacin se convierte en que
a la fecha de publicacin, las autoridades peruanas no han autorizado la publicacin; aunque
tambin consigna que Mxico solicit que se
ponga por escrito que no habiendo recibido la
documentacin tcnica necesaria no pudo verificar los puntajes calculados y publicados por el
Laboratorio8.
Algunas de estas observaciones han tenido
consecuencias
Todo estudio tiene limitaciones y conocerlas permite un uso apropiado de sus resultados. Aqu
mencionaremos las tres ms relevantes:
a) Muestreo. Hay numerosos indicios de que

14

el muestreo no se llev a cabo como se


planific. Por ejemplo en el primer informe
de la UNESCO se dice que cada estrato de
la muestra debera tener al menos 1000
estudiantes, y en el mismo informe queda
claro que varios pases tuvieron alrededor
de 600 estudiantes por estrato9. Esto aumenta el error muestral, cosa que no se
especifica en el informe. Otro ejemplo es
que en un informe tcnico entregado recientemente a los coordinadores nacionales
se menciona que Mxico defini rural como
centros poblados con menos de 5000 estudiantes, mientras que el resto de pases lo
defini como menos de 2500 estudiantes.
Finalmente Argentina no hizo sorteo de escuelas sino que utiliz las que haban sido
seleccionadas para otro estudio, y Brasil slo
evalu a estudiantes de tres estados. En pocas palabras, hay suficientes argumentos tcnicos para dudar de la comparabilidad de las
muestras nacionales y por estratos, e incluso
la representatividad de algunas de las muestras respecto a sus pases.
b) Bilingismo de los estudiantes. Todas las
pruebas fueron en castellano (o brasilero), y
esto podra haber significado un problema
para los estudiantes de lengua materna verncula del Per (sobre todo en tercer grado), y podra haber ocasionado sesgos (i.e.
algunos estudiantes pudieron haber sabido
las respuestas, pero no entendieron las preguntas). No hay en el informe de la
UNESCO un anlisis de sesgos ocasionados
por el bilingismo10.
c) Tipo de prueba. Este es un tema abstruso al
que deberemos dedicar ms atencin aunque ya haya merecido espacio en esta revista11. La prueba del Laboratorio no estuvo
referida a criterios y por tanto no nos dice si
estamos aprobados o desaprobados. Slo
indica si estamos mejor o peor respecto al
promedio. Por eso publicamos la distribucin como un ranking. Esa distribucin hay
que corregirla para ver si las diferencias son
significativas, que es lo que se hace en otro
artculo de esta revista (ver nota 5). Pero al
final de todo este ejercicio todava no es posible decir cul es la situacin de los mejores,
ni de los peores, respecto a lo que debieran
saber.
Tcnica y poltica
No pretendemos con lo anterior decir que el
estudio de la UNESCO debe ser descartado;
pero es necesario ser ms cuidadoso en el uso

de sus resultados. Por otro lado, se trata de un


primer estudio con el cual han quedado muchas
experiencias positivas. Cada estudio aporta alguna evidencia que finalmente debe ser cruzada
con otras para lograr una visin balanceada e
integral del sistema educativo peruano, y a partir
de este balance elaborar lineamientos para su
desarrollo12.
Respecto al tema ms poltico, Mxico result ms astuto en el escenario internacional con la
nota que indica que no avala las cifras porque no
pudo replicar el clculo. En nuestro caso, el debate se politiz rpidamente y acab siendo planteado como un tema de decisin soberana, lo
cual siendo estrictamente legtimo en trmino
de relaciones internacionales ocult las dificultades tcnicas y aliment la sospecha de que se
estaba escondiendo la informacin porque los
resultados eran adversos y ponan en cuestin la
poltica del rgimen13.
Sin embargo, mientras en marzo 1999 se
realizaba el debate interno en el Congreso de la
Repblica, se participaba en la sexta reunin en
La Habana, Cuba. En esta reunin Mxico, Brasil y Per reiteraron las observaciones mencionadas y se acord que el Laboratorio remitira
los informes tcnicos solicitados.
No se trata con estas notas de explicar las
responsabilidades respecto a la demora en la
publicacin ni de trasladar la responsabilidad de
ello a las observaciones sealadas. Es probable
que si el LLECE hubiera aceptado posponer la
publicacin y realizar reunin de coordinadores
que solicitramos, el Ministerio no hubiera autorizado la publicacin. Se trata de dar testimonio
de los hechos y las reflexiones que un grupo de
funcionarios y tcnicos hicieron y evaluaron en
este hito en la participacin peruana en evaluaciones de rendimiento internacionales. Lo aprendido ha promovido que nos incorporemos al programa PISA de OCDE, iniciativa que es
presentada en esta misma revista.

LABORATORIO LATINOAMERICANO DE EVALUACIN DE LA CALIDAD DE LA EDUCACIN (LLECE-ex LACE): CRONOGRAMA


Noviembre de 1994
Julio de 1995

Mxico, creacin del LLECE.


Firma del Convenio entre el Ministerio de Educacin del Per y la Oficina Regional para Amrica Latina y el Caribe (OREALC)
de la UNESCO.
Setiembre de 1995
Venezuela (Caracas). Primera Reunin de Coordinadores Nacionales. Primeros acuerdos sobre procedimientos (estndares,
instrumentos y muestra).
Mayo de 1996
Brasil (Fortaleza). Segunda Reunin de Coordinadores Nacionales. La elaboracin de estndares es pospuesta. Acuerdos sobre
logstica de instrumentos y muestra. Se incorpora el tema de manejo de informacin y variables incidentes.
Agosto de 1996
Realizacin de la prueba piloto. Se prueban los instrumentos.
Marzo de 1997
Argentina (Buenos Aires). Tercera Reunin de Coordinadores Nacionales. Se revisan los instrumentos para el Piloto y se acuerda
el universo (3 y 4), los estratos de la muestra y el manual de muestreo; queda pendiente el tema de la definicin de ruralidad.
La Coordinacin del LLECE debe presentar el Plan de Anlisis, el Plan de Difusin y Uso de la informacin en la siguiente reunin.
Mayo de 1997
Brasil (Brasilia). Cuarta Reunin de Coordinadores Nacionales. La Coordinacin se excusa y pospone la presentacin de los
Planes de Anlisis y Difusin. Se acuerda varios tipos de informe y crear un protocolo de uso. Se acuerda crear un comit
editorial: l Laboratorio no publicar ningn informe que no haya sido analizado y aprobado por el Comit Editorial. Se
acuerda el procedimiento de acreditacin de las muestras nacionales y encargar externamente la acreditacin de los instrumentos. Se acuerda crear grupos de trabajo para Evaluacin e Interculturalidad, y Evaluacin y Transversalidad.
Noviembre de 1997
Aplicacin de la Prueba Internacional en el Per.
Abril de 1998
Per enva al LLECE sus observaciones a los procedimientos de certificacin de las muestras nacionales, la equivalencia entre las
formas A y B de la prueba, y solicita informacin sobre los procedimientos de ponderacin de los estratos muestrales as como
los procedimientos para construccin de escalas.
Julio de 1998
Chile (Santiago). Quinta Reunin de Coordinadores Nacionales. Per reitera sus observaciones. El LLECE declara no poder
entregar anlisis sobre los temas planteados por el Per dado que las bases de datos de la regin estn incompletas. Se acuerda
un cronograma para remitir los documentos detallados con el anlisis preliminar entre el 31 de agosto y el 15 de setiembre.
Este acuerdo es pospuesto para el 16 de octubre, a ms tardar, para que los pases formulen sus observaciones y comentarios
antes del 6 de noviembre, para su procesamiento de modo que se publique el 7 de diciembre. Adems, se acuerda un
procedimiento para descartar temes de las pruebas que parecieran no funcionar en todos los pases.
7 de noviembre de 1998 El LLECE remite el anlisis del Per con la instruccin de que si las observaciones no llegan antes del 11 dar por aceptada la
publicacin. Per evala que la informacin est incompleta e inicia comunicaciones para tratar de que el LLECE cumpla con el
acuerdo de enviar el anlisis detallado de las muestras, los factores de ponderacin y la diferencia entre instrumentos, as como
las escalas de calificacin.
11 de noviembre de 1998 El Per comunica al LLECE que la premura [...] no contribuye a lograr un producto que refleje el esfuerzo efectuado y pide un
perodo ltimo de aclaracin de las preocupaciones que hayan podido surgir con relacin al informe.
7 de diciembre de 1998 El LLECE da a conocer los resultados del Primer Estudio.
Marzo de 1999
Cuba (La Habana). Sexta Reunin de Coordinadores Nacionales. Mxico, Brasil y Per reiteran observaciones tcnicas. Se
acuerda, entre otros temas, que la Coordinacin del LLECE remitir: un informe sobre el proceso de muestreo en cada pas;
un informe descriptivo del procedimiento de construccin de las escalas y de los puntajes; un informe acerca de las diferencias
sustantivas verificadas en los procedimientos de aplicacin de los instrumentos del estudio; y, un reporte sobre las omisiones.

2
3
4

5
6
7
8

El Laboratorio Latinoamericano de Medicin de Calidad Educativa (LLECE)


naci como Laboratorio de Calidad Educativa (LACE), cuya coordinacin fue
encargada a la Oficina Regional de Educacin para Amrica Latina y el Caribe
(OREALC) de la UNESCO.
Ver en http://www.minedu.gob.pe/web/el_ministerio/el_ministerio/PlaniEstra/
med_calidad.htm
Ver en http://www.unesco.cl/09.htm
Primer estudio internacional comparativo sobre lenguaje, matemtica y factores
asociados en tercer y cuarto grado. LLECE, UNESCO, 1998, p. 14: [...] si bien
existen variaciones de rendimientos entre los pases, con la excepcin de Cuba,
a estas alturas del anlisis, no existen evidencias para afirmar que existen diferencias significativas entre ellos.
Alberto Torreblanca, Cun diferentes son los resultados de las pruebas de
matemtica y lenguaje en Latinoamrica?, pp. 16-19.
Esto debido a que mientras nosotros aplicamos rigurosamente el protocolo
acordado, en Chile, donde nos toc ser acreditadores, observamos la aplicacin de criterios diferentes.
En el Per observamos diferencias significativas entre los resultados de las dos
versiones de la prueba, los que por diseo hubieran debido ser similares.
En la pgina 12 del informe del LLECE (1998) dice: Mxico manifiesta no
haber recibido un informe tcnico lo suficientemente detallado sobre la metodologa utilizada para el clculo de los valores nacionales, y por tanto no pudo
validar los propios.
Por ejemplo en lenguaje en Argentina el estrato megaciudad tena 892
estudiantes, en Honduras 672 y en Venezuela 786; para el estrato rural
Argentina incluy solamente a 523 estudiantes, Brasil a 767 y Venezuela a 816;
finalmente, en el estrato privado Argentina slo incluy a 799 estudiantes,
Costa Rica a 764, Honduras a 434 y Venezuela a 826. En matemtica la
inconsistencia de la muestra fue similar. Se debe tambin recordar que el total
del estrato por pas se divida en aproximadamente la mitad para estudiantes de

10

11

12

13

3 y la otra mitad para estudiantes de 4; dadas las cifras de partida, se llega en


algunos casos a que el nmero de estudiantes para un estrato en un grado sea
inferior a los 300.
Empero, en el informe se menciona el problema: El factor lenguaje en sociedades multilinges es, sin embargo, un elemento que pesa en los resultados, en
particular en Bolivia, y que en consecuencia amerita una consideracin especial
(p. 14.). En la pgina 31 se refieren a los grupos cuyas lenguas maternas son
otras que el espaol y el portugus, como es el caso de Bolivia y en cierta
medida Honduras, Mjico y Paraguay sealando este bilingismo como una
posible causa del bajo rendimiento (ob. cit.).
UMC, Sistemas nacionales de evaluacin del rendimiento escolar en Amrica Latina, revista Crecer N 1 (ver direccin web en nota 2). Sobre los
lmites de las pruebas por normas ver de Eyzaguirre y Fontaine, Qu mide
realmente el SIMCE?, en la Revista de Estudios Pblicos N 75: (ihttp://
www.cepchile.cl/cep/docs/revista75/simce.pdf); y Patricia de Arregui, Sistemas de determinacin y evaluacin de metas de logros de aprendizaje escolar
como instrumento para mejorar la calidad, la equidad y la responsabilizacin
en los procesos educativos en Amrica Latina, en Seminario de la UNESCO
sobre Prospectiva Educativa en la Regin, ihttp://www.unesco.cl/promedl7/
prospectivas/arregui.pdf.
Por ejemplo, como decamos en el Boletn UMC 9, una imagen ms balanceada
debera tomar en cuenta que la cobertura del sistema educativo peruano es hoy
ms alta que nunca antes y eso significa que incluye a personas que vienen de
familias con puntos de partida ms alejados de las normas de uso del aparato
instrumental que estas pruebas miden. La idea es que el solo crecimiento de la
matrcula en reas ms alejadas y empobrecidas produce una reduccin en los
puntajes promedio.
Apesar de que los estudiantes de 3 y 4 de primaria en 1997 no haban sido
atendidos con las iniciativas lanzadas por el programa de Mejoramiento de la
Calidad de la Educacin Primaria (MECEP).

15

Cun diferentes son los resultados de las pruebas


de matemtica y lenguaje en Latinoamrica? Una
mirada a travs del Laboratorio Latinoamericano
de Evaluacin de la Calidad Educativa

Alberto Torreblanca1
UMC

n noviembre de 1998 se public el Primer estudio internacional comparativo sobre lenguaje, matemtica y factores asociados en tercer y cuarto
grado realizado por el Laboratorio Latinoamericano de Evaluacin de la Calidad de la Educacin (LLECE) de la UNESCO2 . En este informe
se presentan los resultados de once de los trece
pases participantes (no se presentan los de Costa Rica ni los del Per). Los resultados del Per
fueron difundidos a inicios del ao 2001 en el
Boletn UMC 93 .
En el informe del LLECE se muestran los
resultados de rendimiento mediante diagramas
de dispersin de los puntajes4 .
Los comentarios de los resultados se centran en comparar las distribuciones de puntajes entre pases tomando como referente a
Cuba, puesto que es el pas con puntajes notablemente por encima del resto. Asimismo,
se hace referencia a la posicin de los pases
con respecto al promedio global (promedio
de todos los alumnos de todos los pases participantes). Sin embargo, en la presentacin
de resultados del LLECE se indica que, salvo
Cuba, no se puede afirmar que las diferen-

Cuadro 1
Promedios y errores estndar (entre parntesis)
en lenguaje por pas y grado
PAS

Tercer

Cuarto

Argentina

262,5

(3,5)

281,6

Bolivia

237,1

(5,2)

Brasil

254,5

(2,3)

Chile

261,3

Colombia
Cuba

Cuadro 2
Promedio y error estndar (entre parntesis)
en matemtica por pas y grado
PAS

Tercer

(2,9)

Argentina

251,5

(3,1)

268,9

(3,1)

235,8

(4,1)

Bolivia

244,7

(4,3)

246,7

(3,4)

278,2

(2,6)

Brasil

247,4

(2,6)

269,5

(2,6)

(2,3)

287,7

(2,3)

Chile

244,2

(1,9)

267,2

(1,9)

235,3

(2,5)

261,3

(2,3)

Colombia

239,0

(2,1)

256,2

(1,8)

341,0

(3,0)

344,9

(3,0)

Cuba

356,7

(5,2)

358,4

(4,2)

Honduras

214,2

(3,1)

233,9

(3,5)

Honduras

216,4

(2,3)

231,4

(2,6)

Mxico

227,6

(3,1)

253,1

(3,0)

Mxico

238,2

(2,5)

257,9

(2,4)

Paraguay

234,2

(4,3)

252,3

(3,6)

Paraguay

234,2

(3,5)

248,2

(3,4)

Per

223,4

(3,0)

242,0

(3,2)

Per

217,1

(2,8)

231,9

(2,6)

R. Dominicana

221,3

(3,7)

231,1

(3,4)

R. Dominicana

228,1

(3,5)

234,8

(3,1)

Venezuela

245,4

(3,2)

251,1

(2,7)

Venezuela

218,8

(1,9)

227,9

(2,3)

16

grado

cias son estadsticamente significativas entre


dos pases o grupos de pases5 .
El Boletn UMC 9 presenta la informacin sin
comentarios sobre diferencias significativas entre
pases. Adems, en la presentacin grfica los
datos fueron ordenados de acuerdo con la mediana de cada pas. Lamentablemente, la escasa
advertencia en el boletn sobre la necesidad de
considerar cun significativas son las diferencias
en los puntajes entre pases ha contribuido a que
se elaboren algunas interpretaciones errneas
de lo que significan los resultados. Esperamos
que este texto ayude a entender mejor los puntajes obtenidos por los estudiantes peruanos en
el estudio del LLECE.
En el presente artculo se analizan los resultados en lenguaje y matemtica de la prueba del
LLECE indicando qu diferencias en los rendimientos entre pases son estadsticamente significativas es decir, son ms amplias de lo que se
esperara por azar y por tanto sugieren diferencias reales en los aprendizajes de los estudiantes. Este dato es til para identificar en qu
grupo de pases se ubican los estudiantes peruanos de acuerdo con su rendimiento.

grado

grado

Cuarto

grado

refleja una alta probabilidad de responder correctamente las 15 16 preguntas ms fciles de la


prueba de matemtica, basada en 32 preguntas.
El modelo utilizado para establecer los puntajes en
esta escala cuyo promedio es 250 es el modelo de
Rasch, un modelo probabilstico considerado dentro de los modelos de teora de respuesta al tem.
Al ser un modelo probabilstico, un alto puntaje da
una alta probabilidad de responder preguntas de
un bajo puntaje; por ejemplo, si se tiene una pregunta con una dificultad de 1707 y el puntaje del
estudiante es de 260, la probabilidad de que este
alumno responda correctamente esa pregunta es
de 86%. Este alto valor supondra una respuesta
correcta del alumno. Si el puntaje de la pregunta
es igual al puntaje del alumno, la probabilidad de
una respuesta correcta sera del 50%. En el caso
de que el puntaje de la pregunta sea mayor que el
puntaje del estudiante, la probabilidad de que el
estudiante responda correctamente disminuye. En
sntesis, los alumnos tienen una alta probabilidad
de responder preguntas de puntajes por debajo
del puntaje alcanzado por ellos en la prueba.
Tal como ya fue mencionado, los promedios
fueron calculados directamente de la base de
datos enviada por la UNESCO. Para el caso de
los errores estndar, stos fueron calculados
mediante un procedimiento de replicaciones.8
Este mtodo provee estimaciones del error estndar no sesgadas. Es recomendable el uso de
este mtodo debido a que las muestras provie-

nen de muy diferentes y complejos diseos de


muestreo; bsicamente se realizan repetidas
submuestras de la muestra original, y analizando
la variabilidad del estadstico deseado en estas
submuestras se obtiene la informacin necesaria
para el clculo del error estndar.
El procedimiento seguido para analizar si las
diferencias entre los puntajes de los distintos pases
son significativas estuvo basado en el mtodo de
comparaciones mltiples llamado intervalos de
Bonferroni o ajuste de Bonferroni. En este procedimiento se considera una correccin en la significacin de las comparaciones debido a que se
realizan muchas simultneamente9 . Por ejemplo,
supongamos que es necesario realizar diez comparaciones independientes, mediante pruebas
estadsticas, bajo la hiptesis de que todas son correctas. La probabilidad de obtener diferencias
cuando no existen (error de tipo I) es del 5% (alfa);
pero al realizar diez comparaciones, la probabilidad de que una de stas falle se incrementa aproximadamente a un 40%10 (lo que no es deseable,
por lo que se necesita del ajuste de Bonferroni
para mantener el valor de alfa en 5%).
En los cuadros 3 al 6 se muestra la significacin de estas comparaciones. Los pases han sido
ordenados en ambos ejes de acuerdo con su
promedio. Si en la interseccin de dos pases hay
una casilla sombreada, entonces debe
interpretarse como diferencias estadsticamente
significativas. Este es el caso, por ejemplo, de

Honduras

R. Dominicana

Per

Mxico

Paraguay

Colombia

Bolivia

Venezuela

Brasil

Chile

Argentina

Cuadro 3
Comparacin de los puntajes entre pases
en las pruebas de lenguaje de tercer grado

Cuba

Los promedios nacionales


En el informe presentado por el LLECE se utiliza
la mediana para describir la tendencia central de
la distribucin; sta representa el puntaje por
encima y por debajo del cual se ubica el 50% de
la muestra. El instrumento estadstico que utilizaremos en el presente artculo es el promedio,
que es otro estadstico que se suele emplear
para describir la tendencia central de las distribuciones. Escogimos el promedio puesto que se
adecua mejor a los procedimientos ms frecuentemente empleados para evaluar si dos distribuciones tienden a valores centrales diferentes y si
dicha diferencia es estadsticamente significativa.
La mediana y el promedio pueden diferir dependiendo de la forma de la distribucin de la
poblacin. Al tratarse de poblaciones con distribucin normal, se espera que la mediana y el
promedio sean iguales. Las distribuciones de las
muestras de los pases participantes se aproximan a la distribucin normal.
En los cuadros 1 y 2 se presentan los promedios y errores estndar del promedio para
cada uno de los doce pases con resultados en el
LLECE6 .
En el cuadro 1 se encuentran los promedios
en lenguaje de cada pas, con sus respectivos errores estndar en cada grado evaluado. Podemos
observar las grandes diferencias en puntajes entre
Cuba y los dems pases. Es importante mencionar que los resultados de Cuba podran estar siendo afectados por el efecto de ceiling (techo). Este
efecto est vinculado al hecho de que las tasas de
acierto en las pruebas de los estudiantes cubanos,
en los dos grados, estn muy cerca del mximo
alcanzable con el instrumento de medicin utilizado. En otras palabras, las pruebas del LLECE para
los estudiantes cubanos fueron relativamente fciles y, en consecuencia, si hubiese habido preguntas con mayor nivel de dificultad, es muy probable
que estos estudiantes hubieran alcanzado puntajes an mayores, en relacin con los de los otros
pases.
En el cuadro 2 se presentan, de la misma
forma, los promedios en matemtica para cada
pas.
Una pregunta natural que surge de los cuadros 1 y 2 es qu significa un puntaje de 251,5
como, por ejemplo, el que presenta Argentina en
matemtica en el tercer grado (ver cuadro 2). Este
valor est muy cerca del promedio de 250 establecido por el LLECE para todos los pases participantes. Especficamente, 250 da una alta probabilidad de responder de manera correcta las 11
12 preguntas ms fciles de la prueba de lenguaje,
que en total tiene 19 preguntas. Asimismo, 250

Cuba
Argentina
Chile
Brasil
Venezuela
Bolivia
Colombia
Paraguay
Mxico
Per
R. Dominicana
Honduras

17

A modo de conclusin
La lectura conjunta de los resultados sugiere la
existencia de tres grupos de pases sin diferencias
significativas sistemticas al interior: el primer grupo
slo contiene a Cuba, cuyas diferencias son signifi-

18

Bolivia

Honduras

R. Dominicana

Venezuela

Per

Honduras

Per

Venezuela

Paraguay

Mxico

Colombia

Brasil

Argentina

Chile

Cuba

Cuadro 4
Comparacin de los puntajes entre pases
en las pruebas de lenguaje de cuarto grado

Cuba
Chile
Argentina
Brasil
Colombia
Mxico
Paraguay
Venezuela
Per
Bolivia
Honduras
R. Dominicana

R. Dominicana

Paraguay

Mxico

Colombia

Chile

Bolivia

Brasil

Argentina

Cuadro 5
Comparacin de los puntajes entre pases
en las pruebas de matemtica de tercer grado

Cuba

Brasil y Colombia en el cuadro 3. Por otro lado,


si en la interseccin de dos pases encontramos
una casilla en blanco, mostrar que la diferencia
entre los promedios no es significativa. Este es el
caso de Venezuela y Chile en el cuadro 3. Ntese que la cuadrcula es simtrica desde la diagonal principal cuyos cuadrados estn en negro.
Por ello, los resultados pueden leerse, alternativamente, desde la columna de la izquierda o
desde la fila superior.
En el cuadro 3 se reportan los resultados de
las comparaciones en lenguaje de tercer grado.
Podemos notar all el caso especial de Cuba, cuyo
promedio es ms alto que el de todos los dems
pases (ver cuadro 1). Otro caso interesante es
Bolivia que, a pesar de encontrarse en la sexta
ubicacin, no presenta diferencias significativas
con ninguno de los pases salvo Cuba.
Los resultados en lenguaje de cuarto grado
se presentan en el cuadro 4, y all se observa un
vez ms que Cuba presenta diferencias significativas con todos los dems pases. La lectura conjunta de los resultados de lenguaje de ambos
grados sugiere la siguiente agrupacin de los pases: un primer grupo en el que se encuentran
los estudiantes cubanos solos, uno segundo en
el que se encuentran Argentina, Brasil y Chile, y
el ltimo formado por los restantes.
Los estudiantes peruanos no tiene puntajes
por encima de ningn pas cuyas diferencias sean
estadsticamente significativas. En cambio, muestran resultados significativamente por debajo de
Cuba, Argentina, Chile y Brasil (tanto en tercero
como cuarto grado, vase los cuadros 3 y 4). Son
muy similares a los de Bolivia, Honduras, Mxico, Paraguay y Repblica Dominicana (una vez
ms tanto en tercero como en cuarto). nicamente en los casos de Colombia y Venezuela se
observan diferencias en slo un grado.
En relacin con las comparaciones en matemtica, en los cuadros 5 y 6 se reportan las comparaciones de tercer y cuarto grado, respectivamente. Se aprecia all que la posicin de Cuba
por encima de todos los dems pases se mantiene. Los pases con mejores puntajes que el Per
son Argentina, Brasil, Chile, Colombia y Mxico.
Bolivia se diferencia slo en tercer grado. No se
encuentran diferencias entre Per y los siguientes pases: Honduras, Paraguay, Republica Dominicana y Venezuela.

Cuba
Argentina
Brasil
Bolivia
Chile
Colombia
Mxico
Paraguay
R. Dominicana
Venezuela
Per
Honduras

cativas con todos los dems; el segundo est conformado por Argentina, Brasil y Chile, sin diferencias significativas entre ellos y en algunos casos sin
diferencias significativas con los del siguiente grupo;
y el ltimo grupo resulta formado por Colombia,

Mxico, Bolivia, Venezuela, Paraguay, Per, Honduras y Repblica Dominicana.


En lenguaje, la diferencia de puntajes entre
Per y los pases del tercer grupo no es significativa
respecto a Bolivia, Paraguay, Mxico Repblica

Venezuela

Honduras

Per

R. Dominicana

Bolivia

Paraguay

Colombia

Mxico

Chile

Argentina

Brasil

Cuba

Cuadro 6
Comparacin de los puntajes entre pases
en las pruebas de matemtica de cuarto grado

Cuba
Brasil
Argentina
Chile
Mxico
Colombia
Paraguay
Bolivia
R. Dominicana
Per
Honduras
Venezuela

Dominicana y Honduras, en ningunos de los grados, y tampoco respecto a Colombia en tercer


grado ni a Venezuela en cuarto. En matemtica las
diferencias nunca son significativas con Venezuela,
Paraguay, Honduras y Repblica Dominicana, y
tampoco con Bolivia en cuarto grado.
En otras palabras, dentro del tercer grupo
los estudiantes de Colombia muestran un rendimiento ligeramente superior al resto, seguido
por los estudiantes de Mxico. Los estudiantes
peruanos nunca tuvieron diferencias significativas con los de Paraguay, Repblica Dominicana y
Honduras, y slo en matemtica en tercer grado
con los de Bolivia y lenguaje en tercer grado con
los de Venezuela.
No se debe concluir mucho a partir de este
primer estudio internacional del rendimiento; sin
embargo, los resultados sugieren que habra
mucho que mejorar en trminos de la calidad de
aprendizaje de los estudiantes peruanos en lenguaje y matemtica, en comparacin con algunos otros pases de la regin. Encontrar los mecanismos para hacerlo debera ser una de las
tareas ms urgentes en la agenda educativa de
los prximos aos. Posiblemente una de las pistas la da el mismo estudio de la UNESCO y otros
publicados en el Per que muestran, por ejem-

plo, que los estudiantes rurales estn por debajo


del resto pblico y muy por debajo de los estudiantes de centros privados. De otro lado, la
desigualdad en los rendimientos, asociada directamente a las desigualdades socioeconmicas de
los estudiantes (ver boletn Crecer 5/6 y Boletn
UMC 8), es uno de los grandes impedimentos
para el desarrollo de la educacin.
De alguna manera este resultado es consistente en otra dimensin, por supuesto con
las diferencias en la cantidad de recursos pblicos asignados a la educacin escolar. Slo para
tener una idea de ello, considrese, por ejemplo, que el gasto total (pblico y privado) por
estudiante en primaria en el Per representa
menos de la mitad del que invertan en 1998
Argentina, Chile y Uruguay, poco menos del 60%
del gasto de Brasil y 84% del de Paraguay11 . Por
supuesto, solamente incrementar el gasto hasta
el nivel de Chile, Brasil o Argentina no garantiza
mejores aprendizajes sino que se debe planificar
con mucho cuidado en qu invertir para obtener el mayor impacto de la manera ms eficiente. Los estudios internacionales de factores asociados al rendimiento pueden dar pistas
interesantes a ser consideradas en el diseo de
estas polticas.

El autor desea agradecer los comentarios y


sugerencias de Santiago Cueto (GRADE), Jos
Rodrguez (UMC) y Juan Fernando Vega
(PLANMED).
2 Disponible en http://www.unesco.cl/pdf/programa/inflab1.pdf.
3 Disponible en el portal del Ministerio de Educacin (http://www.minedu.gob.pe).
4 Resaltando el primer y el ltimo decil (10% y
90%, respectivamente) de rendimiento, y el
primer y el ltimo cuartil (25% y 75%, respectivamente), adems de la mediana (50%
de la distribucin de puntajes). Vase en el
Boletn UMC 9 una descripcin del uso y la
interpretacin del diagrama de dispersin o
boxplot. (http://www.minedu.gob.pe/web/
el_ministerio/el_ministerio/PlaniEstra/umc/
boletin9/boletin_crecer9.pdf).
5 [...] si bien existen variaciones de rendimientos entre los pases, con la excepcin de Cuba,
a estas alturas del anlisis no existen evidencias para afirmar que existen diferencias significativas entre ellos. LLECE (2000): Primer
estudio internacional comparativo sobre lenguaje, matemtica y factores asociados, para alumnos de tercer y cuarto grado de la educacin
bsica. Informe tcnico. Santiago de Chile:
UNESCO, 2000, p. 14.
6 Estos estadsticos fueron calculados a partir de
la base de datos recientemente distribuida por
la UNESCO a todos los pases que participaron en el estudio. En los clculos se consider
el factor de ponderacin reportado para cada
pas en la propia base de datos.
7 Los puntajes de las preguntas se encuentran
en el Anexo 3 del Primer Informe del Laboratorio.
8 Ver Efron, B. y R. J. Tibshirani (1993), An
Introduccin to the Bootstrap. San Francisco:
Champman & Hall.
9 Winner, B. J.; D. R. Brown y K. M. Michaels
(1991), Statistical Principles in experimental
design. New York: McGraw Hill.
1 0 Para calcular este valor es necesario calcular
primero la probabilidad de obtener diferencias
cuando no existen diez veces consecutivas; es
decir, multiplicar 1-alfa diez veces, lo que es
aproximadamente 60%, que es mucho menor que la probabilidad deseada para una sola
prueba que era del 95%.
1 1 UNESCO-UIS/OECD (2001): Teachers for
Tomorrow s Schools. Analysis of the World
Education Indicators. 2001 Edition. Pars:
UNESCO-UIS/OECD.

19

Cunto aprenden nuestros estudiantes?


Presentacin de la Evaluacin Nacional del 2001

Jos Rodrguez / Santiago Cueto

Jefe de la Unidad de Medicin de la Calidad Educativa (UMC) / Director de Investigacin del


Grupo de Anlisis para el Desarrollo (GRADE)
n 1996 y 1998 la UMC elabor pruebas y encuestas que fueron administradas a muestras de
estudiantes de diversos grados de primaria y secundaria. Algunos de esos resultados se han reportado en los boletines producidos por la UMC
(disponibles en la pgina web de la UMC en el
Ministerio de Educacin)1 . Este ao se realizar
una nueva evaluacin a escala nacional. A continuacin se presenta la fundamentacin general
de esta evaluacin. Adems, hay una serie de
documentos tcnicos y una fundamentacin especfica para cada rea evaluada2 .
En trminos generales, el enfoque de la evaluacin est orientado a generar informacin sobre el rendimiento y el funcionamiento del sistema educativo, que pueda ser utilizada como
insumo para la identificacin de acciones tendientes a mejorar la calidad y reducir la desigualdad de oportunidades educativas. Actualmente
el sistema educativo pblico peruano busca brindar un acceso
homogneo a los servicios
educativos3 . Sin embargo, sabemos que esto no es suficiente para brindar las mismas oportunidades efectivas de alcanzar
ciertos logros de aprendizaje
entre nuestra poblacin. As por
ejemplo, en contextos de limitados recursos econmicos, en
los cuales las familias no tienen
suficiente capacidad de gasto
para adquirir bienes y servicios
educativos complementarios,
puede ser sumamente conveniente que se facilite este tipo
de bienes y servicios complementarios a travs de los centros educativos. Para contar con
informacin que permita identificar mejor los aspectos que
establecen una diferencia en el
momento de lograr el aprendizaje, es necesario tener una
visin amplia del rendimiento
escolar y de los factores asociados a ste.

20

La informacin no se utilizar para determinar algn tipo de accin o consecuencia referida


a docentes, directivos o estudiantes. Las dos evaluaciones administradas hasta el momento han
respetado este convenio de confidencialidad con
cada estudiante, docente, directivo y padre o
madre de familia participante, y se ha reportado
solamente promedios; esta prctica ser continuada en la evaluacin del presente ao4 .
Las preguntas que guan la evaluacin del 2001
Como se explic en el anterior nmero de la
revista Crecer5 , el modelo utilizado en las evaluaciones nacionales de 1996 y 1998 fue de normas. Este modelo se caracteriza por brindar informacin de tipo relativo y no absoluto. En otras
palabras, los resultados de las pruebas indican
qu grupos de estudiantes obtuvieron mayores
y menores puntajes, y no necesariamente quines salieron bien o mal en relacin con un puntaje
mnimo aceptable. Esta informacin se utiliz, por
ejemplo, para identificar departamentos u otros
grupos con rendimientos relativamente rezagados (estudiantes de centros educativos estatales
y no estatales, entre otros6 ). Sin embargo, estos
datos no son suficientes para identificar cunto
han logrado los estudiantes en lo tocante a aspectos especficos propuestos en el currculo.
Por ello, para la evaluacin del presente ao se
ha adoptado un modelo de criterios, que permitir obtener informacin de tipo absoluto y ms
especfica del rendimiento de los estudiantes en
relacin con los requerimientos del currculo. La
primera pregunta que esta evaluacin permitir
contestar es:
Qu competencias del currculo peruano en
comunicacin integral y lgico-matemtica dominan los estudiantes de cuarto y sexto de primaria,
y los de cuarto de secundaria?
Se han seleccionado estas dos reas de desarrollo por ser consideradas los pilares del currculo. Sin embargo, en futuras evaluaciones se
buscar incluir otras reas de desarrollo (como
se hizo en 1998 en primaria con ciencia y ambiente, y personal social7 ). Si bien en la evaluacin se han incluido todas las competencias del
currculo, result imposible incluir todas las capa-

cidades al interior de cada competencia ya que


el nmero de capacidades es demasiado extenso. Por ello, sobre la base de una serie de consultas con especialistas, se decidi incluir slo algunas del currculo vigente8 para cada grado
evaluado, e incluir para cada capacidad un mnimo de tres preguntas. En futuras evaluaciones se
deber incluir las capacidades restantes.
Adems, se tiene previsto recoger datos sobre algunas caractersticas de los estudiantes, sus
familias y el centro educativo (sobre todo de docentes y directivos, as como del desarrollo de las
clases), de modo que a partir de la descripcin
de estas caractersticas sea posible entender
mejor algunos procesos educativos. Los aspectos en los que se incidir a este respecto tienen
que ver con las principales innovaciones o programas implementados por el Ministerio de Educacin en los ltimos aos, de modo que la informacin pueda ser utilizada luego como un insumo
para mejorar la calidad de los mismos. En esta
lnea, la segunda pregunta que permitir responder esta evaluacin es:
Qu caractersticas tiene el currculo desarrollado por los docentes, cmo usan los docentes
los materiales educativos, qu caracteriza la formacin inicial y en ejercicio de los docentes y qu
caractersticas tiene la gestin educativa en los
centros educativos?
Adems de las anteriores variables, se recoger informacin sobre cada estudiante evaluado y su familia9 . Entre estas variables estar la
lengua materna del estudiante. Se podra recoger informacin sobre otras muchas variables,
pero consideramos que las anteriores resultan
prioritarias en el actual contexto educativo peruano.
Aparte de los aspectos puramente cognitivos,
el currculo peruano llama a reforzar en los estudiantes aspectos afectivos y sociales. Estos no han
sido evaluados en 1996 ni en 1998 (y no suelen
ser incluidos en evaluaciones a escala nacional
en otros pases), pero sern incluidos en la presente evaluacin. Por ello, la tercera pregunta
de evaluacin es:
Cules son algunas actitudes de los estudiantes peruanos hacia la matemtica, la escritura y lectura, y hacia las lenguas nativas y las personas que las hablan?
La evaluacin de las actitudes se centrar en
primer lugar en la percepcin de utilidad, gusto y
autoeficacia frente a la matemtica, la lectura y la
escritura. Estas actitudes han sido seleccionadas
porque aparecen de manera recurrente en las
estructuras curriculares de los grados incluidos
en la evaluacin. Se ha incluido un componente

de actitudes hacia lenguas nativas y sus hablantes


porque el respeto por la diversidad cultural y
lingstica es un tema prioritario del currculo.
De hecho, en la presente evaluacin el tema de
la educacin bilinge intercultural tambin es
prioritario, como se ver ms adelante.
Las tres primeras preguntas tienen un carcter ms exploratorio y descriptivo, lo que permitir hacer un diagnstico de la situacin educativa y en particular de aspectos relativos a los
procesos de aprendizaje. La cuarta pregunta, en
cambio, est ms orientada a explicar los resultados en trminos de rendimientos y de actitudes
de los estudiantes. Esta pregunta tiene, pues, la
intencin de identificar relaciones entre un conjunto amplio de factores asociados o determinantes, y los resultados. Por tanto, la cuarta pregunta de evaluacin es:
Cmo se relacionan los logros y las actitudes
de los estudiantes con el currculo desarrollado, con
los materiales utilizados en el aula, con la formacin inicial, con las capacitaciones efectuadas con
los docentes y con las capacitaciones efectuadas
con los directivos de centros educativos?
El conjunto de informacin que se recoger
permitir, por ejemplo, relacionar caractersticas
de los estudiantes como su lengua materna con
el rendimiento en las pruebas. Tambin permitir analizar los programas y las innovaciones educativas con mayor difusin en los ltimos aos, y
en ello se pondr un nfasis especial. La razn es
que tales programas dependen directamente del
Ministerio y en general del sistema educativo y en consecuencia podrn ser modificados
con relativa mayor facilidad que otros asuntos
vinculados con aspectos ms estructurales, como
por ejemplo las condiciones de pobreza en una
localidad determinada.
La quinta y ltima pregunta tiene que ver
con una comparacin transversal y longitudinal
del rendimiento de los estudiantes. As, interesa
comparar el rendimiento de los estudiantes el
2001 con el de estudiantes en los mismos grados
en 1998; en segundo lugar, se comparar el rendimiento el 2001 de los estudiantes de 4 de
primaria con el de los de 6; y el de stos con el
de los estudiantes de 4 de secundaria. Especficamente, la pregunta de evaluacin es:
Cmo se compara el rendimiento de los estudiantes el 2001 en comunicacin integral y lgico-matemtica con el de estudiantes de los mismos grados en 1998 y con el de estudiantes el
2001 de grados superiores e inferiores?
La respuesta a esta pregunta permitir estimar si la calidad de los aprendizajes ha mejorado
en el tiempo y si un tiempo mayor en la escuela

est relacionado con mejores rendimientos en


las pruebas.
La muestra
En 1996 solamente se incluy en la muestra a
estudiantes de 4 de primaria de centros educativos polidocentes completos de zonas urbanas y
rurales (de fcil acceso), mientras que en 1998
se incluy a estudiantes de 4 y 6 de primaria y
de 4 y 5 de secundaria de centros educativos
polidocentes completos de zonas urbanas. Para
el presente ao se incluir muestras de centros
educativos seleccionadas al azar, sin excluir tipo
alguno por algn criterio, y de stos, a estudiantes de 4 y 6 de primaria y de 4 de secundaria.
Por lo tanto, la muestra ser representativa de
todos los estudiantes peruanos y no tendremos
que limitarnos, como con la informacin de 1996
y 1998, a los estudiantes de centros polidocentes completos o de centros educativos localizados en reas urbanas. Sin embargo, la muestra
de cada grado tendr algunas particularidades.
En 4 grado de primaria la muestra ha sido
diseada para ser representativa de los estudiantes quechuas en programas de educacin bilinge intercultural (EBI) de Cusco, Puno y Apurmac; de los estudiantes aimaras en programa
EBI de Puno, y del resto de estudiantes del Per
(sin importar la lengua materna o si estn en
algn programa EBI en una lengua diferente a las
mencionadas). En otras palabras, la muestra ser
representativa de los estudiantes a escala nacional, y tambin se podr reportar resultados para
cada una de las siguientes poblaciones: a) quechua del Sur, b) aimara y c) hispanohablantes10 .
La inclusin de los grupos quechua y aimara
en EBI obedece a la necesidad de evaluar y
entender mejor los procesos y resultados educativos en escuelas en las cuales predominan
poblaciones con fuerte presencia de lenguas diferentes al castellano. Las pruebas sern, por
primera vez, para estas zonas, bilinges en castellano y quechua o aimara. En comunicacin
integral se tomarn dos pruebas: una en la lengua materna (con versiones equivalentes en quechua, aimara y castellano) y otra en castellano.
De este modo, ser posible comparar los resultados obtenidos por los estudiantes quechuas y
aimaras en su lengua materna y en su segunda
lengua, es decir, el castellano. El resto de estudiantes del pas servir como grupo de referencia (pudindose distinguir entre ellos a quienes
tienen el castellano como lengua materna y a
quienes tienen otra). En lgico-matemtica las
pruebas estarn disponibles para los estudiantes
quechuas y aimaras en la lengua en la que mejor

21

se sientan. As, la prueba de matemtica estar


en las tres lenguas pero slo podr elegir entre
su lengua materna y el castellano aquel estudiante que pertenezca a un centro educativo que
est bajo el programa EBI de quechua o aimara.
En 6 grado de primaria se incluir a estudiantes de los mismos centros educativos de la
muestra de 4 de primaria; por tanto, en trminos generales, la muestra ser representativa de
los mismos grupos antes mencionados, pero slo
se emplearn pruebas en castellano. En el caso
de los estudiantes de centros educativos pequeos (multigrado y unidocentes), se incluir adems a los estudiantes de 5 de primaria, de modo
que se pueda hacer una gradiente de rendimiento que compare a los estudiantes de 4 a 6
de primaria (utilizando las pruebas de 4 de primaria).
En 4 de secundaria el sorteo de escuelas y
estudiantes ser independiente del realizado en
primaria. Es la nica muestra diseada para que
sea representativa de los estudiantes de cada
departamento del Per.
En los tres grados la muestra ser representativa del rendimiento de hombres y mujeres, y
de estudiantes estatales y no estatales, pero slo
a escala nacional.
La muestra incluir adems a padres de familia (slo en 4 grado de primaria), al docente
de lenguaje y al de matemtica de los estudiantes de la muestra y a los directivos de los centros
educativos. Esto es suficiente para reportar resultados de estos grupos a escala nacional, y hacer anlisis exploratorios en subgrupos.
La muestra descrita no ser representativa
de todos los estudiantes de un centro educativo,

22

ya que solamente se incluir una muestra de


estudiantes de algunos grados. Tampoco ser
representativa del rendimiento de cada estudiante, pues esto requerira varias mediciones individuales. Entendemos que los centros educativos
participantes en evaluaciones soliciten los resultados de su centro educativo, pero consideramos que la informacin podra no reflejar el rendimiento de los estudiantes de un centro
educativo en particular. Por lo tanto, en general,
se reportar la informacin que corresponda a
los agregados que la muestra aleatoria permite
mencionados antes y no a cada estudiante
ni a cada centro educativo.
Los instrumentos
En las evaluaciones de 1996 y 1998 se utilizaron
bsicamente preguntas de opcin mltiple, adems de algunas de produccin de textos y respuesta abierta en matemtica (en este ltimo
caso, solamente en secundaria). Dados los cambios curriculares producidos desde entonces, se
ha considerado necesario incluir una mayor variedad en el tipo de preguntas, de modo que los
estudiantes puedan demostrar sus habilidades
ante diferentes estmulos. As, los formatos de
pregunta que se utilizarn en las pruebas son:
Opcin mltiple, que seguir siendo el tipo
ms frecuente, al igual que lo es en todas las
evaluaciones internacionales de rendimiento. Estos temes son de calificacin objetiva y
rpida.
Respuesta abierta corta y larga, que se utilizar tanto en comunicacin integral como
en matemtica. Este formato permite identificar los errores cometidos por los estudian-

tes con mayor riqueza que el de opcin


mltiple.
Produccin de textos narrativos y descriptivos,
en 4 de primaria en castellano, quechua
del Sur y aimara; en los dems grados, slo
en castellano.
Comunicacin oral en quechua del Sur, aimara
y castellano, solamente en 4 grado de primaria y para un grupo reducido que ser
evaluado individualmente.
Solucin de problemas de medicin con material concreto, formato de preguntas que requiere que los estudiantes manipulen materiales para mostrar su competencia en
problemas similares a los que podran encontrar en su vida cotidiana. Se utilizar en
4 y 6 de primaria solamente.
Los tres ltimos formatos son bastante ms
complicados de administrar y calificar que los dos
primeros; de ah que se administrarn a una
muestra ms pequea. Esta muestra ser suficiente para reportar resultados a escala nacional;
y en el caso de 4 de primaria, suficiente para
reportar resultados de los estudiantes quechuas
del Sur, aimaras y castellanohablantes del pas.
Para el caso de actitudes se presentar a los
estudiantes afirmaciones sobre las que tendrn
que responder si estn o no de acuerdo (como
en el caso de los estudiantes de 6 de primaria)
o establecer su grado de acuerdo a travs del
formato Likert (de Totalmente en desacuerdo
a Totalmente de acuerdo) en 4 de secundaria. Las encuestas tienen diferentes tipos de preguntas que sern administradas individual o
grupalmente de acuerdo con las caractersticas
del grupo.
Todos los instrumentos han sido piloteados y
luego pasaron por sucesivas revisiones a cargo
de especialistas en educacin (principalmente
docentes) de diferentes lugares del pas. La participacin de stos ha sido til, adems, para estimar puntos de corte en las pruebas por encima
de los cuales se podr decir que los estudiantes
dominan una competencia.
Se tendrn datos de evaluaciones equivalentes aproximadamente a seis horas de evaluacin por rea y grado (entre 80 y 125 preguntas
por cada rea de desarrollo en cada grado). Sin
embargo, ningn estudiante dar ms de dos
horas de evaluacin por rea y grado (30 temes
como mximo en cada sesin de evaluacin, con
un mximo de dos sesiones de evaluacin por
estudiante en cada rea). Esto se lograr gracias
a un diseo de formas rotadas en los cuadernillos, que permite estimar puntajes para el individuo y para el rea de desarrollo curricular11 .

Las comparaciones de puntajes


El diseo de la evaluacin permitir dos tipos de
comparaciones. La primera, a travs del tiempo.
El presente ao se evaluar una submuestra de
estudiantes con las mismas pruebas administradas en 1998 en lenguaje y matemtica, de modo
que ser posible establecer comparaciones de
rendimiento en los tres grados. En segundo lugar, se harn comparaciones transversales, es
decir del rendimiento de estudiantes de diferentes grados con la prueba del 2001. Estas comparaciones se harn entre el rendimiento de estudiantes de 6 y 4 grados de primaria (y 5 grado
slo en escuelas multigrado y unidocentes) utilizando las pruebas de 4 de primaria (en castellano solamente). Adems, un grupo de estudiantes de 4 de secundaria resolver las pruebas de
6 de primaria de lgico-matemtica y comunicacin integral.
Es de esperar que el rendimiento de los
estudiantes el ao 2001 sea igual o superior al
obtenido por los estudiantes en 1998; y que el
rendimiento de estudiantes de un grado superior sea ms alto que los del grado inferior. Por
ltimo, si bien eventualmente se publicar gran
parte de los temes y sus resultados, algunos
temes de la prueba del ao 2001 se mantendrn en reserva para poder usarlos en comparaciones futuras.
Los usuarios de la informacin
Como se mencion antes, la evaluacin producir diferentes tipos de informacin. Entre los
principales, rendimiento en las pruebas (porcentaje que se ubica por encima de un puntaje mnimo en las reas de desarrollo curricular y en las
competencias al interior de cada rea), actitudes
de los estudiantes, descripciones de algunos procesos educativos sobre todo los vinculados al
desarrollo del currculo, la formacin y capacitacin de docentes y directivos, y los materiales
educativos y anlisis de factores asociados al
rendimiento en las pruebas y escalas. Esta informacin es til para diferentes grupos, entre ellos:
Especialistas del Ministerio de Educacin.
Especialistas de la sociedad civil que trabajan
en temas educativos, con especial nfasis en

especialistas e instituciones dedicados a la


formacin y capacitacin docente, as como
encargados de elaborar materiales educativos.
Docentes, directivos de centros educativos
y especialistas de rganos intermedios en
educacin.
Investigadores en educacin (para ese grupo, y todos los dems, estarn disponibles
no slo los resultados reportados sino tambin las bases de datos de las cuales se obtengan los resultados, y una descripcin de
tcnicas de anlisis novedosas)12.
Pblico en general (que estara interesado
sobre todo en los resultados de las pruebas).
Esperamos elaborar informes dirigidos a todos
los grupos mencionados (como los resultados
globales de las pruebas, por ejemplo) y otros dirigidos a alguno en particular (por ejemplo, un informe sobre el desarrollo del currculo de matemtica en las aulas dirigido a los tres primeros grupos).
Entendemos que los resultados de la evaluacin podran ser utilizados como un insumo
para el desarrollo de polticas educativas. En ningn caso pensamos, sin embargo, que los resultados de las pruebas y los cuestionarios deban
ser el nico ni el principal insumo con cual se
desarrollen las mencionadas polticas, sino que la
informacin obtenida debe ser contrastada con
informacin de otras fuentes (tanto estadsticas
como opiniones de expertos). Tenemos claro,
adems, que el resultado de los estudiantes en
pruebas estandarizadas es uno de los productos
del sistema educativo, pero existen otros de igual
o mayor importancia (como las tasas de desercin y el desarrollo de valores artsticos, culturales y morales en los estudiantes, por ejemplo).
Los resultados de las pruebas no deben recibir,
entonces, ms importancia de la que les corresponde en un sistema que se ha planteado metas
diversas.

se busca aprovechar al mximo la informacin


disponible, y tomar tiempo producir reportes
para cada producto de la evaluacin; en segundo lugar, la experiencia internacional demuestra
que los resultados de un sistema educativo no
cambian de ao en ao, y por tanto repetir la
evaluacin anual o bianualmente proporcionara
informacin redundante y limitara las posibilidades de aprender de la informacin disponible.
La tercera razn es tcnica: hacer buenas evaluaciones toma tiempo. Por tanto, la siguiente
evaluacin debera ser planificada al menos dos
aos antes de la fecha en que se calcule realizarla.
Las evaluaciones del futuro deberan rotar
las reas de desarrollo, de modo que cada rea
del currculo tenga informacin al menos de una
evaluacin durante la prxima dcada. Pensamos que las evaluaciones deberan seguir siendo
muestrales y no censales. Esto porque un censo
no disminuira significativamente el error estadstico que puede proporcionar una muestra, y en
cambio aumentara considerablemente el costo.
En segundo lugar, una evaluacin censal podra
tener sentido en una evaluacin de altas consecuencias, pero como se dijo al inicio de esta
presentacin pensamos que las evaluaciones
de la UMC deberan continuar siendo orientadas a proporcionar informacin que permita
mejorar la calidad y la equidad del sistema sin
conllevar consecuencias individuales (premios o
castigos) para los principales participantes (estudiantes, docentes y directivos).
Por ltimo, la UMC tiene previsto para el
ao 2002 seguir a una submuestra de estudiantes de los tres grados evaluados, tomando datos
longitudinales y analizando en cada caso el incremento de puntajes y la probabilidad de seguir en
la escuela (sobre todo para los de 4 de primaria), de pasar a la secundaria (los de 6) y de
continuar con los estudios o insertarse en el
mundo laboral (los de 4 de secundaria).

Planes para el futuro!


La UMC tiene previsto continuar desarrollando
un plan de evaluaciones. Estas evaluaciones no
deberan repetirse sino hasta dentro de tres aos
al menos. Las razones son tres: en primer lugar,

23

1
2
3

5
6
7
8

24

http://www.minedu.gob.pe/web/el_ministerio/el_ministerio/PlaniEstra/
med_calidad.htm.
Disponibles en la pgina web de la UMC.
Salvo en casos muy particulares, dado que se desarrollan acciones para
grupos especficos a travs de los programas de educacin bilinge
intercultural de escuelas de frontera y otros.
Por otro lado, el sistema de muestreo que se emplear tampoco permitir obtener conclusiones a niveles muy desagregados. As, por ejemplo,
los resultados de las pruebas de los estudiantes de una misma escuela no
pueden necesariamente generalizarse a la escuela como un todo.
Ver Sistemas nacionales de evaluacin del rendimiento escolar en Amrica Latina en Revista Crecer 1 (Lima, abril del 2000).
Para resultados ver boletn Crecer 5/6, disponible en la pgina web de la
UMC.
Para resultados ver Boletn UMC 7.
En el caso de primaria se tom como base el currculo publicado por el
Ministerio de Educacin durante los ltimos aos; en el caso de secundaria se decidi incluir las capacidades que aparecan en el currculo vigente
y tambin el que se encuentra en experimentacin. Se escogieron aquellas capacidades consideradas ms importantes y al mismo tiempo ms
fciles de evaluar a escala nacional.
Se encuestar a padres o madres solamente en 4 grado de primaria, y
en este caso a un tercio de la muestra.

1 0 Es importante insistir en que la distincin entre estos tres grupos obedece


al programa educativo bajo el que se desarrolla la actividad educativa. El
programa EBI ha introducido, entre otras particularidades, capacitaciones
especiales a docentes y materiales educativos en la lengua verncula de la
poblacin. Los centros educativos pblicos que no estn participando en
EBI emplean los materiales en espaol. En el grupo que hemos denominado hispanohablantes, en realidad se est incluyendo a estudiantes de
programas EBI en otras lenguas vernculas diferentes al quechua del Sur
y al aimara.
1 1 Para ello se utilizarn los procedimientos de la teora de respuesta al
tem.
1 2 Como por ejemplo la teora de respuesta al tem para la descripcin de
los resultados en las pruebas y escalas de actitudes y los modelos lineales
jerrquicos para el anlisis de factores asociados al rendimiento.
1 3 En el artculo de Silvana Vargas El Programa Internacional para la Evaluacin de Estudiantes: se est formando capital humano joven en el Per?,
que aparece en este mismo nmero de Crecer, se hace una presentacin
de las actividades del PISA (por su nombre en ingls: Programme for
International Students Assessment), de la Organizacin para la Cooperacin y el Desarrollo Econmico (OCDE). La participacin del en este
programa forma parte de los esfuerzos del Ministerio de Educacin a
travs de la UMC por intervenir en evaluaciones internacionales.

El Programa Internacional para la Evaluacin de


Estudiantes (PISA-OCDE):
Se est formando capital humano joven en el Per?

Silvana Vargas1

UMC

l Per se ha comprometido a participar en el


Programa Internacional de Evaluacin de Estudiantes (PISA) de la OCDE.
En este artculo se presentan algunas caractersticas de esta evaluacin y de los resultados
esperados, los mismos que estarn disponibles a
partir de diciembre del 2002.
Por qu surge PISA2 y cules son sus
fundamentos?
Entre los retos que enfrentan los pueblos de
Amrica Latina, uno de los ms importantes es el
que atae a la juventud. As, nos vemos ante la
imperiosa necesidad de responder a preguntas
como qu tan preparados se encuentran los alumnos para enfrentar la vida adulta cuando terminen el colegio, qu herramientas est privilegiando el sistema educativo en la enseanza, qu
prcticas educativas incrementan las oportunidades de los estudiantes que provienen de contextos desfavorables y en qu reas es necesario
reforzar la poltica educativa. Responder estas
interrogantes es un proceso que involucra participacin social en la elaboracin de diagnsticos,
una adecuada planificacin educativa, la reflexin
y adecuacin de decisiones de poltica, y su implementacin.
Dos insumos importantes en el proceso
de responder a estas preguntas son
la investigacin y la evaluacin
permanente, y distintas organizaciones vienen
cumpliendo un papel promotor en
esta direccin,
entre ellas la
Organizacin para la
Cooperacin
y el Desarrollo Econmico (OCDE).
La OCDE es
un organismo
que opera a
escala internacional y facilita que los

pases que la integran realicen estudios y mejoren sus polticas econmicas y sociales sobre una
base emprica. Convoca a reuniones peridicas
de intercambio y coordinacin, y como resultado de ello ha sido posible identificar temas prioritarios. Uno de ellos es la necesidad de promover el
capital humano3 de los pases a travs de la educacin y la capacitacin. Sin embargo, a pesar de
los esfuerzos realizados, uno de los retos ms
importantes de este trabajo sigue siendo la identificacin de mediciones confiables acerca del rendimiento educativo que permitan establecer
comparaciones a escala internacional, y sobre
todo, que faciliten la medicin de capacidades4.
En este contexto naci el Programa Internacional para la Evaluacin de Estudiantes (PISA),
desarrollado conjuntamente por los pases miembros de la OCDE y dirigido a evaluar qu conocimientos y capacidades5 esenciales para su participacin en la sociedad han adquirido los jvenes
de 15 aos que se encuentran a punto de concluir su educacin obligatoria para integrarse al
mundo del trabajo o estudios superiores.
PISA tambin ha sido concebido como un
proceso de colaboracin entre gobiernos que
integra la experiencia cientfica y los intereses de
poltica educativa de los pases participantes. De
otro lado, PISA es tambin un mecanismo para la
supervisin sistemtica del rendimiento educativo a travs de evaluaciones cada tres aos y que
har posible que los pases evalen el progreso
de sus objetivos educativos con regularidad.
Cules son los objetivos de PISA?
PISA ha sido diseado fundamentalmente para
identificar y medir el conocimiento y las capacidades de los estudiantes en un gran nmero de
pases, con nfasis en la formulacin de recomendaciones sobre asuntos de poltica educativa. Detrs de PISA hay un modelo dinmico que
sugiere que el aprendizaje se da durante toda la
vida. Sin embargo, se sabe que los estudiantes
no podrn aprender en la escuela todo lo que
necesitan para enfrentar la vida adulta. Tambin
se sabe que para adquirir nuevos conocimientos
es necesario ser competente en reas claves (comprensin de lectura, matemtica y ciencias6). Es

25

aqu donde radica la mayor contribucin de PISA.


El objetivo central del Programa es, precisamente,
evaluar qu tanto han desarrollado los alumnos
conocimientos y capacidades que les permitan
desempearse como ciudadanos en sociedades
complejas y seguir aprendiendo en el futuro independientemente del currculo escolar.
Por otro lado, PISA tambin subraya que no
se trata solamente de tener conocimientos y capacidades sino de que los alumnos sean capaces
de organizar, vencer las dificultades del proceso
de aprendizaje en s y seguir aprendiendo durante toda su vida. Para evaluar estos aspectos,
PISA pedir a los estudiantes que reporten sus
autoaprendizajes, sus motivaciones y sus preferencias por distintas situaciones para aprender.
Por ltimo, PISA ha sido pensado desde una
visin sistmica e integradora. En este sentido,
se ha utilizado un diseo con varios niveles que
recoge informacin del alumno, del aula de clases, del centro educativo, y del contexto social y
cultural donde ste se ubica. Con esta informacin se generar un sistema de datos que permitir tener una visin integral de la situacin de los
alumnos evaluados, comparable a escala internacional.
En sntesis, los objetivos especficos de PISA
son:
Identificar competencias que permitan al
estudiante seguir aprendiendo y adquiriendo nuevos conocimientos y capacidades a lo
largo de su vida.
Evaluar las competencias de los alumnos en
comprensin de lectura, matemtica y ciencias, ms all del conocimiento meramente
escolar y para resolver situaciones de la vida
real.
Proporcionar informacin comparativa entre pases que permita disponer de indicadores estandarizados con fines de poltica
educativa a escala internacional.
Ayudar a los gobiernos en la supervisin de
sus objetivos en educacin a escala nacional
a travs de evaluaciones peridicas, aportando al desarrollo de la poltica educativa.

Paralelamente, PISA recoger informacin


sobre mltiples aspectos del rendimiento educativo. PISA 20007 evalu tres reas: comprensin de lectura, matemtica y ciencias. Asimismo, dos tercios del tiempo de la evaluacin en
cada ciclo estarn dedicados a un rea de dominio en particular, la cual ser evaluada a profundidad8. Estas reas estn definidas en trminos
del conocimiento que los estudiantes necesitan
adquirir en cada rea, las habilidades que stas
requieren y los contextos en los que son aplicadas. En este sentido, los alumnos no sern evaluados en trminos de aptitud o inaptitud sino
a travs de niveles de capacidad.
Las reas a evaluar son detalladas a continuacin:
Comprensin de lectura. El objetivo es evaluar la capacidad de los alumnos para entender y reflexionar a partir de la lectura, y requiere que los estudiantes realicen a travs
de diferentes tipos de textos una serie de
tareas tales como extraer informacin especfica, interpretar textos, reflexionar y argumentar a partir de los contenidos.
Matemtica. Esta rea evala la capacidad
de los alumnos de plantear y resolver problemas de matemtica e involucra el uso de
capacidades que van desde realizar operaciones matemticas bsicas hasta razonamiento matemtico. Esto tambin requiere la aplicacin de conocimientos matemticos
utilizando reas tales como probabilidades,
cambio y crecimiento, espacio y forma, razonamiento cuantitativo, incertidumbre y
relaciones de dependencia.
Ciencias. Evaluar la capacidad de los alumnos para usar el conocimiento cientfico, y
supone el uso de conceptos claves para entender y ayudar en la toma de decisiones.
Esto involucra ser capaz de usar evidencias,
obtener conclusiones cientficas y saber comunicarlas. En este ejercicio se utilizarn
conceptos cientficos relevantes para los estudiantes tales como las reas de la vida y la
salud, el medio ambiente y la tecnologa.

de asesores y expertos de reconocido prestigio


internacional. Aparte de esto, en cada pas se
formar un grupo de trabajo con un comit nacional liderado por un coordinador nacional del
Proyecto.
Respecto a la metodologa, se seleccionar
una muestra de centros educativos y posteriormente una muestra de alumnos en cada uno de
esos centros. Se espera que la muestra tenga
entre 4500 a 10000 alumnos de 15 aos de
edad, en un mnimo de 150 centros educativos10, con un mnimo de 35 alumnos por centro
educativo.
Las evaluaciones se aplicarn a los alumnos a
travs de pruebas de preguntas abiertas y de
opcin mltiple. El objetivo de gran parte del
material de evaluacin ser determinar si los estudiantes pueden reflexionar y pensar activamente, en vez de simplemente repetir el conocimiento que han aprendido. De manera adicional,
se les entregar cuestionarios con preguntas acerca del contexto de los alumnos y del centro educativo. Estos cuestionarios proporcionarn informacin que facilitar el anlisis y la interpretacin
de los resultados.
PISA ha desarrollado los temes de la evaluacin de tal manera que sean vlidos para todos los
pases. Para tal efecto, durante 1999, un nmero
de temes fue probado en los pases participantes.
Los resultados de estas pruebas se utilizaron para
seleccionar temes que contribuyan como indicadores de capacidades y conocimientos.
En trminos del uso de la informacin, se
elaborar un primer reporte internacional que
presentar los resultados generales. Asimismo,
se preparar un conjunto de reportes analticos
que discutirn las implicaciones para las polticas
educativas en reas especficas11. Cada pas elaborar adicionalmente su propio reporte de resultados, de acuerdo con su contexto particular
y teniendo en cuenta su sistema educativo y su
realidad nacional. Finalmente, gran parte de los
datos recogidos por las encuestas estarn disponibles para aquellos que quieran realizar sus propios anlisis12.

Que reas evala PISA?


Como se ha mencionado, PISA evaluar el conocimiento y las capacidades de los estudiantes,
as como su predisposicin para seguir aprendiendo en un proceso de evaluacin de tres ciclos de
tres aos cada uno. La evaluacin identificar la
capacidad de los estudiantes para reflexionar activamente acerca de su conocimiento y sus experiencias, as como para resolver problemas que
sern relevantes para sus vidas futuras.

Cmo se aplicar y utilizar la informacin de


PISA?
PISA propone una estructura de organizacin
slida e intercomunicada que garantiza la calidad
en la coordinacin e implementacin del Programa y el logro de sus objetivos. El Programa
cuenta con un equipo central formado por un
consorcio internacional liderado por el Consejo
Australiano para la Investigacin Educativa
(ACER)9. Asimismo, PISA cuenta con un equipo

Cmo participar el Per en PISA+?


La Unidad de Medicin de la Calidad Educativa
del Ministerio de Educacin tendr bajo su responsabilidad las tareas de coordinar, supervisar e
implementar las actividades de PISA+ en el Per.
Actualmente se realizan los preparativos para la
primera intervencin de PISA+. El proceso se
inici con la aplicacin del estudio piloto en junio
y julio del 2001. Posteriormente se adecuarn
los procedimientos logsticos y administrativos y

26

cuestionarios, se realizar la seleccin definitiva


de la muestra, y se establecern las coordinaciones administrativas y logsticas. Todas estas actividades son estrechamente coordinadas con el
consorcio que tiene a su cargo los aspectos tcnicos del Programa.
La participacin del Per en PISA+ tiene
muchas ventajas. En primer lugar, constituye una
herramienta para informar a la opinin pblica
sobre de los resultados de una evaluacin
novedosa del rendimiento escolar. En segundo
lugar, nuestra participacin en PISA+ podra plantearse como parte de la estrategia de insercin
educativa del Per al contexto internacional. En
tercer lugar, al ser una evaluacin de capacidades, los resultados de PISA+ sern complementarios a los de la evaluacin nacional del rendimiento escolar en las reas de lenguaje y
matemtica que se realizar en noviembre del
2001, lo cual enriquecer nuestra capacidad para
comprender los resultados. En cuarto lugar,
PISA+ ofrecer la oportunidad de emplear tcnicas y procedimientos innovadores, as como
procedimientos estandarizados con el fin de generar informacin que permita establecer comparaciones a escala internacional. Finalmente, los
resultados de PISA+ establecern una lnea base
para contrastar nuestros logros educativos en el
futuro13.
A pesar de estas ventajas, el sistema educativo y las caractersticas de la poblacin peruana
de 15 aos plantean algunas dificultades. En primer lugar, los estudiantes de este grupo etreo
no se encuentran necesariamente concentrados en uno o dos grados de educacin secundaria, como ocurre en la mayora de pases del
primer mundo, sino dispersos en los distintos
grados escolares, en distintos tipos de centros
educativos (polidocentes completos, polidocentes multigrado y unidocentes) y en distintos turnos (maana, tarde y noche). En segundo lugar,
a diferencia de otros pases, los jvenes peruanos ingresan al mercado laboral a muy temprana
edad, lo cual impone restricciones a su disponibilidad de tiempo que afectan su rendimiento.
Por ltimo, dada la heterogeneidad en los contextos sociales y culturales de los pases a evaluar
en PISA, podra parecer injusto e inadecuado
para los estudiantes peruanos el ser evaluados
bajo estndares vlidos para pases desarrollados
y el tener como referencia los resultados alcanzados en contextos muy distintos al nuestro. No
obstante, esta evaluacin pondr en evidencia la
brecha que existe entre el Per y otros pases en
relacin con los logros educativos, y ayudar a
identificar pautas a seguir en la superacin de

estas diferencias en un contexto de creciente


globalizacin. Por esta razn, y como parte inicial
de este proceso, valdra la pena poner nfasis en
las comparaciones regionales que informen acerca de las diferencias y semejanzas entre los pases de Amrica Latina y Espaa14.
Sin embargo, al hacer un balance, y conscientes de que estas condiciones pueden afectar los
resultados de las evaluaciones, sobre todo al compararlos con estndares internacionales, el anlisis
y la interpretacin de los resultados de PISA permitirn identificar vas para la superacin de estas
limitaciones, nuevas oportunidades para la colaboracin y lneas de accin a seguir. En particular, los
resultados de esta evaluacin sern sumamente
informativos acerca de lo que en el mbito internacional se espera que los estudiantes sepan a los
15 aos, pudiendo llevar a partir del marco de
evaluacin y los resultados a pensar en la revisin
de nuestros currculos y/o programas de formacin docente. As por ejemplo, entre los principales usuarios de la informacin de PISA+ estn las
instituciones que forman y/o capacitan docentes, y
tambin especialistas en temas curriculares y en
materiales educativos.
Qu puede esperar el Per de su participacin
en PISA+?
En general, se espera que la informacin generada por PISA contribuya a la formulacin de polticas
educativas y de capacitacin en beneficio de nios
y jvenes. Los resultados de PISA otorgarn, por
ejemplo, el perfil para una lnea base acerca del
conocimiento y las capacidades de los estudiantes
a travs de la descripcin de su capacidad para
realizar tareas especficas. Adicionalmente,
ser posible establecer comparaciones
entre subgrupos definidos de acuerdo con las caractersticas de los
estudiantes, tales como rendimiento segn gnero,
grupo socioeconmico,
tipo de gestin del centro educativo (pblico
o privado) y ubicacin geogrfica.
El anlisis identificar asimismo los
factores demogrficos, sociales, econmicos y educativos
que son claves para
entender el rendimiento de los estudiantes y el
funcionamiento de las escuelas.

Con estos resultados, PISA otorgar una base


extensiva para sugerir lineamientos y anlisis de
poltica educativa. En este sentido, por ejemplo,
se relacionar el rendimiento de los estudiantes
con el contexto educativo; se analizarn las relaciones entre rendimiento escolar y factores escolares (esto es, recursos humanos y materiales
de las escuelas, tipo de gestin y mecanismos
para la toma de decisiones); se identificarn las
diferencias en el rendimiento al interior de los
pases estudiados y los colegios; y se compararn
aspectos de la vida de los estudiantes tales como
sus actitudes hacia el aprendizaje, su vida en la
escuela y el contexto familiar.
Cada tres aos la informacin ser renovada
gracias a los resultados sobre la evolucin de las
caractersticas de los estudiantes. Hay muchas
expectativas puestas en que, a travs de la observacin del ritmo de cambio en los diferentes
pases, los hacedores de poltica pblica sean
capaces de enmarcar el desarrollo local en el
contexto de los cambios globales y hacer frente a
los retos del nuevo milenio. Dado que nuestra
participacin en PISA+ nos permitir poner a la
educacin peruana en el contexto internacional
y recoger informacin que sugiera caminos para
mejorar las competencias de los jvenes peruanos a punto de terminar su educacin secundaria, la suma de todos estos esfuerzos servir como
importante promotor del capital humano joven
en nuestro pas.

27

1
2
3
4

28

La autora agradece a Jos Rodrguez y Anglica Montan de la UMC y a


Santiago Cueto de GRADE, por sus comentarios y sugerencias.
Programme for International Student Assessment (Programa Internacional
para la Evaluacin de Estudiantes).
Capital humano se entiende como las capacidades y los conocimientos
que incrementan la productividad.
En los ltimos aos, el Programa de Educacin de la OCDE ha trabajado
en el mejoramiento de los indicadores internacionales de medicin del
rendimiento educativo. Como resultado de este trabajo, el reporte
Education at a Glance es publicado anualmente, y proporciona informacin comparativa acerca de los recursos humanos y financieros invertidos
en educacin, la evolucin de los sistemas de aprendizaje y las tasas de
retorno a la inversin educativa. Asimismo, el Programa de Indicadores
Educativos Mundiales (World Education Indicators Programme WEI), tiene por finalidad establecer la validez y comparabilidad de indicadores
educativos a escala internacional. Este programa se realiza a travs de la
recoleccin de datos usando un conjunto de definiciones, instrucciones y
mtodos comunes en todos los pases participantes. El Per es parte de
este esfuerzo desde el 2000.
El enfoque del desarrollo de capacidades ha sido utilizado en reas como
la economa, la psicologa y la pedagoga. En esta ltima, se ha pasado de
entender a los alumnos como meros receptores de informacin a entenderlos como agentes activos de su propio aprendizaje enfatizando el
desarrollo de sus capacidades, entre ellas la de aprender a aprender.
Los trminos utilizados en ingls son reading literacy, mathematical literacy
y scientific literacy. Literacy, cuya mejor traduccin al castellano es alfabetizacin, se entiende, en un sentido amplio, no solamente como saber
leer y escribir, sino tambin como las actitudes y los valores referidos al
aprendizaje.
PISA realiz la primera evaluacin en el 2000. Sin embargo, para aquellos pases no-miembros de la OCDE interesados en PISA, se ha
implementado PISA Plus (PISA+) que se iniciar en el 2001. El Per es
parte de este plan junto a pases como Albania, Argentina, Bulgaria, Chile,
Indonesia, Israel, Lituania, Rumania y Tailandia. En rigor, PISA+ es una
extensin de PISA que surge ante la demanda de los pases no-miembros
y a fin de que stos puedan participar en la evaluacin paralelamente a
PISA. Los objetivos de los dos proyectos no difieren. Tampoco se intro-

10

11

12
13

14

ducirn mayores cambios en la metodologa (poblacin objetivo, diseo


muestral y procedimientos de aplicacin de evaluaciones). Sin embargo,
para incorporar mejor las caractersticas de la poblacin y el sistema
educativo de los pases que participen en PISA+, se incluirn nuevos
temes en la encuesta principal. A pesar de estas modificaciones, el reporte de los resultados de PISA+ se har de acuerdo con la escala de PISA.
Esto quiere decir que ser posible comparar los resultados de PISA 2000
y PISA+ sin restriccin alguna.
Las reas han sido distribuidas del siguiente modo: comprensin de
lectura tiene prioridad en la evaluacin del 2000 y PISA+, y matemtica y ciencias la tendrn en las evaluaciones del 2003 y 2006, respectivamente.
El consorcio incluye tambin al Instituto Nacional de los Pases Bajos para
la Medicin Educativa (CITO), Servicio de Evaluacin Educativas (ETS, por
sus siglas en ingls), a la empresa WESTAT de Estados Unidos y al Instituto
Nacional para la Investigacin Educativa (NIER) del Japn.
En el caso del Per, la muestra incluir tanto a centros educativos de
zonas urbanas como de zonas rurales, teniendo como condicin que los
alumnos evaluados estn cursando como mnimo el 5 de primaria y
posean un buen dominio del idioma castellano.
Esto incluir estadsticas descriptivas bsicas del rendimiento de los alumnos, informacin acerca de la relacin entre el rendimiento y los atributos
de los estudiantes, alcances de la efectividad escolar e informacin de
logros acerca de tendencias en el tiempo.
Los resultados sern resumidos en la pgina web http://
www.pisa.ocde.org/.
Lnea de base que, adems, contar con la informacin de la Evaluacin
Nacional del Rendimiento Estudiantil 2001. Vase al respecto el artculo
Cunto aprenden nuestros estudiantes? Preparando la Evaluacin Nacional del 2001 en este mismo nmero de Crecer (p. 20).
Es ms adecuado hacer comparaciones con nuestros pares de la regin
que con pases cuyos niveles de desarrollo son bastante superiores, pues
alcanzar las condiciones en las que estos ltimos consiguen los aprendizajes de sus poblaciones (aun cuando para nosotros sea una meta en el
largo plazo), es muy exigente. Es recomendable, pues, que las primeras
metas estn ms vinculadas a los logros de nuestros vecinos.

Crecer
REVISTA

Boletines anteriores emitidos por la Unidad de Medicin de


la Calidad Educativa (UMC) y GRADE:
BOLETN CRECER 1
Algunos aspectos de la formacin docente en el Per
BOLETN CRECER 2
Te gustan las clases de matemtica? Y las de lenguaje?
BOLETN CRECER 3
Las tareas escolares
BOLETN CRECER 4
La escuela y las expectativas de las madres y los padres
BOLETN CRECER 5/6
Resultados de las pruebas de matemtica y lenguaje.
Qu aprendimos a partir de la Evaluacin CRECER 1998?
BOLETN CRECER 7
Resultados de las pruebas de ciencias sociales y ciencias
naturales. Evaluacin nacional de 1998
BOLETN UMC 8
Efecto de la escuela en el rendimiento en lgico-matemtica
en cuarto grado de primaria
BOLETN UMC 9
El Per en el primer estudio internacional comparativo de la
UNESCO sobre lenguaje, matemtica y factores asociados en
tercer y cuarto grado

La Revista CRECER ha sido elaborada por la Unidad de


Medicin de la Calidad Educativa (UMC) y el Grupo de
Anlisis para el Desarrollo (GRADE). El Ministerio agradece
y alienta la difusin de esta revista, cuyo contenido puede
ser reproducido citando la fuente. Escrbanos a: Unidad de
Medicin de la Calidad Educativa, Ministerio de Educacin,
calle Van de Velde 160, San Borja, Lima 41; o a
medicion@minedu.gob.pe
Vistenos en la pgina web http://www.minedu.gob.pe/ luego
presione indicadores de la columna izquierda, luego presione
"Medicin de Calidad", y finalmente "Boletines Informativos
UMC", donde podr encontrar esta Revista y los boletines UMC.
En el mismo sitio consulte la Revista CRECER 1 y otras
publicaciones y vnculos en Internet relacionados con el tema
de evaluacin del rendimiento escolar.

Boletines dedicados a analizar los temes de las pruebas de


primaria:
BOLETN UMC 10
Anlisis de temes de las pruebas CRECER 1998
Resultados de lgico-matemtica en cuarto grado de
primaria
BOLETN UMC 11
Anlisis de temes de las pruebas CRECER 1998
Resultados de comunicacin integral en cuarto grado de
primaria
BOLETN UMC 12
Anlisis de temes de las pruebas CRECER 1998
Produccin de textos en cuarto grado de primaria
BOLETN UMC 13
Anlisis de temes de las pruebas CRECER 1998
Resultados de lgico-matemtica en sexto grado de primaria
BOLETN UMC 14
Anlisis de temes de las pruebas CRECER 1998
Resultados de comunicacin integral en sexto grado de
primaria
BOLETN UMC 15
Anlisis de temes de las pruebas CRECER 1998
Produccin de textos en sexto grado de primaria

Hecho el depsito legal 2001-2682

Anda mungkin juga menyukai