John Dunlosky, Katherine Rawson, Elizabeth Marsh, Mitchell J Nathan & Daniel T, Willingham
Psychological Science in the Public Interest, 2013, 14(1):4-58.
NOTA: Este texto es un extracto de la traduccin realizada por el grupo docente del artculo
orignial. En el extracto hemos conservado la introduccin, la discusin general y las secciones
correspondientes a la tcnica de Pruebas de Prctica y Subrayado, sobre las que versarn las
preguntas del cuestionario. Dejamos a disposicin la traduccin completa del artculo y el
original en ingls. (Juan Valle Lisboa, 2017).
Introduccin
Si se dispusiera de tcnicas sencillas que los profesores y los estudiantes pudieran utilizar para
mejorar el aprendizaje y el rendimiento de los estudiantes, se sorprendera si no se les informara
sobre estas tcnicas y si muchos estudiantes no las usaran? Qu pasa si los estudiantes en su
lugar estn adoptando tcnicas de aprendizaje ineficaces que socavan su logro, o al menos no lo
mejoran? No deberan dejar de usar estas tcnicas y empezar a usar las que son eficaces? Los
psiclogos han estado desarrollando y evaluando la eficacia de las tcnicas para el estudio y la
instruccin por ms de 100 aos. Sin embargo, algunas tcnicas eficaces estn subutilizadas
-muchos profesores no aprenden acerca de ellas y, por lo tanto, muchos estudiantes no las usan, a
pesar de las evidencias que sugieren que las tcnicas podran beneficiar al estudiante con poco
esfuerzo adicional. Adems, algunas tcnicas de aprendizaje que son populares y utilizadas con
frecuencia por los estudiantes son relativamente ineficaces. Una potencial razn para la
desconexin entre la investigacin sobre la eficacia de las tcnicas de aprendizaje y su uso en la
prctica educativa es que debido a que hay tantas tcnicas disponibles sera difcil para los
educadores examinar las investigaciones pertinentes para decidir cules muestran una eficacia
promisoria y podran ser implementadas por los estudiantes (Pressley, Goodchild, Fleet,
Zajchowski, & Evans, 1989).
Al analizar cmo influyen las tcnicas en el desempeo de los criterios, hacemos hincapi en
investigaciones que han ido ms all de demostrar una mejor memoria para el material objetivo,
midiendo la comprensin, aplicacin y transferencia de conocimiento de los estudiantes. Ntese,
sin embargo, que si bien la adquisicin de conocimiento factual no se considera el nico o ltimo
objetivo de la escolarizacin, consideramos sin reparors que los esfuerzos para mejorar la
retencin del conocimiento por parte de los estudiantes son esenciales para alcanzar otros
objetivos de instruccin; si uno no recuerda ideas, hechos o conceptos bsicos, aplicarlos puede
resultar difcil, sino imposible. Los estudiantes que han olvidado los principios de lgebra no
podrn aplicarlos para resolver problemas o utilizarlos como base para el aprendizaje de clculo
(o fsica, economa u otros dominios relacionados), y los estudiantes que no recuerdan qu es el
condicionamiento operante probablemente tendr dificultades para aplicarlo para resolver
problemas de comportamiento. No estamos defendiendo que los estudiantes pasen su tiempo
robticamente memorizando hechos; en cambio, estamos reconociendo la importante interaccin
entre, por un lado, la memoria de un concepto y, por otro, la capacidad de comprenderlo y
aplicarlo.
Un objetivo de esta monografa es alentar a los estudiantes a usar la tcnica o tcnicas de
aprendizaje apropiadas para lograr un objetivo de instruccin dado. Algunas tcnicas de
aprendizaje se centran principalmente en reforzar la memoria de los estudiantes para los hechos
(por ejemplo, la palabra clave mnemnica), otros se centran ms en mejorar la comprensin (por
ejemplo, auto-explicacin), y otros pueden mejorar la memoria y la comprensin (por ejemplo,
exmenes de prctica). As, nuestra revisin de cada tcnica de aprendizaje describe cmo puede
usarse, su efectividad para producir retencin y comprensin a largo plazo y su amplitud de
eficacia entre las categoras de variables enumeradas en la Tabla 2.
Cualquier educador que haya examinado los materiales del curso de los estudiantes est
familiarizado con la visin de un libro de texto marcado y multicolor. Las evaluaciones ms
sistemticas de libros de texto reales y otros materiales de estudio han apoyado la afirmacin de
que resaltar y subrayar son comportamientos comunes (por ejemplo, Bell & Limber, 2010;
Lonka, Lindblom-Ylnne, & Maury, 1994; Nist & Kirby, 1989). Cuando se pregunta a los
estudiantes sobre lo que hacen al estudiar, suelen reportar subrayar, iluminar o marcar el material
de otra manera mientras tratan de aprenderlo (por ejemplo, Cioffi, 1986; Gurung, Weidert, &
Jeske, 2010). Tratamos estas tcnicas como equivalentes, ya que, conceptualmente, deberan
funcionar de la misma manera (y al menos un estudio no encontr diferencias entre ellas, Fowler
y Barker, 1974, Experimento 2). Las tcnicas tpicamente atraen a los estudiantes porque son
simples de usar, no implican entrenamiento y no requieren que los estudiantes inviertan mucho
tiempo ms all de lo que ya es requerido para leer el material. La pregunta que hacemos aqu es,
una tcnica tan fcil de usar realmente ayudar a los estudiantes a aprender? No se consideran
los estudios en los que el marcado activo del texto se apare con otras tcnicas comunes, como la
toma de notas (por ejemplo, Arnold, 1942, LB Brown y Smiley, 1978, Mathews, 1938). Aunque
muchos estudiantes reportan combinar mltiples tcnicas (por ejemplo, L. Annis y Davis, 1978,
Wade, Trathen, & Schraw, 1990), cada tcnica debe ser evaluada independientemente para
descubrir cules son cruciales para el xito.
4.1 Descripcin general del resaltado y el subrayado y por qu deben funcionar. Como
introduccin a los temas relevantes, comenzamos con la descripcin de un experimento
prototpico. Fowler y Barker (1974, Exp. 1) tuvieron estudiantes que leen artculos (alrededor de
8.000 palabras) sobre el aburrimiento y la vida urbana de (las revistas) Scientific American y
Science. Los estudiantes fueron asignados a uno de tres grupos: un grupo de control, en el que
slo leen los artculos; un grupo de destacado-activo, en el que fueron libres para resaltar tanto
de los textos como quisieran; un grupo pasivo-destacando, en el cual leyeron los textos marcados
que haban sido destacados por los participantes que participaron en el grupo destacado activo.
Todos recibieron una hora para estudiar los textos (el tiempo en la tarea fue igualado entre los
grupos); Los estudiantes en la condicin de resaltado activo fueron indicados para marcar
material particularmente importante. Todos los sujetos regresaron al laboratorio una semana
despus y se les permiti revisar sus materiales originales durante 10 minutos antes de tomar una
prueba de eleccin mltiple de 54 tems. En general, los grupos destacados no superaron al grupo
control en la prueba final, resultado que, lamentablemente, se ha repetido en gran parte de la
literatura (por ejemplo, Hoon, 1974; Idstein y Jenkins, 1972; Stordahl y Christensen, 1956). Sin
embargo, los resultados de anlisis ms detallados del desempeo en los dos grupos resaltantes
son informativos acerca de los efectos que podran tener en el procesamiento cognitivo. En
primer lugar, dentro del grupo de resaltado activo, el desempeo fue mejor en los tems de la
prueba para los cuales el texto relevante haba sido resaltado (ver Blanchard y Mikkelson, 1987;
L. L. Johnson, 1988 para resultados similares). En segundo lugar, este beneficio para la
informacin destacada fue mayor para los marcadores activos (que seleccionaron lo que resaltar)
que para los marcadores pasivos (que vieron la misma informacin resaltada, pero no la
seleccionaron). En tercer lugar, este beneficio para la informacin destacada fue acompaado por
un pequeo costo en las preguntas de los exmenes de la prueba de informacin que no se haban
destacado. Para explicar estos hallazgos, los investigadores a menudo sealan un fenmeno
cognitivo bsico conocido como el efecto aislamiento, por el cual un elemento semnticamente o
fonolgicamente nico en una lista es mucho mejor recordado que sus contrapartes menos
distintivas (vase Hunt, 1995, para una descripcin de este trabajo ). Por ejemplo, si los
estudiantes estn estudiando una lista de palabras categricamente relacionadas (por ejemplo,
"escritorio", "cama", "silla", "mesa") y una palabra de otra categora (por ejemplo, "vaca"), Los
estudiantes ms tarde sern ms propensos a recordarlo de lo que lo haran si hubiera sido
estudiado en una lista de palabras categricamente relacionadas (por ejemplo, "cabra", "cerdo",
"caballo", "pollo"). La analoga con el resaltado es que una oracin resaltada, subrayada o
mayscula "saldr" del texto de la misma manera que la palabra "vaca" sera si estuviera aislada
en una lista de palabras para tipos de muebles. De acuerdo con esta expectativa, varios estudios
han demostrado que la lectura de un texto marcado promueve ms tarde la memoria del material
marcado: Es ms probable que los estudiantes recuerden cosas que el experimentador destac o
subray en el texto (por ejemplo, Cashen & Leicht, 1970; Crouse & Idstein, 1972, Hartley,
Bartlett y Branthwaite, 1980, Klare, Mabry, & Gustafson, 1955, vase Lorch, 1989 para una
revisin).
La seleccin activa de la informacin debera beneficiar a la memoria ms que simplemente leer
el texto marcado (dado que el primero capitalizara los beneficios de la generacin de
informacin, Slamecka y Graf, 1978, y procesamiento activo en general, Faw & Waller, 1976).
El texto marcado atrae la atencin del lector, pero se requiere procesamiento adicional si el lector
tiene que decidir qu material es ms importante. Tales decisiones requieren que el lector piense
sobre el significado del texto y cmo sus diferentes piezas se relacionan entre s (es decir,
procesamiento organizacional, Hunt & Worthen, 2006). En el experimento Fowler y Barker
(1974), este beneficio se reflej en la mayor ventaja de la informacin resaltada entre los
marcadores activos que entre los receptores pasivos del mismo texto resaltado. Sin embargo, el
resaltado activo no siempre es mejor que recibir material que ya ha sido resaltado por un
experimentador (por ejemplo, Nist & Hogrebe, 1987), probablemente porque los
experimentadores suelen ser mejores que los estudiantes al resaltar las partes ms importantes de
un texto. De manera ms general, es probable que la calidad del resaltado sea crucial para ayudar
a los estudiantes a aprender (por ejemplo, Wollen, Cone, Britcher y Mindemann, 1985), pero
desafortunadamente muchos estudios no han contenido ninguna medida de la cantidad o la
adecuacin de los estudiantes resaltando. Los estudios que han examinado la cantidad de texto
marcado han encontrado gran variabilidad en lo que los estudiantes realmente marcan, con
algunos estudiantes marcando casi nada y otros marcando casi todo (por ejemplo, Idstein y
Jenkins, 1972). Algunos datos intrigantes vinieron del grupo que destacaba activamente en
Fowler y Barker (1974). El rendimiento de la prueba se correlacion negativamente (r = -29) con
la cantidad de texto que se haba destacado en el grupo de resaltado activo, aunque este resultado
no fue significativo dado el pequeo tamao de la muestra (n = 19). Marcar demasiado texto es
probable que tenga mltiples consecuencias. En primer lugar, el marcado excesivo reduce el
grado en que el texto marcado se distingue de otro texto, y es menos probable que las personas
recuerden el texto marcado si no es distintivo (Lorch, Lorch y Klusewitz, 1995). En segundo
lugar, es probable que tome menos procesamiento para marcar un montn de texto que para
destacar los detalles ms importantes. En consonancia con esta ltima idea, los beneficios del
marcado de texto pueden ser ms probables cuando los experimentadores imponen lmites
explcitos a la cantidad de texto que los estudiantes pueden marcar. Por ejemplo, Rickards y
August (1975) encontraron que los estudiantes limitados a subrayar una sola oracin por prrafo
ms tarde recordaron ms de un texto cientfico que un grupo de control sin subrayar. Del mismo
modo, L. L. Johnson (1988) encontr que marcar una oracin por prrafo ayudaba a los
estudiantes universitarios en una clase de lectura a recordar la informacin subrayada, aunque no
se tradujo en un beneficio general.
4.2 En qu medida son generales los efectos del resaltado y el subrayado? Hemos esbozado
mecanismos hipotticos por los cuales el resaltado podra ayudar a la memoria, y caractersticas
particulares de destacar que seran necesarias para que estos mecanismos fueran efectivos (por
ejemplo, resaltando slo material importante). Sin embargo, la mayora de los estudios no han
mostrado ningn beneficio de resaltar (como se suele utilizar) por encima del beneficio de la
simple lectura, por lo que la cuestin relativa a la generalidad de los beneficios de destacar es en
gran medida discutible. Debido a que la investigacin sobre el alumbrado no ha sido
particularmente alentadora, pocas investigaciones han evaluado sistemticamente los factores
que podran moderar la eficacia de la tcnica; por ejemplo, no podramos incluir una subseccin
de las Condiciones de Aprendizaje (4.2a) por falta de evidencia relevante. En la medida en que la
literatura lo permita, esbozamos las condiciones conocidas para moderar la efectividad del
resaltado. Tambin describimos cmo nuestra conclusin acerca de la ineficacia relativa de esta
tcnica se mantiene en una amplia gama de situaciones.
4.2b Caractersticas del estudiante. Destacar no ha podido ayudar a los estudiantes de base de
la Fuerza Area (Stordahl & Christensen, 1956), a los nios (eg, Rickards & Denner, 1979) y a
los estudiantes de recuperacin (es decir, los estudiantes que obtuvieron un promedio de 390 en
la seccin verbal SAT; & Hogrebe, 1987), as como sub-graduados prototpicos (por ejemplo,
Todd & Kessler, 1971). Es posible que estos grupos se esforzaron por resaltar slo el texto
pertinente, dado que otros estudios han sugerido que la mayora de los estudiantes subrayan el
texto. Los resultados de un estudio con aviadores sugirieron que el conocimiento previo podra
moderar la efectividad de la iluminacin. En particular, los aviadores leyeron un pasaje sobre los
motores de los aviones que no estaban marcados (condicin de control) o tenan informacin
clave subrayada (Klare et al., 1955). Los experimentadores tuvieron acceso a las puntuaciones
medias de aptitud mecnica de los participantes y vincularon el desempeo en el experimento a
esas puntuaciones. El texto marcado era ms til para los aviadores que haban recibido altas
puntuaciones. Este estudio incluy textos premarcados y no examin lo que los participantes
habran subrayado por su cuenta, pero parece probable que los estudiantes con poco
conocimiento de un tema tendran dificultades para identificar qu partes de un texto eran ms o
menos importantes (y por lo tanto se beneficiaran menos del resaltado activo que los estudiantes
con conocimientos). Otra posibilidad interesante ha venido de un estudio en el cual los
experimentadores motivaron extrnsecamente a los participantes prometindoles que los aquellos
participantes con puntajes mximos en un examen recibiran U$ 5 (Fass & Schumacher, 1978).
Los participantes leen un texto sobre enzimas; A la mitad de los participantes se les dijo que
subrayaran palabras clave y frases. Todos los participantes tomaron una prueba de 15 preguntas.
Un beneficio de subrayar se observ entre los estudiantes que podran ganar la bonificacin de $
5, pero no entre los estudiantes en un grupo de control. Por lo tanto, aunque los resultados de este
nico estudio necesitan ser replicados, parece que algunos estudiantes pueden tener la capacidad
de resaltar con eficacia, pero no siempre lo hacen.
4.2c Materiales. Conclusiones similares sobre el marcado del texto han venido de estudios
usando una variedad de materiales de texto diferentes sobre temas tan diversos como la
aerodinmica, las escuelas griegas antiguas, la agresin y Tanzania, que varan en longitud de
unas cuantas palabras a unos cuantos miles. Todd y Kessler (1971) manipularon la longitud del
texto (todos los materiales eran relativamente cortos, con longitudes de 44, 140 o 256 palabras) y
encontraron que el subrayado era ineficaz, independientemente de la longitud del texto. Fass y
Schumacher (1978) manipularon si un texto sobre enzimas era fcil o difcil de leer; La versin
fcil estaba en un nivel de lectura del sptimo grado, mientras que la versin difcil era en el
nivel de la escuela secundaria y contena oraciones ms largas. Una mayor diferencia entre el
resaltado y los grupos de control se encontr para el rendimiento en las pruebas de eleccin
mltiple para el texto difcil en contraposicin al texto fcil.
4.2d Tareas de criterio. Se ha observado una falta de beneficio de destacar en las pruebas
inmediatas y tardas, con retrasos que van desde 1 semana a 1 mes. Se han examinado una
variedad de medidas dependientes, incluyendo el recuerdo libre, las preguntas de opcin mltiple
de contenido, las preguntas de opcin mltiple de comprensin y las pruebas de finalizacin de
la oracin. Tal vez lo ms preocupante son los resultados de un estudio que sugiere que subrayar
puede ser perjudicial para la posterior capacidad de hacer inferencias. Peterson (1992) hizo que
estudiantes avanzados de educacin leyeran un captulo de 10.000 palabras de un libro de texto
de historia; Dos grupos subrayaron mientras estudiaban durante 90 minutos, mientras que a un
tercer grupo slo se le permiti leer el captulo. Una semana ms tarde, a todos los grupos se les
permiti revisar el material durante 15 minutos antes de realizar un examen (los dos grupos de
subrayados difirieron si revisaban una copia limpia del texto original o una que contena su
subrayado). Todo el mundo recibi la misma prueba dos meses despus, sin tener otra
oportunidad de revisar el texto. La prueba de eleccin mltiple consisti en 20 tems que
analizaron hechos (y podran estar vinculados a referencias especficas en el texto) y 20 tems
que requeran inferencias (que tendran que basarse en conexiones a travs del texto y no podan
estar vinculadas a aspectos especficos, Informacin subrayada). Los tres grupos se
desempearon de manera similar en las preguntas de hecho, pero los estudiantes que haban
subrayado (y revisado sus textos marcados) estaban en desventaja en las preguntas de inferencia.
Este patrn de resultados requiere replicacin y extensin, pero una posible explicacin es que el
subrayado estndar llama la atencin ms a los conceptos individuales (que apoyan la memoria
de los hechos) que a las conexiones a travs de los conceptos (como lo requieren las preguntas de
inferencia) . En consonancia con esta idea, en otro estudio, los subrayados que esperaban que una
prueba final estuviera en un formato de opcin mltiple obtuviesen puntajes ms altos que los
subrayados que esperaban que fuera en un formato de respuesta corta (Kulhavy, Dyer y Silver,
1975), independientemente del formato real de las preguntas de la prueba final. La informacin
subrayada puede alinearse naturalmente con el tipo de informacin que los estudiantes esperan
en los exmenes de eleccin mltiple (por ejemplo, S. R. Schmidt, 1988), pero los estudiantes
pueden estar menos seguros de qu subrayar al estudiar para una prueba de respuesta corta.
4.3 Efectos en contextos educativos representativos. Como se alude al principio de esta seccin,
las encuestas de libros de texto reales y otros materiales estudiantiles han apoyado la frecuencia
de destacar y subrayar en contextos educativos (por ejemplo, Bell & Limber, 2010; Lonka et al.,
1994). Menos claras son las consecuencias de tales comportamientos del mundo real. Los
estudios en el aula han examinado si las marcas proporcionadas por el instructor afectan el
rendimiento del examen. Por ejemplo, Cashen y Leicht (1970) hicieron que los estudiantes de
psicologa leyeran artculos cientficos sobre el aprendizaje de los animales, el suicidio y los
conflictos grupales, cada uno de los cuales contena cinco estados crticos que fueron subrayados
en rojo para la mitad de los estudiantes. Los artculos estaban relacionados con el contenido de
los cursos pero no estaban cubiertos en las conferencias. Las puntuaciones de los exmenes en
los tems relacionados con las declaraciones crticas fueron mayores cuando las declaraciones se
haban subrayado en rojo que cuando no. Curiosamente, los estudiantes en la condicin de
subrayado tambin obtuvieron mejores calificaciones en las preguntas del examen sobre la
informacin que estaba en oraciones adyacentes a las declaraciones crticas (en contraposicin a
puntuar peor en preguntas sobre informacin no subordinada). El beneficio de los tems
subrayados se replic en otra clase de psicologa (Leicht & Cashen, 1972), aunque los efectos
fueron ms dbiles. Sin embargo, no est claro si los resultados de cualquiera de estos estudios se
generalizaran a una situacin en la que los estudiantes estuvieran a cargo de su propio resaltado,
porque probablemente marcaran ms de cinco declaraciones en un artculo (y por lo tanto
mostrara menos discriminacin entre informacin importante y trivial).
8 Pruebas de prctica
Es probable que muchos estudiantes consideren que la prueba es una necesidad indeseable de
educacin, y sospechamos que la mayora de los estudiantes preferiran tomar el menor nmero
posible de pruebas. Este punto de vista de la prueba es comprensible, ya que la mayor parte de la
experiencia de los estudiantes con pruebas involucra evaluaciones sumativas de alto riesgo que
se administran para evaluar el aprendizaje. Este punto de vista de las pruebas tambin es
lamentable, ya que eclipsa el hecho de que las pruebas tambin mejoran el aprendizaje. Desde el
estudio seminal de Abbott (1909), ms de 100 aos de investigacin han arrojado varios cientos
de experimentos que demuestran que la prctica de pruebas mejora el aprendizaje y la retencin
(para reseas recientes, vase Rawson & Dunlosky, 2011; Roediger & Butler, 2011; Roediger,
Putnam & Smith, 2011). Incluso en 1906, Edward Thorndike recomend que "el recuerdo activo
de un hecho desde adentro es, por regla general, mejor que su impresin desde fuera" (pgina
123, Thorndike, 1906). El siglo de investigacin sobre las pruebas de prctica desde entonces ha
apoyado la recomendacin de Thorndike, demostrando la amplia generalizacin de los beneficios
de las pruebas de prctica.
Tenga en cuenta que usamos el trmino prueba de prctica aqu (a) para distinguir las pruebas
que se completan como una prctica de bajas consecuencias o sin consecuencias o actividad de
aprendizaje fuera de la clase, de las evaluaciones sumativas administradas por un instructor en
clase y ( B) abarcar cualquier forma de pruebas prcticas que los estudiantes puedan realizar por
s mismos. Por ejemplo, los exmenes prcticos pueden incluir la prctica de recordar la
informacin del objetivo mediante el uso de tarjetas instantneas reales o virtuales, completar los
problemas de prctica o las preguntas incluidas al final de los captulos de libros de texto o
completar exmenes incluidos en los materiales complementarios electrnicos que cada vez ms
acompaan a los libros de texto.
8.1 Descripcin general de las pruebas de prctica y por qu debera funcionar. Como
ejemplo ilustrativo del poder de la prueba, Runquist (1983) present a estudiantes de pregrado
una lista de pares de palabras para el estudio inicial. Despus de un breve intervalo durante el
cual los participantes completaron las tareas de relleno, la mitad de las parejas de palabras fueron
evaluadas presentando solamente una de ellas como pista y la otra mitad no. Los participantes
completaron una prueba de recuento final para todos los pares, ya sea 10 minutos o 1 semana
despus. El resultado de la prueba final fue mejor para los pares que fueron probados en la
prctica que los pares que no lo fueron (53% versus 36% despus de 10 minutos, 35% versus 4%
despus de 1 semana). Considerando que este estudio ilustra el mtodo de comparar el
rendimiento entre las condiciones que no implican y una prueba de prctica, muchos otros
estudios han comparado una condicin de prueba de prctica con condiciones ms estrictas que
implican presentaciones adicionales de la informacin a ser aprendido. Por ejemplo, Roediger y
Karpicke (2006b) presentaron a los estudiantes de pregrado un breve texto expositivo para el
estudio inicial seguido bien por un segundo ensayo del estudio o por un examen de recuperacin
libre de prctica. Una semana despus, el recuerdo libre fue considerablemente mejor entre el
grupo que haba tomado la prueba de prctica que entre el grupo que haba re-estudiado (56%
versus 42%). Como otra demostracin particularmente convincente de la potencia de las pruebas
en comparacin con el reestudio, Karpicke y Roediger (2008) presentaron a los estudiantes de
pregrado con traducciones Swuahili- Ingls para ciclos de estudio y prctica. Despus del primer
retiro correcto, los tems se presentaron solamente en ciclos posteriores de estudio sin ms
pruebas, o solamente en ciclos de prueba subsiguientes sin estudio adicional. El rendimiento en
una prueba final una semana despus fue sustancialmente mayor despus de las pruebas
continuas (80%) que despus del estudio continuo (36%).
Por qu las pruebas de prctica mejoran el aprendizaje? Mientras que una gran cantidad de
estudios han establecido la generalidad de los efectos de las pruebas, las teoras acerca de por
qu mejora el aprendizaje se han quedado atrs. Sin embargo, las descripciones tericas estn
emergiendo cada vez ms para explicar dos tipos diferentes de efectos de prueba, que se
denominan efectos directos y efectos mediados de la prueba (Roediger & Karpicke, 2006a). Los
efectos directos se refieren a los cambios en el aprendizaje que surgen del acto de tomar una
prueba en s, mientras que los efectos mediados se refieren a los cambios en el aprendizaje que
surgen de una influencia de la prueba en la cantidad o tipo de codificacin que tiene lugar
despus de la prueba (pej, durante una oportunidad de reestudio subsiguiente).
Con respecto a los efectos directos de las pruebas de prctica, Carpenter (2009) propuso
recientemente que las pruebas pueden mejorar la retencin al desencadenar procesos de
recuperacin elaborativa. El intento de recuperar informacin de destino implica una bsqueda
de memoria a largo plazo que active la informacin relacionada, y esta informacin activada
puede ser codificada junto con el objetivo recuperado, formando un trazado elaborado que
proporciona mltiples vas para facilitar el acceso posterior a ese informacin. En apoyo de este
relato, Carpenter (2011) hizo que los estudiantes estudiaran parejas de palabras dbilmente
relacionadas (por ejemplo, "madre" - "nio") seguidas ya sea por un estudio adicional o una
prueba de recuperacin de prctica. En una prueba final posterior, la recuperacin de la palabra
objetivo se realiz a travs de una palabra previamente no representada pero fuertemente
relacionada (por ejemplo, "padre"). La probabilidad fue mayor despus de una prueba de prctica
que despus del reestudio, presumiblemente porque la prueba de prctica aument la
probabilidad de que la informacin relacionada fuese activada y codificada junto con la diana
durante el aprendizaje.
En cuanto a los efectos mediados de las pruebas de la prctica, Pyc y Rawson (2010, 2012b)
propusieron un relato similar, segn el cual las pruebas prcticas facilitan la codificacin de
mediadores ms eficaces (es decir, informacin elaborativa que conecta las seales y los
objetivos). Pyc y Rawson (2010) presentaron a los estudiantes con traducciones Swahili-Ingls
en un bloque de estudio inicial, el cual fue seguido por tres bloques de ensayos de reestudio. Para
la mitad de los participantes, cada ensayo de reestudio fue precedido por la prctica de recordad
con claves (se da una palabra y se trata de recordad la otra). A todos los alumnos se les pidi que
generaran e informaran de un mediador de palabras clave durante cada ensayo de reestudio
(NdeT, una palabra intermedia). Cuando se probaron 1 semana ms tarde, en comparacin con
los estudiantes que slo haban reestudiado, los estudiantes que haban participado en la prctica
de recuerdo con clave eran ms propensos a recordar a sus mediadores cuando se los evalu con
la palabra clave y eran ms propensos a recordar el objetivo cuando se los evalua con su
mediador. Evidencia reciente tambin sugiere que las pruebas de prctica pueden mejorar la
forma en que los estudiantes organizan mentalmente la informacin y lo bien que procesan los
aspectos idiosincrsicos de los tems individuales, lo que en conjunto puede respaldar una mejor
retencin y desempeo de las pruebas (Hunt, 1995, 2006). Zaromb y Roediger (2010)
presentaron a los estudiantes con listas que consistan en palabras de diferentes categoras
taxonmicas (por ejemplo, verduras y ropa), ya sea para ocho bloques de ensayos de estudio o
para cuatro bloques de ensayos de estudio con cada ensayo seguido de un examen de libre
prctica. Replicando los efectos bsicos de la prueba, el recuerdo libre final 2 das despus fue
mayor cuando los tems haban recibido pruebas de prctica (39%) que cuando slo haban sido
estudiados (17%). Es importante destacar que la condicin de la prueba de la prctica tambin
super la condicin del estudio en las medidas secundarias, principalmente aprovechando el
procesamiento organizacional y procesamiento idiosincrsico.
8.2 Cun generales son los efectos de los exmenes prcticos? Dado el volumen de la
investigacin sobre los efectos de la prueba, una revisin exhaustiva de la literatura est ms all
del alcance de este artculo. Por lo tanto, nuestra sntesis se basa principalmente en estudios de
los ltimos 10 aos (que incluyen ms de 120 artculos), que creemos que representan el estado
actual del campo. La mayora de estos estudios compararon las condiciones que implicaban
pruebas de la prctica con condiciones que no implicaban pruebas de la prctica o que
implicaban solamente el reestudio. Sin embargo, tambin consideramos el trabajo ms reciente
enfrentando diferentes condiciones de pruebas de prctica entre s para explorar cuando las
pruebas de prctica funcionan mejor.
8.2b Caractersticas del estudiante. Una gran mayora de los estudios han involucrado a
estudiantes universitarios como participantes, pero los efectos de las pruebas tambin se han
demostrado en participantes de edades muy diversas. Los estudios que involucran muestras no-
universitarias han diferido algo en el tipo, la dosificacin o el momento de las pruebas de la
prctica involucradas, pero se ha demostrado algn tipo de efecto de prueba con los nios de
preescolar y kindergarten (Fritz, Morris, Nolan y Singleton, 2007, Kratochwill, , Y Conzemius,
1977), los estudiantes de la escuela primaria (Atkinson y Paulson, 1972, Bouwmeester y
Verkoeijen, 2011, Fishman, Keller y Atkinson, 1968, Gates, 1917, Metcalfe y Kornell, 2007,
Metcalfe, Kornell y Finn, 2009 (Myers, 1914), Rea y Modigliani, 1985, Rohrer, Taylor y Sholar,
2010, Spitzer, 1939), los estudiantes de ciclo bsico de secundaria (Carpenter et al., 2009,
Glover, 1989, McDaniel, Agarwal, Huelser, McDermott y Roediger, 2011, Metales, Kornell y
Son, 2007, Sones y Stroud, 1940), estudiantes de secundaria avanzados (Duchastel, 1981,
Duchastel y Nungester, 2009; Nungester & Duchastel, 1982), y estudiantes ms avanzados,
como estudiantes de medicina de 3 y 4 ao (Krommann et al., 2009; Rees, 1986; Schmidmaier
et al., 2011). En el otro extremo del continuo, los efectos de las pruebas tambin se han
demostrado con los estudiantes de mediana edad y con los adultos mayores (Balota, Duchek,
Sergent-Marshall y Roediger, 2006; Bis- hara & Jacoby, 2008; Logan & Balota, 2008 , Maddox,
Balota, Coane y Duchek, 2011, Sumowski, Chiaravalloti, & DeLuca, 2010, Tse, Balota, &
Roediger, 2010). En contraste con el rango relativamente amplio de edades cubiertas en la
literatura de efectos de prueba, una investigacin sorprendentemente mnima ha examinado los
efectos de las pruebas como una funcin de las diferencias individuales en el conocimiento o la
capacidad. Carroll, Campbell-Ratcliffe, Murnane y Perfect (2007) le presentaron a estudiantes de
primer ao y avanzados de psicologa dos pasajes de un libro de psicologa anormal. Los
estudiantes completaron una prueba de prctica de respuesta corta en uno de los pasajes y luego
hicieron una prueba final en ambos pasajes, ya sea 15 minutos o 1 da despus. Ambos grupos
mostraron efectos de prueba similares en ambos puntos de tiempo (con un 33% y un 38% de
precisin mejor, respectivamente, en el material que se haba ensayado en comparacin con el
material que no lo haba hecho). Aunque estos resultados iniciales constituyen una evidencia
alentadora de que los efectos de la prueba pueden ser robustos en todos los niveles de
conocimiento, es necesario trabajar ms antes de que se puedan sacar conclusiones fuertes acerca
de hasta qu punto el nivel de conocimiento modera los efectos de las pruebas.
Del mismo modo, una investigacin mnima ha examinado los efectos de las pruebas en funcin
de los niveles de capacidad acadmicamente relevantes. En un estudio de Spitzer (1939), 3.605
estudiantes de sexto grado de 91 escuelas elementales diferentes leyeron un breve texto y
realizaron una prueba inmediata, para proporcionar una medida de referencia de la capacidad de
comprensin de lectura. En los grupos de inters aqu, todos los estudiantes leyeron un texto
experimental, la mitad completaron una prueba de opcin mltiple de prctica, y luego
completaron una prueba de opcin mltiple, ya sea 1 o 7 das despus. Spitzer inform el
rendimiento final de la prueba para el texto experimental por separado para los tercios superior e
inferior de los estudiantes en la medida de lnea de base.
Fig. 7. Precisin promedio en un test final administrado 1 da o una semana luego de una
sesin de aprendizaje, que o bien incluy o bien no un ensayo de prueba, para los
estudiantes del tercio superior y el inferior de los puntajes obtenidos en una preuba de lnea
de base de la habilidad en Spitzer (1939). Las barras de error representan los errores
estndar.
Como se muestra en la Figura 7, tomar el examen de prctica benefici a ambos grupos de
estudiantes. Dicho esto, el efecto de prueba pareca ser algo mayor para los lectores de mayor
capacidad que para los lectores de menor capacidad (con aproximadamente un 20%, frente al
12%, mejoras en la precisin), aunque Spitzer no inform las estadsticas inferenciales
pertinentes.
Finalmente, la evidencia de los estudios que involucran poblaciones de pacientes es al menos
sugerente con respecto a la generalidad de los efectos de la prueba a travs de diferentes niveles
de capacidad de aprendizaje. Por ejemplo, Balota et al. (2006) descubrieron que las pruebas
prcticas espaciadas mejoraron la retencin en intervalos de tiempo cortos no slo para adultos
jvenes y adultos mayores sanos, sino tambin para adultos mayores con enfermedad de
Alzheimer. Del mismo modo, Sumowski et al. (2010) encontraron que una prueba de prctica
produjo efectos de prueba ms grandes para los subgrupos de pacientes con esclerosis mltiple (d
= 0,95 vs d = 0,54, respectivamente, con agrupamiento basado en el rendimiento) En una medida
basal de la memoria). En suma, varios estudios han sugerido que las pruebas de prctica pueden
beneficiar a los individuos con diferentes niveles de conocimiento o capacidad, pero la medida
en que la magnitud del beneficio depende de estos factores sigue siendo una cuestin abierta.
8.2c Materiales. Muchos de los estudios que han demostrado efectos de prueba han involucrado
materiales verbales relativamente simples, incluyendo listas de palabras y pares de palabras
asociadas. Sin embargo, la mayora de los conjuntos de materiales utilizados han tenido cierta
relevancia educativa. Una considerable mayora de los estudios que utilizan materiales asociados
han incluido traducciones en el extranjero (incluyendo chino, iupiaq, japons, lituano, espaol y
swahili) o palabras de vocabulario emparejadas con sinnimos. Otros estudios han ampliado los
efectos de los ttulos de libros apareados y nombres de autor, nombres y rostros, objetos y
nombres, e imgenes y traducciones en el extranjero (por ejemplo, Barcroft, 2007, Carpenter &
Vul, 2011, Morris & Fritz, 2002, Rohrer, 2009 ). Un nmero considerable de estudios tambin ha
mostrado efectos de prueba para informacin factual, incluyendo hechos de trivia y preguntas de
conocimiento general (por ejemplo, Butler, Karpicke y Roediger, 2008; TA Smith y Kimball,
2010) y hechos extrados de unidades de aula en ciencia , historia y psicologa (por ejemplo, Car-
penter et al., 2009, McDaniel et al., 2011, McDaniel, Wildman y Anderson, 2012).
Investigaciones anteriores mostraron que las pruebas de prctica ayudaron a los nios a aprender
hechos de multiplicacin y listas de ortografa (Atkinson y Paulson, 1972, Fishman et al., 1968;
Rea & Modigliani, 1985), y estudios recientes han reportado un mejor aprendizaje de
definiciones de palabras de vocabulario (Metcalfe et al. Al., 2007) y definiciones de conceptos de
trmino clave a partir del material de la clase (Rawson & Dunlosky, 2011). Un nmero cada vez
mayor de estudios ha mostrado beneficios para aprender de materiales de texto de diversas
longitudes (de 160 palabras a 2000 palabras o ms), de diversos gneros de texto (por ejemplo,
entradas de enciclopedia, artculos de revistas cientficas, pasajes de libros de texto) (P. Ej.,
Economa de la Guerra Civil, ecolocacin de murcilagos, nutrias marinas, teora del big bang,
fsiles, exploracin del rtico, tucanes).
Las pruebas de prctica han mejorado el aprendizaje a partir de conferencias en video y de
animaciones narradas sobre temas como el desarrollo de adultos, relmpagos, neuroanatoma e
historia del arte (Butler y Roediger, 2007; Vojdanoska, Cranney y Newell, 2010). Aunque gran
parte del trabajo sobre los efectos de la prueba ha utilizado materiales verbales, tambin se ha
demostrado que las pruebas prcticas respaldan el aprendizaje de materiales que incluyen
informacin visual o espacial, incluyendo el aprendizaje de caractersticas y localizaciones en
mapas (Carpenter y Pashler, 2007; Rohrer et al., 2010), identificando aves (Jacoby, Wahlheim, &
Coane, 2010), nombrando objetos (Helder y Shaughnessy, 2008; Morris & Fritz, 2002),
aprendiendo localizaciones espaciales de objetos (Sommer, Schoell, & Bchel, 2008),
aprendiendo smbolos (Coppens, Verkoeijen, & Rikers, 2011) e identificando partes
representadas de una flor (Glover, 1989). Por ltimo, el trabajo reciente ha extendido los efectos
de la prueba al aprendizaje no declarativo, incluyendo el aprendizaje de habilidades de
resucitacin (Kromann et al., 2009) y el aprendizaje inductivo de las funciones de insumo-
producto (Kang, McDaniel et al., 2011).
Fig. 8. Precisin en los test finales que consistan en preguntas que evalan la transferencia basada en inferencias,
basados en conceptos o hechos clave, administrada una semana despus de una sesin de aprendizaje que
involucraba ya sea pruebas de prctica o re-estudio, en Butler (2010). Las barras de error representan el error
estndar.
La preferencia por utilizar intervalos de retencin ms largos puede deberse en parte a los
resultados de varios estudios que informan que los efectos de la prueba son mayores cuando se
administran las pruebas finales despus de retrasos ms prolongados (JCK Chan, 2009; CI
Johnson & Mayer , 2009, Kornell, Bjork y Garcia, 2011, Roediger y Karpicke, 2006b, Runquist,
1983, Schmidmaier et al., 2011, Toppino y Cohen, 2009, Wenger, Thompson y Bartling, 1980,
Wheeler, Ewers y Buonanno , 2003). Es impresionante que se hayan observado efectos de prueba
despus de intervalos an ms largos, incluyendo intervalos de 2 a 4 semanas (por ejemplo,
Bahrick & Hall, 2005, Butler y Roediger, 2007, Carpenter, Pashler, Wixted y Vul, 2008,
Kromann Et al., 2009, Rohrer, 2009), de 2 a 4 meses (McDaniel, Anderson, Derbish y
Morrisette, 2007, Morris y Fritz, 2002; Rawson y Dunlosky, 2011), de 5 a 8 meses (McDaniel Et
al., 2011, Rees, 1986), 9-11 meses (Carpenter et al., 2009) e incluso de 1 a 5 aos (Bahrick et al.,
1993). Estos hallazgos son una gran noticia para estudiantes y educadores, dado que una meta
educativa clave es el conocimiento duradero y no slo mejoras temporales en el aprendizaje.
Fig. 9. Puntajes en exmenes de curso cubriendo tems que fueron presentados en las pruebas de prctica, en el re-
estudio o no presentados durante las actividades de aprendizaje online que los estudiantes completaron para obtener
puntos en el curso. El examen del curso incluy algunas preguntas que haban sido presentadas durante las pruebas
de prctica as como nuevas preguntas que se basan en la misma inforamcin. Por simplicidad los resultados aqu
reportados colapsan dos experimentos reportados en McDaniel, Wildman, and Anderson (2012).
8.4 Cuestiones de aplicacin. Las pruebas de prctica parecen ser relativamente razonables con
respecto a las demandas de tiempo. La mayora de la investigacin ha demostrado los efectos de
la prctica de pruebas cuando la cantidad de tiempo asignado para la prctica de pruebas es
modesto y se equipara con el tiempo asignado para re-estudiar. Otro mrito de las pruebas de
prctica es que se puede implementar con un entrenamiento mnimo. Los estudiantes pueden
participar en auto-pruebas basadas en el recuerdo de una manera relativamente directa. Por
ejemplo, los estudiantes pueden autocomprobarse mediante la creacin de tarjetas flashcards
(tambin est disponible un software libre y de bajo costo para hacer flashcards) o usando el
sistema de toma de notas Cornell (que implica dejar una columna en blanco al tomar notas en
clase y entrar Trminos clave o preguntas en l poco despus de tomar notas para usar para la
auto-prueba al revisar las notas en un momento posterior, para ms detalles, vase Pauk & Ross,
2010). Las formas ms estructuradas de exmenes prcticos (p. Ej., Exmenes de respuesta
mltiple, de respuesta corta y de llenado en blanco) a menudo estn disponibles para los
estudiantes a travs de problemas de prctica o preguntas incluidas al final de los captulos del
libro o en el suplemento electrnico, materiales que acompaan a muchos libros de texto.
Dicho esto, los estudiantes probablemente se beneficiaran de alguna instruccin bsica sobre
cmo utilizar con mayor eficacia las pruebas de prctica, ya que los beneficios de la prueba
dependen del tipo de prueba, dosis y tiempo. Como se ha descrito anteriormente, la prueba de la
prctica es particularmente ventajosa cuando se trata de recuperacin y se contina hasta que los
elementos se responden correctamente ms de una vez dentro y entre sesiones de prctica y con
intervalos ms largos en comparacin con intervalos ms cortos entre ensayos o sesiones. En
cuanto a la eficacia de la prctica de pruebas en relacin con otras tcnicas de aprendizaje,
algunos estudios han demostrado los beneficios de las pruebas de prctica de cartografa de
conceptos, toma de notas, y el uso de imgenes (Fritz et al., 2007, McDaniel et al. , 2009,
Neuschatz, Preston, Toglia, y Neuschatz, 2005), pero las comparaciones ms frecuentes han
consistido en la comparacin de pruebas de prctica contra el re-estudio sin gua.
El resultado ms frecuente es que las pruebas de prctica superan al reestudio, aunque este efecto
depende en cierta medida de la medida en que los exmenes de prctica vayan acompaados de
retroalimentacin que incluya la presentacin de la respuesta correcta. Aunque muchos estudios
han demostrado que las pruebas solo superan el re-estudio, algunos estudios no han logrado
encontrar esta ventaja (en la mayora de estos casos, la precisin en la prueba de prctica ha sido
relativamente baja). En contraste, la ventaja de las pruebas de prctica con la retroalimentacin
sobre el estudio es extremadamente robusto. Las pruebas de prctica con retroalimentacin
tambin superan sistemticamente las pruebas de prctica por s solas.
Otra razn para recomendar la implementacin del feed-back con las pruebas de prctica es que
protege contra los errores de perseverancia cuando los estudiantes responden incorrectamente en
una prueba de prctica. Por ejemplo, Butler y Roediger (2008) encontraron que una prueba de
prctica de eleccin mltiple aument las intrusiones de falsas alternativas en una prueba de
recuperacin de la prueba final cuando no se proporcion retroalimentacin, mientras que no se
observ este aumento cuando se dio la retroalimentacin. Afortunadamente, el efecto correctivo
de la retroalimentacin no requiere que se presente inmediatamente despus de la prueba de
prctica. Metcalfe et al. (2009) encontraron que el rendimiento de la prueba final para las
respuestas inicialmente incorrectas era realmente mejor cuando la retroalimentacin se haba
retrasado que cuando haba sido inmediata. Tambin es alentador la evidencia que sugiere que la
retroalimentacin es particularmente eficaz para corregir errores de alta confianza (por ejemplo,
Butterfield & Metcalfe, 2001).
Por ltimo, observamos que los efectos de los errores de las pruebas de la prctica en el
desempeo subsiguiente tienden a ser relativamente pequeos, a menudo no se obtienen y son
fuertemente menospreciados por los beneficios positivos de las pruebas (por ejemplo, Fazio et
al., 2010, Kang, Pashler, et al., 2011, Roediger y Marsh, 2005). Por lo tanto, las preocupaciones
potenciales acerca de los errores no constituyen un problema serio para la implementacin,
particularmente cuando se proporciona retroalimentacin. Por ltimo, aunque nos hemos
centrado en el uso de las pruebas de la prctica por parte de los estudiantes, de acuerdo con el
propsito de esta monografa, observamos brevemente que los instructores tambin pueden
apoyar el aprendizaje de los estudiantes aumentando el uso de pruebas de prctica de bajo o
ningn impacto en la calificacin en el aula. Varios estudios tambin han reportado resultados
positivos de la administracin de evaluaciones sumativas que son ms cortas y ms frecuentes
que largas y menos frecuentes (por ejemplo, un examen por semana en lugar de slo dos o tres
exmenes por semestre), no slo para los resultados del aprendizaje, pero tambin en las
calificaciones de los estudiantes de factores tales como la satisfaccin del curso y la preferencia
por las pruebas ms frecuentes (por ejemplo, Keirs, 1934, Kika, McLaughlin, y Dixon, 1992;
Leeming, 2002, para una revisin, vase Bangert-Drowns, Kulik, Kulik, 1991).
8.5 Pruebas de prctica: Evaluacin general. Sobre la base de la evidencia descrita
anteriormente, clasificamos las pruebas prcticas como de alta utilidad. Los efectos de las
pruebas se han demostrado a travs de una impresionante gama de formatos de prueba de
prctica, tipos de material, edades de aprendizaje, medidas de resultado y intervalos de retencin.
Por lo tanto, las pruebas de prctica tienen una amplia aplicabilidad. Las pruebas de prctica no
son particularmente intensivas en tiempo con relacin a otras tcnicas, y se pueden implementar
con un entrenamiento mnimo. Por ltimo, varios estudios han proporcionado pruebas de la
eficacia de las pruebas de prctica en contextos educativos representativos. Con respecto a las
recomendaciones para la investigacin futura, una brecha identificada en la literatura se refiere a
la medida en que los beneficios de las pruebas de prctica dependen de las caractersticas de los
alumnos, tales como el conocimiento previo o la capacidad. Explorar las diferencias individuales
en los efectos de la prueba se alineara bien con el objetivo de identificar la mayor generalizacin
de los beneficios de las pruebas de la prctica. Por otra parte, la investigacin dirigida a
identificar ms a fondo las causas de la prctica de los efectos de la prueba puede proporcionar
ms informacin sobre la maximizacin de estos efectos.
Interrogacin
elaborativa Moderada P-I P I P I
Iluminado /
Subrayado Baja Q Q N P N
Memoria
mnemnica con
palabras clave Baja Q Q Q-I Q Q-I
Imgenes del
texto Baja Q Q Q-I P I
Examinacin de
prctica Alta P-I P P P P
Prctica
distribuida Alta P-I P P-I P P-I
Prctica
espaciada Moderada I Q P-I P P-I
Nota. Un indicador positivo (P) muestra que la evidencia disponible demuestra eficacia de la tcnica de aprendizaje
respecto a una determinada variable o dificultad. Un indicador negativo (N) muestra que la tcnica es principalmente
ineficiente para una determinada variable. Un indicador calificado (Q) indica que la tcnica mostr resultados
positivos en algunas condiciones (o en algunos grupos) pero no en otros. Un indicador insuficiente (I) indica que la
evidencia disponible es insuficiente para determinar definitivamente su utilidad para uno o ms factores de una
variable o dificultad.
Nuestra meta para estas evaluaciones era indicar tanto (a) si existen evidencias suficientes para
apoyar conclusiones sobre la generalizabilidad de una tcnica, cuestiones para su
implementacin, o su eficacia en contextos educativos y, si existen pruebas suficientes ( B) si
indica que la tcnica funciona. Por ejemplo, las pruebas de prctica recibieron una evaluacin de
Positivo (P) para tareas de criterio. Esta calificacin indica que hemos encontrado suficiente
evidencia para concluir que las pruebas de prctica benefician el desempeo estudiantil a travs
de una amplia gama de tareas de criterio y intervalos de retencin. Por supuesto, esto no significa
que el trabajo adicional en esta rea (es decir, pruebas con diferentes tareas de criterio) no sera
valioso, pero la extensin de la evidencia es lo suficientemente prometedora como para
recomendarla a los maestros y estudiantes. Una calificacin negativa (N) indica que la evidencia
disponible demuestra que la tcnica de aprendizaje no beneficia el desempeo para la categora o
problema en particular. Por ejemplo, a pesar de su popularidad, destacar no aument el
rendimiento a travs de una variedad de tareas de criterio, por lo que recibi una calificacin de
N para esta variable. Una calificacin calificada (Q) indica que tanto la evidencia positiva como
la negativa han sido reportadas con respecto a una categora o asunto particular. Por ejemplo, la
palabra clave mnemnica recibi una calificacin Q de los materiales, porque la evidencia indica
que esta tcnica funciona para el aprendizaje de materiales que son amigables con las imgenes,
pero no funciona bien para materiales que no se pueden imaginar fcilmente. Una calificacin de
Insuficiente (I) indica que no se dispone de pruebas suficientes para sacar conclusiones sobre los
efectos de una tcnica dada para una categora o problema en particular. Por ejemplo, la
interrogacin elaborativa recibi una calificacin I para las tareas de criterio, porque actualmente
no sabemos si sus efectos son duraderos en intervalos de retencin educativos relevantes.
Cualquier celda en la Tabla 4 con una calificacin I destaca la necesidad de ms investigacin
sistemtica.
Finalmente, algunas celdas incluyen ms de una clasificacin. En estos casos, existe suficiente
evidencia para evaluar una tcnica en una dimensin de una categora o problema, pero no hay
evidencia suficiente para alguna otra dimensin. Por ejemplo, la autoexplicacin recibi una
calificacin de PI para las tareas de criterio porque la evidencia disponible es positiva en una
dimensin (generalizable en una serie de tareas de criterio) pero es insuficiente en otra dimensin
clave (si el beneficio de la autoexplicacin generaliza a travs de intervalos de retencin ms
largos). Como otro ejemplo, la relectura recibi una calificacin de QI para las tareas de criterio,
porque la evidencia de la efectividad de esta tcnica durante largos intervalos de retencin est
calificada (es decir, en algunas condiciones de aprendizaje, no produce un efecto para intervalos
de retencin ms largos) y es insuficiente la evidencia disponible que es relevante para
documentar su efectividad a travs de diferentes tipos de tareas de criterio (por ejemplo, la
relectura aumenta el rendimiento en las tareas de recuperacin, pero se sabe poco sobre sus
beneficios para la comprensin). Cuando las tcnicas tienen calificaciones mltiples para una o
ms variables, los lectores necesitarn consultar las revisiones para ms detalles.
Por ltimo, hemos utilizado estas calificaciones para desarrollar una evaluacin general de
utilidad para cada una de las tcnicas de aprendizaje. Las evaluaciones de la utilidad reflejan en
gran medida la manera en que los beneficios de cada tcnica de aprendizaje se generalizan a
travs de las diferentes categoras de variables (por ejemplo, para cuntas variables la tcnica
recibi una calificacin P). Por ejemplo, la palabra clave mnemnica y el uso de imgenes para
el aprendizaje de texto se clasific bajo en utilidad en parte porque sus efectos se limitan a
materiales que son susceptibles de imgenes y porque pueden no funcionar bien para estudiantes
de todas las edades. An as, algunos maestros pueden decidir que los beneficios de las tcnicas
con calificaciones de baja utilidad coinciden con sus metas de instruccin para sus estudiantes.
Por lo tanto, aunque ofrecemos estas evaluaciones fciles de usar de cada tcnica de aprendizaje,
tambin alentamos a los maestros y estudiantes interesados a leer cuidadosamente cada revisin
para tomar decisiones informadas sobre las tcnicas que mejor satisfagan sus metas de
instruccin y aprendizaje.
Ms all de la formacin de los estudiantes a utilizar estas tcnicas, los profesores tambin
podran incorporar algunos de ellos en sus planes de leccin. Por ejemplo, al comenzar una
nueva seccin de una unidad, un profesor podra comenzar con una prueba de prctica (con
retroalimentacin) sobre las ideas ms importantes de la seccin anterior. Cuando los estudiantes
estn practicando problemas de una unidad en matemticas, los problemas recientemente
estudiados podran ser entrelazados con problemas relacionados de unidades anteriores. Los
profesores tambin podran aprovechar la prctica distribuida re-presentando los conceptos y
actividades ms importantes a lo largo de varias clases. Al introducir conceptos claves o hechos
en clase, los maestros pueden involucrar a los estudiantes en preguntas explicativas al instarles a
considerar cmo la informacin es nueva para ellos, cmo se relaciona con lo que ya saben, o
por qu puede ser cierto. Incluso las tareas pueden ser diseadas para aprovechar muchas de
estas tcnicas. En estos ejemplos (y en otros proporcionados en las subsecciones de Temas para
la Implementacin), los maestros podran implementar una tcnica para ayudar a los estudiantes
a aprender, sin importar si los estudiantes son conscientes de que una tcnica particular est
siendo usada.
Nos damos cuenta de que muchos factores son responsables cada vez que un estudiante no
consigue avanzar en la escuela (Hattie, 2009) y por lo tanto, un cambio a cualquier factor puede
tener un efecto relativamente limitado en el aprendizaje y el logro del estudiante. Las tcnicas de
aprendizaje descritas en esta monografa no sern una panacea para mejorar el logro de todos los
estudiantes y, quiz obviamente, slo beneficiarn a los estudiantes motivados y capaces de
usarlos. Sin embargo, cuando se usan adecuadamente, sospechamos que producirn ganancias
significativas en el desempeo en el aula, en las pruebas de logro y en muchas tareas que se
encuentran a lo largo de la vida. Es obvio que muchos estudiantes no estn usando tcnicas de
aprendizaje eficaces pero podran usar las tcnicas ms efectivas sin mucho esfuerzo, por lo que
los maestros deberan ser animados a capacitar ms consistentemente (y explcitamente) a los
estudiantes para que usen tcnicas de aprendizaje. metas de aprendizaje.