MODULO

DISEÑO Y VALIDACIÓN DE INSTRUMENTOS EDUCATIVOS
Juan Agustín Suárez S

Blanca Rojas de Chirinos
Barquisimeto, Septiembre de 2.004

ÍNDICE GENERAL
p.p
INTRODUCCIÓN........................................................................................................6
PRIMERA PARTE: LA MEDICIÓN EN CIENCIAS SOCIALES Y

EDUCACIÓN...............................................................................................................9
CAPITULOS
I TEORÍA DE LA MEDICIÓN.................................................................................10
Concepto de Medición..........................................................................................10
Isomorfismo y Realidad........................................................................................11
Medición y Evaluación ........................................................................................12
Variables................................................................................................................13
Definición de Constructo......................................................................................16
Escalas de Medición de una Variable....................................................................17
Ejercicios Propuestos............................................................................................22
Referencias............................................................................................................25
Lecturas Sugeridas................................................................................................25
SEGUNDA PARTE: DISEÑO DE INSTRUMENTOS EDUCATIVOS ...................27
II ASPECTOS CONCEPTUALES Y METODOLÓGICOS DE LOS

INSTRUMENTOS EDUCATIVOS ......................................................................28
Concepto de Método, Técnica, Instrumento e Ìtem ............................................28

Propósito de los Test............................................................................................30
Historia de los Test...............................................................................................31
Clasificación de Instrumentos..............................................................................35
Pasos en el Proceso de Diseño y Validación de Instrumentos.............................38
Ejercicios Propuestos...........................................................................................40
Referencias...........................................................................................................42
Lecturas Sugeridas...............................................................................................42
III TESTS DE HABILIDADES .................................................................................43
Conceptualización de los Tests de Habilidades..................................................43

Pruebas de Rendimiento Académico..................................................................44
Test de Inteligencia.............................................................................................57
Pruebas de Habilidades Especiales ....................................................................63
Ejercicios Propuestos .........................................................................................64
Referencias..........................................................................................................65
2
p.p
Lecturas Sugeridas .............................................................................................65
IV TESTS AFECTIVOS.............................................................................................66
Conceptualizaciòn de losTest Afectivos ............................................................66

La actitud............................................................................................................67
Diferencias entre Actitud, Intereses, Valores, Opiniones y Motivaciones .........82
Ejercicios Propuestos..........................................................................................83
Referencias..........................................................................................................89
Lecturas Sugeridas..............................................................................................89
V EL CUESTIONARIO Y LA ENTREVISTA..........................................................90
El Cuestionario.....................................................................................................90
La Entrevista......................................................................................................101
Ejercicios Propuestos.........................................................................................103
Referencias.........................................................................................................106
Lecturas Sugeridas.............................................................................................106
VI LA OBSERVACIÓN...........................................................................................107
Definición........................................................................................................107
Elementos Presentes en la Observación...........................................................107
Modalidades de Observación...........................................................................108
Normas para una observación sistemática y controlada……………………...110
Instrumentos para Realizar una Observación Sistemática...............................111
Dificultades y Limitaciones de la Observación...............................................116
Ejercicios Propuestos .....................................................................................117
Referencias.......................................................................................................118
Lecturas Sugeridas...........................................................................................118
VII TÉCNICAS E INSTRUMENTOS DE RECOLECCIÓN DE DATOS

CUALITATIVOS ...............................................................................................119
Recogida de Datos en Instigaciones Etnográficas..........................................120

Técnicas e Instrumentos en Investigación-Acción..........................................140
Ejercicios Propuestos......................................................................................141
Referencias......................................................................................................142
Lecturas Sugeridas..........................................................................................142
3
p.p
VIII OPERACIONALIZACIÓN DE LAS VARIABLES (CONSTRUCTO) EN

ESTUDIO.........................................................................................................143
A manera de introducción..............................................................................143
Definición y Propósito de Operacionalización de la Variable.......................144
La Operacionalización de la Variable y los Objetivos de la
Investigación ...............................................................................................145
Correspondencia de la Operacionalización de la Variable con las Bases
Teóricas de la Investigación.........................................................................152
Construcción de Ítemes..................................................................................152
Matriz (Cuadro) de Operacionalización de la Variable .................................153
A Manera de Conclusión……………………………………………………161
Ejercicios Propuestos.....................................................................................161
Referencias.....................................................................................................162
Lecturas Sugeridas.........................................................................................162
TERCERA PARTE: VALIDACIÓN DE INSTRUMENTOS.............................163
IX ANÁLISIS DE ÍTEMES....................................................................................164
Índice de Dificultad de los Ìtemes..................................................................164

Análisis de Discriminación de Ìtemes.............................................................167
Ejercicios Propuestos......................................................................................174
Referencias......................................................................................................177
X CONFIABILIDAD DE INSTRUMENTOS DE MEDICIÓN EDUCATIVA .....178
Conceptualización.............................................................................................178
Interpretación del Coeficiente de Confiabilidad...............................................179
Métodos de Confiabilidad.................................................................................180
Factores que Incrementan la Confiabilidad .....................................................194
Incremento de la confiabilidad de un instrumento……………………………195
Ejercicios Propuestos........................................................................................198
Referencias........................................................................................................201
Lecturas Sugeridas............................................................................................201
XI VALIDEZ DE INSTRUMENTOS DE MEDICIÓN EDUCATIVA...................201
Conceptualizaciòn............................................................................................201
Métodos de Validez..........................................................................................202
Ejercicios Propuestos.......................................................................................211
4
Referencias.......................................................................................................216
Lecturas Sugeridas...........................................................................................216
p.p
XII ANÁLISIS FACTORIAL..................................................................................217
A manera de introducción...............................................................................217
Validación Preliminar de Actidoc. .................................................................218
El Análisis Factorial ......................................................................................221
Aproximación a una Nueva Operacionalización de la Variable
Actitud del Docente hacia la Evaluación de los Aprendizajes
a través del Análisis Factorial .....................................................................229
Análisis Factorial ¿Versus? Confiabilidad .....................................................236
A Manera de Conclusión ...............................................................................237
Ejercicio Propuesto.........................................................................................238
Referencias......................................................................................................239
XIII VALIDACIÓN DE INSTRUMENTOS CUALITATIVOS .............................241
Confiabilidad ..................................................................................................241
Validez ............................................................................................................243
Ejercicios Propuestos .....................................................................................246
Referencias .....................................................................................................247
Lecturas Sugeridas .........................................................................................247
ANEXOS .................................................................................................................248
Anexo A .................................................................................................................249
Anexo B ................................................................................................................251
Anexo C ................................................................................................................255
Anexo D..................................................................................................................259
Anexo E..................................................................................................................263
5
INTRODUCCIÓN
El diseño y validación de instrumentos es abordado tanto en textos de

Metodología de la Investigación, en los cuales su tratamiento generalmente es
superficial, como en textos especializados en análisis de instrumentos, donde se trata
más ampliamente y en profundidad los aspectos teóricos y metodológicos que implica
el proceso de Diseño y Validación de Instrumentos. Se puede expresar que escribir un
libro sobre este tópico es redundar en lo existente; porque existe una abundante
bibliografía disponible en el mercado, sin embargo en las labores docentes como
facilitadores de la asignatura Diseño y Validación de Instrumentos Educativos y como
Asesores y tutores de Trabajos de Grado, observamos serias dificultades en
estudiantes tanto de pregrado como de postgrado en cuanto al proceso de Diseño y
Validación de Instrumentos.
Entre las dificultades más comunes del estudiante, están entre otras, determinar
la escala de medición de la variable en estudio (lo cual incide en el tipo de
instrumento a aplicar para la recolección de los datos), diferenciar un cuestionario de
opinión de otros tipos de instrumentos, operacionalizaciòn de la variable,
instrumentos a los cuales se le puede calcular confiabilidad y realizar el análisis de
discriminación de los ìtemes, manejo de bases de datos para realizar el procedimiento
de análisis de discriminación y cálculo de la confiabilidad.
El presente libro, además de iniciar al estudiante en el Diseño y Validación de
Instrumentos, también persigue presentar respuestas a las dificultades más comunes
que éste enfrenta; quien para resolverlas debe realizar investigaciones minuciosas en
diferentes textos, los cuales en la mayoría de las veces no están disponibles, ya sea
por su costo o por la escasez existente en los Centros de Información de las
Universidades e Institutos de Investigación.
En cuanto a la composición del libro, éste incluye tres partes, la primera tiene
únicamente un capìtulo, donde se introduce al estudiante en la teoría de la medición.
6
La segunda parte, compuesta por siete (7) capìtulos comprendidas entre el dos y el
ocho, aborda la construcción de instrumentos. Se inicia con un capìtulo (el dos) sobre
los aspectos conceptuales, metodológicos e históricos de los instrumentos. En los
capìtulos tres (3) y cuatro (4), se aborda los tests de habilidades y afectivos
respectivamente, donde se analizan casos particulares de instrumentos incluidos en
ambas clasificaciones. En los capìtulos cinco (5) y seis (6), se aborda el cuestionario
y la entrevista; y la observación. El capìtulo siete explica las técnicas e instrumentos
cualitativos tomando como referencia la Etnografía y la Investigación-Acción. Por
ùltimo se incluye un capìtulo (el ocho) que aborda el proceso de operacionalizaciòn
de la variable, tópico que genera muchas dudas en el estudiante cuando debe
realizarla.
En la última parte, comprendida entre los capìtulos nueve y trece, se aborda la
validación de instrumentos. Esta parte está compuesta por cinco capìtulos, en el
primero de ellos ( el nueve), se desarrolla el análisis de los ìtemes, considerando el
índice de dificultad de los ítem y el análisis de discriminación. En el caso de este
último indicador, se consideran dos casos: ítem dicotómicos e ítems multicòtomos.
En el capìtulo diez (10), se incluye la confiabilidad de instrumentos; analizando, al
igual que en el análisis de discriminación, el caso de datos dicotòmicos y
multicòtomos, cuando se aplica el método de consistencia interna, el cual es el más
popular y el preferido para determinar la confiabilidad de un instrumento; ya que
requiere una sola aplicación. Además de este método se desarrollan en este capìtulo,
los métodos de reaplicación de la prueba y de pruebas equivalentes, los cuales
requieren, dos aplicaciones para determinar la confiabilidad del instrumento.
El capìtulo once (11), aborda la validez de los instrumentos de medición
educativa, donde se explican los métodos conocidos para determinar la validez de un
instrumento, los cuales son validez de contenido, de criterio y de constructo. En el
siguiente capìtulo (el doce), se explica el análisis factorial que es una herramienta de
gran utilidad para la validación de instrumentos. En su explicación se desarrolla, a
manera de ejemplo, el caso de un instrumento sometido a esta herramienta tan valiosa
para la validación de instrumentos. Como apoyo tecnológico para explicar el análisis
7
factorial, se aplicó el paquete estadístico para Ciencias Sociales (SPSS). El último
capìtulo de esta parte (el trece), el cual es también el último este libro, aborda de
manera introductoria, el proceso de validación de instrumentos cualitativos. Este
capìtulo se incluye, considerando que los capìtulos precedentes, se orientan hacia los
instrumentos cuantitativos.
Además de estos trece (13) capìtulos, se incluyen cinco (5) anexos; el A,
explica la rutina para determinar el índice de dificultad de los ítemes, el B y el C,
explican la rutina exigida para realizar en forma computarizada el análisis de
discriminación de los ítemes, de datos dicotómicos y datos multicótomos
respectivamente; el D, contiene los pasos requeridos para calcular el coeficiente de
confiabilidad de datos dicotòmicos Kuder-Richardson; y el E, explica la rutina para
realizar el análisis factorial a travès del programa SPSS.
Al final de cada capìtulo se incluyen ejercicios propuestos, que le permitirán al
estudiante verificar su conocimiento sobre el contenido de la misma. Se recomienda
no omitir esta sección, porque usted tendrá la oportunidad de autoevaluarse y repasar
aquellos tópico en los cuales muestre debilidad. Asimismo, además de las referencias,
se incluyen una lista de lecturas sugeridas sobre el contenido del capìtulo, para que el
estudiante profundice en aquellos temas y aspectos de su interés.
Por último, sólo queremos expresar nuestro deseo de que este libro sea de
utilidad a quienes se inician en el proceso de Diseño y Validación de Instrumentos
Educativos y que el mismo contribuya a despejar dudas y resolver dificultades
encontradas en el proceso que implica obtener un instrumento válido y confiable.
8
DISEÑO Y VALIDACIÒN DE INSTRUMENTOS EDUCATIVOS
PRIMERA PARTE
LA MEDICIÓN EN LAS CIENCIAS SOCIALES Y LA EDUCACIÓN
9
CAPITULO I
TEORÍA DE LA MEDICIÓN
Objetivos
1. El estudiante debe ser capaz de diferenciar los diferentes tipos de variables y

determinar la escala de medición apropiada para medirla .
2. El estudiante debe ser capaz de diferenciar la medición del proceso de
evaluación
Concepto de Medición
Hay consenso entre autores especializados en medición que la definen como la

asignación de número a los atributos que poseen los objetos o sujetos de acuerdo a
reglas. Es importante destacar que no se mide un sujeto u objeto en si, sino que se
miden son los atributos de éste. Ejemplo: no se mide una mesa como tal, sino su
altura, anchura, etc. Lo mismo sucede con los seres humanos. De ellos se mide son
atributos; como estatura, motivación, edad, etc. Es más se puede afirmar que tampoco
se puede medir directamente los atributos, en el caso de las ciencias sociales y la
educación, sino que se miden indicadores de los atributos, Ejemplo, si se desea
determinar la conducta hostil de los alumnos, se debe precisar los indicadores de
hostilidad, como conducta verbal y física agresiva. Lo mismo sucede si se desea
determinar la motivación del alumno en clase, se debe precisar los indicadores de la
motivación como asistencia, atención, intervenciones, preguntas y respuestas.
Cuando se asigna números a los atributos de los objetos o sujetos en las ciencias
físicas o fácticas, el proceso de medición es una actividad simple, sin complicaciones,
pues se limita a medir longitud, peso y volumen del objeto. Ejemplos de este tipo de
medición es la altura de una mesa, estatura de una persona, sexo, edad, color de los
ojos, etc. Pero en el caso de atributos en las Ciencias Sociales y la Educación, la
medición es un proceso complejo, porque se trata de asignar números a atributos
10
intangibles como el rendimiento escolar, la motivación hacia el estudio, la actitud del
docente hacia la evaluación de los aprendizajes, etc. En este caso el investigador debe
establecer una relación de isomorfismo entre el número asignado al atributo en
estudio y la realidad.
Isomorfismo y realidad
El isomorfismo significa identidad o similitud de forma. Cuando se habla de

isomorfismo en medición, es para referirse a la correspondencia que debe tener un
número y el indicador del atributo que posee el objeto o sujeto. Ejemplo: si se desea
asignar números a la variable sexo, se puede identificar a todas aquellas personas del
sexo femenino con el número cero (0) y a las personas del sexo masculino con el
número uno (1). En este caso la asignación de número es una tarea fácil, sólo se debe
diferenciar una mujer de un hombre. En ejemplos similares a éste, como el color de
los ojos (1= verdes; 2= negros; 3= Azules, 4= otros), color de la piel, etc. establecer
una relación de isomorfismo número y realidad es también una tarea simple, pero
cuando se trata de atributos sociales, determinar el isomorfismo es realmente
complejo, por ejemplo, establecer la relación entre un número y la motivación,
determinar si el número se corresponde con una alta, moderada o baja motivación.
Otro ejemplo, es establecer la relación entre un número y la actitud del docente hacia
la evaluación cualitativo: es decir, la correspondencia entre un número y la actitud
favorable o desfavorable hacia la evaluación cualitativa.
Establecer el isomorfismo entre la medición y la realidad, es un aspecto que el
diseñador y validador de instrumentos debe dominar con propiedad, porque de esta
relación de correspondencia depende en gran medida la calidad de los resultados de la
aplicación de un instrumento. Si esta correspondencia no se establece con precisión
sin duda que los resultados no determinarán el comportamiento real de la variable en
estudio
Medición y Evaluación
11
Es importante diferenciar la medición del proceso de evaluación, porque la
primera (la medición) es una fase de la segunda (la evaluación). Al iniciar este
capìtulo se definió la medición como “la asignación de número de acuerdo reglas”.
Asimismo se mencionó la importancia de saber determinar la relación de
Isomorfismo entre la medición y la realidad, porque cuando hay isomorfismo es
garantía de correspondencia entre el número que se asigna a una categoría de un
atributo y la realidad en la cual el atributo existe.
En el caso especifico de la evaluación del proceso enseñanza-aprendizaje,
Carreño (1.991) expresa lo siguiente:
Evaluar es enjuiciar y valorar a partir de cierta información desprendida
directamente o indirectamente de la realidad, de modo que en el proceso
de enseñanza-aprendizaje la “cierta información” aludida bien puede ser
la medición o cuantificación de los datos aportados por los exámenes,
siempre y cuando dé lugar a ulteriores interpretaciones o establecimiento
de juicios. (p.28)
De lo afirmado por Carreño se puede deducir que la evaluación va más allá de

la simple medición. El profesor o investigador que desea interpretar los resultados de
la aplicación de un instrumento, como una prueba de rendimiento, debe tener claro
que para considerar en un proceso de evaluación los resultados de una prueba no
pueden limitarse a presentar números sin emitir juicio, porque es la interpretación de
los resultados donde se fundamenta la evaluación. Carreño al respecto expresa lo
siguiente:
La medición suele ser deseable como antecedente de la evaluación, por el
mayor rango de objetividad que confiere a la información y las
facilidades que reporta para su manejo, pero el peligro de quedarse en este
paso sin llegar al establecimiento de valoraciones productivas es muy
grande, porque medir ya nos permite calificar y cerrar una parte del
circuito. En cambio, otros pasos que no supongan cuantificaciones del
aprendizaje, si bien nos permiten obtener operaciones evaluativos, no se
prestan para las adjudicaciones de calificaciones, eliminándose su empleo
cuando el otorgar calificaciones es la intención que origina la actividad
probatoria del aprendizaje... (p.28)
12
Se deduce que evaluar para Carreño es “algo mas” que la simple medición, es
un alerta a quienes se limitan a la asignación de una “nota”, sin realizar un juicio
sobre el significado de la misma. Pero al mismo tiempo es un alerta también a
quienes pretende suprimir la medición como fase en el proceso de evaluación. Es el
caso de la evaluación cualitativa, correspondiente a la I y II Etapa de Educación
Básica, donde se establece una evaluación de rango: a, b, c, d, etc. Siendo A mayor a
B, C, D; y B mayor a C y D, y C mayor a D. Pero lo que identifica realmente al
proceso de evaluación no es la simple letra o literal, sino el significado e
interpretación de cada una de ellas.
Variables
Definición de Variable
Una variable es un atributo de un objeto o sujeto que asume varios valores,

ejemplo, la estatura de una persona, el sexo de los alumnos de una Unidad Educativa,
la actitud de los alumnos hacia las matemáticas. Si el atributo no cambia de valor
entre diferentes objetos y sujetos no puede denominarse variable. Se considera una
constante.
Clasificación de Variables
Las clasificaciones más comunes de variables, son las siguientes:
Variables Discretas y Continuas
Una variable discreta es aquella que sólo asume valores enteros, es decir, no
acepta valores intermedios, ejemplos, número de hijos, los cuales pueden ser 3 ó 4,
nunca puede 3,65 hijos. Las variables continuas, a diferencia de las variables
discretas, aceptan valores intermedios, ejemplos, ingreso familiar (1.200.050,50
bolívares) estatura (1,79 mts.).
13
Variables Dependientes e Independientes:
Las variables dependientes son aquellas, cuyo comportamiento depende de otra

u otras variables que ejercen una influencia sobre la misma. Las variables
independientes son aquellas que causan un efecto en una variable dependiente.
También existen las variables intervinientes que son aquellas variables independientes
a las cuales se desea o debe controlar su influencia sobre una variable dependiente
para determinar en forma precisa el efecto que ejerce la variable independiente sobre
la dependiente.
Cuando se establece esta clasificación de variables, se habla de una relación
causa-efecto y se formulan hipótesis para contrastar la influencia de la variable
independiente sobre la dependiente, ejemplo de relación causa-efecto es el siguiente:
Hipótesis nula: El ingreso familiar no influyen en el rendimiento académico del
alumno.
Hipótesis alterna: El ingreso familiar influyen en el rendimiento académico del
alumno.
Variable independiente: Ingreso familiar.
Variable dependiente: Rendimiento académico del alumno.
Hay autores quines expresan que establecer relaciones de causalidad en
Ciencias Sociales es muy cuestionado; porque determinar una relación causa-efecto
implica controlar todas las variables intervinientes para aislar su efecto
sobre la variable dependiente, hecho que es muy difícil en las Ciencias del
Comportamiento, donde se estudia los seres humanos en su ambiente natural.
Sólo es posible aislar, según estos autores, los efectos de las variables intervinientes
en las Ciencias Fácticas, a través de experimentos de laboratorio. Quienes sustenta
este criterio, afirman que en Ciencias Sociales sólo se pueden establecer
relaciones correlacionales, es decir, determinar la existencia o no de relación entre
variables. Sostienen que al no establecer relaciones de causalidad, tampoco se puede
hablar de investigaciones explicativas; ya que las mismas se reservan a los estudios
causales.
14
Referente a este aspecto, Ramírez (1.999) expresa lo siguiente:
Este tipo de investigación es difícil realizar en ciencias sociales, dada la
naturaleza propia de los fenómenos estudiados en estas ciencias (el
hombre y sus acciones). Es temerario establecer que tal factor es causa de
un fenómeno de orden social y mucho menos que sea la causa única. En
nuestra disciplina, la multivariedad de elementos que inciden para que un
fenómeno de orden social se comporte de una manera y no de otra
(Martínez, 1.991), es lo que ha hecho que muchos escépticos las
cataloguen como ciencias “blandas” con respecto a las ciencias “duras”,
donde si es posible establecer, con un elevado grado de certeza, el tipo de
causalidad unívoca; lo cual permitiría la predicción, uno de “los objetivos
de la ciencia” según los cultores de una concepción de ciencia apegada a
los cánones y criterios de cientificidad propios de las ciencias naturales.
(p.p 85 y 86)
Interpretando lo expresado por Ramírez, se puede deducir que los estudios

cuasiexperimentales, los cuales realiza el docente para contrastar la efectividad de
una estrategia instruccional, no se pueden considerar investigaciones a un nivel o de
tipo explicativa; porque la causalidad (influencia de una variable independiente
-causa- sobre una variable dependiente –efecto-), no se puede comprobar, ya que en
su ambiente natural (los estudios cuasiexperimentales trabajan con grupos intactos,
es decir, tal cual como interactúan en la realidad), es imposible aislar las demás
variables que inciden en la variable dependiente, decir, las variables intervinientes.
De acuerdo al criterio de Ramírez se interpreta que este tipo de estudio sólo se puede
considerar como correlacional o descriptivo (hay autores de textos de Metodología de
la Investigación que no incluyen los estudios correlacionales dentro de los niveles o
diseños de investigación).
Variables Cuantitativas y Cualitativas:
Se denomina variable cuantitativa aquellas susceptible de ser medidas,

asignándole valores a los indicadores del atributos del objeto o sujeto, ejemplo, en el
caso de la variable sexo, se puede asignar 1 al sexo masculino y 2 al sexo femenino.
Otro ejemplo es la motivación, donde un alumno altamente motivado se le puede
asignar el número 3, medianamente motivado el número 2 y muy desmotivado el 1.
15
En el caso de la actitud, cuando se asumen 5 categorías; la persona tiene una actitud
muy favorable si es 5, 4 cuando si es favorable, 3 indeciso o indiferente, 2
desfavorable; y 1 muy desfavorable.
Cuando la variable no es susceptible a mediciones, sino que sus indicadores se
describen, se está en presencia de una variable cualitativa. Es importante expresar que
hay variables a las cuales se trata tanto cuantitativa como cualitativamente, por
ejemplo, la actitud también puede analizarse a través de la conducta observable de los
sujetos ante el objeto que origina la actitud. Lo mismo ocurre con la motivación, los
valores, etc. Distinguir si una variable se asume en forma cuantitativa o cualitativa es
una tarea importante, porque dependiendo del tipo de variable (si es cuantitativa o
cualitativa) es que se selecciona el instrumento para recolectar la información
requerida en el proceso de interpretación y análisis de la variables en estudio.
Definición de Constructo:
Un constructo es una variable que no se puede medir directamente, porque la

misma no es observable a simple vista, hay que recurrir a indicadores para analizarla,
ejemplo la conducta agresiva de los alumnos de un curso, la cual al observar el
alumno no se afirmar a simple vista si es agresivo o pacífico, se debe recurrir a
indicadores, como si pelea con sus compañeros, si expresa frases ofensivas, si grita
cuando se comunica con sus compañeros, etc. Un ejemplo similar de constructo es la
actitud, la motivación, la participación de los padres y representantes en la
actividades de la escuela. Los constructos se diferencia de otras variables, como el
sexo, la estatura, temperatura, el peso; en que éstas ùltimas, se determina
directamente a simple vista o aplicando un instrumento que las mide con precisión,
ejemplo, para determinar la estatura se usa una cinta métrica, la temperatura un
termómetro y el peso una balanza.
Escalas de Medición de una Variable
16
Cuando se asigna números a los indicadores de un atributos (variable) que
posee un objeto o sujeto, se debe determinar hasta dónde ese número mide la variable
o constructo, es decir, es preciso determinar la intensidad de la medición de ese
número y el (o los) estadísticos que se pueden aplicar para analizar los resultados de
la medición del constructo en estudio. Para determinar el nivel de la medición están
las escalas de medición de una variable, las cuales desde un nivel inferior (primitivo)
hasta el nivel superior son: escala de medición nominal ordinal, intervalo y de razón:
Niveles de medición de una variable
Escala nominal:
Esta escala es considerada la más primitiva, porque sólo permite clasificar los
indicadores de la variable. Tiene la propiedad de equivalencia; ejemplo, el sexo, color
de los ojos, entidades federales de Venezuela. En estos casos se asigna un número a
cada indicador de la variable, ejemplo, sexo: 1= masculino; 2= femenino. Color de
los ojos: 1= negro; 2= azules; 3= verde; 4= otro. El número sólo indica que el sujeto
posee esa característica del atributo de la variable en estudio. No indica ninguna
relación ordinal, por ejemplo que 4 mayor a 3 mayor a 2 mayor a 1. Según Nunnally
y Berstein (1.995) “ las escalas nominales pueden ser transformadas de manera que
no se asigne el mismo número a categorías diferentes ....” ( p. 14). Sólo se requiere
que las categorías sean mutuamente excluyentes, de esta manera se evita que un
sujeto sea incluido en más de una alternativa. En esta escala, el número no representa
valor alguno, permitiéndose la asignación de cualquier número a una determinada
categoría. Al respecto el autor mencionado expresa que: “...los hombres y mujeres
podrán ser codificados, respectivamente como 1 y 0, 0 y 1 o incluso –257,3 y 534,8
sin ganar o peder información. Estas transformaciones... son permisibles porque los
nombres no tiene propiedades numéricas...” (p. 14).
Al poseer las escalas nominales sólo capacidad clasificatoria, se limita la
aplicación de los estadísticos que se pueden aplicar en el proceso de análisis de la
17
información recabada. Las operaciones matemáticas y estadísticas permitidas a este
nivel de medición son proporciones, porcentajes y tablas de frecuencias. No se puede
aplicar ni siquiera las operaciones aritméticas elementales como son la suma, resta,
multiplicación y división.
Escala Ordinal:
Una escala ordinal, además de la propiedad de clasificación, tiene la propiedad

ordinal, permitiendo determinar si un objeto o sujeto es mayor, menor o igual que
otro en cuanto a un atributo que éste tiene. Una escala ordinal implica que (a) la serie
de número se ordena de mayor a menor o viceversa; (b) No se sabe cuánto posee el
objeto o sujeto del atributo en estudio, sólo se sabe que posee más, menos o igual
cantidad; y (c) No se sabe la distancia (qué tan lejos) entre objetos o sujetos con
respecto al atributo. Ejemplo de escala ordinal puede ser el status social de una
persona; donde 1= Nivel bajo; 2= nivel medio; y 3= Nivel alto. En este caso 3 es
mayor a 2 mayor a 1 (3 2  1). En las escalas ordinales se debe tener cuidado que
los números tengan una relación de orden. Al respecto Nunnally y Berstein expresan
que: “.... La transformación debe conservar la propiedad de rango de datos. Por lo
tanto los nombres de categorías 1, 2 y 3 pueden transformase en 4, 5 y 23 ó –1.3,
2.05 y 5.33, pero no en 3, 1 y 2.....” (p. 16).
Se puede observar en la explicación de estos autores que en la asignación de
números no interesa qué tan distanciado están los números entre una y otra categoría
del atributo que posee los objetos o sujetos, porque en esta escala no se determina la
distancia ni la cantidad del atributo, sólo se determina el rango del mismo, es decir, si
es mayor, menor o igual entre los diferentes sujetos.
Escala de Intervalo:
La escala de intervalo tiene la propiedad de clasificación y orden; pero además

tiene la propiedad de intervalos iguales, con un cero arbitrario, es decir un cero que
18
no tiene significación en la realidad, ejemplo, la temperatura y calificaciones. Existe
la temperatura y calificación cero; pero esto no significa que no existe temperatura o
que un estudiante que obtuvo una calificación cero no tiene ningún conocimiento del
tema evaluado.
Nunnally y Berstein (1.995) expresa que una escala de intervalo tiene las
siguientes características “....1) Se conoce el ordenamiento jerárquico de los objeto
en un atributo, 2) también se conocen las distancias entre objetos en el atributo, pero
3) se desconoce las magnitudes absolutas del atributo....” (p.16 y 17).
Para ejemplificar las características de la escala de intervalo, volvemos al
ejemplo de la temperatura y las calificaciones. Si una temperatura sube de 16 grado a
32 grados, se puede afirmar que la temperatura subió 16 grados. En este caso se
estableció una relación de orden (se sabe que 32 grados es mayor 16 grados); pero
también se conoce la distancia entre 16 y 32 grados (en este caso 16 grados), lo cual
es una propiedad de las escalas de intervalo; sería incorrecto afirmar que la
temperatura subió el doble, porque el cero de una escala de intervalo es relativo, no es
un cero real. Igual sucede con las calificaciones de un alumno X, cuya calificación es
de 10 puntos; y la de un alumno Y, cuya calificación es de 20 puntos; se puede
afirmar que Y obtuvo una calificación mayor (relación de orden) y que la distancia
entre la calificación del alumno X con respecto a la calificación del alumno Y es de
10 puntos; pero es incorrecto afirmar que el alumno Y obtuvo el doble de
calificación; y más aún, afirma que el alumno Y tiene el doble de conocimiento que el
alumno X.
Escala de Razón:
La escala de razón, al igual que la escala de intervalo, tiene la propiedad de

orden y también se conoce la distancia entre los objetos, su diferencia está en el cero.
Mientras en una escala de intervalo el cero es relativo o arbitrario, en la escala de
razón el cero es real; ejemplo de este tipo de escala, es la estatura y la edad. Si una
persona mide 0,90 metros de estatura y otra 1,80, se puede afirmar que la diferencia
19
de estatura entre esas dos personas es el doble. Igual sucede con la edad, una persona
de 40 años es el doble de “vieja” que una de 20 años.
La existencia de un cero real en este tipo de escala, permite que aquellas
variables incluidas en una escala de razón pueden ser sometidas a cualquier operación
matemática y estadística. Es considerada la escala de medición superior; pero es
difícil que una variable o constructo social y educativo poseen las propiedad que se
exigen para considerarla dentro de una escala de razón. La mayoría de los constructo
pertenecen a las escalas nominales y ordinales, y en casos menos comunes a escala de
un intervalo.
Estadísticos Aplicados a Diferentes Tipos de Escalas de Medición
En el cuadro 1 se visualizan los estadísticos descriptivos, las pruebas

estadísticas y los coeficientes de correlación aplicables a variables medidas en las
diferentes escalas de medición. Se observa que en la escala nominal, los estadísticos
descriptivos se limitan a indicar el número de casos de las categorías de la variable en
estudio, proporciones, porcentaje, razones, moda, tabla de frecuencia. En cuanto a las
pruebas, está la Ji cuadrado y el coeficiente biserial puntual.
Cuadro 1
Escalas de Medición y Estadísticos Aplicables

Escala de Ejemplo de Estadísticos Descriptivos Pruebas y Correlación
Medición Variables
Nominal Sexo Nº de casos Ji Cuadrado
Profesión Proporciones Coeficiente biserial puntual
Región Geográfica Porcentajes Coeficiente ETA
Estado Civil Razones
Moda
Tablas de frecuencia
Ordinal Estrato social Todas las anteriores Coeficiente Spearman
Nivel de Mediana Coeficiente de Kendall
instrucción Desviación cuartilítica Prueba U de Mann-Whiney
Rango total Prueba de Wilcoxon
20
De Intervalo Calificaciones Todas las anteriores -Coeficiente de Pearson
Temperatura Media aritmética -Coeficiente parcial y
Actitud Media armónica múltiple
De Razón Talla Varianza Prueba T de Student
Peso Desviación típica Análisis de la varianza
Edad Kurtosis y asimetría
Puntuaciones Z (Dist. Normal)
Distribución de frecuencia
En el caso de la escala ordinal, como tiene las propiedades propias de la escala

nominal, se pueden aplicar todos los estadísticos descriptivos correspondientes a ésta
y además la mediana, desviación cuartílica y el rango total. En el caso de la pruebas y
coeficientes de correlación, se aplican las coeficientes de Spearman y Kendall y las
pruebas U de Mann-Whiney y de Wilcoxon. Estas dos última pruebas equivalen en
variables ordinales a la T de Student para nuestras independientes y correlacionadas o
emparejadas respectivamente.
En variables de intervalos y razón se permite aplicar los estadísticos
descriptivos de las escalas ordinales (ya que esta escala posee la propiedad de orden)
y además la medida aritmética, media armónica, varianza y desviación típica,
Kurtosis y asimetrìa, distribución normal y distribución de frecuencias. En cuanto al
tipo de pruebas aplicables, están la T de Student y análisis de la varianza como las
más importantes. Los coeficientes de correlación adecuados son Pearson y los
coeficientes parcial y múltiple.
Ejercicios Propuestos
1. Explique el concepto de medición en ciencias sociales, ejemplificando casos

aplicados en educación.
2. Explique el concepto de Isomorfismo en ciencias sociales e ilustre ejemplos,
donde exista relación de Isomorfismo entre la medición y la realidad
3. Escriba un ensayo sobre medición y evaluación entre 3 y 5 cuartillas.
4. En la siguiente tabla clasifique las variables:
21
Constructo Escala de Medición
Variable Discreta Continua
Si No Nominal Ordinal Intervalo Razón
Peso de los
alumnos del
5° de
Educación
Básica,
sección A,
turno de la
mañana, de la
U.E. José
Félix Rivas,
Municipio
Palavecino del
Estado Lara.
Sexo de los
participantes
en el programa
de Maestría de
Educación de
la UPEL-IPB
en el III Lapso
del año 2.007
Edad de los
participantes
del programa
de maestría de
Educación de
la UPEL-IPB
en el tercer
lapso del año
2.007
Actitud del
docente de la I
Etapa de
Educación
Básica del
Estado Lara
hacia la
evaluación
cualitativa.
Motivación al
logro de los
profesores de
Educación
Técnica de la
UPEL-IPB
22
Número de
participantes
en las
diferentes
menciones de
la Maestría de
Educación de
la UPEL-IPB
Edad de los
participantes
de postgrado
de la
Universidad
Yacambù
Nivel
socioecnòmico
de los
participantes
de postgrado
de la
Universidad
Yacambù
Rendimiento
académico de
los alumnos de
la U.E.
Bararida,
Municipio
Iribarren,
Estado Lara
Participaciòn
de los padres y
representantes
sobre las
actividades
desarrolladas
en los
planteles
Temperatura
de la ciudad
de
Barquisimeto,
Estado Lara
23
Color de los
Ojos de los
alumnos de la
U.E.N.
Lisandro
Alvarado,
municipio
Iribarren,
Estado Lara
5. Identifique la variable dependiente e independiente en las siguientes

situaciones:
Tipo de Variable
Situación
Dependiente Independiente
Influencia de una estrategia de comprensión lectora en el
rendimiento de la asignatura lengua
Efectos de la motivación al logro en el desempeño docente
Impacto de un programa en la participación de los padres y
representantes en las actividades del plantel.
Efectos de un régimen alimentario en el peso de hombre y
mujeres.
Incidencia de la exposición a los rayos solares en el
envejecimiento prematuro
Influencia del desarrollo personal en el desempeño docente
24
Referencias
Carreño, F. (1.991). Enfoque y principios teóricos de la evaluación (segunda

edición). México: Trillas (cursos básicos para formación de profesores, área
sistematización de la enseñanza, número 5).
Morles, V. (1.997). Planeamiento y análisis de investigaciones (novena edición).

Caracas: El Dorado.
Nunnally, J y Bernstein, I. (1.995) . Teoría psicomètrica. México: Mc Graw Hill
Ramírez, T. (1.999). Cómo hacer un proyecto de investigación. Caracas: Panapo.
Lectura Sugeridas
Ary, D; Dacobs, L., y Razavierh, A. (1.994) Introducción a la investigación

pedagógica (2° edición). México: Mc Graw Hill. Se recomienda el capitulo 5:
Estadística descriptiva, el apartado que aborda las escalas de medición.
Carreño, F. (1.990). Enfoque y principios teóricos de la evaluación (2° edición).

México: Trillas (Cursos Básicos para la formación de profesores, área
sistematización de la enseñanza, número 5). El texto está compuesto de capítulos
muy cortos, se recomiendan los siguientes: Capitulo 1: ¿Qué es la evaluación del
proceso de enseñanza–aprendizaje?. Capitulo 2: ¿Qué funciones cumple la
evaluación del proceso enseñanza– aprendizaje y Capitulo 3: ¿Qué diferencia
hay entre medir y evaluar?
Díaz Barriga, F., y Hernández, G. (2.002). Estrategias docentes para un

aprendizaje Significativo (una interpretación constructivista ( 2° edición).
México: Mc. Graw Hill. Capitulo 8: Constructivismo y evaluación
psicoeducativa. El contenido de este capitulo es el siguiente: ¿Qué es evaluar en
el proceso de enseñanza–aprendizaje?, características de una evaluación
constructivista, técnicas e instrumentos de evaluación, tipo de evaluación y
evaluación de contenidos.
Kerlinger, F. (1.988). Investigación del comportamiento, (tercera edición en inglès y

segunda edición en español). México: Mc. Graw Hill. Capitulo 25: Fundamentos
de la medición. El contenido de este capítulo es el siguiente: Definición de
25
medición; isomorfismo entre medición y “realidad”; Propiedades, proyecciones e
indicadores de los objetos y niveles de medición y escalas.
Morles, V. (1.977). Planteamiento y análisis de investigaciones (novena edición).

Caracas: El Dorado. Capitulo 2: La estadística en el proceso de la investigación
científica. Contenido: Introducción, la estadística en la formulación del
problema de investigación, la estadística en la definición de variables, la
estadística en la formulación de hipótesis, la estadística y el tipo de investigación,
la estadística en la selección de los instrumentos, la selección de la muestra, las
técnicas de análisis cuantitativo, el procesamiento de datos y la estadística en la
elaboración de informes de investigación.
NamakForoosh, M. (2.001),: Metodología de la investigación (2° edición). México:

Limusa. Capitulo 9: Medición y escalas. Los apartados: 9.1. Introducción, 9.2
Qué es la medición, 9.3 Niveles de medición, 9.4 Escala nominal, 9.5 Escalas
ordinales, 9.6 Escalas de intervalo, 9.7 Escala de razón
Nunnally, J., y Bernstein, I. (1.995). Teoría psicométrica (3° edición). México: Mc

Graw Hill. Se sugiere la introducción del texto que tiene el siguiente contenido:
La medición en la ciencia, ventajas de las medidas estandarizadas, Medición y
matemáticas, Escalas de medición, Decisiones acerca de las escalas de medición
y tendencias recientes en la medición.
Ramírez, T. (1.999). Cómo hacer un proyecto de investigación. Caracas: Panapo. Se

recomienda la parte III: Descripción de los elementos de un proyecto de
investigación. Sección: Diseño de investigación. Punto 4.2: Nivel de
investigación: nivel exploratorio, nivel descriptivo y nivel explicativo.
26
DISEÑO Y VALIDACIÒN DE INSTRUMENTOS EDUCATIVOS
SEGUNDA PARTE
DISEÑO DE INSTRUMENTOS EDUCATIVOS

CAPÌTULO II
ASPECTOS CONCEPTUALES Y METODOLÓGICOS DE LOS

INSTRUMENTOS EDUCATIVOS
Objetivos:
1. El estudiante será capaz de diferenciar método, técnica e instrumento.

2. El estudiante tendrá conocimiento del origen de los test educativos.
3. El estudiante será capaz de clasificar diferentes instrumentos educativos.
4. El estudiante tendrá conocimiento del proceso requerido en el diseño y
validación de instrumentos
Concepto de Método, Técnica, Instrumento e Ítem
Es importante establecer la diferencia entre método y técnica, porque a menudo

ambos conceptos se aplican inadecuadamente. Para Ander-Egg (1.980) el método es
“...el camino a seguir mediante una serie de operaciones y reglas fijadas de antemano
de manera reflexiva, para alcanzar un cierto fin” (P.32). Mientras que para este mismo
autor, las técnicas ”... son respuestas al ‘cómo hacer’ para alcanzar un fin o resultado
propuesto, pero se sitúa a nivel de los hechos o de las etapas prácticas que... permiten
la aplicación del método, por medio de elementos prácticos...” (P.33 y 34).
Se puede deducir al analizar ambos conceptos, que el método alude
directamente a los aspectos teóricos y filosóficos en los cuales está inserta la
investigación. Tiene que ver con la decisión de elegir el paradigma en el cual se
desarrollará la investigación. La técnica se relaciona con los aspectos operativos y
práctico de la investigación, es decir, cómo se concretará el método que se ha
seleccionado.
Otros conceptos sobre los cuales debe existir claridad cuando se diseña un
instrumento, es el concepto mismo de instrumento e ítem. Se puede definir el
instrumento como un dispositivo o procedimiento para la recolección de datos
requeridos en el proceso de desarrollo de una investigación. Es importante mencionar
que en los textos de temas psicométricos en lugar del términos instrumento se usa los
términos test o prueba para denominar a un instrumento. En cuanto al ítem, se puede
definir como el hecho o planteamiento al cual se somete o se consulta a una persona.
Al igual que en el caso del término instrumentos, el ítem, también se denomina en
textos de psicometría como reactivo o estímulo. Así mismo es frecuente en el caso de
pruebas de rendimiento y cuestionarios de opinión usar el término pregunta. En
algunos textos de autores de habla hispana, se emplea el término ítemes en lugar de
ítem, siendo este último un vocablo derivado de la lengua inglesa.
En la cuadro 2 se ilustran ejemplos de métodos, técnica e instrumento y la
relación que debe establecerse entre estos tres conceptos. Se observa en el primer
ejemplo, cuyo método es la etnografía y la investigación-acción, que la técnica e
instrumentos en ambos casos son los mismos. Esto significa que entre ambos
método, en este caso, no existen diferencias en cuanto a la manera cómo recolectan la
información. En los tres ejemplos siguientes se observa que el método es el mismo,
sin embargo la técnica e instrumento varían. En el caso de la encuesta (que es la
selección del tamaño de la muestra y los elementos que la conforma mediante
procedimientos probabilísticas), los tipos de instrumentos son la escala de actitud,
encuesta de opinión, escala de participación, escala de motivación y prueba de
conocimiento. Esto no significa que al aplicar alguno de estos instrumentos debe
adoptarse una encuesta muestral; pues estos instrumentos también se aplican en
diseños experimentales y cuasi-experimentales, donde generalmente se trabaja con
sujetos de investigación. Por último se ejemplifica, el caso de proyectos factibles; los
cuales se aplica en considerable número de trabajos de grado en la Universidad
Pedagógica Experimental Libertador (UPEL). Esta técnica se incluye dentro del
método científico y usa instrumentos como la guía de entrevista, que también se
aplica en los métodos cualitativos, como la Investigación-Acciòn y la Etnografía.
29
Cuadro 2
Ejemplos de Métodos, Técnica e Instrumentos Aplicados en Investigaciones

Educativas
Método Técnica Instrumento de Instrumento de

recolección de datos Registro
- Papel y lápiz
Observación - Guía de observación
Etnografía - Cámara
- Lista de cotejo.
Investigación – fotográfica
- Escala de observación.
Acción - Cámara de video
Entrevista - Guía de entrevista
- Grabadora
- Escala de actitud
- Encuesta de opinión.
- Escala de
Método Científico La encuesta participación. Papel y Lápiz
- Escala de motivación.
- Prueba de
conocimiento.
- Prueba de
Diseño rendimiento académico.
Método Científico cuasiexperimental
Papel y Lápiz
- Escala de actitud.
- Escala de motivación
- Cuestionario de
Método Científico Proyecto factible opinión. Papel y Lápiz
- Guía de entrevista
Propósito de los test

Los test surgen con el propósito de recoger información sobre el
comportamiento de una variable (como actitud, motivación, rendimiento académico,
etc.) o de un objeto o individuo específico (en la entrevista clínica se recogen
información específico sobre un paciente en particular). Para verificar que la
información recolectada a través del test tiene una relación de isomorfismo con la
realidad, se recurre a determinar la confiabilidad y validez del test. De los resultados
que generan ambos indicadores se determina la conveniencia o no de tomar los datos
del test como indicador fidedigno del comportamiento de la variable o atributo del
individuo en estudio.
30
La utilidad de los test es de tal magnitud que su uso se ha generalizado en las
escuelas, clínicas, industrias, empresas de servicio y partidos políticos. Los test se han
convertido en un gran negocio para personas y empresas que se desempeñan como
diseñadores de test, fundamentalmente en países desarrollados donde la información
que éstos generan es de gran ayuda para la toma de decisiones y para obtener
información valiosa en cuanto a variables y sujetos en estudio.
Historia de los Test
Los test como dispositivo de apoyo en la relación de datos requeridos por

disciplinas científica, surgen a mitad del siglo XIX (auque su origen se remonta a
siglos pasados) en el ámbito de la psicología científica y psiquiatría que aplicaron
pruebas de evaluación clínica para determinar trastornos mentales
En el ámbito educativo los instrumentos surgen con los test de inteligencia,
cuando en 1.905 el psicólogo Alfred Binet y el médico Theodore Simon publicaron
un instrumento para determinar qué niños podían alcanzar un aprendizaje normal y
quienes de ellos presentarían problema en el proceso de aprendizaje. Este primer test
de inteligencia estuvo constituido por 30 problema con un grado de dificultad
creciente y tuvo como propósito, determinar la capacidad del sujeto para juzgar,
comprender y razonar en diferentes situaciones.
Aiken (1.996) al referirse a la prueba de Binet-Simon expresa lo siguiente:
...En 1.908, se publicó una revisión de la prueba que contenía gran
cantidad de subpruebas agrupadas por niveles de edad desde 3 hasta 13
años. Al calificar la revisión de 1.908 de la escala de inteligencia de
Binet-Simón, el concepto de edad mental se introdujo como forma de
cuantificar el desempeño general de la persona que presenta la prueba.
Una revisión posterior de la escala de Binet-Simon que se publicò
después de la muerte prematura de Binet, amplió la prueba al nivel de
adultos. (p.p 5 y 6)
Otras versiones de la escala de inteligencia de Binet-Simón se publicaron en

1911 y 1.926. En este ùltimo año la Universidad de Stanford realizó una profunda
revisión a esta escala que originó la creación de una nueva escala conocida como la
31
escala de inteligencia de Stanford-Binet. Esta ùltima escala sufrió nuevas
transformación en los años 1.937, 1.960 y en los años ochenta del siglo pasado. Más
recientemente, en la década de los años noventa del siglo pasado, Anne Anastasi,
prestigiosa autora de textos sobre test, creó un instrumento que mide habilidades, el
cual es producto de la integración de las escalas tradicionales de inteligencia y
baterías de aptitudes múltiples.
A continuación se presenta el cuadro 3 que incluye los test más relevantes desde
el siglo 2.200 A.C hasta el año 1.992
Cuadro 3. Eventos Seleccionados en la Historia de la Medición Psicológica y

Educativa
Año Evento
2.200 A.C Los mandarines establecen el programa de medidas para el servicio civil en
china
1219 Primeros exámenes orales de derecho que se llevaron a cabo en la

Universidad de Bologna
1575 J. Huarte publica el libro, Examinen de Ingenios, que trata de las

diferencias individuales en las capacidades mentales.
1636 Exámenes orales para obtener grado de certificado que se emplearon en

Oxford University.
1795 El astrónomo Maskelyne del observatorio de Greenwich despide a su

asitente Kinneboock cuando no concuerdan sus observaciones del tiempo
de tránsito de Venus.
1845 Exámenes impresos que utilizó por primera vez el Comité de la Facultad
de Boston bajo la dirección del educador Horace Mann.
1864 George Fisher, maestro de escuela inglés, elabora una serie de escalas que
consisten en una muestra o conjunto de preguntas y respuestas que sirven
como guías para evaluar las respuestas de los estudiantes a las preguntas de
las pruebas de ensayo.
1865 Establecimiento del Examen del Gobernador del Estado de Nueva York.
1869 El estudio científico de las diferencias individuales se inicia con la

publicación de la classificatión of Men According to Their Natural Gifts,
de Francis Galton
32
Año Evento
1879 Fundación del primer laboratorio psicológico del mundo por parte de
Wilhelm Wundt en la Universidad de Leipzig en Alemania.
1884 Francis Galton abre el Laboratorio antropométrico para la Exposición

Internacional de Salud en Londres.
1887 Gustav Fechener formula la primera ley psicológica.
1888 J.M. Cattell abre el laboratorio de test en la Universidad de Pennsylvania.
1893 Joseph Jastrow muestra los test sensoriomotrices en Columbian Exhibition

en Chicago
1896 Emil Kraeplin propone una nueva clasificación de los trastornos mentales.
Hermann Ebbinghaus desarrolla el primer test de completamiento.
1897 J.M. Rice publica los descubrimientos de las investigaciones sobre

capacidades para ortografía de los niños en las escuelas estadounidenses.
1900 Se funda el consejo para los exámenes de Admisión a la Universidad
1904 Charles Spearman describe la teoría de los factores sobre las capacidades
mentales. Se publicó el primer libro de texto importante sobre las medidas
educativas, Introduction to the Theory of Mental and social Measurement,
de E.L.Thorndike.
1905 Se publicó la primera Escala de Inteligencia de Binet-Simon. Carl G. Jung

utiliza los test de asociación de palabras para el análisis de los complejos
mentales
1908 Se publicó la revisión de la Escala de Inteligencia de Binet-Simon.
1908-1909 J.C. Stone y S.A. Courtis publican los test aritméticos objetivos.
1908-1914 E.L. Thorndike desarrolla dos test estandarizados de aritmética, caligrafía,

lenguaje y ortografía, incluyendo la Escala para Caligrafía de Niños (1910)
1914 Arthur Otis desarrolla los primeros test de inteligencia en grupo, que se
diseñaron y aplicaron a los reclutas del ejercito de Estados Unidos.
1916 Lewisa Terman publica la Escala de Inteligencia de Stanford-Binet.
1917 Los test del ejercito Alfa y Beta, primeros test de inteligencia en grupo, que
se diseñaron y aplicaron a los reclutas del ejército de Estados Unidos. El
primer inventario de personalidad estandarizado, la Hoja de Datos
Personales de Robert Woodworth, se utilizó en la selección militar.
1919 Se publicó el Examen Psicológico para los Estudiantes de Primer Año de

Universidad, por Louis Thurnstone.
33
Año Evento
1920 Se publicó la Escala Nacional de Inteligencia. Se publicó por primera vez

la Prueba de las Manchas de Tinta de Hermann Rorschach.
1923 Se publicó por primera vez la Prueba de Habilidades de Stanford. Se

publicó por primera vez la Prueba Mental Primaria de Pintner-
Cunningham.
1924 Se publicó el Statistical Method de Truman Kelly
1925 Se publicó el Statistical Method in Educational Measurement de Arthur

Otis.
1926 Se aplicó por primera vez la Prueba de Aptitudes Académicas
1927 Se publicó la primera edición del Formulario de Intereses Vocacionales

para Hombres de Strong. Se publicaron por primera vez los Test de
Inteligencia de Kuhlmann-Anderson.
1935 Desarrollo de la primera máquina para calificación de pruebas de IBM
1936 Se publicó el primer volumen de Psychometrika
1937 Se publicó la revisión de la Escala de Inteligencia de Stanford-Binet.
1938 Henry Murria publica Explorations in Personality O.K. Buros publica el

primer Mental Measurements Yearbook.
1939 Se publicó la Escala de Inteligencia de Wechsler-Bellevue
1942 Se publicó el Inventario Multifàsico de Personalidad de Minnesota.
1947 Se fundó el Servicio de Test Educativos.
1949 Se publicó de Wechsler la Escala de Inteligencia para niños.
1960 Se publicó la forma L-M de la Escala de Inteligencia de Stanford-Binet,
1969 Se publicó en Harvard Educational Review la ponencia de Arthur Jensen

sobre la herencia racial del CI.
1970 Aumenta el uso de las computadoras en el diseño, aplicación, calificación,

análisis e interpretación de tesis.
1971 Decisión de la corte federal que requiere que los test que se utilicen para
los propósitos de selección de personal sean importantes para el trabajo
(Griggs contra Duke Powel)
1974 Se publicó de Wechsler la 1° revisión de la Escala de Inteligencia para

niños.
34
Año Evento
1975 Crecimiento de las técnicas de evaluación conductual.
1980 Desarrollo de la teoría de respuestas de conceptos.
1981 Se publicó de Wechsler la revisión de la Escala de Inteligencia para

adultos.
1985 Se publicaron los Standards for Educación and Psychological Testing.
1987 Se publicó la revisión del inventario Psicológico de California
Se publicó el DSM-III-R
1989 Se publicó el MMPI-II
Se publicó la revisión de la prueba de Inteligencia para Edades Preescolar

y Primaría de Wechsler
1990 Se publicó la Escala de inteligencia para niños III de Wechsler
1992 Se publicó la décimo primera edición del The Mental Measurements

Yearbook
Nota. Este cuadro se tomó de Test psicológicos y su evaluación, (p.p 6, 7 y 8 ), Aiken,
1.996.
Clasificación de Instrumentos
En la literatura sobre test existen varios tipo de clasificaciones de instrumentos.

En el caso particular de este libro se ha tomado la clasificación desarrollada por
Aiken (1996), la cual se expone a continuación:
Test Estandarizados-Test no Estandarizado
Un test se considera estandarizado cuando al aplicarlo en una muestra

representativa de la población en estudio, se comprueba que es válido y confiable. En
contraposición a este tipo de test, están los no estandarizado, los cuales son test
35
informales (como las pruebas hechas por el docente para evaluar el aprendizaje del
alumno) que no se han aplicado a una muestra representativo de la población en
estudio, con la finalidad de someterlo a un proceso de validez y confiabilidad. Un
instrumento puede someterse a validación mediante una pequeña muestra pilotos de
sujetos provenientes de la población en estudio, pero si esa muestra no es
representativo no se puede hablar de test estandarizado. Es un test no estandarizado
auque se determine su validez y confiabilidad.
Test Individuales yTest Grupales
Cuando el test se aplica a una sola persona como los test de inteligencia se
denominan test individuales; pero cuando se aplica a un grupo para determinar un
atributo que éstos poseen, se está en presencia de un test grupal.
Test Objetivos y Test no Objetivos (Subjetivos)
Los test objetivos son aquellos que tiene formas de calificación estándar y entre
varios calificadores, los resultados siempre serán los mismos. Ejemplo de test
objetivos son las pruebas objetivas (verdadero-falso, selección simple y múltiple,
apareamiento y completación). Los test no objetivos o sujetivos son aquellos donde
no existe forma estándar para calificarlo, sino que la calificación
depende en gran medida del calificador. Ejemplo de este tipo de test, son las
pruebas de rendimiento académico de ensayo y las pruebas para evaluar la
personalidad .
Test de acuerdo al Contenido de una Tarea que se Presenta:
Esta clasificación se divide en test que contiene sólo material verbal como
vocabularios o lecturas, test de material no verbal como diagramas, rompecabezas y
mapas, y por último, están los test de ejercicio que determinan las habilidades
prácticas en un tema, ejercicio, profesión u oficio.
36
Test Cognoscitivos y Afectivos:
Aiken al explicar los test cognoscitivos expresa lo siguiente:
...tratan de cuantificar los procesos y productos de la actividad mental,

pueden clasificarse como medida de logro y aptitud. Un instrumento de
logro, que evalúa el conocimiento de alguna materia académica u
ocupación, se concentra en el comportamiento pasado de la persona que
la presenta (lo que en realidad ha aprendido o logrado). Un instrumento
de aptitud centra la atención en el comportamiento futuro, es decir, lo que
la persona es capaz de aprender con una capacitación adecuada. De esta
manera, las pruebas de aptitudes mecánicas o para el trabajo de oficina
están diseñadas para evaluar las habilidades y para beneficiarse de una
capacitación avanzada en las labores mecánicas o de oficina,
respectivamente. Sin embargo, el logro y la aptitud no son entidades
separadas; lo que una persona logró en el pasado por lo general es un
indicador bastante adecuado de lo que puede esperarse de ella en el
futuro. De hecho, algunos psicólogos prefieren no utilizar los términos de
logro y aptitud como forma de clasificar test; se refieren a ambos tipos de
instrumentos, como de habilidades (P. 10 y 11).
El mismo autor para referirse a los test afectivos expresa que éstos.....”están
diseñados para evaluar los intereses actitudes, valores, motivos, rasgos de
temperamento u otras características no cognoscitivos de la personalidad....” (P11).
Se puede concluir que los instrumentos de acuerdo al proceso de aprendizaje que
se quiere determinar, se dividen en test de habilidades (procesos cognoscitivos) y test
afectivos o de evaluación de la personalidad. Esta última denominación (test de
personalidad) es como se conocen aquellos test que evalúan la parte afectiva de una
persona.
Instrumento Cuantitativos y Cualitativos:
Una última clasificación de instrumentos a la cual se hace referencia es la que

clasifica a los instrumentos en cuantitativos y cualitativos. Esta clasificación no la
incluye Aiken cuando aborda este tema; sin embargo se considera conveniente
incluirla porque es usual hablar de instrumento cuantitativos y cualitativos. Al
respecto se expresa que un instrumento es cuantitativo cuando los datos son
37
susceptibles para realizar operaciones estadísticas. Estos tipos de instrumentos se
aplican fundamentalmente en el método “científico”. En métodos como la etnografía
y la Investigación-Acción, se limitan a cuestionarios y algunas escalas de estimación;
pero siempre subordinado a instrumentos cualitativos. Los instrumentos cualitativos
son propios de estos dos últimos métodos mencionados y el procesamiento de los
datos recolectados no es susceptible a operaciones estadísticas, sino que en los mismo
prevalece el proceso de categorización de los datos como forma de interpretar y
analizar los resultados. Los instrumentos cualitativos de mayor aplicación son los
relacionados con la entrevista no estructura y la observación.
Pasos en el Proceso de Diseño y Evaluación de Instrumentos
El proceso que debe seguir un diseñador de pruebas para que un instrumento,

sea válido y confiable, es realmente laborioso. Se requiere preparación en aspectos
tales como normas o criterios en el Diseño del instrumento específico que se desea
diseñar; y en confiabilidad y validez de instrumento. Asimismo un diseñador de
instrumentos debe poseer conocimientos de cómo seleccionar la muestra de los
sujetos a quienes se aplicará el instrumento.
Como una guía para quien debe diseñar y validar un instrumento, se describe a
continuación el proceso adecuado para que el instrumento cumpla con normas de
calidad en su elaboración y validación. Con este propósito se incluyen el gráfico 1,
donde se visualiza el flujo correspondiente al proceso de diseño y evaluación de
instrumentos.
Se observa en el gráfico que el proceso se inicia determinando el propósito
del instrumento, es decir, para què se desea diseñar el instrumento. Como segundo
paso se debe decidir el tipo de instrumento a diseñar: si es una prueba de
aprovechamiento académico para determinar el efecto de una estrategia de
compresión lectora en el rendimiento de la asignatura lengua, un cuestionario de
opinión para determinar la necesidad de un plan o proyecto, una escala de actitud del
docente hacia la evaluación cualitativa, etc.
38
1
Propósito
Del
3 4
instrumento
Fundamentación
Conceptualización Teórica de la
Del constructo 2 variable
Decidirelel
Decidir
TipodedeInstrumento
Instrumento
Tipo
5 6
DISEÑO DEL
INSTRUMENTO Redacciòn
Operacionalización Itemes Redacciòn
Operacionalización Deìtems
ìtems
(PRIMERA VERSIÓN De
dedevariables
variables
DEL INSTRUMENTO)
8
7
VALIDACIÓN DEL
INSTRUMENTO Aplicación
Validez de
Validez de DeAplicación
la prueba
Contenido Depiloto
la prueba
(JuicioContenido
de Expertos) piloto
(Juicio de Expertos)
Confiabilidad 1
Confiabilidad
0
Análisis de Itemes Evidencias de validez de constructo
Análisis de Itemes Evidencias de validez de constructo
9 11
Versión definitiva del instrumento
Gráfico 1. Proceso en el diseño y validación de instrumentos
39
Al seleccionar el instrumento, los pasos siguientes son la conceptualización
y fundamentación teórica del constructo que se desea investigar. En estas fases se
debe precisar el concepto de constructo, las teorías que lo explica y la teoría que se
asumirá en la investigación para describir y/o explicarlo. Al poseer la suficiente
fundamentación teórica se debe elaborar el cuadro de Operacionalización de la
variable que consiste en definir las variables a operacionalizar, las dimensiones y
subdimenciones, los indicadores y subindicadores, y por último, la redacción de los
ítems correspondientes a cada variable que se está operacionalizando. Con esta fase
se concluye el proceso de diseño del instrumento, obteniéndose la primera versión.
Al cumplir el proceso de diseño, se inicia el proceso de validación del
instrumento, sometiéndolo a la validez de contenido, la cual se realiza a través de la
técnica de juicio de expertos, que consiste en la revisión del instrumento por personas
expertas en el área en la cual se realiza la investigación y en metodología de la
investigación. Después que los expertos revisen el instrumento y se incorporen las
observaciones al mismo, se aplica la prueba piloto a una muestra de la población en
estudio o con características similares a la misma. La intención de esta muestra es
determinar el comportamiento de los sujetos encuestados ante los ítemes que contiene
el instrumento, determinar con los datos el análisis de ítemes, la confiabilidad y
algunas evidencias de validez. Realizado el proceso de validación se puede hablar de
un instrumento estandarizado, si el mismo además de ser válido y confiable es
representativo de la población en estudio.
Al cumplir con este último paso se obtiene la versión final del instrumento,
la cual se aplicará a la muestra definitiva de sujetos que suministrarán la información
sobre la (s) variable (s) en estudio.
1. Establezca mediante la ejemplificación la diferencia entre método,

técnica e ítem
40
2. Ejemplos de tipo de instrumentos.
Tipos de Instrumentos Señale un ejemplo de cada tipo de instrumento

Estandarizados
No estandarizados
Individuales
Grupales
Objetivos
No objetivos (subjetivos)
Test de material verbal
Test no verbal
Test de ejecución
Test cognoscitivo
Test afectivo
Instrumento cuantitativo
Instrumento cualitativo
3. Tome un tema de investigación que requiere la aplicación de un instrumento

y grafique los pasos exigidos en el proceso de diseño y validación.
Referencias
Aiken, L.(1.996). Test psicológicos y su evaluación (octava edición). México:

Prentice Hill
Ander-Egg,E.(1.980). Técnicas de investigación social (tercera edición). Argentina:

El Cid Editor
41
Lecturas Sugeridas
Aiken, L. (1.996). Test psicológicos y su evaluación (octava edición). México:

Prentice Hill. Se recomienda leer para esta Unidad el Capítulo I: Fundamentos
de la Medición Psicológica, que contiene: Perspectiva histórica: medición
mental en el siglo XIX, los test a principios del siglo XX, eventos seleccionados
en la historia de la medición psicológica y educativa, los test como una
profesión, clasificación de los test , propósito y usos de los test.
Ander-Egg,E.(1.980). Técnicas de Investigación Social (tercera edición., Argentina:

El Cid Editor. Se recomienda del capitulo 2: Metodología, Método y Técnica. El
método científico, leer los apartados métodos y técnicas.
Hurtado de Barrera, J. (2.000). Metodología de la Investigación Holística (tercera

edición). Caracas: sypal. Capítulo 24: Construcción y Validación de
Instrumentos, leer el apartado 24.1: Consideraciones generales, que contiene la
definición de técnica e instrumento, también incluyen un cuadro donde se
ejemplifica técnica e instrumento
42
CAPÌTULO III
TEST DE HABILIDADES
OBJETIVOS
Al terminar esta Unidad el participante será:

1. Capaz de comprender el concepto de test de habilidades
2. Capaz de diseñar una prueba de rendimiento académica, aplicando normas en
el proceso de su elaboración.
3. Capaz de diferenciar una prueba de rendimiento académico, prueba de
aptitud y prueba de inteligencia.
Conceptualizaciòn de los Test de Habilidades
Cuando se abordó la clasificación de los instrumentos, se mencionó un tipo de

clasificación que toma en cuenta si el instrumento investiga algún aspecto
cognoscitivo del sujeto o el aspecto investigado se vincula más bien a lo afectivo. De
acuerdo a esta clasificación, los test se dividen en cognoscitivos y afectivos. En el
caso de los test cognoscitivos se expresó que éstos determinan el logro alcanzado por
un sujeto en cuanto a sus habilidades cognoscitivas. Asimismo los test cognoscitivo
predicen el comportamiento académico y laboral de personas que desean ingresar en
una carrera universitaria o en un trabajo. Este último tipo de instrumentos se conoce
como pruebas de aptitud. De acuerdo a lo expresado, los test cognoscitivos se
dividen en pruebas de aprovechamiento, cuya función es determinar el logro
alcanzado en una asignatura, carrera universitaria u ocupación laboral; y en pruebas
43
de aptitud, que tienen como función predecir cuál será el desempeño de un estudiante
en su carrera universitaria o un profesional en su desempeño laboral.
Cuando se explicó la clasificación de test cognoscitivo y afectivo, también se
expresó que para Aiken (1.996), ante la confusión que puede generar el vocablo logro
en pruebas de aprovechamiento y aptitud, prefería usar la expresión test de
habilidades para denominar a los test cognoscitivo. En este trabajo se aceptó la
sugerencia de Aiken y se habla de test de habilidades para designar todos aquellos test
cuya función es determinar conocimiento, sea éste en tiempo pasado, presente o
futuro.
Prueba de Rendimiento Académico
Funciones de las Pruebas de Rendimiento Académico

La función de las pruebas de rendimiento académico es determinar
el logro alcanzado por un alumno en un tema o aspecto que se somete a
evaluación.
Características de las Pruebas de Rendimiento Académico
Una prueba de rendimiento académico debe poseer tres características

fundamentales
1. Factibilidad de la Prueba: Se refiere a la adecuación de la prueba a las
características del grupo al cual se aplica, es decir, cuando se aplica una prueba, hay
que tomar en cuenta la edad, nivel de conocimiento, muestra representativo de ítems
del dominio que se quiere evaluar, nivel de dificultad, factibilidad de responder todos
los reactivos de la prueba en el tiempo estipulado, etc.
44
2. Validez de Contenido: Las pruebas de rendimiento académico como
cualquier otro instrumento debe someterse a validez de contenido a través de la
técnica de juicio de experto. Evaluada por los expertos, la prueba debe aplicarse a una
muestra piloto para evaluar las respuestas de los respondientes y obtener información
que permita calcular la confiabilidad y otros métodos de validez como de criterios y
constructo.
3. Confiabilidad: Después de someter la prueba a validez de contenido a través
de la técnica de juicio de expertos y aplicar la muestra piloto, se debe realizar el
análisis de los ítems (análisis de discriminación de los ítems e índices de dificultad de
la prueba) y calcular la confiabilidad del instrumento.
4. Estandarización de la Prueba: Demostrada la factibilidad, validez y
confiabilidad de la prueba, se puede aplicar la versión definitiva, la cual determinará
el logro alcanzado por el alumno en la asignatura o tema que se evalúa. A los tres
aspectos señalados como características se puede agregar otro: la estandarización de
la prueba, que consiste en determinar la validez y confiabilidad de la misma en una
muestra representativa de la población en estudio, con la finalidad de generalizar su
aplicación y los resultados a un universo que puede abarcar una región, país e incluso
todo el planeta.
Clasificación de las Pruebas de Rendimiento Académico
Para desarrollar este tema se asume la clasificación de Carreño (1.991); quien

clasifica las pruebas de la manera siguiente:
Nivel Técnico de su Construcción
Informales. Son aquellas pruebas construidas por el docente, sin someterlas a

un análisis exhaustivo y a un proceso de generalización de los resultados de la
muestra.
45
Tipificada. Son aquellas pruebas de rendimiento académico elaboradas por
especialistas tanto en el contenido pedagógico como en técnicas de construcción y
validación de instrumentos, se somete a un proceso de validez y confiabilidad y la
prueba se aplica a una muestra representativa de la población en estudio para
determinar su factibilidad, validez y confiabilidad. Después de cumplir todo el
proceso señalado se aplica en forma definitiva.
Por el Manejo del Tiempo Empleado en Resolverla
Prueba de velocidad. Esta prueba se relaciona con el tiempo en el cual el

alumno logra responderla. En este tipo de prueba la velocidad en las respuestas es un
aspecto muy importante.
De Poder. En esta prueba el tiempo tiene poca importancia, se toma en cuenta

el poder que tiene el alumno para responder el contenido de la prueba.
Por su Forma de Expresión
Orales. Este tipo de prueba tuvo gran acogido (hasta la década de los años
1.960) en el mundo y en nuestro país; pero debido a la subjetividad implícita en las
calificaciones y la dificultad de aplicarla en grupos numerosos, su uso se redujo
considerablemente y fueron sustituidas en gran medida por las pruebas escritas.
Escritas. Este tipo de prueba se divide de la manera siguiente:

1. Pruebas escritas objetivas: no se requiere que el alumno construya la
respuesta, sólo debe marcar la respuesta correcta o completar brevemente una frase.
Los tipos de itemes de respuestas objetivas son los siguientes:
1.1 Respuestas alternas: si-no, verdadero-falso, correcto-incorrecto. En este
tipo de respuestas sólo debe indicarse si el enunciado de la pregunta es verdadero o
falso, correcto o incorrecto, si o no. A este tipo de respuesta se le critica que el
46
alumno tiene una probabilidad de acertar del 50%, es decir, si el alumno responde
todas las preguntas por simple adivinación, tendrá de acuerdo a la ley de probabilidad
la mitad del total de respuesta en forma correcta.
Ejemplo de respuestas alternas:
Las pruebas de aprovechamiento escrita se subdividen en objetivas, de ensayo y
mixtas: V:_____ F: ______
1.2 Ítem con respuestas de jerarquización u ordenamiento. Carreño (1.990)
expresa que las respuestas jerarquizadas u ordenadas “...se caracteriza por ofrecer al
examinado una listas de elementos o datos, a los cuales debe dar un orden específico
de acuerdo con el criterio que indique las instrucciones (cronológico, lógico,
evolutivo, por rango, etc.)”. (p.33)
Carreño señala el siguiente ejemplo: colocar por orden jerárquico los niveles de
aprendizaje propuestos por Bloom en el domino cognoscitivo, empezando por el más
elemental:
Compresión 1.-:______________
Evaluación 2.-: ______________
Aplicación 3.-: ______________
Análisis 4.-: ______________
Conocimiento 5.-: ______________
Síntesis 6.:_______________
1.3 Complementación – respuesta simple o breves. En este tipo de respuesta, se
completa una frase con una palabra, dato o símbolo. Ejemplo: Caracas es la capital
de: _____________________
1.4. Apareamiento / correspondencia / casamiento: Consiste en aparear
elementos que se encuentra en dos grupos.
Ejemplo: En el paréntesis anotar la letra que corresponde a la capital del
Estado.
( ) Lara (A ) Maracaibo
( ) Carabobo (B) Trujillo
( ) Trujillo (C) Cumaná
Cont.
47
( ) Nueva Esparta (D) Valencia
( ) Sucre (E) Tucupita
( ) Delta Amacuro (F) Barquisimeto
( ) Zulia (G) La Asunción
En este caso ambos grupos lo integran siete elementos, lo recomendable es

formar grupos con número de elementos desiguales para evitar la adivinación, si sólo
desconoce el apareamiento de un par de elementos.
1.5 Localización / identificación: Se identifica en un mapa, diagrama, cuadro
sinóptico, ilustración; la respuesta. Ejemplo: En un microscopio identificar el porta
objeto, el tornillo micrométrico, el punto donde proviene la luz y el sitio donde está
ubicado cada lente.
1.6 Respuesta de opción múltiple: Está compuesta por un cuerpo de reactivos y
otro cuerpo de posibles respuestas (opciones de respuestas). Solo una respuestas es la
correcto de cada pregunta. Este tipo de reactivos según Carreño, pueden ser de
definición, propósito, causa-efecto, asociación, reconocimiento de error,
reordenación, identificación de error, evaluación, diferencias, semejanzas, ordenación
incompleta y principios comunes.
Ejemplo: La fórmula para determinar la confiabilidad de consistencia interna
de un instrumento con opciones de respuesta dicotómicas se conoce con el nombre
de:
( ) Spearman–Brown
( ) Pearson
( ) Kuder–Richardson
( ) Alfa de Cronbach
Formula para castigar a los alumnos que adivina las respuestas
48
Para castigar a los alumnos que responden adivinando las respuestas, se ha
construido la siguiente fórmula:
PC= C-(i/n-1)
Donde:
 PC: Puntuación corregida
 C: Número de respuestas correctas
 i: Respuestas incorrectas
 n: Número de alternativas de respuesta del ítem
Ejemplo: Si un estudiante obtiene 30 respuestas correcta y 20 incorrecta en una
prueba de 50 preguntas, con tres alternativas de respuestas, tendrá 20 puntos de
calificación
Pc= 30-(20/3-1)= 20
Fórmula para premiar a los alumnos que no adivinan
Para premiar a quienes dejan en blanco las respuestas que desconocen se aplica
la siguiente fòrmula:
PC= C+(O/N)
Donde:
 PC= Es la puntuación corregida
 C= Número de respuestas correctas
 O= Número de respuestas omitidas
 N= Número de opciones de respuestas del reactivo
Ejemplo: Si un estudiante obtiene 30 respuestas correctas, dos incorrectas y 8
omitidas en una prueba de 40 preguntas de cuatro alternativas de respuestas la
puntuación será de 32 puntos de calificación.
Pc= 30 + (8/4)= 32
2. Pruebas escritas de ensayo: En este tipo de prueba el estudiante redacta la
respuesta. Se conocen dos tipos de reactivos de ensayo: (a) respuestas restringidas,
49
donde se restringe la respuesta de acuerdo a la formulación de la pregunta. Ejemplo:
cite los tres métodos básico de confiabilidad en la validación de instrumentos, (b)
respuesta libre, en este tipo de respuesta el estudiante tiene libertad para responder la
pregunta. Ejemplo: elabore una prueba de rendimiento académico, tomando un
contenido de la asignatura que usted administra.
Las desventajas de las pruebas escritas tipo ensayo son las siguientes: (a) Alto
grado de subjetividad en el proceso de evaluación, (b) Puede influir la redacción en el
momento de la evaluación, y (c) Sólo es adecuada cuando se quiere evaluar
creatividad o redacción.
Tomando en cuenta las limitaciones de las pruebas de ensayo se recomienda: (a)
Incluir una cantidad representativa de ítemes del tema o contenido a evaluar, para ello
se recomienda ítemes de respuestas restringidas, (b) se debe informar al estudiante
como debe responder las preguntas, (c) Debe formularse a todos los estudiantes los
mismas preguntas, con el propósito de evitar preguntas con niveles de dificultad
diferente, (d) se debe corregir la misma pregunta al grupo de estudiantes ante de pasar
a otra, y (e) la corrección de la prueba de deber ser anónima, es decir, no se debe
conocer el nombre del estudiante al cual se está corrigiendo la prueba.
3. Pruebas mixtas:
Es aquel tipo de prueba integrada por reactivos de respuestas objetivas y de
ensayo.
Prueba prácticas. En este tipo de prueba el estudiante responde en la práctica la

pregunta formulada, se usa en áreas como educación física, arte, trabajos de
laboratorio, ejemplo: Evaluación del estudiante en un juego de voleibol.
Taxonomía de Bloom
50
Para la redacción de objetivos instruccionales e ítemes de pruebas de
aprovechamiento académicos, existen las taxonomías, siendo la más popular aquella
creada por Benjamín Bloom; quien divide los objetivos instruccionales en tres áreas:
cognoscitivos (objetivos de la memoria y razonamiento), afectivos (objetivo de las
emociones) y el psicomotriz (objetivo de habilidades físicas).
Bloom divide el dominio cognoscitivo en seis (6) niveles: conocimiento
(recordar o de memoria), compresión (responder lo que se pregunta, para lo cual se
requiere el entendimiento), aplicación (solución de problemas), análisis (examen
exhaustivo de un problema o de un caso especifico), síntesis (resumir la evolución de
un problema. Se considera el nivel inverso al análisis) y evaluación (emitir juicio
sobre un tema particular). Estos niveles para Bloom tienen un orden jerárquico y van
desde el más simple hasta el más complejo
En cuanto al dominio afectivo; Bloom, citado por Woolfolk (1.996), señala
cinco objetivos básicos:
(a) Recepción: estar consciente de algo en el entorno o ponerle atención.
Este es el nivel de “escuchar el concierto pero no prometo que me agrade,
(b) Respuesta: presentar alguna conducta nueva como resultado de le
experiencia. En este nivel, una persona podría aplaudir después del
concierto o murmurar algo de la música el día siguiente, (c) Valoración:
Demostrar algún interés o compromiso definitivo. En este nivel, una
persona podría decidir ir a un concierto en vez de ir a ver una película, (d)
Organización: Integrar un valor nuevo en nuestro propio conjunto general
de valores, dándole alguna clasificación entre nuestras prioridades
generales. Este es el nivel en que una persona empezaría a hacer
compromisos importantes para asistir a un concierto, (e) Caracterización
por valor: Actuar de manera consistente con el nuevo valor. En este nivel
superior, una persona se comprometería con firmeza al amor hacia la
música y lo demostraría abierta y consistentemente. (p.448)
Woolfalk al referirse al dominio psicomotriz expresa:

El aprendizaje en el dominio psicomotriz implica desarrollar una capacidad de
desempeño particular. ¿Cómo valorar el desempeño de un estudiante?. La respuesta
obvia es pedir al estudiante que demuestre la habilidad y luego observar su dominio.
En algunos casos, el desempeño de la aptitud tiene como resultado un producto, de
modo que la valoración del producto puede sustituirse por la observación del
desempeño real. Por ejemplo: un estudiante de artes que aprende a utilizar el torno
51
artesanal, por aprendizaje, debe ser capaz de producir una vasija que sea simétrica,
que se mantengan de pie por si misma y no se resquebraje con el fuego. (p.449)
Es importante agregar que estos tres dominios de la Taxonomía de Bloom no se

aplican por separados, sino que la evaluación de una determinada actividad puede
requerir más de un dominio en el proceso enseñanza–aprendizaje. Es usual los casos
de personas que en su rol como docente aplican en el proceso de evaluación más de
un dominio, existiendo entre ellos un complemento.
A continuación se presenta una lista de verbos recomendados para redactar
ìtemes en los diferentes niveles del dominio cognoscitivo:
Comprensión Interpretación Aplicación Análisis Síntesis Evaluación

I II III IV V VI
Anotar Agrupar Adaptar Analizar Adaptar Apreciar
Adquirir Arreglar Afianzar Buscar Ampliar Auscultar
Aprender Asociar Afirmar Considerar Amar Calcular
Captar Clasificar Aplicar Consultar Bosquejar Calificar
Compartir Catalogar Aprovechar Chequera Concluir Comprobar
Categorizar Aprovechar Desamar Condensar Confirmar
Conocer Colocar Asegurar Descifrar Construir Considerar
Comentar Completar Controlar Descomponer Crear Criticar
Cambiar Contrastar Conversar Descubrir Concebir Chequear
Convertir Comparar Cooperar Desmenuzar Confeccionar Estimar
Citar Considerar Cultivar Desglosar Cambiar Evaluar
Definir Discriminar Chequear dividir Deducir Medir
Discutir Distinguir Demostrar Estudiar Determinar Opinar
Duplicar Empatar Determinar Encontrar Dibujar Sancionar
Describir Encontrar Efectuar Enfocar Elaborar Valorar
Establecer Ejecutar Establecer Enriquecer
Escuchar Generalizar Ejercitar Examinar Encontrar
Enlistar Hallar Emplear Experimentar Experimentar
Enumerar Igualar Encontrar Extraer Formar
Explicar Interpretar Enseñar Hallar Formular
Exponer Ordenar Establecer Investigar Fabricar
Expresarse Organizar Extender Ordenar Generalizar
Graficar Aparear Fomentar Participar Graficar
Identificar Recoger Hallar Presentar Hacer
Imitar Relacionar Iniciar Recortar Hallar
Informar Lanzar Seleccionar Ilustrar
Memorizar Leer (oralmente) Separar Inferir
Percibir Inducir
Prosificar Imaginar
Recitar Localizar Intuir
Recordar Lograr Integrar
Reconocer Llevar Manipular
Reconstruir Llevar a cabo Original
Resaltar Manejar Opinar
Repetir Manipular Producir
Representar Mantener Producir
52
Comprensión Interpretación Aplicación Análisis Síntesis Evaluación
I II III IV V VI
Reproducir Obtener Planificar
Resumir Participar Presentar
Retener Practicar Predecir
Reunir Presentar Realizar
Rehacer Procurar Recoger
Pronunciar Resumir
Traducir Probar Reunir
Transformar Realizar Razonar
Visualizar Rebotar Sinterizar
Ver Recortar Sugerir
Regresar Suponer
Sistematizar
Solucionar
Usar
Utilizar
Es importante aclarar que lo determinante para ubicar una pregunta en un

determinado nivel no es el verbo, sino la orientación del ítem. Esto explica porque un
mismo verbo puede emplearse para redactar preguntas correspondiente a niveles
diferentes del dominio cognoscitivo.
Pasos para la Construcción de una Prueba de Rendimiento.
1. Nombre de la prueba: Se recomienda identificar la prueba con un nombre que

se corresponda con el contenido a evaluar o en honor al autor.
2. Población o muestra a quien se aplicará la prueba: Se debe especificar a
quiénes se aplicará la prueba, ejemplo, Alumnos del primer grado de Educación
Básica, U.E. Cabudare, Municipio Palavecino, Estado Lara. Otro ejemplo es
participantes en la asignatura construcción y validación de instrumento, Maestría en
Educación, Mención Educación Superior U.P.E.L-I.P.B.
3. Tipo de Prueba: Se debe especificar en cuál clasificación se incluyen la
prueba a aplicar: escrita, oral o práctica. Si es escrita, qué tipo de prueba escrita:
objetiva, ensayo o mixta. Si es objetiva debe especificarse si estará integrada por
preguntas de verdadero–falso, apareamiento, completación, selección simple ó
múltiple, etc.
53
4. Tabla de especificaciones de la prueba.
Propósito Nombre del Contenido Dominio del Nivel del Identificación Total
de la objetivo o conocimiento a conocimiento del item(*) ítemes(**)
prueba unidad a evaluar a evaluar
evaluar
- - - - - Total
ítemes(**)
(*) Debe identificar los ítemes que corresponden al nivel del conocimiento a evaluar
(**) Debe indicar la cantidad de ítemes
5. Elaboración del Instrumento. Debe incluir: (a) Identificación de la prueba, el

curso y el alumno, (b) Instrucciones para responder la prueba, y (c) La formulación
de las preguntas y alternativas de respuestas (si es una prueba objetiva). Las
preguntas deben tener correspondencia con la tabla de especificaciones, es decir,
coincidir con el propósito y contenido de la prueba, dominio y niveles de
conocimiento a evaluar.
6. Claves de respuestas: Debe contener lo siguiente: la respuesta correcta y su
valor correspondiente. Cuando el valor de respuesta no es dicotómica, debe explicar
el criterio para determinar el valor, ejemplo, una pregunta ensayo puede tener tres
valores: 3= buena; 1,50= regular y 0= deficiente o no respondió. En este caso debe
explicar cuando se considera buena, regular o deficiente.
7. Revisión y Evaluación de la Prueba: Para cumplir con este paso, debe
elaborar una carta modelo solicitando a expertos validar la prueba. Se debe anexar el
formato de evaluación que llenará el experto, el cual se elaborará tomando en cuenta
los aspecto que el autor de la prueba desea que se evalúen.
8. Criterios para cuantificar los resultados: La cuantificación de los resultados
tiene relación con el nivel del curso donde se aplicará la prueba. Si es en la I y II
Etapa de Educación Básica, la cuantificación de los resultados será en consideración a
las siguientes literales:
54
A = 5: El alumno alcanzó todas las competencias y en algunos casos superó las
expectativas
B = 4: El alumno alcanzó todas las competencias previstas para el grado.
C = 3: El alumno alcanzó la mayoría de las competencias previstas.
D = 4: El alumno alcanzó algunas de las competencias, pero requiere de un
proceso de nivelación al inicio del nuevo año escolar para alcanzar los resultados.
E = El alumno no logró adquirir las competencias mínimas requeridas para ser
promovido al grado inmediato superior.
Si la prueba está dirigida a alumnos de la III Etapa de Educación Básica y a
Educación Media, la escala a tomar en cuenta, será la siguiente:
Puntuación Categorías
18 a 20 Excelente
15 a 17 Buena
Puede 13 a 14 Satisfactoriamente valorar
los resultados 10 a 12 Regular de una
01 a 09 Deficiente
prueba, tomando en
cuenta una escala de puntuaciones diferentes a los establecido, ejemplos, evaluar del
1 al 100 y luego realizar la conversión de 1 a 20 puntos: si un alumno obtuvo una
calificación de 80 puntos (escala del 1 a 100), para transformar esa calificación del 1
al 20, se procede a despejar la siguiente reglas de tres:
80 ___________100
X ___________ 20
La conversión es 16 puntos. Si son 90 puntos, la conversión será 18 puntos.
Si la prueba está dirigida a participantes de postgrado de la UPEL – IPB, la
escala será la siguiente:
Calificación Valoración Acumulada Categoría Cualitativa
10 95-100 Excelente
9 89-94 Sobresaliente
8 83-88 Distinguido
7 77-82 Bueno
55
6 70-76 Suficiente
5 56-69 Deficiente
4 42-55 Deficiente
3 28-41 Deficiente
2 14-27 Deficiente
1 Hasta 13 Deficiente
9. Interpretación de los resultados de una prueba de rendimiento académico. Se

realiza a través de dos clases de evaluación:
1. Evaluación por normas: en esta clase de evaluación se compara el
rendimiento del estudiante con el rendimiento de un grupo. El grupo puede ser
el conformado por un salón de clase, a nivel regional, nacional o incluso
internacional. En este tipo de evaluación la calificación depende de la obtenida
por el grupo que se tiene como norma. Tiene la desventaja que se desconoce el
dominio absoluto del estudiante sobre el tema o contenido evaluado. Para que la
prueba sea representativo del dominio a evaluar, se requiere una cantidad
relativamente grande de ítemes elegidos al azar.
2. Evaluación por criterio: En esta clase de evaluación se considera el dominio
que el estudiante realmente tiene sobre el tema que se desea a evaluar. El
resultado de la prueba se compara con un dominio que es el saber exigido para
que el estudiante tenga el conocimiento suficiente sobre el objetivo evaluado.
La prueba cuando se elabora en función de esta clase de evaluación requiere
una cantidad menor de ítems que en la evaluación por normas. Sólo se requiere
los ítems que determinan el saber exigidos sobre el objetivo evaluado.
Test de Inteligencia
Definición de Inteligencia
En todo el siglo XX la inteligencia fue tema de discusión entre psicólogos,

educadores y diseñadores de test, incluso hasta nuestro días no hay acuerdo sobre la
definición de inteligencia, fue Galton (pionero de los test de inteligencia), quien a
56
principios del siglo XX elaboró una primera definición de inteligencia, la cual vinculó
a factores hereditarios y para demostrar la relación inteligencia-factores hereditarios,
se dedicó a estudiar el árbol genealógico de numerosas familias.
Posteriormente el psicólogo Alfredo Binet, en la primera década del siglo XX,
también se preocupó por definir la inteligencia, a la cual consideró como “La
capacidad para juzgar bien, razonar bien y entender bien”. (tomando de Aiken, 1.996,
p.136).
Teorías recientes involucran como determinantes de la inteligencia a uno o más
de los siguientes aspectos: (a) Capacidad del individuo para aprender; (b)
Conocimiento total que ha adquirido una persona, y (c) Capacidad para adaptarse a
distintas situaciones.
Sobre la definición de inteligencia en al actualidad la polémica continùa, hay
quienes consideran que una persona inteligente debe dominar todas las áreas del
dominio cognoscitivo: arte, matemática, poesía, historia, etc., apoyan su tesis en la
correlación positiva de las diferentes subpruebas de inteligencia.
Mas reciente Howard Gardner en el año 1.983 propuso su teoría sobre la
inteligencia múltiple. Al respecto Woolfolk (1.996) expresa lo siguiente:
... basó su noción de capacidades separadas en parte, en la evidencia de
que el daño cerebral (de un golpe, por ejemplo) con frecuencia interfiere
en el funcionamiento de un área, como el lenguaje, pero no afecta el de
otras áreas. Gardner también anotó que los individuos a menudo
sobresalen en una de estas áreas pero no tiene habilidades considerables
en las otras seis. (p.111)
A continuación se presenta cuadro donde Gardner explica las siete áreas de la

inteligencia
Cuadro 4.
Siete inteligencias (*)
Inteligencia Estados finales Componentes centrales

Lógica - matemática Científico, Sensibilidad y capacidad para discernir patrones
matemático lógicos o numéricos, capacidad para manejar
cadenas extensas de razonamiento.
Lingüística Poeta, periodista Sensibilidad a los sonidos, ritmos y significados de
57
las palabras, sensibilidad para las diferentes
funciones lingüísticas
Musical Compositor, Capacidades para producir y apreciar ritmo, tono y
violinista timbre, apreciación de las formas de expresión
musical.
Espacial Navegante, escultor Capacidades para percibir el mundo espacial visual y
realizar transformaciones en las propias percepciones
iniciales
Inteligencia Estados Finales Componentes centrales
Cinética corporal Bailarín, atleta Capacidades para controlar los movimientos del
cuerpo y manejar objetos con destreza.
Interpersonal Terapeuta, vendedor Capacidad para discernir y responder con propiedad
a los modos, temperamentos, motivaciones y deseos
de otros.
Intrapersonal Persona con un Acceso a los sentimientos propios y la capacidad de
conocimiento discriminar entre éstos y asociarlos para guiar la
detallado y preciso de conducta; conocimiento de las fuerzas, debilidades,
si misma deseos e inteligencia de uno mismo.
(*) La teoría de Howard Gardner de las inteligencias múltiples sugiere que hay siete categorías
diferentes de aptitudes humanas. Un individuo podría tener ventajas y desventajas en una o varias
áreas. La figura presenta explicaciones de cada capacidad y ejemplos de ocupación que se relacionan
con esa aptitud.
Nota: cuadro tomado de Psicología educativa. Woolfolk, (1996), p.113
Clasificación de los Test de Inteligencia
Los test de inteligencia se puede clasificar como test individuales y test

grupales. Los individuales se aplican a un individuos por separados, el especialista o
personas que aplica el test formula las preguntas y aclara cualquier duda sobre las
misma. Este tipo de test presenta como ventaja la obtención de puntajes con menor
error, porque se aplican con asesoramiento del especialista o persona entrenada para
desempeñarse como facilitadores en el proceso de aplicación de test. En cuanto a los
test grupales son aquellos que se aplican simultáneamente a un grupo, siendo auto-
58
administrados. Tiene como desventaja que el aplicador del test no supervisa
directamente las preguntas formuladas, se aplica generalmente cuando se requiere
información inicial sobre la inteligencia del grupo.
Test de Inteligencia más Destacados
Test de Inteligencia de Binet-Simon
Alfredo Binet con la colaboración de Theodore Simon crearon en 1.905 la

primera prueba de inteligencia formal. En 1.908 se publicó una revisión de esta
prueba donde se extendió el limite de edad. En el cuadro 5 se presentan las cincuenta
y cuadro pruebas en la escala de edad mental de Alfred Binet.
Escala de Inteligencia Stanford-Binet
Esta escala de inteligencia surge en 1.916, producto de una profunda revisiòn de

la escala de Binet-Simon. En 1.926 la universidad de Stanford comienza una revisión
de esta escala de inteligencia de Binet. El proyecto de crear una nueva escala de
inteligencia tardó 11 años, fue en 1.937 cuando surge una nueva versión de la escala
de Stanford-Binet. Entre sus nuevos aportes se encuentra la elaboración de dos
formas paralelas de la prueba que evidencian la confiabilidad de la escala y la
elaboración de un manual dirigido a quien le correspondía administrar la prueba.
Entre las crítica a esta escala, que dio origen a una nueva versión, fue la falta de
representación de la muestra.
En 1960 se publicó la tercera edición, que introduce como novedad el cociente
de inteligencia (CI) de desviación, en lugar de las tablas de cociente de inteligencia
(CI) de razón.
El C.I de razón usa el concepto de edad metal que es la edad en la cual un
individuo esta funcionando intelectualmente, por ejemplo, si la prueba se aplica a un
59
niño de 6 años y responde preguntas que corresponde a un niño de 10 años, su C.I
será:
Edad mental 10
C.I: X 100 = X 100= 166.67
Edad Cronológico 6
Cuadro 5. Las cincuentas y cuatro pruebas en la Escala de Edad mental de

Alfred Binet, 1911
3 años 9 años
Señala la nariz, los ojos y la boca Da cambio de 20 pesos
Repite dos dígitos Responde o comprende preguntas sencillas
Menciona los objetos en una ilustración Define palabras familiares en términos superiores
a su uso
Conoce su apellido Reconoce todos los valores de las monedas
Repite un enunciado de seis silabas Menciona los meses del año en orden
4 años
Sabe cuál es su sexo 10 años
Menciona la palabra llave, cuchillo y moneda Acomoda cinco bloques en orden de peso.
Repite tres dígitos Copia dos dibujos de memoria
Compara dos líneas Critica afirmaciones absurdas
5 años Responde o comprende “preguntas difíciles”
Compara dos pesos Utiliza tres palabras determinadas en no más de
Copia un cuadro dos enunciados.
Repite un enunciado de diez sílabas 12 años
Cuenta cuatro monedas Se resiste ante las sugerencia acerca de la
Junta las mitades de un rectángulo dividido longitud de líneas
6 años Construye un enunciado que contiene tres palabras
determinadas.
Distingue entre mañana y tarde Menciona 60 palabras en 3 minutos
Define palabras familiares en términos de uso Define tres palabras abstractas
Cuadro 5 (Cont.)
Copia un diamante Descubre el sentido de un enunciado que no está
en orden
Cuenta 13 monedas
Distingue fotos de rostros feos y bonitos
7 años 15 años
Señala la mano derecha y la oreja izquierda Repite siete dígitos
Describe una ilustración Encuentra tres rimas para una palabra determinada
en 1 minuto
Lleva a cabo tres órdenes que se dan en forma Repite un enunciado de 26 sílabas
simultánea
Cuenta el valor de seis monedas, tres de las Interpreta ilustraciones
cuales valen el doble.
Menciona cuatro colores cardinales Adulto
8 años Resuelve la prueba del cortado de papel
60
Compara dos objetos de memoria Vuelve a ordenar un triángulo en la imaginación
Cuenta del 20 al cero Menciona las diferencias entre pares de términos
abstractos
Se da cuenta de las omisiones en las ilustraciones Menciona tres diferencias entre un presidente y un
rey
Da la fecha y el día Menciona el pensamiento principal de una
selección que lee
Repite cinco dígitos
Nota: Tomado de Aiken, (1.996, p.137)
En este coeficiente de inteligencia se supera el promedio que es 100 puntos. Si

se tiene un niño de 10 años y sólo responde hasta la prueba que corresponde a un niño
de 6 años, el:
Edad mental 6
C.I: X 100 = X 100= 60
Edad Cronológico 10
En este caso el C.I es inferior a la inteligencia promedio que es 100.

Como se mencionò, a partir de la tercera edición de la escala Stanford-Binet, se
introduce el C.I de desviación en lugar del C.I de razón. En este concepto la
inteligencia de un individuo se determina en función del grupo de la misma edad en
la muestra estandarizada. En este caso la media del grupo de la misma edad es 100 y
la desviación es 16, lo que significa que un individuo que obtenga una puntuación de
100 ( la misma que la media ) su C.I= 116.
La cuarta edición de la Escala de Inteligencia Stanford-Binet, publicada en
1986 tiene cambios significativos en cuanto a la organización teórica, aplicación y
calificación e interpretación de los resultados. En las ediciones anteriores la prueba
era una escala de edades, mientras que en esta edición la escala es de puntos, con 15
sub-pruebas separadas
La Escala de Inteligencia de Wechsler
61
Cohen y Swerdlik (2.000) al referirse a este tipo de escala de inteligencia
expresan lo siguiente:
David Wechsler... diseñó una serie de pruebas de inteligencia aplicadas en
forma individual para evaluar las capacidades intelectuales de personas
desde preescolar hasta adulto. En sus revisiones actuales, las tres escalas
de inteligencia de Wechsler son la Escala Wechsler de Inteligencia para
Adultos-tercera edición (Wechsler Adult Intelligence Scale-III; WAIS–III)
para edades de 16 a 89 años, la Escala Wechsler de Inteligencia para
Niños -tercera edición (Wechsler Intelligence Scale for Children-III;
WISC-III) para edades de seis a 16 años y la Escala Wechsler de
Inteligencia Preescolar y Primaria –Revisada (Wechsler Preschool and
Primary Scale of Intelligence-Revised (WPPSI-R), para edades de tres a
siete años, tres meses. Las pruebas tienen todas una estructura similar y
cada una incluyen una escala verbal y una de ejecución....(p.310)
Estas pruebas fueron clasificadas por orden de dificultad y son escala de puntos
en lugar de escalas de edad. La prueba está compuesta por un conjunto de
subpruebas. La primera edición se publicó en 1.930. En el año 1.939 se publicó una
nueva edición. Otras nuevas ediciones se publicaron en 1.942 y 1.997. En esta último
publicación se actualizó el material y se amplió el rango de edad hasta 89 años,
considerando que la esperanza de vida se había incrementado
Pruebas de Habilidades Especiales
La prueba de habilidades especiales son aquellos que evalúan el logro

alcanzado o el que puede alcanzar una persona en un área especifica. Aiken (1996)
expresa que las pruebas de habilidades más destacadas son las siguientes:
Pruebas de Habilidades Sensorio-Perceptuales y Psicomètricas
El propósito de esta prueba es obtener información sobre la capacidad de una

persona en el desempeño de un trabajo. En el campo laboral se tiene a esta prueba
62
como una medida de seguridad que permite determinar el estado de los sentidos de un
candidato a un cargo. En el ámbito escolar instrumentos de este tipo detectan
deficiencias como agudeza visual y auditiva, así como confusiones en la visión de
colores.
Habilidades Mecánico
Se aplican en oficios industriales y alguna carreras técnicas donde se exigen a

la persona un mínimo de habilidades psicomotrices y conocimiento mecánico.
Habilidades para Trabajos de Oficinas y Relacionados con la Computación
Con este tipo de instrumentos se determina habilidades verbales y matemáticas,

perceptuales (habilidad de recibir información por los sentidos), y otros aspectos
relacionados con la inteligencia general
Pruebas de Habilidades Artísticas, Musicales y otras Habilidades
Se aplica para determinar las habilidades musicales y artísticas que posee una
persona
Baterías de Aptitudes Múltiples
Este tipo de prueba está conformada por varias sub-pruebas que miden por
separado varios aspectos de interés relacionado con diferentes habilidades
Ejercicios propuestos
1. Establecer la diferencia entre test de habilidades y test afectivos.

2. Establecer las diferencias entre una prueba de rendimiento académico, un test de
inteligencia y prueba de aptitud.
63
3. Diseñar una prueba de rendimiento académico tomando en cuenta los pasos
explicados para su elaboración.
Referencias
Aiken, L. (1.996). Test psicológicos y evaluación. México: Prentice Hall.
Carreño. F. (1.991). Enfoque y principios teóricos de la evaluación, Cursos Básicos

para la formación de profesores. Área sistematización, N° 6. México: Trillas.
Cohen, R y Swerdlik, M. (2.001). Pruebas y evaluación psicológicas. México: Mc.

Graw Hill.
Woolfolk, A. (1.996). Psicología educativa (segunda edición). México: Printice Hall.
64
Lecturas Sugeridas.
Aiken, L. (1.996. Test psicológicos y evaluación. México: Prentice Hall. Se
recomienda los capítulos 6: Test de inteligencia y el capítulo 7: Tests de
Habilidades especiales.
Carreño, F. (1.991). Enfoque y principios teóricos de la evaluación. Cursos Básicos

para la Formación de Profesores, áreas sistematización, N° 6. México: Trillas. Se
recomienda el capítulos 3: Naturaleza de los reactivos; y capítulo 4: Reactivos de
opción múltiple.
Cohen, R y Swerdlik, M. (2.001). Pruebas y Evaluación Psicológicas. México: Mc.

Graw Hill. Se recomienda el capítulo 8: La inteligencia y su medición; y el
capítulo 9: Pruebas de inteligencia.
Woolfolk, A. (1.996). Psicología educativa (segunda edición). México: Printice Hall.

Se recomienda el capítulo 12: Profesores y enseñanza, específicamente el
apartado que trata sobre Taxonomías.
CAPÌTULO IV
TESTS AFECTIVOS
Objetivos
1. El estudiante será capaz de comprender el concepto de test afectivos.
65
2. El estudiante será capaz de diseñar escalas de actitudes de acuerdo a criterios
técnicos.
3. El estudiante será capaz de distinguir las test afectivos más importantes,
como son actitudes, motivaciones, valores e intereses.
Conceptualización de los Test Afectivos
Los test afectivo, a pesar de no determinar el desempeño profesional o

académico, ya que no determinan ni predicen habilidades, son de gran utilidad
cuando se desea explorar sentimientos y vocación en el individuo. Se considera
menos confiables que los test de habilidades, ya que la mayoría de ellos son informes
sobre si mismo que proporcionan los individuos a quienes se explora, lo cual los hace
susceptibles de obtener información falsa; sin embargo al complementar estos
informes con otros métodos de recolección de muestras conductuales, su validez y
confiabilidad puede considerarse aceptable. Los test afectivos más importantes son
sobre actitudes, motivaciones, valores e intereses. A través de test que examinan estos
constructo el investigador puede lograr información muy valiosa para determinar los
afectos que tienen los individuos hacia otros sujetos u objetos de estudios.
A continuación se explicará los test afectivos más importante; enfatizando en
las escalas de actitud.
La Actitud(1)
La Definición de Actitud
La actitud ha sido estudiada por diferentes disciplinas. En 1918 Thomas y

Znanieki, citado por Triandi (1974), definen la psicología como el estudio científico
de las actitudes. Actualmente hay consenso que la psicología social, además de las
actitudes, comprende otros tópicos; pero es importante esta reseña de Thomas y
Znanieki, porque ciertamente para su época el campo de la psicología social era
exclusivamente el estudio de las actitudes.
66
Actualmente las actitudes son abordadas no solamente por la psicología, sino
por otras disciplinas como la sociología, antropología cultural y educación. La actitud
es un tema que despierta gran interés a los investigadores educacionales, porque a
través de ésta se puede predecir el comportamiento y la conducta de agentes
educativos, como docentes, representantes y alumnos.
La actitud ha sido definida de muchas maneras. Sólo Gordon Allport, citado por
Rodrigues (1990), “compiló más de 100 definiciones de actitud...” (p. 265).
Thurstone (1928), pionero de la construcción de escalas de actitud, define la actitud
como la predisposición de una persona a expresar sus sentimientos. En esta definición
de Thurstone sólo está presente la parte afectiva de la actitud. Actualmente hay
acuerdo que la actitud es la predisposición manifestada por una persona hacia otra
persona u objeto, predisposición que puede ser a favor, en contra o simplemente no
manifestar ninguna predisposición.
(1) Esta sección se tomó de Suárez (1.999).
Donde no hay acuerdo es sobre los componentes de la actitud. Hay autores que
consideran la actitud compuesta por tres componentes: el cognoscitivo (creencias,
percepciones e ideas acerca del objeto de actitud), afectivo (sentimientos de agrado o
desagrado hacia el objeto de actitud) y el conductual (intenciones conductuales o
tendencia a la acción). Otros autores consideran que la actitud, al igual como la
consideró Thurstone, está compuesta solamente por lo afectivo. Stahlberg y Frey
(1990) analizan la controversia sobre la estructura de la actitud. Al respecto expresan
lo siguiente:
...algunos autores conceptualizan las actitudes como si estuvieran
integradas por componentes afectivos, cognitivos y conductuales (entre
ellos Rosenberg y Hovland, 1960). Sin embargo, la mayor parte de la
67
investigación sobre actitudes y conducta ha reducido las actitudes a su
componente afectivo. Esta restricción del concepto de actitud ha estado
motivada económicamente porque las afirmaciones evaluativas se miden
fácilmente, por ejemplo, a través de una escala de Likert. También, en los
casos donde el componente afectivo proporciona un excelente resumen de
la actitud compleja total (por ejemplo, cuando los componentes cognitivo
y afectivos son recíprocamente consistentes), las medidas de sólo el
componente afectivo pueden ser buenos predictores de la conducta. Pero
algunas veces los componentes cognitivo y afectivo pueden ser
inconsistentes... (p. 165)
Más adelante, Stahlberg y Frey citan investigaciones sobre la actitud, donde se

evidencia la inconveniencia de tomar en cuenta sólo lo afectivo para indagar la
actitud:
Los hallazgos de Bagozzi y Burnkrant (1979) señalan igualmente que las
reacciones afectivas hacia un objeto de actitud no siempre representan el
contenido cognitivo completo concerniente al objeto de actitud. Una
simple y única respuesta afectiva no siempre puede representar
adecuadamente el universo de creencias relacionadas con determinado
objeto de actitud. Si éste fuese el caso, por ejemplo, porque la actitud es
muy compleja y diferenciada, se puede asumir que la conducta podrá
predecirse mejor cuando se considere, además de la respuesta actitudinal
afectiva, el sistema complejo de creencias de una persona relativas al
objeto de actitud (componente cognitivo). Es decir, es mejor tener en
cuenta la estructura total de una actitud” (p. 166)
Estructura de las Actitudes
A continuación se analizan por separado los tres componentes de las actitudes.
1. Componente cognoscitivo: Se refiere a las creencias o percepción que un

individuo tiene sobre un objeto. Lo cognoscitivo en la actitud no es la realidad de
hecho; es decir, no es aquello que existe sin discusión, por ejemplo, el conocimiento
que se tiene del color del objeto u otra cualidad de éste que existe
independientemente de las percepciones e impresiones no determina las actitudes. El
componente cognoscitivo es indispensable para que existen actitudes, sin
68
conocimiento del objeto una persona no puede poseer una actitud hacia éste. Si un
docente no tiene conocimiento del Nuevo Diseño Curricular, obviamente que su
actitud hacia el mismo no será ni favorable ni desfavorable. Es necesario para
formarse una actitud, tener conocimiento del objeto que sirve de estímulo.
2. Componente afectivo: Este componente está representado por las emociones,

sentimientos y motivaciones que el sujeto manifiesta hacia el objeto de estímulo. La
mayoría de los autores de temas sobre actitud, coinciden que lo afectivo es el
componente más importante de la actitud. Se mencionó en el punto anterior, que
Thurstone (1928) definía la actitud como el estudio de los sentimientos y emociones.
La importancia de lo afectivo en la formación de actitudes se evidencia cuando el
sujeto cambia sus sentimientos hacia un objeto, por ejemplo, de amor a odio o
viceversa, el componente cognoscitivo y el conductual generalmente también
cambian. Es por esta razón que un docente que se siente mal o bien aplicando el
Nuevo Diseño Curricular, sus componentes cognoscitivo y conductual tenderán a la
congruencia con lo afectivo. Fundamentándose en este supuesto los investigadores
que propugnan un cambio de actitud, tratan de inducir cambios en algún componente
de los tres, siendo generalmente en el afectivo o cognoscitivo, para generar
incongruencia entre los componentes y a través de los cambios introducidos lograr
una nueva congruencia, acorde con los cambios introducidos.
3. Componente conductual: Es la predisposición a actuar, es decir, cómo se

comportaría el sujeto cuando le corresponda actuar frente al objeto de estímulo. Un
ejemplo relacionado con la presente investigación es la disposición o no del docente
de aplicar el Nuevo Diseño Curricular o algunas de sus dimensiones e indicadores
específicos. Este componente tiene un papel significativo en la predicción de la
conducta, porque la predisposición a actuar probablemente conduce a
manifestaciones conductuales. Claro está que en la predicción de la conducta influyen
generalmente otras actitudes y otros constructos psicológicos como la motivación, la
personalidad, el ambiente y por supuesto la interacción social.
69
Formación de la Actitud
La actitud surge de la interacción que los individuos realizan en una sociedad.

Desde niño el individuo está sometido a prácticas socializadoras que influyen en la
formación de actitudes. En ese proceso socializador una persona debe tomar
decisiones, las cuales son producto de las actitudes asumidas durante su aprendizaje.
Su experiencia anterior y la que vive en el momento son las bases determinantes en el
proceso de formación de actitudes.
Marín (1990) menciona dos factores sociales que continuamente influyen sobre
las actitudes:
1. La experiencia directa que el individuo tiene con el objeto de la actitud.
Cuando una persona tiene un contacto por primera vez con un objeto, se creará una
actitud hacia éste o se modificarán sus actitudes anteriores sobre el objeto. Un
docente pudo tener una determinada actitud cuando fue capacitado sobre evaluación
de los aprendizajes; pero cuando comenzó a aplicarlo, su actitud ha podido cambiar.
La actitud tiene cambios continuos, si el sujeto es sometido a diferentes estímulos.
2. El otro factor mencionado por Marín que influye sobre las actitudes, es el
efecto de la comunicación en general. Constantemente una persona está expuesta a
los medios de comunicación; como la televisión, radio y medios impresos. Asimismo
lee libros, asiste a conferencias, talleres y reuniones, donde se emiten mensajes; los
cuales influyen en las actitudes que posee una persona. De las formas de
comunicación, son los medios audiovisuales e impresos los que más influencia
ejercen en las personas. Estos son determinantes en la formación de actitudes. Es
frecuente el caso de un director de programa, autor de una columna o de un periódico,
con alto grado de credibilidad, que predispone a una persona hacia un objeto o
persona donde la actitud que se tiene es en correspondencia con las ideas emitidas por
el director o autor del programa comunicacional.
70
Medición de Actitudes
Para Summers (1976) medir es “...asignar número a observaciones. Y

cualquiera que sea el fenómeno que se observe, esta afirmación sigue siendo cierta”
(p. 13). En la medición de cualquier objeto se debe ser cuidadoso, porque según
Nunnally y Bernstein (1995), no se mide el objeto en sí, sino los atributos que éste
posee, por ejemplo, si es una mesa nuestro objeto, la atención de la medición debe
estar en sus atributos, es decir, en la altura y anchura que son sus dimensiones. De
esta manera similar ocurre, cuando se trata de una persona, no se mide ésta
directamente, sino sus atributos, en los cuales, cuando son físicos como su estatura,
edad, sexo, no es un proceso complejo; pero cuando los atributos a medir son
constructos psicológicos, es una tarea compleja. Al respecto Summers (1976) expresa
lo siguiente:
Si el fenómeno (a medir) es la actitud, el proceso de medir se hace más
complejo porque las actitudes no pueden observarse directamente, sino
que necesitan inferirse de la conducta. Hay por supuesto muchas otras
variables familiares al psicólogo social que son inaccesibles a la
observación directa; la inteligencia, rasgos de personalidad, valores y
motivos son sólo unas cuantas de esas variables que tienen igual cualidad.
(p. 13)
Tomando en cuenta la complejidad para medir actitudes, el autor propone tres

(3) sub-procesos que deben tomarse en cuenta, siendo los siguientes:
1. Identificación de muestras conductuales que se aceptan como base para hacer
inferencias acerca de la actitud; allí identifica cinco bases de inferencia de la actitud,
ellas son: (a) informes de uno mismo sobre creencias, sentimientos y conductas, (b)
observación de conductas manifiestas, (c) reacción a estímulos particularmente
estructurados o interpretación de ellos, cuando implican al objeto de la actitud, (d)
realización de tareas objetivas donde intervenga el objeto de la actitud, y (e)
reacciones fisiológicas al objeto de la actitud o las representaciones de él.
Para este investigador ninguna de estas bases son completamente fiables, por
esta razón recomienda en el momento de escoger una de ellas para medir la actitud,
correlacionarla con otra y así obtener la validez convergente. De estas bases, los
71
informes acerca de sí mismo son los de mayor uso, incluyéndose dentro de ellas las
escalas de actitud, donde se destaca la escala de Likert, por su amplio uso en la
actualidad.
2. Recolección de muestras conductuales:
Este investigador propone cuatro procedimientos posibles para recolectar
muestras conductuales:
Aplicación colectiva-descripción del sujeto: En este procedimiento el
investigador reúne colectivamente una muestra de sujetos y ellos mismos responden
los items del cuestionario aplicado. Este procedimiento es muy popular, debido a la
facilidad de aplicación.
Aplicación en grupo-descripción del investigador: Es de difícil aplicación
cuando deben registrarse las respuestas en forma simultánea por el investigador
Aplicación individual-descripción del sujeto: Este procedimiento se utiliza
cuando el sujeto está muy distanciado geográficamente y es muy costoso entrevistarlo
personalmente, entonces se usa el correo. El sujeto investigado contesta el
cuestionario, el cual se aplica individualmente.
Aplicación individual-descripción del investigador: Se usa ampliamente y
consiste en un encuentro cara a cara (sujeto e investigador), donde este último hace
preguntas y registra sus respuestas.
3. Tratamiento de muestras conductuales:
Afirma este autor que la escala de números “es un tratamiento adecuado que
permite determinar las dimensiones del conjunto” (p. 24), porque la misma tiene
muchas propiedades, entre ellas, la realización de las cuatro operaciones
fundamentales: suma, sustracción, multiplicación y división. Para Summers la escala
de números tiene las cuatro escalas de medición: nominal, ordinal, intervalo y razón.
Al respecto expresa lo siguiente:
Se supone generalmente que la actitud, como concepto, tiene todas las
propiedades de escala de números. Primero, porque la actitud se considera
como una variable continua, se pueden identificar puntos nominalmente
diferentes a lo largo de su continuo... cuando se considera el continuo
como extendiéndose desde del extremo “positivo” hasta el extremo
“negativo” con respecto al objeto actitudinal, cualesquiera dos puntos en
72
él nominalmente distintos diferirán en cantidad de “positividad” (o
“negatividad”). Por lo tanto, la actitud tiene una propiedad ordinal. En
seguida, es posible localizar en el continuo de actitud puntos que sean
equidistantes en significado psicológico (positividad o negatividad);
consecuentemente, la actitud tiene una propiedad intervalar. Finalmente,
los teóricos de las actitudes suponen ordinariamente que es posible
localizar puntos que mantengan legalmente la igualdad de razones. Esto
es equivalente a decir que el Punto A, en la dimensión de actitud, es dos
veces más positivo que el Punto B. Dado un isomorfismo entre las
propiedades del concepto y las de la escala numérica, cualquier limitación
en la aplicación de la escala en la investigación de la actitud debe
descansar en las propiedades de la muestra. (p. 25)
Es importante considerar la afirmación de Summers, cuando sostiene que el

hecho de ser una escala de actitud, no le confiere las cuatro escalas de medición.
Todas las escalas de actitud tienen la propiedad nominal, la mayoría la ordinal e
intervalar y sólo pocas las de razón. Para que una escala de actitud tenga las cuatro
escalas de medición se requiere un isomorfismo entre las propiedades de escala de
números y la actitud, dependiendo el mismo de la muestra conductual. Summers
advierte que no debe considerarse una muestra en una escala más allá de lo ordinal,
cuando no reúne las condiciones, porque "si así se hiciera conduciría a interpretar
erróneamente las puntuaciones numéricas" (p. 26)
La medición de actitudes debe realizarse en un ambiente donde el sujeto sea
libre de manifestar su predisposición hacia el objeto, porque de lo contrario, los
resultados de la investigación serán errados. Al respecto Thurstone (1928), expresa lo
siguiente:
Supondremos que la escala de actitud se utiliza sólo en aquellas
situaciones donde es razonable esperar que la gente diga la verdad acerca
de sus convicciones u opiniones. Si una escuela subvencionada por una
congregación religiosa aplicara a sus alumnos una escala de actitud en
relación con la Iglesia, mal podría esperarse que los alumnos inteligentes
expresaran sus verdaderas convicciones si estas no coincidieran con las
creencias ortodoxas. Los hallazgos podrían cuestionarse si se diera el caso
de que las actitudes se expresan en una situación que entrañara presiones
o contuviera amenazas implícitas que pudieran gravitar de manera directa
en la actitud a medir (...) se supone que las escalas de actitud se
emplearán sólo en aquellas situaciones donde la presión sobre la actitud
sea mínima. Tales situaciones son bastante corrientes. (p. 267)
73
Métodos para medir actitudes
A continuación se desarrollarán los principales métodos para medir actitudes,

en las cuales las escala numéricas ocupan un lugar predominante.
La Escala de Actitud de Thurstone (1928)
Louis Thurstone es considerado el pionero en la medición de actitudes. Fue él

quien en 1928 desarrolló su método para medir la actitud mediante la construcción de
tres escalas: pacifismo-militarismo, prohibición y actitud hacia la Iglesia. A través de
la construcción de estas tres escalas, este investigador comprueba la validez y
confiabilidad de su método, el cual requiere el siguiente procedimiento:
...se solicita a varios grupos que expresen por escrito sus opiniones sobre
el tema en cuestión y se selecciona del material recogido aquellos
enunciados, breves y adecuados, que pueden servir a los objetivos de la
escala. La elaboración de este material permite confeccionar una lista de
100 a 150 enunciados que expresan actitudes que cubren, en lo posible,
todas las graduaciones de un extremo al otro de la escala. A veces es
necesario dedicarles atención especial a los enunciados neutros. Si una
recolección al azar de enunciados de opinión no permite extraer
enunciados neutros, existe el riesgo de que la escala se quiebre en dos
partes. Hasta donde un reconocimiento preliminar nos permite ver,
debemos cubrir bastante bien la gama total de actitudes con el fin de
asegurarnos de que haya superposición en el orden jerárquico de los
distintos lectores a lo largo de toda la escala... (p. 278)
Más adelante continúa la explicación de su método para medir actitudes que

como se puede observar es muy laborioso, agregando lo siguiente:
Cuando se haya confeccionado la lista original.. habrá quizás unos 80 a
100 enunciados que realmente pueden ubicarse en la escala. Estos
enunciados se mimeografían en pequeñas tarjetas, con un enunciado en
cada tarjeta, se solicita a doscientos o trescientos sujetos (jueces
imparciales para Thursrtone) que ordenen los enunciados en once pilas de
manera que cubran desde las opiniones más intensamente positivas hasta
las más intensamente negativas. Las instrucciones detalladas se
publicarán junto con la descripción de las escalas. La tarea consiste
fundamentalmente en distribuir las tarjetas en las once pilas de manera
74
que aparezcan regularmente espaciadas o graduadas... Para cada
enunciado, el lector (Juez) debe decir cuál de cinco grados subjetivos de
afirmación o de negación implica el mismo, o si se trata de una opinión
neutral (p.p. 279-280)
Después que los “jueces neutrales” asignen puntuaciones a los once grados
(cinco positivos, uno neutro y cinco negativos), el paso siguiente es calcular el valor
que tendrá cada grado, de acuerdo a los resultados obtenidos por la valoración de los
jueces. Se observa que aplicar una escala de actitud a través del método de Thurstone
es complicado. Al respecto Aiken (1996) expresa lo siguiente:
A pesar de la alta confiabilidad de los instrumentos que se elaboran por
medio de intervalos aparentemente iguales (Escala de Thurstone), el
procedimiento ha sido objeto de críticas por: 1) la gran cantidad de
trabajo que se requiere en la elaboración de una escala de actitud; 2) la
falta de unicidad en la calificación y 3) los efectos de las propias actitudes
de los jueces sobre los valores en la escala de las afirmaciones (Selltiz,
Wrightsman y Cook, 1976). Si tomamos en cuenta la disponibilidad de
nuevas técnicas que ahorran tiempo, el primer motivo de crítica no es
grave. El segundo motivo se refiere al hecho de que la misma
calificación, que es simplemente el valor mediano de las afirmaciones
revisadas, puede observarse al verificarse diferentes afirmaciones. El
tercer motivo de crítica, se refiere al hecho de que no todos somos
capaces de representar el papel de juez neutral. No obstante, Bruwold
(1975) llegó a la conclusión de que la instrucción cuidadosa de los jueces
reduce los prejuicios a un nivel que no distorsionan de manera importante
las propiedades de intervalos iguales en estas escalas. (p. 232)
Las críticas formuladas a la Escala de Thurstone que evidencian las numerosas

dificultades en su aplicación, ha originado que la misma actualmente no se use, a
pesar de comprobarse su validez y confiabilidad. Sin embargo, es importante
mencionar que esta escala tiene el mérito de ser la pionera en la medición de
actitudes, a través de un método confiable y válido, siendo una referencia en la
elaboración de escalas de actitud que surgieron posteriormente, por ejemplo, la escala
de Likert se fundamentó en esta escala para probar la validación de la misma. Fue
Thurstone el teórico en quien Likert se apoya para comprobar su método,
reconociendo el mismo Likert, el aporte de Thurstone en el desarrollo de su escala de
actitud.
75
Escalograma de Guttman (1944)
Louis Guttman en el año 1944 elaborò una escala de actitud, conocida como el
Escalograma de Guttman, porque es una escala de intensidad, donde si un sujeto
respalda un reactivo de mayor intensidad, debe respaldar también todos aquellos de
menor intensidad, por ejemplo, si una mujer blanca afirma que está dispuesta a
casarse con un hombre negro, entonces debe aceptar reactivos de menor intensidad
como asistir a un restaurante donde permiten la entrada de negros o manifestar su
aceptación con las inmigraciones de negros al país donde vive.
El objetivo de Guttman fue crear una escala ordinal acumulativa, probando
antes de la aplicación definitiva, los grados de intensidad de los reactivos. Guttman
planteó la unidimensionalidadd de la variable, es decir, la medición de una dimensión
única. Para la elaboración de su escala se apoyó en Bogardes quien en 1925 creó una
escala de distancia social de distintos grupos sociales, entre ellos religiosos y raciales.
El Diferencial Semántico (1957)
El método conocido como Diferencial Semántico fue creado por Charles E.

Osgood, G. J. Suci y P. H. Tannenbaum en el año 1957. Esta escala de actitud consiste
en la creación de dos adjetivos extremos o bipolares (bueno-malo; justo-injusto;
bonito-feo; activo-pasivo; favorable-desfavorable; agradable-desagradable), sobre los
cuales el sujeto a quien se trata de medir la actitud, expresa el grado de acercamiento
a uno de ellos. La escala gráficamente se representa de la forma siguiente:
Bueno: ______,______,______,______,______,______,______, Malo
Hay la posibilidad de seleccionar tres opciones relacionadas con cada uno de
los adjetivos: las tres de la izquierda relacionadas con el adjetivo bueno y las tres de
la derecha con el adjetivo malo; y la del centro, la cuatro, expresa una actitud neutral
del sujeto. La marca más cercana al adjetivo representa una relación muy estrecha
con el objeto estímulo de la actitud, la segunda marca de uno u otro extremo,
76
representa una relación estrecha y la tercera marca, representa una relación
medianamente.
La Escala de Likert (1932)
La escala de actitud tipo Likert, es la más popular de los métodos para medir
actitudes. Fue creada por Rensis Likert en 1932. Para validar su escala Likert
compara los resultados de los mismos instrumentos aplicados por Thurstone (1928)
para probar su técnica y concluye que existe una alta correlación entre el método que
él creó y el aplicado por Thurstone. Esto prueba la validez y confiabilidad de la
Escala de Likert, la cual es mucho más sencilla de aplicar que la escala de Thurstone.
Likert (1932) al realizar comparaciones entre ambos métodos expresa:
...con la presente escala de internacionalismo, con 24 ítems, se obtiene la
misma confiabilidad que combinando ambas formas de la escala de
Thurstone, con un total de 44 ítems. Por ende, usando el método que
describimos aquí se asegura una medida de la actitud de una persona que
es tan confiable como la obtenida por el método de Thurstone y que sólo
requiere que la persona reaccione aproximadamente a la mitad de los
ítems... (p. 236)
Además de la menor cantidad de ítems, Likert demostró que se podía obtener los
puntajes de un sujeto con solo sumar los valores de los ítems, usando una escala de
respuestas entre 1 y 5 (en algunos casos usó escalas entre 1 y 3 y entre 1 y 7
alternativas de respuestas). Este método, actualmente vigente, exige que las
alternativas de respuestas sean las mismas para todos los ítems. Debido al proceso de
sumatoria de ítems, se conoce como el método de rangos sumatorizados.
Sampieri y otros autores (1991) menciona las categorías de respuestas más
frecuentemente usadas para la construcción de escalas de actitud tipo Likert. Ellas son
las siguientes:
1) Muy de acuerdo De acuerdo Ni de acuerdo ni en En desacuerdo Muy en

desacuerdo desacuerdo
2) Totalmente de De acuerdo Neutral En desacuerdo Totalmente en

acuerdo desacuerdo
77
3) Definitivamente si Probablemente si Indeciso Probablemente no Definitivamente
no
4) Completamente Verdadero Ni falso ni Falso Completamente

verdadero verdadero falso
Gráfico 2. Alternativas o puntos en las escalas Likert.

Nota: Tomado de Metodología de la Investigación 1991 (p. 264) de R. Hernández Sampieri, C.
Fernández Coello y P. Baptista Lucio.
En los ejemplos de alternativas de respuestas ilustrados, todos ellos son de

cinco alternativas. Es importante aclarar que una escala Likert también puede ser de
tres o siete alternativas, dependiendo de la capacidad de discriminación del sujeto a
quien se le aplica la escala. En la medida que el sujeto tenga más capacidad de
discriminación se puede incrementar el número de alternativas.
Otro elemento importante de tomar en cuenta cuando se construye una escala de
este tipo, es el puntaje que se asigna a la alternativa de respuesta. Siempre la actitud
más favorable debe asignársele al mayor puntaje y a la menos favorable el puntaje
menor. Si ésta califica positivamente al objeto, la actitud de máxima puntuación debe
ser muy de acuerdo. Si lo califica negativamente, entonces la alternativa más
favorable es muy en desacuerdo. Este requisito es indispensable de cumplir, porque
de lo contrario se obtendrían resultados erróneos. Es preocupante el uso inadecuado
de puntuaciones o resultados de escala de actitud tipo Likert en algunas trabajos de
grado, lo cual conduce a resultados y conclusiones que no se corresponden con la
realidad.
Otro aspecto que debe considerarse es sobre la puntuación de la alternativa
neutro o indeciso. Esta siempre debe tener una puntuación intermedia entre las
alternativas favorables y desfavorables. No es correcto asignarle cero a esta categoría
y a partir del uno considerar la alternativa más desfavorable. Sólo se considera
correcta la asignación de cero a esta categoría, si las alternativas desfavorables son
negativas y las favorables positivas; porque la categoría neutro o indeciso se debe
situar en el centro. Esta observación es pertinente, porque se observan trabajos donde
el puntaje de la alternativa neutro o indeciso se usa incorrectamente.
78
A continuación se presentan algunos criterios para la construcción de escalas de
Likert, formulados por Edwars, los cuales fueron tomados por Triandis (1974):
(a)...Evitar declaraciones que se refieren al pasado más bien que al
presente; (b) Evitar declaraciones que sean positivas o puedan presentarse
como tales; (c) Evitar declaraciones que pueden interpretarse de más de
una manera; (d) Evitar las declaraciones que carezcan de interés respecto
al objeto psicológico en estudio; (e) Evitar las declaraciones que pueden
ser apoyadas por casi todos o por nadie; (f) Seleccionar declaraciones que
se crea abarcan todo el campo de la escala afectiva de interés; (g)
Mantener el lenguaje de las declaraciones sencillo, claro y directo; (h) Las
declaraciones deben ser cortas, pasando rara vez de las 20 palabras; (i)
Cada declaración debe contener solamente un pensamiento completo; (j)
Evitar los conceptos universales, como todos, siempre, ninguna, nunca;
(k) Las palabras tales como solamente, justamente, simplemente... deben
utilizarse con cuidado y moderación, en la escritura de las declaraciones;
(l) Siempre que sea posible, las declaraciones deben ser en forma de frase
sencilla, más bien que frases compuestas o complejas; (m) Evitar el uso
de palabras que puedan no ser comprendidas; y (n) Evitar el uso de
negativos dobles... (p. 38)
Además de los criterios establecidos por Edwars, a continuación se mencionan

otros que es común encontrarlos en la literatura disponible sobre construcción de
escalas de actitud tipo Likert: (a) Los ítems deben ser representativos de la totalidad
del atributo que se quiere medir. No pueden excluirse del cuestionario dimensiones e
indicadores que califican la actitud hacia el objeto a investigar, (b) Debe medirse la
actitud hacia un único objeto. Si un cuestionario tiene ítems que miden a más de un
objeto, la calificación de cada uno de ellos debe ser por separado, (c) Todos los ítems
deben tener igual puntaje y el mismo número de alternativas de respuestas, (d) La
versión inicial del instrumento debe tener entre 2 ó 5 veces más ítems que la versión
final, para permitirle a los expertos que realizan la validez de contenido; más
flexibilidad en excluir ítems del cuestionario y poder asimismo suprimir aquellos
ítems sin capacidad de discriminación. La inclusión de un número mayor de ítems en
la versión inicial del instrumento evita tener que formular nuevos ítems, si los
excluidos son considerables, lo cual implica realizar de nuevo validez de contenido y
la prueba piloto para conocer la discriminación de ítems, (e) Deben incluirse una
cantidad par de ítems y formular la mitad de los enunciados en sentido favorable
79
hacia el objeto y la otra mitad en sentido desfavorable, (f) En la formulación de los
enunciados debe considerarse los tres componentes de la actitud: el cognoscitivo,
afectivo y conductual. Tomar en cuenta esta exigencia es indispensable, porque la
actitud està compuesta por esos tres componentes. Al excluir uno de ellos, no se
estudiará la actitud en forma completa, sino que se delimitaría sólo al componente
tomado en cuenta, (g) Los ítems que conforman el instrumento no deben colocarse en
un orden preestablecido, sino que debe implementarse un procedimiento aleatorio
para garantizar la aleatoriedad en la colocación de los mismos.
Asimismo, el instrumento debe someterse al análisis de validez; el cual puede
ser validez de contenido, de criterio (predictiva y concurrente) y de constructo
(validez convergente y divergente). El tipo de validez comúnmente aplicado es la
validez de contenido a través del juicio de expertos. Sin embargo, este tipo de validez
no es suficiente, por lo que es recomendable en lo posible someter al instrumento a
otro tipo de validez. Por último, es importante mencionar que antes de la aplicación
definitiva del instrumento, debe realizarse una prueba piloto, lo cual permitirá: (a)
realizar el análisis de discriminación de los ítems, (b) realizar el análisis de validez de
criterio y de constructo, y (c) análisis de confiabilidad del instrumento, el cual se
puede realizar a través de reaplicación de la prueba, aplicación de pruebas
equivalentes y la consistencia interna del instrumento.
Otros Métodos yTécnicas para la Medición de Actitudes
Summers (1976) analiza otros instrumentos para la medición de actitudes

diferentes a las escalas de números. A continuación se mencionan esos instrumentos:
1. Observación de la conducta manifiesta: Allí expresa que la observación
directa de la conducta manifiesta del individuo para analizar sus actitudes, no
representa menos sesgo que la escala de número, aunque reconoce a este instrumento
como el ideal para recoger muestras conductuales de un individuo. En consideración
al alto sesgo que presenta, Summers recomienda utilizarlo en combinación con las
escalas de números, a las cuales puede servir en obtener la validez convergente.
80
2. Reacción de estímulos estructurados parcialmente: Esta técnica es similar a
las técnicas de informe de sí mismo (donde se incluyen las escalas de números), pero
tiene las siguientes características que lo diferencian de los informes de sí mismo: (a)
la intención es encubierta, porque se oculta al sujeto el verdadero objetivo del
instrumento, (b) “hace creer al sujeto que no hay respuestas correctas e incorrectas,
pues cualquier respuesta es aceptable”, y (c) el formato del instrumento es de
respuestas libres donde el sujeto debe elaborar las respuestas sin ayuda del
investigador.
3. Reacciones fisiológicas: “La técnica de reacciones fisiológicas descansa en
las teorías del aprendizaje. La mayoría de las respuestas son susceptibles de
condicionamiento” (p. 23). Summers expresa, tomado de Cook y Selltiz que “la
mayoría de las medidas de reacción fisiológicas indican solamente el grado de
activación y no la dirección del sentimiento” (p. 23)
4. Tareas dirigidas: En estas técnicas se instruye al sujeto para que realice
determinadas tareas y se le hace creer que se le está examinando por ejemplo sus
aptitudes; pero en realidad lo que persigue el investigador es escudriñar sus
reacciones ante determinadas situaciones. Esta técnica, como la de reacción de
estímulo estructural parcialmente, fundamenta su éxito en el engaño al sujeto a quien
se pretende medir su actitud.
Las objeciones a estos instrumentos para medir actitudes, favorece el uso de los
informes sobre sí mismo, los cuales se implementan a través de las escalas de
números, concluyéndose que los mismos pueden complementar el uso de los
informes de sí mismo, sobre todo cuando se analiza la validez convergente del
instrumento.
Diferencias entre Actitud, Intereses, Valores, Opiniones y Motivaciones
Se considera importante distinguir la actitud de los conceptos: intereses, valores

y opiniones; los cuales usualmente se usan indistintamente. Mientras actitud, como
fue definido, es la predisposición de una persona hacia un objeto o hacia otra persona,
81
los intereses según Aiken (1996) “...es un sentimiento o preferencia respecto de las
actividades propias...” (p.p. 230-231), los valores son “...la utilidad, importancia que
se da a las actividades u objetos particulares...” (p. 236) y las opiniones son definidas
por Aiken como “...una reacción específica ante ciertos sucesos o situaciones (...) son
similares a las creencias, en el hecho de que ambos son juicios o aceptaciones...” (p.
231). La motivación es la razón por la cual un organismo o persona realiza una
acción, la cual puede ser conciente o inconscientes A pesar de la interacción existente
entre estos conceptos, se observan las especificidades de cada uno, lo cual los
diferencia entre sí.
1. Establezca la diferencia entre actitud, intereses, valores, opiniones y

motivación.
2. Analice las escalas de actitud que se presentan en este punto, respondiendo
los aspectos siguientes
2.1 Determine si los ítemes de los instrumentos presentados cumplen con los
criterios requeridos para la construcción de escalas de actitud. Razone su respuesta.
2.2 Si considera que alguno de los ítemes del instrumento no están
correctamente enunciados, redáctelos correctamente.
82
2.3 Diga a qué componente de la actitud pertenece cada ítem (Componente
Cognoscitivo, Afectivo o Conductual).
2.4 Apliquen entre los participantes de este curso el instrumento que están
analizando y calculen la actitud total promedio/sujeto
Procedimiento para calcular la actitud total promedio del grupo: Sume el valor
total de la actitud de todos los sujetos y divídalo entre el número de sujetos.
2.5 Determine la actitud promedio del grupo.
Procedimiento para calcular la actitud promedio del grupo: Divide la actitud
total promedio del grupo entre el número de ítemes (redondear al entero más
próximo)
Posibles resultados:
Que la actitud sea:
(1) Muy desfavorable
(2) Desfavorable
(3) Indeciso
(4) Favorable
(5) Muy favorable
A continuación se presentas las escalas de actitud que usted debe analizar

considerando los puntos mencionados.
Actitud de los Estudiantes de Postgrado de la UPEL-IPB hacia

la Prevención del Cáncer
N° Itemes
1 El Cáncer es curable si se diagnostica a tiempo.
5. Totalmente de acuerdo ____ 4. De acuerdo ____ 3. Indeciso:__
2. En desacuerdo ____ 1. Totalmente en Desacuerdo __
2 No creo que la bebida y el tabaco influyan en enfermedades cancerígenas.

5. Totalmente de acuerdo ____ 4. De acuerdo ____ 3. Indeciso ____
2. En desacuerdo ____ 1. Totalmente en Desacuerdo ____
83
N° Itemes
3 Con el cáncer no hay prevención que valga.
4 Los hábitos de vida influyen en las enfermedades cancerígenas.

4. En desacuerdo ___ 5. Totalmente en Desacuerdo __

5 Todos debemos luchar contra el cáncer.
2. En desacuerdo ___ 1. Totalmente en Desacuerdo __
84
Actitud del Docente de la Primera Etapa de Educación Básica hacia la
Evaluación
N° Itemes
1 Según el Currículo Básico Nacional (CBN) la evaluación cualitativa es el
mejor procedimiento de evaluación del alumno en la I etapa de Educación
Básica.
2. En desacuerdo ____ 1. Totalmente en Desacuerdo __

2 Me enredo cuando evalúo cualitativamente a mis alumnos.

3 Los mejores instrumentos para evaluar al alumno de la I etapa de
Educación Básica son las pruebas objetivas.

4 Me gusta aplicar cuando evalúo a mis alumnos pruebas objetivas y
pruebas de ensayo.
2. En desacuerdo __ 1. Totalmente en Desacuerdo ____

5 Se inserta la evaluación de los aprendizajes de Educación Básica, dentro
del enfoque cualitativo etnográfico-naturalista que pretende hacer de la
escuela un lugar que valore y comprenda las consideraciones,
interpretaciones, intereses y aspiraciones de quienes actúan en el proceso
enseñanza-aprendizaje, a fin de ofrecer información pertinente y oportuna
a cada uno de los participantes. La metodología de la evaluación
cualitativa es comprensiva, global, de carácter descriptivo, narrativo.
5. Totalmente de acuerdo ___4. De acuerdo __ 3. Indeciso _
85
Actitud de los alumnos hacia la geografía
ïtem Enunciado
1 La geografía no es una materia interesante
1) Totalmente de acuerdo, 2). De acuerdo, 3). Indeciso
4) En desacuerdo, 5). Totalmente en desacuerdo
2 La Geografía es una materia valiosa y necesaria
3 Rara vez me gusta estudiar geografía
1)Totalmente de acuerdo, 2). De acuerdo, 3). Indeciso
4)En desacuerdo, 5). Totalmente en desacuerdo
4 Me interesa adquirir más conocimiento sobre geografía
4) En desacuerdo, 5). Totalmente en desacuerdo.
5 A mi, la geografía me hace sentir incómodo.
4) En desacuerdo, 5). Totalmente en desacuerdo.
6 No estoy dispuesto a leer más geografía después de cursar esta asignatura
7 La geografía no tiene importancia en la vida diaria
8 Cuando tengo que estudiar geografía me siento mal.
9 La geografía ha contribuido al desarrollo de la civilización
10 La geografía es una de las materia más fastidiosa

11 No estoy motivado para estudiar temas de geografía ni de matemática.
12 La geografía es una de las materias más importante que un alumno puede estudiar.
13 Nunca entiendo cuando estudio geografía
14 No me gusta mi profesor(a) de geografía.
86
ïtem Enunciado
15 Disfruto estudiando geografía
Actitud hacia la paz

Instrucciones:
Marca con una X si estás totalmente de acuerdo, si te es indiferente o si estás totalmente en
desacuerdo con cada una de las siguientes afirmaciones.
1) - Me preocupo por promover la tranquilidad mía y la de los demás.
Totalmente de acuerdo Indiferente Totalmente en desacuerdo
2) - Cuando alguien se porta mal conmigo, trato de reaccionar con calma y serenidad.
3) - Le doy la oportunidad a los demás de enmendar sus errores.
4) - Estoy dispuesto a perdonar porque esa es la única forma de superar los conflictos.
5) - La paz social requiere que los derechos de todos sean reconocidos
6) - Me enfurezco cuando alguien me contradice.
7) - Rompo relaciones con quien he tenido algún conflicto para evitar problemas mayores.
8) - Siento que no puedo contenerme cuando estoy de mal genio con alguien.
9) - Los conflictos graves únicamente pueden resolverse haciendo uso de la fuerza.
10) - La mejor forma de tener tranquilidad es evitar discutir con quienes tienen opiniones
diferentes.
87
Fuente: Cuestionario para reflexionar realizado por Cristina Villegas de Posada, Phd, profesora
titular. Departamento de Sicología Universidad de los Andes (Colombia). Con la colaboración de los
sicólogos : Javier Corredor, Carlina Maldonado, Lima Saldarriaga y Lauro Vega. Investigación; textos
y actividades: Constanza Orozco Vargas.
Comentarios sobre la escala de actitud hacia la paz. (*)
Si estuviste totalmente de acuerdo con las preguntas entre la 1 y la 5, y

totalmente en desacuerdo con la mayoría de las restantes, eres una persona que
contribuye a la paz en las relaciones interpersonales y que cree en la justicia para
lograr la paz social.
Si presentaste el patrón contrario, es decir, estuviste totalmente en desacuerdo

con las preguntas entre la 1 y la 5 y totalmente de acuerdo con la mayoría de las
restantes, debes tener en cuenta que los conflictos y las diferencias son partes de la
vida social y que la violencia no los soluciona. Ten presente que el respeto, el diálogo
y la búsqueda de soluciones negociadas son una buena manera de construir un mejor
país.
88
Referencias.
Suárez, J.A. (2.001) . Actitud del docente de la I etapa de Educación Básica hacia la
evaluación de acuerdo al currículo Básico Nacional. Trabajo de Grado de
Maestría no publicado, Universidad Pedagógico Experimental Libertador,
Instituto Pedagógico Luis Beltrán Prieto Figueroa, Barquisimeto.
Lecturas sugeridas
Suárez, J.A. (2.001) . Actitud del docente de la I etapa de Educación Básica hacia la
evaluación de acuerdo al currículo Básico Nacional. Trabajo de Grado de
Maestría no publicado, Universidad Pedagógico Experimental Libertador,
Instituto Pedagógico Luis Beltrán Prieto Figueroa, Barquisimeto. Se recomienda
del capítulo 2, Bases teórica; La actitud.
89
CAPÌTULO V
EL CUESTIONARIO Y LA ENTREVISTA
Objetivo
1. El estudiante será capaz de diseñar un cuestionario en consideración a los

criterios establecidos.
2. El estudiante será capaz de diseñar una guía de entrevista.
3. El estudiante será capaz de diferenciar un cuestionario de opinión de los test
afectivos, específicamente de las escalas de actitud.
El Cuestionario
Definición
Un cuestionario es un instrumento de recolección de datos, compuesto de un

listado de preguntas; cuyo propósito es medir o describir una variable. Su
especificidad está en que las preguntas son respondidas directamente por la persona a
quien se solicita la información, sin necesidad de que otra persona se las formule y
escriba la respuesta.
Tomando en cuenta esta definición; se considera un cuestionario una escala de
actitud, escala de motivación, un cuestionario de opinión, etc., si el instrumento es
autoadministrado, es decir, respondido directamente por el “encuestado”.
Tipos de Preguntas
Namakforoosh, M. (2001) divide las preguntas de un cuestionario en dos tipos:
90
Preguntas Basadas en Hechos
Son aquellas preguntas objetivas sobre las condiciones sociales, educativas,

personales o del entorno donde interactúa el respondiente del cuestionario. Ejemplo
de este tipo de preguntas es el sexo, la edad, nivel de ingreso, nivel académico, etc.
En este tipo de preguntas se responde no lo que el “encuestado” cree, sino lo que
realmente es.
Preguntas de Opinión
En este tipo de pregunta el “encuestado” emite su opinión acerca del tópico

sobre el cual se consulta. La respuesta no es objetiva, sino que es la creencia o
percepción que tiene el consultado sobre el tema a investigar. Este tipo de preguntas
son propias de los cuestionarios de opinión, los cuales se aplican para determinar la
variable necesidad de elaborar un plan o proyecto, diseñar un software o material
educativo, que corresponde a las modalidades de proyectos factibles y especiales,
incluidos en el Manual de Trabajos de Grado, de Especialización y Maestría y Tesis
Doctorales de la Universidad Pedagógica Experimental Libertador (UPEL).
Asimismo las escalas de actitud , motivación y otros constructos afectivos formulan
este tipo de preguntas.
Formas de Respuestas
La mayoría de los autores que publican libros sobre cuestionarios, señalan tres
formas de respuesta: las correspondientes a preguntas abiertas, cerradas y mixtas. Se
consideró necesario incluir una cuarta forma de respuesta abordada por autores como
Namakforoosh (2001) y Kerlinger (1998), quienes hablan de las escalas de
clasificación como una forma de pregunta. A continuación se explican cada una de
estas formas de respuestas:
91
Preguntas Cerradas
En estas preguntas, el “encuestado” responde de acuerdo a las alternativas de

respuesta que se le proporcionan. Ejemplo: ¿Participa usted en las actividades
recreativas que se desarrollan en la escuela donde estudian sus representados? :
5.-Siempre: ____ 4.- Casi siempre: ____ 3.- A veces: ____ 2.- Rara vez: ____ 1.-
Nunca: ____.
¿Tiene conocimiento que pedir contribuciones económicas para inscribir a su
representado está prohibido?: 1.- Si: ____ 2.- No: ____.
La primera de las preguntas es multicótoma, es decir, tiene más de dos
alternativas de respuestas y la segunda pregunta es dicotòmica, ya que sólo posee dos
alternativas de respuesta.
Preguntas Abiertas
En estas preguntas, el respondiente del cuestionario expresa su propia respuesta.

No hay alternativas de respuestas prefijadas. Ejemplo de esta forma de preguntas son
las siguientes: ¿Diga su edad?, ¿En cuáles actividades que se realizan en la escuela
donde usted es representante le gustaría participar?. Se observa que la formulación de
las preguntas puede ser de hechos como de opinión.
Preguntas Mixtas
Se dice que una pregunta es mixta, cuando tiene una pregunta cerrada y otra
abierta. Esta última se formula para profundizar en la primera parte de la pregunta, es
decir, en la pregunta cerrada. Ejemplo: ¿Participa usted en las actividades que se
realizan en el plantel donde estudian sus representados?:
92
5.- Siempre: ____ 4.- Casi siempre: ____ 3.- A veces: ____ 2.- Rara vez: ____
1.- Nunca: ____.Si responde “rara vez” ó “nunca”, preguntar ¿Por qué?:
____________________________________________________________________.
Los autores mencionados (Namakfoosh y Kerlinger) no incluyen las preguntas
mixtas dentro de las formas de pregunta, sin embrago hay muchos autores que las
consideran dentro de la clasificación de preguntas en los cuestionarios. De ahí que se
decidió incluirla como una de las formas de respuesta correspondiente a los
cuestionarios.
Escalas de Clasificación
Namakforoosh (2.001) expresa que las escalas de clasificación “…se usan

siempre que los entrevistados son interrogados acerca de su opinión en términos de
serie de categorías tales como muy de acuerdo, favorable, muy frecuente” (p. 176). Al
respecto, Kerlinger (1998) señala que “…una escala es un conjunto de reactivos
verbales ante los cuales un individuo responde expresando grados de acuerdo y
desacuerdo… Los reactivos de escala tienen alternativas fijas y colocan sobre algún
punto de la escala al individuo que responde…” (p. 502).
Un ejemplo es el siguiente: ¿Los estudios de postgrado le permiten a quienes
los realizan superarse profesionalmente?:
5.- Muy de acuerdo: ____ 4.- De acuerdo: ____ 3.- Ni de acuerdo ni en desacuerdo:
____ 2.- En desacuerdo: ____ 1.- Muy en desacuerdo: ____.
Cuando se formula un cuestionario solamente con este tipo de preguntas, hay
que ser muy cuidadoso en el momento de pretender realizar el análisis de
discriminación de los ítemes, y calcular la confiabilidad del instrumento, ya que para
realizar ambos tipos de análisis se requiere una escala de medición de la variable en
estudio como mínimo en ordinal. Si la escala de mediciòn de la variable no alcanza
una escala ordinal, sino que la misma sólo es medida en escala nominal, no es posible
realizar los análisis mencionados, aunque todas las preguntas tengan las mismas
alternativas de respuestas.
93
El análisis de discriminación y el cálculo del coeficiente de confiabilidad, como
se analizará en los capìtulos IX y X respectivamente, exigen clasificar los puntajes de
los sujetos en forma jerárquica, de aquél que obtuvo el mayor puntaje hasta el que
obtuvo el menor puntaje, procedimiento que no es adecuado realizarlo en variables en
escala de mediciòn ordinal.
Cuando se aborde la diferencia entre cuestionarios de opinión y escalas de
actitud, análisis de ítemes y confiabilidad se comentarà nuevamente este aspecto, ya
que es usual aplicar a cuestionarios de opinión, con preguntas en escala de
clasificación, el análisis de discriminación y confiabilidad.
Criterios para la Construcción de Cuestionarios
Los criterios más usuales que los expertos formulan para la elaboración de
cuestionarios son los siguientes:
1. Las preguntas deben ser lo más sencillas posibles, y más aún, si los
respondientes son personas de bajo nivel de instrucción.
2. Las preguntas no deben contener más de 25 palabras.
3. La pregunta debe contener una sola idea o sentencia lógica, porque cuando
una pregunta tiene más de una idea, el “encuestado” puede tener respuestas
diferentes para cada una de ellas.
4. Se debe evitar preguntas ambiguas que pueden ser respondidas de diferentes
maneras.
5. Se debe evitar preguntas con estereotipos, al menos que el propósito del
cuestionario sea determinarlos.
6. En las preguntas abiertas se debe dejar suficiente espacio para que el
respondiente pueda escribir la respuesta completa.
94
Pasos para la Construcción de un Cuestionario
En el gráfico 2 se visualiza el proceso que debe seguirse para la construcción de

un instrumento. A continuación se describe cada uno de los pasos:
1. La primera actividad cuando se construye un cuestionario, es revisar la
literatura existente sobre la variable que se desea medir o describir.
2. El segundo paso, tiene dos opciones: la primera adaptar un cuestionario ya
aplicado en otro estudio, y la segunda opción, diseñar un cuestionario para recoger
información sobre la variable en estudio.
3. El tercer paso es determinar los niveles de medición de la variable, es decir,
indicar si la variable está en una escala nominal, ordinal, de intervalo o de razón. Este
paso permitirá conocer a qué tipo de validación se puede someter el instrumento y los
estadísticos apropiados para la interpretación y análisis de los resultados del
instrumento.
4. Redactar las preguntas de acuerdo a los criterios para elaborar cuestionarios y
a la operacionalización de la variable. En esta fase, el diseñador del cuestionario
realiza la fase fundamental: redactar las preguntas que conformará el cuestionario.
Con este propósito debe operacionalizar la variable de acuerdo a las bases teóricas
que soportan la investigación a realizar.
5. Como quinto paso, se debe codificar las alternativas de respuestas, lo cual
permitirá un mejor manejo operativo cuando se vacíe la información recabada en una
base de datos.
6. Al realizar estas fases, se dispone de la versión preliminar del instrumento, la
cual debe someterse a los pasos siguientes:
7. Someter el instrumento a validez de contenido, a través de la técnica de
juicios de expertos para que estos validen el contenido del cuestionario.
8. El paso ocho, consiste en entrenar a los encuestadores y supervisores, si el
investigador no aplica directamente el cuestionario.
9. Se aplica una muestra piloto a sujetos que integran la población en estudio y
se corrigen aquellas preguntas que presentaron dificultad en responderlas.
95
Revisión de la literatura de cuestionarios que midan las mismas variables
que pretendemos medir en al investigaciòn
Evaluar la validez y la confiabilidad de esos cuestionarios anteriores
Adaptar un cuestionario Desarrollar un cuestionario

aplicado en otro estudio propio tomando en cuenta a
otros.
Determine los niveles de medición de preguntas
Operacionalización de la variable y redacción de las preguntas
Determinar la codificación de preguntas

cerradas.
Elaborar la primera versión del cuestionario
Someter el instrumento a validez de contenido (Juicio de Expertos)
Ajustar la primera versión
Entrenar encuestadores, si es que se requieren (o supervisores)
Aplicar la prueba piloto
Codificar las Elaborar la Decidir el

preguntas versión final del contexto en que
abiertas cuestionario se aplicará
Aplicación
definitiva del
cuestionario
Gráfico 2. Pasos para la construcción de cuestionarios.
10. Antes de obtener la versión definitiva del cuestionario, hay dos pasos: uno,
es la codificación de preguntas abiertas si se recoge en la muestra piloto la
información suficiente para cerrarlas, de lo contrario debe tratar de cerrarlas después
de aplicar la muestra definitiva. También en el caso de preguntas abiertas, se puede
96
realizar un proceso cualitativo, a través de la categorización de las respuestas. El otro
paso es decidir el contexto en el cual se aplicará el cuestionario para superar y estar
alerta ante posibles situaciones problemáticas que pudieran afectar la aplicación
definitiva del cuestionario.
11. Por último, está la aplicación definitiva del cuestionario, donde se recabará
la información requerida por la investigación en proceso.
Codificación de las Respuestas de un Cuestionario
El proceso de codificación consiste en asignar números a las alternativas de

respuestas, con la finalidad de diferenciar una alternativa de otra(s), y poder realizar a
través de este proceso el tratamiento estadístico adecuado. A continuación se presenta
un ejemplo de codificación de alternativas de respuestas:
Ejemplo de Codificación de un Cuestionario

Encuesta realizada por: Fecha: __ /__ /__
Número de la encuesta: ___________
Características del Docente
1. Nombre del Docente: _______
2. Plantel: Código: _______
3. Medio geográfico: 1. Urbano: ______ 2. Rural: _____
4. Municipio: Código:
5. Parroquia: Código:
6. Edad:
1. 18 a 23 años: _____
2. 24 a 29 años: _____
3. 30 a 39 años: _____
4. 40 a 49 años: _____
5. 50 a 59 años: _____
97
6. Mayor de 60 años: _____
7. Sexo: 1. Masculino: _____ 2. Femenino: _____
8. Nivel Profesional (marque solamente el último nivel alcanzado):
4. Profesor/Lic. en educación:_____
3. Tec. Sup. Educ.: _____
2. Maestro/Br. Doc.: _____
1. No graduado: _____
9. Años de Servicio como docente:____
1. Menos de 05 años:_____
2. 0 5 a 10 años: _____
3. 11 a 15 años: _____
4. 16 a 20 años: _____
5. Más de 20 años:_____
10. Marque con una (X) el grado que administra:

1. Primero (1°):_____
2. Segundo (2°):_____
3. Tercero (3°):_____
5. Varios (4º):_____
Nota: Tomado de Suárez, 2001
Todas las alternativas de respuestas de las diez (10) preguntas se codificaron,

incluyendo el nombre del docente y del plantel, colocándole al docente como código
el lugar que ocupó en la base de datos y al plantel una numeración seriada
(comenzando en 1). Al municipio se le asignó en esta encuesta un número
comprendido entre 1 al 9, de acuerdo a un orden alfabético, correspondiéndole al
municipio Andrés Eloy Blanco el 1, al municipio Crespo el 2, al municipio Iribarren
el 3 y así sucesivamente hasta el municipio Urdaneta que se le asignó el 9. La
parroquia se codificó con 3 números, correspondiéndole el primero al código del
municipio y los dos restantes al orden alfabético de la parroquia desde el número 01.
La edad es una variable en una escala de medición de razón; pero en este caso
particular se presenta en una escala ordinal de seis alternativas de respuesta. El sexo
con dos alternativas de respuesta está expresado en forma nominal. La profesión
corresponde a una escala ordinal, los años de servicio, al igual que la edad, se
98
transformó de una escala de razón, como realmente es, a una escala ordinal, por
último está, el grado que administra el docente, el cual se puede asumir en forma
ordinal, pero en este caso hay una alternativa de respuesta: varios grados, que no
permite medir en forma ordinal esta variable. Debe tomarse entonces como nominal.
Determinar la codificación de acuerdo a la escala de medición de la variable, es
un paso en la construcción de instrumentos, imprescindible de establecer; porque de
esta fase depende el uso adecuado o inadecuado que se puede dar al tratamiento
estadístico de la variable en estudio. Cuando la variable es nominal cualquier número
que se asigne es indiferente. La regla sólo exige asignar números diferentes a cada
una de las alternativas que deben ser mutuamente excluyentes; pero a partir de escalas
ordinales en adelante el código depende de la alternativa de respuesta. En este caso se
debe asignar el código menor a la alternativa que representa el rango o el nivel
inferior de la variable en estudio. Ejemplo, en el caso del nivel profesional, se le
asigna 1 al docente no graduado por ser este el nivel profesional inferior, mientras
que al profesor o licenciado en educación se le asigna la calificación más alta (4),
porque es la alternativa que representa el nivel profesional superior.
Diferencias entre Cuestionarios de Opinión y Escalas de Actitud
Es importante establecer la diferencia entre cuestionarios de opinión y escalas

de actitud; ya que ambos instrumentos suelen confundirse, aplicando los criterios
propios de las escalas de actitud a los cuestionarios de opinión.
Sobre esta diferenciación Aike (1.996) expresa lo siguente:
…es una reacción específica [la opinión] ante ciertos sucesos o
situaciones, en tanto que la actitud es más general en sus efectos sobre las
respuestas de una persona hacia una amplia variedad de personas o
eventos. Además la gente esta consciente de sus opiniones, pero quizás no
lo esté por completo de su actitud. Las opiniones son similares a las
creencias, en el hecho de que ambas son juicios o aceptaciones de ciertas
proposiciones como verdades; pero los respaldos verdaderos de las
opiniones por lo regular son más débiles que aquèllos para las
creencias…(p. 231)
99
En cuanto a la actitud, en la Unidad IV se definió como la predisposición que
tiene una persona de creer, sentir y actuar hacia otra persona u objeto. De acuerdo a
esta definición, en la actitud están involucradas las creencias y percepciones, los
sentimientos y la predisposición a actuar frente al objeto de estímulo de la actitud.
También la actitud a diferencia de las opiniones, tiene direccionalidad, porque
permite determinar si una persona tiene una actitud alta o baja, hacia el objeto que
origina la actitud. En el caso de las opiniones no se puede hablar de direccionalidad o
intensidad de las opiniones. Ellas sólo se pueden considerar como opiniones que
tienen un sujeto o grupos de sujetos sobre un determinado tópico o situación.
A continuación se presentan los comentarios de Anastasi y Urbina (1998) sobre
las escalas de actitud y los cuestionarios de opinión:
…las encuestas de opinión implican respuestas a preguntas específicas
que no necesitan ser relacionadas, las respuestas a dichas preguntas se
mantienen separadas en lugar de combinarlas en una calificación total.
Por ejemplo, una encuesta de opinión aplicada a empleados podría incluir
preguntas sobre los programas de trabajo, la forma de pago, los beneficios
adicionales, la cafetería de la compañía y las relaciones con los
supervisores; cada uno de esos reactivos se incluye por su importancia
intrínseca para el mejoramiento de las relaciones con los empleados, por
lo que las respuestas a cada pregunta se tabulan en forma separada para
identificar las fuentes de satisfacción e insatisfacción de los trabajadores.
(p. 405)
Referente a las escalas de actitud ambas autoras expresan lo siguiente:

…las escalas de actitud por lo general arrojan una calificación total que
indica la dirección e intensidad de la actitud del individuo hacia una
compañía, un grupo de gente, una política u otras categorías de estímulo.
En la construcción de una escala de actitud, las diferentes preguntas se
diseñan para medir una sola actitud o variable unidimensional, y por lo
común se utilizan procedimientos objetivos en esfuerzo por acercarse a
esa meta; por ejemplo, una escala de actitud para empleados produce una
sola calificación que muestra el grado de satisfacción con el trabajo o la
actitud total del individuo hacia la compañía. (p. 405)
De los comentarios señalados por Anastasi y Urbina se puede extraer como

conclusión que cuando se interpretan y analizan los resultados de un cuestionario de
opinión, debe realizarse pregunta por pregunta. Esta afirmación es válida aún para
100
aquellos cuestionarios de opinión de preguntas con las mismas alternativas de
respuestas. Es incorrecto realizar un análisis sumando los códigos de todas las
alternativas de respuestas para posteriormente promediar y obtener una sola
puntuación. Los cuestionarios de opinión, como ya se mencionó, miden variables en
una escala de medición nominal, la cual no permite realizar ninguna operación
aritmética y menos el uso de promedios.
La Entrevista
Definición
Es aquella técnica de investigación que se aplica “…cuando una persona

(encuestador) solicita información a otra (informante o sujeto de investigación), para
obtener datos sobre un problema determinado. Presume… la existencia de dos
personas y la posibilidad de interacción verbal” (Ander-Egg, 1980, p. 174)
La diferencia fundamental entre un cuestionario y la entrevista está en la forma
de aplicación, la entrevista requiere de una persona (entrevistador) que formule las
preguntas al entrevistado. En el caso del cuestionario, el mismo “encuestado” llena el
instrumento, es decir, la aplicación es autoadministrada.
Tipos de Entrevistas
Entrevista Estructurada
Es “…un interrogatorio en el cual las preguntas establecidas con anterioridad se

plantean siempre en el mismo orden y se formulan con los mismos términos… se
101
realiza sobre la base de un formulario previamente preparado…”. (Ander-Egg, 1980,
p. 174)
Para Padua (1979):
“…la entrevista estandarizada (en este caso equivale a la entrevista
estructurada) y los cuestionarios son prácticamente la misma cosa,
solamente que se habla de entrevista estandarizada en situaciones en los
que el cuestionario se aplica por un entrevistador que leerá las preguntas a
un respondiente. Las preguntas son presentadas exactamente como
figuran en el cuestionario y en su mismo orden…” (p. 17)
La entrevista no Estructurada
Este tipo de entrevista “…deja una mayor libertad a la iniciativa de la persona

interrogada y al encuestador, tratándose de preguntas abiertas que son respondidas
dentro de una conversación…” (Ander-Egg, 1980, p.175).
Se divide en entrevista focalizada, donde el investigador tiene una lista de
tópicos a investigar de un problema. Existe la entrevista clínica que es muy similar a
la entrevista focalizada, pero se centra en el estudio psicológico de los individuos, a
diferencia de la focalizada que estudia grupos sociales.
El proceso de una entrevista focalizada es el siguiente: (a) Las personas
entrevistadas deben tener en común un problema o una situación, (b) Antes de aplicar
la entrevista es conveniente analizar la situación donde interactúa el problema a
investigar, y (c) Sobre la base de la situación planteada elaborar una guía de
entrevista.
El otro tipo de entrevista no estructurada es la entrevista no dirigida, donde el
entrevistado conversa con el entrevistador en forma libre, limitándose este último a
dirigir y orientar la entrevista. Aunque en este tipo de entrevista no existe una guía,
deben existir un tema de entrevista para tratar de obtener mejor provecho de la
investigación que se realiza.
Instrumentos de recolección de datos en la técnica de la entrevista
102
Formulario de Preguntas
Este instrumento es similar al cuestionario, solo difiere que en la entrevista el

entrevistador formula las preguntas al “encuestado”. Este tipo de instrumento es
propio de la entrevista estructurada donde las preguntas formuladas a los
entrevistados son los mismos y son formulados en el mismo orden.
Guía de Entrevista
En este instrumento se elabora un listado de aspectos a investigar. Este

instrumento corresponde a las entrevistas focalizadas y para su elaboración debe
seguirse el proceso descrito para este tipo de entrevistas.
Tema de Entrevista
No es propiamente un instrumento, pues sólo se requiere disponer de un tema

para realizar la entrevista. Corresponde a la entrevista no dirigida.
1. Establezca las diferencias entre cuestionario de opinión y una escala de actitud.

2. Codifique las alternativas de las siguientes preguntas:
2.1. No me gusta la evaluación cualitativa (corresponde a un ítem de una escala de
actitud):
Totalmente de acuerdo: ____
De acuerdo: ____
Ni de acuerdo ni en desacuerdo: ____
En desacuerdo: ____
Totalmente en desacuerdo: ____
103
2.2. ¿Usted asiste a las reuniones de padres y representantes realizadas en la escuela
donde estudian sus hijos?
Siempre: ____
Casi siempre: ____
A veces: ____
Rara vez: ____
Nunca: ____
2.3. ¿En cuál zona de la ciudad está residenciado?
Este: ____
Norte: ____
Sur: ____
Oeste: ____
Fuera de la ciudad: ____
2.4. ¿Cuál es el nivel de ingresos mensual de su familia?
Menor a 190.000 ____
190.000 a 400.000 ____
400.001 a 600.000 ____
600.001 a 800.000 ____
800.001 a 1.000.000 ____
1.000.001 a 1.500.000____
1.500.001 a 2.000.000____
Superior a 2.000.000 ____
2.5. ¿Cómo considera usted la evaluación de acuerdo al Currículo Básico Nacional
para la I y II etapa de Educación Básica? ( corresponde a una pregunta de un
cuestionario de opinión)
Mejor que la anterior: ____
Igual a la anterior: ____
Peor a la anterior: ____
Indeciso: ____
104
2.6. ¿Hace falta una estrategia instruccional innovadora para la asignatura matemática
de tercer grado de Educación Básica? (corresponde a un cuestionario de opiniòn)
Totalmente de acuerdo: ____
De acuerdo: ____
Ni de acuerdo ni en desacuerdo: ____
En desacuerdo: ____
Totalmente en desacuerdo: ____
2.7. ¿Cuáles son las condiciones de infraestructura del plantel donde usted trabaja?
Óptimas: ____
Buenas: ____
Regulares: ____
Pésimas: ____
2.8. ¿Cuál es su satisfacción por el funcionamiento del programa Escuelas
Bolivarianas en el plantel donde trabaja? (corresponde a una escala de satisfacción)
Muy satisfecho: ____
Satisfecho: ____
Ni satisfecho ni insatisfecho: ____
Insatisfecho: ____
Muy insatisfecho: ____
3. Seleccione un tema a investigar para aplicar una entrevista focalizada y
diseñe el instrumento apropiado para la recolección de información.
105
Referencias
Aiken, L. (1996) Test psicológicos y evaluación. México: Prentice Hall.
Anastasi, A., y Urbina, S. (1998). Test psicológicos. México: Prentice Hall.
Ander-Egg, E. (1980). Técnicas de investigación social. (14ª edición). Argentina: El

Cid Editor.
Kerlinger, F. (1998). Investigación del comportamiento (Segunda edición). México:

McGraw Hill.
Namakforoosh, M. (2001). Metodología de la investigación (Segunda edición).

México: Limusa
Padua, J. (1979). Técnicas de investigación aplicadas a las Ciencias Sociales.

México: F.C.E.
Lecturas Sugeridas
Aiken, L. (1996) Test psicológicos y evaluación. México: Prentice Hall. Capítulo 8:
Intereses, actitudes y valores. El apartado que trata las actitudes y los intereses.
Anastasi, A., y Urbina, S. (1998). Test psicológicos. México: Prentice Hall. Capítulo
9. Medición de intereses y actitudes. El apartado que corresponde a encuestas de
opinión y escalas de actitud.

Cid Editor. Capítulo 10. La entrevista. El apartado 1: Modalidades de la entrevista.
Kerlinger, F. (1998). Investigación del comportamiento (Segunda edición). México:

Mc Graw Hill. Capítulo 28. Entrevistas y programas de entrevistas. Es un
capítulo muy corto e interesante, se recomienda leerlo completo.
Namakforoosh, M. (2001). Metodología de la investigación (Segunda edición).

México: Limusa. Capítulo 7. Elaboración del cuestionario. Es un capítulo corto y
oportuno para dominar la elaboración y aplicación de cuestionarios, por lo que
se recomienda todo el capítulo. Su contenido es el siguiente: Introducción, Diseño
del cuestionario, Información requerida, Determinar el tipo de preguntas y la
manera de obtener la información, Contenido de una pregunta individual,
Formas de respuestas, Decisión sobre redacción de la pregunta, Determinar las
secuencias de las preguntas y Evaluación y prueba del cuestionario.
Padua, J. (1979). Técnicas de investigación aplicadas a las Ciencias Sociales.

México: F.C.E. Capítulo 1: La Organización de un “survey”. El apartado que se
denomina observaciones, entrevista y cuestionarios.
106
CAPÌTULO VI
LA OBSEVACIÒN
Objetivo
El estudiante al concluir esta Unidad estará en capacidad de diseñar instrumentos para

aplicar una observación sistemática
Definiciòn
Para Ander-Egg (1980), la observación como técnica de investigación, consiste:

…en observar a la gente in situ, o sea, en su contexto real, donde
desarrollan normalmente sus actividades para captar aquellos aspectos
que son más significativos (para la investigación)… Abarca el ambiente
físico, social y cultural, etc., donde los hombres desarrollan sus vidas…
(p. 156)
Es importante destacar que cuando se habla de observación no se limita a captar

sólo imágenes, es decir, al sentido de la vista, sino que en la observación están
involucrados el resto de los sentidos como el oído, gusto, olfato y tacto. Claro está
que en el proceso de la observación en la mayoría de las investigaciones la vista
ejerce la función predominante.
Elementos Presentes en la Observación
Según Ander-Egg en el proceso de investigación deben estar presentes los

siguientes elementos: (a) El observador, quien es el responsable de realizar la
observación; (b) El fenómeno, problema o situación que se observa, (c) La
información o dato que se busca, ya que se puede observar el fenómeno o problema,
pero la obtención de datos que lo describan o explique no está al alcance de la
investigación, (d) El papel o modo de participar del observador, para cumplir con este
elemento, el observador debe definir su modo de participación, es decir, determinar si
será un observador participante o no participante, si la observación será estructurada o
107
no estructurada, si la observación la realizará en forma individual o grupal, y por
último, si será una observación en la vida real (caso de las ciencias sociales y la
educación) o de laboratorio (caso de las ciencias fácticas), y (e) Definir los
instrumentos y medios de observación, los cuales permitirán al observador obtener la
información y los datos del fenómeno o problema en observación.
Modalidades de Observación
Según los medios utilizados
Ante de abordar la observación de acuerdo a los medios, se explica el concepto

de categoría de análisis, ya que el mismo es fundamental para diferenciar una
observación no estructurada de la estructurada. Una categoría de análisis es la forma
de clasificación de los datos que se obtiene de la observación. Esta clasificación se
realiza previamente en la observación estructurada, lo cual implica realizar consultas
teóricas y con los informantes de la investigación, para garantizar categorías
altamente estructuradas.
La observación según los medios utilizados se divide en (a) Observación no
estructurada, en la cual las categorías de observación son poco estructuradas; y (b)
Observación estructurada o sistemática en la cual las categorías de observación son
bien estructuradas. De acuerdo a ambas definiciones se puede decir que la diferencia
entre una observación no estructurada y estructurada se fundamenta en el grado de
estructuración de las categorías de análisis y no en la intensidad de los instrumentos
empleados en la observación.
Según el Papel o Modo de Participación del Observador
La observación de acuerdo al papel o modo de participación se dividen en:
108
Observación no Participante
Cuando el papel del observador es no participante, éste no convive con el grupo de

estudio ni asume ningún rol de la comunidad. Su papel se limita a observar el grupo,
sin involucrarse en la vida cotidiana que éste desempeña. Esta forma de observación
tiene como desventaja la restricción de la observación a momentos donde el
observado sabe que lo observan, lo cual puede conducirlo a fingir su comportamiento.
La ventaja es que el observador no necesita convivir en el grupo para realizar la
investigación.
Observación Participante
El observador convive en el grupo y asume uno o varios roles de la comunidad en

estudio. En esta forma de observación, el investigador tiene que permanecer en la
comunidad, siendo su estadía en la mayoría de los casos prolongada, extendiéndose
por meses y hasta por varios años. Tiene como desventaja que no siempre un
investigador no puede desvincularse de su vida cotidiana para convivir en un medio
geográfico y social generalmente muy diferente al cual pertenece. Tiene como ventaja
que permite realizar una investigación exhaustiva del fenómeno o problema en
estudio.
Según el Número de Observadores y Lugar de la Observación
Según el Número de Observadores
Puede ser realizada por una sola persona o por un grupo de observadores. Es
conveniente cuando se aplica la técnica de la observación que la misma sea realizada
por más de una persona; porque de esta manera se puede contrastar lo observado
entre el grupo de observadores y suprimir cualquier sesgo presente en el proceso de
observación.
109
Según el Lugar donde se Realiza la Observación
El lugar donde se realiza la observación puede ser en un laboratorio o en la vida real,

tal cual como interactúan los sujetos de la investigación. En las ciencias sociales y la
educación, el lugar de la observación es en la vida real, lo que lleva a establecer
controles o mecanismos para aislar variables intervinientes que pudieran influir en la
variable en estudio. Es un proceso mucho más complejo que la observación en
laboratorio, donde se aísla al sujeto (que generalmente son animales y plantas),
lográndose así contrarrestar el efecto ejercido sobre las variables intervinientes.
Normas para una Observación Sistemática y Controlada
Ander-Egg (1980) menciona algunas normas que deben tomarse en cuenta

cuando se realiza una observación sistemática y controlada. Las mismas son las
siguientes:
1. Determinar el objetivo de la observación. En esta fase el investigador debe
precisar cuál es el propósito de la investigación, para así orientar el rumbo que debe
tener la observación.
2. Elaborar un plan de actividades y tareas a realizar durante el proceso de la
observación. Este plan permitirá reducir la incertidumbre presente durante el tiempo
en el cual transcurre la observación. Generará certidumbre y logrará facilitar el
trabajo de campo.
3. Orientación teórica sobre técnicas de observación y sobre el fenómeno o
problema a observar. La fundamentación teórica permitirá al observador mejor
manejo de la observación y del problema a observar.
4. Lista o guía sobre los aspectos a observar, con el propósito de delimitar la
observación sólo a los aspectos que interesan al investigar. Esta guía varía de acuerdo
al tipo de investigación. En los estudios exploratorios, donde el conocimiento sobre el
problema a estudiar es reducido, esta lista debe ser más flexible que en estudios
explicativos, donde los aspectos a estudiar están bien delimitados.
110
5. Seleccionar los instrumentos con los cuales se registrará la información y
datos a recoger. Se debe precisar antes de realizar la observación cuáles son los
instrumentos más recomendados para realizar la observación.
6. Deben tomarse en cuenta los problemas operativos que pueden surgir en el
proceso de la observación, tales como traslado al lugar, pernocta, material e
instrumentos de registro como cámara fotográfica y de video, grabador, libreta,
lápices, etc. La ausencia de algún instrumento de registro puede afectar
considerablemente la recogida de datos producto de la observación.
7. Establecer empatía con el grupo sujeto al estudio, para facilitar la
comunicación entre el observador y la comunidad donde se realizará la observación.
8. Cuando se llegue a la comunidad donde se realizará el estudio, se debe ubicar
a los informantes claves; quienes orientarán al investigador sobre aspectos que éste
desea observar.
9. Se debe registrar en el momento o lo más pronto posible lo observado para
evitar el olvido. Para ello debe grabarse escenas, escribir en el cuaderno de nota o en
cualquier otro dispositivo electrónico o manual seleccionado para cada oportunidad
específica.
Instrumentos para Realizar una Observación Sistemática
El Diario
Es el relato escrito sobre lo observado en el proceso de la investigación y debe

escribirse lo más pronto posible de los sucesos observados.
Registro anecdótico
Es el registro escrito, generalmente en una ficha, de relatos e interpretación de

incidentes observados sobre el problema o fenómeno en estudio. Estos incidentes
pueden ser típicos o representativos de la conducta del grupo en estudio.
111
Ejemplo de Registro Anecdótico
Alumno: Edad:
Sexo: Grado: Sección: Fecha: Hora:
Incidente:
Interpretación:
Conclusión:
Lista de Cotejo, de Control o Corroboración
Su propósito es verificar la presencia o no en el grupo de estudio de alguna

característica de interés para la investigación. Tiene como limitante que no registra la
frecuencia o intensidad con la cual ocurre la característica de interés para la
investigación.
112
Ejemplos de listas de cotejo
Lista de Control para ser usada por maestros especializados en dificultades del
aprendizaje.
(Uso colectivo)
Curso: Fecha:
Observador:
Instrucciones: identifique con un signo de cotejo los desórdenes que ha observado en
cada uno de sus alumnos.
Alumnos
1 2 3 4 5 6 7 8 9 10
 Hiperactividad
 Disfunciones percepto-motoras
 Bajo nivel de motivación
 Dificultades de coordinación
general
 Desórdenes de la atención
 Impulsividad
 Desórdenes de la memoria
 Desórdenes del pensamiento
 Desórdenes del lenguaje
 Desórdenes de la audición
 Desorganización lógica
 Dificultades en la lectura
 Dificultades en la escritura
 Dificultades en el silabeo
 Dificultades en el cálculo
Nota: Tomado de Busot. (p. 212)
113
Lista de Control para ser usada por maestros especializados en dificultades del
aprendizaje.
(Uso individual)
Nombre del alumno: Sexo: Edad:
Fecha: Curso:
Instrucciones: identifique con un signo de cotejo los desórdenes que ha observado en cada uno de sus
alumnos.
 Hiperactividad
 Disfunciones percepto-motoras
 Bajo nivel de motivación
 Dificultades de coordinación general
 Desórdenes de la atención
 Impulsividad
 Desórdenes de la memoria
 Desórdenes del pensamiento
 Desórdenes del lenguaje
 Desórdenes de la audición
 Desorganización lógica
 Dificultades en la lectura
 Dificultades en la escritura
 Dificultades en el silabeo
 Dificultades en el cálculo
Nota: Tomado de Busot, p. 211
Cuaderno de Nota
Es una libreta, o que hace las veces de ella, donde el observador realiza
anotaciones relevantes o de interés sobre situaciones que observa y considera que
pueden aportar a la investigación.
Escalas de Estimación
Este instrumento también se conoce como escala valorativa o de valores, de

evaluación, apreciación, juicio o de estimación. Kerlinger (1.998) la define como “…
instrumento de medición que requiere que el calificador u observador asigne el objeto
114
calificado a categorías o espacios continuos que tienen valores numéricos asignados a
ellas…” (p. 502). Al respecto Busot (1980) expresa que “…las escalas valorativas
son cuestionarios especiales que incrementan la cantidad de información al registrar
no sólo la presencia o ausencia de un rasgo, sino además su frecuencia, nivel o
intensidad…” (p. 215)
Escala Valorativa: Una Ilustración muy singular
Muy Poco
Excelente satisfactorio Satisfactorio satisfactorio Deficiente
Necesita
coger
Salta enormes Sólo salta Se estrella No sabe
impulso
CALIDAD edificios de un pequeños contra los distinguir los
para saltar
solo brinco. edificios. edificios. edificios.
altos
edificios
Tan veloz Algo más Sólo puede Se hiere con
Es más veloz
RAPIDEZ como una lento que disparar sus propias
que una bala.
bala. la bala. balas. balas.
Más fuerte que Más fuerte Más fuerte Tiene que
INICIATIVA una que un que un dispararle Huele a toro.
locomotora. elefante. toro. al toro.
Camina
EJECUTORIA
Usa el Busca el
Camina sobre sobre el Usa el
agua sólo agua en
ADAPTACIÓN el agua agua en agua para
para casos de
frecuentemente. casos de lavarse.
beberla. emergencia.
emergencia.
Pierde
Discute cuando
Habla con los Habla con Se habla a
COMUNICACIÓN consigo discute
dioses. los ángeles. sí mismo.
mismo. consigo
mismo.
Se mueve Se mueve
Se mueve entre Se mueve Se mueve
entre detrás de
RELACIONES dueños y altos entre los entre la
ejecutivos una
ejecutivos. empleados. competencia.
medios. escoba.
Se Se Se
Muy brillante Muy tonto
preocupa preocupa preocupa
PLANIFICACIÓN para para
por el por el por el
preocuparse. preocuparse.
futuro. presente. pasado.
Nota: Tomado de Busot (p. 216)
115
Mapas
Los mapas representan una valiosa ayuda para el observador, porque le

permiten ubicarse en el sitio donde realizará la observación. Los mapas pueden ser
elaborados por el mismo observador de forma rudimentaria, con ayuda de un
conocedor del lugar.
Dificultades y Limitaciones de la Observación
La observación es una técnica de investigación que implica alto riesgo de

subjetividad, lo cual origina las siguientes dificultades en su aplicación:
1. Percepciones y creencias del observador en el proceso de observación que
pueden afectar la calidad de la investigación. El ser humano a través de los sentidos
capta su mundo externo de acuerdo a las creencias y percepciones que posee. Este
hecho origina la carencia o disminución de la objetividad cuando realiza cualquier
observación.
2. Se debe ser muy cuidadoso cuando se pretende realizar generalizaciones de
un proceso de observación muy particular a una colectividad o grupos de personas
más amplios, porque cuando se generalizan resultados debe existir certeza que lo
observado puede proyectarse a una comunidad más amplia.
3. La observación es una técnica que exige un proceso de aprendizaje y
experimentación que cualquier investigación no la posee. Un observador sin
experiencia puede distorsionar la observación y conducirlo a resultados erróneos,
perjudiciales para la solución o comprensión del fenómeno o problema en estudio.
116
1. Observe la figura y diga los aspectos observados. Al terminar de observarla,

discuta e intercambie con sus compañeros los aspectos observados para determinar
coincidencias y divergencias sobre las características observadas de la figura.
2. Observe a un grupo social cuando realiza alguna actividad. Diga las

conclusiones de la observación. Para realizarla cumpla con las normas para una
observación sistemática y controlada.
117
Referencias

Cid Editor.
Busot, A. (1980). Investigación educacional. Maracaibo, Venezuela: Universidad del

Zulia.
Kerlinger, F. (1998). Investigación del comportamiento. (Segunda edición). México:

Mc Graw Hill.
Lecturas Sugeridas

Cid Editor. Se recomienda leer el Capítulo 9: La observación.
Busot, A. (1980). Investigación educacional. Maracaibo, Venezuela: Universidad del

Zulia. Se recomienda leer el Capítulo IV: Recolección de datos. Apartado sobre
técnicas para recoger información.
Kerlinger, F. (1998). Investigación del comportamiento. (Segunda edición). México:

Mc Graw Hill. Capítulo 31: Observaciones del comportamiento y sociometría.
Apartados: Problemas en la observación del comportamiento y evaluación de la
observación del comportamiento.
118
CAPÌTULO VII
TÉCNICAS E INSTRUMENTOS DE RECOLECCIÓN DE DATOS
CUALITATIVOS
Objetivo
Proporcionar al estudiante las herramientas básicas para aplicar instrumentos
cualitativos
A Manera de Introducción
La orientación de este Módulo está dirigida hacia el Diseño y Validación de

Instrumento de Medición Educativa que se fundamenta en lo cuantitativo como
procedimiento implementado en el proceso que requiere el diseño de un instrumento
válido y confiable. En el caso de las técnicas e instrumentos de investigaciones
cualitativas, su diseño implica un proceso centrado en la descripción cualitativa de los
datos.
Para Pérez Serrano (1.998), “En la investigación cualitativa, tanto la recogida
de datos como el análisis de datos van juntos, mientras que constituyen momentos
diferentes en la metodología cuantitativa” (p. 104). Más adelante Pérez Serrano
Expresa:
El proceso a seguir en la investigación cuantitativa presenta un carácter
lineal, mientras que en la cualitativa es fundamentalmente interactivo. Lo
que exige en muchas ocasiones volver sobre los datos, analizarlos y
replantear el proceso. El análisis de los datos no es la última fase de la
investigación, dado que el proceso es cíclico. (p. 104)
Para desarrollar este capìtulo, se explicará las técnicas e instrumentos aplicados

en dos métodos de investigación cualitativas: la Etnografía y la Investigación-Acción,
los cuales son los más usuales en investigaciones cualitativas realizadas en
Educación. Los instrumentos en ambos métodos son los mismos o muy similares;
pero en las investigaciones cualitativas, cada método tiene su especificidad en cuanto
119
a las técnicas e instrumentos de recolección de datos usados. Es por esta razón que se
explican las técnicas e instrumento de recogida de datos, tomando en cuenta el
método de investigación.
En el caso de las técnicas e instrumentos de investigaciones etnográficas, se
desarrolla su explicación tomando como referencia dos autoras, Goetz y LeCompte,
quienes representan una corriente etnográfica en Educación con presencia y
seguidores a nivel mundial. En Investigación-Acción, su explicación se fundamenta
en Gloria Pérez Serrano, exponente hispana de este método; quien ha publicado
varios textos sobre investigación cualitativa e Investigación-Acción.
Recogida de Datos en Investigaciones Etnográficas
Goetz y LeCompte (1.988) al referirse a la recogida de datos en estudios

etnográficos, expresan lo siguiente:
Las categorías de estrategias de recogidas de datos comúnmente usadas
en etnografía son la observación, las entrevistas, los instrumentos
diseñados por el investigador y los análisis de contenido de los artefactos
humanos. A su vez, cada una puede dividirse en otras más específicas. La
observación participante y las distintas variantes de la observación no
participante (crónicas de líneas de comportamiento, proxemia y kinesia y
protocolos de líneas de análisis de interacciones) son medios alternativos
de recogida de datos dentro de la categoría de observación. La entrevista a
informantes claves y la recogida de material biográfico son variantes de la
entrevista; los instrumentos diseñados por el investigador incluyen
encuestas de confirmación, instrumentos para descubrir constructos de los
participantes y pruebas proyectivas. El análisis de contenido de artefactos
humanos comprende la recogida de material demográfico y de archivo,
así como el análisis de vestigios o restos materiales (p.p. 124-125).
Las autoras mencionadas clasifican la recogida de datos en (a) métodos

interactivos, los cuales implica una intensa interacción entre el investigador y los
sujetos e informantes de la investigación, y (b) métodos no interactivos (o no
intrusivos), en los cuales hay poca interacción entre el investigador y los participantes
de la investigación.
120
A continuación se explican las técnicas correspondientes a cada uno de ambos
métodos.
Técnicas Interactivas
Goetz y LeCompte señalan tres (3) estrategias de recogida de datos con técnicas
interactivas en los estudios etnográficos. A continuación se explican:
Observación Participante
La observación participante es la principal técnica de recogida de datos en los

estudios etnográficos, ésta consiste, tal como se explicó en el capìtulo VI, en convivir
con los participantes de la investigación en el sitio donde ellos interactúan. Sobre esta
técnica no se explicará más detalles, ya que la misma fue abordada en el Capítulo VI.
Entrevista Cualitativa
Para Taylor y Bogdan (1.996) las entrevistas cualitativas:

En completo contraste con la entrevista estructurada, … son flexibles y
dinámicas. Las entrevistas cualitativas han sido descritas como no
directivas, no estructuradas, no estandarizadas y abiertas. Utilizamos la
expresión “entrevista en profundidad” para referirnos a este método de
investigación cualitativo. Por entrevista en profundidad entendemos
reiterados encuentros cara a cara entre el investigador y los informantes,
encuentros éstos dirigidos hacia la comprensión de las perspectivas que
tienen los informantes respecto a sus vidas, experiencias o situaciones, tal
como las expresan con sus propias palabras. Las entrevistas en
profundidad siguen el modelo de una conversación entre iguales, y no de
un intercambio formal de preguntas y respuestas. Lejos de asemejarse a
un robot recolector de datos, el propio investigador es el instrumento de la
investigación, y no lo es un protocolo o formulario de entrevista. El rol
implica no sólo obtener respuestas, sino también aprender qué preguntas
hacer y cómo hacerlas. (p. 101)
Esta técnica, al igual que la anterior, fue abordada en un capìtulo aparte, el

capìtulo V; se puede agregar que la entrevista cualitativa en su forma específica
121
adopta las siguientes modalidades: entrevista a informantes claves y biografías o
historias profesionales.
Se explican a continuación ambas formas específicas de la entrevista:
Entrevista a informantes claves. Los informantes claves son personas

conocedoras del comportamiento del problema o fenómeno en estudio o personas que
orientan al investigador sobre la ubicación de los datos requeridos por la
investigación. Un informante clave debe ser una persona dispuesta a colaborar con el
investigador y con acceso a los participantes y datos de interés para la investigación.
Historias profesionales. Las Historias profesionales es una variante de las

historias de vida. Éstas se aplican en escenarios educativos para narrar la vida
profesional de los participantes de una investigación.
Ejemplo de entrevista cualitativa
Se presenta en esta sección un ejemplo de entrevista cualitativa tomada de un

caso práctico (realizada en Julio–1.999) donde los autores del presente libro tuvieron
participación.
A continuación se presenta una de varias entrevistas realizadas para describir el
comportamiento de niños preadolescentes:
Propósito del estudio: Describir el comportamiento de los alumnos del quinto
grado, sección F, de la E.B. Stella Cechini
Fuente de Información: Entrevista semiestructurada y la observación:
participante y no participante.
Descripción del contexto en el cual se realizó la entrevista
Las entrevistas se realizaron dentro de las instalaciones del la Escuela Básica
Stella Cechini. La del alumno y la madre de éste se realizaron en el aula
correspondiente a la sección F de 5º grado. En el caso particular del niño, la entrevista
fue interrumpida varias veces por la entrada de otros niños, así mismo se observó
122
mucha interferencia (que impedía escuchar bien) proveniente de la parte trasera del
aula, donde está un patio y en ese momento se encontraban jugando algunos niños.
En el caso de la madre la interferencia de la entrevista fue aún mayor, porque en
el interior del aula, además de nosotros (entrevistador y entrevistado) se encontraban
sus dos últimos hijos; quienes durante el tiempo que duró la entrevista se dedicaron a
pelear y a mover los pupitres, y en el exterior, cercano al aula, se efectuaba una
reunión de padres y representantes con el Director y el medio para comunicarse era
un altoparlante que impedía una nítida audición de la entrevista. La entrevista de la
maestra orientadora se realizó en su oficina, donde constantemente entraban y salían
niños que estaban ordenando la oficina. Ellos en cada momento se dirigían a la
orientadora para consultar sobre la ubicación de un determinado objeto. Su tono de
voz era sumamente bajo, lo cual dificultó escuchar del grabador con precisión muchas
palabras y frases que ella expresó.
En conclusión se puede decir que las condiciones bajo las cuales se realizaron
las entrevistas no fueron las más adecuadas; pero realizarlas en otro sitio era muy
difícil y más cuando en nuestro caso el tiempo fue un factor apremiante.
Análisis de las Entrevistas 1.3, 1.4 y 1.5
Análisis de los Datos
Primer Análisis: Por Categorías

La información recolectada a través de las entrevistas se agrupó en ocho (8)
categorías, subdividiéndose las mismas en subcategorías, las cuales son las
siguientes: 1. Actuación agresiva (subcategorías: verbal, física, gestual); 2. Actuación
pacífica (subcategorías: verbal, física y gestual); 3. Contexto (subcategorías: escolar,
vecinal, familiar); 4. Enamoramiento y relaciones sexuales (subcategorías:
enamoramiento y relaciones sexuales); 5. Normas (subcategorías: en la escuela y en
el hogar); 6. Rendimiento escolar (subcategorías: bajo, medio y alto); 7. Tiempo libre
123
(subcategorías: música, televisión y deportes); y 8. Valores (subcategorías: éticos o,
morales, culturales, religiosos y juicios de valores).
1. Categoría Nº 1
Actuación agresiva: es un sentimiento inamistoso (hostil) de una persona hacia
otra(s) que la rodean. Ese sentimiento puede expresarse de tres (3) formas
(subcategorías): verbal (palabras agresivas), físico (atropello o daños a la integridad
física de una persona) y gestual (cuando el sentimiento se realiza a través de gestos,
ejemplo, con los ojos, ademanes o movimientos de las manos).
2. Categoría Nº 2
Actuación pacífica: es cuando la actuación de la persona es en forma tranquila
y manifiesta ser amante de la paz. Puede expresarse a través de las siguientes formas
(subcategorías): verbal (cuando su expresión oral se realiza en forma tranquila, sin
insultos y con gran serenidad), gestual (cuando en los gestos que realiza no expresa
sentimientos inamistosos, sino que refleja tranquilidad y paz) y física (cuando nunca
atenta contra la integridad física de otra persona).
3. Categoría Nº 3
Contexto: es el medio físico, social y psicológico, donde actúa el
preadolescente sujeto a estudio. En la investigación se identificaron tres (3) contextos
(subcategorías): escolar (circunscrito al ambiente escolar, no sólo al espacio interno
de la escuela, sino todo aquello que rodea el entorno inmediato de la misma), vecinal
(se refiere al contexto donde el alumno vive, es decir, al barrio, urbanización, sector o
caserío) y familiar (se refiere a todos los acontecimientos que suceden en la vivienda
o familia, donde el alumno vive o pertenece).
4. Categoría Nº 4
Enamoramiento y Relaciones sexuales: esta categoría se divide en dos
subcategorías: enamoramiento y relaciones sexuales, la primera, el enamoramiento se
refiere cuando el alumno siente un sentimiento de atracción hacia otra persona; y la
segunda, relaciones sexuales, cuando el alumno practica el coito.
5. Categoría Nº 5
124
Normas: Son reglamentos o preceptos con la finalidad de instaurar el orden o la
disciplina. Las mismas en nuestro caso se refieren al hogar o a la escuela
(subcategorías).
6. Categoría Nº 6
Rendimiento escolar: se refiere a las calificaciones que el alumno obtiene en
los procesos de evaluación que se le realizan. En el presente trabajo se distinguen tres
subcategorías: alto rendimiento, que son alumnos con calificaciones excelentes y
buenas (entre 16 y 20 puntos); rendimiento medio, que son alumnos con rendimiento
satisfactorio o regular (entre 12 y 15 puntos); y rendimiento bajo, cuando los alumnos
obtienen calificaciones inferiores a los 12 puntos.
7. Categoría Nº 7
Tiempo Libre: es la utilización del tiempo por el alumno cuando no está en
actividades escolares. En este caso en particular se distinguieron cinco (5)
subcategorías: música, televisión, deporte, videos (nintendo, ataris, juegos por
computadoras, etc.) y juegos tradicionales (metras, papagayos, ladrón librado, etc.)
8. Categoría Nº 8
Valores: son las apreciaciones que tiene una persona sobre otra persona, objeto,
evento, hecho, etc. En esta investigación se dividieron (subcategorías) en: valores
éticos o morales (cuando el valor se refiere a la adaptación a las costumbres de una
sociedad, comunidad o grupo social con el cual se convive), culturales (cuando se
aceptan los valores por tradición familiar o de la comunidad donde vive) y juicios
individuales (cuando una persona emite una opinión o apreciación sobre un individuo
en particular).
Segundo Análisis: Patrones
Alumno
Pág. 1. Línea 26: ...no, es que las hembras son las más peleonas.
Pág. 2. Línea 28: Son más chismosas que los varones.
Pág. 2. Línea 32: Por nada, porque ellas son las peores.
Pág. 3. Línea 56: Las hembras son las más malablá.
Pág. 5. Línea 122: Esos son pa’ las hembras.
125
Pág. 7. Línea 182: Porque se lo cuentan a otras y ellas las traicionan. Es que las
hembras son muy chismosas.
Madre del Alumno

Pág. 8. Línea 200: El es muy rebelde...
Pág. 9. Línea 228: Porque él no quería hacer caso...
Pág. 9. Línea 248: ¡Na’ guará! ¡les pega! El es jugando. El todo es violencia...
Pág. 10. Línea 251: ...El es muy violento y uno no debe ser así.
Pág. 11. Línea 288: A veces me hace caso y a veces no. A veces me hace coger
rabias. La otra semana yo le pegué,...
Maestra Orientadora
Pág. 14. Línea 382: ...Los problemas de conducta vienen en si del hogar,...
Pág. 15. Línea 391: ... al evaluar el comportamiento de un niño, hay que
considerar, primero, el hogar, eso en primer...
Pág. 16. Línea 425: Esos niños vienen de un hogar todo desintegrado y las
consecuencias las vemos después...
Pág. 16. Línea 431: ...pero en si los problemas de conducta radican en el hogar.
Pág. 17. Línea 468: ...Casi siempre lo que ha pasado con niños con problemas
de conducta, es porque vienen de...
Pág. 17. Línea 469: ... hogares de padres divorciados, padres irresponsables o
padres que son muy borrachos...
Tercer Análisis: Por Dilemas
Alumno
Pág. 3. Líneas 67, 68, 69, 70, 73, 74, 75, 76, 77 y 78
- I: ¿Qué opinas de las peleas?
- A: A mi no me gustan.
- I: Pero las ves.
- A: Si, las veo.
- I: Cuando alguien te hace algo ¿Cómo reaccionas?
- A. Le digo a la profe.
126
- I: ¿Y si es fuera de la escuela?
- A: Ah, hay peleo. Aquí en la escuela no, porque me pueden expulsar.
- I: Y en la calle, ¿qué haces?
- A: Le caigo a golpes.
Madre del Alumno
Pág. 10. Líneas 258 y 259
Pág. 13. Líneas 340, 341, 342, 343 y 344
- ...No era que llegaba pelao a maltratarme a mi o maltratarlos a ellos...
- ...¡Claro!, cuando él les pegaba era por algo.
- ¿Cómo era su esposo?
- ¡El!, ¡él era apretao!
- ¿Perdía el control?
- No, bueno él poco le pegaba; pero cuando le daba eran pocos golpes, pero
bien asentaos...
- ¡Le pegaba!, Juan José sabe que lo marcaba.
Pág. 11. Líneas 291 y 293
- ...El me dice mamá ayúdame y yo le digo te voy a ayudar... (hacer sus tareas)
- ...Además con qué tiempo le voy ayudar...
- Pág. 12 . Líneas 317, 318, 319, 320, 322 y 323
- ¿Cómo reacciona usted ante una agresión en contra de sus hijos?
- Cónchale, me siento mal, como ellos son tan inquietos. El otro día una niñita
golpeó a Agustín, el más menor, ¡Claro! Fue porque él en una oportunidad le había
echado una cachetada a
- la niñita y salió corriendo...
- ...¿cómo... voy yo a reclamar?...
Maestra Orientadora
- No se determinaron dilemas en la entrevista
A continuación se presenta la entrevista realizada a la maestra orientadora:
127
Entrevista sobre el comportamiento de escolares preadolescentes
(Continuación)
Categorización Línea Texto Pág. 14
361. M: En realidad que no; pero si lo he pensado, porque yo ya no sé como corregirlo.
362. I: De nuevo le doy las gracias por dedicar su tiempo a conversar conmigo, sin duda que sus
363. respuestas nos ayudarán mucho para el trabajo que estamos haciendo. ¡Muchas gracias!
364. M: No hay de que, gracias a usted por preocuparse por mi hijo.
(3) Maestra de la U.E. Stella Cechini, con una larga trayectoria tratando niños con problemas
de aprendizaje y de conducta. Lugar de la entrevista en la propia escuela. Código: 1.3.
365. I: ¿Usted trabaja conjuntamente con los Núcleos Integrados de Bienestar Estudiantil (NIBES) y con
Rapport 366. la Dirección de Educación (el Departamento de Educación Especial)?
367. M: Bueno, nosotros (los maestros en educación especial) dependemos de Educación Especial. Nos
368. anexan a una escuela.
369. I: ¿Usted esta adscrita a esta escuela?
370. M: Si, aquí a la Stella Cechini.
371. I: Además de esta escuela, ¿trabaja en otra?
372. M: No, trabajo sólo en esta escuela.
373. I: Ha realizado cursos... (interrumpe)
374. M: Si, constantemente las maestras de educación especial recibimos varios talleres.
375. I: Sus funciones en esta escuela, ¿cuáles son?
376. M: Bueno, yo trabajo directamente con los niños que están en los salones y tengan dificultades en el
377. aprendizaje, desde preescolar hasta sexto.
378. I: ¿Usted trabaja conjuntamente con los NIBES?
379. M: Si, nosotros enviamos los casos allá para que ellos los evalúen.
Valores (morales) 380. I: ¿Qué opinión tiene usted de los muchachos de esta escuela?
381. M: El problema de los niños de aquí es la rebeldía. Para explicar esto tiene que partirse desde el
382. hogar. Los problemas de conducta vienen en si del hogar, por ejemplo, allá afuera está una madre
383. que tiene su hija aquí y viene hablar conmigo, porque su hija está muy rebelde y no le hace caso.
384. I: ¿Qué edad tiene la niña?
385. M: 11 años.
128 Continúa
(Continuación)
386. I: ¿Qué hace la niña?
387. M: Bueno, yo veo que el principal problema es que sus padres son evangélicos y la niña dice que no
388. le gusta esa religión, que ella es católica. En el caso del mal comportamiento usted no puede
389. quedarse en una sola parte, sino que la información hay que buscarla en los padres, el maestro, sus
390. amigos y los propios niños, de por qué se comportan de una determinada manera, yo considero que
391. al evaluar el comportamiento de un niño, hay que considerar, primero, el hogar, eso en primer lugar,
392. y después la escuela, el sector donde vive, con quien anda. Todo eso influye en el comportamiento
393. de los niños.
394. I: Casos de mal comportamiento... (interrumpe)
395. M: ¿Qué yo recuerde?
396. I: Si, que para usted fueron difíciles de resolver.
Normas (escuela) 397. M: Mira, yo desde el año 85 tengo eso (señala hacia un estante) un libro, allí llevo todos los casos
398. con problemas de conducta.
399. I: ¿Qué hace para resolver un caso de mala conducta o mal comportamiento?
400. M: Mire le voy a responder con un caso de un niño con indisciplina marcada. Era el líder y todos
401. los demás niños le seguían. Hacían lo que él hacía. Todos sabían que él era el culpable, pero nadie
402. lo acusaba. La maestra de esa sección, dijo que si no lo expulsaban, entonces era ella la que se iba;
403. pero ¿cómo lo expulsábamos?, si nadie lo acusaba.
404. I: Pero, ¿qué era lo que hacía?
405. M: Bueno, “tiraba la piedra y escondía la mano”. Tiraba papeles a la maestra, hacía ruidos cuando
406. la maestra estaba escribiendo en el pizarròn.
407. I: ¿Qué edad tenía el niño?
408. M: 10 años. Entonces yo los llamé (a todos los alumnos de la sección) uno por uno y les hice firmar
409 un acta donde ellos se comprometían a portarse bien o sino todos iban a ser expulsados. Muchos de
410. ellos a mi me confesaron que él era el culpable; pero le tenían miedo, porque él después se iba a
411. vengar. Hablé con él y le dije: “yo tengo testigos que tu eres el culpable de todo lo que está pasando
412. en la sección y si tú no te comportas bien, entonces tú serás expulsado”. Pues ese fue el santo
413. remedio. A partir de esa conversación que tuve con ese niño, ya no volvió a molestar a
129 Continúa
(Continuación)
414. la maestra.
415. I: Las cartas de buena conducta ¿en dónde se tramitan?
416. M: Por la Dirección.
417. I: Si, pero el Director para otorgar las cartas de buena conducta ¿consulta con usted?
418. M: No, con la maestra del niño que solicita la carta de buena conducta.
419. I: Pero, si el alumno tuvo problemas no en el año que cursa, sino en años anteriores.
420. M: No, para otorgar la carta de buena conducta se toma en cuenta el año que está cursando o acaba
421. de cursar.
422. I: ¿Cuál cree usted que es la causa de niños... (interrumpe).
423. M: ¿Con problemas de conducta?
424. I: Sí.
Valores (morales) 425. M: Esos niños vienen de un hogar todo desintegrado y las consecuencias las vemos después en la
426. calle, cuando aparecen en la prensa, donde la mayor parte de los delitos son cometidos por
427. adolescentes. Aquí en la escuela hay problemas de conducta, pero también en otras escuelas los hay.
428. Esto se ha generalizado en toda la educación.
429. I: ¿Considera usted que el mal comportamiento en esta escuela está desbordado?
430 M: No, desbordado no. Hay problemas que se han presentado, los oriento como deben abordar el
431. problema de su hijo o alumno; pero en si los problemas de conducta radican en el hogar.
432. I: ¿Ha enviado algunos niños a consultas psicológicas?
Normas (escuela) 433. M: Sí, al Seguro, la Cruz Roja.
434. I: ¿Quién recomienda remitir a consultas... (interrumpe)
435. M: La persona que se siente capaz de hacerlo: yo, la maestra del alumno, el director.
436. I: ¿La escuela lleva estadísticas sobre niños que tienen problemas de conducta, sobre las citaciones
437. que le hacen a los padres por mal comportamiento o bajo rendimiento?
438. M: No, estadísticas no; pero un maestro de aula, puede saber cuántos niños son los que tienen mala
Valores (culturales) 439. conducta. La mayoría de los casos se dan entre cuarto y sexto, porque en estos grados los niños
440. entran a una edad preadolescente y se creen más independientes. Quieren explorar. Comienzan a
441. enamorarse. Se siente que ya pueden actuar, como si fueran mayores de lo que son.
130 Continúa
(Continuación)
442. Están en una etapa muy difícil que exige por parte de los padres y el maestro mucho cuidado para
443. poder orientarlo por un camino no equivocado. En esta etapa, donde los niños tienen entre 9 y 13
444. años, es que realmente ellos necesitan orientación y vigilancia.
445. I: La información de la cual dispongo a través de la profesora Lucía, es que usted tiene muchos
446. años de experiencia, tratando niños con problemas de aprendizaje, conducta o comportamiento. Yo
447. quisiera que usted estableciera una comparación de niños de estas edades que usted mencionó y que
448. son niños preadolescentes, porque están en una edad de transición entre la infancia y la
449. adolescencia. La comparación sobre la cual yo estoy interesado sobre preadolescentes, por ejemplo,
450. de la década de los sesenta, ochenta y noventa.
Valores (culturales) 451. M: ¡Nooo!, como no, son comportamientos muy diferentes; pero muy diferentes. ¡Mire!, antes el
452. mayor pecado que podía cometer el alumno más rebelde, era pegarle chicle en la silla del escritorio
453. del maestro ¡A mí me lo hicieron!; pero ahora uno tiene que tener cuidado, porque el niño que uno
454. menos piensa puede amenazarlo con un arma blanca y hasta de fuego. Son conocidos los casos de
455. alumnos que han amenazado y hasta matado a su maestro por un problema de nota o de que éste le
456. llamó la atención. Son situaciones realmente muy diferentes. Los niños de ahora parece que nacen
457. aprendidos. ¡Mire!, yo ya he perdido mi capacidad de asombro de saber lo que sabe un niño de esa
458. edad. ¡Mire! De sexo sabe hasta el más mínimo detalle. Son niños que se les inculca más violencia a
459. través de programas de televisión, que en esto los padres tienen mucha responsabilidad, porque
460. deberían ayudar a sus hijos a seleccionar los mejores programas, que los hay, a través de la
461. televisión por cable hay muy buenos programas educativos. En conclusión el muchacho de hoy
462. maneja mucha más información que niños de la década de los sesenta, setenta y ochenta no
463 manejaban. No se sorprenda cuando le digo que estos niños de ahora manejan muchas veces más
464. información que nosotros que somos profesionales.
465. I: Profesora la entrevista ha terminado, muchas gracias, le estamos muy agradecidos por su valiosa
Valores (morales) 466. información. Si quiere agregar algo más, se lo agradezco.
467. M: Mi área, es el aprendizaje, pero yo aprovecho mi función para analizar la conducta de muchos
468. niños. Casi siempre lo que ha pasado con niños con problemas de conducta, es porque vienen de
469. hogares de padres divorciados, padres irresponsables o padres que son muy borrachos. Allí radica
131 Continúa
(Continuación)
Rendimiento escolar (bajo) 470. el problema. Por ejemplo, yo estoy tratando un niño que rinde poco y yo llegué a la conclusión
Contexto (familiar)
471. que ese niño es así, porque presenció que su padre se ahorcó, pues eso causó una impresión muy
472. grande en el niño. Ese niño desde ese momento no puede ser el mismo. Eso lo marcará para toda
473. su vida y es allí donde el docente y el padre deben jugar un papel de orientador para que ese niño
474. supere su trauma.
475. ¡Mire! ya que la entrevista ha terminado ¿no podemos oír eso?
476. I: ¿Qué?, ¿cómo dice?
477. M: Que si no podemos oír lo que tú grabaste.
478. I: Sí, como no. Vamos a oírlo.
132 Continúa
Interpretación de la Entrevista
Al interpretar las entrevistas realizadas (Alumno, madre de éste y maestra

orientadora) se destacan los siguientes elementos:
1) Hay dos patrones que contribuyen a caracterizar el comportamiento de los
preadolescentes sujetos a la investigación y los cuales surgen del seno mismo de los
entrevistados. Esos patrones son los siguientes:
- El comportamiento de los niños y los adolescentes depende principalmente de
la formación recibida en el hogar. Si el niño vive y actúan en un hogar desintegrado,
de padres divorciados o muy borracho, es obvio que este comportamiento y situación
de sus padres incidirá negativamente en el comportamiento del niño. Este crecerá
como un niño inestable emocionalmente y tendrá su mal comportamiento como un
escape a su frustración y a sus problemas (Maestra orientadora).
- El niño que me correspondió analizar (Juan José) es de actuación agresiva,
demostrándose con el patrón de la madre: él es muy rebelde, él por nada pelea, él
todo es violencia. Asimismo él mismo afirma que si alguien le dice algo que no le
gusta “le caigo a golpes”.
2) En esta etapa de la vida (la preadolescencia) los niños empiezan a despertar
sus sentimientos de atracción hacia el sexo opuesto y hasta mantener relaciones
sexuales, aunque éstas sean en forma esporádica. Este hecho se manifiesta en la
confesión de Juan José sobre su enamoramiento y su primera relación sexual, a pesar
de ser aún un niño. Asimismo cuando Juan José afirma que uno de sus amigos (el de
13 años) también ha mantenido relaciones sexuales y que sus compañeras de sección
tienen novios, algunos del grado superior (6º grado) y otros que ya no estudian en la
escuela.
3) Los comentarios sobre la comparación generacional del comportamiento
realizados por la orientadora, reafirma que el comportamiento de los niños y
adolescentes tiene un carácter histórico: cambia en el transcurso histórico y se adapta
a la sociedad donde ellos actúan. Igualmente se afirma que el comportamiento de los
niños y adolescentes actuales es más agresivo, lo cual es consecuencia del exceso de
133
violencia en la televisión; siendo este medio comunicacional donde ellos pasan mayor
parte de su tiempo libre.
La Guía de Entrevista. Cuando se aplican entrevistas cualitativas es

recomendable elaborar una Guía de entrevista que será el instrumento de recolección
de datos provenientes de la entrevista. Al respecto Taylor y Bogdan (1.996) realizan
los siguientes comentarios:
En los proyectos de entrevista en gran escala algunos investigadores
utilizan una guía de entrevista para asegurarse de que los temas claves
sean explorados con cierto número de informantes. La guía de la
entrevista no es un protocolo estructurado. Se trata de una lista de áreas
generales que deben cubrirse con cada informante. En la situación de
entrevista el investigador decide cómo enunciar las preguntas y cuándo
formularlas. La guía de entrevista sirve solamente para recordar que se
deben hacer preguntas sobre ciertos temas... (p. 119)
Encuestas
Goetz y LeCompte al referirse a las encuestas expresan lo siguiente:

...En las investigaciones etnográficas, las encuestas se basan en
informaciones reunidas previamente con métodos más informales y
menos estructurados. Una vez realizado este trabajo preliminar, puede
iniciarse la construcción de los instrumentos de la encuesta. Estos suelen
ser de tres tipos: instrumentos de confirmación, instrumentos de
análisis de los constructos de los participantes e instrumentos proyectivos.
(p. 135).
Cuando las autoras mencionan instrumentos de confirmación se refieren a la

confirmación de los datos recogidos a través de los informante claves. El segundo
tipo de instrumentos, dirigidos al análisis de constructos, permiten al investigador
conocer la opinión de los individuos sobre el fenómeno en estudio y para la
construcción de las categorías de análisis en el proceso de obtención de datos. Por
último están las técnicas proyectivas, las cuales permiten al investigador explorar
aspectos encubiertos de la personalidad de los investigados. Entre las técnicas
proyectivas más importantes están la mancha de tinta, las técnicas pictóricas o
134
gráficas, técnicas verbales, recuerdos autobiográficos y técnicas de ejecución de
tareas.
Técnicas no interactivas
Estas técnicas, como fue mencionado, implican poca interacción entre el

investigador y los participantes de la investigación. A continuación se presentan las
técnicas no interactivas más aplicadas en investigación etnográfica:
Observación No Participante
Es aquella modalidad de observación, donde el investigador no convive en el

grupo ni asume roles del mismo. Sólo se limita a observar en aquellos momentos
cuando establece contacto con el grupo de estudio.
Según Goetz y LeCompte, los etnógrafos utilizan tres tipos de observación:
1. Crónicas de Flujos de Comportamiento
Goetz y LeCompte al respecto expresan:
El registro y análisis de flujos de comportamiento en crónicas narrativas,
descrito por Barker (1.983), requiere descripciones exactas, minuto a
minuto, de lo que un participante dice y hace. Estos comportamientos
pueden ser filmados, grabados o anotados. La descripción de Barker y
Wright (1.951) de un día en la vida de un niño de 7 años quizá sea el
ejemplo extremo de esta estrategia. Con más frecuencia, los etnógrafos
efectúan un muestreo entre participantes, acontecimientos y escenarios y
elaboran crónicas relevantes para los principales temas y cuestiones de
sus estudios. (p. 153).
Goetz y LeCompte mencionan algunas investigaciones que usaron la técnica de

flujos de comportamiento: efectos de la enseñanza escolar sobre los niños de cultura
africana tradicional, comparación de pautas de comportamiento de niños de seis
culturas, Desarrollo de una taxonomía de la conducta de escolares de tercer grado en
el aula y análisis comparativo de las conductas normativas de cuatro profesores de
educación Básica.
135
2. Kinesia y Proxemia. Para Goetz y LeCompte: “La Kinesia y la proxemia
estudian el movimiento corporal y los usos sociales del espacio (...) La incorporación
de registros observacionales centrados en aspectos proxémicos y kinésicos es
particularmente útil cuando el foco de la investigación es el uso del espacio del aula o
las pautas de la interacción profesor-alumno”. (p. 154)
3. Protocolos de análisis de interacción: Estos se componen por sociogramas,
sistemas estandarizados de clasificación de los comportamientos y otros instrumentos
que registren la forma como interactúan los participantes de la investigación.
Ejemplo de un caso de observación no participante
Se presenta la transcripción de una observación no participante realizada a

preadolescentes de quinto grado de Educación Básica en junio de 1.999. Esta
observación se realizó en una actividad cuyo propósito fue establecer rapport con el
grupo, donde se perseguía describir su comportamiento.
136
Observación No Participante sobre el Comportamiento de Preadolescentes
Fases Línea Texto Pág. 1

Investigador (observación no participante en una convivencia realizada en la U.E. Stella Cechini,
con los alumnos de la sección de quinto grado a investigar). Código: 2.2.
1. Se acordó en una reunió previa del equipo, encontrarnos el día sábado 12 de junio, a las 9 de la
2. mañana en la puerta principal de la escuela. Cuando llegué (exactamente a las 9), ya habían llegado
3. dos integrantes del equipo: Moraima y Fernando. A las 9:30 llegó la profesora Lucía, quien fue,
4. además de integrar el equipo, nuestra informante y maestra de la sección de quinto grado que nos
5. proponíamos indagar sobre su comportamiento. A esa hora ya estaban presentes todos los
Inspección ocular a 6. integrantes del equipo. Fernando y yo realizamos una inspección ocular a la escuela; la cual ocupa
la escuela 7. una manzana completa, fuimos hasta el fondo de la escuela ahí vimos las paredes, Fernando expresó
8. a esos bloques muchas veces se les desprende solo parte del material. Esta escuela yo la veo muy
9. bien mantenida y bonita, continuó diciendo Fernando, de repente Agustín andamos buscando algo
Apariencia de los 10. que no existe (la agresividad en los niños). Yo vi unos niños de la sección y no tienen apariencia de
niños 11. agresivos. Le respondo a Fernando: espérate, aún es muy prematuro para hacer afirmaciones sin
12. fundamento. Recuerda esta es nuestra primera visita a la escuela y aún no hemos tenido contacto
13. con los niños, yo aún ni siquiera he visto al primero. Continuó Fernando diciendo: a lo mejor lo que
14. existe es un simple problema de indisciplina, hecho muy normal en niños de esta edad. Yo creo que
15. es muy tajante hablar de agresividad en esta escuela. Yo le respondí a Fernando: vamos a ver que
16. encontramos, por ahora no debemos asumir posiciones prejuiciadas. Antes de comenzar con la
17. agenda propuesta, solicité a Lucía que me informara dónde estaba el baño (lo hice no tanto para
18. satisfacer una necesidad fisiológica, sino porque en los baños generalmente, y más los de una
19. institución escolar, hay graffitis muy reveladores). Ella me llevó hasta la puerta del baño, le advertí
20. a Lucía que tenía un letrero que decía: Hembras, ella me respondió que entrara, porque el de los
21. varones debería “estar hecho un desastre”, lo hice pensando en los graffitis, habían varios nombres
22. femeninos, acompañados del adjetivo Puta, todos con letras diferentes. Entré después al baño de los
23. varones y contrario a lo que creía, no había ningún graffiti ni tampoco tenía un aspecto
24. antihigiénico. Le comenté a Lucía lo de los graffitis. Ella me dijo que una niña (la que entrevistó
Atención 25. Moraima) le expresó que yo había entrado al baño de las hembras. Comenzamos a las 10: revisamos
26. la agenda, como primer punto fue la presentación, para lo cual conformamos parejas, donde uno
137 Continúa
Continuación
Fases Línea Texto Pág. 2
27. presentaba al otro y viceversa. A mi me correspondió presentar a un niño de 11 años que consideré a
28. simple vista inteligente. Lucía me confirmó que era muy estudioso, hijo único y los padres
29. extremaban los cuidados sobre él. Cuando le dije en la conversación al niño que era sociólogo, me
30. preguntó ¿¡qué es eso!? ¿Cómo los psicólogos?, yo le respondí incómodo, pero sin demostrárselo,
31. esa pregunta que me han hecho muchas veces. Las presentaciones fueron muy jucosas. Algunos no
32. recordaban la información que le dio su pareja para que lo presentara, sobretodo cuando la pareja
33. era uno de nosotros. Hubo un niño, que Lucía clasificó entre los más indisciplinados y de bajo
34. rendimiento, que la información transmitida a su pareja (Moraima) fue la de un niño de excelente
35. rendimiento. Esto causó mucha risa entre sus compañeros.
Juegos 36. Como siguiente punto hubo actividad deportiva, Fernando asumió el papel de guía deportivo. Yo me
37. concentré a observar esos niños que al principio “no nos quitaban los ojos de encima”, pero el juego
38. les hizo olvidar nuestra presencia. Su interés ahora era jugar, correr, gritar y hasta llorar. Varios
39. niños se acercaron a su maestra Lucía para acusar a otros, algunos de ellos llorando.
Chistes 40. Lucía llamaba la atención muy dulcemente. Ahí estaba el niño que me correspondía entrevistar:
41. rebotando contra el piso un balón. Yo le pregunté ¿por qué no juegas con el resto de tus
42. compañeros?. El me respondió que quería jugar solo. Ahí entendí que estaba en presencia de un
43. niño huraño. Al discutir con Lucía este hecho me comentó que realmente era un niño muy
44. asociable; pero en el caso particular de los juegos deportivos, lo rechazaban sus compañeros porque
45. su actuación era muy torpe y contribuía a la pérdida de juegos de su equipo.
46. La siguiente actividad fue la de contar chistes, los cuales era demasiado “Picantes” y con mucho
47. “doble sentido”. Me sorprendió su capacidad para contar chistes con tanto contenido sexual.
Canciones 48. Luego cantamos una canción (Mulato), canción que fue ensayada antes de cantarla y con ayuda de
Cuestionario 49. su reproducción en un casette. De inmediato los niños llenaron un cuestionario auto-administrado,
50. donde se solicitaba información que permitió explorar el grupo. Para llenar el cuestionario se
51. sentaron o acostaron en el piso de un salón sin paredes. Al revisar los cuestionarios observé una
52. pésima caligrafía y ortografía. Como actividad de cierre oímos canciones y compartimos un
Despedida 53. refrigerio, el cual los niños y nosotros comimos con mucho apetito. Se despidieron los niños.
54. Algunas niñas se despidieron de nosotros con un beso. Salieron mucho más habladores y juguetones
138 Continúa
Continuación
Fases Línea Texto
55. de como llegaron.
Entrevistas 56. Antes de irnos, nos distribuimos las entrevistas. A mí me correspondió
57. orientadora del plantel, un alumno y su madre. Lucía me advirtió que
58. entrevistar era demasiado cerrado. Ella y la madre de éste hacían esfuerzo
59. pero era importante entrevistarlo porque había sido protagonista de varias e
139
Hay programas computarizados, entre los cuales está el Atlas ti, que facilita la
transcripción e interpretación de entrevistas y observaciones cualitativas. Los mismos
contribuyen a reducir lo laborioso de la transcripción e interpretación de ambos
instrumento cualitativos.
Recogida de Artefactos
Los artefactos pertenecientes a la cultura estudiada representan una fuente de

datos de extraordinaria importancia para la investigación. Hay algunas disciplinas,
como la historia y la antropología, que sustentan su investigación en datos
provenientes de artefactos.
A continuación se describen dos tipos de recogida de artefactos:
(a)Recogida de datos demográficos y de archivos: como correspondencias, lista
de asistencia, actas de reuniones, libros texto, guías curriculares, lista de
matrícula, expedientes de alumnos, apuntes de clase; (b) Recogida de vestigios
físicos: como símbolos, número (disminución o incremento en el tiempo) de
objetos como equipos audiovisuales, espacios escolares, espacios
recreacionales, equipos almacenados sin o con uso, deterioro o mantenimiento
de la planta física.
Técnicas e Instrumentos de Datos en Investigación-Acción
La Investigación Acción usa técnicas e instrumentos de recolección de datos,

fundamentalmente cualitativos, aunque no rechaza los cuantitativos; pero siempre
subordinados a los que proporcionan datos cualitativos.
Pérez Serrano (1.994) establece la siguiente clasificación de técnicas e
instrumentos más usualmente aplicados en Investigación-Acción:
1. Técnicas de lápiz y papel:
- Notas de campo.
- Diarios, anécdotas, impresiones, comentarios en vivo, informes descriptivos.
140
- Cuestionarios.
- Pruebas documentales.
2. Las denominadas técnicas “vivas”:
- Sociogramas, sociodramas, teatro popular.
- Entrevistas y discusiones de grupo.
- Estudios de casos.
3. Técnicas de carácter audiovisual:
- Diapositivas y fotos.
- Grabaciones de audio.
- Grabaciones de video.
Usualmente sobre un mismo fenómeno, hecho o situación se aplican más de
una técnica o instrumento con la finalidad de comprobar la validez de la
investigación. Este procedimiento se conoce como triangulación. Este tema se aborda
en el capìtulo XIII, donde se explica el proceso de validación de investigaciones
cualitativas.
Ejercicio Propuesto
Elabore una guía de entrevista tomando en cuenta lo expresado por Taylor y

Bogdan. Con este propósito seleccione un tema de entrevista y realice una entrevista,
de acuerdo a los criterios establecidos en esta Unidad.
141
Referencias
Goetz, J. P., Y LeCompte, M.D. (1.988). Etnografía y diseño cualitativo en

investigaciones educativas. Madrid: Morata.
Pérez Serrano, G. (1.994). Investigación cualitativa: Retos e Interrogantes: I

Métodos. Madrid: La Muralla.
Taylor, S., J., y Bogdan, R. (1.996). Introducción a los métodos cualitativos de

investigación. Buenos Aires: Paidòs.
Lecturas Sugeridas

investigaciones educativas. Madrid: Morata. Se recomienda el Capítulo V:
Estrategias de recogida de datos. El contenido de este capítulo es el siguiente:
Elección de los métodos de recogida de datos, Métodos interactivos, Métodos no
interactivo y Recogida de artefactos.
Pérez Serrano, G. (1.994). Investigación cualitativa: Retos e Interrogantes: I

Métodos. Madrid: La Muralla. Se recomienda el Capítulo IV: La Investigación-
Acción. Apartado: Técnicas e instrumentos de recogida de datos.
Taylor, S., J., y Bogdan, R. (1.996). Introducción a los métodos cualitativos de

investigación. Buenos Aires: Paidos. Se recomienda el capítulo 4: La entrevista
en profundidad; cuyo contenido es el siguiente: Tipos de entrevistas, Optando por
entrevistar, La selección de informantes, Aproximación a los informantes, El
comienzo de las entrevistas, La guía de entrevista, La situación de entrevista, El
sondeo, Controles cruzados, Las relaciones con los informantes, Entrevistas
grabadas y El diario del entrevistador.
142
CAPÌTULO VIII
OPERACIONALIZACIÓN DE VARIABLES
Objetivo
Al finalizar este capìtulo, el estudiante será capaz de elaborar el cuadro de

operacionalizaciòn de la variable y evaluar el proceso de operacionalizaciòn en
trabajos de grado.
La recolección de los datos es una fase que no debe descuidarse cuando se

realiza una investigación, porque de los datos recogidos depende en gran medida la
calidad de la investigación, y por ende, la validez de los resultados obtenidos y de las
conclusiones. Es por esta razón que la obtención de los datos necesarios para
describir o contrastar una variable debe realizarse a través de un proceso ordenado
previamente a su recolección; siendo precisamente el propósito de la
operacionalización de una variable, planificar la obtención de los datos para asegurar
que los mismos se obtengan a través de un proceso planificado y no producto de la
improvisación y del recuerdo del investigador en el momento de realizar la
recolección de los datos.
La intención de este trabajo es explicar el proceso de operacionalización de una
variable, tomando en cuenta ejemplos prácticos de investigaciones educativas y
estableciendo la correspondencia que debe existir entre los objetivos y las bases
teóricas con las dimensiones, indicadores y el dato a obtener.
En lo referente a la correspondencia entre los objetivos y bases teóricos con las
dimensiones, indicadores y los datos, se tomó como guía las normas exigidas por la
Universidad Pedagógica Experimental Libertador (UPEL), las cuales se establecen en
el Manual de Trabajos de Grado de Especialización y Maestría y Tesis Doctorales.
143
Tomando en cuentas los requisitos exigidos, se recomienda la formulación de
objetivos de acuerdo a las modalidades y tipos de investigación incluidas en el
Manual mencionado. Esto no significa que este trabajo sea dirigido solamente a
investigaciones realizadas a través de las normas de la UPEL, porque el proceso de
Operacionalización debe realizarse en cualquier tipo de variable, incluso en aquéllas
insertas en el paradigma cualitativo.
Definición y Propósito de Operacionalización de la Variable
La operacionalización de la variable es un proceso de desagregación de una

variable, a la cual se desea medir o describir mediante la aplicación de un instrumento
de recolección de datos. El proceso se inicia desde su composición más general que
son las dimensiones y subdimensiones, hasta su expresión más concreta representada
por los indicadores, subindicadores e ítemes. Cada uno de los componentes de la
operacionalización están interrelacionados entre sí, siendo el item una expresión tanto
del indicador (y subindicador si existe) como de la dimensión (y subdimensión si
existe), en otras palabras, los ítemes deben ser formulados tomando en cuenta tanto
los indicadores como las dimensiones de la variable.
Se puede definir la dimensión como la descomposición de una variable en su
forma más general; de la cual, debido al nivel de abstracción, no permite la
formulación de los ítemes. Se requiere para la redacción de los ítemes un nivel de
concreción, el cual se obtiene a través de los indicadores.
En cuanto al propósito de la operacionalización, ésta se elabora para planificar
el proceso requerido en la construcción de un instrumento. Es inadecuado y poco
recomendable formular ítemes (o buscar datos), sin que éstos formen parte de un
proceso planificado. La operacionalización de la variable permite formular ítemes en
correspondencia con los objetivos y las bases teóricas de la investigación e impide
que los ítemes se formulen de manera improvisada y sean producto de lo recordado
en el momento en que se formulan.
144
Es necesario aclarar la duda de investigadores y tesistas, quienes se preguntan si
todos los instrumentos de recolección de datos necesitan someterse al proceso de
operacionalización de la variable. Se responde que la formulación de los ítemes de
cualquier instrumento requiere un proceso de planificación. En el caso de las pruebas
de rendimiento académico, la operacionalización de la variable es sustituida por la
tabla de especificaciones de la prueba; siendo la misma, el proceso de planificación
adecuado para la formulación de los ítemes. Cuando el instrumento es un cuestionario
de opinión, una escala de actitud, de motivación, desempeño, etc. se elabora la matriz
de operacionalización, tal como se desarrolla en la sección correspondiente a la
misma. En las investigaciones documentales tambièn se recomienda la
operacionalizaciòn de variables. En esta modalidad de investigación el instrumento de
recolección de datos es generalmewnte la ficho de registro.
La Operacionalización de la Variable y los Objetivos de la Investigación
Se presentará, a manera de ejemplo, las siguientes modalidades o tipos de

investigación, de acuerdo al Manual de Trabajos de Grado de Especialización, y
Maestría y Tesis Doctorales de la UPEL:
Proyecto Factible
De acuerdo al Manual de Trabajo de Grado de Especialización y Maestría y

Tesis Doctorales de la UPEL, el proyecto factible es una modalidad de investigación.
La formulación de los objetivos que se recomienda son los siguientes:
Objetivo General:
- Proponer un plan …
ó
- Proponer un proyecto …
Objetivos Específicos:
145
1. Determinar la necesidad de un plan (o proyecto) …
2. Determinar la factibilidad del plan (o proyecto) …
3. Diseñar el plan (o proyecto) …
Cuando se operacionaliza la variable en los proyectos factibles, ésta se formula
en términos de necesidad, ya que la realización de un proyecto factible requiere
determinar la necesidad del proyecto. Al respecto la UPEL (2.003) expresa lo
siguiente: “El proyecto factible consiste en la investigación, elaboración y desarrollo
de una propuesta de un modelo operativo viable para solucionar problemas,
requerimientos o necesidades de organizaciones o grupos sociales…” (p. 16). Se
deduce que el proyecto factible justifica su elaboración y ejecución en determinar la
existencia de un problema que requiere como necesidad un proyecto de solución al
mismo. De ahí que en las investigaciones bajo la modalidad de proyecto factible se
crea una variable para determinar la necesidad de la propuesta. Esta variable permite
también la elaboración del diagnóstico que es la primera fase de un proyecto factible.
Es importante hacer referencia a la polémica existente sobre los objetivos 2 y 3
de un proyecto factible. Hay quienes afirman que es incorrecto desarrollar primero la
factibilidad del proyecto y luego diseñar el proyecto. Señalan como ejemplo que
cuando se construye un edificio antes de determinar la factibilidad hay que elaborar el
proyecto; porque es en función de éste que se determina la factibilidad. De acuerdo a
este criterio, no se puede determinar la factibilidad sin elaborar el proyecto.
Igualmente (expresan) sucede cuando se diseña un programa de formación docente,
para determinar la factibilidad del programa hay que hacerlo en función del programa
de formación docente ya elaborado.
Se considera este criterio equivocado, porque cuando se habla de estudio de
factibilidad, es para referirse a una apreciación general del proyecto o programa en
estudio. A esta etapa corresponde el estudio de mercado, estudio técnico y estudio
financiero. En esta fase se estudia la demanda y oferta del producto (se entiende por
producto el bien o servicio que se ofrece, en el caso educativo el producto son
docentes capacitados, laboratorio construido, etc.). Asimismo se estudia las
especificaciones del producto e insumos y la disponibilidad de recursos financieros,
146
también los aspectos organizacionales y jurídicos en líneas generales. Si estos tres
aspectos son viables (demanda y oferta del producto, estudio técnico y financiero) se
considera factible el plan, programa o propuesta en estudio y se puede pasar al
cumplimiento del objetivo 3: Diseñar el proyecto, programa, plan o propuesta. En
esta última fase, se elabora la propuesta que puede ser un plan, programa o proyecto,
para lo cual hay que desarrollarla al mayor nivel de concreción y considerando el
mínimo detalle. Si la propuesta es un plan de formación docente, debe detallarse los
costos bien especificados, así como la inversión. También debe diseñarse los cursos y
talleres a nivel de detalle, así como todos los aspectos involucrados en la propuesta.
Hay quienes denominan a esta fase “Factibilidad del Proyecto”, y la fase anterior
“prefactibilidad del proyecto, pero ambas fases: prefactibilidad y factibilidad,
equivalen en este caso a la factibilidad y propuesta definitiva respectivamente.
Se desea reafirmar el graso error en el cual incurren quienes desarrollan primero
la propuesta o proyecto definitivo para posteriormente desarrollar la factibilidad de la
propuesta. Imaginemos un arquitecto e ingeniero que primero realiza el proyecto
definitivo: la maqueta, microlocalización de un edificio, estudio de suelos, planos de
ingenierìa civil, electricidad y de aguas blancas y servidas. En resumen elabora el
proyecto de ingeniería, realiza una preinversión millonaria, y posteriormente
determina el estudio de mercado, disponibilidad de recursos técnicos y financieros, es
decir, el estudio de factibilidad; concluyendo que el proyecto realizado no es factible.
Es por esta razón que se considera incorrecto desarrollar primero la propuesta para
después determinar la factibilidad de la misma. Se ha enfatizado en este aspecto,
porque es frecuente en el mundo de los proyectos pasar de la idea a la propuesta o
proyecto definitivo, obviando la factibilidad (o prefactibilidad) del proyecto. Este
error ha originado que los proyectos fracasen; porque demuestran inviabilidad en su
fase de ejecución y funcionamiento.
En cuanto al proceso de operacionalización, ésta se realiza para satisfacer el
cumplimiento del primer objetivo específico: Determinar la necesidad de la
propuesta, porque es este objetivo el que requiere un instrumento para su
cumplimiento. El desarrollo de los otros objetivos: el estudio de factibilidad y diseño
147
de la propuesta, siguen un proceso metodológico diferente. La determinación de la
necesidad, además de cumplir con un requisito de la UPEL, permite, como fue
mencionado, realizar el diagnóstico que es la primera fase de los proyectos factibles.
Para concluir este punto se recomienda a quienes realizan el proceso de
operacionalización formular los ìtemes en función de la necesidad o importancia de la
propuesta. Es común en un número importante de instrumentos; cuyo propósito es
determinar la necesidad de la propuesta, observar ítemes redactados en términos que
no determinan necesidad, lo cual origina el no cumplimiento del propósito del
instrumento.
Proyecto Especial
Los proyectos especiales es otra modalidad de investigación incluida en el

Manual de Trabajo de Grado de Especialización y Maestría y Tesis Doctórales de la
UPEL. La presentación de los objetivos que se recomienda para esta modalidad son
los siguiente:
Objetivo general: Proponer un software (ó estrategia, carta geográfica, texto,
etc.)…
1. Determinar la necesidad de un software (ó estrategia, carta geográfica, texto,
etc.)…
2. Diseñar el software (ó estrategia, carta geográfica, texto, etc.)…
3. Validar un software (ó estrategia, carta geográfica, texto, etc.)…
Según el Manual de Trabajos de la UPEL, se habla de proyectos especiales
cuando se está en presencia de “creaciones tangibles”, como un software educativo,
una estrategia instruccional, un manual, guía o carta sobre algún aspecto determinado.
Para la UPEL, los proyectos especiales deben “…ser utilizados como soluciones a
problemas demostrados o que responden a necesidades e intereses de tipo cultural…”
(p. 8).
148
Al igual que los proyectos factibles, los proyectos especiales deben demostrar
que la creación (software, manual, guía, etc.), obedece a una necesidad o que la
misma es considerada importante por potenciales usuarios. Al respecto la UPEL
(2.003) expresa: “Los proyectos especiales, en todos los casos, deben incluir la
demostración de la necesidad de la creación o de la importancia del aporte según el
caso…”(p. 17). Tomando en cuenta esta exigencia de la UPEL sobre los proyectos
especiales es que se recomienda formular el primer objetivo: Determinar la necesidad
de un software (ó estrategia, carta geográfica, etc.)… Para cumplir este objetivo se
aplica un instrumento a los usuarios o beneficiarios de la creación, siendo el propósito
del mismo determinar la necesidad de la creación. El segundo objetivo consiste en
diseñar la creación, y el tercero, en validar la creación, para ello, debe someterse la
creación, a la validación tecnológica (a través de la evaluación de la creación por
expertos en la materia) y de campo (aplicación de la creación a una muestra de los
usuarios de la misma, para posteriormente determinar su viabilidad).
Al igual que en los proyectos factibles, debe tenerse sumo cuidado que los
instrumentos diseñados para determinar la necesidad de una creación, estén
conformados por ítemes orientados a determinar la necesidad de esa creación, porque
de no ser así, el instrumento no cumplirá con su propósito. La formulación de los
ítemes debe estar en correspondencia con la variable que se desea determinar, sus
dimensiones e indicadores, porque entre todos estos aspectos existe un proceso
interdependiente.
Estudios para determinar actitudes
La actitud se puede determinar, tal como se analizó en el capìtulo IV, a través de

diferentes métodos; pero el más usual es la escala de número y de ésta la escala
Likert. Es por esta razón que se desarrollarán los objetivos de los estudios de actitud
cuando corresponden a una escala de actitud tipo Likert.
A diferencia de los proyectos factibles y los proyectos especiales, donde
generalmente se determina la variable a través de un cuestionario de opinión (aunque
149
no necesariamente, porque en estas modalidades de investigación se puede aplicar
como instrumento una escala de necesidad o utilidad), una escala de actitud se aplica
para describir o evaluar un aspecto de interés y puede corresponder a un estudio de
carácter descriptivo, bajo la modalidad de campo, tipo encuesta (si se desea estimar
estadísticamente la actidud de una población determinada), o un estudio de carácter
evaluativo, tipo diseño cuasiexperimental (si se desea determinar el efecto de una
estrategia instruccional sobre la actitud, aplicando una escala de actitud como pretest
y postest) ó un estudio de casos, de carácter exploratorio o descriptivo, donde se toma
una muestra no probabilística.
De acuerdo a lo planteado, los objetivos de estudios de actitudes, aunque sea
una escala de actitud tipo Likert, varían en consideración a la modalidad o tipo de
investigación.
A continuación se desarrolla un ejemplo ilustrativo:
Caso de estudio de actitud, de carácter descriptivo, modalidad de campo y tipo

encuesta
Objetivo General:
Analizar la actitud del docente de la I etapa de Educación Básica del Estado
Lara hacia la investigación cualitativa.
1. Describir la actitud del docente de acuerdo a variables personas (sexo, edad) y

profesionales (nivel académico, grado que administra, medio geográfico donde labora
del docente, años de servicio).
2. Estimar la actitud promedio del docente a nivel del Estado Lara hacia la
investigación cualitativa.
3. Estimar la actitud promedio del docente por dimensiones (cognoscitiva, afectiva y
conductual).
150
4. Estimar la actitud promedio del docente hacia la investigación cualitativa por
Municipio.
Estudios Tipo Cuasiexperimental
Si se tiene como tema de estudio una Estrategia Innovadora de Comprensión

Lectora en Alumnos de Sexto Grado de Educación Básica y el tipo de investigación a
realizar es Cuasiexperimental (porque se contrastará la eficacia de la estrategia a
través de un grupo experimental, a quien se le aplicará la estrategia de comprensión
lectora innovadora, y un grupo control, a quien se le aplicará la estrategia de
comprensión lectora tradicional), los objetivos comúnmente formulados son los
siguientes:
Objetivo General
Evaluar el efecto de la estrategia de comprensión lectora en el rendimiento de

Castellano y Literatura de alumnos de sexto grado de Educación
Básica
Objetivos Específicos
1. Diagnosticar el nivel de comprensión lectora de los alumnos

2. Diseñar la estrategia tomando como referencia el programa de Castellano y
Literatura, correspondiente al sexto grado de Educación Básica
3. Ejecutar la estrategia de comprensión lectora
4. Comparar el nivel de comprensión lectora del grupo experimental y control,
antes y después de la aplicación de la estrategia.
En este caso se requiere un instrumento para diagnosticar el nivel de
compresión lectora (vinculado al objetivo 1) y para comparar el nivel de
151
compresión lectora en los grupos experimental y control antes y después de
aplicar la estrategia (objetivo 4). En ambas situaciones (en el diagnóstico y
comparación de las calificaciones del grupo experimental y control) se aplica el
mismo instrumento que en este caso es una prueba de nivel de conocimiento
sobre compresión lectora o sobre una asignatura donde la estrategia puede tener
un efecto directo ( en este caso la asignatura Lengua y Literatura).
Correspondencia de la Operacionalización de la Variable con las Bases Teóricas de la

Investigación
Se afirmó que los ítemes deben formularse en correspondencia con los

indicadores, dimensiones y la variable en estudio. El lector seguramente se preguntará
¿En función de qué se plantean las dimensiones e indicadores? Es importante
dilucidar esta interrogante, porque en algunos casos las dimensiones e indicadores se
plantean sin tomar en cuenta lo abordado en las bases teóricas de la investigación y
tanto las dimensiones e indicadores de una variable deben reflejar la concepción
teórica que el investigar o tesista asumió cuando elaboró las bases teóricas.
Por ejemplo sí se operacionaliza la variable actitud del docente de la I etapa de
Educación Básica hacia la evaluación de los aprendizajes de acuerdo al Currículo
Básico Nacional, se plantean las dimensiones en función de los componentes de la
actitud: (a) cognitiva (b) afectiva, y (c) conductual; y los indicadores se plantean de
acuerdo a lo abordado en el Currículo Básico Nacional sobre evaluación de los
aprendizajes. En las bases teóricas debe analizarse las tres dimensiones, las cuales
están en correspondencia a la actitud, y el contenido del Currículo en lo referente a la
evaluación de los aprendizajes, lo cual sustenta a los indicadores.
Construcción de los Ítemes
Los criterios para la construcción de ítemes depende en gran medida del tipo de
instrumento del cual forman parte. El lector puede consultar los capìtulos anteriores a
152
éste donde se analiza el diseño de diferentes tipos de instrumentos. Sólo se quiere
enfatizar lo mencionado en puntos anteriores de que los ítemes deben formularse en
correspondencia a la variable en estudio, las dimensiones e indicadores; para lo cual
el investigador debe apoyarse en los objetivos de la investigación y las bases teóricas.
Matriz (Cuadro) de Operacionalización de la Variable

La matriz de operacionalización, o cuadro de operacionalizacòn como se conoce
tambièn, es el producto obtenido del proceso de operacionalización de la variable. En
ella debe presentarse a manera sinóptica el nombre y definición de la variable ó
variables a operacionalizar, el propósito del instrumento, las dimensiones, indicadores
y la identificación de los ítemes que conforman el instrumento.
A continuación se presentan ejemplos de la matrices de operacionalización:
Ejemplo 1
Operacionalización de la variable Comprensión Lectora
Variable Propósito del Dimensiones Indicadores Item
Instrumento
Comprensión Determinar el Nivel de Reconocimiento de
lectora nivel de descodificación. palabras.
conocimiento Asignación de
de alumnos de significado de léxico.
sexto grado de
Educación Nivel de comprensión Comprensión explícita en
Básica sobre literal. el texto.
comprensión
lectora.
Nivel de comprensión Elaboración semántica
inferencial profunda.
Nivel de
metacomprensión. Reflexión.
Nota: Tomado de Laguna, 2001.
153
Ejemplo 2
Operacionalización de la variable Conocimiento del Docente de la Segunda

etapa de Educación Básica sobre orientación de la sexualidad
Variable Propósito del Dimensiones Subdimensiones Indicadores Item

Instrumento
Conocimiento Determinar el Conocimientos Aspectos básicos -Sexualidad
del Docente de nivel de teóricos sobre de sexualidad. -Sexo
la Segunda conocimiento sexualidad. -Identificación sexual
etapa de del Docente de -Desarrollo sexual
Educación la Segunda -Madurez sexual
Básica sobre etapa de
orientación de Educación
la sexualidad Básica sobre
orientación de
la sexualidad
Aspectos básicos del Consideraciones -Estructura del aparato
aparato genital anatómicas genital masculino y
masculino y femenino
femenino
Estrategia de Actividades de -Conversaciones i-
abordaje de la orientación informativas
sexualidad -Discusiones grupales
-Realización de talleres
informativos
Aspectos Físicos -Desarrollo pondo-estatural.
relacionados con el -Caracteres sexuales
alumno, primarios.
considerados por el -Caracteres sexuales
docente para la secundarios.
orientación sexual. Biológicos -Cambios hormonales
-Menarquía
-Ciclo menstrual
-Eyaculación
Psicológicos -Elaboración de la propia
identidad.
-Planteamientos de metas.
-Afianzamiento de
relaciones interpersonales.
Salud -Enfermedades de
transmisión sexual.
-Embarazo precoz.
-Prostitución infantil.
Nota: Tomado de Torres, 2001.
154
Ejemplo 3
Conceptualización y Operacionalización de las Variables Actitud del docente de la

primera etapa de Educación Básica hacia la evaluación de acuerdo al
Currículo Básica Nacional
Variables Definición de la Dimensiones Sub-Dimensiones Indicadores Items
Variable (versión
preliminar)
Fundamentación Evaluación 4,16
Cualitativa.
Evaluación Integral. 20,27
Evaluación Continua.
Evaluación 8,36
Cooperativa.
13,11
Tipos de evaluación Explorativa. 23,1
Formativa. 40,38
Final. 26,7
Formas de Autoevaluación 9,29
evaluación Coevaluación 6,37
Predisposición
Actitud del Heteroevaluación 2,33
del docente (a
docente hacia Planificación de la El qué evaluar. 35,10
creer, sentir y Componente
la evaluación evaluación El cómo evaluar. 31,39
actuar) hacia la Cognoscitivo
de los El cuándo evaluar 18,5
evaluación de los
aprendizajes El con qué evaluar 22,14
aprendizajes
Procedimientos e -Observación 15,17
instrumentos de sistemática
evaluación -Análisis de 28,19
producción de los
alumnos
-Pruebas utilizadas en 32,24
el aula
-Intercambios orales 34,30
con el alumno.
-Autoreportes
-Técnicas 21,12
sociométricas 25,3
155
Ejemplo 3 (cont.)

Variable (versión
preliminar)
Fundamentación Evaluación Cualitativa. 49,74
Evaluación Integral.
Evaluación Continua. 65,66
Evaluación
Cooperativa. 71,59
47,61
Formativa. 70,57
Final. 43,44

Heteroevaluación 52,64
Componente Planificación de la El qué evaluar. 54,53

evaluación El cómo evaluar. 58,62
Afectivo
El cuándo evaluar 76,80
El con qué evaluar 56,77

evaluación -Análisis de producción 72,63
de los alumnos
-Pruebas utilizadas en el
aula 50,75
-Intercambios orales
con el alumno. 78,48
-Autoreportes
-Técnicas sociométricas
79,51
46,69
156
Ejemplo 3 (cont.)

Variable (versión
preliminar)
Fundamentación Evaluación Cualitativa. 95,96
Evaluación Integral.
Evaluación Continua. 94,93
Evaluación
Cooperativa. 89,86
85,82
Formativa. 90,87
Final. 81,99

Heteroevaluación 84,101
Componente Planificación de la El qué evaluar. 108,114

evaluación El cómo evaluar. 102,107
Conductual
El cuándo evaluar 113,118
El con qué evaluar 106,100

evaluación -Análisis de producción 110,105
de los alumnos
-Pruebas utilizadas en el
aula 116,103
-Intercambios orales
con el alumno. 119,117
-Autoreportes
-Técnicas sociométricas
120,115
112,109
157
Ejemplo 3 (cont.)
Variables Definición de la Variable Indicadores Items

1. 18 a 23 años
2. 24 a 29 años
Tiempo transcurrido del
docente desde su nacimiento 3. 30 a 39 años
Edad hasta el momento de aplicación 6
del instrumento de esta 4. 40 a 49 años
investigación.
5. 50 a 59 años
6. 60 y más años
1. Masculino
Diferencia física y constitutiva
Sexo 7
del hombre y de la mujer
2. Femenino
4. Profesor o Lic. en educación
3. T.S.U. en educación
Grado académico alcanzado por
Nivel de Instrucción 8
el docente
2. Maestro / Br. Docente
1. No graduado
1. Urbana
Se refiere a si la escuela donde
Ubicación geográfica de labora el docente está ubicada
3
la Escuela en una zona considerada como
urbana o rural
2. Rural
1. Menos de 5 años
2. 5 a 10 años
Se refiere a los años que tiene el
Años de servicio como
docente trabajando como 3. 11 a 15 años 9
docente
docente
4. 16 a 20 años
5. Más de 20 años
Nota: Tomado de Suárez, 2001
158
Ejemplo 4
Definir las variables Dimensiones Subdimensiones Indicadores Item

o constructo en
estudio
Nivel socio Nivel Social Grado de
económico de la Instrucción
cohorte 2000, II Nivel
lapso de Postgrado, Económico Ingresos, tipo de
mención Educación vivienda, zona de
Superior, UPEL- residencia
IPB
Rendimiento Calificaciones
académico
Actitud hacia la Cognoscitiva, Enfermedades Causas de cada
prevención del Afectiva, cancerígenas enfermedad
cáncer Conductual
Necesidades de Enfermedades Síntomas de cada
prevención de por el uso del enfermedad.
enfermedades por el computador.
uso del computador. Medidas
Prevención de preventivas.
enfermedades
por el uso del
computador.
Se observa en los ejemplos, que la operacionalización se realiza tomando en

cuenta la especificidad de la variable. En algunos casos se requiere formular
dimensiones, subdimensiones e indicadores, como es el caso del ejemplo 2 y 3.
Cuando la variable que se operacionaliza es actitud, tiene dos descriptores, uno
correspondiente a la actitud y el otro referido al objeto de la actitud (ejemplo 3). Es
recomendable en este caso, formular las dimensiones en función de los componentes
de la actitud; y los componentes del objeto o sujeto a quien se desea medir la actitud,
considerarlo como subdimensión y los indicadores diseñarlos de acuerdo a como se
descompone o subdivide el objeto de la actitud. Al formular los ítemes se debe tener
159
cuidado de tomar en cuenta no sólo los indicadores, sino las dimensiones y
subdimensiones.
El ejemplo 2, es un caso donde también se incluyen subdimensiones, con la
diferencia que el tipo de instrumento diseñado es una prueba de nivel de
conocimiento. En el ejemplo 1, la variable operacionalizada es tambièn el nivel de
conocimiento y el instrumento es igualmente una prueba de nivel de conocimiento;
pero en este caso, la autora no formuló subdimensiones. En el ejemplo 4, se presenta
un resumen de casos de operacionalización variables. Se observa un caso donde se
operacionaliza la variable, rendimiento académico, solamente con indicadores,
porque su nivel de concreción se obtiene con calificaciones, sin necesidad de plantear
niveles más generales como son las dimensiones y subdimensiones.
Los ejemplos ilustrados representan una muestra de cuadros de operalización de
variables en trabajos de grados presentados en la Universidad Pedagógica
Experimental Libertador, específicamente en el Instituto Pedagógico Luis Beltrán
Prieto Figueroa de Barquisimeto.
A continuación se presenta un cuadro de Operacionalización presentado por
Ramírez (1.999), el cual tiene ligeras modificaciones con respecto a los anteriores.
Variables Dimensiones Indicadores Fuentes Técnicas Instrumentos

B1 M Y Encuesta Cuestionario
N Y Encuesta Cuestionario
A L S Observaciones Lista de cotejo
B2 F 0 Documental Ficha de registro
D 0 Documental Ficha de registro
Tomando de Ramírez (1.999), P.139
Respecto al cuadro de Operacionalización de la variable, Ramírez (1.999)

expresa lo siguientes:
Incorporados estos elementos, nos ha de resultar un cuadro mucho más
completo, el cual le hará al lector una idea más abarcarte y total de la
160
investigación que personas llevan a cabo. A esto se le agrega el hecho de
obligar al investigador a pensar estrategias metodológicas y técnicas en
función no de ideas preconcebidas acerca de los métodos y técnicas más
adecuadas, sino en función de los indicadores, fuentes de información y
estrategias de búsquedas que se derivan del análisis de las variables que
de hecho se van a estudiar. (P. 136)
De este cuadro se puede interpretar que toda variable debe operacionalizarse,

incluso aquéllas cuya modalidad de investigación es documental o de tipo cualitativo.
A Manera de Conclusiones
1.- La operacionalización de la variable es un proceso necesario para planificar

la obtención de datos requeridos para la descripción y/o evaluación de una variable en
estudio.
2.- La operalización de la variable debe realizarse en todos los casos que se
requiere obtener información sobre una variable, incluso en aquellos casos de
variables cualitativas. Cuando se trata de una prueba de rendimientos académico, la
Operacionalización es sustituida por la tabla de especificaciones de la prueba, donde
se planifican las preguntas en función de los dominios y niveles de aprendizaje
3.- Los ítem en el proceso de operacionalización de la variable, deben
formularse tomando en cuenta los objetivos y las bases teóricas de la investigación,
así como las dimensiones e indicadores de la variable en estudio.
EJERCICIOS PROPUESTOS
Evalúe en un trabajo de grado la operacionalización de la variable. Analice si

hay correspondencia de los objetivo y las bases teóricas de la investigación con las
dimensiones, indicadores e ìtemes
Referencias
161
Laguna, Y. (2001). Estrategia innovadora de comprensión lectora en estudiantes de
sexto grado de Educación Básica de la U.E.E José Félix Ribas del Municipio
Palavecino, del Estado Lara. Trabajo de grado no publicado. Universidad
Pedagógica Experimental Libertado, Instituto Pedagógico Luis Beltrán Prieto
Figueroa, Barquisimeto.
Ramírez, T. (1.999). Còmo hacer el proyecto un investigación. Caracas: Panapo.
Suárez, J. A. (2001). Actitud del docente de la primera etapa de Educación Básica

hacia la evaluación de los aprendizajes de acuerdo al Currículo Básico Nacional.
Trabajo de grado no publicado. Universidad Pedagógica Experimental
Libertador, Instituto Pedagógico Luis Beltrán Prieto Figueroa, Barquisimeto.
Torres, J. (2001). Programa de capacitación para la orientación de la sexualidad

Dirigido a Docentes de la segunda etapa de Educación Básica, de la Parroquia
Juan de Villegas, del Municipio Iribarren, Estado Lara. Trabajo de grado no
publicado. Universidad Pedagógica Experimental Libertador, Instituto
Pedagógico Luis Beltrán Prieto Figueroa, Barquisimeto.
Universidad Pedagógica Experimental Libertador. Vicerrectorado de Investigación y

Postgrado. (2.003). Manual de Trabajos de Grado de Especialización y
Maestrías y Tesis Doctórales. Caracas: Autor.
Lecturas Sugeridas
Sobre operacionalización de la variable, la bibliografía es escasa. Se recomienda

consultar Trabajos de Grado de Especialización y Maestría y Tesis Doctorales en
los Centros de información de las universidades que oferten postgrado en
educación.
Ramírez, T. (1.999). Como hacer el proyecto un investigación. Caracas: Panapo. Se

recomienda el capítulo 4: Diseño de investigación. Apartado: Las variables y la
operacionalizacòn.
162
DISEÑO Y VALIDACIÓN DE INSTRUMENTOS EDUCATIVOS
TERCERA PARTE
VALIDACIÓN DE INSTRUMENTOS EDUCATIVOS
163
CAPÌTULO IX
ANÀLISIS DE LOS ÍTEMES
Objetivo
Al concluir este capìtulo el estudiante será capaz de calcular el índice de

dificultad de los ìtemes, realizar el análisis de discriminación de los ìtemes e
interpretar ambos indicadores.
Índice de Dificultad de los Ítemes
Conceptualización
El índice de dificultad de los ítemes determina el grado de dificultad de un

ítem. Su aplicación exige dos condiciones: (a) Sólo es aplicable a ítemes de
instrumentos que miden conocimiento, ejemplo, pruebas de aprovechamiento y
pruebas de nivel de conocimiento (test de habilidades). Cuando los ítemes del
instrumento no miden conocimiento, el índice se interpreta como porcentaje de
respuestas afirmativas y negativas, de acuerdo y en desacuerdo, a favor o en contra,
(b) La codificación o valoración de las alternativas de respuestas deben ser
dicotómicas: correcta (1) e incorrecta (0). Esto se explica, porque la fórmula del
índice de dificultad de los ìtemes es un proporción entre el número de sujetos que
respondieron correctamente el ítem y el número de sujetos que respondieron la
prueba. Se puede aplicar este ìndice a ìtemes de alternativas de respuestas no
dicotòmicas, como ìtems de objetivos de respuestas mùltiples; pero asignando dos
posibles valores o códigos: 1 (correcta) y 2 (incorrecta).
164
Fórmula para Calcular el Índice de Dificultad de los Ìtemes
ID= SRCI x 100

N
ID: índice de dificultad del ítem

SRCI: Número de sujetos que respondieron correctamente el ítem
N: Número de sujetos que respondieron la prueba
Categorías de Interpretación del Ìndice de Dificultad del Ítem
Rango Interpretación
81 a 100 Muy fácil
61 a 80 Fácil
41 a 60 Moderadamente fácil o moderadamente difícil
21 a 40 Difícil
0 a 20 Muy difícil
Ejemplos
Caso 1: de 35 alumnos de un curso, respondieron correctamente 18 alumnos
¿ Cuál es el índice de dificultad y la interpretación del resultado?
ID: 18 x 100 = 51 El índice se ubica en el rango 41 a 60; lo cual se interpreta como

35 moderadamente fácil o moderadamente difícil
Caso 2: de 35 alumnos de un curso, respondieron correctamente el ítem 35 alumnos
ID: 35 x 100=100 El índice se ubica en el rango 81 a 100, lo cual se interpreta

35 como un Ítem muy fácil
165
Caso 3: de 35 alumnos de un curso, ninguno respondió correctamente el ítem.
ID: 0 x 100 = 0 El índice se ubica en el rango 0 a 20, lo cual se interpreta como

35 un ítem muy difícil
Se observa que entre mayor es el índice de dificultad, más fácil es el ítem;

explicándose, porque al establecer el índice como una proporción de sujetos con
respuestas correctas/total sujeto que respondieran la prueba, al aumentar el número de
sujeto con respuestas correctas, el índice también se incrementa, convirtiendo al ítem
en más fácil
Índice Promedio de Dificultad de la Prueba
Para obtener este índice se promedian los índices de la dificultad de todos los
ítemes que contiene la prueba.
Ejemplo en los tres casos anteriores
51+100+1=151= 50 El índice se ubica en el rango 41 a 60, lo cual se interpreta que

3 3 la dificultad de la prueba en su conjunto (promedio) es
moderada.
.
Para calcular el índice de dificultad a través del programa Excel se recomienda ver
anexo A
Grado de Dificultad Adecuado para Aceptar un Ítem
Cuando se calcula el índice de dificultad de una prueba es usual que el

evaluador, se pregunte: ¿Es aceptable este índice?. Al respecto se afirma que la
respuesta depende del propósito de la prueba. Si es una prueba de aptitud académica,
que persigue seleccionar una cantidad de aspirante a ingresar al nivel Superior de
Educación, donde la demanda supera la oferta de cupos disponible, el nivel de la
prueba debe ser difícil o muy difícil para rechazar un mayor número de aspirantes. Si
la prueba de admisión es un mero requisito, donde el nivel de conocimientos del
166
aspirante no es importante, se puede pensar en diseñar una prueba fácil, para así
permitir el acceso a un mayor número de aspirantes.
En el caso de las pruebas aplicadas por el docente, éste puede tener interés en
obtener una prueba moderadamente difícil, también se puede presentar el caso, donde
el docente no le interesa el nivel de dificultad de la prueba, porque su diseño lo hace
en función de un dominio absoluto que debe poseer el alumno sobre el contenido
evaluado. En este caso no interesa calcular el índice de dificultad de la prueba.
Análisis de discriminación de los ítemes
Conceptualización
El análisis de discriminación tiene como propósito determinar si los grupos con

las calificaciones más altas y las calificaciones más bajas (grupo superior e inferior
respectivamente), difieren entre si. Si hay diferencias significativas entre las
calificaciones de ambos grupos, el item discrimina, y por lo tanto, mide
adecuadamente el constructo en estudio, siendo recomendable incluirlo en el
instrumento. Si las calificaciones no difieren entre ambos grupos, el ítem no
discrimina, y por lo tanto, no mide adecuadamente el constructo en estudio. En este
caso debe excluirse del instrumento. Al respecto Cohen y Swerdlik (2.000) expresa
lo siguiente:
El índice de discriminación de reactivos es una medida de la diferencia entre
la proporción de personas que obtienen puntuaciones altas que responden un
reactivo en forma correcta y la proporción de personas que obtienen
puntuaciones bajas que responden el reactivo en forma correcta, entre mayor
es el valor de d (del índice de discriminación), será mayor el número de
personas que obtienen puntuaciones altas que respondieron el reactivo en
forma correcta. Un valor d negativo en un reactivo particular es una bandera
roja debido a que indica una situación donde los examinados que obtienen
puntuaciones bajas tienen mayor probabilidades de responder el reactivo en
forma correcta que los examinados que obtienen puntuaciones altas. Esta
situación exige alguna acción como una revisión del reactivo o su eliminación
(p.p 244 y 245).
167
Cohen y Swerdlik (2000) ejemplifican de manera muy clara el análisis de
discriminación en el siguiente extracto:
Las medidas de discriminación de reactivos indican qué tan adecuadamente
separa o discrimina un reactivo a quienes obtienen puntuaciones altas y a
quienes obtienen puntuaciones bajas en una prueba. En este contexto, un
reactivo de opción múltiple en una prueba de rendimiento es un buen reactivo
si la mayoría de los que obtienen puntuaciones altas lo responden en forma
correcta y la mayoría de los que obtienen puntuaciones bajas la responden en
forma incorrecta (...) El sentido común dicta que un reactivo en una prueba de
rendimiento académico no está haciendo su trabajo si es respondido en forma
correcta por quienes entienden menos la materia. Del mismo modo, un
reactivo en una prueba que pretende medir un rasgo de personalidad particular
no está haciendo su trabajo si la respuesta indican que las personas que por
ejemplo, obtienen puntuaciones muy bajas en la prueba en conjunto (lo que
indicaría una ausencia o nivel bajo del rasgo en cuestión) tienden a obtener
una puntuación muy alta en el reactivo (lo que indica que están muy altos en el
rasgo en cuestión, lo que es contrario a lo que indica la prueba en conjunto).
(P.243 y 244).
Es importante clarificar que el análisis de discriminación no puede realizarse a

cualquier instrumento. Su aplicación implica que la variable a la cual pretende medir
el instrumento, debe estar en una escala de medición como mínimo en ordinal, porque
el análisis de discriminación exige conformar grupos con las calificaciones más altas
y las más bajas, lo cual implica como mínimo una relación de orden. Una escala de
medición nominal, no permite agrupar sujetos de acuerdo a las calificaciones más alta
y calificaciones más baja, porque su propiedad es sólo clasificatoria. Esto explica,
porque un cuestionario de opinión, por ejemplo (el cual mide una variable en escala
de medición nominal); aunque la forma de respuesta sea de preguntas cerradas y
todas tengan las mismas alternativas de respuestas, es incorrecta aplicarle el análisis
de discriminación.
Criterios para Determinar el Tamaño de los Grupos (Grupo Superior e

Inferior).
El criterio establecido por diferentes autores para determinar el tamaño de la

muestra, es asignar el 27% de los sujetos a la muestra de cada grupo extremo, si los
168
datos se distribuyeron normalmente. Si se alejan de la distribución normal, el
porcentaje debe incrementarse a 33% del total de sujetos en cada grupo extremo.
Sobre este punto Anastasi y Urbina (1.998) expresan lo siguiente:
Aunque la diferencia sea obviamente mayor, entre más extremos sean los
grupos, el uso de grupos muy extremos ( como el 10% superior e inferior)
puede reducir la confiabilidad de los resultados por el pequeño número de
casos utilizados. En una distribución normal, el punto óptimo en el que las dos
condiciones se equilibran es el 27% superior e inferior... Cuando la
distribución es más plana que la curva normal, el porcentaje óptimo es
ligeramente mayor al 27% y se aproxima al 33% ... Con los grupos pequeños,
como los que se encuentran en un salón de clase, el error estadístico del
muestreo es tan grande que sólo es posible obtener resultados aproximados;
por lo tanto, en estas condiciones no es necesario preocuparse por el
porcentaje exacto de casos en los grupos de contraste. Cualquier número
conveniente entre 25 y 33 por cierto resultará adecuado. (P.182)
En el cuadro 6, se visualiza la conformación de los tres grupos: superior,

intermedio e inferior. En este caso, tomando en consideración que es un grupo
pequeño y los resultados por lo tanto son aproximados, se tomó el 27% como
porcentaje para la conformación de los grupos extremos (superior e inferior).
Procedimientos para Determinar la Discriminación de los Ìtemes.
El procedimiento para determinar la discriminación de los ítem varía de

acuerdo al tipo de respuestas de los ítem, si el ítem tiene alternativas de respuestas
dicotómicas se aplica una fórmula para determinar el índice de discriminación, pero si
son más de dos alternativas de respuestas, el procedimiento adecuado es la aplicación
de la prueba estadística T de Student para muestras independientes, con el propósito
de determinar si los grupos poseen medias significativamente iguales o diferentes.
A continuación se explican ambos casos:
169
Análisis de discriminación en ítemes dicotómicos (*)
Pasos para calcular el índice de discriminación en forma manual(*). Cuando

se procede manualmente para calcular el índice de discriminación, los pasos son las
siguientes:
1. Se conforman los grupos extremos (superior e inferior) tomando en cuenta
los criterios establecidos (ver cuadro 6).
2. Se aplica la fórmula para calcular el Índice de discriminación.
ID: RCGS-RCCI
NG
ID: Indice de discriminación
RCGS: Respuestas correctas grupo superior
RCGI: Respuestas correctas grupo inferior
NG: Tamaño de uno de los grupos.
Ejemplos. A continuación se calculan los índices de discriminación de la matriz

de datos del cuadro 6
ID item 1= 4 –0 = 1 ID item 2= 4 – 4 =0 ID item 3= 0 – 0 = 0

4 4 4
ID item 4= 2 – 3 = -0,25 ID item 5= 3 – 2 = 0,25 ID ítem 6= 4 – 0 = 1

4 4 4
ID ítem 7 = 4 – 0 = 1 ID ítem 8 = 4 - 0 = 1
4 4
(*) En el anexo B se explica la rutina para calcular los índices de discriminación para
datos dicotómicos a través del programa Excel.
170
Cuadro 6
Conformación de los grupos
ITEM
GRUPOS SUJETOS 1 2 3 4 5 6 7 8 TOTAL
S V V X V V V V V 7
U 1
P 2 V V X V X V V V 6
E
R 3 V V X X V V V V 6
I
O 4 V V X X V V V V 6
R
TOTAL 4 4 0 2 3 4 4 4
I 5 V V X X X V V V 5
N
T 6 V V X X X V V V 5
E
R 7 V X X X V V V V 5
M
E 8 V V X X V V V X 5
D
I 9 V X X X V V V V 5
O
10 V X X X X V V V 4
11 V V X X X X V V 4
I 12 X V X V V X X X 3.
N
F 13 X V X V V X X X 3
E
R 14 X V X V X X X X 2
I
O 15 X V X X X X X X 1
R
TOTAL 0 4 0 3 2 0 0 0 -
171
3.- Calculados los índices de discriminación de todos los ítem, se interpretan los
resultados considerando los siguientes intervalos.
0,81 ----------- 1 Muy alta
0,61 ----------- 0,80 Alta
0,41 ----------- 0,60 Moderada
0,21 ----------- 0,40 Baja
0,00 ----------- 0,20 Muy Baja
Negativo Extremadamente Baja
Interpretando los índices de discriminación, se tiene que los ítem 1 ,6, 7 y 8

tienen un nivel de discriminación muy alto, lo que sirve de base para aceptarlos. Los
ítem 2 y 3 tiene una discriminación muy baja, ya que ambos grupos lo responden en
forma similar, se recomienda en este caso excluirlos del instrumento. El ítem 5 tiene
una discriminación baja, recomendándose, al igual que en el caso de los ítem 2 y 3,
excluirlos del instrumentos. Por último está el ítem 4, el cual discrimina en forma
negativa. Cuando la discriminación es negativa, debe excluirse el ítem del
instrumento, porque significa que el grupo inferior obtiene calificaciones más altas
que las del grupo superior. Este ítem, como se explicó en el punto de la
conceptualización del análisis de discriminación, no mide adecuadamente el
constructo en estudio, recomendándose su exclusión del instrumento.
Para aceptar un ítem, la discriminación debe ser en el caso que la variable a
medir sea conocimiento, como mínimo moderada. En el caso de test de personalidad
o afectivos, el nivel de discriminación debe ser muy alto, auque pueden aceptarse
ítemes con discriminación alta, si está cerca del límite superior del rango, es decir
cercano a 0,80.
172
Análisis de discriminación en el caso de ítemes multicótomos (más de 2
alternativas de respuestas).
El análisis de discriminación para datos no dicotómicos, al igual que el caso de

ítemes dicotómicos se desarrolla en forma manual y automatizada.
Pasos para calcular el índice de discriminación de los ítemes multicótomos
1. Se conforman los grupos extremos (superior e inferior)

2. Se calcula la T de Student para muestras independientes de los grupos
extremos en cada item que conforman el instrumento.
3. Se interpretan los resultados. En este punto hay 2 opciones (a) en cálculos
manuales o en el programa Excel, se compara la T calculada con el T crítico o
teórico (T de la tabla), si el T calculado es mayor al T teórico, las medias de ambos
grupos son significativamente diferentes, por lo tanto, el ítem discrimina; en caso
contrario, el T calculado menor al T teórico, no hay diferencias significativas entre las
medias de ambos grupos, por lo tanto, el ítem no discrimina, (b) En cálculos
realizados a través del Programa Estadístico para Ciencias Sociales (SPSS), se
compara el valor de significación (sig) con un valor alfa () que usualmente es 0,05 ó
0,01, si el valor de significación (asociado a la hipótesis nula) es mayor al valor alfa
( ) no hay diferencias significativas, por lo tanto el ítem no discrimina, si es el caso
contrario, el valor de significación menor a alfa, hay diferencias significativas entre
las medias de ambos grupos, por lo tanto el ítem discrimina (ver anexo C, donde se
explica la rutina para realizar el análisis de discriminación a través del programa
SPSS).
173
ACTIVIDAD 1
1. ANÁLISIS DE DISTRIMINACIÓN E ÍNDICE DE DIFICULTAD DE ÌTEMES

DICOTÓMICOS
Usando como herramienta tecnológica el programa Excel, calcule e interprete el índice de
dificultad y el índice de discriminación de los ítemes en la siguiente matriz de datos (ver
anexos A y B).
ITEM01
ITEM02
ITEM03
ITEM04
ITEM05
ITEM06
ITEM07
ITEM08
ITEM09
ITEM10
ITEM12
ITEM13
ITEM14
ITEM15
ITEM16
ITEM11
SUJETOS
1 0 0 1 0 1 1 1 1 1 1 1 1 1 1 1 1
2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
3 1 0 0 0 0 0 0 1 1 1 1 1 0 1 1 1
4 0 1 1 1 1 1 1 0 0 1 1 1 1 0 1 1
5 1 0 1 1 0 1 1 0 1 1 1 1 1 0 1 0
6 0 0 0 1 1 1 0 0 1 1 1 1 1 1 0 0
7 1 1 1 0 0 0 1 0 1 1 0 1 0 1 0 0
8 0 0 0 1 1 1 0 0 0 1 0 1 1 0 0 0
9 1 1 0 0 0 0 1 1 1 0 0 0 0 0 0 0
10 0 0 1 1 0 0 0 0 0 1 0 0 0 1 1 0
11 0 0 0 0 1 1 0 0 0 0 0 0 0 1 1 0
12 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0
ACTIVIDAD 2
174
2.1.- Diseñe una base de datos a partir de la matriz anexa, usando como herramienta
tecnológica el Programa Estadístico de Ciencias Sociales (SPSS). En el Diseño tome
en cuenta las siguientes variables cualitativas:
Sexo: 1.- Masculino 2.- Femenino
Edad
1= "18 a 23" 2="24 a 29" 3= "30 a 39" 4= "40 a 49" 5="50 a 59" 6="> de 60"
Profesión
4="Prof/Lic." 3="Tec.Sup.Educ." 2=" Maest/Br.Doc." 1="No graduado"
Años de Servicios
1="<5" 2="5 a 10" 3="11 a 15" 4="16 a 20" 5="> a 20"
2.2.- Determine los ítemes que discriminan y no discriminan, usando la T de Student

para muestras independiente como estadístico de prueba y el programa SPSS como
herramienta (ver anexo C).
EDAD
PROFESION
SEXO
SERVICIO
ITEM01
ITEM02
ITEM03
ITEM04
ITEM05
ITEM06
ITEM07
ITEM08
ITEM09
ITEM10
5 5 5 4 5 5 5 5 5 4 1 1 4 1
2 1 2 1 1 1 1 1 1 1 2 1 1 4
2 4 2 3 4 5 5 5 4 4 4 2 1 3
5 5 5 4 5 4 5 5 5 4 3 1 3 2
4 5 5 5 4 4 4 5 5 5 2 2 2 2
5 5 5 5 5 5 5 5 5 5 1 1 3 5
5 5 3 5 4 5 4 5 5 5 3 2 1 1
1 4 2 5 2 4 4 5 5 4 3 1 1 4
2 5 4 5 5 5 5 5 5 5 3 2 1 1
4 5 1 4 4 4 5 4 4 2 3 2 1 2
175
Formato para analizar e interpretar los resultados del análisis de discriminación
realizado a través del programa SPSS
Determine los ítemes que discriminan o no, tomando como referencia un valor
alfa  = 0.05 (ver anexo C).
Varianza T de Student
Sig Tipo Sig. Contraste Conclusión Decisión
Item
(1) Hipótesis (3) sobre el
nula item
(2) (4)
(1) Tipo: Si las varianzas son iguales ó desiguales

(2) Contrate de Hipótesis: Se acepta o rechaza la hipótesis nula
(3) Conclusión: Si el ítem discrimina o no discrimina
(4) Decisión sobre el ìtem: Se acepta o se rechaza.
176
Referencias
Anastasi, A., y Urbina , S. (1.998). Test psicológicos. México: Prince Hall.

Cohen, R., y Swerdlik, M (2.000). Pruebas y evaluación psicológicas, México: MC
Graw Hill
Lecturas Sugeridas
Aiken, L. (1.996). Tests psicológicas y evaluación. México: Prince Hall. Se

recomienda del capítulo 3: Administración, calificación y análisis de reactivos de
test, apartado Análisis de reactivos, sub-apartado Índices de dificultad y
discriminación de los reactivos.
Anastasi, A., y Urbina, S. (1.998). Test psicológicos. México. Prince Hall. Se

recomienda el capítulos 7: Análisis de reactivos, apartados: Dificultad de
reactivos y Discriminación de reactivos.
Cohen, R., y Swerdlink, M. (2.000). Pruebas y evaluación psicológicas. México: MC

Graw Hill. Se recomienda capítulo 7: Elaboración de pruebas, apartado: Análisis
de reactivos. Sub-apartado: Índices de dificultad e índice de discriminación
177
CAPÌTULO X
CONFIABILIDAD DE INSTRUMENTO DE MEDICIÓN EDUCATIVA
Objetivo
Al concluir este capìtulo, el estudiante será capaz de calcular el coeficiente de

confiabilidad más adecuado de un instrumento de medición educativa e interpretar los
resultados.
Conceptualización
La confiabilidad es una medida de consistencia y uniformidad de un

instrumento de recolección de datos. Permite determinar si las calificaciones
provenientes de la aplicación de un instrumento son estables en el tiempo y en lugares
diferentes. Se comprueba la confiabilidad de una balanza, si una persona que se pesa
en ella en lugares y momentos diferentes, obtienen un peso similar, es decir, sin
diferencias significativas. En el caso de los instrumentos educativos, se dice que éste
es confiable si al aplicar el instrumento dos veces a las mismas personas o al aplicar
dos versiones de un mismo instrumento a los mismo sujetos se obtiene los mismos
resultados. Asimismo un instrumento es confiable si los sujetos a quienes se le aplica
el instrumento lo responden homogéneamente (consistentemente) en cuanto a la
variable que se desea medir.
A continuación se revisan algunas definiciones de confiabilidad. Se comienza
con Anastasi y Urbina (1.998) quienes al respecto expresa lo siguiente: “...El término
de confiabilidad se refiere a la consistencia de las puntuaciones obtenidas por las
mima personas cuando se las examina en distintas ocasiones con el mismo test, con
conjunto equivalentes de reactivos o en otras condiciones de examinación...”(P.84).
Más adelante las autoras mencionadas definen la confiabilidad: “....en términos más
técnicos, la confiabilidad de una prueba permite estimar qué proporción de la
varianza verdadera total de las puntuaciones se debe a varianzas del error ...(P.84).
178
Es importante expresar que cuando se realizan mediciones en diferentes
ocasiones, siempre existen diferencias, por ejemplo, si nos pesamos hoy y luego lo
volvemos hacer el día siguiente siempre existe una diferencia, auque a veces es
mínima, la cual es originada por factores fortuitos como haber tomando el peso
inmediatamente después de consumir alimentos. Este tipo de diferencias se conocen
como varianza del error y es originada por factores aleatorios, los cuales el
investigador cuando aplica un instrumento debe controlar.
La teoría del error de medición en la confiabilidad de los instrumentos se
expresa de la manera siguiente:
Y= T+E; donde:
Y= Puntuación observada
T= Puntuación verdadera
E= Error de la medición
Transformándose la ecuación en:
V= Vv+ Ve; donde:
V= Varianza total
Vv= Varianza verdadera
Ve= Varianza del error
Interpretación del Coeficiente de Confiabilidad
La confiabilidad se interpreta a través de un coeficiente que tiene los siguientes

rangos:
0.81 ----------- 1 Muy alta
0.61 ----------- 0.80 Alta
0.41 ----------- 0.60 Moderada
0.21 ----------- 0.40 Baja
0.00 ----------- 0,20 Muy baja
Cuando es negativa Extremadamente baja
Cuando es mayor 1 Extremadamente alta
Lo normal es que el coeficiente de confiabilidad esté entre 0 y 1; pero en
algunos casos traspasa esté intervalo. Cuando un instrumento tiene una confiabilidad
negativa, significativa que ésta es extremadamente baja, lo cual debe llevar a tomar la
179
decisión de rechazar el instrumento. Cuando sucede el caso contrario, el coeficiente
mayor a 1, la confiabilidad es extremadamente alta. Debe aceptarse el instrumento.
Lo recomendable cuando ocurre alguno de estos dos casos es revisar
determinadamente las respuestas del instrumento y los cálculos. Es común cuando
esto ocurre que el resultado se debe a incorrecta codificación de las alternativas de
respuestas o cálculos aritméticos incorrectos cuando el coeficiente se calcula en
forma manual.
Métodos de Confiabilidad
Los métodos de confiabilidad son tres, los cuales se desarrollan a continuación:
Reaplicación de la Prueba (Test-Retest)
Este método de confiabilidad consiste en aplicar el instrumento a los mismo

sujetos en dos momentos diferentes. Es aconsejable que el intervalo de tiempo, entre
los dos aplicaciones no sea muy prolongado ni muy breve. Lo recomendable es entre
15 y 30 días. Debe tenerse cuidado que en el periodo entre ambas aplicaciones, los
sujetos no reciban algún estímulo que pudiera influir en la segunda aplicación. Este
método genera medida de estabilidad, porque garantiza que los resultados del
instrumento sean estables en el tiempo.
El procedimiento para aplicarlo es el siguiente:
1. Se aplica el instrumento en dos momentos a los mismos sujetos.
2. Se correlacionan los puntajes de ambas mediciones, a través de un
coeficientes de correlación; cuando la variable está en una escala de medición
de intervalo o de razón se aplican el coeficiente de correlación de Pearson. Si
la variable está expresada en una escala de medición ordinal, el coeficiente de
correlación apropiado es el Spearrman.
A continuación se presentan dos (2) ejemplos que ilustran ambos casos:
180
Ejemplo 1
Aplicación del Coeficiente de Correlación de Pearson
Sujetos Puntuación X Puntuación y 2 2

X Y
(1° aplicación) (2° aplicación) X.Y
1 10 12 100 144 120
2 20 19 400 361 380
3 15 15 225 225 225
4 13 15 169 225 195
5 8 9 64 81 72
6 10 12 100 144 120
7 11 11 121 121 121
8 17 16 289 256 272
9 20 19 400 361 380
10 5 4 25 16 20
2 2
X=1.893 Y=1.
N= 10 X= 129 Y= 132 XY=1.905
934
  X   Y 
 XY 
r N
   x     y 
2 2
 x  N    y  N 
2 2
  
129132
1.905 
10 202,20
r   0,97
  129    132  209,42
2 2
1.893   10  1.934  10 

 
El coeficiente de confiabilidad es 0,97; lo cual indica una confiabilidad muy

alta (ver rangos de interpretación).
181
Ejemplo 2
Aplicación del Coeficiente de Correlación de Spearman
Sujet Primer Rang Segun Rang Di 2

D1
os os puntajes o dos o (R1-R2)
(RI) Punta (R2)
jes
1 83 2 43 3 -1 1
2 99 6 47 4 2 4
3 88 5 40 2 3 9
4 41 1 38 1 0 0
5 117 10 66 8 2 4
6 114 9 89 11 -2 4
7 112 8 87 10 -2 4
8 84 3 57 6 -3 9
9 86 4 63 7 -3 9
10 127 12 93 12 0 0
11 107 7 55 5 2 4
12 118 11 83 9 2 4
Total 52
6  Di 2
6 52 
r 1   0.82
N  N 12   N
3 3
La confiabilidad es muy alta, aceptándose sin reservas el instrumento

Cuando dos o mas sujetos reciben el mimos puntaje, se le asignaba a cada uno
el promedio de los rangos de los sujetos empatados. A continuación se muestra un
ejemplo:
Sujetos Rango1 Puntuac Rango 2 D 2

Di
(R1) iones (R2) (R1-R2)
1 1 20 1 0 0
2 2 18 3,5 -1,5 2,25
3 3 19 2 1 1
4 4 18 3,5 0,5 0,25
5 5 16 6 -1 1
6 6 15 8 -2 4
7 7 16 6 1 1
182
8 8 16 6 2 4
9 9 13 10 -1 1
10 10 14 9 1 1
11 11 9 11 0 0
12 12 6 12 0 0
Total 15,5
615,5
r  1  0,95
12 3  12
La confiabilidad es muy alta, por lo tanto, debe aceptarse el instrumento.
Hay programa estadístico, como Excel, STATISTICA, SPSS, etc., que calculan
ambos coeficientes de correlación, lo cual facilita considerablemente la obtención de
estos coeficientes. La rutina para obtenerlos es muy fácil de manejar y presenta
además la prueba de contraste de hipótesis que complementa los resultados obtenidos
a través de los coeficientes.
Pruebas de formas Equivalentes y formas altenas
Este método consiste en elaborar dos versiones de un instrumento que miden

la misma variable, las cuales se aplican a un mismo grupo de sujetos. Genera en el
instrumento medidas de equivalencia, porque garantiza la obtención de resultados
confiables cuando la variable se mide en dos versiones diferentes del instrumento.
Cuando las dos versiones no se aplican simultáneamente al grupo de sujetos, sino que
se aplican en momentos diferentes; además de generar medida de equivalencia,
también genera medida de estabilidad.
El procedimiento para obtener el coeficiente de confiabilidad de equivalencia es
el siguiente.
1. Elaborar las dos versiones equivalente del instrumento.
2. Correlacionar los puntajes de ambas versiones de la prueba de la misma
manera que en el caso del método de reaplicación de la prueba, es decir a través del
coeficiente de correlación de Pearson, si la escala de medición de la variable es de
183
intervalo o de razón; si la escala de medición de la variable es ordinal, se aplica el
coeficiente de correlación de Spearman.
Hay autores que establecen diferencias entre pruebas equivalentes y pruebas
alternas, argumentado que solamente puede hablarse de pruebas equivalentes cuando
ambas versiones no tiene diferencias significativas en la media y la varianza de las
puntuaciones obtenidas. Cuando sólo se asume que hay dos versiones equivalentes de
una prueba, sin comprobar la igualdad de medias y varianzas, se está en presencia de
una prueba paralela.
Al respecto Cohen y Swerdlik (2.000) expresan lo siguiente:
Formas alternas y formas equivalentes son tèrminos que en ocasiones se

usan en forma indiscriminada, aunque hay una diferencia tècnicas entre
ellos . Existen formas equivalentes de una prueba cuando para cada forma
de la prueba son iguales las medias y las varianzas de las puntuaciones de
pruebas observadas. ... Las formas alternas tan sòlo son versiones
diferentes de una prueba que se han construido con el fin de ser
equivalentes. Aunque no cumplen con los requisitos para la designaciòn
legìtima de “equivalentes“, las formas alternas de una prueba estàn
diseñadas generalmente para ser equivalentes con respecto a variables (o
ìtems) como contenido y nivel de dificultad. (p. 160)
Método de Consistencia Interna
Este método tiene como propósito determinar la homogeneidad en las

respuestas de sujetos a quienes se le aplicó el instrumento, puede aplicarse a pruebas
que miden habilidades como prueba de aprovechamiento, aptitud, inteligencia, de
nivel de conocimiento, etc, y a pruebas afectivas (o de personalidad) como las escalas
de actitud, test de personalidad, escalas de motivación, etc. Es incorrecto aplicar este
método a los cuestionario de opinión; porque al medir homogeneidad en las respuesta
de los sujetos a quienes se aplica el instrumento, es apropiado para aquellos
instrumento que persiguen obtener una calificación única, con alternativas de
respuestas en grado de intensidad.
184
En los cuestionarios de opinión no hay inconsistencia si los sujetos responden
las preguntas en forma heterogéneas, porque las mismas no son para obtener una
puntuación única que indica una alta, media o baja presencia del atributo (variable) en
los sujetos. En el caso de los cuestionarios de opinión, cada pregunta como se
mencionó en el capìtulo V, se analiza por separado. No es posible una calificación
única, porque, primero, las opiniones están en una escala de medición nominal (sólo
son clasificatorias), y en segundo lugar, generalmente este tipo de instrumento,
aunque describa una sola variable, incluye preguntas con las cuales no se puede
obtener una calificación única, porque los ítemes miden o describen aspectos
diferentes de la variable.
A continuación se presentan varias fórmulas para calcular la consistencia
interna de un instrumento.
Datos dicotómicos
Fórmula Kuder-Richardson (K-R20)
n vt   p.q ó n  p.q
Rt  ( )( ) Rt  ( )  (1  )
n 1 vt n 1 vt
Rt= Coeficiente de Confiabilidad

n= Número de ítemes que contiene el instrumento.
Vt: Varianza total de la prueba
p.q= Sumatoria de la varianza individual de los ítemes
Se puede aplicar cualquiera de ambas fòrmulas, obteniéndose resultados
similares.
Determinar el coeficiente de la confiablidad Kuder-Richardson (Matriz de

ítemes dicotómicos).
ítemes Total X2

Sujetos
1 2 3 4 5 (x)
1 1 1 1 1 1 5 25
2 1 1 1 1 1 5 25
3 1 1 1 1 1 5 25
185
4 1 1 1 1 1 5 25
5 0 1 1 1 1 4 16
6 1 0 0 1 1 3 9
7 1 1 1 1 1 5 25
8 1 1 1 1 1 5 25
9 0 ò 1 1 1 0 3 9
Total 7 8 8 9 8 40 184
P 0,78 0,89 0,89 1 0,89 - -
q= 1-P 0,22 0,11 0,11 0 0,11 - -
p.q 0,17 0,10 0,10 0 0,10 0,47 -
Cálculo de la varinza
( x) 2 ( 40) 2
 2  x2  184 
( x  x ) n  9  0.78
Vt 
n 1 n 1 9 1
p.q = 0.47
Vt= Varianza total
n= número de sujetos
La varianza, al igual que el coeficiente de confiabilidad de Kuder-Richardson,
se puede calcular por dos fórmulas. Se recomienda calcular el promedio por la
segunda fórmula que lo calcula abreviado y es menos susceptible a errores de
redondeo, los cuales cuando se calculan coeficientes pueden afectar
significativamente los resultados.
186
Cálculo del Coeficiente Kuder-Richardson
5 0.47
Rt  ( ) x(1  )  0,50
n  p.q 5 1 0.78
Rt  ( )  (1  )
n 1 vt
Rt= Coeficiente de confiabilidad Kuder-Richardson

n= número de ítemes que contiene el instrumento
Al interpretar los resultados de acuerdo a los rangos explicados, se concluye
que la confiabilidad de consistencia interna es moderada. Si el instrumento evaluado
es un test afectivo (como una escala de actitud, escala de motivaciòn, test de
personalidad, etc.) debe rechazarse el instrumento. Si es un instrumento que mide
habilidades (como una prueba de conocimiento, prueba de rendimiento acadèmico,
prueba de aptitud, etc.) se puede aceptar el instrumento, complementando el anàlisis
con otros indicadores de validaciòn. Cuando la confiabildad es baja, muy baja o
extremadamente baja (negativa) debe rechazarse el instrumento, aunque sea un test de
habilidades.
Datos en Escalas no Dicotómicas (más de 2 Alternativas de Respuestas)
Fórmula Alfa de Cronbach
n Vi
n St   Vi rt  ( )  (1  )
rt  ( )  ( ) n 1 Vt
n 1 Vt
rt = Coeficiente de confiabilidad
n = Número de ítemes que contiene el instrumento
Vt ò St= varianza total
Vi= varianzas individuales
Se puede aplicar cualquiera de las dos fórmulas, obteniéndose resultados

similares
187
Determinar el coeficiente Alfa de Cronbach (matriz de ítemes con cinco (5)
alternativas de respuestas).
Sujetos Ítemes Total X2
1 2 3 4 5 6 (X)
1 4 4 3 2 1 1 15 225
2 3 1 3 3 1 2 13 169
3 4 5 4 4 4 4 25 625
4 4 3 2 3 1 1 14 196
5 5 2 4 4 3 1 19 361
6 5 4 3 2 4 2 20 400
7 4 4 2 3 2 3 18 324
8 4 4 2 5 2 4 21 441
Total (x) 33 27 23 26 18 18 145 2.741
X2 139 103 71 92 52 52 - -
Vi2 0.41 1,70 0,70 1.07 1,64 1,64 7,16 -
Cálculo de la varianza
Varianza total
(145) 2
2.741 
Vt  8  16,13
8 1
Cálculo de las varianzas individuales
(33) 2 (27) 2
139  103 
8  0,41 V 22  8  1,70
V 12  8 1
8 1
(26) 2
92 
(23) 2 8  1,07
71  V 42 
V 32  8  0,70 8 1
8 1
(18) 2 (18) 2
52  52 
8  1,64 V 32  8  1,64
V 52 
8 1 8 1
188
Coeficiente de Confiabilidad
rt=( n ) *( 1- Vi ) =( 6 )* (1–7,16/16,13)

n- 1 VT 6-1
rt=0,67
rt= Coeficiente de confiabilidad
n= número de ítemes que contiene el instrumento
VT= Varianza total
Vi= Varianzas individuales
En este ejemplo la confiabilidad es alta. Si el instrumento mide habilidades se
debe aceptar el instrumento; pero cuando es una prueba afectiva, el coeficiente como
mínimo debe ser 0.81, es decir, poseer una confiabilidad muy alta.
La formula alfa de Cronbach también es aplicable a datos dicotómicos. Al
respecto Cohen y Swerdlik (2.000) expresa lo siguientes: ..... el coeficiente alfa
también puede ser usado en pruebas con reactivos dicotómicos. Además, el
coeficiente alfa es apropiado para ser usado en pruebas que contienen reactivos que
no son dicotómicos ...(P.166). Los resultados de la confiabilidad de datos
dicotómicos, aplicando la fórmula Alfa de Cronback, son similares a los obtenidos
aplicando la formula Kuder-Richardson, si las respuestas de los sujetos a quienes se
aplicó el instrumento son muy homogéneas. En la medida que se incrementa la
homogeneidad, mayor será la similitud de los resultados de ambas fórmulas. Si las
respuestas de los sujetos son heterogéneas, la diferencia de los resultados obtenidos
por ambas fórmulas será considerable. En este último caso no es recomendable
aplicar la fórmula Alfa de Cronbach a ítemes de respuestas dicotómicas. Se puede
proceder en el cálculo de la confiabilidad de datos dicotómica de la manera siguiente:
se calcula el coeficiente de confiabilidad alfa de Cronbch a través de SPSS, si el
coeficiente es muy alto, se acepta como indicador adecuado de la confiabilidad (en
este caso los datos son muy homogéneos). Si es bajo, se considera heterogéneo,
siendo aconsejable determinar el coeficiente por la fórmula Kuder- Richardson,
porque indica diferencias entre los resultados de ambas fórmulas. Cuando se calcula
189
el coeficiente Kuder-Richardson hay que hacerlo maual; porque el Programa SPSS
no lo calcula. Se puede calcular tambièn a travès del programa Excel, siguiendo la
rutina que se incluye en el anexo D. Se justifica la aplicación de este programa
cuando el nùmero de ítems del instrumento es alto.
CORRELACIÒN ÌTEM-TEST Y CONFIABILIDAD SIN EL ÍTEM
CORRELACIÓN ÍTEM-TEST
Este indicador de homogeneidad del test, permite establecer la correlación
entre el ítem y el total de la escala. Pardo y Ruiz (2.002) Expresan que “...lo deseable
es que esas correlaciones sean altas; una correlación baja estaría indicando que el
elemento [el ítem] en cuestión no apunta en la misma dirección que el resto de los
elementos”. (p. 605)
El paquete estadístico SPSS, lo presenta como opcional cuando se calcula el
coeficiente de confiabilidad. Ruiz (1998) recomienda que el ítem aceptado debe
poseer una relación con el total, superior a 0,25; porque de lo contrario la relación no
es aceptable.
Confiabilidad del Instrumento si se Excluye el Ìtem Analizado
Este indicador de confiabilidad del instrumento, permite determinar si el ítem

analizado aporta confiabilidad al instrumento. El criterio que se estable es excluir el
ítem y observar el comportamiento de la confiabilidad del instrumento. Si la
confiabilidad sube o permanece igual a la obtenida con el ítem incorporado, se toma
la decisión de excluirlo del instrumento; porque se demuestra que el mismo no aporta
confiabilidad al instrumento, en caso contrario, cuando la confiabilidad baja, debe
aceptarse el ìtem; porque indica que si èste se excluye del instrumento, la
confiabilidad serà afectada (disminuirà).
Ccàlculo de Ambos Indicadores
190
Su cálculo manual es muy engorroso y complejo; pero el programa SPSS lo
calcula, siguiendo la siguiente rutina: Menú Estadístico ( o Menú Analizar)→
Escalas→Análisis de fiabilidad→Estadístico: activar la opciòn “Escala si se elimina
el elemento”→ Continuar→Aceptar.
Confiabilidad de Dos Mitades
Es un método que determina consistencia interna del instrumento. Consiste en

dividir el instrumento en dos mitades y proceder a determinar si existen relación entre
ambas, aplicando el coeficiente de Spearman-Brown, el cual introduce en la fórmula
una corrección, porque al dividir el instrumento en dos mitades se reduce el número
de ìtemes, afectando la confiabilidad.
¿Cómo se constituyen las dos mitades?
Las dos mitades pueden conformarse de varias formas; las más usuales son las
siguientes:
1. Itemes pares e ítemes impares
2. Procedimientos aleatorios para seleccionar los ìtemes de cada mitad
Pasos para calcular el coeficiente de las dos mitades
1. Se constituyen las dos mitades

2. Se calcula el coeficiente de correlación de Pearson, correlacionando las dos
mitades
3. Se aplica la fórmula de Spearman-Broawn
El procedimiento para calcularlo es similar a los mètodos de reaplicaciòn de la
prueba y al de confiabilidad de formas equivalentes y formas alternas. Se aplica la
fòrmula del coeficiente de correlaciòn de Pearson cuando la escala de mediciòn de la
variable es de intervalo o de razòn. Si la escala de mediciòn de la variable es ordinal,
el coeficiente de correlaciòn adecuado es el de Speraman (ver en este mismo capìtulo
la subsecciòn correspondiente al mètodo de reaplicaciòn de la prueba).
191
Fórmula de Spearman – Brown
2r1, 2
rsp 
1  r1, 2
rsp= coeficiente de correlaciòn Spearman-Brown

r 1,2= coeficiente de correlaciòn de las dos mitades
Ejemplo
Calificaciones de 10 estudiantes de un curso

Estudiantes Calificaciones Calificaciones
primera mitad de la segunda mitad prueba
prueba
1 15 16
2 14 13
3 20 20
4 8 10
5 17 16
6 19 19
7 14 15
8 12 13
9 20 20
10 8 6
En este ejemplo el coeficiente de correlación de Pearson ( r1,2) de las dos

mitades es 0,96. El procedimiento para calcularlo es similar al correspondiente a los
mètodos de confiabilidad de reaplicación de la prueba y al de pruebas equivalentes y
de formas alternas. Se aplica la fòrmula del coeficiente de Pearson cuando la escala
de mediciòn de la variable es de intervalo. Si la escala es ordinal, la fòrmula adecuada
es la de Spearman (ver en este mismo capìtulo el apartado correspondiente al mètodo
de reaplicación de la pruebas.
Se procede a calcular el coeficiente de confiabilidad aplicando la fórmula de
Spearman-Brown. Los resultados son los siguientes:
2  0.96
rsp   0.98
1  0.96 192
4. Se interpreta la confiabilidad como muy alta (0,98), por lo tanto, el
instrumento tiene consistencia interna.
Diferencias entre Dos Mitades de la Prueba y Formas Paralelas
Pardo (2.000) al referirse a ambos indicadores de evaluación de un instrumento,

expresa lo siguiente:
“Dos Mitades. Divide la escala en dos partes y calcula la fiabilidad a partir de
la correlación entre ambas partes”. (p. 596). Al referise a las formas paralelas de un
instrumento, expresa: “...Asume que todos los elementos [ìtms o variables] tienen
iguales varianzas observadas y error.” (p. 596). Pardo, tambièn establece diferencias
entre las formas paralelas de una prueba y el paralelo estricto. Al referirse a este
ùltimo expresa: “...Asume los supuestos del modelo paralelo y, además, que las
medias de todos los elementos son iguales." (p.596)
Para acceder a estos tres modelos incorporados en el programa SPSS desde la
Base de datos que se analiza, se sigue la siguiente rutina: Clic en analizar
→Escala→Anàlisis de fiabilidad→en “Modelo” cambiar Alfa (opciòn por defecto)
por Dos Mitades o Paralelo o Paralelo estricto.
Factores que Incrementan la Confiabilidad
1. Exclusión del instrumento ìtemes ambiguos: las ìtemes deben

formularse de manera clara y precisa, para evitar a quienes los
responden interpretaciones diferentes al sentido para el cual fue
formulado.
2. Instrucciones claras tienden a reducir los errores de medición: el
instrumento de recolección de datos, debe ir acompañado de
instrucciones donde se especifique la manera de responder las
preguntas y donde se aclare posibles dudas del respondiente en el
momento de contestar las preguntas formuladas.
193
3. Control de las condiciones del espacio físico y el personal responsable
de aplicar el instrumento: cuando se aplica un instrumento debe
disponerse de condiciones de espacio físico similares para todas
aquellas personas a quienes se le aplicará la prueba. Asimismo el
personal responsable de aplicarlas debe poseer el mismo entrenamiento
y las mismas instrucciones.
Estableciendo estos mecanismos de control se puede reducir la varianza del
error, la cual es causada por factores externos a la prueba. Si este tipo de varianza no
se controla, puede afectar considerablemente los resultados de la prueba, y por lo
tanto, la confiabilidad del instrumento.
Incremento de la Confiabilidad de un Instrumento
Si el instrumento posee baja confiabilidad, ésta puede incrementarse agregando

ítemes de igual tipo y calidad
A continuación se presenta ejemplos de cómo incrementar la confiabilidad
aumentando el número de ítemes:
¿ Cuantos ítemes deben agregarse a un instrumento para alcanzar la
confiabilidad deseada?
Fórmula
N= CD(1-CI)
CI(1-CD)
N= número de ítemes necesarios para lograr la confiabilidad desea

CI = Confiabilidad del test inicial
CD = Confiabilidad deseada
194
Ejercicios Resueltos para incrementar la confiabilidad.
Si la confiabilidad de un instrumento de 10 ítemes es 0.46 ¿Cuantos ítemes

deben agregarse para alcanzar una confiabilidad de 0.81?
N= 0,81(1-0,46) = 5 veces más largo, es decir, necesita 50 ìtemes para lograr la

0,46(1-0,81) confiabilidad deseada
Si la confiabilidad de un instrumento de 30 ítemes es 0.05. ¿Cuántos ítemes deben

agregarse para alcanzar una confiabilidad de 0.90?
N= 0,90(1-0,05) = 171 veces màs largo. Tendría que tener 5.130 ìtemes
0,05(1-0,90)
Si la confiabilidad de un instrumento de 30 ítemes es 0.55. ¿Cuantos ítemes deben

agregarse para incrementarla a 0.61?
N= 0,61(1-0,55) = 1,28 veces más largo. Tendría que tener 38 ìtemes.

0,55(1-0,61)
195
Actividad 1
CONFIABILIDAD POR REAPLICACIÓN DE LA PRUEBA Y POR PRUEBAS EQUIVALENTES
Calcule el coeficiente de estabilidad y equivalencia en las siguientes situaciones e interprete los resultados :
(Las pruebas F1 y F2 son dos versiones del mismo instrumento que miden la misma variable y
se asume los datos en una escala de mediciòn de intervalo)
Prueba (F1) aplicada Prueba (F1) aplicada Prueba (F2) aplicada
Sujetos el 29/02/04 el 22/03/04 el 22/03/04
(Puntaje total) (Puntaje Total) (Puntaje total)
1 267 275 272
2 246 236 240
3 246 229 260
4 244 267 265
5 274 267 270
6 264 280 275
7 274 276 260
8 275 257 270
9 264 269 230
10 248 231 255
11 277 256 250
12 246 253 252
13 224 236 240
14 247 272 271
15 241 258 257
16 240 247 250
17 251 262 260
18 254 266 265
Actividad 2
196
Desarrolle el procedimiento manual exigido para calcular el coeficiente de
consistencia interna en los siguientes ejercicios e interprete los resultados
EJERCICIO 1
ítemes
Sujetos
1 2 3 4 5
1 1 1 1 1 1
2 1 0 1 1 1
3 1 1 0 0 0
4 1 1 1 1 1
5 1 1 1 1 1
6 1 1 1 1 1
7 1 0 1 0 1
8 1 0 1 0 0
9 0 1 1 1 0
EJERCICIO 2
Sujetos Items
1 2 3 4 5 6
1 4 4 4 4 4 4
2 5 4 4 5 4 2
3 5 5 5 5 5 5
4 4 5 4 4 5 4
5 4 4 4 4 5 4
6 4 4 5 5 5 5
7 4 5 2 3 5 5
8 5 5 4 5 4 5
9 4 4 4 4 4 4
10 5 5 5 5 5 5
Actividad 3
Aplicando el programa SPSS como herramienta tecnológica, calcule e
interprete en la siguente base de datos el coeficiente de confiabilidad alfa de
Cronbach y excluye del instrumento los ìtems que no aportan confiabilidad y
presenten una correlación ítem-test menor o igual a 0.25:
ÌTEMS
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
sujetos
1 5 4 5 5 2 4 4 5 4 1 5 5 4 4 5 5 5 5 5
197
2 4 4 4 4 1 4 4 4 4 1 4 5 5 4 4 4 5 4 4
3 2 1 3 2 2 2 2 2 1 2 1 1 1 2 2 3 4 5 2
4 4 4 4 4 4 4 4 4 4 2 4 4 4 4 1 4 4 4 4
5 5 4 4 4 2 5 3 4 4 4 5 5 2 4 4 4 5 5 4
6 5 5 5 5 2 5 5 5 5 2 5 5 5 5 5 5 1 5 5
7 5 4 4 4 4 4 1 4 4 2 4 4 4 5 5 4 5 5 4
8 3 4 5 2 5 5 3 3 3 2 5 2 5 2 4 4 5 4 4
9 4 4 4 4 4 4 1 4 4 2 4 4 4 4 1 4 4 4 4
10 4 4 4 4 4 4 1 4 4 4 4 4 4 4 4 4 4 4 4
11 5 5 5 4 4 4 1 5 5 5 4 4 4 5 1 5 4 2 3
12 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4
13 2 2 2 2 2 2 3 2 2 2 2 2 2 2 2 1 1 2 2
14 4 5 4 4 4 4 5 5 5 1 5 5 5 5 5 5 5 5 5
15 4 4 3 2 4 4 3 2 4 5 4 4 4 4 1 4 5 4 5
16 3 2 2 2 2 2 1 2 4 1 2 4 2 4 2 4 2 4 2
17 4 4 4 4 1 4 1 4 4 1 4 4 4 4 2 4 4 4 4
18 2 4 4 4 1 4 1 4 4 1 5 5 4 2 1 4 2 5 5
19 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
20 4 4 5 5 1 5 5 4 4 2 5 1 4 4 4 2 5 5 5
21 2 1 1 1 1 1 1 1 1 1 1 1 2 2 1 2 2 1 1
Referencias
Anastasi, A., Y Urbina, U. (1.998). Test psicológicos. México: Prentice Hall.
Cohen, R., y Swerdlik, M. (2.001). Prueba y evaluación psicológicas. México:

Mc. Graw Hill
Pardo, A. (2.000). SPSS 11: Guìa para el análisis de datos. Madrid: Mc Graw
Hill.
Lecturas Sugeridas
Aiken, L. (1.996). Tests psicológicos y evaluación (octava edición), México; Prentice

Hall. Se recomienda el capitulo 4: Estandarización, confiabilidad y validez.
Apartado de confiabilidad.
Anastasi, A., Y Urbina, U. (1.998). Test psicológicos. México: Prentice Hall. Capítulo
4: confiabilidad. Apartado: tipos de confiabilidad.
198
Ary, D., Jacobs, L., Y Razavieh, A. (1.989). Introducción a la investigación
pedagógico. México: Mc Graw Hill. Se recomienda el capítulo 8: validez y
confiabilidad. Apartado: confiabilidad.
Cohen, R., y Sswerdlik,, M. (2.001). Pruebas y evaluación psicológicas. México: Mc

Graw Hill. Se recomienda el capítulo 5: Confiabilidad. Apartado: Estimaciones
de confiabilidad.
Kerlinger, F. (1.988). Investigación del comportamiento (tercera edición en español).

México: MC Graw Hill.. Se recomienda el capítulo 26. El contenido es el
siguiente: definiciones de confiabilidad, teoría de la confiabilidad,
interpretaciones del coeficiente de confiabilidad, error estándar de la media y el
error estándar de la medición, mejoramiento de la confiabilidad y el valor de la
confiabilidad.
Pardo, A. (2.000). SPSS 11: Guìa para el análisis de datos. Madrid: Mc Graw Hill.
Se recomienda leer el capìtulo 25: Fiabilidad de las escalas: Procedimiento.
Análisis de Fiabilidad. Exxplicaeste libro los métodos de confiabilidad
analizados en este capìtulo y el procedimiento para calcularlos a travès del
programa SPSS.
CAPITULO XI
VALIDEZ DE INSTRUMENTOS DE MEDICIÓN EDUCATIVA
Objetivo
El estudiante al terminar esta Unidad será capaz de realizar el proceso de

validez de instrumentos de medición educativa.
Conceptualización
Cuando se analizó en el capìtulo anterior la confiabilidad, se dijo que ésta

determina si los puntajes provenientes de la aplicación de un instrumento son estables
en el tiempo si se aplica el instrumento dos veces; son equivalentes si se aplican dos
versiones de un mismo instrumento; y consistentes, si quienes responden un
instrumento lo hacen homogéneamente. La confiabilidad determina si los puntajes de
199
un instrumento son los mismos en el tiempo y en situaciones similares; pero no
determina si lo que está midiendo es lo que realmente se quiere medir. Puede ocurrir
que un instrumento sea estable, equivalente y homogèneo; pero no mide la variable
que se desea medir, ejemplo, una balanza puede medir en repetidas mediciones un
peso de un objeto o sujeto en forma consistente. Las veces que se pesa, éste es el
mismo. Esto determina por lo tanto confiabilidad; pero puede ser que éste no sea el
peso del objeto o sujeto, es decir, mide algo en forma consistente, pero no lo que
realmente queremos medir.
La validez tiene como propósito determinar si el instrumento mide exactamente
lo que se quiere medir. Es por esta razón que suele afirmarse que la confiabilidad de
un instrumento es una condición necesaria para evaluarlo, pero no suficiente; porque
un instrumento puede ser confiable, sin ser válido; pero al ser válido es
necesariamente confiable.
El lector puede preguntar, si un instrumento que es válido, también es confiable
¿Por qué no concentrar la evaluación del instrumento en la validez y nos olvidamos
de la confiabilidad?. La respuesta a la pregunta, es que hallar evidencias de validez es
más difícil que calcular la confiabilidad, la cual se reduce a un mero tecnicismo, a
calcular un coeficiente de confiabilidad. La validez también aplica coeficientes, pero
requiere la presencia de evidencias que determinan la validez del instrumento, las
cuales en la mayoría de las veces es muy difícil de obtenerlas, porque las mismas
implica determinar aspectos teóricos de lo que se quiere medir y relacionarlos con
evidencias empíricas; las cuales no siempre son accesibles en el procceso de
validación de instrumento
Métodos de Validez
Los métodos para determinar la validez son: Validez de contenido (a través de

la técnica de Juicio de expertos), Validez de criterio (la cual se subdivide en validez
concurrente y predictiva) y la validez de constructo (a través de sus dos clases:
convergente y discriminante, aunque además de éstas hay otras evidencias de validez
200
de constructo, las cuales también se analizarán). A continuación se explican los
diferentes métodos de validez:
Validez de Contenido
La validez de contenido es la más usual entre los tipos de validez. Esto se

explica, porque se le puede aplicar a cualquier instrumento independiente de la escala
de medición. Los otros tipos de validez exigen como mínimo una escala de medición
ordinal. El otro aspecto que favorece la aplicación de este método, es que la técnica
empleada para obtener la validez de contenido es la técnica de Juicio de Experto, la
cual consiste en la revisión del instrumento por expertos en la variable en estudio,
quienes en la mayoría de los casos se localizan fácilmente.
Para la evaluación del contenido del instrumento, el investigador o diseñador
del instrumento, debe proporcionarle al experto un formato para evaluar el
instrumento, donde éste realiza las observaciones y recomendaciones sobre el
contenido del instrumento.
A continuación se presentan algunos modelos de formato:
MODELO 1.-FORMATO PARA EVALUAR EL INSTRUMENTO
Ítem Congruencia Claridad Tendenciosidad Observaciones

Sí ----- No ----- Sí------ No ----- Sí ------ No -----
1
.
.
.
.
.
.
.
.
.
.
.
201
.
n
MODELO 2.- FORMATO PARA EVALUAR EL INSTRUMENTO
ítem Esencial Útil pero no esencial No necesario

1
.
.
.
.
.
.
.
n
A continuación se presenta y ejemplifica la razón de validez de contenido, la

cual se puede aplicar cuando el formato de evaluación es el modelo 2:
Razón de Validez de Contenido
Ne  N 2
CVR 
N
2 de validez de contenido
CVR = razón
Ne = Número de expertos que indican "Esencial"
N = Número total de expertos.
Ejemplo
1.- CVR negativo: cuando menos de la mitad de expertos indica esencial.

Supóngase que cuatro (4) de once (11) expertos indicaron esencial.
4  (11 2)
CVR   0,27
11 2
202
2.- CVR cero = Cuando exactamente la mitad de los expertos indican
"esencial" . Supòngase que cinco (5) de diez (10) expertos indican que es
esencial
5  (10 2)
CVR  0
10 2
3.-CVR positivo = cuando más de la mitad; pero no todos los expertos indican
"esencial". Supòngase que nueve (9) de once (11) experos indican que es esencial.
9  (11 2)
CVR   0.64
11 2
Para interpretar los resultados debe consultarse la tabla que se presenta a

continuación:
203
Valores mínimos de la razón de validez de contenido para asegurar que es
improbables que el acuerdo se debe al azar.
Número de expertos Valor mínimo

5 0.99
6 0.99
7 0.99
8 0.75
9 0.78
10 0.62
11 0.59
12 0.56
13 0.54
14 0.51
15 0.49
20 0.42
25 0.37
30 0.33
35 0.31
40 0.29
Fuente: Cohen, R y Swerdlik, M. (2.000). Pruebas y Evaluación Psicológicas, 4°

edición: MC Graw Hill, pág. 189.
Al consultar en esta tabla los resultados de los tres ejemplos desarrollados, los
mismo se interpretan de la manera siguiente: en el primer ejemplo, el resultado es
negativo por lo tanto se rechaza el ítem; ya que la tabla no tiene valores mínimos
negativos. En el segundo ejemplo es cero, al consultar la tabla, se observa que
tampoco tiene valores mínimos de cero, lo cual debe llevar a tomar como decisión
excluir el ítem del instrumento. En el tercer ejemplo el resultado es mayor a cero;
para interpretar el resultado consultamos la tabla, procediendo de la manera siguiente:
se consulta en la tabla el valor mínimo cuando hay 11 expertos, el cual es 0,59. Se
compara con el valor calculado que es 0,64. Este valor está por encima del valor
mínimo exigido, por lo tanto, se acepta el ítem.
204
Además del Formato de evaluación del instrumento, es recomendable anexar al
instrumento, el cuadro de operacionalización de la variable, los objetivos de la
investigación y las bases teóricas de la variable en estudio. Esta información ampliará
el conocimiento del experto sobre la variable que se quiere medir y le permitirá
proporcior mejores observaciones y recomendaciones sobre el instrumento evaluado.
Validez de Criterio
Determina la relación existente entre las puntuaciones de un instrumento de

medición y una variable (conocida como criterio).
¿Qué es un criterio?
Para Hurtado (2.000) un criterio es: “... una medida externa, independiente al
instrumento (en evaluación), con el cual se supone que éste está correlacionado y que
en definitiva es la característica o conducta que el instrumento intenta predecir...
[pretende medir]” (p. 435).
Un ejemplo es predecir el rendimiento que tendrá un estudiante en su futura
carrera universitaria (criterio) a través de una prueba de aptitud académica
(instrumento en evaluación). Para validar el instrumento, se aplica a un grupo de
estudiantes que aspiran ingresar a la Universidad, se espera que haya transcurrido un
semestre o un año académico para correlacionar las puntuaciones obtenidas en el
instrumento con la calificaciones promedio del mismo grupo después de finalizar el
semestre o año académico.
El estadístico que se emplea es el coeficiente de correlación de Pearson (si la
escala de medición de las puntaciones se considera como mínimo en intervalo) o el
coeficiente de correlación de Spearman (si la escala de medición es ordinal). Para
conocer el procedimiento exigido en el cálculo de ambos coeficientes puede consultar
el aprtado del capìtulo sobre confiabilidad de instrumento de medición educativa
(Unidad anterior) que aborda el método de confiabilidad de reaplicación de la prueba.
205
Características que debe reunir un criterio
1. Pertinencia: debe juzgarse si el criterio representa realmente un rendimiento

adecuado de la variable que se desea medir.
2. Debe ser confiable.
3. Debe estar libre de tendenciosidad.
4. Debe poseer validez.
Coeficiente de validez de criterio.
El coeficiente de validez de criterio se determina correlacionando los puntajes

del instrumento en evaluación con los puntajes del criterio. La interpretación de los
resultados es similar a la del coeficiente de confiabilida. A continuaciòn se presenta
los valores para su interpretaciòn:
0.81 ----------- 1 Muy alta
0.61 ----------- 0.80 Alta
0.41 ----------- 0.60 Moderada
0.21 ----------- 0.40 Baja
0.00 ----------- 0,20 Muy baja
Clase de validez de criterio
Se conocen dos clases de validez de criterio:
206
Validez concurrente. Cuando las puntuaciones del instrumento en evaluación se
obtienen más o menos al mismo tiempo que las medidas del criterio. Ejemplo: cuando
se utilizan los resultados de una prueba de habilidades numéricas y verbales
(instrumento en evaluación) para determinar el rendimiento académico (criterio).
Validez predictiva. Cuando el criterio está en tiempo futuro. Ejemplo: cuando se

utilizan los resultados de una prueba de aptitud académica (instrumento en
evaluación) para predecir el desempeño académico (criterio) del alumno en un curso.
Validez de construcción (o de constructo)
Definición de constructo
Se está en presencia de un constructo cuando la variable a investigar no se

puede medir directamente; pero muchas de las conductas que se consideran como
aspecto de ella son descriptibles y medibles.
Definición de validez de constructo
Grado en que un instrumento es una medida de un constructo en particular.
Clases de validez de constructo
Validez Convergente. Se determina correlacionando los puntajes del

instrumento que mide el constructo en estudio con los puntajes de otro instrumento
que mide el mismo constructo u otro con el cual debería correlacionarse
positivamente. La correlación para que exista validez de constructo convergente debe
ser alta o muy alta y la aplicación de ambos instrumentos debe ser a la misma muestra
de sujetos.
207
Validez Discriminante. Se determina correlacionando las puntuaciones del
instrumento que mide el constructo en estudio con las puntuaciones de otro
instrumento que mide otro constructo o variables, con la cual el constructo en estudio
no debería correlacionarse. El coeficiente de correlación en la medida que se
aproxime a cero (0) indica mayor validez discriminante.
Etapas para Calcular la Validez de Constructo
1. Establecer la relación teórica entre los conceptos, basándose en el marco teórico,

en que se fundamentan ambos instrumentos.
2. Correlacionar los puntajes de los sujetos en ambos instrumentos.
3. Determinar qué clase de validez de constructo posee el instrumento.
Otras Evidencias de Validez de Constructo
Además de las evidencias obtenidas por la validez convergente y discriminante,

hay otras evidencias de validez de constructo, las cuales se explican a continuación:
1. Evidencia de homogeneidad o consistencia interna: se refiere a lo bien que
mide un instrumento un solo concepto. Se puede determinar a través de: (a)
Correlación item-test: se determina la correlación existente entre cada ítem que
conforma el instrumento con el total de puntajes del instrumento. El programa SPSS
dispone de este indicador. Se debe rechazar todos aquellos ítemes con un coeficiente
de correlación ítem-test inferior o igual a 0,25; (b) Capacidad de discriminación de
los ítemes: mide el grado en que los sujetos de altas calificaciones y los sujetos de
bajas calificaciones responden en forma diferenciada los ítemes. (Ver capìtulo IX).
2. Evidencias de cambios con la edad: Se somete un instrumento a este
indicador cuando cuanto hay certeza que la edad influye en su comportamiento.
Ejemplo: se puede aplicar una prueba de rapidez en la lectura a escolares de grupos
de edades diferentes. La prueba evidenciará validez de constructo si los grupos de
grados superiores obtienen calificaciones más altas que los grupos de grados
208
inferiores. Esto debe ser de esta manera, porque está demostrado que el incremento de
la escolaridad mejora la rapidez en la lectura.
3. Evidencias de cambios preprueba-posprueba: Si se aplica una estrategia
instruccional, la cual ha demostrado eficacia para incrementar el rendimiento
académico, los puntajes de un instrumento que mide el rendimiento académico, deben
tener diferencias significativas al comparar los resultados de la preprueba, aplicada
antes de comenzar la estrategia instruccional, con los resultados de la posprueba,
aplicada después de concluir el curso sometido a la estrategia. Si las diferencias entre
la preprueba y posprueba son significativas, se puede asegurar que el instrumento
tiene validez de construcción.
4. Evidencia de grupos distintos: Si se diseña un instrumento que mide la
actitud del estudiante hacia la matemática y se aplica el instrumento a dos grupos
claramente diferenciados: grupo de alumnos que aprobaron la asignatura matemática
y grupo de alumnos reprobados en esa asignatura, un instrumento con validez de
constructo debe presentar como resultado estudiantes que aprobaron la asignatura con
una actitud hacia las matemáticas más favorable y los estudiantes reprobados con una
actitud menos favorable.
5. Análisis Factorial: El análisis factorial es una técnica que a través de un
procedimiento matemático y estadístico complejo, determina si los ítemes de un
instrumento miden solamente un aspecto de la variable en estudio. Asimismo
identifica aquellos ítemes que no miden ningún aspecto de la variable en estudio, los
cuales deben excluirse del instrumento. El análisis factorial es un indicador tan
importante en el proceso de validación de un instrumento que se dedicará la próxima
unidad a desarrollar paso a paso su procedimiento.
209
Actividad 1
3. Revise un trabajo de grado, evalúe los ítemes del instrumento aplicado para la
recolección de datos; y llene el formato presentado a continuación:
Formato para Evaluar el Instrumento
Aspectos a evaluar del Instrumento Observaciones

ítem Congruencia (1) Claridad (2) Tendenciosidad (3)
Si No Si No Si No (4)
1
2
3
Fecha:
Nombre del Experto: Firma:
Institución donde trabaja: Cargo que desempeña:
(1) Congruencia: Sí el ítem se relaciona con el indicador, subdimensión, dimensión y variable

que se pretender medir o describir.
(2) Claridad: Redacción del ítem
(3) Tendenciosidad: Si induce a responder en forma favorable, indecisa o desfavorable.
(4) Observaciones: Recomendaciones sobre el ítem que es evaluado desfavorablemente:
modificarlo, sustituirlo por otro, excluirlo del instrumento, etc.
Actividad 2
Determine la razón de validez de contenido:
210
Un Jurado lo integran nueve (9) expertos.
¿Qué decisión debe tomarse con respecto al ítem?
1. Siete (7) expertos indican que el ítem es "esencial".
2. Tres (3) expertos indican que el ítem es "esencial".
3. Tres (3) expertos indican que el ítem "no es necesario" y dos que es " útil
pero no esencial", el resto respondieron que es "esencial".
4. Cinco (5) expertos indican que el ítem es "útil pero no esencial ", uno (1) que
"no es necesario" y el resto que es "esencial".
5. Todos los expertos indicaron que no es esencial.
6. Sólo un (1) experto indicó que es esencial.
Actividad 3
Determine el coeficiente de validez de criterio e interprete el resultado.
211
sujetos Instrumento en evaluaciòn Criterio
(puntajes) (puntajes)
1 19 19
2 18 17
3 15 15
4 20 20
5 16 15
6 17 14
7 18 18
8 20 19
9 20 19
10 14 15
11 14 14
12 14 14
13 16 15
14 16 17
15 15 14
16 18 19
17 14 14
18 17 17
19 20 20
20 18 18
21 14 13
22 15 16
23 18 18
24 19 19
25 15 16
ACTIVIDAD 4
Determine en los siguientes ejercicios si existe validez convergente o

discriminante:
212
Situación 1
Se ha demostrado teóricamente que la actitud hacia las innovaciones educativas
y la motivación al logra se correlacionan positivamente. Tomando en cuenta esta
relación el Constructor de una escala de actitud hacia las innovaciones educativas
desea determinar si el instrumento diseñado tiene validez de constructo. En este
sentido aplica a una misma muestra de sujeto este instrumento, conjuntamente con
otro instrumento que mide la motivación al logro; el cual tiene debidamente
comprobado validez. Calcule el coeficiente de validez e interprete los resultados que
se muestran en la siguiente tabla:
Sujetos Actitud hacia las Motivación al logro

innovaciones educativas
(Puntajes)
(Puntajes)
1 3 3
2 5 4
3 5 5
4 2 2
5 4 5
6 1 2
7 2 2
8 3 3
9 5 5
10 5 5
11 5 5
12 4 5
13 2 2
14 2 2
15 1 1
16 1 2
17 4 5
18 4 5
19 5 5
20 1 2
Situación 2
213
Se ha demostrado teóricamente que el coeficiente de inteligencia y el nivel de
ingreso no se correlacionan; tomando en cuenta esta afirmación el constructor de una
prueba de inteligencia, correlaciona los puntaje de un test de inteligencia aplicado a
un grupo de sujetos con el nivel de ingreso que posee cada uno de ellos. Calcule e
interprete el coeficiente de validez.
sujetos Coef. de Inteligencia Ingreso/mensual

(C.I) (Bs.)
1 98 100.000
2 120 700.000
3 111 990.000
4 115 1.200.000
5 125 3.500.000
6 85 1.100.000
7 95 1.090.000
8 99 900.000
9 115 1.100.000
10 100 1.100.000
11 115 1.300.000
12 130 1.040.000
13 125 900.000
14 114 1.200.000
15 105 1.500.000
16 100 905.500
17 100 1.300.000
18 98 900.000
19 95 1.000.000
20 65 2.290.000
21 80 800.000
22 75 800.000
23 98 2.500.000
24 95 900.000
25 89 1.100.000
26 110 970.000
27 95 2.700.000
28 100 3.000.000
Referencias
Cohen, R., Y Swerdlik, M. (2.001). Pruebas y Evaluación Psicológicas. México: Mc

Graw Hill.
214
Hurtado, J. (2.000). Metodología de la investigación holística. (Tercera edición)
Caracas. Sypal.
Lecturas Sugeridas
Aiken, L. (1.996). Test psicológicos y evaluación. México: Prentice Hall. Se

recomienda el Capítulo 4: Estandarización, confiabilidad y validez. Punto:
Validez.
Ary, D., Jacobs, L.., Y Razavieh, A. (1.994). Investigación pedagógica. (Segunda

Edición). México: Mc Graw Hill. Se recomienda el Capítulo 8: Validez y
confiabilidad. Apartado: Validez.
Cohen, R., Y Swerdlik, M. (2.001). Pruebas y Evaluación Psicológicas. México: Mc

Graw Hill.
Hurtado, J. (2.000). Metodología de la Investigación Holística. (Tercera edición).

Caracas: Sipal. Se recomienda el Capítulo 24: Construcción y validación de
instrumentos. Apartado 24.3: Validez de instrumentos.
Kerlinger, F. (1.988). Investigación del comportamiento (Segunda edición en

español): México: Mc Graw Hill. Se recomienda el Capítulo 27: Validez.
CAPITULO XII
ANÁLISIS FACTORIAL COMO TÉCNICA DE VALIDEZ DE CONSTRUCTO
EN ESCALAS PARA MEDIR ACTITUDES
215
Objetivo
Familiarizar al estudiante con el procedimiento exigido para cumplir la

aplicación del análisis factorial
Estudiar actitudes, considerando sus tres componentes, implica elaborar un

instrumento con un alto número de ítemes, porque se debe redactar ítemes que
representen los tres componentes de la actitud y los indicadores del objeto de la
actitud. Cada indicador debe estar representado por ítemes redactados en forma
cognoscitiva, afectivo y conductual, porque de lo contrario no medirá la actitud en
consideración a sus tres componentes. Este procedimiento, que es el adecuado,
origina instrumentos constituidos por un alto número de ítemes, cuando la variable
posee un extenso número de indicadores. Es en este caso, cuando el análisis factorial
representa una poderosa herramienta para reducir el número de ítemes de un
instrumento.
El análisis factorial es una técnica que genera validez de constructo, tanto
convergente como discriminante; porque identifica a los ítemes que miden sólo un
factor, aquellos que miden a varios y los que no miden ninguno. Sus resultados
permiten tomar la decisión de aceptar solamente los ítemes que miden un factor.
El procedimiento para la aplicación del análisis factorial, implica el uso de
técnicas matemáticas y estadísticas muy complejas, como son el coeficiente de
correlación parcial, álgebra matricial y la rotación de factores; técnicas que al
realizarlas manualmente exigen poseer sólidos conocimientos sobre estas dos
disciplinas y realizar laboriosos cálculos. Afortunadamente existen programas
computarizados, como el Programa Estadístico para Ciencias Sociales (SPSS), que
presenta en forma automatizada los resultados, evitando la laboriosa tarea de realizar
cálculos manuales de tan complejas técnicas matemáticas y estadísticas.
216
Validación Preliminar de Actidoc. I
Descripción de Actidoc. I
Es una escala de actitud, usando el método de Likert; y cuyo propósito es

determinar la actitud del docente de la primera etapa de Educación Básica hacia la
evaluación de los aprendizajes, de acuerdo al Currìculo Básico Nacional. Este
instrumento tiene cinco (5) alternativas de respuestas: totalmente de acuerdo, de
acuerdo, indeciso, en desacuerdo y totalmente en desacuerdo. La valoración de cada
alternativa depende del sentido de redacción del item. Si es en sentido positivo hacia
la evaluación de los aprendizajes la máxima valoración (5 puntos) corresponde a la
alternativa totalmente de acuerdo. Si por el contrario, el item se expresa en sentido
negativo hacia la evaluación de los aprendizajes, la máxima valoración será
totalmente en desacuerdo.
La versión preliminar del instrumento estuvo conformada por 120 ítemes. El
criterio establecido fue redactar 2 ítemes por indicador. El total de indicadores suma
veinte; pero como cada indicador se expresó en forma cognoscitiva, afectiva y
conductual, esta cifra ascendió a 60 indicadores, que al redactar la mitad en sentido
positivo y la otra mitad en sentido negativo, totaliza 120 ítemes.
En cuanto al número de sujetos para aplicar la encuesta piloto, se seleccionaron
240 docentes que laboran en 30 escuelas de la primera etapa de Educación Básica del
Estado Lara. El criterio para calcular el tamaño de la muestra piloto de docentes, fue
tomar el doble de sujetos por item.
Validez de Contenido
217
Antes de aplicar la prueba piloto, se realizó la validez de contenido del
instrumento a través de la técnica de juicio de expertos. En este sentido el instrumento
fue evaluado por siete (7) expertos: 3 metodólogos, 1 experto en construcción de
instrumentos educativos y muestreo, 1 experto en diseño curricular y 2 maestros de
aula de la primera etapa de Educación Básica; estos últimos evaluaron
fundamentalmente la claridad, nivel de comprensión de los ítemes y la duración en el
llenado del instrumento. Las observaciones realizadas por los siete (7) expertos
contribuyeron sustancialmente a mejorar y enriquecer el instrumento.
Análisis de Discriminación de los Îtemes
El análisis de discriminación de los ítemes se realizó calculando la t de student

para muestras independientes. El procedimiento consistió en comparar en cada item
el 27% de los sujetos (65 docentes) con el puntaje total de actitud más alto (grupo
superior) y el 27% de sujetos (65 docentes) con el puntaje total de actitud más bajo.
Con este propósito se calcularon a través del paquete estadístico computarizado SPSS
120 T de student correspondientes a cada uno de los ítemes que constituyeron la
versión preliminar del instrumento.
Se contrastaron las 120 pruebas estadísticos, a un nivel de significación bilateral
y al 0,01 de rechazo de la hipótesis nula (H0). Los resultados fueron los siguientes:
hubo 108 ítemes donde la hipótesis nula se rechazó, aceptándose por lo tanto la
hipótesis alternativa que afirma la existencia de diferencias significativas entre el
grupo superior e inferior, en consecuencia, estos ítemes demostraron capacidad de
discriminación. Los ítemes donde los grupos no presentaron diferencias significativas
fueron doce (12): 1, 12, 21, 26, 27, 35, 40, 70, 79, 82, 106 y 108. En estos ítemes se
evidenciò baja capacidad de discriminación, lo cual permitiò excluirlos del
instrumento.
Análisis de Confiabilidad de Instrumento
218
Para evaluar la confiabilidad del instrumento se analizaron dos (2) métodos:
1. reaplicación de la prueba: el procedimiento fue el siguiente: se aplicó la
versión preliminar a 240 docentes y se seleccionó aleatoriamente el 10% de los
docentes de la muestra piloto (24 docentes); a quienes se aplicó por segunda vez el
mismo instrumento, dos meses después de la primera aplicación. Se procedió a sumar
el total de actitud de cada uno en ambos aplicaciones, se calculó a través del
programa estadístico computarizado SPSS, el coeficiente de correlación de Pearson
(la actitud se considera expresada en una escala de medición de intervalo; por lo tanto
este coeficiente es adecuado), correlacionando los puntajes del test y el retest. Los
resultados (coeficiente de 0,78) demuestran alta correlación entre ambos puntajes y
estabilidad del instrumento, garantizando que los resultados se pueden generalizar a
través del tiempo.
2. Confiabilidad de consistencia interna: esta confiabilidad mide la
homogeneidad o consistencia que presentan las respuestas de los sujetos a quienes se
le aplicó el instrumento. Para que el instrumento tenga consistencia interna es
necesario respuestas homogéneas, es decir, obtener puntajes similares en los
diferentes ítemes. Para el cálculo de esta confiabilidad se usó las fórmulas de Alfa de
Cronbach y Dos Mitades. En ambos casos el procedimiento fue a través del programa
estadístico SPSS. Los resultados fueron coeficientes de confiabilidad de 0,95 y 0,91
respectivamente, lo cual demuestra alta confiabilidad de consistencia interna del
instrumento.
Contribución de los Ítemes a la Confiabilidad del Instrumento.
Para determinar si los ítemes que constituyen el instrumento contribuyen a la

confiabilidad o si por el contrario afectan la confiabilidad del instrumento, se aplicó
la opción de SPSS para conocer la confiabilidad del instrumento si se excluye el item
del análisis de confiabilidad. Los resultados demostraron que hubo 10 ítemes que no
aportaban confiabilidad al instrumento y en algunos casos la confiabilidad se
219
incrementaba al excluir el item. Los ítemes que no contribuyeron a la confiabilidad
son los siguientes: 17, 22, 32, 53, 75, 76, 100, 113, 116 y 120.
Considerando que el propósito en la evaluación de un instrumento es obtener
validez y confiabilidad, se decidió excluir estos ítemes del instrumento, porque no
cumplían con el propósito de aportar confiabilidad al instrumento. La confiabilidad
sin estos ítemes ascendió un (1) punto, ubicándose el coeficiente Alfa de Cronbach en
0,96.Correlación
Relación Ítem-Total-Corregido
Este indicador de confiabilidad lo presenta el paquete estadístico SPSS, como

opcional cuando se calcula el coeficiente de confiabilidad. Ruiz (1990) recomienda
que el item aceptado debe poseer una relación con el total, superior a 0,254 (p.91);
porque de lo contrario la relación no es aceptable. En la presente investigación todos
los ítemes aceptados, poseen una relación con el total superior al 0,25. Sólo los ítemes
que no contribuyen a la confiabilidad, a excepción del 17, presentan una relación
inferior o igual a 0,25.
El Análisis Factorial
Coceptualización
El análisis factorial es una técnica de validez de constructo que por su

complejidad es de uso limitado; pero de gran utilidad cuando se requiere reducir
variables o ítemes; ya sea porque miden varios factores o simplemente no miden
ninguno. Kerlinger (1988) al referirse al análisis factorial expresa lo siguiente:
El análisis factorial sirve a la causa de la circunspección científica.
Reduce la multiplicidad de pruebas y medidas a una mayor simplicidad.
Nos dice, en efecto, qué pruebas o medidas pertenecen conjuntamente:
con cuáles podría medirse la misma cosa, en otras palabras, y en qué
medida pueden hacerlo. De este modo, reduce el número de variables que
debe tratar el científico. También ayuda al científico a localizar e
220
identificar las unidades o propiedades básicas que fundamentan las
pruebas y medidas. (p. 648)
Más adelante Kerlinger define los factores, los cuales constituyen el soporte del
análisis factorial. Al respecto señala que:
Un factor es un constructo, una entidad hipotética, una variable latente
que se supone fundamenta las pruebas, escalas, reactivos y, en realidad,
las medidas de casi cualquier tipo. Se ha encontrado que ciertos números
de factores fundamentan la inteligencia; por ejemplo, habilidad verbal.
Habilidad numérica, razonamiento abstracto, razonamiento espacial,
memoria y otros. De manera similar, se han aislado e identificado los
factores aptitud, actitud y personalidad. Aún las naciones y la gente han
sido factorizada. (p. 648)
El procedimiento para realizar el análisis factorial consiste en los siguientes

pasos: (a) Formar la matriz de correlaciones, en la cual se correlacionan todas las
pruebas o ítemes; (b) Se identifican los ítemes que se relacionaron con cada factor;
(c) Se rotan los factores para obtener una solución factorial más confiable; (d) Se
excluyen del instrumento aquellos ítemes que cargan (o se correlacionan) con más de
un factor o no tiene cargas altas (correlación alta) en ningún factor; (e) Se construye
la versión definitiva del instrumento, con aquellos ítemes que sólo se correlacionan
altamente con un factor y con correlaciones bajas en el resto. Con este criterio se
persigue que los ítemes midan exactamente lo que deben medir, de ahí que se
considere al análisis factorial como una técnica para generar la validez de constructo
del instrumento.
Caso Hipotético de Análisis Factorial
A continuación se presenta el procedimiento manual para desarrollar un

ejemplo hipotético de análisis factorial:
221
1. Matriz de correlación de ítemes
Pruebas 1 2 3 4 5 6
1 1 0.72 0.63 0.09 0.09 0.00
2 0.72 1 0.57 0.15 0.16 0.09
3 0.63 0.57 1 0.14 0.15 0.09
4 0.09 0.15 0.14 1 0.57 0.63
5 0.09 0.16 0.15 0.57 1 0.72
6 0.00 0.09 0.09 0.63 0.72 1
En negritas: Factor 1 (Pruebas 1, 2 y 3 ) y factor 2 (Pruebas 4, 5 y 6)

Prueba 1: Vocabulario Prueba 4:Álgebra
Prueba 2: Lectura Prueba 5: Aritmética (Prueba estandarizada)
Prueba 3: Sinónimos Prueba 6: Aritmética (Prueba hecha por el docente)
Tomado de Kerlinger. (1998), p 649
Se correlacionan los resultados de cada prueba con el resto y se obtienen 36

coeficientes de correlación. El tipo de coeficiente de correlación que se aplica es el
parcial.
2. Obtención de la matriz factorial original.
Pruebas Factor 1 Factor 2

1 0.90 0.00
2 0.80 0.10
3 0.70 0.10
4 0.10 0.70
5 0.10 0.80
6 0.10 0.90
Tomado de Kerlinger. (1.998), p 652
Se correlaciona cada prueba con el factor y se obtiene los coeficientes de correlación

parcial de cada prueba en ambos factores
222
3. Matriz factorial con solución rotadas
Pruebas Factor 1 Factor 2

1 0.83 0.01
2 0.79 0.10
3 0.70 0.10
4 0.10 0.70
5 0.10 0.79
6 0.01 0.83
Tomado de Kerlinger. (1.998), p 651
Considerando que la solución no rotada, presenta resultados ambiguos, se rotan los

factores para obtener una solución única. En la interpretación de los resultados, se
aceptan aquellas pruebas que tienen un coeficiente de correlación alto en un factor
(mayor a 0,50) y bajo en el resto de los factores (menor o igual a 0,30). En este
ejemplo hipotético, las pruebas que se correlacionan con el factor 1, son la 1, 2 y 3.
Con el factor 2, se correlacionan las pruebas 4, 5 y 6. Si alguna de ellas se
correlacionaran en forma alta en ambos factores o no se correlacionaran con ninguno,
se debe excluir de la investigación en estudio. En el primer caso (correlación de la
prueba con más de un factor), indica que la prueba está midiendo más de factor y sólo
debe medir un factor. En el segundo caso (la prueba no se correlaciona con ningún
factor), no mide ningún factor.
Rutina para Realizar el Análisis Factorial en SPSS
1. Abrir el archivo
2. Clic en el menú analizar ( si es la versiòn 11) o en Estadìstico (si es
la versiòn 7.5)
3. Clic en reducción de datos.
4. Clic en análisis factorial
223
5. Pasar todos los ítemes (no las variables cualitativas) al recuadro
variables.
6. Clic en descriptivos: activar las opciones “Determinante” y “KMO y
prueba de esfericidad de Bartlett”, clic en continuar.
7. Clic en extracción: Dejar activada la opciòn poor defecto “Mètodo
Componentes principales”, activar la opción autovalores mayores que 1. Clic
en continuar.
8. Clic en rotación: activar la opción varimax. Clic en continuar.
9. Clic en opciones: activar las opciones “Ordenadas por tamaño” y
“suprimir valores absolutos menores a 0.10”. Clic en continuar.
10. Clic en aceptar.
Para informaciòn màs amplia sobre la rutina del anàlisis facttorial a

travès del progrma SPSS, consultar el anexo E de este Mòdulo, donde se
suministra informaciòn sobre el propòsito que cumplen cada uno de los
indicadores que presentan las diferentes opciones.
El Análisis Factorial en un Caso Práctico: Actidoc. I
En el caso particular de esta investigación, el análisis factorial se realizó a

través del programa estadístico computarizado SPSS, seleccionando el Método de
Componentes Principales como Extracción de Factores y el Método Varimax para la
rotación de factores. Como opción que presenta SPSS, se realizó una ordenación de
las cargas factoriales de acuerdo al tamaño y se suprimieron los valores absolutos
menores 0,10.
Para determinar si es viable aplicar el análisis factorial en el instrumento
Actidoc. I, se calculó a través de SPSS, el Determinante de la matriz; el cual se
interpreta de la siguiente manera: valores cercanos a cero (0) indican que los ìtemes
de la matriz se correlacionan linealmente, siendo viable por lo tanto aplicar el anàlisis
factorial, cuando ocurre lo contrario, es aconsejable no continuar con el anàlisis. En el
224
caso de Actidoc. 1, el Determinante se ubica en 6,187E-30 (se interpreta que antes del
nùmero 6 se anteponen 30 ceros). Este resultado evidencia que Actidoc. 1 tiene una
interrelaciòn lineal alta entre los ìtemes.
Asimismo se calculò a travès de este mismo programa, el coeficiente KMO
(Káiser-Meyer-Olkin) y el Test de Bartlett. Según Visuata (1998) “...el índice KMO
nos compara los coeficientes de correlación de Pearson obtenidos (en la matriz de
correlación)... con los coeficientes de correlación parcial entre variables...” (p. 224)
El criterio para interpretar los resultados del índice KMO son los siguientes:
1  KMO > 0,90 son considerados excelentes.
0,90  KMO > 0,80 son considerados buenos.
0,80  KMO > 0,70 son considerados aceptables.
0,70  KMO > 0,60 son considerados mediocres o regulares.
0,60  KMO > 0,50 son considerados malos
KMO  0,50 son considerados inaceptables o muy malos.
En el caso específico de esta investigación el KMO es igual a 0,81,
considerándose por lo tanto como bueno.
En el caso del test de Bartlett, Visuata (1998) expresa que éste:
...es utilizado para verificar si la matriz de correlaciones es una matriz

identidad, es decir, si todos los coeficientes de la diagonal principal son
iguales a la unidad y los externos a la diagonal iguales a 0. Este
estadístico se obtiene a partir de la transformación x 2 del determinante de
la matriz de correlaciones y cuanto mayor sea y por lo tanto menor el
grado de significación más improbable que la matriz sea una matriz
identidad... un grado de significación p = 0 resulta evidente que no se
trata de una matriz identidad. En el supuesto de que no pudiese rechazar
esta hipótesis, se desaconseja proceder a realizar el análisis factorial con
los datos. (p. 224)
En el caso de esta investigación, la prueba Bartlett tiene una significación igual

a 0,00, lo que indica aconsejable aplicar el análisis factorial en la validación del
instrumento.
Las tres pruebas aplicadas (el Determinante, el índice KMO y la prueba de
Bartlett), consideradas como aconsejables aplicarlas para determinar la conveniencia
225
de realizar el análisis factorial, son favorables; lo que indica la conveniencia y la
viabilidad de aplicar en esta investigación la técnica de análisis factorial. En este
sentido se procedió a realizar (después de extraer los factores, a través del método de
componentes principales, y la rotación de factores, a través del método Varimax) la
selección de los ítemes entre 28 factores extraídos. El criterio para seleccionar los
ítemes se tomó de Nunnally y Bernstein (1988), quienes al respecto expresan lo
siguiente:
...cada factor debe tener algunas variables que se correlacionen con él casi
exclusivamente (la mayoría de las variables que se correlacionan
altamente con ese factor no deben correlacionarse más de 0,3 con
cualquier otro factor, y las variables marcadoras... deben correlacionarse
por encima de 0,5...(p. 603)
Tomando en cuenta este criterio, la cantidad de ítemes se reduce de 98 a 49,

excluyéndose ítemes, unos, porque tenían alta correlación en más de un factor (mayor
a 0.50), lo cual indica que miden más de un factor, los otros ítemes excluídos fueron
aquellos que no tenían correlación mayor a 0,5 en ningún factor, indicando que no
medían ningún factor. En resumen se descartaron aquellos ítemes que medían más de
un aspecto del objeto de estudio (en este caso la actitud del docente hacia la
evaluación de los aprendizajes) o aquèllos que no medían ninguno. El análisis
factorial permite precisamente determinar que los ítemes de un instrumento miden
realmente lo que se quiere medir y cada uno de ellos deben medir sólo un aspecto
(factor) del objeto de estudio.
En el caso de esta investigación se aplicó el criterio de aceptar factores con
extracción de autovalores mayores que 1. Se obtuvo, tomando en cuenta este criterio,
28 factores que acumularon una varianza explicada de 72,26% (Ver Cuadro 7), es
decir que esta cantidad de factores explican 72,26% de la varianza del total de ítemes
del instrumento, porcentaje que se considera alto y aceptable para realizar el análisis
factorial del instrumento.
226
Cuadro 7
Varianza total explicada
Suma de las saturaciones al cuadrado de la rotación
Componente
Total % de la varianza % acumulado
1 6,212 6,339 6,339
2 3,849 3,928 10,267
3 3,748 3,825 14,091
4 3,544 3,616 17,707
5 3,383 3,452 21,159
6 3,287 3,355 24,514
7 3,105 3,168 27,682
8 2,878 2,937 30,619
9 2,521 2,572 33,191
10 2,499 2,550 35,740
11 2,433 2,482 38,223
12 2,425 2,475 40,697
13 2,422 2,472 43,169
14 2,236 2,282 45,451
15 2,188 2,233 47,684
16 2,135 2,178 49,863
17 2,057 2,099 51,952
18 2,047 2,089 54,050
19 1,982 2,022 56,072
20 1,892 1,931 58,004
21 1,881 1,920 59,923
22 1,850 1,887 61,810
23 1,833 1,870 63,681
24 1,749 1,785 65,465
25 1,677 1,712 67,177
26 1,673 1,707 68,884
27 1,658 1,692 70,576
28 1,648 1,682 72,257
Nota: Datos tomados de la matriz de resultados de la encuesta piloto (preliminar)

Actidoc. I y cálculos realizados a través del programa estadístico SPSS.
227
Aproximación a una Nueva Operacionalización de la Variable Actitud del
Docente hacia la Evaluación de los Aprendizajes a través del Análisis
Factorial
Entre los beneficios que genera la aplicación de la técnica del análisis factorial
es descubrir factores que reemplazan la estructura original de operacionalización de la
variable, fundamentada en dimensiones, subdimensiones e indicadores. En el caso de
esta investigación se mencionan los factores y los ítemes que lo explican. Cada factor
se le asignó un nombre en consideración al elemento común de los ítemes que lo
constituyen. Hay algunos factores que no fue posible identificar el elemento común
en el cual convergen. Sobre la identificación del factor común, Cohen y Swerdlik
(1988) comentan lo siguiente:
...si un análisis factorial identificó un factor común que está midiendo los
instrumentos hipotéticos, una “prueba de bulimia” y una “prueba de
anorexia”, surgiría una interrogante concerniente a la forma de nombrar
este factor. Una analista factorial que observara los datos y reactivos de
cada prueba podría bautizar al factor común como un “factor de trastorno
alimenticio”. Otro analista factorial que examinara exactamente los
mismos materiales podría denominar el factor común “factor de
preocupación por el peso corporal”. Un tercer analista podría nombrarlo
“factor de trastornos de la percepción de sí mismo” y así en forma
sucesiva. El punto aquí es que la denominación de factores que surgen de
una análisis factorial tiene más que ver con el conocimiento, juicio y
capacidad de abstracción verbal que con la destreza matemática. No hay
un libro de reglas para designar factores; los analistas factoriales ejercen
su propio juicio concerniente a cuál nombre del factor comunica mejor el
significado del factor... (p. 212)
Tomando en cuenta los comentarios de Cohen y Swerdlik, se procedió a

factorizar los resultados del instrumento definitivo, compuestos por 49 ítemes. Se
aplicó el mismo criterio de la factorización de los resultados de la encuesta piloto:
extraer factores con autovalores superior a 1. Los resultados fueron 15 factores y 30
228
ítemes que se correlacionaron casi exclusivamente con un factor determinado. Este
procedimiento es conocido como análisis factorial de segundo orden. Al respecto
Kerlinger (1988) expresa que “... un análisis factorial de segundo orden... es un
método para encontrar los factores detrás de los factores... [calculando]... las
correlaciones entre los factores y nuevamente... [analizar]... factorialmente...” (p. 663)
A continuación se presentan los 15 factores con la asignación de su nombre,

considerando el elemento común presente en los ítemes que conforman cada
factor.
Factores Comunes
Factor 1: Animadversión hacia la evaluación de acuerdo al Currículo Básico

Nacional
Item 28 Me angustia tener que planificar cómo evaluar a mis alumnos cuando
desarrollo una actividad en el aula.
Item 29 Evaluar las producciones de mis alumnos (escritas, orales, dramatizaciones,
producciones plásticas o musicales, investigaciones), es sumamente
aburrido.
Item 26 Es fastidioso tener que indagar aprendizajes de mis alumnos cada vez que
inicio un tema.
Item 25 Tener que evaluar todo el tiempo me fastidia.
Factor 2: Actitud hacia la evaluación participativa
Item 36 Promuevo en el alumno evaluar su propio desempeño en las actividades
desarrolladas en el proceso enseñanza – aprendizaje.
Item 37 En la evaluación de mis alumnos tomo en cuenta tanto sus aspectos
psicosociales como el progreso en su aprendizaje.
Item 49 Propicio entre mis alumnos intercambios orales (diálogos, entrevistas,
debates).
Factor 3: Actitud hacia las estrategias de evaluación
229
Item 08 Explorar el nivel de disposiciones, sentimientos, valores, actitudes y
aptitudes antes de comenzar un tema, contribuye al aprendizaje del alumno.
Item 07 El proceso enseñanza–aprendizaje debe fundamentarse en evaluaciones
permanentes sobre la actuación del alumno.
Item 31 Disfruto evaluando integralmente a mis alumnos.
Factor 4: Actitud hacia la heteroevaluación
Item 05 En la evaluación de los aprendizajes deben participar, además del docente,
los alumnos, padres y representantes y la comunidad educativa.
Item 04 El alumno al evaluar su propio desempeño, contribuye a mejorar su
proceso de aprendizaje.
Factor 5: No se descubre el elemento común de los ítemes
Item 14 Al evaluar los aprendizajes no debo tomar en cuenta la opinión de los
alumnos.
Item 44 Cómo evaluar al alumno lo decido en el transcurso de las actividades que
éste desarrolla.
Item 13 Sólo debe evaluarse al alumno al finalizar cada lapso.
Factor 6: Actitud hacia la evaluación cualitativa
Item 39 Estoy “ganado” para trabajar con la evaluación cualitativa.
Item 33 Me desagrada evaluar los intercambios orales entre mis alumnos (diálogos,
entrevistas, debates).
Item 22 Me encanta aplicar instrumentos de evaluación cualitativa.
Factor 7: Actitud hacia las técnicas de evaluación sociométricas
Item 09 Las técnicas sociométricas, tales como el sociograma, mapa de conceptos y
el portafolio, permiten obtener progresos importantes en los aprendizajes
del alumno.
Item 47 Oriento a mis alumnos cuando realizan técnicas sociométricas (sociograma,
mapas de conceptos, portafolios).
Factor 8: No se puede determinar el elemento comùn, porque sòlo hay un ìtem.
230
Item 16 Es entretenido evaluar aplicando la técnica de la observación mediante el
uso de escalas de estimación, listas de cotejo, registro anecdótico y diario
de clase.
Item 11 Es innecesario utilizar intercambios orales entre los alumnos (diálogos,
entrevistas, debates), para evaluar su aprendizaje.
Item 20 Me desagrada tener que aplicar escalas y cuestionarios de actitud para
explorar las actitudes de mis alumnos.
Factor 11: Actitud hacia la evaluación cuantitativa

Item 06 Los mejores instrumentos para evaluar al alumno son las pruebas objetivas.
Item 42 Es usual que yo aplique pruebas objetivas (verdadero y falso,
completación, apareamiento, selección), para evaluar los aprendizajes.
Item 03 La evaluación del alumno debe realizarse constantemente durante el
período que comprende el año escolar.
Factor 13: Actitud hacia los tipos de evaluaciòn.
Item 35 Yo en la evaluación de mis alumnos solamente tomo en cuenta los
conocimientos adquiridos.
Item 48 Sólo evalúo cuando termina la actividad.
Item 01 El docente debe evaluar sólo en aquellos momentos del proceso
enseñanza – aprendizaje que considere relevante.
Item 40 Me cuesta evaluar cualitativamente a mis alumnos.
En la medida que se obtiene un nuevo factor, la tendencia es a disminuir los
ítemes que lo constituyen, explicándose este hecho; porque el siguiente factor
generado, aporta una cantidad menor de varianza explicada. También se observa en
algunos factores que el elemento común a los ítemes correlacionados con el factor, no
231
emergen claramente, impidiendo su reconocimiento, siendo necesario realizar un
nuevo análisis factorial hasta que la estructura factorial completa aparezca con
claridad. En este caso se requiere volver aplicar el instrumento con los ítemes
seleccionados del primer análisis factorial. La estructura factorial que se realiza tiene
el propósito de presentar una aproximación a una nueva operacionalización de la
variable en estudio tomando en cuenta el análisis factorial.
Se observa en el cuadro 8 que los factores determinados (15) explican la
varianza total de los ítemes en un 67,16 %, porcentaje considerado favorable para
aplicar análisis factorial de segundo orden en esta investigación. El nùmero de ìtems
aceptados tomando en cuenta el anàlisis factorial de segundo orden, es 30 ìtems
Cuadro 8
Varianza total explicada
Suma de las saturaciones al

Componente
cuadrado de la rotación
% de la varianza % acumulado
1 8,643 8,643
2 5,909 14,552
3 5,188 19,740
4 5,048 24,788
5 4,860 29,648
6 4,596 34,244
7 4,298 38,542
8 4,162 42,704
9 3,949 46,653
10 3,791 50,444
11 3,747 54,191
12 3,552 57,743
13 3,531 61,274
14 2,978 64,252
15 2,911 67,163
Nota: Cuadro elaborado con los datos de la encuesta definitiva Actidoc. I y cálculos
realizados a través del programa estadístico computarizado SPSS.
232
Con el propósito de continuar la operacionalización de la variable a través de
análisis factorial de segundo orden, se fijaron el número de factores en 8 (no
considerando valores mayores a 1), acumulando una varianza explicada del 55,61 %,
porcentaje que aún se considera viable para aplicar el análisis factorial bajo este
criterio. El número de ítemes aceptados usando el mismo criterio de los casos
anteriores, es de 21 ítemes.
A continuación se identifican los factores y los ítemes que los constituyen:
Factores Comunes
Factor 1: Animadversión hacia la evaluación de acuerdo al Currículo Básico
Nacional
Item 23 Me desagrada tener que revisar constantemente el aprendizaje de mis

alumnos.
Item 26 Es fastidioso indagar los aprendizajes de mis alumnos cada vez que inicio
un tema.
Item 28 Me angustia tener que planificar cómo evaluar a mis alumnos cuando debo
desarrollar alguna actividad en el aula.
Item 29 Evaluar las producciones de mis alumnos (escrita, orales, dramatizaciones,
producciones plásticas o musicales, investigaciones), es sumamente
aburrido.
Factor 2: Actitud hacia la evaluación explorativa
Item 08 Explorar el nivel de disposiciones, sentimientos, valores, actitudes y
aptitudes antes de comenzar un tema contribuye al aprendizaje del alumno.
Item 10 Las producciones del alumno (escrita, orales, dramatizaciones,
producciones plásticas o musicales, investigaciones), permiten evaluar
eficientemente el aprendizaje adquirido.
Item 20 Me desagrada tener que aplicar escalas y cuestionarios para explorar las
actitudes de mis alumnos.
Item 38 Indago sobre el nivel de los aprendizajes de mis alumnos antes de iniciar
un tema o actividad.
Factor 3: Actitud hacia la evaluación cualitativa
233
Item 16 Es entretenido evaluar aplicando la técnica de observación mediante el uso
de escalas de estimación, lista de cotejo, registro anecdótico y diario de
clase.
Item 22 Me encanta aplicar instrumentos de evaluación cualitativa.
Item 33 Me agrada evaluar los intercambios orales entre mis alumnos (diálogos,
entrevistas, debates).
Item 39 Estoy “ganado” para trabajar con la evaluación cualitativa.
Factor 4: Actitud hacia la heteroevaluación
Item 05 En la evaluación de los aprendizajes deben participar, además del docente,
los alumnos, padres y representantes y la comunidad educativa.
Item 21 Me gusta la evaluación recíproca entre padres y representantes, alumnos y
docentes para evaluar los aprendizajes de mis alumnos.
Item 13 Sólo debe evaluarse el alumno al finalizar cada lapso.
Item 35 Yo en la evaluación de mis alumnos solamente tomo en cuenta los
conocimientos adquiridos.
Factor 7: Actitud hacia la evaluación cuantitativa
Item 06 Los mejores instrumentos para evaluar al alumno son las pruebas objetivas.
Item 42 Es usual que yo aplique pruebas objetivas (verdadero y falso,
completación, pareo, selección), para evaluar los aprendizajes.
Factor 8: No se descubre el elemento común entre los ítemes
Item 01 El docente debe evaluar sólo en aquellos momentos del proceso
enseñanza-aprendizaje que considera relevantes.
Item 41 Asigno a cada alumno evaluar la actuación del resto de sus compañeros en
las actividades desarrolladas durante el año escolar.
Item 44 Cómo evaluar al alumno lo decido en el transcurso de las actividades que
éste desarrolla.
La aplicación del análisis factorial de segundo orden, origina una nueva
operacionalización de la variable, la cual no se fundamenta, como en la
234
operacionalización inicial, en dimensiones e indicadores de la variable; sino en
factores constituidos por ítemes interrelacionados entre sí. Con esta nueva concepción
de medir la actitud, se genera validez de constructo, porque aquellos ítemes que
miden varios factores (se correlacionan con más de un factor) y los que no miden
ninguno (no se correlacionan con ningún factor) se excluyen del instrumento; pues
los ítemes para que aporten validez de constructo sólo deben medir un aspecto
(factor) de la variable en estudio.
Análisis Factorial ¿Versus? Confiabilidad
Está comprobada que una reducción sustancial de los ítem de un instrumento,

como es el caso de Actidoc I, disminuye la confiabilidad del instrumento, es por esta
razón que cuando se está en presencia de un caso, donde la confiabilidad es afectada
después de reducir ítemes, como consecuencia de la aplicación del análisis factorial,
surge el dilema: validez versus confiabilidad, y la pregunta: ¿“Vale la pena” generar
validez en detrimento de la confiabilidad?. Esta pregunta se debe responder con
cautela, porque está demostrado que un instrumento válido, es también confiable;
(aunque lo contrario no es cierto, es decir, un instrumento confiable no es
necesariamente válido), esto significa que si la confiabilidad es afectada hasta el
punto de considerar al instrumento poco confiable, se debe tomar con cautela el
análisis factorial como técnica generadora de validez. Es necesario revisar y analizar
dónde está el problema. Con estos comentarios, se desea expresar que los modelos
matemáticos y estadísticos en Ciencias Sociales no se pueden aplicar
irreflexivamente, sino que los mismo deben considerarse dentro del contexto donde
interactúan las variables en estudio.
En el caso de Actidoc I, la confiabilidad antes de aplicar el análisis de discriminación
de los ítemes, se sitúo en 0,9465; al excluir los ítemes que no discriminaron, subió a
0,9554; después de excluir aquellos ítemes que afectaban la confiabilidad del
instrumento, sube al 0,9556; al aplicar el análisis factorial, desciende a 0,9045,
disminución no significativa, a pesar de reducir los ítemes a la mitad ( de 98 ítemes,
235
cantidad antes de aplicar el análisis factorial, a 49 ítemes). A este nivel el instrumento
aún se mantienen muy confiable, es decir, en el rango de 0.81 a 1.
Después de aplicar el análisis factorial de segundo orden (análisis que se realiza
con los datos obtenidos de la aplicación del instrumento con 49 ìtemes y 190
docentes), el instrumento queda constituido por 30 ìtemes, el cual presenta una
confiabilidad de 0,8207; siendo a este nivel la confiabilidad muy alta; porque aún se
sitúa en el rango de 0,81 y 1. Considerando que la confiabilidad se ubica muy cerca
del el límite inferior del rango, es aconsejable no continuar aplicando análisis
factorial, porque en la siguiente aplicación es probable que la confiabilidad descienda
de muy confiable a confiable y es recomendable que los instrumentos; cuyo propósito
sea medir actitudes, tengan una confiabilidad muy alta. Después de aplicar el análisis
factorial dos veces a este instrumento se debe aceptar esta versión, constituida por 30
ìtemes, como la definitiva.
A Manera de Conclusión
1. La aplicación del análisis factorial a los datos obtenidos en la versión

preliminar del instrumento, permitió identificar los ítem que miden un solo factor,
más de uno y ninguno. Tomando en cuenta los resultados se aceptaron para
conformar la versión definitiva del instrumento solamente aquellos ítemes que
midieron a un solo factor. Con este procedimiento se logró excluir de la versión
inicial la cantidad de 48 ítem, que representa la mitad de 98 ítem, a los cuales se
aplicó el análisis factorial. Al aplicar el análisis factorial de segundo orden, se
logra reducir los ìtemes de 49 a 30, recomendándose esta versión como la
definitiva.
2. Al aplicar el análisis factorial de segundo orden, se produce una mejor
identificación de los factores en relación a los resultados obtenidos de la
aplicación inicial, auque se requiere una nueva aplicación del análisis factorial
para obtener la identificación de aquellos factores aún sin la claridad evidente.
236
3. Los resultados de aplicación del análisis factorial de segundo orden,
aproximan la variable en estudio a una nueva Operacionalización, en función de
la identificación de los factores obtenidos. Esta nueva Operacionalización puede
mejorar si se descubre el elemento común que identifica a los factores aún sin
emerger claramente. Como se mencionó en la conclusión anterior, la
identificación plena de los factores, puede surgir de la reaplicación del análisis
factorial hasta lograr plena identificación de todos ellos.
4. La reducción tan sustancial de los ítemes del instrumento, no afecta
confiabilidad. Esta se mantienen muy alta antes y después de la exclusión de los
ítemes, lo que permitió generar validez de constructo, sin “sacrificar” la
confiabilidad.
Ejercicio Propuesto
Usando el programa SPSS como herramienta tecnológica, aplique el análisis

factorial a los resultados de Actidoc. I. Fije el número de factores en 4 y elimine
valores en los coeficientes inferiores a 0,10. El análisis factorial se realizará con los
ìtemes que discriminan y aportan confiabilidad al instrumento. Se anexa en disquete
matriz original (120 ìtemes y 240 sujetos) de Actidoc. I
237
Referencias
Cohen, R. y Swerdlik. (1998). Pruebas y evaluación psicológica (introducción a las

pruebas y la medición). Cuarta edición. México: Mc Graw-Hill.
Kerlinger, F. (1.988). Investigación del comportamiento (segunda edición). México:

Mc Graw Hill
Nunnally, J. Y Bernstein, I. (1995). Teoría psicométrica. Tercera edición. México:

Mc Graw-Hill.
Rodrigues, A. (1990). Cambio de Actitudes. En J. Whittaker (Comp.), La psicología

social en el mundo de hoy. (p.p. 265-284). México: Trillas.
Ruíz Bolívar, C. (1990). Desarrollo de una escala de actitud hacia la Innovación

Educativa. Trabajo de Ascenso para optar a la categoría de profesor agregado,
Universidad Pedagógica Experimental Libertador, Vicerrectorado de
Investigación y Postgrado, Caracas.
Stahlberg, D. Y Frey, D. (1990). Actitudes I: Estructura, Medida y Funciones. En M.

Hewstone, W. Stroede, J.P. Codal y G.M. Stephenson (Comp.), Introducción a la
psicología social (una perspectiva europea). (p.p. 149-197). Barcelona – España:
Editorial Ariel.
Thurstone, L. (1928). Las actitudes pueden medirse. En C. Wainerman (Comp.),

Escalas de medición en Ciencias Sociales. (p.p. 261-289). Buenos Aires: Nueva
Visión.
Triandis, H. (1974). Actitudes y cambio de actitudes. Barcelona - España: Toray.
Visuata, B. (1998). Análisis estadístico con SPSS para Windows (Volumen II:
Estadística Multivariante). Madrid: Mc Graw-Hill.
Lecturas Sugeridas
238
Cohen, R y Swerdlik. M. (2.001). Pruebas y evaluación psicológicas, México, Mc.
Graw Hill. Se recomienda el capìtulo 6: Validaz. Secciòn Validez de constructo.
Subpunto: Análisis factorial.
Kerlinger, F. (1.988). Investigación del comportamiento (segunda edición). México:

Mc Graw Hill. Se recomienda el capítulo 25: Análisis factorial. Su contenido es
el siguiente: Fundamentos, Extracción y rotación de factores, calificaciones
factoriales y análisis factorial de segundo orden, ejemplos de investigación,
análisis factorial e investigación científica, apéndice.
Nunnally, J. y Bernstein, I. (1.995). Teoría psicomètrica (segunda edición). México:

Mc Graw Hill. Se recomienda el capìtulo 12: Análisis factorial exploratorio II.
Secciòn: una expectativa del análisis factorial exploratorio. Subsecciòn:
Consideraciones pràcticas del análisis factorial.
Pardo, A. (2.000). Guìa para el análisis de datos Madrid: Mc Graw Hill. Se

recomienda el capìtulo 20: Análisis Facorial: El procedimiento Análisis
Factorial. Este capìtulo explica en detalle todas las opciones del análisis
factorial que contiene el programa SPSS.
Visuata, B. (1998). Análisis estadístico con SPSS para Windows (Volumen II:
Estadística Multivariante). Madrid: Mc Graw-Hill. Se recomienda el capítulo 6:
Análisis factorial. Su contenido es el siguiente: Aspectos introductorio,
descriptivos y matriz de correlaciones, extracción de factores, rotación y
puntuaciones factoriales. Este capítulo presenta en forma muy didáctica los pasos
necesarios para aplicar el análisis factorial, usando el programa SPSS como
herramienta tecnólogica.
Yela, M. (1.997). La técnica del análisis factorial: Un método de investigación en

psicología y pedagogía. Madrid: Biblioteca Nueva. Para quienes desea conocer
el procedimiento manual de esta técnica, se recomienda este libro; cuyo
contenido es el siguiente: Capitulo I: Los conceptos fundamentales; capítulo II:
Las ecuaciones fundamentales; capítulo III: Un ejemplo sencillo; capítulo IV: La
factorizaciòn. Lógica del método centroide; capítulo V: La factorizaciòn.
Aplicación del método centroide; capítulo VI: La estructura simple; capítulo VII:
La rotación. Un ejemplo de dos dimensiones; capitulo VIII: La rotación. Un
ejemplo centroide; y capítulo IX: La rotación. Un ejemplo de tres dimensiones.
“...El libro está ... destinado a estudiantes universitarios que no poseen una
preparación matemática especial...” (Yela, M, p.20)
239
CAPITULO XIII
VALIDACIÓN DE INVESTIGACIONES CUALITATIVAS
Objetivo
El estudiante se introducirá en el proceso requerido para obtener confiabilidad y

validez en investigaciones cualitativas
Confiabilidad
Confiabilidad Interna y Externa
La confiabilidad en investigaciones cualitativas tiene la misma acepción que la

aplicada en los instrumentos cuantitativos, es decir, está asociada a la estabilidad,
equivalencia y homogeneidad de los datos. Su diferencia se fundamenta en el
planteamiento y la forma como ambos paradigmas abordan la realidad.
A continuación se presentan las opiniones de tres autores (destacados en temas
cualitativos) sobre confiabilidad. Al primero en referirnos es Martínez (1.996), quien
expresa lo siguiente:
“Una investigación con buena confiabilidad es aquélla que es estable,
segura, congruente... La confiabilidad tiene dos caras, una externa y otra
interna: hay confiabilidad externa cuando investigadores independientes,
al estudiar una realidad en tiempo y situaciones diferentes llegan a los
mismos resultados; hay confiabilidad interna cuando varios observadores
(investigadores que realizan el estudio), al estudiar la misma realidad,
concuerdan en sus conclusiones”. (p.p. 204 y 205).
240
Goetz y LeCompte (1.988) expresan sobre la confiabilidad de los estudios
etnográficos, lo siguiente:
“...lo que se pretende, en efecto, es coincidir en la descripción y
composición de los acontecimientos y no en la determinación de la
frecuencia... Un escenario puede admitir sólo a uno o unos pocos
observadores. Sin una corroboración aportada por otros, la investigación
realizada puede ser acusada de idiosincrásica y carente de un registro
cuidadoso y sistemático de los fenómenos para proteger sus estudios de
las amenazas a su fiabilidad interna, los etnógrafos suelen utilizar una de
estas cinco estrategias: Descriptores de bajo nivel inferencial, varios
investigadores, participantes ayudantes, revisión por otros investigadores
y datos registrados automáticamente”. (p. 221).
Estrategias para Asegurar Confiabilidad
A continuación se explica cada una de las cinco estrategias para asegurar la

confiabilidad de los estudios etnográficos:
(a) Descriptores de bajo nivel inferencial: se refiere a la transcripción exacta
(palabra por palabra) de las entrevistas con los informantes o sujetos del estudio,
(b) varios investigadores: a pesar de que Goetz y LeCompte reconoce la dificultad de
realizar una investigación con varios investigadores, recomienda esta estrategia como
garantía de confiabilidad del estudio, (c) participante ayudante: involucrar en la
investigación a ayudantes (pueden ser estudiantes) permite comprobar que lo
percibido por el investigador es real, (d) Revisión de otros investigadores: esto se
puede lograr con la realización de investigaciones simultáneas en escenarios
diferentes o publicando las conclusiones de la investigación en revistas especializadas
para que otros investigadores la evalúen, y (e) Datos registrados automáticamente: se
refiere a la conveniencia de grabar las entrevistas y observaciones realizadas. Con
este propósito el investigador debe disponer de grabadores de audio y video, cámara
fotográfica, etc.
Confiabilidad Quijotesca, Diacrónica y sincrónica
241
Kurt y Miller, citado por Pérez Serrano (1.998), establece una clasificación
diferente, a la de confiabilidad interna y externa presentada por Martínez y Goetz y
LeCompte. A continuación se presenta la mencionada clasificación:
“(a) Fiabilidad quijotesca: se refiere a las circunstancias en las que un
único método de observación da lugar de forma continuada a una medida
invariable..., (b) Fiabilidad diacrónica: consiste en la estabilidad de una
observación a través del tiempo que puede comprobarse al repetir las
medidas, pero teniendo en cuenta que sólo tendrá utilidad en aspectos
inalterables de un determinado período, (c) Fiabilidad sincrónica: implica
la semejanza de la observación dentro del mismo período de tiempo.
Raramente implica observaciones idénticas, sino el hecho de que sean
consistentes respecto a rasgos relevantes”. (p.p. 77 y 78).
La diferencia entre ellos es que la fiabilidad (o confiabilidad) quijotesca implica

la estabilidad de los datos en el tiempo; la diacrónica, la estabilidad de la técnica (o
método) en el tiempo; y la confiabilidad sincrónica, implica que las observaciones
realizadas en un determinado período de tiempo (en el mismo período de tiempo),
deben tener resultados similares.
Validez
Validez Interna y Externa
Para Martínez (1.996):

“...Una investigación tiene un alto nivel de validez si al observar, medir o
apreciar una realidad, se observa, mide o aprecia esa realidad y no otra
cosa. Este hecho constituye la validez interna. Hay otro criterio de
validez, validez externa, que consiste en averiguar hasta qué punto las
conclusiones de un estudio son aplicables a grupos similares”. (P. 206.)
La triangulación, saturación y la negociación como forma de validez
Pérez Serrano (1.998) identifica tres tipos de validez:

1. Triangulación: “Implica reunir una variedad de datos y métodos para
referirnos al mismo tema o problema... Implica también que los datos se recojan
desde un punto de vista distinto y realizar comparaciones múltiples de un fenómeno
242
único, de un grupo –y en varios momentos- utilizando perspectivas diversas y
múltiples procedimientos”. (p. 81).
2. Saturación: “...‘consiste en reunir las pruebas y evidencias suficientes para
garantizar la credibilidad de la investigación’. Se consigue revisando el proceso o
repitiendo de nuevo el estudio para comprobar si los resultados se mantienen”. (p.
84).
3. Validez respondente o negociación: “consiste en validar los resultados e
informes de la investigación básicamente mediante contraste de los puntos o
resultados obtenidos por el investigador con los de otros compañeros, informadores,
observadores, así como con las personas implicadas”. (p.p. 84 y 85).
Amenazas a la Validez Interna
Goetz y LeCompte (1.988) señalan algunas amenazas contra la validez interna,

las cuales los investigadores deben enfrentarlas y evitarlas. Estas amenazas también
se plantean en la investigación experimental, pero en forma diferente. A continuación
se explican:
1. Historia y maduración: A diferencia de la investigación experimental que
trata de establecer controles en el ambiente, la investigación cualitativa asume
ambientes naturales, y analiza los datos que cambian y aquellos estables en el tiempo.
El investigador debe tener cuidado con aquellos datos donde la maduración
(transformación en el tiempo) tiene efectos que pudieran afectar los resultados de la
investigación.
2. Influencia del observador: cuando el informante o personal del grupo en
estudio se sabe observado, es posible que oculten su verdadero comportamiento. Se
debe para evitar obtener información falsa, contrastar los datos entre varios
informantes o personas integrantes del grupo en estudio.
3. Selección y regresión: en los estudios cualitativos, se evita que los sujetos de
investigación sean controlados para garantizar que los cambios se deban al
243
tratamiento. Los sujetos de estudio se analizan tal cual como se comportan en su
ambiente natural.
4. Mortalidad: En la investigación cualitativa, a diferencia de la investigación
experimental que puede sustituir a los sujetos que desaparecen de la investigación, la
mortalidad de sujetos en la investigación cualitativa no se reemplaza, sino que se
estudian sus efectos en el problema o fenómeno estudiado.
5. Conclusiones espurias: cuando se realiza una investigación, incluso es válido
para la investigación experimental, el investigador debe ser sumamente cuidadoso y
analítico cuando elabora las conclusiones del estudio, porque en esta fase tan
importante de un trabajo, muchos investigadores establecen relaciones y conclusiones
equivocadas.
Factores que Afectan la Validez Externa
1. Efectos de selección: afecta la validez cuando los investigadores seleccionan

grupos, a los cuales no se puede comparar con el grupo en estudio.
2. Efectos escenario: cuando se trata de comparar un constructo en otros
escenarios que no permite la comparación.
3. Efectos de la historia: cuando se pretende comparar constructos en épocas
históricas diferentes, pero sin descubrir que es una experiencia histórica única y muy
circunscrita a un determinado período histórico.
4. Efectos de constructo: cuando se crea un constructo muy ajustado a un grupo
específico, lo cual imposibilita realizar comparaciones intergrupal.
La validación de instrumentos de medición tiene en común con la validación de
investigaciones cualitativas, el hecho de que la confiabilidad y validez en ambos
casos se definen en forma similar; pero su conceptualización y orientación es
diferente. Mientras que los instrumentos de medición soportan sus procedimientos en
el llamado paradigma “científico” o paradigma experimental, fundamentado en la
objetividad de las investigaciones y en la ley de las probabilidades, la validación de
investigaciones cualitativas se apoyan en el paradigma naturalista y holística, donde
244
la realidad se analiza, tal como se presenta: intacta. Esta concepción del mundo tan
diferente, origina que la validación de instrumentos cualitativos difiera en cuanto a su
procedimiento. En este tipo de investigación; la validación se fundamenta, más que
en análisis numéricos, en patrones descriptivos y observacionales, donde la
diversidad de instrumentos y opiniones de diferentes observadores e investigadores,
determina la confiabilidad y validez de las investigaciones. A diferencia de las
investigaciones insertas dentro del paradigma “científico”, donde se valida es el
instrumento; en la investigación naturalista y holística, se valida es la investigación
como un todo, apoyándose en la descripción e interpretación de los datos, más que en
el análisis numérico de los mismos.
Ejercicios propuestos
1. Establezca las diferencias entre la confiabilidad de los estudios cuantitativos

y cualitativos.
2. Establezca las diferencias entre la validez de los estudios cuantitativos y
cualitativos.
245
Referencias

investigación educativa. Madrid: Morata.
Martínez, M. (1.996). Comportamiento humano (Segunda Edición). México: Trillas.
Pérez Serrano, G. (1.998). Investigación cualitativa: Retos e Interrogantes II:

Técnicas y análisis de datos (Segunda edición). Madrid: La Muralla.
Lecturas Sugeridas
Goetz, J. P., Y LeCompte, M.D. (1.988). Etnografía y diseño cualitativo en investigación

educativa. Madrid: Morata. Se recomienda el Capítulo VII: Evaluación del diseño
etnográfico. Se recomiendan los apartados: Exigencias de la fiabilidad etnográfica,
fiabilidad externa y fiabilidad interna.
Martínez, M. (1.996). Comportamiento humano (Segunda Edición). México: Trillas. Se

recomienda el capítulo 6: Postulados para una metodología estructural. Postulados
18, 19 y 21. Capítulo 10: El método etnográfico. Secciòn: El proceso de
investigación. Subsecciòn: Confiabilidad y validez : El Capítulo 12: El Método de la
Investigación-Acción. Secciòn: Validez y confiabilidad..
Pérez Serrano, G. (1.998). Investigación cualitativa: Retos e Interrogantes II: Técnicas y

análisis de datos. (Segunda edición). Madrid: La Muralla. Capítulo II: El problema
de la fiabilidad y la validez. Se recomienda leer el capítulo completo cuyo contenido
es el siguiente: Introducción, la fiabilidad y validez en los estudios cuantitativos,
Fiabilidad y validez en los estudios cualitativos, Perspectivas para el análisis de la
fiabilidad y validez en la investigación cualitativa.
246
ANEXOS
247
ANEXO A
Índice de dificultad de los ítemes a través del programa excel.
Pasos:
1. Abrir el programa de excel

2. Transcribir la Base original de datos en una hoja nueva (ver tabla 1)
3. Recuerde grabar el archivo en su disquete 3 ½ o en el disco duro del computador
4. Copie y pegue en una hoja nueva la Base de Datos.
5. Sume los totales de los ítemes.
Escriba la fórmula de la suma debajo de la celda que contiene el último sujeto y el primero
ítem (ver tabla 2). La fórmula de la suma es =suma (primera celda que deseamos sumar:
última celda que deseamos sumar). En nuestro ejemplo (tabla 2) la fórmula es
=suma(B3:B14). Al terminar de escribir la fórmula presione enter. Luego copie y pegue la
fórmula para el restos de los ítemes.
6. Debajo de la celda del total y el primer ítem escriba la fórmula del índice de dificultad
=(total del primer ítem ó número de persona que respondieron correctamente el item/Número
de sujetos que respondieron el item)/*100. Al terminar de escribir la fórmula presione enter.
En el ejemplo ilustrado la fórmula es =(B15/12)*100. Luego copie y pegue la fórmula para el
resto de los ítemes.
7. Calcule el índice de dificultad promedio. Escriba la fórmula en la última línea en blanco
(ver tabla 2). La fórmula es =promedio(índice de dificultad del primer ítem:índice de
dificultad del último ítem). En nuestro ejemplo la fórmula es =promedio (B16:G16).
8. Recuerde grabar los cambios introducidos en su disquete de 3 ½ o en disco duro del
computador
9. Interprete los resultados, tomando en cuenta la escala siguiente.
81 a 100 Muy fàcil
61 a 80 Fácil
41 a 60 Moderadamente fácil
21 a 40 Difícil
01 a 20 Muy difícil
COPIAR Y PEGAR FÓRMULAS

-Seleccione la celda que desea copiar y y presione el botòn derecho del mouse
(ratòn) y oprima copiar
-Seleccione (sombree) las celdas donde desea pegar la fórmula y presione el
botón derecho del mouse (ratón) y oprima pegar
CENTRAR TÍTULOS
Clic en menú herramientas---clic en personalizar---clic en comandos---clic en

formato---clic en combinar y centrar—arrastre con el mouse (ratón) el icono de
combinar y centrar hacia las barras de herramientas—seleccione (sombree) el
248
espacio donde desea escribir y centrar el título---clic en el icono de combinar y
centrar.
249
A B C D E F G
1 TABLA 1. MATRIZ ORIGINAL DE DISCRIMINACIÓN DE DATOS DICOTÓMICOS
2 item1 item2 item3 item4 item5 item6
3 0 0 1 0 1 1
4 1 1 1 1 1 1
5 1 0 0 0 0 0
6 0 1 1 1 1 1
7 1 0 1 1 0 1
8 0 0 0 1 1 1
9 1 1 1 0 0 0
10 0 0 0 1 1 1
11 1 1 0 0 0 0
12 0 0 1 1 0 0
13 0 0 0 0 1 1
14 1 1 1 1 1 1
A B C D E F G
1 TABLA 2. INDICE DE DIFICULTAD DE LOS ITEMES
3 0 0 1 0 1 1
4 1 1 1 1 1 1
5 1 0 0 0 0 0
6 0 1 1 1 1 1
7 1 0 1 1 0 1
8 0 0 0 1 1 1
9 1 1 1 0 0 0
10 0 0 0 1 1 1
11 1 1 0 0 0 0
12 0 0 1 1 0 0
13 0 0 0 0 1 1
14 1 1 1 1 1 1
15 TOTAL 6 5 7 7 7 8
16 INDICE DIF./ITEM 50.00 41.67 58.33 58.33 58.33 66.67
17 INDICE DIF./PROMEDIO 55.56
250
ANEXO B
Análisis de discriminación de datos dicotómicos a través del programa Excel.

PASOS
1. Abrir el programa Excel
2. Transcribir la Base original de Datos en una hoja nueva (Ver tabla 1)
3. Recuerde grabar el archivo en su disquete 3 ½
4. Copie en una hoja nueva la base da dato original.
5. Calcule los totales de los sujetos:
Procedimientos:
Etiquete la última columna en blanco como : totales, y en la celda correspondiente al
sujeto 1, escriba la fórmula de la suma, = suma (primera celda que deseamos sumar:
ultima celda que deseamos sumar). En este caso particular la fórmula será =suma
(B3:G3). Al terminar de introducir la fórmula, presione Enter. Luego copie y pegue
esta fórmula para el resto de los sujetos (ver tabla 2).
6. Ordene los totales en orden decreciente (de mayor a menor)
Rutina:
 Clic en el menú datos
 Clic en ordenar
 Clic ordenar por totales
 Clic en descendente
 Clic en aceptar
Observará los datos iguales a los que contiene la tabla 3, ordenados por el total y en
forma descendente.
7. Conforme los grupos superior e inferior, tomando como referencia el 27% de los
sujetos en muestra grandes y el 34% de los sujetos en muestra pequeñas (ver tabla 4).
En nuestro caso el tamaño de ambos grupos será cuatro (4) sujetos con los puntajes
más altos (grupos superior) y cuatro (4) sujetos con los puntajes más bajo (grupo
inferior). Para determinar el tamaño de los grupos ver la secciòn Criterios para
determinar el tamaño de los grupos, capìtulo IX: Análisis de los ìtemes.
Rutina:
Suprimir los sujetos que tienen puntuaciones intermedios (en nuestro caso los sujetos
intermedios están comprendidos entre el sujeto 5 y el sujeto 10). Para realizar este
procedimiento seleccione (sombree) los sujetos a borrar y haga Clic en el menú
edición – Clic en borrar.
-Calcule el total tanto del grupo superior como del inferior (ver tabla 4). Para
calcular el total del grupo superior, escriba la fórmula de la suma debajo de la línea
del último sujeto del grupo superior y presione Enter. Copie y pegue la fórmula para
el resto de los ítemes. Proceda de la misma forma para calcular el total de los ítemes
del grupo inferior (ver tabla 4). La fórmula suma para el ejemplo ilustrado y
correspondiente al grupo superior es =SUMA(B3:B6). La formula para el grupo
251
inferior es =SUMA(B11:B14). Al calcular los totales de ambos grupos se puede
aplicar la fórmula que determina el índice de discriminación de los ítemes.
8. Debajo de la línea que contiene los totales del grupo inferior (debajo de la celda
que contiene los totales del primer ítem) escriba la fórmula para calcular el índice de
discriminación (ver tabla 4). La fórmula es la siguiente: (total GS-total GI)/tamaño de
uno de los grupos. En el ejemplo ilustrado la fórmula es la siguiente =(B7-B15)/4. Al
escribirla oprimir Enter. Luego copie y pegue la fórmula para el resto de los ítemes.
9. Recuerde grabar en su disquete 3 ½, los cambios introducidos
10. Interprete los resultados, tomando en cuenta la siguiente escala:
0.81 - 1 Muy alta

0.61 - 0.80 Alta
0.41 - 0.60 Moderada
0..21 - 0.40 Baja
0.00 - 0.20 Muy baja
Negativa Extremadamente baja
Copiar y pegar fórmulas
-Seleccione la celda que contiene la fòrmula que desea copiar→ oprima copiar→
seleccione (sombree) las celdas donde desea pegarr la fórmula→ presione el botón
derecha del mouse (ratón) y haga clic en pegar
CENTRAR TÍTULOS
Clic en menú herramientas---clic en personalizar---clic en comandos---clic en

formato---clic en combinar y centrar—arrastre con el mouse (ratón) el icono de
combinar y centrar hacia las barras de herramientas—seleccione (sombree) el
espacio donde desea escribir y centrar el título---clic en el icono de combinar y
centrar.
252
A B C D E F G
1 TABLA 1. MATRIZ ORIGINAL DE DISCRIMINACIÓN DE DATOS DICOTÓMICOS
3 0 0 1 0 1 1
4 1 1 1 1 1 1
5 1 0 0 0 0 0
6 0 1 1 1 1 1
7 1 0 1 1 0 1
8 0 0 0 1 1 1
9 1 1 1 0 0 0
10 0 0 0 1 1 1
11 1 1 0 0 0 0
12 0 0 1 1 0 0
13 0 0 0 0 1 1
14 1 1 1 1 1 1
A B C D E R G H
1 TABLA 2. CÁLCULOS DE TOTALES
2 item1 item2 item3 item4 item5 item6 TOTAL
3 0 0 1 0 1 1 3
4 1 1 1 1 1 1 6
5 1 0 0 0 0 0 1
6 0 1 1 1 1 1 5
7 1 0 1 1 0 1 4
8 0 0 0 1 1 1 3
9 1 1 1 0 0 0 3
10 0 0 0 1 1 1 3
11 1 1 0 0 0 0 2
12 0 0 1 1 0 0 2
13 0 0 0 0 1 1 2
14 1 1 1 1 1 1 6
A B C D E F G
1 TABLA 3. ORDENACIÓN DE TOTALES
253
3 1 1 1 1 1 1
4 1 1 1 1 1 1
5 0 1 1 1 1 1
6 1 0 1 1 0 1
7 0 0 1 0 1 1
8 0 0 0 1 1 1
9 1 1 1 0 0 0
10 0 0 0 1 1 1
11 1 1 0 0 0 0
12 0 0 1 1 0 0
13 0 0 0 0 1 1
14 1 0 0 0 0 0
A B C D E F G H
1 TABLA 4. CONFORMACIÓN DE LOS GRUPOS Y RESULTADOS DEL ANÁLISIS DE DISCRIMINACIÓN
2 item1 item2 item3 item4 item5 item6 TOTAL
3 1 1 1 1 1 1 6
4 1 1 1 1 1 1 6
5 0 1 1 1 1 1 5
6 1 0 1 1 0 1 4
7 total GS 3 3 4 4 3 4
8
9
10
11 1 1 0 0 0 0 2
12 0 0 1 1 0 0 2
13 0 0 0 0 1 1 2
14 1 0 0 0 0 0 1
15 TOTAL GI 2 1 1 1 1 1
16 ID 0.25 0.50 0.75 0.75 0.50 0.75
254
ANEXO C
ANÁLISIS DE DISCRIMINACIÓN DE INSTRUMENTOS CON DATOS MULTICÒTOMOS

(MAS DE DOS ALTERNATIVA DE RESPUESTAS) A TRAVÈS DEL PROGRAMA SPSS EN
AMBIENTE WINDOWS
RUTINA:
Abrir el archivo que contiene la base de datos en SPSS
FASE 1
¿CÒMO CALCULAR LOS TOTALES DE LOS SUJETOS?
Para calcular los totales de los sujetos presentamos dos procedimientos, el primero de ellos, es a través
del Menú Transformar. Este procedimiento es fácil de desarrollar; pero es muy laboriosa cuando el
número de ìtemes es elevado. Hay otro procedimiento siguiendo un artificio informàtico que consiste
en transponer la matriz de datos, procedimiento que presenta cierto nivel de dificultad para quienes no
poseen conocimientos básicos de computación; pero es sumamente rápido para aquellas personas con
cierta destreza informática. Este segundo procedimiento no es recomendable si el usuario posee un
adiestramiento insuficiente en computación.
Para el cálculo de los totales se deben seleccionar uno de los dos procedimientos:
I. CÀLCULO DE LOS TOTALES A TRAVÈS DEL MENÙ TRANSFORMAR
1. Clic en el Menú Transformar

2. Clic en Calcular...
3. Escribir total en la Variable de destino
4. Transferir los ítem desde “tipo y etiqueta” hacia “Expresión numérica”. Los datos deben
presentarse en “Expresión numérica” de la siguiente manera:
Opción 1:
Suma(item001,item002,item003,.........................................................,itemN)
Opciòn 2:
Item001+item002+item003+………………………………………+itemN
5. Al transferir todos los ítem al recuadro “Expresión numérica”, clic en aceptar.
II. CÀLCULO DE LOS TOTALES TRANSPONIENDO LA MATRIZ DE DATOS
1. Clic en el menú Datos

2. Clic en Transponer
255
3. En el cuadro que aparece se transfieren todos los ítem al rectángulo Variables. Debe tener cuidado
de no transferir otras variables (como por ejemplo edad, sexo, grado, etcétera.) diferentes a ítem
4. Clic en Aceptar
5. Si en la matriz de datos hay otras variables diferentes a ítem, aparece una advertencia que dice: “
...se perderán las variables no transpuestas”. Hacer Clic en Aceptar. Luego aparecen los resultados de
transponer la matriz. Clic en Cerrar.
6. Aparece un cuadro de diálogo que dice: ”¿ Desea guardar el contenido del navegador de
resultados en Resultados?. Clic en no.
7. Aparece la nueva matriz de datos con los sujetos en las columnas y las variables en las filas. Hacer
clic en el Menú Estadísticos → clic resumen → clic en descriptivas. Al aparecer el cuadro,
transferir las var (que son los ítems) al rectángulo variables → clic en opciones: dejar sólo
activado el estadístico suma y desactivar el resto→ Clic en continuar → clic en aceptar. Se
visualizan los resultados con los ítem y sus respectivos N (total ítems/sujeto) y la suma de las
calificaciones totales de cada sujeto.
8. Se seleccionan los resultados, haciendo clic en cualquier parte de los mismos. Se verán dentro de
un recuadro..
9. Nota: Válido solamente cuando no se visualizan todos los resultados en la ventana activa . Cuando
no es el caso, omitir y pasar al paso siguiente
Hacer doble clic dentro del recuadro. Debe aparecer un cuadro de diálogo. Active la segunda opción
del cuadro de diálogo que dice: editar este elemento en su lugar con barras de desplazamiento →
clic en aceptar.
10. Clic donde aparece el total del primer sujeto (deber asegurarse que el cursor esté en la celda que
corresponde al total del primer sujeto). Mantenga oprimida la tecla ↑ (o shift), sin soltarla. Luego
arrastre (sombrear) los totales desde el primer sujeto hasta el último sujeto. En el proceso de arrastre
con la tecla ↓ (flecha de desplazamiento hacia abajo) debe mantener sin soltar la tecla ↑ ( o shift) hasta
que termine de sombrear todos los totales de los sujetos. Cuando tengamos seguridad que todos los
valores están sombreados podemos soltar la tecla, hacemos clic con el botón derecho del ratón y
elegimos la opción cortar o copiar. Luego cerramos los resultados.
11. En el cuadro de diálogo donde se pregunta si desea guardar los resultados, haga clic en no.
12. Aparece la matriz transpuesta. La cerramos y en el cuadro que dice: “¿ Desea guardar el contenido
editor de datos en sin titulo?” , hacemos clic en no.
13. Abrimos el archivo donde se quiere pegar los totales.
14. En el archivo abierto creamos una nueva variable: Totales. Hacemos clic en la casilla en blanco,
correspondiente al primer sujeto y de nuevo hacemos clic pero con el botón derecho del ratón. Se elige
la opción pegar. Aparecerán todos los totales de los sujetos en su casilla correspondiente.
256
FASE II
¿CÓMO CREAR LOS GRUPOS SUPERIOR E INFERIOR Y CALCULAR LAS T DE

STUDENT?
1. Clic en el menú Datos

2. Clic en la opción “Ordenar casos”
3. Transferimos la variable total al recuadro “Ordenar por”.
4. En la opción “orden de clasificación”: clic en descendente. Esta opción permite ordenar los
totales de mayor a menor.
5. Clic en aceptar. Se Observará los totales de los sujetos desde la mayor a menor puntuación.
6. Incluir en la matriz sólo el 27% de los sujetos con las calificaciones más altas y el 27% de los
sujetos con las calificaciones más bajas. Excluir los sujetos con calificaciones intermedias. Para
realizar este procedimiento, seleccionamos (sombreamos) los sujetos con calificaciones intermedias y
se oprime la tecla suprimir (SUPR o deleite).
7. Se procede a crear una nueva variable: grupo, asignándole a los sujetos del grupo superior un
número (que puede ser 1) y al grupo inferior otro número (que puede ser 2).
8. Ahora estamos en condiciones de calcular las T de Student, correspondientes a los ítems del
instrumento: comparar en cada ítem las calificaciones promedio del grupo superior e inferior. Los
resultados de las T de Student determinarán cuáles ítems discriminan.
Para calcular las T de Student se procede de la manera siguiente:
8.1. Clic en el menú estadísticos
8.2. Clic en comparar medias
8.3. Clic en pruebas para muestras independientes
8.4. Pasamos al recuadro Contrastar variables, todos los ítems, teniendo cuidado de no pasar otras
variables que no sean ítems.
8.5. Transferir la variable grupo a la casilla: Variable de agrupación. Clic en definir grupos. En
grupo 1: colocar 1 (si el número asignado al grupo superior fue 1). En grupo 2: colocar 2 (si el número
asignado al grupo inferior fue 2). Clic en continuar. Clic en aceptar.
8.6. Aparecerán los resultados que contienen las T de Student, donde se comparan las calificaciones
promedias de los grupos (superior e inferior) en cada ítem.
257
FASE III
¿CÓMO INTERPRETAR LOS RESULTADOS?
En los resultados aparecen dos cuadros: el primero presenta estadísticos descriptivos de los grupos. El
segundo cuadro presenta la prueba T de Student para muestras independientes. Este cuadro presenta
dos partes sucesivas. En la primera se determina la homogeneidad de las varianzas en los grupos
sometidos a contraste de hipótesis y, luego, dependiendo si presentan varianzas iguales o desiguales, se
presentan los resultados de la prueba T de Student. Se procede a comparar el nivel de significación
(sig. bilateral), asociado a la hipótesis nula, con un valor alfa ( ), asociado a la hipótesis alterna; el
cual comúnmente se le asigna los valores 0,05 ó 0,01.
Si el valor de significación (sig. bilateral) es mayor a alfa (), indica que se acepta la hipótesis nula de
no diferencia entre el grupo superior e inferior, evidenciándose que el ítem no discrimina. Si ocurre el
caso contrario, que el nivel de significación es menor o igual a alfa, entonces se rechaza la hipótesis
nula de no diferencias entre los grupo. Este último resultado indica que el ítem tiene capacidad de
discriminación.
Pasos para interpretar los resultados del análisis de discriminación, usando el

programa SPSS.
1. Determine si las varianzas son iguales o desiguales: compare el valor significación (sig.) con
un valor de rechazo alfa (). Si sig   (en este caso  = 0.05) se acepta la hipótesis nula,
demostrándose que las varianzas son iguales. En caso contrario (sig. ≤ a ), se rechaza la
hipótesis nula, siendo las varianzas desiguales.
2. Después de determinar la condición de las varianzas, se contrasta los grupos (superior e
inferior), a través de la T de Student para muestras independientes, tomando el nivel de
significación (sig. Bilateral) de acuerdo a la condición de la varianza (es decir, sí son iguales ó
desiguales). Se compara el sig. Bilateral con un valor de rechazo alfa, si sig. Bilateral mayor
a alfa (sig. bilateral   ) se acepta la hipótesis nula, concluyéndose por lo tanto que el ítem
no discrimina. Si sucede el caso contrario, (sig. bilateral ≤ a ), se rechaza la hipótesis nula.
Se determina en este caso que las medias tienen diferencias significativas y por lo tanto el
ítem tiene capacidad de discriminación.
258
ANEXO D
Pasos para calcular el coeficiente de confiabilidad Kuder–Richardson (caso de datos

dicotómicos)
1. Abrir el programa excel

2. Transcribir la matriz original (tabla 1)
3. Grabe el archivo en su disquete o en el disco duro del computador
4. Calcule los totales de los sujetos para obtener el coeficiente de confiabilidad Kuder–Richardson (Ver tabla
2)
Rutina:
Crear una nueva variable (columna en blanco) con el nombre de total. En la celda G3 (total del primer sujeto)
escribir la fórmula de suma. La fórmula en este caso es =suma(B3:F3). Al escribir oprima enter, luego copie y
pegue la fórmula para el resto de los sujetos.
5. Calcule los totales de los ítemes para obtener el coeficiente de confiabilidad Kuder–Richardrson (ver tabla
2)
Rutina:
En la celda A12 escribir la palabra total. En la celda B12 (total del primer ítem) escribir la fórmula de suma. La
fórmula en este caso es =suma(B3:B11).
6. Calcule las varianzas individuales para obtener el coeficiente de confiabilidad Kuder–Richardson (ver
tabla 3)
a) En la celda A13 escribir la etiqueta: p=respuesta correcta/ total sujetos (en este caso 9 sujetos).
b) En la celda B13 (P correspondiente al primer ítem) escriba la fórmula de P. La fórmula en este caso es =B12/9.
Oprimir enter, luego copie y pegue la fórmula para el resto de los ítemes, incluyendo la suma de la columna total.
c) En la celda A14 escriba la etiqueta q=1-p
d) En la celda B14 escriba la fórmula de q. En nuestro caso la fórmula de q es =1-B13, luego oprimir enter. Copie
y pegue la fórmula al resto de los itemes.
e) En la celda A15 escriba la etiqueta varianzas individuales=p*q. En la celda B15 escriba la fórmula de varianzas
individuales. La fórmula es =B13*B14. Presione enter. Luego copie y pegue la fórmula al resto de los ítemes
f) En la celda G15 escriba la fórmula de la sumatoria de las varianzas individuales. La fórmula es =suma
(B15:F15). Presione enter
7. Calcule la varianza total para obtener el coeficiente Kuder–Richardrson (ver tabla 4)
Rutina:
En la columna A16 escriba la etiqueta; varianza total. Luego escriba en la celda G16 la fórmula para obtener la
varianza total. La fórmula es =VAR (G3:G11), presione enter.
8. Calcule el coeficiente de confiabilidad Kuder–Richardson (ver tabla 5)
Rutina:
En la celda A17 escriba la etiqueta : KR=(n/(n-1))*((Vt-p*q)/(Vt)).

En la celda B17 escriba la fórmula del coeficiente Kuder–
Richardson. La fórmula es =(5/(5-1))*((g16-g15)/g16)
259
a b c d e f
1 Tabla 1. Matriz original de datos para calcular el coeficiente de confiabilidad Kuder-Richardson
2 item1 item2 item3 item4 item5
3 1 1 1 1 1
4 1 1 1 1 1
5 0 1 1 1 1
6 1 0 1 1 1
7 0 1 1 1 1
8 1 1 1 1 0
9 1 1 1 0 0
10 0 0 1 1 1
11 0 1 1 0 0
a b c d e f g
1 Tabla 2. Càlculo de los totales de sujetos e ìtemes para obtener el coeficiente de confiabilidad Kuder-Richardson
2 item1 item2 item3 item4 item5 total
3 1 1 1 1 1 5
4 1 1 1 1 1 5
5 0 1 1 1 1 4
6 1 0 1 1 1 4
7 0 1 1 1 1 4
8 1 1 1 1 0 4
9 1 1 1 0 0 3
10 0 0 1 1 1 3
11 0 1 1 0 0 2
12 total 5 7 9 7 6 34
a b c d e f g
260
1 Tabla 3. Càlculo de las varianzas individuales para obtener el coeficiente de confiabilidad Kuder-Richardson
3 1 1 1 1 1 5
4 1 1 1 1 1 5
5 0 1 1 1 1 4
6 1 0 1 1 1 4
7 0 1 1 1 1 4
8 1 1 1 1 0 4
9 1 1 1 0 0 3
10 0 0 1 1 1 3
11 0 1 1 0 0 2
12 Total respuestas 5 7 9 7 6 34
13 p=Total respuestas/total sujetos 0,56 0,78 1,00 0,78 0,67
14 q=1-p 0,44 0,22 0,00 0,22 0,33
15 varianzas individuales=p*q 0,25 0,17 0,00 0,17 0,22 0,81
a b c d e f g
1 Tabla 4. Càlculo de la varianza total para obtener el coeficiente de confiabilidad Kuder-Richardson
3 1 1 1 1 1 5
4 1 1 1 1 1 5
5 0 1 1 1 1 4
6 1 0 1 1 1 4
7 0 1 1 1 1 4
8 1 1 1 1 0 4
9 1 1 1 0 0 3
10 0 0 1 1 1 3
11 0 1 1 0 0 2
13 p=Total respuestas /total sujetos 0,56 0,78 1,00 0,78 0,67
14 q=1-p 0,44 0,22 0,00 0,22 0,33
16 varianza total 0,94
261
a b c d e f g
1 Tabla 5. Càlculo el coeficiente de confiabilidad Kuder-Richardson
3 1 1 1 1 1 5
4 1 1 1 1 1 5
5 0 1 1 1 1 4
6 1 0 1 1 1 4
7 0 1 1 1 1 4
8 1 1 1 1 0 4
9 1 1 1 0 0 3
10 0 0 1 1 1 3
11 0 1 1 0 0 2
13 p=Total respuestas/total sujetos 0,56 0,78 1,00 0,78 0,67
14 q=1-p 0,44 0,22 0,00 0,22 0,33
16 varianza total (Vt) 0,94
17 KD=(n/(n-1))*((Vt-p*q)/Vt) 0,1715686
262
ANEXO E
RUTINA PARA REALIZAR EL ANÁLISIS FACTORIA L A TRAVÉS DEL

PROGRAMA SPSS
-Abrir el archivo que contiene la base de datos del instrumento en proceso de validación.
Antes de realizar el análisis factorial debe excluir del instrumento los ítem que no
discriminan ni aportan confiabilidad al instrumento. A continuación realice la siguiente
rutina:
RUTINA:
-Clic en Estadísticos (versión 7.5) o en Analizar (versiones posteriores a la 7.5, como la

10.05 y 11).
-Clic en Reducción de datos→Clic en Análisis factorial→transferir los ítem hacia el

recuadro “Variables”. (A partir de este momento debe tomar decisiones sobre las opciones
que se presentan: Variable de selección, Descriptivo, Extracción, Rotación, Puntaciones y
Opciones. Para tomar decisiones sobre estas opciones debe documentarse leyendo las
referencias sugeridas en el capìtulo XII: Análisis Factorial).
-Clic en aceptar.
ALGUNAS CONSIDERACIONES SOBRE LAS OPCIONES QUE

PRESENTA SPSS CON RESPECTO AL ANÁLISIS FACTORIAL
Opción “Variable de selección”: es una variable filtro que tiene como función realizar
el análisis factorial en submuestras de una variable, por ejemplo, si se tiene la variable
sexo, cuyos valores son: masculino=1 y femenino=2; y se està interesado en
determinar como se comporta el anàlis factorial en el sexo femenino, se hace clic en
valor y se coloca en “Valor para la variable de selección” el nùmero 2. Si no interesa
determinar el comportamiento de submuestras de una variable se omite esta opción.
Opciòn “Descriptivo”: se puede activar sólo las opciones: “Determinante” y “KMO y

prueba de esfericidad de Bartlett”. Ambas opciones permiten determinar si es viable
realizar el análisis factorial al instrumento que se está validando.
En el caso de la opción “Determinante”, el valor presentado debe estar próximo a
cero, lo cual expresa que los ítem analizados se correlacionan linealmente. Valores alejados
de cero indican que los ítem no están correlacionados linealmente entre si, lo cual aconseja
no continuar con el análisis factorial del instrumento.
263
Cuando el determinante es exactamente cero, el programa SPSS no presenta los
resultados del KMO ni de la prueba de Bartlett. En este caso se asume que la intercorrelaciòn
entre los ítem es perfectamente lineal, y por lo tanto, es viable proseguir con el análisis
factorial.
En el caso de del índice KMO el criterio para interpretar los resultados es el
siguientes:
1  KMO > 0,90 son considerados excelentes.
0,90  KMO > 0,80 son considerados buenos.
0,80  KMO > 0,70 son considerados aceptables.
0,70  KMO > 0,60 son considerados mediocres o regulares.
0,60  KMO > 0,50 son considerados malos
KMO  0,50 son considerados inaceptables o muy malos.
En el caso del test de Bartlett, Visuata (1998) expresa que éste:
...es utilizado para verificar si la matriz de correlaciones es una matriz identidad,

es decir, si todos los coeficientes de la diagonal principal son iguales a la unidad
y los externos a la diagonal iguales a 0. Este estadístico se obtiene a partir de la
transformación x2 del determinante de la matriz de correlaciones y cuanto mayor
sea y por lo tanto menor el grado de significación más improbable que la matriz
sea una matriz identidad... un grado de significación p = 0 resulta evidente que
no se trata de una matriz identidad. En el supuesto de que no pudiese rechazar
esta hipótesis, se desaconseja proceder a realizar el análisis factorial con los
datos. (p. 224)
Opciòn “Extracción”: En “Método” dejar la opción que por defecto tiene el programa
SPSS: “Componentes principales”. Con respecto al resto de las opciones, se
recomienda dejar activada: “Autovalores mayores a 1” (que está por defecto) y en
cuanto a la opción “Número de factores” se puede activar, si se está interesado en fijar
un límite de factores para analizar, es decir, cuando no se desea tomar en cuenta el
máximo de factores que genera la aplicación del análisis factorial. Si se desea limitar el
número de factores, se debe analizar la varianza total explicada por los factores
(presentada por defecto), la cual no debe ser menor del 50% acumulada por el último
factor. En caso de ser menor a este porcentaje, se debe aumentar el número de factores;
con el propósito de incrementar la varianza total explicada.
264
Opciòn “Rotación”: se recomienda activar la opción Varimax, el cual es el método de
rotación de mayor aplicación cuando se calcula la matriz de componentes rotados.
Cuando se calculan los factores, es recomendable una solución rotada; porque la
solución no rotada es ambigua y puede presentar varias soluciones, hecho que no
ocurre cuando se rotan los factores.
Opciòn “Puntuaciones”: en esta opción, en consideración a la simplicidad de la

explicación y tomando en cuenta que su incorporación en el análisis no es
indispensable, se recomienda no activar ninguna opción.
Opciòn “Opciones”: Se recomienda dejar activada la opción por defecto “Excluir

casos según lista” y activar las opciones: “Ordenados por su tamaño” y “Suprimir
valores absolutos menores que 10”. Estas dos últimas opciones permiten una mejor
presentación de los resultados y facilitan el análisis e interpretación de los mismos.
¿CÓMO INTERPRETAR LOS RESULTADOS Y SELECCIONAR LOS ÍTEM

QUE CONFORMARÁN LA VERSIÓN DEFINITIVA DEL INSTRUMENTO?
Para seleccionar los ítemes Nunnally y Bernstein (1988), expresan lo siguiente:
...cada factor debe tener algunas variables que se correlacionen con él casi
exclusivamente (la mayoría de las variables que se correlacionan altamente con
ese factor no deben correlacionarse más de 0,3 con cualquier otro factor), y las
variables marcadoras... deben correlacionarse por encima de 0,5...(p. 603)
En resumen, el criterio de selección de los ítem es el siguiente:

Incluir a conformar la versión definitiva del instrumento aquellos ìtem que se
correlacionan por encima de 0.50 (> 0.50) con un factor (sòlo con un factor) y menor o igual
a 0.30 (< ò =) con el resto de los factores. Si el ítem analizado no cumple con estas
condiciones debe excluirse del instrumento.
265

MODULO

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

MODULO

Diunggah oleh

Hak Cipta:

Format Tersedia

DISEÑO Y VALIDACIÓN DE INSTRUMENTOS EDUCATIVOS

Juan Agustín Suárez S

Barquisimeto, Septiembre de 2.004

PRIMERA PARTE: LA MEDICIÓN EN CIENCIAS SOCIALES Y

SEGUNDA PARTE: DISEÑO DE INSTRUMENTOS EDUCATIVOS ...................27

II ASPECTOS CONCEPTUALES Y METODOLÓGICOS DE LOS

Concepto de Método, Técnica, Instrumento e Ìtem ............................................28

III TESTS DE HABILIDADES .................................................................................43

Conceptualización de los Tests de Habilidades..................................................43

Lecturas Sugeridas .............................................................................................65

Conceptualizaciòn de losTest Afectivos ............................................................66

VII TÉCNICAS E INSTRUMENTOS DE RECOLECCIÓN DE DATOS

Recogida de Datos en Instigaciones Etnográficas..........................................120

VIII OPERACIONALIZACIÓN DE LAS VARIABLES (CONSTRUCTO) EN

TERCERA PARTE: VALIDACIÓN DE INSTRUMENTOS.............................163

Índice de Dificultad de los Ìtemes..................................................................164

XI VALIDEZ DE INSTRUMENTOS DE MEDICIÓN EDUCATIVA...................201

XII ANÁLISIS FACTORIAL..................................................................................217

XIII VALIDACIÓN DE INSTRUMENTOS CUALITATIVOS .............................241

El diseño y validación de instrumentos es abordado tanto en textos de

LA MEDICIÓN EN LAS CIENCIAS SOCIALES Y LA EDUCACIÓN

1. El estudiante debe ser capaz de diferenciar los diferentes tipos de variables y

Hay consenso entre autores especializados en medición que la definen como la

El isomorfismo significa identidad o similitud de forma. Cuando se habla de

De lo afirmado por Carreño se puede deducir que la evaluación va más allá de

Una variable es un atributo de un objeto o sujeto que asume varios valores,

Las clasificaciones más comunes de variables, son las siguientes:

Variables Discretas y Continuas

Las variables dependientes son aquellas, cuyo comportamiento depende de otra

Interpretando lo expresado por Ramírez, se puede deducir que los estudios

Variables Cuantitativas y Cualitativas:

Se denomina variable cuantitativa aquellas susceptible de ser medidas,

Un constructo es una variable que no se puede medir directamente, porque la

Escalas de Medición de una Variable

Niveles de medición de una variable

Una escala ordinal, además de la propiedad de clasificación, tiene la propiedad

La escala de intervalo tiene la propiedad de clasificación y orden; pero además

La escala de razón, al igual que la escala de intervalo, tiene la propiedad de

Estadísticos Aplicados a Diferentes Tipos de Escalas de Medición

En el cuadro 1 se visualizan los estadísticos descriptivos, las pruebas

Escalas de Medición y Estadísticos Aplicables

En el caso de la escala ordinal, como tiene las propiedades propias de la escala

1. Explique el concepto de medición en ciencias sociales, ejemplificando casos

5. Identifique la variable dependiente e independiente en las siguientes

Carreño, F. (1.991). Enfoque y principios teóricos de la evaluación (segunda

Morles, V. (1.997). Planeamiento y análisis de investigaciones (novena edición).

Nunnally, J y Bernstein, I. (1.995) . Teoría psicomètrica. México: Mc Graw Hill

Ramírez, T. (1.999). Cómo hacer un proyecto de investigación. Caracas: Panapo.

Ary, D; Dacobs, L., y Razavierh, A. (1.994) Introducción a la investigación

Carreño, F. (1.990). Enfoque y principios teóricos de la evaluación (2° edición).

Díaz Barriga, F., y Hernández, G. (2.002). Estrategias docentes para un

Kerlinger, F. (1.988). Investigación del comportamiento, (tercera edición en inglès y

Morles, V. (1.977). Planteamiento y análisis de investigaciones (novena edición).

NamakForoosh, M. (2.001),: Metodología de la investigación (2° edición). México:

Nunnally, J., y Bernstein, I. (1.995). Teoría psicométrica (3° edición). México: Mc

Ramírez, T. (1.999). Cómo hacer un proyecto de investigación. Caracas: Panapo. Se

DISEÑO DE INSTRUMENTOS EDUCATIVOS

ASPECTOS CONCEPTUALES Y METODOLÓGICOS DE LOS

1. El estudiante será capaz de diferenciar método, técnica e instrumento.

Concepto de Método, Técnica, Instrumento e Ítem

Es importante establecer la diferencia entre método y técnica, porque a menudo

Ejemplos de Métodos, Técnica e Instrumentos Aplicados en Investigaciones

Método Técnica Instrumento de Instrumento de