INTRODUCCIÓN........................................................................................................6
CAPITULOS
I TEORÍA DE LA MEDICIÓN.................................................................................10
Concepto de Medición..........................................................................................10
Isomorfismo y Realidad........................................................................................11
Medición y Evaluación ........................................................................................12
Variables................................................................................................................13
Definición de Constructo......................................................................................16
Escalas de Medición de una Variable....................................................................17
Ejercicios Propuestos............................................................................................22
Referencias............................................................................................................25
Lecturas Sugeridas................................................................................................25
2
p.p
IV TESTS AFECTIVOS.............................................................................................66
V EL CUESTIONARIO Y LA ENTREVISTA..........................................................90
El Cuestionario.....................................................................................................90
La Entrevista......................................................................................................101
Ejercicios Propuestos.........................................................................................103
Referencias.........................................................................................................106
Lecturas Sugeridas.............................................................................................106
VI LA OBSERVACIÓN...........................................................................................107
Definición........................................................................................................107
Elementos Presentes en la Observación...........................................................107
Modalidades de Observación...........................................................................108
Normas para una observación sistemática y controlada……………………...110
Instrumentos para Realizar una Observación Sistemática...............................111
Dificultades y Limitaciones de la Observación...............................................116
Ejercicios Propuestos .....................................................................................117
Referencias.......................................................................................................118
Lecturas Sugeridas...........................................................................................118
3
p.p
A manera de introducción..............................................................................143
Definición y Propósito de Operacionalización de la Variable.......................144
La Operacionalización de la Variable y los Objetivos de la
Investigación ...............................................................................................145
Correspondencia de la Operacionalización de la Variable con las Bases
Teóricas de la Investigación.........................................................................152
Construcción de Ítemes..................................................................................152
Matriz (Cuadro) de Operacionalización de la Variable .................................153
A Manera de Conclusión……………………………………………………161
Ejercicios Propuestos.....................................................................................161
Referencias.....................................................................................................162
Lecturas Sugeridas.........................................................................................162
IX ANÁLISIS DE ÍTEMES....................................................................................164
Conceptualizaciòn............................................................................................201
Métodos de Validez..........................................................................................202
Ejercicios Propuestos.......................................................................................211
4
Referencias.......................................................................................................216
Lecturas Sugeridas...........................................................................................216
p.p
A manera de introducción...............................................................................217
Validación Preliminar de Actidoc. .................................................................218
El Análisis Factorial ......................................................................................221
Aproximación a una Nueva Operacionalización de la Variable
Actitud del Docente hacia la Evaluación de los Aprendizajes
a través del Análisis Factorial .....................................................................229
Análisis Factorial ¿Versus? Confiabilidad .....................................................236
A Manera de Conclusión ...............................................................................237
Ejercicio Propuesto.........................................................................................238
Referencias......................................................................................................239
Lecturas Sugeridas..........................................................................................239
Confiabilidad ..................................................................................................241
Validez ............................................................................................................243
Ejercicios Propuestos .....................................................................................246
Referencias .....................................................................................................247
Lecturas Sugeridas .........................................................................................247
ANEXOS .................................................................................................................248
Anexo A .................................................................................................................249
Anexo B ................................................................................................................251
Anexo C ................................................................................................................255
Anexo D..................................................................................................................259
Anexo E..................................................................................................................263
5
INTRODUCCIÓN
6
La segunda parte, compuesta por siete (7) capìtulos comprendidas entre el dos y el
ocho, aborda la construcción de instrumentos. Se inicia con un capìtulo (el dos) sobre
los aspectos conceptuales, metodológicos e históricos de los instrumentos. En los
capìtulos tres (3) y cuatro (4), se aborda los tests de habilidades y afectivos
respectivamente, donde se analizan casos particulares de instrumentos incluidos en
ambas clasificaciones. En los capìtulos cinco (5) y seis (6), se aborda el cuestionario
y la entrevista; y la observación. El capìtulo siete explica las técnicas e instrumentos
cualitativos tomando como referencia la Etnografía y la Investigación-Acción. Por
ùltimo se incluye un capìtulo (el ocho) que aborda el proceso de operacionalizaciòn
de la variable, tópico que genera muchas dudas en el estudiante cuando debe
realizarla.
En la última parte, comprendida entre los capìtulos nueve y trece, se aborda la
validación de instrumentos. Esta parte está compuesta por cinco capìtulos, en el
primero de ellos ( el nueve), se desarrolla el análisis de los ìtemes, considerando el
índice de dificultad de los ítem y el análisis de discriminación. En el caso de este
último indicador, se consideran dos casos: ítem dicotómicos e ítems multicòtomos.
En el capìtulo diez (10), se incluye la confiabilidad de instrumentos; analizando, al
igual que en el análisis de discriminación, el caso de datos dicotòmicos y
multicòtomos, cuando se aplica el método de consistencia interna, el cual es el más
popular y el preferido para determinar la confiabilidad de un instrumento; ya que
requiere una sola aplicación. Además de este método se desarrollan en este capìtulo,
los métodos de reaplicación de la prueba y de pruebas equivalentes, los cuales
requieren, dos aplicaciones para determinar la confiabilidad del instrumento.
El capìtulo once (11), aborda la validez de los instrumentos de medición
educativa, donde se explican los métodos conocidos para determinar la validez de un
instrumento, los cuales son validez de contenido, de criterio y de constructo. En el
siguiente capìtulo (el doce), se explica el análisis factorial que es una herramienta de
gran utilidad para la validación de instrumentos. En su explicación se desarrolla, a
manera de ejemplo, el caso de un instrumento sometido a esta herramienta tan valiosa
para la validación de instrumentos. Como apoyo tecnológico para explicar el análisis
7
factorial, se aplicó el paquete estadístico para Ciencias Sociales (SPSS). El último
capìtulo de esta parte (el trece), el cual es también el último este libro, aborda de
manera introductoria, el proceso de validación de instrumentos cualitativos. Este
capìtulo se incluye, considerando que los capìtulos precedentes, se orientan hacia los
instrumentos cuantitativos.
Además de estos trece (13) capìtulos, se incluyen cinco (5) anexos; el A,
explica la rutina para determinar el índice de dificultad de los ítemes, el B y el C,
explican la rutina exigida para realizar en forma computarizada el análisis de
discriminación de los ítemes, de datos dicotómicos y datos multicótomos
respectivamente; el D, contiene los pasos requeridos para calcular el coeficiente de
confiabilidad de datos dicotòmicos Kuder-Richardson; y el E, explica la rutina para
realizar el análisis factorial a travès del programa SPSS.
Al final de cada capìtulo se incluyen ejercicios propuestos, que le permitirán al
estudiante verificar su conocimiento sobre el contenido de la misma. Se recomienda
no omitir esta sección, porque usted tendrá la oportunidad de autoevaluarse y repasar
aquellos tópico en los cuales muestre debilidad. Asimismo, además de las referencias,
se incluyen una lista de lecturas sugeridas sobre el contenido del capìtulo, para que el
estudiante profundice en aquellos temas y aspectos de su interés.
Por último, sólo queremos expresar nuestro deseo de que este libro sea de
utilidad a quienes se inician en el proceso de Diseño y Validación de Instrumentos
Educativos y que el mismo contribuya a despejar dudas y resolver dificultades
encontradas en el proceso que implica obtener un instrumento válido y confiable.
8
DISEÑO Y VALIDACIÒN DE INSTRUMENTOS EDUCATIVOS
PRIMERA PARTE
9
CAPITULO I
TEORÍA DE LA MEDICIÓN
Objetivos
Concepto de Medición
10
intangibles como el rendimiento escolar, la motivación hacia el estudio, la actitud del
docente hacia la evaluación de los aprendizajes, etc. En este caso el investigador debe
establecer una relación de isomorfismo entre el número asignado al atributo en
estudio y la realidad.
Isomorfismo y realidad
Medición y Evaluación
11
Es importante diferenciar la medición del proceso de evaluación, porque la
primera (la medición) es una fase de la segunda (la evaluación). Al iniciar este
capìtulo se definió la medición como “la asignación de número de acuerdo reglas”.
Asimismo se mencionó la importancia de saber determinar la relación de
Isomorfismo entre la medición y la realidad, porque cuando hay isomorfismo es
garantía de correspondencia entre el número que se asigna a una categoría de un
atributo y la realidad en la cual el atributo existe.
En el caso especifico de la evaluación del proceso enseñanza-aprendizaje,
Carreño (1.991) expresa lo siguiente:
Evaluar es enjuiciar y valorar a partir de cierta información desprendida
directamente o indirectamente de la realidad, de modo que en el proceso
de enseñanza-aprendizaje la “cierta información” aludida bien puede ser
la medición o cuantificación de los datos aportados por los exámenes,
siempre y cuando dé lugar a ulteriores interpretaciones o establecimiento
de juicios. (p.28)
12
Se deduce que evaluar para Carreño es “algo mas” que la simple medición, es
un alerta a quienes se limitan a la asignación de una “nota”, sin realizar un juicio
sobre el significado de la misma. Pero al mismo tiempo es un alerta también a
quienes pretende suprimir la medición como fase en el proceso de evaluación. Es el
caso de la evaluación cualitativa, correspondiente a la I y II Etapa de Educación
Básica, donde se establece una evaluación de rango: a, b, c, d, etc. Siendo A mayor a
B, C, D; y B mayor a C y D, y C mayor a D. Pero lo que identifica realmente al
proceso de evaluación no es la simple letra o literal, sino el significado e
interpretación de cada una de ellas.
Variables
Definición de Variable
Clasificación de Variables
Una variable discreta es aquella que sólo asume valores enteros, es decir, no
acepta valores intermedios, ejemplos, número de hijos, los cuales pueden ser 3 ó 4,
nunca puede 3,65 hijos. Las variables continuas, a diferencia de las variables
discretas, aceptan valores intermedios, ejemplos, ingreso familiar (1.200.050,50
bolívares) estatura (1,79 mts.).
13
Variables Dependientes e Independientes:
14
Referente a este aspecto, Ramírez (1.999) expresa lo siguiente:
Este tipo de investigación es difícil realizar en ciencias sociales, dada la
naturaleza propia de los fenómenos estudiados en estas ciencias (el
hombre y sus acciones). Es temerario establecer que tal factor es causa de
un fenómeno de orden social y mucho menos que sea la causa única. En
nuestra disciplina, la multivariedad de elementos que inciden para que un
fenómeno de orden social se comporte de una manera y no de otra
(Martínez, 1.991), es lo que ha hecho que muchos escépticos las
cataloguen como ciencias “blandas” con respecto a las ciencias “duras”,
donde si es posible establecer, con un elevado grado de certeza, el tipo de
causalidad unívoca; lo cual permitiría la predicción, uno de “los objetivos
de la ciencia” según los cultores de una concepción de ciencia apegada a
los cánones y criterios de cientificidad propios de las ciencias naturales.
(p.p 85 y 86)
15
En el caso de la actitud, cuando se asumen 5 categorías; la persona tiene una actitud
muy favorable si es 5, 4 cuando si es favorable, 3 indeciso o indiferente, 2
desfavorable; y 1 muy desfavorable.
Cuando la variable no es susceptible a mediciones, sino que sus indicadores se
describen, se está en presencia de una variable cualitativa. Es importante expresar que
hay variables a las cuales se trata tanto cuantitativa como cualitativamente, por
ejemplo, la actitud también puede analizarse a través de la conducta observable de los
sujetos ante el objeto que origina la actitud. Lo mismo ocurre con la motivación, los
valores, etc. Distinguir si una variable se asume en forma cuantitativa o cualitativa es
una tarea importante, porque dependiendo del tipo de variable (si es cuantitativa o
cualitativa) es que se selecciona el instrumento para recolectar la información
requerida en el proceso de interpretación y análisis de la variables en estudio.
Definición de Constructo:
16
Cuando se asigna números a los indicadores de un atributos (variable) que
posee un objeto o sujeto, se debe determinar hasta dónde ese número mide la variable
o constructo, es decir, es preciso determinar la intensidad de la medición de ese
número y el (o los) estadísticos que se pueden aplicar para analizar los resultados de
la medición del constructo en estudio. Para determinar el nivel de la medición están
las escalas de medición de una variable, las cuales desde un nivel inferior (primitivo)
hasta el nivel superior son: escala de medición nominal ordinal, intervalo y de razón:
Escala nominal:
Esta escala es considerada la más primitiva, porque sólo permite clasificar los
indicadores de la variable. Tiene la propiedad de equivalencia; ejemplo, el sexo, color
de los ojos, entidades federales de Venezuela. En estos casos se asigna un número a
cada indicador de la variable, ejemplo, sexo: 1= masculino; 2= femenino. Color de
los ojos: 1= negro; 2= azules; 3= verde; 4= otro. El número sólo indica que el sujeto
posee esa característica del atributo de la variable en estudio. No indica ninguna
relación ordinal, por ejemplo que 4 mayor a 3 mayor a 2 mayor a 1. Según Nunnally
y Berstein (1.995) “ las escalas nominales pueden ser transformadas de manera que
no se asigne el mismo número a categorías diferentes ....” ( p. 14). Sólo se requiere
que las categorías sean mutuamente excluyentes, de esta manera se evita que un
sujeto sea incluido en más de una alternativa. En esta escala, el número no representa
valor alguno, permitiéndose la asignación de cualquier número a una determinada
categoría. Al respecto el autor mencionado expresa que: “...los hombres y mujeres
podrán ser codificados, respectivamente como 1 y 0, 0 y 1 o incluso –257,3 y 534,8
sin ganar o peder información. Estas transformaciones... son permisibles porque los
nombres no tiene propiedades numéricas...” (p. 14).
Al poseer las escalas nominales sólo capacidad clasificatoria, se limita la
aplicación de los estadísticos que se pueden aplicar en el proceso de análisis de la
17
información recabada. Las operaciones matemáticas y estadísticas permitidas a este
nivel de medición son proporciones, porcentajes y tablas de frecuencias. No se puede
aplicar ni siquiera las operaciones aritméticas elementales como son la suma, resta,
multiplicación y división.
Escala Ordinal:
Escala de Intervalo:
18
no tiene significación en la realidad, ejemplo, la temperatura y calificaciones. Existe
la temperatura y calificación cero; pero esto no significa que no existe temperatura o
que un estudiante que obtuvo una calificación cero no tiene ningún conocimiento del
tema evaluado.
Nunnally y Berstein (1.995) expresa que una escala de intervalo tiene las
siguientes características “....1) Se conoce el ordenamiento jerárquico de los objeto
en un atributo, 2) también se conocen las distancias entre objetos en el atributo, pero
3) se desconoce las magnitudes absolutas del atributo....” (p.16 y 17).
Para ejemplificar las características de la escala de intervalo, volvemos al
ejemplo de la temperatura y las calificaciones. Si una temperatura sube de 16 grado a
32 grados, se puede afirmar que la temperatura subió 16 grados. En este caso se
estableció una relación de orden (se sabe que 32 grados es mayor 16 grados); pero
también se conoce la distancia entre 16 y 32 grados (en este caso 16 grados), lo cual
es una propiedad de las escalas de intervalo; sería incorrecto afirmar que la
temperatura subió el doble, porque el cero de una escala de intervalo es relativo, no es
un cero real. Igual sucede con las calificaciones de un alumno X, cuya calificación es
de 10 puntos; y la de un alumno Y, cuya calificación es de 20 puntos; se puede
afirmar que Y obtuvo una calificación mayor (relación de orden) y que la distancia
entre la calificación del alumno X con respecto a la calificación del alumno Y es de
10 puntos; pero es incorrecto afirmar que el alumno Y obtuvo el doble de
calificación; y más aún, afirma que el alumno Y tiene el doble de conocimiento que el
alumno X.
Escala de Razón:
19
de estatura entre esas dos personas es el doble. Igual sucede con la edad, una persona
de 40 años es el doble de “vieja” que una de 20 años.
La existencia de un cero real en este tipo de escala, permite que aquellas
variables incluidas en una escala de razón pueden ser sometidas a cualquier operación
matemática y estadística. Es considerada la escala de medición superior; pero es
difícil que una variable o constructo social y educativo poseen las propiedad que se
exigen para considerarla dentro de una escala de razón. La mayoría de los constructo
pertenecen a las escalas nominales y ordinales, y en casos menos comunes a escala de
un intervalo.
Cuadro 1
20
De Intervalo Calificaciones Todas las anteriores -Coeficiente de Pearson
Temperatura Media aritmética -Coeficiente parcial y
Actitud Media armónica múltiple
De Razón Talla Varianza Prueba T de Student
Peso Desviación típica Análisis de la varianza
Edad Kurtosis y asimetría
Puntuaciones Z (Dist. Normal)
Distribución de frecuencia
21
Constructo Escala de Medición
Variable Discreta Continua
Si No Nominal Ordinal Intervalo Razón
Peso de los
alumnos del
5° de
Educación
Básica,
sección A,
turno de la
mañana, de la
U.E. José
Félix Rivas,
Municipio
Palavecino del
Estado Lara.
Sexo de los
participantes
en el programa
de Maestría de
Educación de
la UPEL-IPB
en el III Lapso
del año 2.007
Edad de los
participantes
del programa
de maestría de
Educación de
la UPEL-IPB
en el tercer
lapso del año
2.007
Actitud del
docente de la I
Etapa de
Educación
Básica del
Estado Lara
hacia la
evaluación
cualitativa.
Motivación al
logro de los
profesores de
Educación
Técnica de la
UPEL-IPB
22
Constructo Escala de Medición
Variable Discreta Continua
Si No Nominal Ordinal Intervalo Razón
Número de
participantes
en las
diferentes
menciones de
la Maestría de
Educación de
la UPEL-IPB
Edad de los
participantes
de postgrado
de la
Universidad
Yacambù
Nivel
socioecnòmico
de los
participantes
de postgrado
de la
Universidad
Yacambù
Rendimiento
académico de
los alumnos de
la U.E.
Bararida,
Municipio
Iribarren,
Estado Lara
Participaciòn
de los padres y
representantes
sobre las
actividades
desarrolladas
en los
planteles
Temperatura
de la ciudad
de
Barquisimeto,
Estado Lara
23
Constructo Escala de Medición
Variable Discreta Continua
Si No Nominal Ordinal Intervalo Razón
Color de los
Ojos de los
alumnos de la
U.E.N.
Lisandro
Alvarado,
municipio
Iribarren,
Estado Lara
24
Referencias
Lectura Sugeridas
25
medición; isomorfismo entre medición y “realidad”; Propiedades, proyecciones e
indicadores de los objetos y niveles de medición y escalas.
26
DISEÑO Y VALIDACIÒN DE INSTRUMENTOS EDUCATIVOS
SEGUNDA PARTE
Objetivos:
29
Cuadro 2
30
La utilidad de los test es de tal magnitud que su uso se ha generalizado en las
escuelas, clínicas, industrias, empresas de servicio y partidos políticos. Los test se han
convertido en un gran negocio para personas y empresas que se desempeñan como
diseñadores de test, fundamentalmente en países desarrollados donde la información
que éstos generan es de gran ayuda para la toma de decisiones y para obtener
información valiosa en cuanto a variables y sujetos en estudio.
31
escala de inteligencia de Stanford-Binet. Esta ùltima escala sufrió nuevas
transformación en los años 1.937, 1.960 y en los años ochenta del siglo pasado. Más
recientemente, en la década de los años noventa del siglo pasado, Anne Anastasi,
prestigiosa autora de textos sobre test, creó un instrumento que mide habilidades, el
cual es producto de la integración de las escalas tradicionales de inteligencia y
baterías de aptitudes múltiples.
A continuación se presenta el cuadro 3 que incluye los test más relevantes desde
el siglo 2.200 A.C hasta el año 1.992
Año Evento
2.200 A.C Los mandarines establecen el programa de medidas para el servicio civil en
china
1845 Exámenes impresos que utilizó por primera vez el Comité de la Facultad
de Boston bajo la dirección del educador Horace Mann.
1864 George Fisher, maestro de escuela inglés, elabora una serie de escalas que
consisten en una muestra o conjunto de preguntas y respuestas que sirven
como guías para evaluar las respuestas de los estudiantes a las preguntas de
las pruebas de ensayo.
1865 Establecimiento del Examen del Gobernador del Estado de Nueva York.
32
Año Evento
1879 Fundación del primer laboratorio psicológico del mundo por parte de
Wilhelm Wundt en la Universidad de Leipzig en Alemania.
1896 Emil Kraeplin propone una nueva clasificación de los trastornos mentales.
Hermann Ebbinghaus desarrolla el primer test de completamiento.
1904 Charles Spearman describe la teoría de los factores sobre las capacidades
mentales. Se publicó el primer libro de texto importante sobre las medidas
educativas, Introduction to the Theory of Mental and social Measurement,
de E.L.Thorndike.
1908-1909 J.C. Stone y S.A. Courtis publican los test aritméticos objetivos.
1914 Arthur Otis desarrolla los primeros test de inteligencia en grupo, que se
diseñaron y aplicaron a los reclutas del ejercito de Estados Unidos.
1917 Los test del ejercito Alfa y Beta, primeros test de inteligencia en grupo, que
se diseñaron y aplicaron a los reclutas del ejército de Estados Unidos. El
primer inventario de personalidad estandarizado, la Hoja de Datos
Personales de Robert Woodworth, se utilizó en la selección militar.
33
Año Evento
1971 Decisión de la corte federal que requiere que los test que se utilicen para
los propósitos de selección de personal sean importantes para el trabajo
(Griggs contra Duke Powel)
34
Año Evento
Se publicó el DSM-III-R
Clasificación de Instrumentos
35
informales (como las pruebas hechas por el docente para evaluar el aprendizaje del
alumno) que no se han aplicado a una muestra representativo de la población en
estudio, con la finalidad de someterlo a un proceso de validez y confiabilidad. Un
instrumento puede someterse a validación mediante una pequeña muestra pilotos de
sujetos provenientes de la población en estudio, pero si esa muestra no es
representativo no se puede hablar de test estandarizado. Es un test no estandarizado
auque se determine su validez y confiabilidad.
Cuando el test se aplica a una sola persona como los test de inteligencia se
denominan test individuales; pero cuando se aplica a un grupo para determinar un
atributo que éstos poseen, se está en presencia de un test grupal.
Los test objetivos son aquellos que tiene formas de calificación estándar y entre
varios calificadores, los resultados siempre serán los mismos. Ejemplo de test
objetivos son las pruebas objetivas (verdadero-falso, selección simple y múltiple,
apareamiento y completación). Los test no objetivos o sujetivos son aquellos donde
no existe forma estándar para calificarlo, sino que la calificación
depende en gran medida del calificador. Ejemplo de este tipo de test, son las
pruebas de rendimiento académico de ensayo y las pruebas para evaluar la
personalidad .
Test de acuerdo al Contenido de una Tarea que se Presenta:
Esta clasificación se divide en test que contiene sólo material verbal como
vocabularios o lecturas, test de material no verbal como diagramas, rompecabezas y
mapas, y por último, están los test de ejercicio que determinan las habilidades
prácticas en un tema, ejercicio, profesión u oficio.
36
Test Cognoscitivos y Afectivos:
Aiken al explicar los test cognoscitivos expresa lo siguiente:
El mismo autor para referirse a los test afectivos expresa que éstos.....”están
diseñados para evaluar los intereses actitudes, valores, motivos, rasgos de
temperamento u otras características no cognoscitivos de la personalidad....” (P11).
Se puede concluir que los instrumentos de acuerdo al proceso de aprendizaje que
se quiere determinar, se dividen en test de habilidades (procesos cognoscitivos) y test
afectivos o de evaluación de la personalidad. Esta última denominación (test de
personalidad) es como se conocen aquellos test que evalúan la parte afectiva de una
persona.
37
susceptibles para realizar operaciones estadísticas. Estos tipos de instrumentos se
aplican fundamentalmente en el método “científico”. En métodos como la etnografía
y la Investigación-Acción, se limitan a cuestionarios y algunas escalas de estimación;
pero siempre subordinado a instrumentos cualitativos. Los instrumentos cualitativos
son propios de estos dos últimos métodos mencionados y el procesamiento de los
datos recolectados no es susceptible a operaciones estadísticas, sino que en los mismo
prevalece el proceso de categorización de los datos como forma de interpretar y
analizar los resultados. Los instrumentos cualitativos de mayor aplicación son los
relacionados con la entrevista no estructura y la observación.
38
1
Propósito
Del
3 4
instrumento
Fundamentación
Conceptualización Teórica de la
Del constructo 2 variable
Decidirelel
Decidir
TipodedeInstrumento
Instrumento
Tipo
5 6
DISEÑO DEL
INSTRUMENTO Redacciòn
Operacionalización Itemes Redacciòn
Operacionalización Deìtems
ìtems
(PRIMERA VERSIÓN De
dedevariables
variables
DEL INSTRUMENTO)
8
7
VALIDACIÓN DEL
INSTRUMENTO Aplicación
Validez de
Validez de DeAplicación
la prueba
Contenido Depiloto
la prueba
(JuicioContenido
de Expertos) piloto
(Juicio de Expertos)
Confiabilidad 1
Confiabilidad
0
Análisis de Itemes Evidencias de validez de constructo
Análisis de Itemes Evidencias de validez de constructo
9 11
39
Al seleccionar el instrumento, los pasos siguientes son la conceptualización
y fundamentación teórica del constructo que se desea investigar. En estas fases se
debe precisar el concepto de constructo, las teorías que lo explica y la teoría que se
asumirá en la investigación para describir y/o explicarlo. Al poseer la suficiente
fundamentación teórica se debe elaborar el cuadro de Operacionalización de la
variable que consiste en definir las variables a operacionalizar, las dimensiones y
subdimenciones, los indicadores y subindicadores, y por último, la redacción de los
ítems correspondientes a cada variable que se está operacionalizando. Con esta fase
se concluye el proceso de diseño del instrumento, obteniéndose la primera versión.
Al cumplir el proceso de diseño, se inicia el proceso de validación del
instrumento, sometiéndolo a la validez de contenido, la cual se realiza a través de la
técnica de juicio de expertos, que consiste en la revisión del instrumento por personas
expertas en el área en la cual se realiza la investigación y en metodología de la
investigación. Después que los expertos revisen el instrumento y se incorporen las
observaciones al mismo, se aplica la prueba piloto a una muestra de la población en
estudio o con características similares a la misma. La intención de esta muestra es
determinar el comportamiento de los sujetos encuestados ante los ítemes que contiene
el instrumento, determinar con los datos el análisis de ítemes, la confiabilidad y
algunas evidencias de validez. Realizado el proceso de validación se puede hablar de
un instrumento estandarizado, si el mismo además de ser válido y confiable es
representativo de la población en estudio.
Al cumplir con este último paso se obtiene la versión final del instrumento,
la cual se aplicará a la muestra definitiva de sujetos que suministrarán la información
sobre la (s) variable (s) en estudio.
Ejercicios Propuestos
40
2. Ejemplos de tipo de instrumentos.
Referencias
41
Lecturas Sugeridas
42
CAPÌTULO III
TEST DE HABILIDADES
OBJETIVOS
43
de aptitud, que tienen como función predecir cuál será el desempeño de un estudiante
en su carrera universitaria o un profesional en su desempeño laboral.
Cuando se explicó la clasificación de test cognoscitivo y afectivo, también se
expresó que para Aiken (1.996), ante la confusión que puede generar el vocablo logro
en pruebas de aprovechamiento y aptitud, prefería usar la expresión test de
habilidades para denominar a los test cognoscitivo. En este trabajo se aceptó la
sugerencia de Aiken y se habla de test de habilidades para designar todos aquellos test
cuya función es determinar conocimiento, sea éste en tiempo pasado, presente o
futuro.
44
2. Validez de Contenido: Las pruebas de rendimiento académico como
cualquier otro instrumento debe someterse a validez de contenido a través de la
técnica de juicio de experto. Evaluada por los expertos, la prueba debe aplicarse a una
muestra piloto para evaluar las respuestas de los respondientes y obtener información
que permita calcular la confiabilidad y otros métodos de validez como de criterios y
constructo.
3. Confiabilidad: Después de someter la prueba a validez de contenido a través
de la técnica de juicio de expertos y aplicar la muestra piloto, se debe realizar el
análisis de los ítems (análisis de discriminación de los ítems e índices de dificultad de
la prueba) y calcular la confiabilidad del instrumento.
4. Estandarización de la Prueba: Demostrada la factibilidad, validez y
confiabilidad de la prueba, se puede aplicar la versión definitiva, la cual determinará
el logro alcanzado por el alumno en la asignatura o tema que se evalúa. A los tres
aspectos señalados como características se puede agregar otro: la estandarización de
la prueba, que consiste en determinar la validez y confiabilidad de la misma en una
muestra representativa de la población en estudio, con la finalidad de generalizar su
aplicación y los resultados a un universo que puede abarcar una región, país e incluso
todo el planeta.
45
Tipificada. Son aquellas pruebas de rendimiento académico elaboradas por
especialistas tanto en el contenido pedagógico como en técnicas de construcción y
validación de instrumentos, se somete a un proceso de validez y confiabilidad y la
prueba se aplica a una muestra representativa de la población en estudio para
determinar su factibilidad, validez y confiabilidad. Después de cumplir todo el
proceso señalado se aplica en forma definitiva.
Orales. Este tipo de prueba tuvo gran acogido (hasta la década de los años
1.960) en el mundo y en nuestro país; pero debido a la subjetividad implícita en las
calificaciones y la dificultad de aplicarla en grupos numerosos, su uso se redujo
considerablemente y fueron sustituidas en gran medida por las pruebas escritas.
46
alumno tiene una probabilidad de acertar del 50%, es decir, si el alumno responde
todas las preguntas por simple adivinación, tendrá de acuerdo a la ley de probabilidad
la mitad del total de respuesta en forma correcta.
Ejemplo de respuestas alternas:
Las pruebas de aprovechamiento escrita se subdividen en objetivas, de ensayo y
mixtas: V:_____ F: ______
1.2 Ítem con respuestas de jerarquización u ordenamiento. Carreño (1.990)
expresa que las respuestas jerarquizadas u ordenadas “...se caracteriza por ofrecer al
examinado una listas de elementos o datos, a los cuales debe dar un orden específico
de acuerdo con el criterio que indique las instrucciones (cronológico, lógico,
evolutivo, por rango, etc.)”. (p.33)
Carreño señala el siguiente ejemplo: colocar por orden jerárquico los niveles de
aprendizaje propuestos por Bloom en el domino cognoscitivo, empezando por el más
elemental:
Compresión 1.-:______________
Evaluación 2.-: ______________
Aplicación 3.-: ______________
Análisis 4.-: ______________
Conocimiento 5.-: ______________
Síntesis 6.:_______________
1.3 Complementación – respuesta simple o breves. En este tipo de respuesta, se
completa una frase con una palabra, dato o símbolo. Ejemplo: Caracas es la capital
de: _____________________
1.4. Apareamiento / correspondencia / casamiento: Consiste en aparear
elementos que se encuentra en dos grupos.
Ejemplo: En el paréntesis anotar la letra que corresponde a la capital del
Estado.
( ) Lara (A ) Maracaibo
( ) Carabobo (B) Trujillo
( ) Trujillo (C) Cumaná
Cont.
47
( ) Nueva Esparta (D) Valencia
( ) Sucre (E) Tucupita
( ) Delta Amacuro (F) Barquisimeto
( ) Zulia (G) La Asunción
48
Para castigar a los alumnos que responden adivinando las respuestas, se ha
construido la siguiente fórmula:
PC= C-(i/n-1)
Donde:
PC: Puntuación corregida
C: Número de respuestas correctas
i: Respuestas incorrectas
n: Número de alternativas de respuesta del ítem
Ejemplo: Si un estudiante obtiene 30 respuestas correcta y 20 incorrecta en una
prueba de 50 preguntas, con tres alternativas de respuestas, tendrá 20 puntos de
calificación
Pc= 30-(20/3-1)= 20
Para premiar a quienes dejan en blanco las respuestas que desconocen se aplica
la siguiente fòrmula:
PC= C+(O/N)
Donde:
PC= Es la puntuación corregida
C= Número de respuestas correctas
O= Número de respuestas omitidas
N= Número de opciones de respuestas del reactivo
Ejemplo: Si un estudiante obtiene 30 respuestas correctas, dos incorrectas y 8
omitidas en una prueba de 40 preguntas de cuatro alternativas de respuestas la
puntuación será de 32 puntos de calificación.
Pc= 30 + (8/4)= 32
2. Pruebas escritas de ensayo: En este tipo de prueba el estudiante redacta la
respuesta. Se conocen dos tipos de reactivos de ensayo: (a) respuestas restringidas,
49
donde se restringe la respuesta de acuerdo a la formulación de la pregunta. Ejemplo:
cite los tres métodos básico de confiabilidad en la validación de instrumentos, (b)
respuesta libre, en este tipo de respuesta el estudiante tiene libertad para responder la
pregunta. Ejemplo: elabore una prueba de rendimiento académico, tomando un
contenido de la asignatura que usted administra.
Las desventajas de las pruebas escritas tipo ensayo son las siguientes: (a) Alto
grado de subjetividad en el proceso de evaluación, (b) Puede influir la redacción en el
momento de la evaluación, y (c) Sólo es adecuada cuando se quiere evaluar
creatividad o redacción.
Tomando en cuenta las limitaciones de las pruebas de ensayo se recomienda: (a)
Incluir una cantidad representativa de ítemes del tema o contenido a evaluar, para ello
se recomienda ítemes de respuestas restringidas, (b) se debe informar al estudiante
como debe responder las preguntas, (c) Debe formularse a todos los estudiantes los
mismas preguntas, con el propósito de evitar preguntas con niveles de dificultad
diferente, (d) se debe corregir la misma pregunta al grupo de estudiantes ante de pasar
a otra, y (e) la corrección de la prueba de deber ser anónima, es decir, no se debe
conocer el nombre del estudiante al cual se está corrigiendo la prueba.
3. Pruebas mixtas:
Es aquel tipo de prueba integrada por reactivos de respuestas objetivas y de
ensayo.
Taxonomía de Bloom
50
Para la redacción de objetivos instruccionales e ítemes de pruebas de
aprovechamiento académicos, existen las taxonomías, siendo la más popular aquella
creada por Benjamín Bloom; quien divide los objetivos instruccionales en tres áreas:
cognoscitivos (objetivos de la memoria y razonamiento), afectivos (objetivo de las
emociones) y el psicomotriz (objetivo de habilidades físicas).
Bloom divide el dominio cognoscitivo en seis (6) niveles: conocimiento
(recordar o de memoria), compresión (responder lo que se pregunta, para lo cual se
requiere el entendimiento), aplicación (solución de problemas), análisis (examen
exhaustivo de un problema o de un caso especifico), síntesis (resumir la evolución de
un problema. Se considera el nivel inverso al análisis) y evaluación (emitir juicio
sobre un tema particular). Estos niveles para Bloom tienen un orden jerárquico y van
desde el más simple hasta el más complejo
En cuanto al dominio afectivo; Bloom, citado por Woolfolk (1.996), señala
cinco objetivos básicos:
(a) Recepción: estar consciente de algo en el entorno o ponerle atención.
Este es el nivel de “escuchar el concierto pero no prometo que me agrade,
(b) Respuesta: presentar alguna conducta nueva como resultado de le
experiencia. En este nivel, una persona podría aplaudir después del
concierto o murmurar algo de la música el día siguiente, (c) Valoración:
Demostrar algún interés o compromiso definitivo. En este nivel, una
persona podría decidir ir a un concierto en vez de ir a ver una película, (d)
Organización: Integrar un valor nuevo en nuestro propio conjunto general
de valores, dándole alguna clasificación entre nuestras prioridades
generales. Este es el nivel en que una persona empezaría a hacer
compromisos importantes para asistir a un concierto, (e) Caracterización
por valor: Actuar de manera consistente con el nuevo valor. En este nivel
superior, una persona se comprometería con firmeza al amor hacia la
música y lo demostraría abierta y consistentemente. (p.448)
51
artesanal, por aprendizaje, debe ser capaz de producir una vasija que sea simétrica,
que se mantengan de pie por si misma y no se resquebraje con el fuego. (p.449)
52
Comprensión Interpretación Aplicación Análisis Síntesis Evaluación
I II III IV V VI
Reproducir Obtener Planificar
Resumir Participar Presentar
Retener Practicar Predecir
Reunir Presentar Realizar
Rehacer Procurar Recoger
Pronunciar Resumir
Traducir Probar Reunir
Transformar Realizar Razonar
Visualizar Rebotar Sinterizar
Ver Recortar Sugerir
Regresar Suponer
Sistematizar
Solucionar
Usar
Utilizar
53
4. Tabla de especificaciones de la prueba.
Propósito Nombre del Contenido Dominio del Nivel del Identificación Total
de la objetivo o conocimiento a conocimiento del item(*) ítemes(**)
prueba unidad a evaluar a evaluar
evaluar
- - - - - Total
ítemes(**)
(*) Debe identificar los ítemes que corresponden al nivel del conocimiento a evaluar
(**) Debe indicar la cantidad de ítemes
54
A = 5: El alumno alcanzó todas las competencias y en algunos casos superó las
expectativas
B = 4: El alumno alcanzó todas las competencias previstas para el grado.
C = 3: El alumno alcanzó la mayoría de las competencias previstas.
D = 4: El alumno alcanzó algunas de las competencias, pero requiere de un
proceso de nivelación al inicio del nuevo año escolar para alcanzar los resultados.
E = El alumno no logró adquirir las competencias mínimas requeridas para ser
promovido al grado inmediato superior.
Si la prueba está dirigida a alumnos de la III Etapa de Educación Básica y a
Educación Media, la escala a tomar en cuenta, será la siguiente:
Puntuación Categorías
18 a 20 Excelente
15 a 17 Buena
Puede 13 a 14 Satisfactoriamente valorar
los resultados 10 a 12 Regular de una
01 a 09 Deficiente
prueba, tomando en
cuenta una escala de puntuaciones diferentes a los establecido, ejemplos, evaluar del
1 al 100 y luego realizar la conversión de 1 a 20 puntos: si un alumno obtuvo una
calificación de 80 puntos (escala del 1 a 100), para transformar esa calificación del 1
al 20, se procede a despejar la siguiente reglas de tres:
80 ___________100
X ___________ 20
La conversión es 16 puntos. Si son 90 puntos, la conversión será 18 puntos.
Si la prueba está dirigida a participantes de postgrado de la UPEL – IPB, la
escala será la siguiente:
Calificación Valoración Acumulada Categoría Cualitativa
10 95-100 Excelente
9 89-94 Sobresaliente
8 83-88 Distinguido
7 77-82 Bueno
55
6 70-76 Suficiente
5 56-69 Deficiente
4 42-55 Deficiente
3 28-41 Deficiente
2 14-27 Deficiente
1 Hasta 13 Deficiente
Test de Inteligencia
Definición de Inteligencia
56
principios del siglo XX elaboró una primera definición de inteligencia, la cual vinculó
a factores hereditarios y para demostrar la relación inteligencia-factores hereditarios,
se dedicó a estudiar el árbol genealógico de numerosas familias.
Posteriormente el psicólogo Alfredo Binet, en la primera década del siglo XX,
también se preocupó por definir la inteligencia, a la cual consideró como “La
capacidad para juzgar bien, razonar bien y entender bien”. (tomando de Aiken, 1.996,
p.136).
Teorías recientes involucran como determinantes de la inteligencia a uno o más
de los siguientes aspectos: (a) Capacidad del individuo para aprender; (b)
Conocimiento total que ha adquirido una persona, y (c) Capacidad para adaptarse a
distintas situaciones.
Sobre la definición de inteligencia en al actualidad la polémica continùa, hay
quienes consideran que una persona inteligente debe dominar todas las áreas del
dominio cognoscitivo: arte, matemática, poesía, historia, etc., apoyan su tesis en la
correlación positiva de las diferentes subpruebas de inteligencia.
Mas reciente Howard Gardner en el año 1.983 propuso su teoría sobre la
inteligencia múltiple. Al respecto Woolfolk (1.996) expresa lo siguiente:
... basó su noción de capacidades separadas en parte, en la evidencia de
que el daño cerebral (de un golpe, por ejemplo) con frecuencia interfiere
en el funcionamiento de un área, como el lenguaje, pero no afecta el de
otras áreas. Gardner también anotó que los individuos a menudo
sobresalen en una de estas áreas pero no tiene habilidades considerables
en las otras seis. (p.111)
57
las palabras, sensibilidad para las diferentes
funciones lingüísticas
Musical Compositor, Capacidades para producir y apreciar ritmo, tono y
violinista timbre, apreciación de las formas de expresión
musical.
Espacial Navegante, escultor Capacidades para percibir el mundo espacial visual y
realizar transformaciones en las propias percepciones
iniciales
Inteligencia Estados Finales Componentes centrales
Cinética corporal Bailarín, atleta Capacidades para controlar los movimientos del
cuerpo y manejar objetos con destreza.
Interpersonal Terapeuta, vendedor Capacidad para discernir y responder con propiedad
a los modos, temperamentos, motivaciones y deseos
de otros.
Intrapersonal Persona con un Acceso a los sentimientos propios y la capacidad de
conocimiento discriminar entre éstos y asociarlos para guiar la
detallado y preciso de conducta; conocimiento de las fuerzas, debilidades,
si misma deseos e inteligencia de uno mismo.
(*) La teoría de Howard Gardner de las inteligencias múltiples sugiere que hay siete categorías
diferentes de aptitudes humanas. Un individuo podría tener ventajas y desventajas en una o varias
áreas. La figura presenta explicaciones de cada capacidad y ejemplos de ocupación que se relacionan
con esa aptitud.
Nota: cuadro tomado de Psicología educativa. Woolfolk, (1996), p.113
58
administrados. Tiene como desventaja que el aplicador del test no supervisa
directamente las preguntas formuladas, se aplica generalmente cuando se requiere
información inicial sobre la inteligencia del grupo.
59
niño de 6 años y responde preguntas que corresponde a un niño de 10 años, su C.I
será:
Edad mental 10
C.I: X 100 = X 100= 166.67
Edad Cronológico 6
3 años 9 años
Señala la nariz, los ojos y la boca Da cambio de 20 pesos
Repite dos dígitos Responde o comprende preguntas sencillas
Menciona los objetos en una ilustración Define palabras familiares en términos superiores
a su uso
Conoce su apellido Reconoce todos los valores de las monedas
Repite un enunciado de seis silabas Menciona los meses del año en orden
4 años
Sabe cuál es su sexo 10 años
Menciona la palabra llave, cuchillo y moneda Acomoda cinco bloques en orden de peso.
Repite tres dígitos Copia dos dibujos de memoria
Compara dos líneas Critica afirmaciones absurdas
5 años Responde o comprende “preguntas difíciles”
Compara dos pesos Utiliza tres palabras determinadas en no más de
Copia un cuadro dos enunciados.
Repite un enunciado de diez sílabas 12 años
Cuenta cuatro monedas Se resiste ante las sugerencia acerca de la
Junta las mitades de un rectángulo dividido longitud de líneas
6 años Construye un enunciado que contiene tres palabras
determinadas.
Distingue entre mañana y tarde Menciona 60 palabras en 3 minutos
Define palabras familiares en términos de uso Define tres palabras abstractas
Cuadro 5 (Cont.)
Copia un diamante Descubre el sentido de un enunciado que no está
en orden
Cuenta 13 monedas
Distingue fotos de rostros feos y bonitos
7 años 15 años
Señala la mano derecha y la oreja izquierda Repite siete dígitos
Describe una ilustración Encuentra tres rimas para una palabra determinada
en 1 minuto
Lleva a cabo tres órdenes que se dan en forma Repite un enunciado de 26 sílabas
simultánea
Cuenta el valor de seis monedas, tres de las Interpreta ilustraciones
cuales valen el doble.
Menciona cuatro colores cardinales Adulto
8 años Resuelve la prueba del cortado de papel
60
Compara dos objetos de memoria Vuelve a ordenar un triángulo en la imaginación
Cuenta del 20 al cero Menciona las diferencias entre pares de términos
abstractos
Se da cuenta de las omisiones en las ilustraciones Menciona tres diferencias entre un presidente y un
rey
Da la fecha y el día Menciona el pensamiento principal de una
selección que lee
Repite cinco dígitos
Edad mental 6
C.I: X 100 = X 100= 60
Edad Cronológico 10
61
Cohen y Swerdlik (2.000) al referirse a este tipo de escala de inteligencia
expresan lo siguiente:
David Wechsler... diseñó una serie de pruebas de inteligencia aplicadas en
forma individual para evaluar las capacidades intelectuales de personas
desde preescolar hasta adulto. En sus revisiones actuales, las tres escalas
de inteligencia de Wechsler son la Escala Wechsler de Inteligencia para
Adultos-tercera edición (Wechsler Adult Intelligence Scale-III; WAIS–III)
para edades de 16 a 89 años, la Escala Wechsler de Inteligencia para
Niños -tercera edición (Wechsler Intelligence Scale for Children-III;
WISC-III) para edades de seis a 16 años y la Escala Wechsler de
Inteligencia Preescolar y Primaria –Revisada (Wechsler Preschool and
Primary Scale of Intelligence-Revised (WPPSI-R), para edades de tres a
siete años, tres meses. Las pruebas tienen todas una estructura similar y
cada una incluyen una escala verbal y una de ejecución....(p.310)
Estas pruebas fueron clasificadas por orden de dificultad y son escala de puntos
en lugar de escalas de edad. La prueba está compuesta por un conjunto de
subpruebas. La primera edición se publicó en 1.930. En el año 1.939 se publicó una
nueva edición. Otras nuevas ediciones se publicaron en 1.942 y 1.997. En esta último
publicación se actualizó el material y se amplió el rango de edad hasta 89 años,
considerando que la esperanza de vida se había incrementado
62
como una medida de seguridad que permite determinar el estado de los sentidos de un
candidato a un cargo. En el ámbito escolar instrumentos de este tipo detectan
deficiencias como agudeza visual y auditiva, así como confusiones en la visión de
colores.
Habilidades Mecánico
Se aplica para determinar las habilidades musicales y artísticas que posee una
persona
Este tipo de prueba está conformada por varias sub-pruebas que miden por
separado varios aspectos de interés relacionado con diferentes habilidades
Ejercicios propuestos
63
3. Diseñar una prueba de rendimiento académico tomando en cuenta los pasos
explicados para su elaboración.
Referencias
Aiken, L. (1.996). Test psicológicos y evaluación. México: Prentice Hall.
64
Lecturas Sugeridas.
Aiken, L. (1.996. Test psicológicos y evaluación. México: Prentice Hall. Se
recomienda los capítulos 6: Test de inteligencia y el capítulo 7: Tests de
Habilidades especiales.
CAPÌTULO IV
TESTS AFECTIVOS
Objetivos
65
2. El estudiante será capaz de diseñar escalas de actitudes de acuerdo a criterios
técnicos.
3. El estudiante será capaz de distinguir las test afectivos más importantes,
como son actitudes, motivaciones, valores e intereses.
La Actitud(1)
La Definición de Actitud
66
Actualmente las actitudes son abordadas no solamente por la psicología, sino
por otras disciplinas como la sociología, antropología cultural y educación. La actitud
es un tema que despierta gran interés a los investigadores educacionales, porque a
través de ésta se puede predecir el comportamiento y la conducta de agentes
educativos, como docentes, representantes y alumnos.
La actitud ha sido definida de muchas maneras. Sólo Gordon Allport, citado por
Rodrigues (1990), “compiló más de 100 definiciones de actitud...” (p. 265).
Thurstone (1928), pionero de la construcción de escalas de actitud, define la actitud
como la predisposición de una persona a expresar sus sentimientos. En esta definición
de Thurstone sólo está presente la parte afectiva de la actitud. Actualmente hay
acuerdo que la actitud es la predisposición manifestada por una persona hacia otra
persona u objeto, predisposición que puede ser a favor, en contra o simplemente no
manifestar ninguna predisposición.
Donde no hay acuerdo es sobre los componentes de la actitud. Hay autores que
consideran la actitud compuesta por tres componentes: el cognoscitivo (creencias,
percepciones e ideas acerca del objeto de actitud), afectivo (sentimientos de agrado o
desagrado hacia el objeto de actitud) y el conductual (intenciones conductuales o
tendencia a la acción). Otros autores consideran que la actitud, al igual como la
consideró Thurstone, está compuesta solamente por lo afectivo. Stahlberg y Frey
(1990) analizan la controversia sobre la estructura de la actitud. Al respecto expresan
lo siguiente:
...algunos autores conceptualizan las actitudes como si estuvieran
integradas por componentes afectivos, cognitivos y conductuales (entre
ellos Rosenberg y Hovland, 1960). Sin embargo, la mayor parte de la
67
investigación sobre actitudes y conducta ha reducido las actitudes a su
componente afectivo. Esta restricción del concepto de actitud ha estado
motivada económicamente porque las afirmaciones evaluativas se miden
fácilmente, por ejemplo, a través de una escala de Likert. También, en los
casos donde el componente afectivo proporciona un excelente resumen de
la actitud compleja total (por ejemplo, cuando los componentes cognitivo
y afectivos son recíprocamente consistentes), las medidas de sólo el
componente afectivo pueden ser buenos predictores de la conducta. Pero
algunas veces los componentes cognitivo y afectivo pueden ser
inconsistentes... (p. 165)
68
conocimiento del objeto una persona no puede poseer una actitud hacia éste. Si un
docente no tiene conocimiento del Nuevo Diseño Curricular, obviamente que su
actitud hacia el mismo no será ni favorable ni desfavorable. Es necesario para
formarse una actitud, tener conocimiento del objeto que sirve de estímulo.
69
Formación de la Actitud
70
Medición de Actitudes
71
informes acerca de sí mismo son los de mayor uso, incluyéndose dentro de ellas las
escalas de actitud, donde se destaca la escala de Likert, por su amplio uso en la
actualidad.
2. Recolección de muestras conductuales:
Este investigador propone cuatro procedimientos posibles para recolectar
muestras conductuales:
Aplicación colectiva-descripción del sujeto: En este procedimiento el
investigador reúne colectivamente una muestra de sujetos y ellos mismos responden
los items del cuestionario aplicado. Este procedimiento es muy popular, debido a la
facilidad de aplicación.
Aplicación en grupo-descripción del investigador: Es de difícil aplicación
cuando deben registrarse las respuestas en forma simultánea por el investigador
Aplicación individual-descripción del sujeto: Este procedimiento se utiliza
cuando el sujeto está muy distanciado geográficamente y es muy costoso entrevistarlo
personalmente, entonces se usa el correo. El sujeto investigado contesta el
cuestionario, el cual se aplica individualmente.
Aplicación individual-descripción del investigador: Se usa ampliamente y
consiste en un encuentro cara a cara (sujeto e investigador), donde este último hace
preguntas y registra sus respuestas.
3. Tratamiento de muestras conductuales:
Afirma este autor que la escala de números “es un tratamiento adecuado que
permite determinar las dimensiones del conjunto” (p. 24), porque la misma tiene
muchas propiedades, entre ellas, la realización de las cuatro operaciones
fundamentales: suma, sustracción, multiplicación y división. Para Summers la escala
de números tiene las cuatro escalas de medición: nominal, ordinal, intervalo y razón.
Al respecto expresa lo siguiente:
Se supone generalmente que la actitud, como concepto, tiene todas las
propiedades de escala de números. Primero, porque la actitud se considera
como una variable continua, se pueden identificar puntos nominalmente
diferentes a lo largo de su continuo... cuando se considera el continuo
como extendiéndose desde del extremo “positivo” hasta el extremo
“negativo” con respecto al objeto actitudinal, cualesquiera dos puntos en
72
él nominalmente distintos diferirán en cantidad de “positividad” (o
“negatividad”). Por lo tanto, la actitud tiene una propiedad ordinal. En
seguida, es posible localizar en el continuo de actitud puntos que sean
equidistantes en significado psicológico (positividad o negatividad);
consecuentemente, la actitud tiene una propiedad intervalar. Finalmente,
los teóricos de las actitudes suponen ordinariamente que es posible
localizar puntos que mantengan legalmente la igualdad de razones. Esto
es equivalente a decir que el Punto A, en la dimensión de actitud, es dos
veces más positivo que el Punto B. Dado un isomorfismo entre las
propiedades del concepto y las de la escala numérica, cualquier limitación
en la aplicación de la escala en la investigación de la actitud debe
descansar en las propiedades de la muestra. (p. 25)
73
Métodos para medir actitudes
74
que aparezcan regularmente espaciadas o graduadas... Para cada
enunciado, el lector (Juez) debe decir cuál de cinco grados subjetivos de
afirmación o de negación implica el mismo, o si se trata de una opinión
neutral (p.p. 279-280)
Después que los “jueces neutrales” asignen puntuaciones a los once grados
(cinco positivos, uno neutro y cinco negativos), el paso siguiente es calcular el valor
que tendrá cada grado, de acuerdo a los resultados obtenidos por la valoración de los
jueces. Se observa que aplicar una escala de actitud a través del método de Thurstone
es complicado. Al respecto Aiken (1996) expresa lo siguiente:
A pesar de la alta confiabilidad de los instrumentos que se elaboran por
medio de intervalos aparentemente iguales (Escala de Thurstone), el
procedimiento ha sido objeto de críticas por: 1) la gran cantidad de
trabajo que se requiere en la elaboración de una escala de actitud; 2) la
falta de unicidad en la calificación y 3) los efectos de las propias actitudes
de los jueces sobre los valores en la escala de las afirmaciones (Selltiz,
Wrightsman y Cook, 1976). Si tomamos en cuenta la disponibilidad de
nuevas técnicas que ahorran tiempo, el primer motivo de crítica no es
grave. El segundo motivo se refiere al hecho de que la misma
calificación, que es simplemente el valor mediano de las afirmaciones
revisadas, puede observarse al verificarse diferentes afirmaciones. El
tercer motivo de crítica, se refiere al hecho de que no todos somos
capaces de representar el papel de juez neutral. No obstante, Bruwold
(1975) llegó a la conclusión de que la instrucción cuidadosa de los jueces
reduce los prejuicios a un nivel que no distorsionan de manera importante
las propiedades de intervalos iguales en estas escalas. (p. 232)
75
Escalograma de Guttman (1944)
Louis Guttman en el año 1944 elaborò una escala de actitud, conocida como el
Escalograma de Guttman, porque es una escala de intensidad, donde si un sujeto
respalda un reactivo de mayor intensidad, debe respaldar también todos aquellos de
menor intensidad, por ejemplo, si una mujer blanca afirma que está dispuesta a
casarse con un hombre negro, entonces debe aceptar reactivos de menor intensidad
como asistir a un restaurante donde permiten la entrada de negros o manifestar su
aceptación con las inmigraciones de negros al país donde vive.
El objetivo de Guttman fue crear una escala ordinal acumulativa, probando
antes de la aplicación definitiva, los grados de intensidad de los reactivos. Guttman
planteó la unidimensionalidadd de la variable, es decir, la medición de una dimensión
única. Para la elaboración de su escala se apoyó en Bogardes quien en 1925 creó una
escala de distancia social de distintos grupos sociales, entre ellos religiosos y raciales.
76
representa una relación estrecha y la tercera marca, representa una relación
medianamente.
La escala de actitud tipo Likert, es la más popular de los métodos para medir
actitudes. Fue creada por Rensis Likert en 1932. Para validar su escala Likert
compara los resultados de los mismos instrumentos aplicados por Thurstone (1928)
para probar su técnica y concluye que existe una alta correlación entre el método que
él creó y el aplicado por Thurstone. Esto prueba la validez y confiabilidad de la
Escala de Likert, la cual es mucho más sencilla de aplicar que la escala de Thurstone.
Likert (1932) al realizar comparaciones entre ambos métodos expresa:
...con la presente escala de internacionalismo, con 24 ítems, se obtiene la
misma confiabilidad que combinando ambas formas de la escala de
Thurstone, con un total de 44 ítems. Por ende, usando el método que
describimos aquí se asegura una medida de la actitud de una persona que
es tan confiable como la obtenida por el método de Thurstone y que sólo
requiere que la persona reaccione aproximadamente a la mitad de los
ítems... (p. 236)
Además de la menor cantidad de ítems, Likert demostró que se podía obtener los
puntajes de un sujeto con solo sumar los valores de los ítems, usando una escala de
respuestas entre 1 y 5 (en algunos casos usó escalas entre 1 y 3 y entre 1 y 7
alternativas de respuestas). Este método, actualmente vigente, exige que las
alternativas de respuestas sean las mismas para todos los ítems. Debido al proceso de
sumatoria de ítems, se conoce como el método de rangos sumatorizados.
Sampieri y otros autores (1991) menciona las categorías de respuestas más
frecuentemente usadas para la construcción de escalas de actitud tipo Likert. Ellas son
las siguientes:
77
3) Definitivamente si Probablemente si Indeciso Probablemente no Definitivamente
no
78
A continuación se presentan algunos criterios para la construcción de escalas de
Likert, formulados por Edwars, los cuales fueron tomados por Triandis (1974):
(a)...Evitar declaraciones que se refieren al pasado más bien que al
presente; (b) Evitar declaraciones que sean positivas o puedan presentarse
como tales; (c) Evitar declaraciones que pueden interpretarse de más de
una manera; (d) Evitar las declaraciones que carezcan de interés respecto
al objeto psicológico en estudio; (e) Evitar las declaraciones que pueden
ser apoyadas por casi todos o por nadie; (f) Seleccionar declaraciones que
se crea abarcan todo el campo de la escala afectiva de interés; (g)
Mantener el lenguaje de las declaraciones sencillo, claro y directo; (h) Las
declaraciones deben ser cortas, pasando rara vez de las 20 palabras; (i)
Cada declaración debe contener solamente un pensamiento completo; (j)
Evitar los conceptos universales, como todos, siempre, ninguna, nunca;
(k) Las palabras tales como solamente, justamente, simplemente... deben
utilizarse con cuidado y moderación, en la escritura de las declaraciones;
(l) Siempre que sea posible, las declaraciones deben ser en forma de frase
sencilla, más bien que frases compuestas o complejas; (m) Evitar el uso
de palabras que puedan no ser comprendidas; y (n) Evitar el uso de
negativos dobles... (p. 38)
79
hacia el objeto y la otra mitad en sentido desfavorable, (f) En la formulación de los
enunciados debe considerarse los tres componentes de la actitud: el cognoscitivo,
afectivo y conductual. Tomar en cuenta esta exigencia es indispensable, porque la
actitud està compuesta por esos tres componentes. Al excluir uno de ellos, no se
estudiará la actitud en forma completa, sino que se delimitaría sólo al componente
tomado en cuenta, (g) Los ítems que conforman el instrumento no deben colocarse en
un orden preestablecido, sino que debe implementarse un procedimiento aleatorio
para garantizar la aleatoriedad en la colocación de los mismos.
Asimismo, el instrumento debe someterse al análisis de validez; el cual puede
ser validez de contenido, de criterio (predictiva y concurrente) y de constructo
(validez convergente y divergente). El tipo de validez comúnmente aplicado es la
validez de contenido a través del juicio de expertos. Sin embargo, este tipo de validez
no es suficiente, por lo que es recomendable en lo posible someter al instrumento a
otro tipo de validez. Por último, es importante mencionar que antes de la aplicación
definitiva del instrumento, debe realizarse una prueba piloto, lo cual permitirá: (a)
realizar el análisis de discriminación de los ítems, (b) realizar el análisis de validez de
criterio y de constructo, y (c) análisis de confiabilidad del instrumento, el cual se
puede realizar a través de reaplicación de la prueba, aplicación de pruebas
equivalentes y la consistencia interna del instrumento.
80
2. Reacción de estímulos estructurados parcialmente: Esta técnica es similar a
las técnicas de informe de sí mismo (donde se incluyen las escalas de números), pero
tiene las siguientes características que lo diferencian de los informes de sí mismo: (a)
la intención es encubierta, porque se oculta al sujeto el verdadero objetivo del
instrumento, (b) “hace creer al sujeto que no hay respuestas correctas e incorrectas,
pues cualquier respuesta es aceptable”, y (c) el formato del instrumento es de
respuestas libres donde el sujeto debe elaborar las respuestas sin ayuda del
investigador.
3. Reacciones fisiológicas: “La técnica de reacciones fisiológicas descansa en
las teorías del aprendizaje. La mayoría de las respuestas son susceptibles de
condicionamiento” (p. 23). Summers expresa, tomado de Cook y Selltiz que “la
mayoría de las medidas de reacción fisiológicas indican solamente el grado de
activación y no la dirección del sentimiento” (p. 23)
4. Tareas dirigidas: En estas técnicas se instruye al sujeto para que realice
determinadas tareas y se le hace creer que se le está examinando por ejemplo sus
aptitudes; pero en realidad lo que persigue el investigador es escudriñar sus
reacciones ante determinadas situaciones. Esta técnica, como la de reacción de
estímulo estructural parcialmente, fundamenta su éxito en el engaño al sujeto a quien
se pretende medir su actitud.
Las objeciones a estos instrumentos para medir actitudes, favorece el uso de los
informes sobre sí mismo, los cuales se implementan a través de las escalas de
números, concluyéndose que los mismos pueden complementar el uso de los
informes de sí mismo, sobre todo cuando se analiza la validez convergente del
instrumento.
81
los intereses según Aiken (1996) “...es un sentimiento o preferencia respecto de las
actividades propias...” (p.p. 230-231), los valores son “...la utilidad, importancia que
se da a las actividades u objetos particulares...” (p. 236) y las opiniones son definidas
por Aiken como “...una reacción específica ante ciertos sucesos o situaciones (...) son
similares a las creencias, en el hecho de que ambos son juicios o aceptaciones...” (p.
231). La motivación es la razón por la cual un organismo o persona realiza una
acción, la cual puede ser conciente o inconscientes A pesar de la interacción existente
entre estos conceptos, se observan las especificidades de cada uno, lo cual los
diferencia entre sí.
Ejercicios Propuestos
82
2.3 Diga a qué componente de la actitud pertenece cada ítem (Componente
Cognoscitivo, Afectivo o Conductual).
2.4 Apliquen entre los participantes de este curso el instrumento que están
analizando y calculen la actitud total promedio/sujeto
Procedimiento para calcular la actitud total promedio del grupo: Sume el valor
total de la actitud de todos los sujetos y divídalo entre el número de sujetos.
2.5 Determine la actitud promedio del grupo.
Procedimiento para calcular la actitud promedio del grupo: Divide la actitud
total promedio del grupo entre el número de ítemes (redondear al entero más
próximo)
Posibles resultados:
Que la actitud sea:
(1) Muy desfavorable
(2) Desfavorable
(3) Indeciso
(4) Favorable
(5) Muy favorable
N° Itemes
1 El Cáncer es curable si se diagnostica a tiempo.
5. Totalmente de acuerdo ____ 4. De acuerdo ____ 3. Indeciso:__
2. En desacuerdo ____ 1. Totalmente en Desacuerdo __
83
N° Itemes
3 Con el cáncer no hay prevención que valga.
5. Totalmente de acuerdo ____ 4. De acuerdo ____ 3. Indeciso ____
2. En desacuerdo ____ 1. Totalmente en Desacuerdo ____
84
Actitud del Docente de la Primera Etapa de Educación Básica hacia la
Evaluación
N° Itemes
1 Según el Currículo Básico Nacional (CBN) la evaluación cualitativa es el
mejor procedimiento de evaluación del alumno en la I etapa de Educación
Básica.
5. Totalmente de acuerdo ____ 4. De acuerdo ____ 3. Indeciso ____
85
Actitud de los alumnos hacia la geografía
ïtem Enunciado
1 La geografía no es una materia interesante
1) Totalmente de acuerdo, 2). De acuerdo, 3). Indeciso
4) En desacuerdo, 5). Totalmente en desacuerdo
2 La Geografía es una materia valiosa y necesaria
1) Totalmente de acuerdo, 2). De acuerdo, 3). Indeciso
4) En desacuerdo, 5). Totalmente en desacuerdo
3 Rara vez me gusta estudiar geografía
1)Totalmente de acuerdo, 2). De acuerdo, 3). Indeciso
4)En desacuerdo, 5). Totalmente en desacuerdo
4 Me interesa adquirir más conocimiento sobre geografía
1) Totalmente de acuerdo, 2). De acuerdo, 3). Indeciso
4) En desacuerdo, 5). Totalmente en desacuerdo.
5 A mi, la geografía me hace sentir incómodo.
1) Totalmente de acuerdo, 2). De acuerdo, 3). Indeciso
4) En desacuerdo, 5). Totalmente en desacuerdo.
6 No estoy dispuesto a leer más geografía después de cursar esta asignatura
1) Totalmente de acuerdo, 2). De acuerdo, 3). Indeciso
4) En desacuerdo, 5). Totalmente en desacuerdo
7 La geografía no tiene importancia en la vida diaria
1) Totalmente de acuerdo, 2). De acuerdo, 3). Indeciso
4) En desacuerdo, 5). Totalmente en desacuerdo
8 Cuando tengo que estudiar geografía me siento mal.
1) Totalmente de acuerdo, 2). De acuerdo, 3). Indeciso
4) En desacuerdo, 5). Totalmente en desacuerdo
9 La geografía ha contribuido al desarrollo de la civilización
1) Totalmente de acuerdo, 2). De acuerdo, 3). Indeciso
4)En desacuerdo, 5). Totalmente en desacuerdo
86
ïtem Enunciado
15 Disfruto estudiando geografía
1) Totalmente de acuerdo, 2). De acuerdo, 3). Indeciso
4)En desacuerdo, 5). Totalmente en desacuerdo
2) - Cuando alguien se porta mal conmigo, trato de reaccionar con calma y serenidad.
4) - Estoy dispuesto a perdonar porque esa es la única forma de superar los conflictos.
7) - Rompo relaciones con quien he tenido algún conflicto para evitar problemas mayores.
8) - Siento que no puedo contenerme cuando estoy de mal genio con alguien.
10) - La mejor forma de tener tranquilidad es evitar discutir con quienes tienen opiniones
diferentes.
87
Fuente: Cuestionario para reflexionar realizado por Cristina Villegas de Posada, Phd, profesora
titular. Departamento de Sicología Universidad de los Andes (Colombia). Con la colaboración de los
sicólogos : Javier Corredor, Carlina Maldonado, Lima Saldarriaga y Lauro Vega. Investigación; textos
y actividades: Constanza Orozco Vargas.
88
Referencias.
Suárez, J.A. (2.001) . Actitud del docente de la I etapa de Educación Básica hacia la
evaluación de acuerdo al currículo Básico Nacional. Trabajo de Grado de
Maestría no publicado, Universidad Pedagógico Experimental Libertador,
Instituto Pedagógico Luis Beltrán Prieto Figueroa, Barquisimeto.
Lecturas sugeridas
Suárez, J.A. (2.001) . Actitud del docente de la I etapa de Educación Básica hacia la
evaluación de acuerdo al currículo Básico Nacional. Trabajo de Grado de
Maestría no publicado, Universidad Pedagógico Experimental Libertador,
Instituto Pedagógico Luis Beltrán Prieto Figueroa, Barquisimeto. Se recomienda
del capítulo 2, Bases teórica; La actitud.
89
CAPÌTULO V
EL CUESTIONARIO Y LA ENTREVISTA
Objetivo
El Cuestionario
Definición
Tipos de Preguntas
90
Preguntas Basadas en Hechos
Preguntas de Opinión
Formas de Respuestas
La mayoría de los autores que publican libros sobre cuestionarios, señalan tres
formas de respuesta: las correspondientes a preguntas abiertas, cerradas y mixtas. Se
consideró necesario incluir una cuarta forma de respuesta abordada por autores como
Namakforoosh (2001) y Kerlinger (1998), quienes hablan de las escalas de
clasificación como una forma de pregunta. A continuación se explican cada una de
estas formas de respuestas:
91
Preguntas Cerradas
Preguntas Abiertas
Preguntas Mixtas
Se dice que una pregunta es mixta, cuando tiene una pregunta cerrada y otra
abierta. Esta última se formula para profundizar en la primera parte de la pregunta, es
decir, en la pregunta cerrada. Ejemplo: ¿Participa usted en las actividades que se
realizan en el plantel donde estudian sus representados?:
92
5.- Siempre: ____ 4.- Casi siempre: ____ 3.- A veces: ____ 2.- Rara vez: ____
1.- Nunca: ____.Si responde “rara vez” ó “nunca”, preguntar ¿Por qué?:
____________________________________________________________________.
Los autores mencionados (Namakfoosh y Kerlinger) no incluyen las preguntas
mixtas dentro de las formas de pregunta, sin embrago hay muchos autores que las
consideran dentro de la clasificación de preguntas en los cuestionarios. De ahí que se
decidió incluirla como una de las formas de respuesta correspondiente a los
cuestionarios.
Escalas de Clasificación
93
El análisis de discriminación y el cálculo del coeficiente de confiabilidad, como
se analizará en los capìtulos IX y X respectivamente, exigen clasificar los puntajes de
los sujetos en forma jerárquica, de aquél que obtuvo el mayor puntaje hasta el que
obtuvo el menor puntaje, procedimiento que no es adecuado realizarlo en variables en
escala de mediciòn ordinal.
Cuando se aborde la diferencia entre cuestionarios de opinión y escalas de
actitud, análisis de ítemes y confiabilidad se comentarà nuevamente este aspecto, ya
que es usual aplicar a cuestionarios de opinión, con preguntas en escala de
clasificación, el análisis de discriminación y confiabilidad.
Los criterios más usuales que los expertos formulan para la elaboración de
cuestionarios son los siguientes:
1. Las preguntas deben ser lo más sencillas posibles, y más aún, si los
respondientes son personas de bajo nivel de instrucción.
2. Las preguntas no deben contener más de 25 palabras.
3. La pregunta debe contener una sola idea o sentencia lógica, porque cuando
una pregunta tiene más de una idea, el “encuestado” puede tener respuestas
diferentes para cada una de ellas.
4. Se debe evitar preguntas ambiguas que pueden ser respondidas de diferentes
maneras.
5. Se debe evitar preguntas con estereotipos, al menos que el propósito del
cuestionario sea determinarlos.
6. En las preguntas abiertas se debe dejar suficiente espacio para que el
respondiente pueda escribir la respuesta completa.
94
Pasos para la Construcción de un Cuestionario
95
Revisión de la literatura de cuestionarios que midan las mismas variables
que pretendemos medir en al investigaciòn
Aplicación
definitiva del
cuestionario
Gráfico 2. Pasos para la construcción de cuestionarios.
10. Antes de obtener la versión definitiva del cuestionario, hay dos pasos: uno,
es la codificación de preguntas abiertas si se recoge en la muestra piloto la
información suficiente para cerrarlas, de lo contrario debe tratar de cerrarlas después
de aplicar la muestra definitiva. También en el caso de preguntas abiertas, se puede
96
realizar un proceso cualitativo, a través de la categorización de las respuestas. El otro
paso es decidir el contexto en el cual se aplicará el cuestionario para superar y estar
alerta ante posibles situaciones problemáticas que pudieran afectar la aplicación
definitiva del cuestionario.
11. Por último, está la aplicación definitiva del cuestionario, donde se recabará
la información requerida por la investigación en proceso.
4. Municipio: Código:
5. Parroquia: Código:
6. Edad:
1. 18 a 23 años: _____
2. 24 a 29 años: _____
3. 30 a 39 años: _____
4. 40 a 49 años: _____
5. 50 a 59 años: _____
97
6. Mayor de 60 años: _____
4. Profesor/Lic. en educación:_____
3. Tec. Sup. Educ.: _____
2. Maestro/Br. Doc.: _____
1. No graduado: _____
1. Menos de 05 años:_____
2. 0 5 a 10 años: _____
3. 11 a 15 años: _____
4. 16 a 20 años: _____
5. Más de 20 años:_____
98
transformó de una escala de razón, como realmente es, a una escala ordinal, por
último está, el grado que administra el docente, el cual se puede asumir en forma
ordinal, pero en este caso hay una alternativa de respuesta: varios grados, que no
permite medir en forma ordinal esta variable. Debe tomarse entonces como nominal.
Determinar la codificación de acuerdo a la escala de medición de la variable, es
un paso en la construcción de instrumentos, imprescindible de establecer; porque de
esta fase depende el uso adecuado o inadecuado que se puede dar al tratamiento
estadístico de la variable en estudio. Cuando la variable es nominal cualquier número
que se asigne es indiferente. La regla sólo exige asignar números diferentes a cada
una de las alternativas que deben ser mutuamente excluyentes; pero a partir de escalas
ordinales en adelante el código depende de la alternativa de respuesta. En este caso se
debe asignar el código menor a la alternativa que representa el rango o el nivel
inferior de la variable en estudio. Ejemplo, en el caso del nivel profesional, se le
asigna 1 al docente no graduado por ser este el nivel profesional inferior, mientras
que al profesor o licenciado en educación se le asigna la calificación más alta (4),
porque es la alternativa que representa el nivel profesional superior.
99
En cuanto a la actitud, en la Unidad IV se definió como la predisposición que
tiene una persona de creer, sentir y actuar hacia otra persona u objeto. De acuerdo a
esta definición, en la actitud están involucradas las creencias y percepciones, los
sentimientos y la predisposición a actuar frente al objeto de estímulo de la actitud.
También la actitud a diferencia de las opiniones, tiene direccionalidad, porque
permite determinar si una persona tiene una actitud alta o baja, hacia el objeto que
origina la actitud. En el caso de las opiniones no se puede hablar de direccionalidad o
intensidad de las opiniones. Ellas sólo se pueden considerar como opiniones que
tienen un sujeto o grupos de sujetos sobre un determinado tópico o situación.
A continuación se presentan los comentarios de Anastasi y Urbina (1998) sobre
las escalas de actitud y los cuestionarios de opinión:
…las encuestas de opinión implican respuestas a preguntas específicas
que no necesitan ser relacionadas, las respuestas a dichas preguntas se
mantienen separadas en lugar de combinarlas en una calificación total.
Por ejemplo, una encuesta de opinión aplicada a empleados podría incluir
preguntas sobre los programas de trabajo, la forma de pago, los beneficios
adicionales, la cafetería de la compañía y las relaciones con los
supervisores; cada uno de esos reactivos se incluye por su importancia
intrínseca para el mejoramiento de las relaciones con los empleados, por
lo que las respuestas a cada pregunta se tabulan en forma separada para
identificar las fuentes de satisfacción e insatisfacción de los trabajadores.
(p. 405)
100
aquellos cuestionarios de opinión de preguntas con las mismas alternativas de
respuestas. Es incorrecto realizar un análisis sumando los códigos de todas las
alternativas de respuestas para posteriormente promediar y obtener una sola
puntuación. Los cuestionarios de opinión, como ya se mencionó, miden variables en
una escala de medición nominal, la cual no permite realizar ninguna operación
aritmética y menos el uso de promedios.
La Entrevista
Definición
Tipos de Entrevistas
Entrevista Estructurada
101
realiza sobre la base de un formulario previamente preparado…”. (Ander-Egg, 1980,
p. 174)
Para Padua (1979):
“…la entrevista estandarizada (en este caso equivale a la entrevista
estructurada) y los cuestionarios son prácticamente la misma cosa,
solamente que se habla de entrevista estandarizada en situaciones en los
que el cuestionario se aplica por un entrevistador que leerá las preguntas a
un respondiente. Las preguntas son presentadas exactamente como
figuran en el cuestionario y en su mismo orden…” (p. 17)
La entrevista no Estructurada
102
Formulario de Preguntas
Guía de Entrevista
Tema de Entrevista
Ejercicios Propuestos
103
2.2. ¿Usted asiste a las reuniones de padres y representantes realizadas en la escuela
donde estudian sus hijos?
Siempre: ____
Casi siempre: ____
A veces: ____
Rara vez: ____
Nunca: ____
2.3. ¿En cuál zona de la ciudad está residenciado?
Este: ____
Norte: ____
Sur: ____
Oeste: ____
Fuera de la ciudad: ____
2.4. ¿Cuál es el nivel de ingresos mensual de su familia?
Menor a 190.000 ____
190.000 a 400.000 ____
400.001 a 600.000 ____
600.001 a 800.000 ____
800.001 a 1.000.000 ____
1.000.001 a 1.500.000____
1.500.001 a 2.000.000____
Superior a 2.000.000 ____
2.5. ¿Cómo considera usted la evaluación de acuerdo al Currículo Básico Nacional
para la I y II etapa de Educación Básica? ( corresponde a una pregunta de un
cuestionario de opinión)
Mejor que la anterior: ____
Igual a la anterior: ____
Peor a la anterior: ____
Indeciso: ____
104
2.6. ¿Hace falta una estrategia instruccional innovadora para la asignatura matemática
de tercer grado de Educación Básica? (corresponde a un cuestionario de opiniòn)
Totalmente de acuerdo: ____
De acuerdo: ____
Ni de acuerdo ni en desacuerdo: ____
En desacuerdo: ____
Totalmente en desacuerdo: ____
2.7. ¿Cuáles son las condiciones de infraestructura del plantel donde usted trabaja?
Óptimas: ____
Buenas: ____
Regulares: ____
Pésimas: ____
2.8. ¿Cuál es su satisfacción por el funcionamiento del programa Escuelas
Bolivarianas en el plantel donde trabaja? (corresponde a una escala de satisfacción)
Muy satisfecho: ____
Satisfecho: ____
Ni satisfecho ni insatisfecho: ____
Insatisfecho: ____
Muy insatisfecho: ____
3. Seleccione un tema a investigar para aplicar una entrevista focalizada y
diseñe el instrumento apropiado para la recolección de información.
105
Referencias
Aiken, L. (1996) Test psicológicos y evaluación. México: Prentice Hall.
Lecturas Sugeridas
Aiken, L. (1996) Test psicológicos y evaluación. México: Prentice Hall. Capítulo 8:
Intereses, actitudes y valores. El apartado que trata las actitudes y los intereses.
Anastasi, A., y Urbina, S. (1998). Test psicológicos. México: Prentice Hall. Capítulo
9. Medición de intereses y actitudes. El apartado que corresponde a encuestas de
opinión y escalas de actitud.
106
CAPÌTULO VI
LA OBSEVACIÒN
Objetivo
Definiciòn
107
no estructurada, si la observación la realizará en forma individual o grupal, y por
último, si será una observación en la vida real (caso de las ciencias sociales y la
educación) o de laboratorio (caso de las ciencias fácticas), y (e) Definir los
instrumentos y medios de observación, los cuales permitirán al observador obtener la
información y los datos del fenómeno o problema en observación.
Modalidades de Observación
108
Observación no Participante
Observación Participante
Puede ser realizada por una sola persona o por un grupo de observadores. Es
conveniente cuando se aplica la técnica de la observación que la misma sea realizada
por más de una persona; porque de esta manera se puede contrastar lo observado
entre el grupo de observadores y suprimir cualquier sesgo presente en el proceso de
observación.
109
Según el Lugar donde se Realiza la Observación
110
5. Seleccionar los instrumentos con los cuales se registrará la información y
datos a recoger. Se debe precisar antes de realizar la observación cuáles son los
instrumentos más recomendados para realizar la observación.
6. Deben tomarse en cuenta los problemas operativos que pueden surgir en el
proceso de la observación, tales como traslado al lugar, pernocta, material e
instrumentos de registro como cámara fotográfica y de video, grabador, libreta,
lápices, etc. La ausencia de algún instrumento de registro puede afectar
considerablemente la recogida de datos producto de la observación.
7. Establecer empatía con el grupo sujeto al estudio, para facilitar la
comunicación entre el observador y la comunidad donde se realizará la observación.
8. Cuando se llegue a la comunidad donde se realizará el estudio, se debe ubicar
a los informantes claves; quienes orientarán al investigador sobre aspectos que éste
desea observar.
9. Se debe registrar en el momento o lo más pronto posible lo observado para
evitar el olvido. Para ello debe grabarse escenas, escribir en el cuaderno de nota o en
cualquier otro dispositivo electrónico o manual seleccionado para cada oportunidad
específica.
El Diario
Registro anecdótico
111
Ejemplo de Registro Anecdótico
Alumno: Edad:
Sexo: Grado: Sección: Fecha: Hora:
Incidente:
Interpretación:
Conclusión:
112
Ejemplos de listas de cotejo
Lista de Control para ser usada por maestros especializados en dificultades del
aprendizaje.
(Uso colectivo)
Curso: Fecha:
Observador:
Instrucciones: identifique con un signo de cotejo los desórdenes que ha observado en
cada uno de sus alumnos.
Alumnos
1 2 3 4 5 6 7 8 9 10
Hiperactividad
Disfunciones percepto-motoras
Bajo nivel de motivación
Dificultades de coordinación
general
Desórdenes de la atención
Impulsividad
Desórdenes de la memoria
Desórdenes del pensamiento
Desórdenes del lenguaje
Desórdenes de la audición
Desorganización lógica
Dificultades en la lectura
Dificultades en la escritura
Dificultades en el silabeo
Dificultades en el cálculo
113
Lista de Control para ser usada por maestros especializados en dificultades del
aprendizaje.
(Uso individual)
Nombre del alumno: Sexo: Edad:
Fecha: Curso:
Instrucciones: identifique con un signo de cotejo los desórdenes que ha observado en cada uno de sus
alumnos.
Hiperactividad
Disfunciones percepto-motoras
Bajo nivel de motivación
Dificultades de coordinación general
Desórdenes de la atención
Impulsividad
Desórdenes de la memoria
Desórdenes del pensamiento
Desórdenes del lenguaje
Desórdenes de la audición
Desorganización lógica
Dificultades en la lectura
Dificultades en la escritura
Dificultades en el silabeo
Dificultades en el cálculo
Cuaderno de Nota
Es una libreta, o que hace las veces de ella, donde el observador realiza
anotaciones relevantes o de interés sobre situaciones que observa y considera que
pueden aportar a la investigación.
Escalas de Estimación
114
calificado a categorías o espacios continuos que tienen valores numéricos asignados a
ellas…” (p. 502). Al respecto Busot (1980) expresa que “…las escalas valorativas
son cuestionarios especiales que incrementan la cantidad de información al registrar
no sólo la presencia o ausencia de un rasgo, sino además su frecuencia, nivel o
intensidad…” (p. 215)
Muy Poco
Excelente satisfactorio Satisfactorio satisfactorio Deficiente
Necesita
coger
Salta enormes Sólo salta Se estrella No sabe
impulso
CALIDAD edificios de un pequeños contra los distinguir los
para saltar
solo brinco. edificios. edificios. edificios.
altos
edificios
Tan veloz Algo más Sólo puede Se hiere con
Es más veloz
RAPIDEZ como una lento que disparar sus propias
que una bala.
bala. la bala. balas. balas.
Más fuerte que Más fuerte Más fuerte Tiene que
INICIATIVA una que un que un dispararle Huele a toro.
locomotora. elefante. toro. al toro.
Camina
EJECUTORIA
Usa el Busca el
Camina sobre sobre el Usa el
agua sólo agua en
ADAPTACIÓN el agua agua en agua para
para casos de
frecuentemente. casos de lavarse.
beberla. emergencia.
emergencia.
Pierde
Discute cuando
Habla con los Habla con Se habla a
COMUNICACIÓN consigo discute
dioses. los ángeles. sí mismo.
mismo. consigo
mismo.
Se mueve Se mueve
Se mueve entre Se mueve Se mueve
entre detrás de
RELACIONES dueños y altos entre los entre la
ejecutivos una
ejecutivos. empleados. competencia.
medios. escoba.
Se Se Se
Muy brillante Muy tonto
preocupa preocupa preocupa
PLANIFICACIÓN para para
por el por el por el
preocuparse. preocuparse.
futuro. presente. pasado.
115
Mapas
116
Ejercicios Propuestos
117
Referencias
Lecturas Sugeridas
118
CAPÌTULO VII
TÉCNICAS E INSTRUMENTOS DE RECOLECCIÓN DE DATOS
CUALITATIVOS
Objetivo
Proporcionar al estudiante las herramientas básicas para aplicar instrumentos
cualitativos
A Manera de Introducción
119
a las técnicas e instrumentos de recolección de datos usados. Es por esta razón que se
explican las técnicas e instrumento de recogida de datos, tomando en cuenta el
método de investigación.
En el caso de las técnicas e instrumentos de investigaciones etnográficas, se
desarrolla su explicación tomando como referencia dos autoras, Goetz y LeCompte,
quienes representan una corriente etnográfica en Educación con presencia y
seguidores a nivel mundial. En Investigación-Acción, su explicación se fundamenta
en Gloria Pérez Serrano, exponente hispana de este método; quien ha publicado
varios textos sobre investigación cualitativa e Investigación-Acción.
120
A continuación se explican las técnicas correspondientes a cada uno de ambos
métodos.
Técnicas Interactivas
Goetz y LeCompte señalan tres (3) estrategias de recogida de datos con técnicas
interactivas en los estudios etnográficos. A continuación se explican:
Observación Participante
Entrevista Cualitativa
121
adopta las siguientes modalidades: entrevista a informantes claves y biografías o
historias profesionales.
Se explican a continuación ambas formas específicas de la entrevista:
122
mucha interferencia (que impedía escuchar bien) proveniente de la parte trasera del
aula, donde está un patio y en ese momento se encontraban jugando algunos niños.
En el caso de la madre la interferencia de la entrevista fue aún mayor, porque en
el interior del aula, además de nosotros (entrevistador y entrevistado) se encontraban
sus dos últimos hijos; quienes durante el tiempo que duró la entrevista se dedicaron a
pelear y a mover los pupitres, y en el exterior, cercano al aula, se efectuaba una
reunión de padres y representantes con el Director y el medio para comunicarse era
un altoparlante que impedía una nítida audición de la entrevista. La entrevista de la
maestra orientadora se realizó en su oficina, donde constantemente entraban y salían
niños que estaban ordenando la oficina. Ellos en cada momento se dirigían a la
orientadora para consultar sobre la ubicación de un determinado objeto. Su tono de
voz era sumamente bajo, lo cual dificultó escuchar del grabador con precisión muchas
palabras y frases que ella expresó.
En conclusión se puede decir que las condiciones bajo las cuales se realizaron
las entrevistas no fueron las más adecuadas; pero realizarlas en otro sitio era muy
difícil y más cuando en nuestro caso el tiempo fue un factor apremiante.
123
(subcategorías: música, televisión y deportes); y 8. Valores (subcategorías: éticos o,
morales, culturales, religiosos y juicios de valores).
1. Categoría Nº 1
Actuación agresiva: es un sentimiento inamistoso (hostil) de una persona hacia
otra(s) que la rodean. Ese sentimiento puede expresarse de tres (3) formas
(subcategorías): verbal (palabras agresivas), físico (atropello o daños a la integridad
física de una persona) y gestual (cuando el sentimiento se realiza a través de gestos,
ejemplo, con los ojos, ademanes o movimientos de las manos).
2. Categoría Nº 2
Actuación pacífica: es cuando la actuación de la persona es en forma tranquila
y manifiesta ser amante de la paz. Puede expresarse a través de las siguientes formas
(subcategorías): verbal (cuando su expresión oral se realiza en forma tranquila, sin
insultos y con gran serenidad), gestual (cuando en los gestos que realiza no expresa
sentimientos inamistosos, sino que refleja tranquilidad y paz) y física (cuando nunca
atenta contra la integridad física de otra persona).
3. Categoría Nº 3
Contexto: es el medio físico, social y psicológico, donde actúa el
preadolescente sujeto a estudio. En la investigación se identificaron tres (3) contextos
(subcategorías): escolar (circunscrito al ambiente escolar, no sólo al espacio interno
de la escuela, sino todo aquello que rodea el entorno inmediato de la misma), vecinal
(se refiere al contexto donde el alumno vive, es decir, al barrio, urbanización, sector o
caserío) y familiar (se refiere a todos los acontecimientos que suceden en la vivienda
o familia, donde el alumno vive o pertenece).
4. Categoría Nº 4
Enamoramiento y Relaciones sexuales: esta categoría se divide en dos
subcategorías: enamoramiento y relaciones sexuales, la primera, el enamoramiento se
refiere cuando el alumno siente un sentimiento de atracción hacia otra persona; y la
segunda, relaciones sexuales, cuando el alumno practica el coito.
5. Categoría Nº 5
124
Normas: Son reglamentos o preceptos con la finalidad de instaurar el orden o la
disciplina. Las mismas en nuestro caso se refieren al hogar o a la escuela
(subcategorías).
6. Categoría Nº 6
Rendimiento escolar: se refiere a las calificaciones que el alumno obtiene en
los procesos de evaluación que se le realizan. En el presente trabajo se distinguen tres
subcategorías: alto rendimiento, que son alumnos con calificaciones excelentes y
buenas (entre 16 y 20 puntos); rendimiento medio, que son alumnos con rendimiento
satisfactorio o regular (entre 12 y 15 puntos); y rendimiento bajo, cuando los alumnos
obtienen calificaciones inferiores a los 12 puntos.
7. Categoría Nº 7
Tiempo Libre: es la utilización del tiempo por el alumno cuando no está en
actividades escolares. En este caso en particular se distinguieron cinco (5)
subcategorías: música, televisión, deporte, videos (nintendo, ataris, juegos por
computadoras, etc.) y juegos tradicionales (metras, papagayos, ladrón librado, etc.)
8. Categoría Nº 8
Valores: son las apreciaciones que tiene una persona sobre otra persona, objeto,
evento, hecho, etc. En esta investigación se dividieron (subcategorías) en: valores
éticos o morales (cuando el valor se refiere a la adaptación a las costumbres de una
sociedad, comunidad o grupo social con el cual se convive), culturales (cuando se
aceptan los valores por tradición familiar o de la comunidad donde vive) y juicios
individuales (cuando una persona emite una opinión o apreciación sobre un individuo
en particular).
Segundo Análisis: Patrones
Alumno
Pág. 1. Línea 26: ...no, es que las hembras son las más peleonas.
Pág. 2. Línea 28: Son más chismosas que los varones.
Pág. 2. Línea 32: Por nada, porque ellas son las peores.
Pág. 3. Línea 56: Las hembras son las más malablá.
Pág. 5. Línea 122: Esos son pa’ las hembras.
125
Pág. 7. Línea 182: Porque se lo cuentan a otras y ellas las traicionan. Es que las
hembras son muy chismosas.
126
- I: ¿Y si es fuera de la escuela?
- A: Ah, hay peleo. Aquí en la escuela no, porque me pueden expulsar.
- I: Y en la calle, ¿qué haces?
- A: Le caigo a golpes.
Madre del Alumno
Pág. 10. Líneas 258 y 259
Pág. 13. Líneas 340, 341, 342, 343 y 344
- ...No era que llegaba pelao a maltratarme a mi o maltratarlos a ellos...
- ...¡Claro!, cuando él les pegaba era por algo.
- ¿Cómo era su esposo?
- ¡El!, ¡él era apretao!
- ¿Perdía el control?
- No, bueno él poco le pegaba; pero cuando le daba eran pocos golpes, pero
bien asentaos...
- ¡Le pegaba!, Juan José sabe que lo marcaba.
Pág. 11. Líneas 291 y 293
- ...El me dice mamá ayúdame y yo le digo te voy a ayudar... (hacer sus tareas)
- ...Además con qué tiempo le voy ayudar...
- Pág. 12 . Líneas 317, 318, 319, 320, 322 y 323
- ¿Cómo reacciona usted ante una agresión en contra de sus hijos?
- Cónchale, me siento mal, como ellos son tan inquietos. El otro día una niñita
golpeó a Agustín, el más menor, ¡Claro! Fue porque él en una oportunidad le había
echado una cachetada a
- la niñita y salió corriendo...
- ...¿cómo... voy yo a reclamar?...
Maestra Orientadora
- No se determinaron dilemas en la entrevista
127
Entrevista sobre el comportamiento de escolares preadolescentes
(Continuación)
Categorización Línea Texto Pág. 14
361. M: En realidad que no; pero si lo he pensado, porque yo ya no sé como corregirlo.
362. I: De nuevo le doy las gracias por dedicar su tiempo a conversar conmigo, sin duda que sus
363. respuestas nos ayudarán mucho para el trabajo que estamos haciendo. ¡Muchas gracias!
364. M: No hay de que, gracias a usted por preocuparse por mi hijo.
(3) Maestra de la U.E. Stella Cechini, con una larga trayectoria tratando niños con problemas
de aprendizaje y de conducta. Lugar de la entrevista en la propia escuela. Código: 1.3.
365. I: ¿Usted trabaja conjuntamente con los Núcleos Integrados de Bienestar Estudiantil (NIBES) y con
Rapport 366. la Dirección de Educación (el Departamento de Educación Especial)?
367. M: Bueno, nosotros (los maestros en educación especial) dependemos de Educación Especial. Nos
368. anexan a una escuela.
369. I: ¿Usted esta adscrita a esta escuela?
370. M: Si, aquí a la Stella Cechini.
371. I: Además de esta escuela, ¿trabaja en otra?
372. M: No, trabajo sólo en esta escuela.
373. I: Ha realizado cursos... (interrumpe)
374. M: Si, constantemente las maestras de educación especial recibimos varios talleres.
375. I: Sus funciones en esta escuela, ¿cuáles son?
376. M: Bueno, yo trabajo directamente con los niños que están en los salones y tengan dificultades en el
377. aprendizaje, desde preescolar hasta sexto.
378. I: ¿Usted trabaja conjuntamente con los NIBES?
379. M: Si, nosotros enviamos los casos allá para que ellos los evalúen.
Valores (morales) 380. I: ¿Qué opinión tiene usted de los muchachos de esta escuela?
381. M: El problema de los niños de aquí es la rebeldía. Para explicar esto tiene que partirse desde el
382. hogar. Los problemas de conducta vienen en si del hogar, por ejemplo, allá afuera está una madre
383. que tiene su hija aquí y viene hablar conmigo, porque su hija está muy rebelde y no le hace caso.
384. I: ¿Qué edad tiene la niña?
385. M: 11 años.
128 Continúa
Entrevista sobre el comportamiento de escolares preadolescentes
(Continuación)
Categorización Línea Texto Pág. 15
386. I: ¿Qué hace la niña?
387. M: Bueno, yo veo que el principal problema es que sus padres son evangélicos y la niña dice que no
388. le gusta esa religión, que ella es católica. En el caso del mal comportamiento usted no puede
389. quedarse en una sola parte, sino que la información hay que buscarla en los padres, el maestro, sus
390. amigos y los propios niños, de por qué se comportan de una determinada manera, yo considero que
391. al evaluar el comportamiento de un niño, hay que considerar, primero, el hogar, eso en primer lugar,
392. y después la escuela, el sector donde vive, con quien anda. Todo eso influye en el comportamiento
393. de los niños.
394. I: Casos de mal comportamiento... (interrumpe)
395. M: ¿Qué yo recuerde?
396. I: Si, que para usted fueron difíciles de resolver.
Normas (escuela) 397. M: Mira, yo desde el año 85 tengo eso (señala hacia un estante) un libro, allí llevo todos los casos
398. con problemas de conducta.
399. I: ¿Qué hace para resolver un caso de mala conducta o mal comportamiento?
400. M: Mire le voy a responder con un caso de un niño con indisciplina marcada. Era el líder y todos
401. los demás niños le seguían. Hacían lo que él hacía. Todos sabían que él era el culpable, pero nadie
402. lo acusaba. La maestra de esa sección, dijo que si no lo expulsaban, entonces era ella la que se iba;
403. pero ¿cómo lo expulsábamos?, si nadie lo acusaba.
404. I: Pero, ¿qué era lo que hacía?
405. M: Bueno, “tiraba la piedra y escondía la mano”. Tiraba papeles a la maestra, hacía ruidos cuando
406. la maestra estaba escribiendo en el pizarròn.
407. I: ¿Qué edad tenía el niño?
408. M: 10 años. Entonces yo los llamé (a todos los alumnos de la sección) uno por uno y les hice firmar
409 un acta donde ellos se comprometían a portarse bien o sino todos iban a ser expulsados. Muchos de
410. ellos a mi me confesaron que él era el culpable; pero le tenían miedo, porque él después se iba a
411. vengar. Hablé con él y le dije: “yo tengo testigos que tu eres el culpable de todo lo que está pasando
412. en la sección y si tú no te comportas bien, entonces tú serás expulsado”. Pues ese fue el santo
413. remedio. A partir de esa conversación que tuve con ese niño, ya no volvió a molestar a
129 Continúa
Entrevista sobre el comportamiento de escolares preadolescentes
(Continuación)
Categorización Línea Texto Pág. 16
414. la maestra.
415. I: Las cartas de buena conducta ¿en dónde se tramitan?
416. M: Por la Dirección.
417. I: Si, pero el Director para otorgar las cartas de buena conducta ¿consulta con usted?
418. M: No, con la maestra del niño que solicita la carta de buena conducta.
419. I: Pero, si el alumno tuvo problemas no en el año que cursa, sino en años anteriores.
420. M: No, para otorgar la carta de buena conducta se toma en cuenta el año que está cursando o acaba
421. de cursar.
422. I: ¿Cuál cree usted que es la causa de niños... (interrumpe).
423. M: ¿Con problemas de conducta?
424. I: Sí.
Valores (morales) 425. M: Esos niños vienen de un hogar todo desintegrado y las consecuencias las vemos después en la
426. calle, cuando aparecen en la prensa, donde la mayor parte de los delitos son cometidos por
427. adolescentes. Aquí en la escuela hay problemas de conducta, pero también en otras escuelas los hay.
428. Esto se ha generalizado en toda la educación.
429. I: ¿Considera usted que el mal comportamiento en esta escuela está desbordado?
430 M: No, desbordado no. Hay problemas que se han presentado, los oriento como deben abordar el
431. problema de su hijo o alumno; pero en si los problemas de conducta radican en el hogar.
432. I: ¿Ha enviado algunos niños a consultas psicológicas?
Normas (escuela) 433. M: Sí, al Seguro, la Cruz Roja.
434. I: ¿Quién recomienda remitir a consultas... (interrumpe)
435. M: La persona que se siente capaz de hacerlo: yo, la maestra del alumno, el director.
436. I: ¿La escuela lleva estadísticas sobre niños que tienen problemas de conducta, sobre las citaciones
437. que le hacen a los padres por mal comportamiento o bajo rendimiento?
438. M: No, estadísticas no; pero un maestro de aula, puede saber cuántos niños son los que tienen mala
Valores (culturales) 439. conducta. La mayoría de los casos se dan entre cuarto y sexto, porque en estos grados los niños
440. entran a una edad preadolescente y se creen más independientes. Quieren explorar. Comienzan a
441. enamorarse. Se siente que ya pueden actuar, como si fueran mayores de lo que son.
130 Continúa
Entrevista sobre el comportamiento de escolares preadolescentes
(Continuación)
Categorización Línea Texto Pág. 17
442. Están en una etapa muy difícil que exige por parte de los padres y el maestro mucho cuidado para
443. poder orientarlo por un camino no equivocado. En esta etapa, donde los niños tienen entre 9 y 13
444. años, es que realmente ellos necesitan orientación y vigilancia.
445. I: La información de la cual dispongo a través de la profesora Lucía, es que usted tiene muchos
446. años de experiencia, tratando niños con problemas de aprendizaje, conducta o comportamiento. Yo
447. quisiera que usted estableciera una comparación de niños de estas edades que usted mencionó y que
448. son niños preadolescentes, porque están en una edad de transición entre la infancia y la
449. adolescencia. La comparación sobre la cual yo estoy interesado sobre preadolescentes, por ejemplo,
450. de la década de los sesenta, ochenta y noventa.
Valores (culturales) 451. M: ¡Nooo!, como no, son comportamientos muy diferentes; pero muy diferentes. ¡Mire!, antes el
452. mayor pecado que podía cometer el alumno más rebelde, era pegarle chicle en la silla del escritorio
453. del maestro ¡A mí me lo hicieron!; pero ahora uno tiene que tener cuidado, porque el niño que uno
454. menos piensa puede amenazarlo con un arma blanca y hasta de fuego. Son conocidos los casos de
455. alumnos que han amenazado y hasta matado a su maestro por un problema de nota o de que éste le
456. llamó la atención. Son situaciones realmente muy diferentes. Los niños de ahora parece que nacen
457. aprendidos. ¡Mire!, yo ya he perdido mi capacidad de asombro de saber lo que sabe un niño de esa
458. edad. ¡Mire! De sexo sabe hasta el más mínimo detalle. Son niños que se les inculca más violencia a
459. través de programas de televisión, que en esto los padres tienen mucha responsabilidad, porque
460. deberían ayudar a sus hijos a seleccionar los mejores programas, que los hay, a través de la
461. televisión por cable hay muy buenos programas educativos. En conclusión el muchacho de hoy
462. maneja mucha más información que niños de la década de los sesenta, setenta y ochenta no
463 manejaban. No se sorprenda cuando le digo que estos niños de ahora manejan muchas veces más
464. información que nosotros que somos profesionales.
465. I: Profesora la entrevista ha terminado, muchas gracias, le estamos muy agradecidos por su valiosa
Valores (morales) 466. información. Si quiere agregar algo más, se lo agradezco.
467. M: Mi área, es el aprendizaje, pero yo aprovecho mi función para analizar la conducta de muchos
468. niños. Casi siempre lo que ha pasado con niños con problemas de conducta, es porque vienen de
469. hogares de padres divorciados, padres irresponsables o padres que son muy borrachos. Allí radica
131 Continúa
Entrevista sobre el comportamiento de escolares preadolescentes
(Continuación)
Categorización Línea Texto Pág. 18
Rendimiento escolar (bajo) 470. el problema. Por ejemplo, yo estoy tratando un niño que rinde poco y yo llegué a la conclusión
Contexto (familiar)
471. que ese niño es así, porque presenció que su padre se ahorcó, pues eso causó una impresión muy
472. grande en el niño. Ese niño desde ese momento no puede ser el mismo. Eso lo marcará para toda
473. su vida y es allí donde el docente y el padre deben jugar un papel de orientador para que ese niño
474. supere su trauma.
475. ¡Mire! ya que la entrevista ha terminado ¿no podemos oír eso?
476. I: ¿Qué?, ¿cómo dice?
477. M: Que si no podemos oír lo que tú grabaste.
478. I: Sí, como no. Vamos a oírlo.
132 Continúa
Interpretación de la Entrevista
133
violencia en la televisión; siendo este medio comunicacional donde ellos pasan mayor
parte de su tiempo libre.
Encuestas
134
gráficas, técnicas verbales, recuerdos autobiográficos y técnicas de ejecución de
tareas.
Técnicas no interactivas
Observación No Participante
135
2. Kinesia y Proxemia. Para Goetz y LeCompte: “La Kinesia y la proxemia
estudian el movimiento corporal y los usos sociales del espacio (...) La incorporación
de registros observacionales centrados en aspectos proxémicos y kinésicos es
particularmente útil cuando el foco de la investigación es el uso del espacio del aula o
las pautas de la interacción profesor-alumno”. (p. 154)
3. Protocolos de análisis de interacción: Estos se componen por sociogramas,
sistemas estandarizados de clasificación de los comportamientos y otros instrumentos
que registren la forma como interactúan los participantes de la investigación.
136
Observación No Participante sobre el Comportamiento de Preadolescentes
137 Continúa
Observación No Participante sobre el Comportamiento de Preadolescentes
Continuación
Fases Línea Texto Pág. 2
27. presentaba al otro y viceversa. A mi me correspondió presentar a un niño de 11 años que consideré a
28. simple vista inteligente. Lucía me confirmó que era muy estudioso, hijo único y los padres
29. extremaban los cuidados sobre él. Cuando le dije en la conversación al niño que era sociólogo, me
30. preguntó ¿¡qué es eso!? ¿Cómo los psicólogos?, yo le respondí incómodo, pero sin demostrárselo,
31. esa pregunta que me han hecho muchas veces. Las presentaciones fueron muy jucosas. Algunos no
32. recordaban la información que le dio su pareja para que lo presentara, sobretodo cuando la pareja
33. era uno de nosotros. Hubo un niño, que Lucía clasificó entre los más indisciplinados y de bajo
34. rendimiento, que la información transmitida a su pareja (Moraima) fue la de un niño de excelente
35. rendimiento. Esto causó mucha risa entre sus compañeros.
Juegos 36. Como siguiente punto hubo actividad deportiva, Fernando asumió el papel de guía deportivo. Yo me
37. concentré a observar esos niños que al principio “no nos quitaban los ojos de encima”, pero el juego
38. les hizo olvidar nuestra presencia. Su interés ahora era jugar, correr, gritar y hasta llorar. Varios
39. niños se acercaron a su maestra Lucía para acusar a otros, algunos de ellos llorando.
Chistes 40. Lucía llamaba la atención muy dulcemente. Ahí estaba el niño que me correspondía entrevistar:
41. rebotando contra el piso un balón. Yo le pregunté ¿por qué no juegas con el resto de tus
42. compañeros?. El me respondió que quería jugar solo. Ahí entendí que estaba en presencia de un
43. niño huraño. Al discutir con Lucía este hecho me comentó que realmente era un niño muy
44. asociable; pero en el caso particular de los juegos deportivos, lo rechazaban sus compañeros porque
45. su actuación era muy torpe y contribuía a la pérdida de juegos de su equipo.
46. La siguiente actividad fue la de contar chistes, los cuales era demasiado “Picantes” y con mucho
47. “doble sentido”. Me sorprendió su capacidad para contar chistes con tanto contenido sexual.
Canciones 48. Luego cantamos una canción (Mulato), canción que fue ensayada antes de cantarla y con ayuda de
Cuestionario 49. su reproducción en un casette. De inmediato los niños llenaron un cuestionario auto-administrado,
50. donde se solicitaba información que permitió explorar el grupo. Para llenar el cuestionario se
51. sentaron o acostaron en el piso de un salón sin paredes. Al revisar los cuestionarios observé una
52. pésima caligrafía y ortografía. Como actividad de cierre oímos canciones y compartimos un
Despedida 53. refrigerio, el cual los niños y nosotros comimos con mucho apetito. Se despidieron los niños.
54. Algunas niñas se despidieron de nosotros con un beso. Salieron mucho más habladores y juguetones
138 Continúa
Observación No Participante sobre el Comportamiento de Preadolescentes
Continuación
Fases Línea Texto
55. de como llegaron.
Entrevistas 56. Antes de irnos, nos distribuimos las entrevistas. A mí me correspondió
57. orientadora del plantel, un alumno y su madre. Lucía me advirtió que
58. entrevistar era demasiado cerrado. Ella y la madre de éste hacían esfuerzo
59. pero era importante entrevistarlo porque había sido protagonista de varias e
139
Hay programas computarizados, entre los cuales está el Atlas ti, que facilita la
transcripción e interpretación de entrevistas y observaciones cualitativas. Los mismos
contribuyen a reducir lo laborioso de la transcripción e interpretación de ambos
instrumento cualitativos.
Recogida de Artefactos
140
- Cuestionarios.
- Pruebas documentales.
2. Las denominadas técnicas “vivas”:
- Sociogramas, sociodramas, teatro popular.
- Entrevistas y discusiones de grupo.
- Estudios de casos.
3. Técnicas de carácter audiovisual:
- Diapositivas y fotos.
- Grabaciones de audio.
- Grabaciones de video.
Usualmente sobre un mismo fenómeno, hecho o situación se aplican más de
una técnica o instrumento con la finalidad de comprobar la validez de la
investigación. Este procedimiento se conoce como triangulación. Este tema se aborda
en el capìtulo XIII, donde se explica el proceso de validación de investigaciones
cualitativas.
Ejercicio Propuesto
141
Referencias
Lecturas Sugeridas
142
CAPÌTULO VIII
OPERACIONALIZACIÓN DE VARIABLES
Objetivo
A Manera de Introducción
143
Tomando en cuentas los requisitos exigidos, se recomienda la formulación de
objetivos de acuerdo a las modalidades y tipos de investigación incluidas en el
Manual mencionado. Esto no significa que este trabajo sea dirigido solamente a
investigaciones realizadas a través de las normas de la UPEL, porque el proceso de
Operacionalización debe realizarse en cualquier tipo de variable, incluso en aquéllas
insertas en el paradigma cualitativo.
144
Es necesario aclarar la duda de investigadores y tesistas, quienes se preguntan si
todos los instrumentos de recolección de datos necesitan someterse al proceso de
operacionalización de la variable. Se responde que la formulación de los ítemes de
cualquier instrumento requiere un proceso de planificación. En el caso de las pruebas
de rendimiento académico, la operacionalización de la variable es sustituida por la
tabla de especificaciones de la prueba; siendo la misma, el proceso de planificación
adecuado para la formulación de los ítemes. Cuando el instrumento es un cuestionario
de opinión, una escala de actitud, de motivación, desempeño, etc. se elabora la matriz
de operacionalización, tal como se desarrolla en la sección correspondiente a la
misma. En las investigaciones documentales tambièn se recomienda la
operacionalizaciòn de variables. En esta modalidad de investigación el instrumento de
recolección de datos es generalmewnte la ficho de registro.
Proyecto Factible
Objetivos Específicos:
145
1. Determinar la necesidad de un plan (o proyecto) …
2. Determinar la factibilidad del plan (o proyecto) …
3. Diseñar el plan (o proyecto) …
Cuando se operacionaliza la variable en los proyectos factibles, ésta se formula
en términos de necesidad, ya que la realización de un proyecto factible requiere
determinar la necesidad del proyecto. Al respecto la UPEL (2.003) expresa lo
siguiente: “El proyecto factible consiste en la investigación, elaboración y desarrollo
de una propuesta de un modelo operativo viable para solucionar problemas,
requerimientos o necesidades de organizaciones o grupos sociales…” (p. 16). Se
deduce que el proyecto factible justifica su elaboración y ejecución en determinar la
existencia de un problema que requiere como necesidad un proyecto de solución al
mismo. De ahí que en las investigaciones bajo la modalidad de proyecto factible se
crea una variable para determinar la necesidad de la propuesta. Esta variable permite
también la elaboración del diagnóstico que es la primera fase de un proyecto factible.
Es importante hacer referencia a la polémica existente sobre los objetivos 2 y 3
de un proyecto factible. Hay quienes afirman que es incorrecto desarrollar primero la
factibilidad del proyecto y luego diseñar el proyecto. Señalan como ejemplo que
cuando se construye un edificio antes de determinar la factibilidad hay que elaborar el
proyecto; porque es en función de éste que se determina la factibilidad. De acuerdo a
este criterio, no se puede determinar la factibilidad sin elaborar el proyecto.
Igualmente (expresan) sucede cuando se diseña un programa de formación docente,
para determinar la factibilidad del programa hay que hacerlo en función del programa
de formación docente ya elaborado.
Se considera este criterio equivocado, porque cuando se habla de estudio de
factibilidad, es para referirse a una apreciación general del proyecto o programa en
estudio. A esta etapa corresponde el estudio de mercado, estudio técnico y estudio
financiero. En esta fase se estudia la demanda y oferta del producto (se entiende por
producto el bien o servicio que se ofrece, en el caso educativo el producto son
docentes capacitados, laboratorio construido, etc.). Asimismo se estudia las
especificaciones del producto e insumos y la disponibilidad de recursos financieros,
146
también los aspectos organizacionales y jurídicos en líneas generales. Si estos tres
aspectos son viables (demanda y oferta del producto, estudio técnico y financiero) se
considera factible el plan, programa o propuesta en estudio y se puede pasar al
cumplimiento del objetivo 3: Diseñar el proyecto, programa, plan o propuesta. En
esta última fase, se elabora la propuesta que puede ser un plan, programa o proyecto,
para lo cual hay que desarrollarla al mayor nivel de concreción y considerando el
mínimo detalle. Si la propuesta es un plan de formación docente, debe detallarse los
costos bien especificados, así como la inversión. También debe diseñarse los cursos y
talleres a nivel de detalle, así como todos los aspectos involucrados en la propuesta.
Hay quienes denominan a esta fase “Factibilidad del Proyecto”, y la fase anterior
“prefactibilidad del proyecto, pero ambas fases: prefactibilidad y factibilidad,
equivalen en este caso a la factibilidad y propuesta definitiva respectivamente.
Se desea reafirmar el graso error en el cual incurren quienes desarrollan primero
la propuesta o proyecto definitivo para posteriormente desarrollar la factibilidad de la
propuesta. Imaginemos un arquitecto e ingeniero que primero realiza el proyecto
definitivo: la maqueta, microlocalización de un edificio, estudio de suelos, planos de
ingenierìa civil, electricidad y de aguas blancas y servidas. En resumen elabora el
proyecto de ingeniería, realiza una preinversión millonaria, y posteriormente
determina el estudio de mercado, disponibilidad de recursos técnicos y financieros, es
decir, el estudio de factibilidad; concluyendo que el proyecto realizado no es factible.
Es por esta razón que se considera incorrecto desarrollar primero la propuesta para
después determinar la factibilidad de la misma. Se ha enfatizado en este aspecto,
porque es frecuente en el mundo de los proyectos pasar de la idea a la propuesta o
proyecto definitivo, obviando la factibilidad (o prefactibilidad) del proyecto. Este
error ha originado que los proyectos fracasen; porque demuestran inviabilidad en su
fase de ejecución y funcionamiento.
En cuanto al proceso de operacionalización, ésta se realiza para satisfacer el
cumplimiento del primer objetivo específico: Determinar la necesidad de la
propuesta, porque es este objetivo el que requiere un instrumento para su
cumplimiento. El desarrollo de los otros objetivos: el estudio de factibilidad y diseño
147
de la propuesta, siguen un proceso metodológico diferente. La determinación de la
necesidad, además de cumplir con un requisito de la UPEL, permite, como fue
mencionado, realizar el diagnóstico que es la primera fase de los proyectos factibles.
Para concluir este punto se recomienda a quienes realizan el proceso de
operacionalización formular los ìtemes en función de la necesidad o importancia de la
propuesta. Es común en un número importante de instrumentos; cuyo propósito es
determinar la necesidad de la propuesta, observar ítemes redactados en términos que
no determinan necesidad, lo cual origina el no cumplimiento del propósito del
instrumento.
Proyecto Especial
148
Al igual que los proyectos factibles, los proyectos especiales deben demostrar
que la creación (software, manual, guía, etc.), obedece a una necesidad o que la
misma es considerada importante por potenciales usuarios. Al respecto la UPEL
(2.003) expresa: “Los proyectos especiales, en todos los casos, deben incluir la
demostración de la necesidad de la creación o de la importancia del aporte según el
caso…”(p. 17). Tomando en cuenta esta exigencia de la UPEL sobre los proyectos
especiales es que se recomienda formular el primer objetivo: Determinar la necesidad
de un software (ó estrategia, carta geográfica, etc.)… Para cumplir este objetivo se
aplica un instrumento a los usuarios o beneficiarios de la creación, siendo el propósito
del mismo determinar la necesidad de la creación. El segundo objetivo consiste en
diseñar la creación, y el tercero, en validar la creación, para ello, debe someterse la
creación, a la validación tecnológica (a través de la evaluación de la creación por
expertos en la materia) y de campo (aplicación de la creación a una muestra de los
usuarios de la misma, para posteriormente determinar su viabilidad).
Al igual que en los proyectos factibles, debe tenerse sumo cuidado que los
instrumentos diseñados para determinar la necesidad de una creación, estén
conformados por ítemes orientados a determinar la necesidad de esa creación, porque
de no ser así, el instrumento no cumplirá con su propósito. La formulación de los
ítemes debe estar en correspondencia con la variable que se desea determinar, sus
dimensiones e indicadores, porque entre todos estos aspectos existe un proceso
interdependiente.
149
no necesariamente, porque en estas modalidades de investigación se puede aplicar
como instrumento una escala de necesidad o utilidad), una escala de actitud se aplica
para describir o evaluar un aspecto de interés y puede corresponder a un estudio de
carácter descriptivo, bajo la modalidad de campo, tipo encuesta (si se desea estimar
estadísticamente la actidud de una población determinada), o un estudio de carácter
evaluativo, tipo diseño cuasiexperimental (si se desea determinar el efecto de una
estrategia instruccional sobre la actitud, aplicando una escala de actitud como pretest
y postest) ó un estudio de casos, de carácter exploratorio o descriptivo, donde se toma
una muestra no probabilística.
De acuerdo a lo planteado, los objetivos de estudios de actitudes, aunque sea
una escala de actitud tipo Likert, varían en consideración a la modalidad o tipo de
investigación.
A continuación se desarrolla un ejemplo ilustrativo:
Objetivo General:
Analizar la actitud del docente de la I etapa de Educación Básica del Estado
Lara hacia la investigación cualitativa.
Objetivos Específicos:
150
4. Estimar la actitud promedio del docente hacia la investigación cualitativa por
Municipio.
Objetivo General
Objetivos Específicos
151
compresión lectora en los grupos experimental y control antes y después de
aplicar la estrategia (objetivo 4). En ambas situaciones (en el diagnóstico y
comparación de las calificaciones del grupo experimental y control) se aplica el
mismo instrumento que en este caso es una prueba de nivel de conocimiento
sobre compresión lectora o sobre una asignatura donde la estrategia puede tener
un efecto directo ( en este caso la asignatura Lengua y Literatura).
Los criterios para la construcción de ítemes depende en gran medida del tipo de
instrumento del cual forman parte. El lector puede consultar los capìtulos anteriores a
152
éste donde se analiza el diseño de diferentes tipos de instrumentos. Sólo se quiere
enfatizar lo mencionado en puntos anteriores de que los ítemes deben formularse en
correspondencia a la variable en estudio, las dimensiones e indicadores; para lo cual
el investigador debe apoyarse en los objetivos de la investigación y las bases teóricas.
Nivel de
metacomprensión. Reflexión.
153
Ejemplo 2
154
Ejemplo 3
155
Ejemplo 3 (cont.)
47,61
Tipos de evaluación Explorativa. 68,60
Formativa. 70,57
Final. 43,44
156
Ejemplo 3 (cont.)
85,82
Tipos de evaluación Explorativa. 92,83
Formativa. 90,87
Final. 81,99
157
Ejemplo 3 (cont.)
2. 24 a 29 años
Tiempo transcurrido del
docente desde su nacimiento 3. 30 a 39 años
Edad hasta el momento de aplicación 6
del instrumento de esta 4. 40 a 49 años
investigación.
5. 50 a 59 años
6. 60 y más años
1. Masculino
Diferencia física y constitutiva
Sexo 7
del hombre y de la mujer
2. Femenino
3. T.S.U. en educación
Grado académico alcanzado por
Nivel de Instrucción 8
el docente
2. Maestro / Br. Docente
1. No graduado
1. Urbana
Se refiere a si la escuela donde
Ubicación geográfica de labora el docente está ubicada
3
la Escuela en una zona considerada como
urbana o rural
2. Rural
1. Menos de 5 años
2. 5 a 10 años
Se refiere a los años que tiene el
Años de servicio como
docente trabajando como 3. 11 a 15 años 9
docente
docente
4. 16 a 20 años
5. Más de 20 años
158
Ejemplo 4
159
cuidado de tomar en cuenta no sólo los indicadores, sino las dimensiones y
subdimensiones.
El ejemplo 2, es un caso donde también se incluyen subdimensiones, con la
diferencia que el tipo de instrumento diseñado es una prueba de nivel de
conocimiento. En el ejemplo 1, la variable operacionalizada es tambièn el nivel de
conocimiento y el instrumento es igualmente una prueba de nivel de conocimiento;
pero en este caso, la autora no formuló subdimensiones. En el ejemplo 4, se presenta
un resumen de casos de operacionalización variables. Se observa un caso donde se
operacionaliza la variable, rendimiento académico, solamente con indicadores,
porque su nivel de concreción se obtiene con calificaciones, sin necesidad de plantear
niveles más generales como son las dimensiones y subdimensiones.
Los ejemplos ilustrados representan una muestra de cuadros de operalización de
variables en trabajos de grados presentados en la Universidad Pedagógica
Experimental Libertador, específicamente en el Instituto Pedagógico Luis Beltrán
Prieto Figueroa de Barquisimeto.
A continuación se presenta un cuadro de Operacionalización presentado por
Ramírez (1.999), el cual tiene ligeras modificaciones con respecto a los anteriores.
160
investigación que personas llevan a cabo. A esto se le agrega el hecho de
obligar al investigador a pensar estrategias metodológicas y técnicas en
función no de ideas preconcebidas acerca de los métodos y técnicas más
adecuadas, sino en función de los indicadores, fuentes de información y
estrategias de búsquedas que se derivan del análisis de las variables que
de hecho se van a estudiar. (P. 136)
A Manera de Conclusiones
EJERCICIOS PROPUESTOS
Referencias
161
Laguna, Y. (2001). Estrategia innovadora de comprensión lectora en estudiantes de
sexto grado de Educación Básica de la U.E.E José Félix Ribas del Municipio
Palavecino, del Estado Lara. Trabajo de grado no publicado. Universidad
Pedagógica Experimental Libertado, Instituto Pedagógico Luis Beltrán Prieto
Figueroa, Barquisimeto.
Lecturas Sugeridas
162
DISEÑO Y VALIDACIÓN DE INSTRUMENTOS EDUCATIVOS
TERCERA PARTE
163
CAPÌTULO IX
Objetivo
Conceptualización
164
Fórmula para Calcular el Índice de Dificultad de los Ìtemes
Rango Interpretación
81 a 100 Muy fácil
61 a 80 Fácil
41 a 60 Moderadamente fácil o moderadamente difícil
21 a 40 Difícil
0 a 20 Muy difícil
Ejemplos
165
Caso 3: de 35 alumnos de un curso, ninguno respondió correctamente el ítem.
Para obtener este índice se promedian los índices de la dificultad de todos los
ítemes que contiene la prueba.
Ejemplo en los tres casos anteriores
166
aspirante no es importante, se puede pensar en diseñar una prueba fácil, para así
permitir el acceso a un mayor número de aspirantes.
En el caso de las pruebas aplicadas por el docente, éste puede tener interés en
obtener una prueba moderadamente difícil, también se puede presentar el caso, donde
el docente no le interesa el nivel de dificultad de la prueba, porque su diseño lo hace
en función de un dominio absoluto que debe poseer el alumno sobre el contenido
evaluado. En este caso no interesa calcular el índice de dificultad de la prueba.
Conceptualización
167
Cohen y Swerdlik (2000) ejemplifican de manera muy clara el análisis de
discriminación en el siguiente extracto:
Las medidas de discriminación de reactivos indican qué tan adecuadamente
separa o discrimina un reactivo a quienes obtienen puntuaciones altas y a
quienes obtienen puntuaciones bajas en una prueba. En este contexto, un
reactivo de opción múltiple en una prueba de rendimiento es un buen reactivo
si la mayoría de los que obtienen puntuaciones altas lo responden en forma
correcta y la mayoría de los que obtienen puntuaciones bajas la responden en
forma incorrecta (...) El sentido común dicta que un reactivo en una prueba de
rendimiento académico no está haciendo su trabajo si es respondido en forma
correcta por quienes entienden menos la materia. Del mismo modo, un
reactivo en una prueba que pretende medir un rasgo de personalidad particular
no está haciendo su trabajo si la respuesta indican que las personas que por
ejemplo, obtienen puntuaciones muy bajas en la prueba en conjunto (lo que
indicaría una ausencia o nivel bajo del rasgo en cuestión) tienden a obtener
una puntuación muy alta en el reactivo (lo que indica que están muy altos en el
rasgo en cuestión, lo que es contrario a lo que indica la prueba en conjunto).
(P.243 y 244).
168
datos se distribuyeron normalmente. Si se alejan de la distribución normal, el
porcentaje debe incrementarse a 33% del total de sujetos en cada grupo extremo.
Sobre este punto Anastasi y Urbina (1.998) expresan lo siguiente:
Aunque la diferencia sea obviamente mayor, entre más extremos sean los
grupos, el uso de grupos muy extremos ( como el 10% superior e inferior)
puede reducir la confiabilidad de los resultados por el pequeño número de
casos utilizados. En una distribución normal, el punto óptimo en el que las dos
condiciones se equilibran es el 27% superior e inferior... Cuando la
distribución es más plana que la curva normal, el porcentaje óptimo es
ligeramente mayor al 27% y se aproxima al 33% ... Con los grupos pequeños,
como los que se encuentran en un salón de clase, el error estadístico del
muestreo es tan grande que sólo es posible obtener resultados aproximados;
por lo tanto, en estas condiciones no es necesario preocuparse por el
porcentaje exacto de casos en los grupos de contraste. Cualquier número
conveniente entre 25 y 33 por cierto resultará adecuado. (P.182)
169
Análisis de discriminación en ítemes dicotómicos (*)
ID: RCGS-RCCI
NG
ID: Indice de discriminación
RCGS: Respuestas correctas grupo superior
RCGI: Respuestas correctas grupo inferior
NG: Tamaño de uno de los grupos.
ID ítem 7 = 4 – 0 = 1 ID ítem 8 = 4 - 0 = 1
4 4
(*) En el anexo B se explica la rutina para calcular los índices de discriminación para
datos dicotómicos a través del programa Excel.
170
Cuadro 6
ITEM
GRUPOS SUJETOS 1 2 3 4 5 6 7 8 TOTAL
S V V X V V V V V 7
U 1
P 2 V V X V X V V V 6
E
R 3 V V X X V V V V 6
I
O 4 V V X X V V V V 6
R
TOTAL 4 4 0 2 3 4 4 4
I 5 V V X X X V V V 5
N
T 6 V V X X X V V V 5
E
R 7 V X X X V V V V 5
M
E 8 V V X X V V V X 5
D
I 9 V X X X V V V V 5
O
10 V X X X X V V V 4
11 V V X X X X V V 4
I 12 X V X V V X X X 3.
N
F 13 X V X V V X X X 3
E
R 14 X V X V X X X X 2
I
O 15 X V X X X X X X 1
R
TOTAL 0 4 0 3 2 0 0 0 -
171
3.- Calculados los índices de discriminación de todos los ítem, se interpretan los
resultados considerando los siguientes intervalos.
Rango Interpretación
0,81 ----------- 1 Muy alta
0,61 ----------- 0,80 Alta
0,41 ----------- 0,60 Moderada
0,21 ----------- 0,40 Baja
0,00 ----------- 0,20 Muy Baja
Negativo Extremadamente Baja
172
Análisis de discriminación en el caso de ítemes multicótomos (más de 2
alternativas de respuestas).
173
EJERCICIOS PROPUESTOS
ACTIVIDAD 1
ITEM02
ITEM03
ITEM04
ITEM05
ITEM06
ITEM07
ITEM08
ITEM09
ITEM10
ITEM12
ITEM13
ITEM14
ITEM15
ITEM16
ITEM11
SUJETOS
1 0 0 1 0 1 1 1 1 1 1 1 1 1 1 1 1
2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
3 1 0 0 0 0 0 0 1 1 1 1 1 0 1 1 1
4 0 1 1 1 1 1 1 0 0 1 1 1 1 0 1 1
5 1 0 1 1 0 1 1 0 1 1 1 1 1 0 1 0
6 0 0 0 1 1 1 0 0 1 1 1 1 1 1 0 0
7 1 1 1 0 0 0 1 0 1 1 0 1 0 1 0 0
8 0 0 0 1 1 1 0 0 0 1 0 1 1 0 0 0
9 1 1 0 0 0 0 1 1 1 0 0 0 0 0 0 0
10 0 0 1 1 0 0 0 0 0 1 0 0 0 1 1 0
11 0 0 0 0 1 1 0 0 0 0 0 0 0 1 1 0
12 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0
ACTIVIDAD 2
174
2.1.- Diseñe una base de datos a partir de la matriz anexa, usando como herramienta
tecnológica el Programa Estadístico de Ciencias Sociales (SPSS). En el Diseño tome
en cuenta las siguientes variables cualitativas:
Sexo: 1.- Masculino 2.- Femenino
Edad
1= "18 a 23" 2="24 a 29" 3= "30 a 39" 4= "40 a 49" 5="50 a 59" 6="> de 60"
Profesión
4="Prof/Lic." 3="Tec.Sup.Educ." 2=" Maest/Br.Doc." 1="No graduado"
Años de Servicios
1="<5" 2="5 a 10" 3="11 a 15" 4="16 a 20" 5="> a 20"
EDAD
PROFESION
SEXO
SERVICIO
ITEM01
ITEM02
ITEM03
ITEM04
ITEM05
ITEM06
ITEM07
ITEM08
ITEM09
ITEM10
5 5 5 4 5 5 5 5 5 4 1 1 4 1
2 1 2 1 1 1 1 1 1 1 2 1 1 4
2 4 2 3 4 5 5 5 4 4 4 2 1 3
5 5 5 4 5 4 5 5 5 4 3 1 3 2
4 5 5 5 4 4 4 5 5 5 2 2 2 2
5 5 5 5 5 5 5 5 5 5 1 1 3 5
5 5 3 5 4 5 4 5 5 5 3 2 1 1
1 4 2 5 2 4 4 5 5 4 3 1 1 4
2 5 4 5 5 5 5 5 5 5 3 2 1 1
4 5 1 4 4 4 5 4 4 2 3 2 1 2
175
Formato para analizar e interpretar los resultados del análisis de discriminación
realizado a través del programa SPSS
Determine los ítemes que discriminan o no, tomando como referencia un valor
alfa = 0.05 (ver anexo C).
Varianza T de Student
Sig Tipo Sig. Contraste Conclusión Decisión
Item
(1) Hipótesis (3) sobre el
nula item
(2) (4)
176
Referencias
Lecturas Sugeridas
177
CAPÌTULO X
CONFIABILIDAD DE INSTRUMENTO DE MEDICIÓN EDUCATIVA
Objetivo
Conceptualización
178
Es importante expresar que cuando se realizan mediciones en diferentes
ocasiones, siempre existen diferencias, por ejemplo, si nos pesamos hoy y luego lo
volvemos hacer el día siguiente siempre existe una diferencia, auque a veces es
mínima, la cual es originada por factores fortuitos como haber tomando el peso
inmediatamente después de consumir alimentos. Este tipo de diferencias se conocen
como varianza del error y es originada por factores aleatorios, los cuales el
investigador cuando aplica un instrumento debe controlar.
La teoría del error de medición en la confiabilidad de los instrumentos se
expresa de la manera siguiente:
Y= T+E; donde:
Y= Puntuación observada
T= Puntuación verdadera
E= Error de la medición
Transformándose la ecuación en:
V= Vv+ Ve; donde:
V= Varianza total
Vv= Varianza verdadera
Ve= Varianza del error
Interpretación del Coeficiente de Confiabilidad
Rango Interpretación
0.81 ----------- 1 Muy alta
0.61 ----------- 0.80 Alta
0.41 ----------- 0.60 Moderada
0.21 ----------- 0.40 Baja
0.00 ----------- 0,20 Muy baja
Cuando es negativa Extremadamente baja
Cuando es mayor 1 Extremadamente alta
Lo normal es que el coeficiente de confiabilidad esté entre 0 y 1; pero en
algunos casos traspasa esté intervalo. Cuando un instrumento tiene una confiabilidad
negativa, significativa que ésta es extremadamente baja, lo cual debe llevar a tomar la
179
decisión de rechazar el instrumento. Cuando sucede el caso contrario, el coeficiente
mayor a 1, la confiabilidad es extremadamente alta. Debe aceptarse el instrumento.
Lo recomendable cuando ocurre alguno de estos dos casos es revisar
determinadamente las respuestas del instrumento y los cálculos. Es común cuando
esto ocurre que el resultado se debe a incorrecta codificación de las alternativas de
respuestas o cálculos aritméticos incorrectos cuando el coeficiente se calcula en
forma manual.
Métodos de Confiabilidad
180
Ejemplo 1
X Y
XY
r N
x y
2 2
x N y N
2 2
129132
1.905
10 202,20
r 0,97
129 132 209,42
2 2
181
Ejemplo 2
6 Di 2
6 52
r 1 0.82
N N 12 N
3 3
182
8 8 16 6 2 4
9 9 13 10 -1 1
10 10 14 9 1 1
11 11 9 11 0 0
12 12 6 12 0 0
Total 15,5
615,5
r 1 0,95
12 3 12
La confiabilidad es muy alta, por lo tanto, debe aceptarse el instrumento.
Hay programa estadístico, como Excel, STATISTICA, SPSS, etc., que calculan
ambos coeficientes de correlación, lo cual facilita considerablemente la obtención de
estos coeficientes. La rutina para obtenerlos es muy fácil de manejar y presenta
además la prueba de contraste de hipótesis que complementa los resultados obtenidos
a través de los coeficientes.
183
intervalo o de razón; si la escala de medición de la variable es ordinal, se aplica el
coeficiente de correlación de Spearman.
Hay autores que establecen diferencias entre pruebas equivalentes y pruebas
alternas, argumentado que solamente puede hablarse de pruebas equivalentes cuando
ambas versiones no tiene diferencias significativas en la media y la varianza de las
puntuaciones obtenidas. Cuando sólo se asume que hay dos versiones equivalentes de
una prueba, sin comprobar la igualdad de medias y varianzas, se está en presencia de
una prueba paralela.
184
En los cuestionarios de opinión no hay inconsistencia si los sujetos responden
las preguntas en forma heterogéneas, porque las mismas no son para obtener una
puntuación única que indica una alta, media o baja presencia del atributo (variable) en
los sujetos. En el caso de los cuestionarios de opinión, cada pregunta como se
mencionó en el capìtulo V, se analiza por separado. No es posible una calificación
única, porque, primero, las opiniones están en una escala de medición nominal (sólo
son clasificatorias), y en segundo lugar, generalmente este tipo de instrumento,
aunque describa una sola variable, incluye preguntas con las cuales no se puede
obtener una calificación única, porque los ítemes miden o describen aspectos
diferentes de la variable.
A continuación se presentan varias fórmulas para calcular la consistencia
interna de un instrumento.
Datos dicotómicos
Fórmula Kuder-Richardson (K-R20)
n vt p.q ó n p.q
Rt ( )( ) Rt ( ) (1 )
n 1 vt n 1 vt
185
4 1 1 1 1 1 5 25
5 0 1 1 1 1 4 16
6 1 0 0 1 1 3 9
7 1 1 1 1 1 5 25
8 1 1 1 1 1 5 25
9 0 ò 1 1 1 0 3 9
Total 7 8 8 9 8 40 184
P 0,78 0,89 0,89 1 0,89 - -
q= 1-P 0,22 0,11 0,11 0 0,11 - -
p.q 0,17 0,10 0,10 0 0,10 0,47 -
Cálculo de la varinza
( x) 2 ( 40) 2
2 x2 184
( x x ) n 9 0.78
Vt
n 1 n 1 9 1
p.q = 0.47
Vt= Varianza total
n= número de sujetos
La varianza, al igual que el coeficiente de confiabilidad de Kuder-Richardson,
se puede calcular por dos fórmulas. Se recomienda calcular el promedio por la
segunda fórmula que lo calcula abreviado y es menos susceptible a errores de
redondeo, los cuales cuando se calculan coeficientes pueden afectar
significativamente los resultados.
186
Cálculo del Coeficiente Kuder-Richardson
5 0.47
Rt ( ) x(1 ) 0,50
n p.q 5 1 0.78
Rt ( ) (1 )
n 1 vt
n Vi
n St Vi rt ( ) (1 )
rt ( ) ( ) n 1 Vt
n 1 Vt
rt = Coeficiente de confiabilidad
n = Número de ítemes que contiene el instrumento
Vt ò St= varianza total
Vi= varianzas individuales
187
Determinar el coeficiente Alfa de Cronbach (matriz de ítemes con cinco (5)
alternativas de respuestas).
Sujetos Ítemes Total X2
1 2 3 4 5 6 (X)
1 4 4 3 2 1 1 15 225
2 3 1 3 3 1 2 13 169
3 4 5 4 4 4 4 25 625
4 4 3 2 3 1 1 14 196
5 5 2 4 4 3 1 19 361
6 5 4 3 2 4 2 20 400
7 4 4 2 3 2 3 18 324
8 4 4 2 5 2 4 21 441
Total (x) 33 27 23 26 18 18 145 2.741
X2 139 103 71 92 52 52 - -
Vi2 0.41 1,70 0,70 1.07 1,64 1,64 7,16 -
Cálculo de la varianza
Varianza total
(145) 2
2.741
Vt 8 16,13
8 1
Cálculo de las varianzas individuales
(33) 2 (27) 2
139 103
8 0,41 V 22 8 1,70
V 12 8 1
8 1
(26) 2
92
(23) 2 8 1,07
71 V 42
V 32 8 0,70 8 1
8 1
(18) 2 (18) 2
52 52
8 1,64 V 32 8 1,64
V 52
8 1 8 1
188
Coeficiente de Confiabilidad
189
el coeficiente Kuder-Richardson hay que hacerlo maual; porque el Programa SPSS
no lo calcula. Se puede calcular tambièn a travès del programa Excel, siguiendo la
rutina que se incluye en el anexo D. Se justifica la aplicación de este programa
cuando el nùmero de ítems del instrumento es alto.
CORRELACIÓN ÍTEM-TEST
Este indicador de homogeneidad del test, permite establecer la correlación
entre el ítem y el total de la escala. Pardo y Ruiz (2.002) Expresan que “...lo deseable
es que esas correlaciones sean altas; una correlación baja estaría indicando que el
elemento [el ítem] en cuestión no apunta en la misma dirección que el resto de los
elementos”. (p. 605)
El paquete estadístico SPSS, lo presenta como opcional cuando se calcula el
coeficiente de confiabilidad. Ruiz (1998) recomienda que el ítem aceptado debe
poseer una relación con el total, superior a 0,25; porque de lo contrario la relación no
es aceptable.
190
Su cálculo manual es muy engorroso y complejo; pero el programa SPSS lo
calcula, siguiendo la siguiente rutina: Menú Estadístico ( o Menú Analizar)→
Escalas→Análisis de fiabilidad→Estadístico: activar la opciòn “Escala si se elimina
el elemento”→ Continuar→Aceptar.
191
Fórmula de Spearman – Brown
2r1, 2
rsp
1 r1, 2
Ejemplo
2 0.96
rsp 0.98
1 0.96 192
4. Se interpreta la confiabilidad como muy alta (0,98), por lo tanto, el
instrumento tiene consistencia interna.
193
3. Control de las condiciones del espacio físico y el personal responsable
de aplicar el instrumento: cuando se aplica un instrumento debe
disponerse de condiciones de espacio físico similares para todas
aquellas personas a quienes se le aplicará la prueba. Asimismo el
personal responsable de aplicarlas debe poseer el mismo entrenamiento
y las mismas instrucciones.
Estableciendo estos mecanismos de control se puede reducir la varianza del
error, la cual es causada por factores externos a la prueba. Si este tipo de varianza no
se controla, puede afectar considerablemente los resultados de la prueba, y por lo
tanto, la confiabilidad del instrumento.
N= CD(1-CI)
CI(1-CD)
194
Ejercicios Resueltos para incrementar la confiabilidad.
N= 0,90(1-0,05) = 171 veces màs largo. Tendría que tener 5.130 ìtemes
0,05(1-0,90)
195
EJERCICIOS PROPUESTOS
Actividad 1
CONFIABILIDAD POR REAPLICACIÓN DE LA PRUEBA Y POR PRUEBAS EQUIVALENTES
Calcule el coeficiente de estabilidad y equivalencia en las siguientes situaciones e interprete los resultados :
(Las pruebas F1 y F2 son dos versiones del mismo instrumento que miden la misma variable y
se asume los datos en una escala de mediciòn de intervalo)
Prueba (F1) aplicada Prueba (F1) aplicada Prueba (F2) aplicada
Sujetos el 29/02/04 el 22/03/04 el 22/03/04
(Puntaje total) (Puntaje Total) (Puntaje total)
1 267 275 272
Actividad 2
196
Desarrolle el procedimiento manual exigido para calcular el coeficiente de
consistencia interna en los siguientes ejercicios e interprete los resultados
EJERCICIO 1
ítemes
Sujetos
1 2 3 4 5
1 1 1 1 1 1
2 1 0 1 1 1
3 1 1 0 0 0
4 1 1 1 1 1
5 1 1 1 1 1
6 1 1 1 1 1
7 1 0 1 0 1
8 1 0 1 0 0
9 0 1 1 1 0
EJERCICIO 2
Sujetos Items
1 2 3 4 5 6
1 4 4 4 4 4 4
2 5 4 4 5 4 2
3 5 5 5 5 5 5
4 4 5 4 4 5 4
5 4 4 4 4 5 4
6 4 4 5 5 5 5
7 4 5 2 3 5 5
8 5 5 4 5 4 5
9 4 4 4 4 4 4
10 5 5 5 5 5 5
Actividad 3
Aplicando el programa SPSS como herramienta tecnológica, calcule e
interprete en la siguente base de datos el coeficiente de confiabilidad alfa de
Cronbach y excluye del instrumento los ìtems que no aportan confiabilidad y
presenten una correlación ítem-test menor o igual a 0.25:
ÌTEMS
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
sujetos
1 5 4 5 5 2 4 4 5 4 1 5 5 4 4 5 5 5 5 5
197
2 4 4 4 4 1 4 4 4 4 1 4 5 5 4 4 4 5 4 4
3 2 1 3 2 2 2 2 2 1 2 1 1 1 2 2 3 4 5 2
4 4 4 4 4 4 4 4 4 4 2 4 4 4 4 1 4 4 4 4
5 5 4 4 4 2 5 3 4 4 4 5 5 2 4 4 4 5 5 4
6 5 5 5 5 2 5 5 5 5 2 5 5 5 5 5 5 1 5 5
7 5 4 4 4 4 4 1 4 4 2 4 4 4 5 5 4 5 5 4
8 3 4 5 2 5 5 3 3 3 2 5 2 5 2 4 4 5 4 4
9 4 4 4 4 4 4 1 4 4 2 4 4 4 4 1 4 4 4 4
10 4 4 4 4 4 4 1 4 4 4 4 4 4 4 4 4 4 4 4
11 5 5 5 4 4 4 1 5 5 5 4 4 4 5 1 5 4 2 3
12 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4
13 2 2 2 2 2 2 3 2 2 2 2 2 2 2 2 1 1 2 2
14 4 5 4 4 4 4 5 5 5 1 5 5 5 5 5 5 5 5 5
15 4 4 3 2 4 4 3 2 4 5 4 4 4 4 1 4 5 4 5
16 3 2 2 2 2 2 1 2 4 1 2 4 2 4 2 4 2 4 2
17 4 4 4 4 1 4 1 4 4 1 4 4 4 4 2 4 4 4 4
18 2 4 4 4 1 4 1 4 4 1 5 5 4 2 1 4 2 5 5
19 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
20 4 4 5 5 1 5 5 4 4 2 5 1 4 4 4 2 5 5 5
21 2 1 1 1 1 1 1 1 1 1 1 1 2 2 1 2 2 1 1
Referencias
Pardo, A. (2.000). SPSS 11: Guìa para el análisis de datos. Madrid: Mc Graw
Hill.
Lecturas Sugeridas
Anastasi, A., Y Urbina, U. (1.998). Test psicológicos. México: Prentice Hall. Capítulo
4: confiabilidad. Apartado: tipos de confiabilidad.
198
Ary, D., Jacobs, L., Y Razavieh, A. (1.989). Introducción a la investigación
pedagógico. México: Mc Graw Hill. Se recomienda el capítulo 8: validez y
confiabilidad. Apartado: confiabilidad.
Pardo, A. (2.000). SPSS 11: Guìa para el análisis de datos. Madrid: Mc Graw Hill.
Se recomienda leer el capìtulo 25: Fiabilidad de las escalas: Procedimiento.
Análisis de Fiabilidad. Exxplicaeste libro los métodos de confiabilidad
analizados en este capìtulo y el procedimiento para calcularlos a travès del
programa SPSS.
CAPITULO XI
VALIDEZ DE INSTRUMENTOS DE MEDICIÓN EDUCATIVA
Objetivo
Conceptualización
199
un instrumento son los mismos en el tiempo y en situaciones similares; pero no
determina si lo que está midiendo es lo que realmente se quiere medir. Puede ocurrir
que un instrumento sea estable, equivalente y homogèneo; pero no mide la variable
que se desea medir, ejemplo, una balanza puede medir en repetidas mediciones un
peso de un objeto o sujeto en forma consistente. Las veces que se pesa, éste es el
mismo. Esto determina por lo tanto confiabilidad; pero puede ser que éste no sea el
peso del objeto o sujeto, es decir, mide algo en forma consistente, pero no lo que
realmente queremos medir.
La validez tiene como propósito determinar si el instrumento mide exactamente
lo que se quiere medir. Es por esta razón que suele afirmarse que la confiabilidad de
un instrumento es una condición necesaria para evaluarlo, pero no suficiente; porque
un instrumento puede ser confiable, sin ser válido; pero al ser válido es
necesariamente confiable.
El lector puede preguntar, si un instrumento que es válido, también es confiable
¿Por qué no concentrar la evaluación del instrumento en la validez y nos olvidamos
de la confiabilidad?. La respuesta a la pregunta, es que hallar evidencias de validez es
más difícil que calcular la confiabilidad, la cual se reduce a un mero tecnicismo, a
calcular un coeficiente de confiabilidad. La validez también aplica coeficientes, pero
requiere la presencia de evidencias que determinan la validez del instrumento, las
cuales en la mayoría de las veces es muy difícil de obtenerlas, porque las mismas
implica determinar aspectos teóricos de lo que se quiere medir y relacionarlos con
evidencias empíricas; las cuales no siempre son accesibles en el procceso de
validación de instrumento
Métodos de Validez
200
de constructo, las cuales también se analizarán). A continuación se explican los
diferentes métodos de validez:
Validez de Contenido
1
.
.
.
.
.
.
.
.
.
.
.
201
.
n
Ne N 2
CVR
N
2 de validez de contenido
CVR = razón
Ne = Número de expertos que indican "Esencial"
N = Número total de expertos.
Ejemplo
4 (11 2)
CVR 0,27
11 2
202
2.- CVR cero = Cuando exactamente la mitad de los expertos indican
"esencial" . Supòngase que cinco (5) de diez (10) expertos indican que es
esencial
5 (10 2)
CVR 0
10 2
3.-CVR positivo = cuando más de la mitad; pero no todos los expertos indican
"esencial". Supòngase que nueve (9) de once (11) experos indican que es esencial.
9 (11 2)
CVR 0.64
11 2
203
Valores mínimos de la razón de validez de contenido para asegurar que es
improbables que el acuerdo se debe al azar.
Al consultar en esta tabla los resultados de los tres ejemplos desarrollados, los
mismo se interpretan de la manera siguiente: en el primer ejemplo, el resultado es
negativo por lo tanto se rechaza el ítem; ya que la tabla no tiene valores mínimos
negativos. En el segundo ejemplo es cero, al consultar la tabla, se observa que
tampoco tiene valores mínimos de cero, lo cual debe llevar a tomar como decisión
excluir el ítem del instrumento. En el tercer ejemplo el resultado es mayor a cero;
para interpretar el resultado consultamos la tabla, procediendo de la manera siguiente:
se consulta en la tabla el valor mínimo cuando hay 11 expertos, el cual es 0,59. Se
compara con el valor calculado que es 0,64. Este valor está por encima del valor
mínimo exigido, por lo tanto, se acepta el ítem.
204
Además del Formato de evaluación del instrumento, es recomendable anexar al
instrumento, el cuadro de operacionalización de la variable, los objetivos de la
investigación y las bases teóricas de la variable en estudio. Esta información ampliará
el conocimiento del experto sobre la variable que se quiere medir y le permitirá
proporcior mejores observaciones y recomendaciones sobre el instrumento evaluado.
Validez de Criterio
¿Qué es un criterio?
Para Hurtado (2.000) un criterio es: “... una medida externa, independiente al
instrumento (en evaluación), con el cual se supone que éste está correlacionado y que
en definitiva es la característica o conducta que el instrumento intenta predecir...
[pretende medir]” (p. 435).
Un ejemplo es predecir el rendimiento que tendrá un estudiante en su futura
carrera universitaria (criterio) a través de una prueba de aptitud académica
(instrumento en evaluación). Para validar el instrumento, se aplica a un grupo de
estudiantes que aspiran ingresar a la Universidad, se espera que haya transcurrido un
semestre o un año académico para correlacionar las puntuaciones obtenidas en el
instrumento con la calificaciones promedio del mismo grupo después de finalizar el
semestre o año académico.
El estadístico que se emplea es el coeficiente de correlación de Pearson (si la
escala de medición de las puntaciones se considera como mínimo en intervalo) o el
coeficiente de correlación de Spearman (si la escala de medición es ordinal). Para
conocer el procedimiento exigido en el cálculo de ambos coeficientes puede consultar
el aprtado del capìtulo sobre confiabilidad de instrumento de medición educativa
(Unidad anterior) que aborda el método de confiabilidad de reaplicación de la prueba.
205
Características que debe reunir un criterio
Rango Interpretación
0.81 ----------- 1 Muy alta
0.61 ----------- 0.80 Alta
0.41 ----------- 0.60 Moderada
0.21 ----------- 0.40 Baja
0.00 ----------- 0,20 Muy baja
206
Validez concurrente. Cuando las puntuaciones del instrumento en evaluación se
obtienen más o menos al mismo tiempo que las medidas del criterio. Ejemplo: cuando
se utilizan los resultados de una prueba de habilidades numéricas y verbales
(instrumento en evaluación) para determinar el rendimiento académico (criterio).
Definición de constructo
207
Validez Discriminante. Se determina correlacionando las puntuaciones del
instrumento que mide el constructo en estudio con las puntuaciones de otro
instrumento que mide otro constructo o variables, con la cual el constructo en estudio
no debería correlacionarse. El coeficiente de correlación en la medida que se
aproxime a cero (0) indica mayor validez discriminante.
208
inferiores. Esto debe ser de esta manera, porque está demostrado que el incremento de
la escolaridad mejora la rapidez en la lectura.
3. Evidencias de cambios preprueba-posprueba: Si se aplica una estrategia
instruccional, la cual ha demostrado eficacia para incrementar el rendimiento
académico, los puntajes de un instrumento que mide el rendimiento académico, deben
tener diferencias significativas al comparar los resultados de la preprueba, aplicada
antes de comenzar la estrategia instruccional, con los resultados de la posprueba,
aplicada después de concluir el curso sometido a la estrategia. Si las diferencias entre
la preprueba y posprueba son significativas, se puede asegurar que el instrumento
tiene validez de construcción.
4. Evidencia de grupos distintos: Si se diseña un instrumento que mide la
actitud del estudiante hacia la matemática y se aplica el instrumento a dos grupos
claramente diferenciados: grupo de alumnos que aprobaron la asignatura matemática
y grupo de alumnos reprobados en esa asignatura, un instrumento con validez de
constructo debe presentar como resultado estudiantes que aprobaron la asignatura con
una actitud hacia las matemáticas más favorable y los estudiantes reprobados con una
actitud menos favorable.
5. Análisis Factorial: El análisis factorial es una técnica que a través de un
procedimiento matemático y estadístico complejo, determina si los ítemes de un
instrumento miden solamente un aspecto de la variable en estudio. Asimismo
identifica aquellos ítemes que no miden ningún aspecto de la variable en estudio, los
cuales deben excluirse del instrumento. El análisis factorial es un indicador tan
importante en el proceso de validación de un instrumento que se dedicará la próxima
unidad a desarrollar paso a paso su procedimiento.
Ejercicios Propuestos
209
Actividad 1
3. Revise un trabajo de grado, evalúe los ítemes del instrumento aplicado para la
recolección de datos; y llene el formato presentado a continuación:
Fecha:
Nombre del Experto: Firma:
Institución donde trabaja: Cargo que desempeña:
210
Un Jurado lo integran nueve (9) expertos.
3. Tres (3) expertos indican que el ítem "no es necesario" y dos que es " útil
pero no esencial", el resto respondieron que es "esencial".
4. Cinco (5) expertos indican que el ítem es "útil pero no esencial ", uno (1) que
"no es necesario" y el resto que es "esencial".
Actividad 3
211
sujetos Instrumento en evaluaciòn Criterio
(puntajes) (puntajes)
1 19 19
2 18 17
3 15 15
4 20 20
5 16 15
6 17 14
7 18 18
8 20 19
9 20 19
10 14 15
11 14 14
12 14 14
13 16 15
14 16 17
15 15 14
16 18 19
17 14 14
18 17 17
19 20 20
20 18 18
21 14 13
22 15 16
23 18 18
24 19 19
25 15 16
ACTIVIDAD 4
212
Situación 1
Se ha demostrado teóricamente que la actitud hacia las innovaciones educativas
y la motivación al logra se correlacionan positivamente. Tomando en cuenta esta
relación el Constructor de una escala de actitud hacia las innovaciones educativas
desea determinar si el instrumento diseñado tiene validez de constructo. En este
sentido aplica a una misma muestra de sujeto este instrumento, conjuntamente con
otro instrumento que mide la motivación al logro; el cual tiene debidamente
comprobado validez. Calcule el coeficiente de validez e interprete los resultados que
se muestran en la siguiente tabla:
Situación 2
213
Se ha demostrado teóricamente que el coeficiente de inteligencia y el nivel de
ingreso no se correlacionan; tomando en cuenta esta afirmación el constructor de una
prueba de inteligencia, correlaciona los puntaje de un test de inteligencia aplicado a
un grupo de sujetos con el nivel de ingreso que posee cada uno de ellos. Calcule e
interprete el coeficiente de validez.
214
Hurtado, J. (2.000). Metodología de la investigación holística. (Tercera edición)
Caracas. Sypal.
Lecturas Sugeridas
CAPITULO XII
ANÁLISIS FACTORIAL COMO TÉCNICA DE VALIDEZ DE CONSTRUCTO
EN ESCALAS PARA MEDIR ACTITUDES
215
Objetivo
A Manera de Introducción
216
Validación Preliminar de Actidoc. I
Descripción de Actidoc. I
Validez de Contenido
217
Antes de aplicar la prueba piloto, se realizó la validez de contenido del
instrumento a través de la técnica de juicio de expertos. En este sentido el instrumento
fue evaluado por siete (7) expertos: 3 metodólogos, 1 experto en construcción de
instrumentos educativos y muestreo, 1 experto en diseño curricular y 2 maestros de
aula de la primera etapa de Educación Básica; estos últimos evaluaron
fundamentalmente la claridad, nivel de comprensión de los ítemes y la duración en el
llenado del instrumento. Las observaciones realizadas por los siete (7) expertos
contribuyeron sustancialmente a mejorar y enriquecer el instrumento.
218
Para evaluar la confiabilidad del instrumento se analizaron dos (2) métodos:
1. reaplicación de la prueba: el procedimiento fue el siguiente: se aplicó la
versión preliminar a 240 docentes y se seleccionó aleatoriamente el 10% de los
docentes de la muestra piloto (24 docentes); a quienes se aplicó por segunda vez el
mismo instrumento, dos meses después de la primera aplicación. Se procedió a sumar
el total de actitud de cada uno en ambos aplicaciones, se calculó a través del
programa estadístico computarizado SPSS, el coeficiente de correlación de Pearson
(la actitud se considera expresada en una escala de medición de intervalo; por lo tanto
este coeficiente es adecuado), correlacionando los puntajes del test y el retest. Los
resultados (coeficiente de 0,78) demuestran alta correlación entre ambos puntajes y
estabilidad del instrumento, garantizando que los resultados se pueden generalizar a
través del tiempo.
2. Confiabilidad de consistencia interna: esta confiabilidad mide la
homogeneidad o consistencia que presentan las respuestas de los sujetos a quienes se
le aplicó el instrumento. Para que el instrumento tenga consistencia interna es
necesario respuestas homogéneas, es decir, obtener puntajes similares en los
diferentes ítemes. Para el cálculo de esta confiabilidad se usó las fórmulas de Alfa de
Cronbach y Dos Mitades. En ambos casos el procedimiento fue a través del programa
estadístico SPSS. Los resultados fueron coeficientes de confiabilidad de 0,95 y 0,91
respectivamente, lo cual demuestra alta confiabilidad de consistencia interna del
instrumento.
219
incrementaba al excluir el item. Los ítemes que no contribuyeron a la confiabilidad
son los siguientes: 17, 22, 32, 53, 75, 76, 100, 113, 116 y 120.
Considerando que el propósito en la evaluación de un instrumento es obtener
validez y confiabilidad, se decidió excluir estos ítemes del instrumento, porque no
cumplían con el propósito de aportar confiabilidad al instrumento. La confiabilidad
sin estos ítemes ascendió un (1) punto, ubicándose el coeficiente Alfa de Cronbach en
0,96.Correlación
Relación Ítem-Total-Corregido
El Análisis Factorial
Coceptualización
220
identificar las unidades o propiedades básicas que fundamentan las
pruebas y medidas. (p. 648)
Más adelante Kerlinger define los factores, los cuales constituyen el soporte del
análisis factorial. Al respecto señala que:
Un factor es un constructo, una entidad hipotética, una variable latente
que se supone fundamenta las pruebas, escalas, reactivos y, en realidad,
las medidas de casi cualquier tipo. Se ha encontrado que ciertos números
de factores fundamentan la inteligencia; por ejemplo, habilidad verbal.
Habilidad numérica, razonamiento abstracto, razonamiento espacial,
memoria y otros. De manera similar, se han aislado e identificado los
factores aptitud, actitud y personalidad. Aún las naciones y la gente han
sido factorizada. (p. 648)
221
1. Matriz de correlación de ítemes
Pruebas 1 2 3 4 5 6
1 1 0.72 0.63 0.09 0.09 0.00
2 0.72 1 0.57 0.15 0.16 0.09
3 0.63 0.57 1 0.14 0.15 0.09
4 0.09 0.15 0.14 1 0.57 0.63
5 0.09 0.16 0.15 0.57 1 0.72
6 0.00 0.09 0.09 0.63 0.72 1
222
3. Matriz factorial con solución rotadas
1. Abrir el archivo
2. Clic en el menú analizar ( si es la versiòn 11) o en Estadìstico (si es
la versiòn 7.5)
3. Clic en reducción de datos.
4. Clic en análisis factorial
223
5. Pasar todos los ítemes (no las variables cualitativas) al recuadro
variables.
6. Clic en descriptivos: activar las opciones “Determinante” y “KMO y
prueba de esfericidad de Bartlett”, clic en continuar.
7. Clic en extracción: Dejar activada la opciòn poor defecto “Mètodo
Componentes principales”, activar la opción autovalores mayores que 1. Clic
en continuar.
8. Clic en rotación: activar la opción varimax. Clic en continuar.
9. Clic en opciones: activar las opciones “Ordenadas por tamaño” y
“suprimir valores absolutos menores a 0.10”. Clic en continuar.
10. Clic en aceptar.
224
caso de Actidoc. 1, el Determinante se ubica en 6,187E-30 (se interpreta que antes del
nùmero 6 se anteponen 30 ceros). Este resultado evidencia que Actidoc. 1 tiene una
interrelaciòn lineal alta entre los ìtemes.
Asimismo se calculò a travès de este mismo programa, el coeficiente KMO
(Káiser-Meyer-Olkin) y el Test de Bartlett. Según Visuata (1998) “...el índice KMO
nos compara los coeficientes de correlación de Pearson obtenidos (en la matriz de
correlación)... con los coeficientes de correlación parcial entre variables...” (p. 224)
El criterio para interpretar los resultados del índice KMO son los siguientes:
1 KMO > 0,90 son considerados excelentes.
0,90 KMO > 0,80 son considerados buenos.
0,80 KMO > 0,70 son considerados aceptables.
0,70 KMO > 0,60 son considerados mediocres o regulares.
0,60 KMO > 0,50 son considerados malos
KMO 0,50 son considerados inaceptables o muy malos.
En el caso específico de esta investigación el KMO es igual a 0,81,
considerándose por lo tanto como bueno.
En el caso del test de Bartlett, Visuata (1998) expresa que éste:
225
de realizar el análisis factorial, son favorables; lo que indica la conveniencia y la
viabilidad de aplicar en esta investigación la técnica de análisis factorial. En este
sentido se procedió a realizar (después de extraer los factores, a través del método de
componentes principales, y la rotación de factores, a través del método Varimax) la
selección de los ítemes entre 28 factores extraídos. El criterio para seleccionar los
ítemes se tomó de Nunnally y Bernstein (1988), quienes al respecto expresan lo
siguiente:
...cada factor debe tener algunas variables que se correlacionen con él casi
exclusivamente (la mayoría de las variables que se correlacionan
altamente con ese factor no deben correlacionarse más de 0,3 con
cualquier otro factor, y las variables marcadoras... deben correlacionarse
por encima de 0,5...(p. 603)
226
Cuadro 7
Varianza total explicada
Suma de las saturaciones al cuadrado de la rotación
Componente
Total % de la varianza % acumulado
1 6,212 6,339 6,339
2 3,849 3,928 10,267
3 3,748 3,825 14,091
4 3,544 3,616 17,707
5 3,383 3,452 21,159
6 3,287 3,355 24,514
7 3,105 3,168 27,682
8 2,878 2,937 30,619
9 2,521 2,572 33,191
10 2,499 2,550 35,740
11 2,433 2,482 38,223
12 2,425 2,475 40,697
13 2,422 2,472 43,169
14 2,236 2,282 45,451
15 2,188 2,233 47,684
16 2,135 2,178 49,863
17 2,057 2,099 51,952
18 2,047 2,089 54,050
19 1,982 2,022 56,072
20 1,892 1,931 58,004
21 1,881 1,920 59,923
22 1,850 1,887 61,810
23 1,833 1,870 63,681
24 1,749 1,785 65,465
25 1,677 1,712 67,177
26 1,673 1,707 68,884
27 1,658 1,692 70,576
28 1,648 1,682 72,257
227
Aproximación a una Nueva Operacionalización de la Variable Actitud del
Docente hacia la Evaluación de los Aprendizajes a través del Análisis
Factorial
Entre los beneficios que genera la aplicación de la técnica del análisis factorial
es descubrir factores que reemplazan la estructura original de operacionalización de la
variable, fundamentada en dimensiones, subdimensiones e indicadores. En el caso de
esta investigación se mencionan los factores y los ítemes que lo explican. Cada factor
se le asignó un nombre en consideración al elemento común de los ítemes que lo
constituyen. Hay algunos factores que no fue posible identificar el elemento común
en el cual convergen. Sobre la identificación del factor común, Cohen y Swerdlik
(1988) comentan lo siguiente:
...si un análisis factorial identificó un factor común que está midiendo los
instrumentos hipotéticos, una “prueba de bulimia” y una “prueba de
anorexia”, surgiría una interrogante concerniente a la forma de nombrar
este factor. Una analista factorial que observara los datos y reactivos de
cada prueba podría bautizar al factor común como un “factor de trastorno
alimenticio”. Otro analista factorial que examinara exactamente los
mismos materiales podría denominar el factor común “factor de
preocupación por el peso corporal”. Un tercer analista podría nombrarlo
“factor de trastornos de la percepción de sí mismo” y así en forma
sucesiva. El punto aquí es que la denominación de factores que surgen de
una análisis factorial tiene más que ver con el conocimiento, juicio y
capacidad de abstracción verbal que con la destreza matemática. No hay
un libro de reglas para designar factores; los analistas factoriales ejercen
su propio juicio concerniente a cuál nombre del factor comunica mejor el
significado del factor... (p. 212)
228
ítemes que se correlacionaron casi exclusivamente con un factor determinado. Este
procedimiento es conocido como análisis factorial de segundo orden. Al respecto
Kerlinger (1988) expresa que “... un análisis factorial de segundo orden... es un
método para encontrar los factores detrás de los factores... [calculando]... las
correlaciones entre los factores y nuevamente... [analizar]... factorialmente...” (p. 663)
Factores Comunes
Item 28 Me angustia tener que planificar cómo evaluar a mis alumnos cuando
desarrollo una actividad en el aula.
Item 29 Evaluar las producciones de mis alumnos (escritas, orales, dramatizaciones,
producciones plásticas o musicales, investigaciones), es sumamente
aburrido.
Item 26 Es fastidioso tener que indagar aprendizajes de mis alumnos cada vez que
inicio un tema.
Item 25 Tener que evaluar todo el tiempo me fastidia.
Factor 2: Actitud hacia la evaluación participativa
Item 36 Promuevo en el alumno evaluar su propio desempeño en las actividades
desarrolladas en el proceso enseñanza – aprendizaje.
Item 37 En la evaluación de mis alumnos tomo en cuenta tanto sus aspectos
psicosociales como el progreso en su aprendizaje.
Item 49 Propicio entre mis alumnos intercambios orales (diálogos, entrevistas,
debates).
Factor 3: Actitud hacia las estrategias de evaluación
229
Item 08 Explorar el nivel de disposiciones, sentimientos, valores, actitudes y
aptitudes antes de comenzar un tema, contribuye al aprendizaje del alumno.
Item 07 El proceso enseñanza–aprendizaje debe fundamentarse en evaluaciones
permanentes sobre la actuación del alumno.
Item 31 Disfruto evaluando integralmente a mis alumnos.
Factor 4: Actitud hacia la heteroevaluación
Item 05 En la evaluación de los aprendizajes deben participar, además del docente,
los alumnos, padres y representantes y la comunidad educativa.
Item 04 El alumno al evaluar su propio desempeño, contribuye a mejorar su
proceso de aprendizaje.
Factor 5: No se descubre el elemento común de los ítemes
Item 14 Al evaluar los aprendizajes no debo tomar en cuenta la opinión de los
alumnos.
Item 44 Cómo evaluar al alumno lo decido en el transcurso de las actividades que
éste desarrolla.
Item 13 Sólo debe evaluarse al alumno al finalizar cada lapso.
Factor 6: Actitud hacia la evaluación cualitativa
Item 39 Estoy “ganado” para trabajar con la evaluación cualitativa.
Item 33 Me desagrada evaluar los intercambios orales entre mis alumnos (diálogos,
entrevistas, debates).
Item 22 Me encanta aplicar instrumentos de evaluación cualitativa.
Factor 7: Actitud hacia las técnicas de evaluación sociométricas
Item 09 Las técnicas sociométricas, tales como el sociograma, mapa de conceptos y
el portafolio, permiten obtener progresos importantes en los aprendizajes
del alumno.
Item 47 Oriento a mis alumnos cuando realizan técnicas sociométricas (sociograma,
mapas de conceptos, portafolios).
Factor 8: No se puede determinar el elemento comùn, porque sòlo hay un ìtem.
230
Item 16 Es entretenido evaluar aplicando la técnica de la observación mediante el
uso de escalas de estimación, listas de cotejo, registro anecdótico y diario
de clase.
Factor 9: No se puede determinar el elemento comùn, porque sòlo hay un ìtem.
Item 11 Es innecesario utilizar intercambios orales entre los alumnos (diálogos,
entrevistas, debates), para evaluar su aprendizaje.
Factor 10: No se puede determinar el elemento comùn, porque sòlo hay un ìtem.
Item 20 Me desagrada tener que aplicar escalas y cuestionarios de actitud para
explorar las actitudes de mis alumnos.
231
emergen claramente, impidiendo su reconocimiento, siendo necesario realizar un
nuevo análisis factorial hasta que la estructura factorial completa aparezca con
claridad. En este caso se requiere volver aplicar el instrumento con los ítemes
seleccionados del primer análisis factorial. La estructura factorial que se realiza tiene
el propósito de presentar una aproximación a una nueva operacionalización de la
variable en estudio tomando en cuenta el análisis factorial.
Se observa en el cuadro 8 que los factores determinados (15) explican la
varianza total de los ítemes en un 67,16 %, porcentaje considerado favorable para
aplicar análisis factorial de segundo orden en esta investigación. El nùmero de ìtems
aceptados tomando en cuenta el anàlisis factorial de segundo orden, es 30 ìtems
Cuadro 8
Nota: Cuadro elaborado con los datos de la encuesta definitiva Actidoc. I y cálculos
realizados a través del programa estadístico computarizado SPSS.
232
Con el propósito de continuar la operacionalización de la variable a través de
análisis factorial de segundo orden, se fijaron el número de factores en 8 (no
considerando valores mayores a 1), acumulando una varianza explicada del 55,61 %,
porcentaje que aún se considera viable para aplicar el análisis factorial bajo este
criterio. El número de ítemes aceptados usando el mismo criterio de los casos
anteriores, es de 21 ítemes.
A continuación se identifican los factores y los ítemes que los constituyen:
Factores Comunes
Factor 1: Animadversión hacia la evaluación de acuerdo al Currículo Básico
Nacional
233
Item 16 Es entretenido evaluar aplicando la técnica de observación mediante el uso
de escalas de estimación, lista de cotejo, registro anecdótico y diario de
clase.
Item 22 Me encanta aplicar instrumentos de evaluación cualitativa.
Item 33 Me agrada evaluar los intercambios orales entre mis alumnos (diálogos,
entrevistas, debates).
Item 39 Estoy “ganado” para trabajar con la evaluación cualitativa.
Factor 4: Actitud hacia la heteroevaluación
Item 05 En la evaluación de los aprendizajes deben participar, además del docente,
los alumnos, padres y representantes y la comunidad educativa.
Item 21 Me gusta la evaluación recíproca entre padres y representantes, alumnos y
docentes para evaluar los aprendizajes de mis alumnos.
Factor 5: No se puede determinar el elemento comùn, porque sòlo hay un ìtem.
Item 13 Sólo debe evaluarse el alumno al finalizar cada lapso.
Factor 6: No se puede determinar el elemento comùn, porque sòlo hay un ìtem.
Item 35 Yo en la evaluación de mis alumnos solamente tomo en cuenta los
conocimientos adquiridos.
Factor 7: Actitud hacia la evaluación cuantitativa
Item 06 Los mejores instrumentos para evaluar al alumno son las pruebas objetivas.
Item 42 Es usual que yo aplique pruebas objetivas (verdadero y falso,
completación, pareo, selección), para evaluar los aprendizajes.
Factor 8: No se descubre el elemento común entre los ítemes
Item 01 El docente debe evaluar sólo en aquellos momentos del proceso
enseñanza-aprendizaje que considera relevantes.
Item 41 Asigno a cada alumno evaluar la actuación del resto de sus compañeros en
las actividades desarrolladas durante el año escolar.
Item 44 Cómo evaluar al alumno lo decido en el transcurso de las actividades que
éste desarrolla.
La aplicación del análisis factorial de segundo orden, origina una nueva
operacionalización de la variable, la cual no se fundamenta, como en la
234
operacionalización inicial, en dimensiones e indicadores de la variable; sino en
factores constituidos por ítemes interrelacionados entre sí. Con esta nueva concepción
de medir la actitud, se genera validez de constructo, porque aquellos ítemes que
miden varios factores (se correlacionan con más de un factor) y los que no miden
ninguno (no se correlacionan con ningún factor) se excluyen del instrumento; pues
los ítemes para que aporten validez de constructo sólo deben medir un aspecto
(factor) de la variable en estudio.
235
cantidad antes de aplicar el análisis factorial, a 49 ítemes). A este nivel el instrumento
aún se mantienen muy confiable, es decir, en el rango de 0.81 a 1.
Después de aplicar el análisis factorial de segundo orden (análisis que se realiza
con los datos obtenidos de la aplicación del instrumento con 49 ìtemes y 190
docentes), el instrumento queda constituido por 30 ìtemes, el cual presenta una
confiabilidad de 0,8207; siendo a este nivel la confiabilidad muy alta; porque aún se
sitúa en el rango de 0,81 y 1. Considerando que la confiabilidad se ubica muy cerca
del el límite inferior del rango, es aconsejable no continuar aplicando análisis
factorial, porque en la siguiente aplicación es probable que la confiabilidad descienda
de muy confiable a confiable y es recomendable que los instrumentos; cuyo propósito
sea medir actitudes, tengan una confiabilidad muy alta. Después de aplicar el análisis
factorial dos veces a este instrumento se debe aceptar esta versión, constituida por 30
ìtemes, como la definitiva.
A Manera de Conclusión
236
3. Los resultados de aplicación del análisis factorial de segundo orden,
aproximan la variable en estudio a una nueva Operacionalización, en función de
la identificación de los factores obtenidos. Esta nueva Operacionalización puede
mejorar si se descubre el elemento común que identifica a los factores aún sin
emerger claramente. Como se mencionó en la conclusión anterior, la
identificación plena de los factores, puede surgir de la reaplicación del análisis
factorial hasta lograr plena identificación de todos ellos.
4. La reducción tan sustancial de los ítemes del instrumento, no afecta
confiabilidad. Esta se mantienen muy alta antes y después de la exclusión de los
ítemes, lo que permitió generar validez de constructo, sin “sacrificar” la
confiabilidad.
Ejercicio Propuesto
237
Referencias
Visuata, B. (1998). Análisis estadístico con SPSS para Windows (Volumen II:
Estadística Multivariante). Madrid: Mc Graw-Hill.
Lecturas Sugeridas
238
Cohen, R y Swerdlik. M. (2.001). Pruebas y evaluación psicológicas, México, Mc.
Graw Hill. Se recomienda el capìtulo 6: Validaz. Secciòn Validez de constructo.
Subpunto: Análisis factorial.
Visuata, B. (1998). Análisis estadístico con SPSS para Windows (Volumen II:
Estadística Multivariante). Madrid: Mc Graw-Hill. Se recomienda el capítulo 6:
Análisis factorial. Su contenido es el siguiente: Aspectos introductorio,
descriptivos y matriz de correlaciones, extracción de factores, rotación y
puntuaciones factoriales. Este capítulo presenta en forma muy didáctica los pasos
necesarios para aplicar el análisis factorial, usando el programa SPSS como
herramienta tecnólogica.
239
CAPITULO XIII
VALIDACIÓN DE INVESTIGACIONES CUALITATIVAS
Objetivo
Confiabilidad
240
Goetz y LeCompte (1.988) expresan sobre la confiabilidad de los estudios
etnográficos, lo siguiente:
“...lo que se pretende, en efecto, es coincidir en la descripción y
composición de los acontecimientos y no en la determinación de la
frecuencia... Un escenario puede admitir sólo a uno o unos pocos
observadores. Sin una corroboración aportada por otros, la investigación
realizada puede ser acusada de idiosincrásica y carente de un registro
cuidadoso y sistemático de los fenómenos para proteger sus estudios de
las amenazas a su fiabilidad interna, los etnógrafos suelen utilizar una de
estas cinco estrategias: Descriptores de bajo nivel inferencial, varios
investigadores, participantes ayudantes, revisión por otros investigadores
y datos registrados automáticamente”. (p. 221).
241
Kurt y Miller, citado por Pérez Serrano (1.998), establece una clasificación
diferente, a la de confiabilidad interna y externa presentada por Martínez y Goetz y
LeCompte. A continuación se presenta la mencionada clasificación:
“(a) Fiabilidad quijotesca: se refiere a las circunstancias en las que un
único método de observación da lugar de forma continuada a una medida
invariable..., (b) Fiabilidad diacrónica: consiste en la estabilidad de una
observación a través del tiempo que puede comprobarse al repetir las
medidas, pero teniendo en cuenta que sólo tendrá utilidad en aspectos
inalterables de un determinado período, (c) Fiabilidad sincrónica: implica
la semejanza de la observación dentro del mismo período de tiempo.
Raramente implica observaciones idénticas, sino el hecho de que sean
consistentes respecto a rasgos relevantes”. (p.p. 77 y 78).
Validez
242
único, de un grupo –y en varios momentos- utilizando perspectivas diversas y
múltiples procedimientos”. (p. 81).
2. Saturación: “...‘consiste en reunir las pruebas y evidencias suficientes para
garantizar la credibilidad de la investigación’. Se consigue revisando el proceso o
repitiendo de nuevo el estudio para comprobar si los resultados se mantienen”. (p.
84).
3. Validez respondente o negociación: “consiste en validar los resultados e
informes de la investigación básicamente mediante contraste de los puntos o
resultados obtenidos por el investigador con los de otros compañeros, informadores,
observadores, así como con las personas implicadas”. (p.p. 84 y 85).
243
tratamiento. Los sujetos de estudio se analizan tal cual como se comportan en su
ambiente natural.
4. Mortalidad: En la investigación cualitativa, a diferencia de la investigación
experimental que puede sustituir a los sujetos que desaparecen de la investigación, la
mortalidad de sujetos en la investigación cualitativa no se reemplaza, sino que se
estudian sus efectos en el problema o fenómeno estudiado.
5. Conclusiones espurias: cuando se realiza una investigación, incluso es válido
para la investigación experimental, el investigador debe ser sumamente cuidadoso y
analítico cuando elabora las conclusiones del estudio, porque en esta fase tan
importante de un trabajo, muchos investigadores establecen relaciones y conclusiones
equivocadas.
244
la realidad se analiza, tal como se presenta: intacta. Esta concepción del mundo tan
diferente, origina que la validación de instrumentos cualitativos difiera en cuanto a su
procedimiento. En este tipo de investigación; la validación se fundamenta, más que
en análisis numéricos, en patrones descriptivos y observacionales, donde la
diversidad de instrumentos y opiniones de diferentes observadores e investigadores,
determina la confiabilidad y validez de las investigaciones. A diferencia de las
investigaciones insertas dentro del paradigma “científico”, donde se valida es el
instrumento; en la investigación naturalista y holística, se valida es la investigación
como un todo, apoyándose en la descripción e interpretación de los datos, más que en
el análisis numérico de los mismos.
Ejercicios propuestos
245
Referencias
Lecturas Sugeridas
246
ANEXOS
247
ANEXO A
Índice de dificultad de los ítemes a través del programa excel.
Pasos:
CENTRAR TÍTULOS
248
espacio donde desea escribir y centrar el título---clic en el icono de combinar y
centrar.
249
A B C D E F G
1 TABLA 1. MATRIZ ORIGINAL DE DISCRIMINACIÓN DE DATOS DICOTÓMICOS
2 item1 item2 item3 item4 item5 item6
3 0 0 1 0 1 1
4 1 1 1 1 1 1
5 1 0 0 0 0 0
6 0 1 1 1 1 1
7 1 0 1 1 0 1
8 0 0 0 1 1 1
9 1 1 1 0 0 0
10 0 0 0 1 1 1
11 1 1 0 0 0 0
12 0 0 1 1 0 0
13 0 0 0 0 1 1
14 1 1 1 1 1 1
A B C D E F G
1 TABLA 2. INDICE DE DIFICULTAD DE LOS ITEMES
2 item1 item2 item3 item4 item5 item6
3 0 0 1 0 1 1
4 1 1 1 1 1 1
5 1 0 0 0 0 0
6 0 1 1 1 1 1
7 1 0 1 1 0 1
8 0 0 0 1 1 1
9 1 1 1 0 0 0
10 0 0 0 1 1 1
11 1 1 0 0 0 0
12 0 0 1 1 0 0
13 0 0 0 0 1 1
14 1 1 1 1 1 1
15 TOTAL 6 5 7 7 7 8
16 INDICE DIF./ITEM 50.00 41.67 58.33 58.33 58.33 66.67
17 INDICE DIF./PROMEDIO 55.56
250
ANEXO B
251
inferior es =SUMA(B11:B14). Al calcular los totales de ambos grupos se puede
aplicar la fórmula que determina el índice de discriminación de los ítemes.
8. Debajo de la línea que contiene los totales del grupo inferior (debajo de la celda
que contiene los totales del primer ítem) escriba la fórmula para calcular el índice de
discriminación (ver tabla 4). La fórmula es la siguiente: (total GS-total GI)/tamaño de
uno de los grupos. En el ejemplo ilustrado la fórmula es la siguiente =(B7-B15)/4. Al
escribirla oprimir Enter. Luego copie y pegue la fórmula para el resto de los ítemes.
9. Recuerde grabar en su disquete 3 ½, los cambios introducidos
10. Interprete los resultados, tomando en cuenta la siguiente escala:
252
A B C D E F G
1 TABLA 1. MATRIZ ORIGINAL DE DISCRIMINACIÓN DE DATOS DICOTÓMICOS
2 item1 item2 item3 item4 item5 item6
3 0 0 1 0 1 1
4 1 1 1 1 1 1
5 1 0 0 0 0 0
6 0 1 1 1 1 1
7 1 0 1 1 0 1
8 0 0 0 1 1 1
9 1 1 1 0 0 0
10 0 0 0 1 1 1
11 1 1 0 0 0 0
12 0 0 1 1 0 0
13 0 0 0 0 1 1
14 1 1 1 1 1 1
A B C D E R G H
1 TABLA 2. CÁLCULOS DE TOTALES
2 item1 item2 item3 item4 item5 item6 TOTAL
3 0 0 1 0 1 1 3
4 1 1 1 1 1 1 6
5 1 0 0 0 0 0 1
6 0 1 1 1 1 1 5
7 1 0 1 1 0 1 4
8 0 0 0 1 1 1 3
9 1 1 1 0 0 0 3
10 0 0 0 1 1 1 3
11 1 1 0 0 0 0 2
12 0 0 1 1 0 0 2
13 0 0 0 0 1 1 2
14 1 1 1 1 1 1 6
A B C D E F G
1 TABLA 3. ORDENACIÓN DE TOTALES
2 item1 item2 item3 item4 item5 item6
253
3 1 1 1 1 1 1
4 1 1 1 1 1 1
5 0 1 1 1 1 1
6 1 0 1 1 0 1
7 0 0 1 0 1 1
8 0 0 0 1 1 1
9 1 1 1 0 0 0
10 0 0 0 1 1 1
11 1 1 0 0 0 0
12 0 0 1 1 0 0
13 0 0 0 0 1 1
14 1 0 0 0 0 0
A B C D E F G H
1 TABLA 4. CONFORMACIÓN DE LOS GRUPOS Y RESULTADOS DEL ANÁLISIS DE DISCRIMINACIÓN
2 item1 item2 item3 item4 item5 item6 TOTAL
3 1 1 1 1 1 1 6
4 1 1 1 1 1 1 6
5 0 1 1 1 1 1 5
6 1 0 1 1 0 1 4
7 total GS 3 3 4 4 3 4
8
9
10
11 1 1 0 0 0 0 2
12 0 0 1 1 0 0 2
13 0 0 0 0 1 1 2
14 1 0 0 0 0 0 1
15 TOTAL GI 2 1 1 1 1 1
16 ID 0.25 0.50 0.75 0.75 0.50 0.75
254
ANEXO C
RUTINA:
FASE 1
Para calcular los totales de los sujetos presentamos dos procedimientos, el primero de ellos, es a través
del Menú Transformar. Este procedimiento es fácil de desarrollar; pero es muy laboriosa cuando el
número de ìtemes es elevado. Hay otro procedimiento siguiendo un artificio informàtico que consiste
en transponer la matriz de datos, procedimiento que presenta cierto nivel de dificultad para quienes no
poseen conocimientos básicos de computación; pero es sumamente rápido para aquellas personas con
cierta destreza informática. Este segundo procedimiento no es recomendable si el usuario posee un
adiestramiento insuficiente en computación.
Para el cálculo de los totales se deben seleccionar uno de los dos procedimientos:
Opciòn 2:
Item001+item002+item003+………………………………………+itemN
5. Al transferir todos los ítem al recuadro “Expresión numérica”, clic en aceptar.
255
3. En el cuadro que aparece se transfieren todos los ítem al rectángulo Variables. Debe tener cuidado
de no transferir otras variables (como por ejemplo edad, sexo, grado, etcétera.) diferentes a ítem
4. Clic en Aceptar
5. Si en la matriz de datos hay otras variables diferentes a ítem, aparece una advertencia que dice: “
...se perderán las variables no transpuestas”. Hacer Clic en Aceptar. Luego aparecen los resultados de
transponer la matriz. Clic en Cerrar.
6. Aparece un cuadro de diálogo que dice: ”¿ Desea guardar el contenido del navegador de
resultados en Resultados?. Clic en no.
7. Aparece la nueva matriz de datos con los sujetos en las columnas y las variables en las filas. Hacer
clic en el Menú Estadísticos → clic resumen → clic en descriptivas. Al aparecer el cuadro,
transferir las var (que son los ítems) al rectángulo variables → clic en opciones: dejar sólo
activado el estadístico suma y desactivar el resto→ Clic en continuar → clic en aceptar. Se
visualizan los resultados con los ítem y sus respectivos N (total ítems/sujeto) y la suma de las
calificaciones totales de cada sujeto.
8. Se seleccionan los resultados, haciendo clic en cualquier parte de los mismos. Se verán dentro de
un recuadro..
9. Nota: Válido solamente cuando no se visualizan todos los resultados en la ventana activa . Cuando
no es el caso, omitir y pasar al paso siguiente
Hacer doble clic dentro del recuadro. Debe aparecer un cuadro de diálogo. Active la segunda opción
del cuadro de diálogo que dice: editar este elemento en su lugar con barras de desplazamiento →
clic en aceptar.
10. Clic donde aparece el total del primer sujeto (deber asegurarse que el cursor esté en la celda que
corresponde al total del primer sujeto). Mantenga oprimida la tecla ↑ (o shift), sin soltarla. Luego
arrastre (sombrear) los totales desde el primer sujeto hasta el último sujeto. En el proceso de arrastre
con la tecla ↓ (flecha de desplazamiento hacia abajo) debe mantener sin soltar la tecla ↑ ( o shift) hasta
que termine de sombrear todos los totales de los sujetos. Cuando tengamos seguridad que todos los
valores están sombreados podemos soltar la tecla, hacemos clic con el botón derecho del ratón y
elegimos la opción cortar o copiar. Luego cerramos los resultados.
11. En el cuadro de diálogo donde se pregunta si desea guardar los resultados, haga clic en no.
12. Aparece la matriz transpuesta. La cerramos y en el cuadro que dice: “¿ Desea guardar el contenido
editor de datos en sin titulo?” , hacemos clic en no.
13. Abrimos el archivo donde se quiere pegar los totales.
14. En el archivo abierto creamos una nueva variable: Totales. Hacemos clic en la casilla en blanco,
correspondiente al primer sujeto y de nuevo hacemos clic pero con el botón derecho del ratón. Se elige
la opción pegar. Aparecerán todos los totales de los sujetos en su casilla correspondiente.
256
FASE II
257
FASE III
¿CÓMO INTERPRETAR LOS RESULTADOS?
En los resultados aparecen dos cuadros: el primero presenta estadísticos descriptivos de los grupos. El
segundo cuadro presenta la prueba T de Student para muestras independientes. Este cuadro presenta
dos partes sucesivas. En la primera se determina la homogeneidad de las varianzas en los grupos
sometidos a contraste de hipótesis y, luego, dependiendo si presentan varianzas iguales o desiguales, se
presentan los resultados de la prueba T de Student. Se procede a comparar el nivel de significación
(sig. bilateral), asociado a la hipótesis nula, con un valor alfa ( ), asociado a la hipótesis alterna; el
cual comúnmente se le asigna los valores 0,05 ó 0,01.
Si el valor de significación (sig. bilateral) es mayor a alfa (), indica que se acepta la hipótesis nula de
no diferencia entre el grupo superior e inferior, evidenciándose que el ítem no discrimina. Si ocurre el
caso contrario, que el nivel de significación es menor o igual a alfa, entonces se rechaza la hipótesis
nula de no diferencias entre los grupo. Este último resultado indica que el ítem tiene capacidad de
discriminación.
1. Determine si las varianzas son iguales o desiguales: compare el valor significación (sig.) con
un valor de rechazo alfa (). Si sig (en este caso = 0.05) se acepta la hipótesis nula,
demostrándose que las varianzas son iguales. En caso contrario (sig. ≤ a ), se rechaza la
hipótesis nula, siendo las varianzas desiguales.
2. Después de determinar la condición de las varianzas, se contrasta los grupos (superior e
inferior), a través de la T de Student para muestras independientes, tomando el nivel de
significación (sig. Bilateral) de acuerdo a la condición de la varianza (es decir, sí son iguales ó
desiguales). Se compara el sig. Bilateral con un valor de rechazo alfa, si sig. Bilateral mayor
a alfa (sig. bilateral ) se acepta la hipótesis nula, concluyéndose por lo tanto que el ítem
no discrimina. Si sucede el caso contrario, (sig. bilateral ≤ a ), se rechaza la hipótesis nula.
Se determina en este caso que las medias tienen diferencias significativas y por lo tanto el
ítem tiene capacidad de discriminación.
258
ANEXO D
259
a b c d e f
1 Tabla 1. Matriz original de datos para calcular el coeficiente de confiabilidad Kuder-Richardson
2 item1 item2 item3 item4 item5
3 1 1 1 1 1
4 1 1 1 1 1
5 0 1 1 1 1
6 1 0 1 1 1
7 0 1 1 1 1
8 1 1 1 1 0
9 1 1 1 0 0
10 0 0 1 1 1
11 0 1 1 0 0
a b c d e f g
1 Tabla 2. Càlculo de los totales de sujetos e ìtemes para obtener el coeficiente de confiabilidad Kuder-Richardson
2 item1 item2 item3 item4 item5 total
3 1 1 1 1 1 5
4 1 1 1 1 1 5
5 0 1 1 1 1 4
6 1 0 1 1 1 4
7 0 1 1 1 1 4
8 1 1 1 1 0 4
9 1 1 1 0 0 3
10 0 0 1 1 1 3
11 0 1 1 0 0 2
12 total 5 7 9 7 6 34
a b c d e f g
260
1 Tabla 3. Càlculo de las varianzas individuales para obtener el coeficiente de confiabilidad Kuder-Richardson
2 item1 item2 item3 item4 item5 total
3 1 1 1 1 1 5
4 1 1 1 1 1 5
5 0 1 1 1 1 4
6 1 0 1 1 1 4
7 0 1 1 1 1 4
8 1 1 1 1 0 4
9 1 1 1 0 0 3
10 0 0 1 1 1 3
11 0 1 1 0 0 2
12 Total respuestas 5 7 9 7 6 34
13 p=Total respuestas/total sujetos 0,56 0,78 1,00 0,78 0,67
14 q=1-p 0,44 0,22 0,00 0,22 0,33
15 varianzas individuales=p*q 0,25 0,17 0,00 0,17 0,22 0,81
a b c d e f g
1 Tabla 4. Càlculo de la varianza total para obtener el coeficiente de confiabilidad Kuder-Richardson
2 item1 item2 item3 item4 item5 total
3 1 1 1 1 1 5
4 1 1 1 1 1 5
5 0 1 1 1 1 4
6 1 0 1 1 1 4
7 0 1 1 1 1 4
8 1 1 1 1 0 4
9 1 1 1 0 0 3
10 0 0 1 1 1 3
11 0 1 1 0 0 2
12 Total respuestas 5 7 9 7 6 34
13 p=Total respuestas /total sujetos 0,56 0,78 1,00 0,78 0,67
14 q=1-p 0,44 0,22 0,00 0,22 0,33
15 varianzas individuales=p*q 0,25 0,17 0,00 0,17 0,22 0,81
16 varianza total 0,94
261
a b c d e f g
1 Tabla 5. Càlculo el coeficiente de confiabilidad Kuder-Richardson
2 item1 item2 item3 item4 item5 total
3 1 1 1 1 1 5
4 1 1 1 1 1 5
5 0 1 1 1 1 4
6 1 0 1 1 1 4
7 0 1 1 1 1 4
8 1 1 1 1 0 4
9 1 1 1 0 0 3
10 0 0 1 1 1 3
11 0 1 1 0 0 2
12 Total respuestas 5 7 9 7 6 34
13 p=Total respuestas/total sujetos 0,56 0,78 1,00 0,78 0,67
14 q=1-p 0,44 0,22 0,00 0,22 0,33
15 varianzas individuales=p*q 0,25 0,17 0,00 0,17 0,22 0,81
16 varianza total (Vt) 0,94
17 KD=(n/(n-1))*((Vt-p*q)/Vt) 0,1715686
262
ANEXO E
-Abrir el archivo que contiene la base de datos del instrumento en proceso de validación.
Antes de realizar el análisis factorial debe excluir del instrumento los ítem que no
discriminan ni aportan confiabilidad al instrumento. A continuación realice la siguiente
rutina:
RUTINA:
-Clic en aceptar.
Opción “Variable de selección”: es una variable filtro que tiene como función realizar
el análisis factorial en submuestras de una variable, por ejemplo, si se tiene la variable
sexo, cuyos valores son: masculino=1 y femenino=2; y se està interesado en
determinar como se comporta el anàlis factorial en el sexo femenino, se hace clic en
valor y se coloca en “Valor para la variable de selección” el nùmero 2. Si no interesa
determinar el comportamiento de submuestras de una variable se omite esta opción.
263
Cuando el determinante es exactamente cero, el programa SPSS no presenta los
resultados del KMO ni de la prueba de Bartlett. En este caso se asume que la intercorrelaciòn
entre los ítem es perfectamente lineal, y por lo tanto, es viable proseguir con el análisis
factorial.
En el caso de del índice KMO el criterio para interpretar los resultados es el
siguientes:
1 KMO > 0,90 son considerados excelentes.
0,90 KMO > 0,80 son considerados buenos.
0,80 KMO > 0,70 son considerados aceptables.
0,70 KMO > 0,60 son considerados mediocres o regulares.
0,60 KMO > 0,50 son considerados malos
KMO 0,50 son considerados inaceptables o muy malos.
Opciòn “Extracción”: En “Método” dejar la opción que por defecto tiene el programa
SPSS: “Componentes principales”. Con respecto al resto de las opciones, se
recomienda dejar activada: “Autovalores mayores a 1” (que está por defecto) y en
cuanto a la opción “Número de factores” se puede activar, si se está interesado en fijar
un límite de factores para analizar, es decir, cuando no se desea tomar en cuenta el
máximo de factores que genera la aplicación del análisis factorial. Si se desea limitar el
número de factores, se debe analizar la varianza total explicada por los factores
(presentada por defecto), la cual no debe ser menor del 50% acumulada por el último
factor. En caso de ser menor a este porcentaje, se debe aumentar el número de factores;
con el propósito de incrementar la varianza total explicada.
264
Opciòn “Rotación”: se recomienda activar la opción Varimax, el cual es el método de
rotación de mayor aplicación cuando se calcula la matriz de componentes rotados.
Cuando se calculan los factores, es recomendable una solución rotada; porque la
solución no rotada es ambigua y puede presentar varias soluciones, hecho que no
ocurre cuando se rotan los factores.
...cada factor debe tener algunas variables que se correlacionen con él casi
exclusivamente (la mayoría de las variables que se correlacionan altamente con
ese factor no deben correlacionarse más de 0,3 con cualquier otro factor), y las
variables marcadoras... deben correlacionarse por encima de 0,5...(p. 603)
265