Anda di halaman 1dari 30

• Construcción

de escalas

• Una vista rápida al proceso de


Estas diapositivas constituyen una introducción al seminario de Construcción de
Instrumentos de Evaluación Psicológica y un resumen del material principal de lectura.
Dicho material titulado “Orientaciones prácticas para la construcción de Escalas de
Evaluación Psicológica” (Morosini, 2016) de la Serie Apuntes Metodológicos, presenta un
desarrollo mayor sobre cada paso y anexos computacionales para la realización de análisis
de reactivos, análisis de confiabilidad y validez tanto en planillas electrónicas de Open
Office como en R-Commander.
En los anexos se presentan ejemplos y ejercicios que constituyen la base de otro material
que se encuentra en etapa de desarrollo y será publicado como un manual breve en edición
digital y libre disponible para su descarga.
El material, una vez finalizado pretende ofrecer a estudiantes, docentes e investigadores una
herramienta actualizada y en español de apoyo al creciente interés por construir
instrumentos de medición y evaluación.
Las críticas, observaciones y comentarios que tengan sobre el contenido serán de
valiosísima utilidad y acogidos gratamente.

• Objeto y finalidad

• Defina claramente lo que pretende medir.

• Este paso parecerá muy obvio, sin embargo, la selección del tema debería realizarse
de manera cuidadosa y asegurarse de contar con las fuentes bibliográficas necesarias,
un marco teórico de referencia y antecedentes de estudios similares.

• Establezca con claridad cuáles son los objetivos de la prueba, considerando que esta
definición puede condicionar los requerimientos de calidad psicométrica para valorar
la prueba. La finalidad de la prueba puede ser: investigación, clasificación, selección
o diagnóstico.

• Marco conceptual

• Realice una amplia exploración bibliográfica, permítase establecer con claridad un


marco teórico sólido y antecedentes de investigación sobre el tema.
• Elabore un marco conceptual concreto, adscriba su(s) definición(es) a una teoría
sustantiva o reformule la definición del constructo incorporando elementos
conceptuales de diferentes teorías que sean consistentes con los objetivos del estudio.
En esta etapa puede ser útil la consulta a expertos en el tema.

• Operacionalización

• Operacionalice el constructo que va a evaluar, enfóquese en el uso coloquial del


constructo y las circunstancias en las que se manifiestan las conductas que responden
al dominio, elabore una estructura del concepto que permita identificar dimensiones y
factores. Redacte una frase configurativa del constructo y luego elabore una tabla de
especificaciones que caracterice cada dimensión y describa los reactivos necesarios
para representar suficientemente cada dimensión.

• Definición operacional
Como lo afirma Dancer (1990), a diferencia de algunos otros componentes de la
investigación científica, las definiciones no requieren de prueba. En consecuencia, las
definiciones son, en cierto modo, arbitrarias. Dado su carácter arbitrario, una pregunta
importante que necesita ser abordada es “¿Qué propiedades deben caracterizar a una
definición con el fin de sea útil a la comunidad científica, útil para facilitar la investigación
empírica y útil para promover resultados acumulativos?”

• Definición operacional

• Guttman (1950) sostuvo que con el fin de promover la investigación científica


rigurosa, los conceptos científicos se deben definir en términos de observaciones
empíricas u operaciones en datos empíricos y que en la medida en que no se consiga
una definición con correspondencia empírica ésta no sería útil para la ciencia (Dancer,
1990).

• Frase configurativa

• Canter (1983) indica que una forma de resumir el conjunto completo de todos los
perfiles de acciones posibles es mediante una "frase configurativa", la cual se define
como "un enunciado verbal del dominio y del rango de un mapa (trazado o ruta)
incluyendo conexiones entre facetas como en el lenguaje ordinario".

• Frase configurativa

• La frase configurativa es un aporte específico de la Teoría de Facetas de Guttman y se


construye a partir de la combinación de la facetas: P (características de las personas),
C (componentes del contenido) y R (rango de respuestas que caracterizan el
constructo).
• Tabla de especificaciones (TE)

• Es una tabla de doble o triple entrada en la cual se consigan las dimensiones del
constructo a evaluar.

• Las dimensiones pueden tener distintos elementos, lo más habitual es combinar


conductas x situaciones.

• Otro aspecto a considerar es el peso que se le asigna a cada conducta.

• Elaboración de la TE

• Realice un listado de los aspectos que representan el constructo.

• Para esto puede servir un listado de características identificadoras.

• Definir los contextos vinculados.

• Generar la tabla de especificaciones.

• Indicar el número de reactivos que representarán cada celda de la tabla.

• Tabla de especificaciones

• Una tabla de especificaciones tendría este aspecto y en cada celda deberá indicarse el
número de reactivos.

• Redacción de ítems

• Prepare el primer conjunto de reactivos considerando que los mismos deben ser
claros, concisos y simples.

• Evite expresiones como “siempre” o “nunca” y la utilización de frases que impliquen


negación.

• Asuma la posición de la persona encuestada y haga su mayor esfuerzo para que los
reactivos sean accesibles a la comprensión y faciliten un compromiso de sinceridad y
exactitud en las respuestas.

• Redacción de ítems
• Adopte formulaciones consistentes a lo largo de toda la prueba: en la estructura del
enunciado (persona, número, género, tiempos verbales), en la extensión de cada
reactivo, en el tono de las expresiones, en el nivel de formalidad (o tuteo), etc.

• Incluya reactivos “positivos” y “negativos”, es decir, tanto aquellos que reafirmen la


presencia de determinado dominio como su ausencia.

• Reflexione sobre el tipo adecuado de reactivo en concordancia con el tipo de escala y


los objetivos de su estudio (dicotómica, tipo Likert, de frecuencia de respuestas,
diferencial semántico, etc.).

• Además, deberá decidir sobre el número conveniente de opciones o niveles de las


respuestas, si no tiene elementos suficientes para esta decisión ponga a prueba los
diferentes formatos.

• Redacción de ítems

• La cantidad de reactivos dependerá de las delimitaciones establecidas en el punto


anterior y deben representar suficientemente cada dimensión, por lo que deberá
ajustarse a la tabla de especificaciones, recuerde, además, que durante el proceso de
prueba los reactivos sufrirán cambios o serán descartados, por lo que deberá redactar
tres o cuatro veces más reactivos del número que supone deberán constituir la versión
final. Puede resultar muy útil revisar reactivos de otros instrumentos que midan
constructos similares, sin embargo, evite la tentación de reproducir los ítems en el
nuevo instrumento.

• Tipos diferentes de ítems

 Cuestionarios de selección múltiple.

 Cuestionarios de sí o no (escalas aditivas)

 Inventarios tipo Likert.

 Comparaciones tipo Thurstone.

 Escala acumulativa tipo Guttman.

 Diferencial Semántico.

 Listado de Sustantivos.
 Listado de adjetivos.

• Evaluación de jueces

• Acuda a jueces expertos que le ayuden a evaluar la adecuación, calidad, suficiencia y


pertinencia de los reactivos redactados. Invite a personas cuya opinión sea relevante y
criteriosa, que sean consecuentes con la tarea de evaluar cada reactivo y que tengan la
capacidad y predisposición de reflexionar sobre lo que se pretende abarcar con la
prueba y,
por lo tanto, qué tan bien aborda
el tema cada reactivo.

• Evaluación de jueces

• Aquí se realiza la primera etapa de correcciones y selección de reactivos y por esta


razón es que debe considerar cuidadosamente los criterios con los que seleccione a
cada persona como juez experto, la cantidad de expertos (cuanto más, mejor, como
mínimo deberán ser 3) y de qué manera se aprovechará la información ofrecida por
los jueces. Existen índices cuantitativos para valorar la opinión de los jueces (Lawshe,
1975; Rovinelli y Hambleton, 1976) pero recuerde que la información cualitativa en
esta etapa es fundamental para mejorar la redacción de los reactivos y la
representatividad de cada dominio.

• Razón de validez de contenido

• Lawshie (1975) propuso un coeficiente que permita cuantificar el grado de consenso


existente entre jueces que evaluaran el grado de pertinencia de un determinado
reactivo para la evaluación del constructo para el cual fue redactado.

• Para ello se solicita a un panel de jueces que indique el grado en que el reactivo es:

– Esencial

– Útil, más no esencial, o

– No necesario
Para evaluar el dominio propuesto.

• Razón de validez de contenido

• A partir de la evaluación de cada ítem, por parte de cada juez (en forma
independiente), se calcula la “Razón de Validez de Contenido”:

𝐶𝑉𝑅=��𝑛�𝑒�−𝑁/2�𝑁/2�
En donde,
CVR = Content Validity Ratio (Razón de Validez de Contenido).
ne = Número de jueces que consideró el ítem como esencial.
N/2 = El número total de jueces divido por dos.

• En teoría los coeficientes pueden variar entre -1 y 1 y se ofrecen valores aceptables


según la cantidad de jueces que participen del panel de consulta.

• Interrogatorio cognitivo

• Realice un interrogatorio cognitivo de la prueba, evalúe a personas que compartan


características con la población-objetivo e indague sobre la comprensión que alcanzó
cada persona sobre cada ítem (efectivamente se trata de una evaluación individual y
cualitativa), puede utilizar el modelo de “protocolo abierto” o “pensamiento en voz
alta” para interrogar acerca de qué proceso interno se movilizó al responder a cada
reactivo, el objetivo es que la reproducción que haga cada sujeto coincida con el
sentido original del aspecto indagado por el ítem.

• Interrogatorio cognitivo

• Para esta etapa se requiere la participación de por lo menos diez personas que
representen diversas características de la población: sexo, edad, nivel de instrucción y
comprensión, etc. (considere los factores que podrían incidir en la comprensión de la
prueba).

• La tarea principal consiste en solicitar a cada persona evaluada que responda el ítem y
luego indique qué pensó cuando lo respondió, es decir, cuál fue su interpretación y de
qué manera construyó su respuesta.

• La idea principal es comprobar si el proceso se corresponde con lo pretendido


originalmente.

• Validez de contenido

• La validez de contenido en el interrogatorio cognitivo es un proceso absolutamente


cualitativo.

• Considere que cada sujeto representa a una probable proporción de la población, por
lo que cualquier dificultad o distorsión en la comprensión deberá ser atendida para
mejorar la redacción del reactivo.

• Si todos los reactivos fueron comprendidos correctamente se concluye la validación


de contenido (en esta etapa, recordemos que la validez de contenido abarca más
aspectos).
• Prueba pre-piloto

• Revise cuidadosamente cada reactivo, incorpore las observaciones realizadas por los
jueces expertos y los comentarios que hayan hecho los participantes del interrogatorio
cognitivo. Prepare una versión de la prueba lista para aplicar y ejecute una prueba pre-
piloto:

• Prueba pre-piloto

• Si ha obtenido varias formas de plantear un ítem incluya a todas para que pueda optar
por aquella que presente mejores índices psicométricos. Asimismo puede preparar
versiones de la prueba que incluya diferentes formas o niveles de respuesta
(dicotomías, opciones en cantidades pares e impares, etc.), sin embargo considere que
esto lo obligará a aplicar las diferentes versiones a una misma persona o a duplicar o
triplicar el tamaño de la muestra para poner a prueba cada versión y optar por la que
muestre mejor rendimiento.

• Prueba pre-piloto

• Planifique un muestreo incluyendo personas con características similares a la de la


muestra final, incluya la mayor diversidad de características que pudieran influir
sobre las respuestas: sexo, edad, nivel de instrucción, nivel socioeconómico, etc. En
cuanto al número de personas necesarias lo ideal sería incluir a 100 evaluados, en
caso de no poder acceder a este número intente encuestar a por lo menos 30 personas.

• Prueba pre-piloto

• Asegúrese de que las condiciones de aplicación del instrumento sean las más
adecuadas a la finalidad de la evaluación de la prueba, debe quedar claro que en el
interés se enfoca en el funcionamiento de la prueba más que en las características de
las personas evaluadas por lo que deberá controlar cualquier factor que pudiera incidir
sobre las respuestas que no fueran los propios reactivos del instrumento.

• Revisión de la prueba

• Registre todos los aspectos críticos de la prueba: duración, consulta sobre reactivos
que no han resultado claros, actitud ante la prueba, etc.

• Analice las respuestas y evalúe las características de cada reactivo:

– Analice patrones de respuestas: conjuntos de respuestas sistemáticas que


pudieran ser inconsistentes con un determinado rasgo o actitud.
• Análisis de ítems

• Calcule los índices descriptivos de cada reactivo:

– Tendencia central: media, moda, medina.


– Dispersión: desviación típica, coeficiente de variabilidad.
– Distribución absoluta y relativa de cada opción de respuesta.
– Correlación ítem-total.
– Correlación inter-ítems.
• Selección de ítems

• Seleccione los reactivos que se ajusten a los índices que haya establecido como
preferibles. Resulta crucial que se establezcan parámetros de aceptación antes de
realizar los cálculos:

– valores promedio próximos al punto medio de la escala

– alto nivel de variabilidad

– moderados coeficientes de correlación ítem total)

– cuide que las decisiones no afecten la representación del constructo que se


valora (no opere solo con criterios cuantitativos)

• Selección de ítems

• Evalúe la necesidad de modificar aquellos reactivos cuyos índices no fueran


satisfactorios (preste atención a aquellos cuya redacción suene confusa en su
planteamiento, que incluya más de una idea u otra característica que pudiera explicar
índices no satisfactorios). Es probable que se requiera la redacción de nuevos
reactivos, los cuales deberán someterse a los procesos anteriores (evaluación de
jueces, comprensión y pre-piloto).

• Ejemplo de análisis de ítems

• Ejemplo de análisis de ítems

• Ejemplo de análisis de ítems


• Prueba piloto

• Incorpore las modificaciones que considere necesarias, prepare una versión preliminar
de la prueba y proceda con la prueba piloto:
– Realice un plan de muestreo que asegure la obtención de índices psicométricos
consistentes (de 5 a 10 personas por reactivo) y la representatividad de la
población de estudio (considere la necesidad de realizar un muestreo
estratificado o por conglomerados), se recomienda un mínimo de 300 o 500
personas, recomendación que debe ser considerada críticamente en cada caso.
– Seleccione a los participantes siguiendo en forma rigurosa el plan de muestreo
planificado.
– Asegúrese de que las condiciones de aplicación favorezcan las mejores
respuestas.

• Plan de muestreo

• Además, elabore un cuidadoso plan de muestreo y recuerde que todo plan de


muestreo debe considerar los siguientes aspectos (Rodríguez, 1990):

– Tipo de muestreo.
– Marco de la muestra.
– Tamaño de la muestra.
– Parámetro a estimar:
• Modelo del error muestral.

• Plan de estimación del parámetro.

• Análisis de los ítems

• Realice un análisis de la prueba, repita los análisis realizados en la prueba pre-piloto


y, además realice:

– un análisis de la consistencia interna del test (coeficiente alfa de Cronbach)


– unde laanálisis factorial exploratorio que permita examinar la composición interna
escala, busque reproducir la estructura de factores y dimensiones
definidas inicialmente.
• Coeficiente Alfa de Cronbach

• El coeficiente Alfa de Cronbach es una estimación de la confiabilidad de la escala


basada en la consistencia interna del test.

• Existen discusiones críticas sobre su conveniencia, sin embargo, sigue siendo el


coeficiente más utilizado en la literatura referente a estudios instrumentales.

• Puede considerarse el límite inferior de la confiabilidad y se recomienda que los


valores sean iguales o superiores a α ≥ 0,75.

• Coeficiente Alfa de Cronbach

• Se utilizan dos fórmulas para el cálculo:

• Basado en las varianzas:

𝛼=��𝑘�𝑘−1���1−��𝑖=1�𝑘��𝑆�𝑖�2����𝑆�𝑡�2���

• Coeficiente Alfa de Cronbach

• Y la otra:

• Basada en las correlaciones entre ítems:

𝛼=�𝑘��𝑟��𝑖��1+��𝑟��𝑖��𝑘−1��

En donde:
𝑘= número de ítems
��𝑟��𝑖� = promedio de las correlaciones entre ítems que sería la
sumatoria de todas las relaciones �𝑟�𝑖𝑗� dividido por k.

• Coeficiente Alfa de Cronbach

• Análisis Factorial Exploratorio

• El análisis factorial es una técnica estadística para la extracción de factores latentes.


Se basa en la matriz de covarianzas y utiliza las correlaciones entre variables (en el
caso del análisis de instrumentos se utilizan las correlaciones entre ítems) para
identificar factores comunes que expliquen las relaciones entre las mismas.
• Análisis Factorial Exploratorio

• En la prueba de instrumentos se utiliza para confirmar que los reactivos se agrupen


conforme se planificó originalmente, formando dimensiones o factores. Para ello se
analizan las matrices de saturación factorial y se espera que los reactivos presenten
cargas factoriales compartidas con los demás que forman parte de una misma
dimensión o factor.

• Análisis Factorial Exploratorio

• Constituye la primera evidencia empírica sobre la validez de construcción del


instrumento (algunos autores aseguran que presenta la evidencia complementaria
sobre la validez de contenido).

• La explicación de los procedimientos analíticos serán expuestos en otro material. A


continuación se presenta una tabla típica del Análisis Factorial Exploratorio.

• Análisis Factorial Exploratorio

• Versión final de la prueba

• Prepare la versión final de la prueba junto con un informe del desarrollo de la escala,
especifique los procedimientos para la corrección e interpretación de las
puntuaciones. Prepare tablas normativas provisorias (recuerde que los estudios
normativos y de validación requieren un nuevo muestreo y procedimientos de
confirmación de los supuestos específicos para cada tipo de validez en cuestión).

• Manual del test

• Martínez (1996) recomienda que para la elaboración del manual de uso del test, se
consignen, necesariamente, los siguientes aspectos (p. 54):
– Usos a los que se puede dedicar el test.
– Instrucciones completas para su administración.
– Tablas de normas para convertir las puntuaciones brutas en otras interpretables.
– Coeficientes de fiabilidad y precisión de la medida del test.
– Datos sobre la validez del test para la finalidad o finalidades para las que fue
construido (…).
– Sugerencias sobre el posible uso de las puntuaciones del test.
• Bibliografía recomendada
Arce, C. (1994). Técnicas de construcción de Escalas Psicológicas. Madrid: Síntesis.
Bilsky, W. (2002). La Teoría de las Facetas: Informaciones Básicas y Aplicaciones
Paradigmáticas. Paraíba, Brasil: Autor.
Canter, D. (1983). The Potential of Facet Theory for Applied Social Psychology. Quality &
Quantity, 17, 35-67.
Canter, D. (1985). Facet Theory. Approaches to Social Research.
New York: Springer-Verlag.
Carretero-Dios, H. y Pérez, C. (2005). Normas para el desarrollo y revisión de estudios
instrumentales. IJCHP, 5 (3) 521-551.
Cea D’Ancona, M.A. (2002). Análisis Multivariable. Teoría y Práctica en la investigación
social. Madrid: Síntesis.
Clark, L. A. & Watson, D. (1995). Constructing Validity: Basic Issues in Objective Scale
Development. Psychological Assessment, 7 (3) 309-319.
Dancer, L. S. (1990). Introduction to Facet Theory and its Applications.
Applied Psychology: An International Review, 39 (4) 365-377.

• Bibliografía recomendada
DeVellis, R. F. (2003). Scale Development. Theory and Applications. 2nd Ed. California:
SAGE Publications.
Diener, E., Emmons, R. A., Larsen, R. J. y Griffin, S. (1985). The Satisfaction with Life
Scale. Journal of Personality Assessment, 49, 71-75.
Edwards, A. L. y Kilpatrick, F. P. (1976). Una técnica para elaborar escalas de actitudes. En
Summers, G. F. (Ed.). Medición de actitudes (pp. 311-323). México: Trillas.
(Reimpreso de Edwards, A. L. y Kilpatrick, F. P., A technique for the construction of
attitude scales. Journ. Appl. Psych., 1948, 32, 374-384).
Fitzpatrick, A. R. (1983). The Meaning of Content Validity. ApPsyMeas, 7 (1) 3-13.
Guttman, L. (1976). Bases para elaborar técnicas con datos cualitativos.
En Summers, G. F. (Ed.), Medición de actitudes (pp. 311-323). México: Trillas.
(Reimpreso de L. Guttman, A basis for scaling qualitative data. American Sociological
Review, 1944, 9, 139-150).
Guttman, R. & Greenbaum, Ch. W. (1988). Facet Theory: Its Development and Current
Status. European Psychologist, 3, 1, pp. 13-36.

• Bibliografía recomendada
Kerlinger, F. y Kaya, E. (1976). Elaboración y validación analítico factorial de escalas para
medir actitudes hacia la educación. En Summers, G. F. (Ed.), Medición de actitudes
(pp. 311-323). México: Trillas. (Reimpreso de Kerlinger, F. N. & Kaya E., The
predictive validity of scales constructed to measure attitudes toward education. Educ.
psychol. Measmt., 1959, 19, 305-317).
Lawshe, C. H. (1975). A Quantitative Approach to Content Validity. Personnel Psychology,
28, 563-575.
Levy, S. (1976). Use of Mapping Sentence for Coordinating Theory and Research: A cross-
cultural example. Quality and Quantity, 10, 117-125.
Likert, R. (1976). Una técnica para medir actitudes. En Summers, G. F. (Ed.). Medición de
actitudes (pp. 311-323). México: Trillas. (Reimpreso de Likert, R., A Technique for the
Measurement of Attitudes. Arch. Psych., 1932, 140).
Martínez, R. (1996). Psicometría: Teoría de los tests psicológicos y educativos. Madrid:
Síntesis.
Morales, P. (2006). Medición de actitudes en psicología y educación. 3ª ed. Madrid:
Comillas.

• Bibliografía recomendada
Morales, P. (2010). Guía para construir cuestionarios y escalas de actitudes. Madrid:
Comillas.
Muñiz, J., Fidalgo, A. M., García-Cueto, E., Martínez, R. y Moreno, R. (2005). Análisis de
los ítems. Madrid: Muralla.
Nunnally, J. C. & Bernstein, I. J. (1995). Teoría Psicométrica. 3a ed. México: McGraw-
Hill.
Osgood, Ch. E., Suci, G. J. y Tennenbaum, P .H. (1976) Medición de actitudes. En
Summers, G. F. (Ed.). Medición de actitudes (pp. 277-276). México: Trillas.
(Reimpreso parcialmente de Osgood, Ch. E., Suci, G. J. y Tennenbaum, P .H., 1959,
The Measurement of Meaning. Illinois: Illinois Press).
Osterlind, S. J. (1988/2002). Construct- Test Items: Multiple-Choice, Constructed-
Response, Performance, and Other Formats. 2nd ed. Dordrecht: Kluwer.
Rodríguez Osuna, J. (1991). Métodos de Muestreo. Madrid: CIS.
Rovinelli, R. J. y Hambleton, R. K (1976) On the Use of Content Specialists in the
Assessment of Criterion-Referenced Test Item Validity. Laboratory of Psychometric
and Evaluative Research Report No. 24.

• Bibliografía recomendada
Seiler, L. H. y Hough R. L. (1976). Comparaciones empíricas entre las técnicas de
Thurstone y Likert. En Summers, G. F. (Ed.). Medición de actitudes
(pp. 311-323). México: Trillas.
Seiler, L. H. y Hough R. L. (1976). Comparaciones empíricas entre las técnicas de
Thurstone y Likert. En Summers, G. F. (Ed.). Medición de actitudes
(pp. 311-323). México: Trillas.
Shye, S. (1998). Modern Facet Theory: Content Design and Measurement in Behavioral
Research. Europ. Journ. of Psychological Assessment, 14,2, 160-171.
Summers, G. F. (Comp.) (1976). Medición de actitudes. México: Trillas.
Thorndike, R. L. (1989). Psicometría Aplicada. México: Limusa.
Thurstone, L. L. (1976). Las Actitudes pueden medirse. En Summers, G. F. (Ed.), Medición
de actitudes (pp. 311-323). México: Trillas.
Van Den Wittenboer, G. (2001). On the Structure of Measures in Facet Theory. Quality &
Quantity, 35, 77-89.
Wainerman, C. H. (Comp.) (1976). Escalas de medición en ciencias sociales.
Bs. As.: Visión.
• ANEXOS

• Teoría de Facetas
Breve Introducción al enfoque Estructural de Guttman

• Teoría de Facetas

• La teoría de facetas se basa en los principios de la moderna teoría matemática de


conjuntos para definir el universo de contenidos representado por un conjunto finito
de variables.

• Teoría de Facetas

• La idoneidad de la teoría faceta como una herramienta para la formulación de las


definiciones de construcciones de comportamiento proviene de la claridad y precisión
que aporta al proceso de identificación de componentes básicos de un conjunto de
variables y de estos componentes en relación a los datos empíricos.

• Teoría de Facetas

• Al igual que la teoría de conjuntos, la Teoría de las Facetas es una teoría estructural.

• En esencia, se ofrece una aproximación a la definición de constructos


comportamentales para probar hipótesis relativas a la correspondencia entre las
definiciones de comportamiento y las observaciones empíricas sobre las variables
representativas de un constructo.

• Teoría de Facetas

• Una idea principal en la Teoría de Facetas es que en prácticamente todas las


investigaciones empíricas en las ciencias sociales, en el fondo, la colección particular
de variables utilizadas, por ejemplo un conjunto de ítems que forma un cuestionario,
una encuesta, una escala o un conjunto de objetos geométricos utilizados en un
experimento sobre percepción visual, no es el resultado de un interés del investigador
por estos estímulos en particular, sino lo más probable es que considere que éstos son
representativos de un universo más amplio de comportamientos.

• Proceso de facetización

• En total, se distinguen tres tipos de facetas:


– La primera se refiere a la población de los sujetos considerados en la
investigación respectiva. Se pueda simbolizar este tipo con la letra P.

– La segunda concierne al contenido de las variables investigadas (estímulos,


ítems, preguntas), a continuación representado por la letra C. Juntas, las facetas
de población y de contenido, determinan el domino de interés.

• Proceso de facetización

– Finalmente, la tercera se refiere al universo de las reacciones o respuestas de


los sujetos investigados, o, para ser más exacto, al conjunto (set) de las
categorías exclusivas, disponibles para evaluar las tareas o simplemente los
ítems empleados en la investigación. Este tipo es denominado como rango
(range) y simbolizado por la letra R.

• Ejemplos de frase configurativa

• Motivación Prosocial

• Bienestar Subjetivo

• Wechsler Intelligence Test for Children

• Actitud en el sentido de satisfacción

• Redacción de ítems

• Método tradicional: opiniones

• Partiendo del supuesto de que las opiniones son actitudes verbalizadas, los ítems de
las escalas de actitudes suelen tomar la forma de frases cortas, de afirmación que
expresan opiniones que se pueden tener con respecto al objeto de la actitud medida.

• Edwards enumera las características que deben tener los ítems:

– Relevancia
– Claridad
– Discriminación
– Bipolaridad
• Algunas observaciones

• Una cuestión debatida es si es preferible una formulación obvia, que permita advertir
qué se está midiendo o una formulación sutil que en la medida de lo posible
enmascararse el constructo subyacente. La relevancia y la claridad de la formulación
son más importantes que el esconder lo que se quiere medir; por otra parte, y con
criterios de validez (relación con criterios externos) suelen ser mejores lo ítems que
podemos denominar cándidos.

• Algunas observaciones

• No se trata de una cuestión cerrada y se puede experimentar con unos y otros tipos de
ítems durante el proceso de construcción. Ampliaremos este punto al tratar de la
validez de contenido; se ha investigado mucho pero en relación a los tests de
personalidad; tiene menos interés en las escalas de actitud.

• Algunas observaciones

• En la primera redacción de los ítems puede ser conveniente expresar la misma idea de
modos diferentes. Aunque la idea sea la misma, no siempre es previsible qué
formulación va a ser más clara o más discriminante. Después del análisis de ítems se
puede escoger la formulación más eficaz.

• Algunas observaciones

• Como por ejemplo reproducimos seis ítems de una escala de actitud hacia el estudio;
todos expresan la misma idea básica: nivel de aspiraciones. La selección final de los
reactivos se basó en el índice de correlación ítem-total (Morales, 2006).

• Redacciones alternativas

• Para mí es muy importante sacar notas altas

• A mí me basta con aprobar o tener “suficiente” al terminar el curso

• El vivir a mi gusto es para mí más importante que el sacar buenas notas


• No me importaría fracasar en algunas cosas de las que hago

• No tengo ningún interés en ser mejor que los demás

• Yo me siento satisfecho sin ser mejor que los demás

• Substantivos

• Las opiniones pueden sustituirse por substantivos o por expresiones muy breve; el
ejemplo clásico y más conocido es la escala de conservadurismo de Wilson y
Patterson.

• En esta escala se ofrece una lista de substantivos o expresiones breves a los que las
personas deben indicar cuál es su reacción inmediata.

• Pena de muerte

• Matrimonio gay

• Evolucionismo

• Uniformes en los colegios

• Aborto

• Desfiles militares

• Impuestos

• Adjetivos

• Son bastantes los instrumentos constituidos por listas de adjetivos: el que responde
indica qué adjetivos son aplicables en cada caso.

• Los instrumentos formados por listas de adjetivos podemos clasificarlos según estos
tres criterios (que pueden combinarse en un mismo instrumento):

• Adjetivos
• El número de respuestas: pueden ser dos (aplicable o no aplicable; 1 o 0) o más; si son
más, las repuestas pueden expresarse con números o con expresiones verbales o de las
dos maneras a la vez.

• Adjetivos

• El objeto de medición: el sujeto puede describirse a sí mismo o puede describir o


valorar otros objetos de actitud. El uso quizá más frecuente es el autodescriptivo y
muchos de estos instrumentos puede considerarse con más propiedad tests de
personalidad que escalas.

• Adjetivos

• Los adjetivos pueden ser simples (listas de adjetivos) o bipolares, tal como se utiliza
en el diferencial semántico, aunque aquí los análisis y el uso, con frecuencia, son
distintos.

• Ítems bipolares

• Ítems bipolares

– No hay mucha gente que piense bien de mí


– Casi toda la gente piensa bien de mí
• A continuación la persona debe escoger como alternativa “prefiero lo primero antes
que lo segundo” o “prefiero lo segundo a lo primero”.

– Prefiero tomar decisiones en grupo que aceptar yo toda la responsabilidad de


las actitudes del grupo.

– Puesto a jugar a las cartas, prefiero un juego fácil y divertido a otros que
requiera pensar mucho.

– Prefiero trabajar a comisión, con más riesgo pero con posibilidades de ganar
mucho, que con un salario fijo.

• Otros tipos
• La mayoría de las escalas utilizan opiniones en los ítems y es, en principio, el método
que parece más idóneo.

• Algunas formulaciones no expresan exactamente opiniones; puede tratarse de


conductas, deseos, etc., pero se mantiene el mismo formato:

• Otros tipos
cada ítem está constituido por una frase relativamente corta con cuyo significado se
puede estar o no estar de acuerdo. También se han utilizado otras modalidades en la
manera de concebir los ítems; exponemos las más importantes.

• Ejemplos de ítems

• Ejemplo de ítems
• Las cosas más importantes que hay que enseñar a los niños son la obediencia y el respeto
a la autoridad.
• Ninguna debilidad, ninguna dificultad puede pararnos si tenemos suficiente fuerza de
carácter.
• La ciencia tiene su lugar, pero hay muchas cosas importantes que el espíritu humano
jamás logrará comprender.
• La naturaleza humana es como es, de manera que siempre habrá guerras y conflictos.
• Cuando una persona tiene un problema o está aburrido es mejor para ella no pensar en
eso y ocuparse en cosas que le interesen más.

• Distancia Social de Bogardus

• Habilidades Sociales

• Escala de Evaluación Negativa

• Personalidad (ítems adjetivos)

• Ítems de bienestar
• Generalmente hablando, ¿estás feliz este día?
(muy feliz... muy infeliz)
• Cuál es tu humor, en estos días?
(muy bien todo el tiempo... no muy bien la mayor parte del tiempo)
• En general, cómo evalúas tu vida familiar?
(muy bien... muy mal)
• En general estás satisfecho con la manera en cómo utilizas tu tiempo libre?
(muy satisfecho... no totalmente satisfecho)
• En general, cómo evalúas tu salud en estos días?
(muy bien... no del todo bien)

• Ítems de madurez

• Me parece (difícil/fácil) reflexionar sobre los motivos y valores y comprender las


razones de la mayor parte de mi comportamiento

• Porque (frecuentemente/ rara vez) reflexiono acerca de por qué creo actuar como lo
hago, encuentro estas preguntas (fácil / difícil) para contestar.

• Tengo problemas para controlar los impulsos para hacer las cosas sin pensar

• A menudo digo lo que viene a la mente muy sin pensar mucho en ello.

• Ítems de madurez

• Digo cosas sarcásticas cuando la gente me molesta.

• Por lo general controlo mi temperamento incluso cuando alguien es desagradable para


mí.

• A menudo me ha sido difícil pensar cómo la gente se está sintiendo.

• A veces me molestan las personas y sin embargo ni siquiera soy consciente de ello.

• La mayoría de las personas se desenvuelven por sí mismos.

• La mayoría de las personas pueden cumplir con sus promesas.

• Creencias
• Es importante para mí que los demás me aprueban.
• Las personas que hacen mal merecen lo que reciben.
• Normalmente acepto lo que me sucede con filosofía.
• Si una persona quiere, ella / él puede ser feliz bajo casi cualquier circunstancia.
• Tengo miedo de algunas cosas que a menudo me molestan.
• Todo el mundo necesita a alguien de quien puede depender para pedir ayuda y
consejo.
• "Una cebra no puede cambiar su / sus rayas."
• Me gustaría tener el respeto de los demás.
• Evito las cosas que no puedo hacer bien.
• Demasiadas personas malvadas escapan del castigo que se merecen.

• Juicio de Expertos

• Aproximación general

• A través de la validez de contenido se trata de determinar hasta dónde los ítems de un


instrumento son representativos del dominio o universo de contenido de la propiedad
que se desea medir. Esta definición, aunque bien en teoría, presenta dificultades
prácticas, ya que es imposible extraer muestras aleatorias de reactivos de un universo
de contenido, puesto que este existe sólo conceptual o teóricamente.

• Implementación

• A diferencia de otros tipos de validez, la de contenido no puede ser expresada


cuantitativamente, a través de un índice o coeficiente; ella es más bien una cuestión de
juicio. Es decir, la validez de contenido, por lo general, se estima de manera subjetiva
o intersubjetiva. El procedimiento más comúnmente empleado para determinar este
tipo de validez, es el que se conoce con el nombre de juicios de expertos, para lo cual
se procede de la siguiente manera:

• Juicio de expertos

• Se seleccionan dos jueces o expertos, por lo menos, a los fines de juzgar, de


manera independiente, la “bondad” de los ítems del instrumento, en términos de la
relevancia o congruencia de los reactivos con el universo de contenido, la claridad
en la redacción y la tendenciosidad o sesgo en la formulación de los ítems.

• Cada experto recibe suficiente información escrita acerca de: (a) el propósito de la
prueba; (b) conceptualización del universo de contenido; (c) plan de
operacionalización o tabla de especificaciones (en el caso de las pruebas de
rendimiento académico).

• Juicio de expertos
• Cada juez recibe un instrumento de validación en el cual se recoge la información
de cada experto. Dicho instrumento normalmente contiene las siguientes categorías
de información por cada ítem: congruencia ítem-dominio claridad, tendenciosidad
y observaciones.

• Juicio de expertos

• Entregue una nota explicativa de los objetivos de la evaluación y clara definición del
constructo y los componentes principales.

• Anexe la planilla de juzgamiento, en la cual cada juez deberá expresar su juicio


respecto a la claridad, precisión y pertinencia del reactivo para evaluar cada
dimensión o componente del constructo.

• Juicio de expertos

• Se recogen y analizan los instrumentos de validación y se toman las decisiones


siguientes: (a) los ítems donde hay un 100 por ciento de coincidencia favorable
entre los jueces (los ítems son congruentes, están escritos claramente y no son
tendenciosos) quedan incluido en el instrumento; (b) los ítems donde hay un 100
por ciento de coincidencia desfavorable entre los jueces, quedan excluidos del
instrumento; y (c) los ítems donde sólo hay coincidencia parcial entre los jueces
deben ser revisados, reformulados, si es necesario, y nuevamente validados.

• Valores críticos para el CVR

• Plan de muestreo

• Concepto de representatividad

• La representatividad es una condición “ideal” en la que una muestra de elementos que


“exhiba internamente el mismo grado de diversidad que la población.” (Silva, 2000,
p. 19).

• No existe una definición formal que permita establecer si una muestra concreta es o
no representativa, ni estimar siquiera su grado de representatividad. Es más bien una
noción intuitiva.

• Plan de muestreo

• Tipo de muestreo.
• Marco de la muestra.

• Tamaño de la muestra.

• Parámetro a estimar:

– Modelo del error muestral.


– Plan de estimación del parámetro.
• Tipos : Muestreo probabilístico

• Muestreo aleatorio simple.

– Muestreo sistemático.

• Muestreo aleatorio estratificado.

• Muestreo por conglomerados.


– Muestreo por conglomerado de una, dos y más de dos etapas.
– Muestreo por conglomerados probabilidades iguales y desiguales.

• Otros muestreos probabilísticos.


– Muestreo por pesca y repesca (para estimar tamaños de población)
– Muestreo para muestras elusivas (de difícil acceso)
• Muestreo por bola de nieve
• Muestreo dirigido por el encuestado
• Muestreo de tiempo-localización

• Tipos: Muestreo no probabilístico

• Selección realizada sin método alguno.

• Muestreo semiprobabilístico.

• Muestreo por cuotas.

• Selección según criterio de autoridad.


• Muestreo probabilístico

• Se dice que un muestreo es probabilístico cuando una población P integrada por N


elementos:
P = {e1, e2, e3, … eN}.

• Cada elemento debe tener una probabilidad conocida de integrar la muestra.

• Que tal probabilidad no sea nula para ningún elemento.

• Que la selección de las muestras involucre algún procedimiento aleatorio de


selección.

• Estimación de parámetros

• Un aspecto importante a recordar es que cuando se investiga, no se estudia la muestra


propiamente, sino los atributos de la muestra.

• Estos atributos son denominados en el ámbito estadístico “parámetros”, generalmente


haciendo referencia a que lo que interesa en realidad es un factor o característica que
no es observable directamente en la muestra sino que, a través de las observaciones
realizadas sobre la muestra, se puede “inferir” cuáles son los atributos en la población
(parámetros).

• Factores que definen el tamaño

• Cálculo del tamaño de la muestra

• Fórmula general bajo muestreo aleatorio simple:

– Fórmula para el cálculo del tamaño de la muestra en poblaciones infinitas o


muestreo con reposición:

– Fórmula de corrección para el cálculo del tamaño de la muestra en poblaciones


finitas de tamaño conocido:
• Fórmula del MSA

– Fórmula general aplicable al caso del muestreo en población finita y de tamaño


conocido:

Siendo:
𝜀 = error estadístico (que no debería superar el 10% del
valor estimado).
�𝑍�1−𝛼/2�2� = Valor de la distribución normal acumulada
correspondiente a determinado nivel de confianza (error tipo
I o alfa).
S2 = Varianza de la variable [cuando el valor estimado
fuese una proporción, la varianza es S2 = p . q = p.(1 – p)]
N = Tamaño de la población

• Consideraciones adicionales

• Considere que la fórmula para el cálculo del tamaño de muestras, presentadas en las
diapositivas anteriores, solo se utilizan para el muestreo aleatorio simple (MSA).

• Cuando se utilizan otros diseños de muestreo aleatorio, deberá considerarse lo


siguiente:
– Si se trata de muestreo aleatorio estratificado (MAE), debería utilizarse la
misma fórmula que el muestreo aleatorio simple, considerando que el MAE por
definición presentará varianzas
iguales o inferiores al MSA.
– Si se utiliza un diseño complejo: conglomerados, de dos o más
etapas, etc., deberá realizarse el cálculo del tamaño de la muestra para el
Muestreo Aleatorio Simple y luego multiplicarlo por el Efecto de Diseño, valor
que se obtiene a partir de otros estudios similares.

• Baremación

• Nociones elementales

• Se conoce como Baremación al proceso de generación de tablas normativas utilizadas


para interpretar las puntuaciones obtenidas en un test.
• Las puntuaciones originales son transformadas a escalas que se ajustan a las
características de una “muestra normativa” las que se constituyen en la norma del
grupo-meta, objeto de evaluación.

• Varios conceptos se encuentran estrechamente relacionados con el proceso de


baremación: estandarización, normalización, grupos normativos, tipificación, los
cuales son desarrollados a continuación.

• Estandarización

• Los tests se caracterizan por su alto grado de estandarización, lo cual implica


establecer normas estandarizadas para su:

– Aplicación
– Calificación
– Corrección
– Interpretación
• El desarrollo de pruebas estandarizadas surge como respuesta a la necesidad de
realizar comparaciones entre los resultados de diferentes investigaciones que
indagaban sobre los mismos temas, por lo que propugnó la estandarización de
procedimientos de laboratorio lo que rápidamente fue transferido a los procesos de
evaluación.

• Notas estandarizadas

• Las notas estandarizadas o notas estándar son calificaciones que resultan de la


transformación de las puntuaciones brutas obtenidas en una escala de uso común que
pueda resultar fácilmente interpretable.

• Pueden ser el resultado de una transformación lineal de las puntuaciones originales


(las transformaciones lineales implican sumar, restar, multiplicar y/o dividir valores
de la cifra original).

• Puede implicar transformaciones no lineales: los percentiles son una transformación


no lineal que depende de la posición relativa que ocupa una puntuación en el conjunto
total de datos.

• Nota z
• Es una transformación lineal de las puntuaciones y constituye la nota tipificada por
excelencia (en estadística se la conoce como nota tipificada estándar o nota estándar).

• Se obtiene al restar la puntuación bruta de la media y dividirla por la desviación


estándar, por lo que representa el equivalente en desviaciones estándar, es decir, un
valor z = 1 equivale una puntuación que representa una desviación estándar de la
media.

• Su fórmula es la siguiente:

• Nota T

• La nota T es una nota tipificada que se obtiene mediante la transformación lineal de la


nota z.

• Debido a que la nota z tiene la molesta característica de presentarse en valores


decimales pueden tener tanto signo positivo como negativo, se desarrolló una nota
que presente las transformaciones solamente en valores enteros y positivos.

• Su fórmula es la siguiente:

• Esta nota se caracteriza por presentar una media de 50 y una desviación estándar de
10.

• Otras notas tipificadas

• A partir de la nota z es posible derivar otras notas tipificadas, utilizando el mismo


procedimiento que el utilizado para obtener la nota T.

• Estas notas se presentan mediante una media y una desviación estándar, ambas
estandarizadas y fijas.

• Por lo tanto, mediante esta fórmula, se puede obtener una nota tipificada “derivada”
(D), de la siguiente manera:

• Percentil

• El percentil es una nota que no se basa en la transformación lineal, puesto que se


sustituye la puntuación bruta por la posición relativa que esta puntuación ocupa en la
distribución de puntuaciones sobre una base de 100.
• Específicamente consiste en ordenar las puntuaciones obtenidas, de mayor a menor,
asociándolas con la cantidad de sujetos que obtuvo cada puntuación. Sobre la
distribución acumulada o frecuencia acumulada se establece que porcentaje de la
población representa cada puntuación y esta constituye el percentil.

• Es, probablemente, una de las puntuaciones más utilizadas por la sencillez en su


interpretación.

• Percentil

• Por lo tanto, el percentil de una puntuación se corresponde al porcentaje de personas


que han obtenido puntuaciones iguales o inferiores a un determinado puntaje.

• Su cálculo es sencillo, puesto que se ordenan todos los resultados de menor a mayor,
el sujeto con la puntuación más baja representa el percentil 1 y el mayor el percentil
99. Como varias personas pudieron obtener iguales puntuaciones un mismo percentil
puede estar representado por el mismo valor en puntuaciones brutas.

• Cuando los valores se presentan agrupados en tablas de frecuencia, es posible calcular


los percentiles mediante la siguiente fórmula:

• Percentil

• Fórmula:

• Normalización

• La normalización es un término amplio que puede representar aspectos diferentes:

• Puede hacer referencia a la generación de normas de interpretación de


puntuaciones, lo cual implica la selección de un grupo normativo (más adelante se
detalla cada paso), la aplicación del instrumento, la transformación de las
puntuaciones a una nota tipificada y la generación de una tabla con la intención de
utilizar dichas normas para el diagnóstico individual de sujetos que serán
evaluados posteriormente y cuyo desempeño será valorado a partir de la tabla de
normalización.

• Normalización
• Por otro lado, se utiliza el término normalización al procedimiento por el cual se
modifica la distribución de las puntuaciones obtenidas para que éstas se ajusten a la
distribución normal. Estas puntuaciones se denominan “puntuaciones
normalizadas”.
Cuando se trata de esta acepción, el procedimiento consiste en transformar los
valores brutos obtenidos de una muestra a sus respectivos valores percentiles y, a
través de la tabla de distribución normal, se convierten estos percentiles a valores
Z, en este caso se denomina Z normalizada (en ocasiones se representa con la Z
mayúscula para diferenciarla de la zona no normalizada). A partir de esta
transformación se pueden obtener otras puntuaciones normalizadas.

• Grupos normativos: características

• Los grupos normativos deben ser representativos de la población a la cual se desea


evaluar con el instrumento desarrollado, preferentemente se debería obtener una
muestra aleatoria de la población con una estrategia clara de muestreo, considerando
que estos estudios suelen implicar recursos importantes, la muestra es importante ya
que no se pueden repetir a menudo (recordemos que en muchos casos utilizamos
baremos que se hicieron por única vez y han perdurado en el tiempo sin nuevos
estudios), a pesar de que la recomendación es realizar estudios normativos cada 5
años.

• El tamaño de la muestra también es importante y depende en gran medida del diseño


del muestreo (más adelante se desarrolla el tema).

• El estudio de tipificación

• Pasos básicos

• Identificar la población objetivo de la prueba.

• Especificar los estadísticos que se deberán calcular a partir de los datos muestrales.

• Determinar la cantidad de error muestral tolerable para los estadísticos


especificados.

• Diseño muestral, siguiendo alguna de las técnicas de muestreo probabilístico.

• Extraer la muestra y recoger los datos documentando casos de no respuesta y las


posibles causas.

• Pasos básicos

• Calcular los valores de los estadísticos en la muestra y sus errores típicos.

• Identificar los tipos de puntuaciones normativas necesarias y preparar las tablas de


conversión.
• Prepara la documentación escrita sobre el proceso de tipificación del test y la guía
para la interpretación de las puntuaciones normativas.

Anda mungkin juga menyukai