Psicometra 100509194052 Phpapp01

PSICOMETRA
Diseado por:
Germn Andrs Torres Escobar
Hitos en la historia de la
psicometra
AO
HITO O ACONTECIMIENTO
1115 a.C.
En China se utilizan tests para acceder a puestos en el gobierno.
1869 d C.
Francis Galton publica el libro Genio Hereditario (1869) donde plantea a travs
de estudios estadsticos que la inteligencia se hereda.
1904 1910 d. C.
Charles Spearman funda la Teora Clsica de los tests o del modelo lineal
y publica su teora de los factores de la inteligencia y las formulas de atenuacin.
1905 d.C.
Alfredo Binet y Theodore Simon publican la primera escala de inteligencia para nios,
con el fin de establecer su edad mental y predecir su rendimiento acadmico.
1918 d.C.
Se crean los tests de inteligencia Army Alpha y Beta para clasificar a los soldados
durante la Primera Guerra Mundial y Robert Woodworth elabor el primer Personal
Data Sheet para detectar los soldados que pudieran tener crisis nerviosas.
1931 d.C.
Thurstone publica su libro The reliability and validity of tests.
1939 d.C.
Wechsler propone su escala de medida para la inteligencia.
1940 d.C.
Aparece el cuestionario de personalidad de Minnesota Multiphasic Personality

Inventory (MMPI).
1960 d.C.
Cronbach propone su Teora de la Generalizacin en la cual utiliza el anlisis de

varianza para interpretar las fuentes de error en los puntajes.
1980 d.C.
Rasch plantea la Teora de la Respuesta al tem o del rasgo latente que permite
conocer la informacin de cada tem para disear pruebas individualizadas.
La psicometra
Es la rama de la
psicologa
que
desarrolla y estudia
las propiedades de las
pruebas psicolgicas
o tests para medir las
variables psicolgicas
con
la
mayor
precisin posible.
Diferencia entre psicometra y

evaluacin psicolgica
Psicometra
Evaluacin psicolgica
nfasis en la medicin
nfasis en el diagnstico
Instrumentos y tests
La persona
Historia de la psicometra
Antecedentes
Modelos
histricos.
de medicin.
Antecedentes histricos
Hacia el ao 1115 a.C. se utilizan comienzan a utilizar en

China los primeros tests que buscan medir las
capacidades de aspirantes para acceder a puestos del
gobierno (primera medicin de capacidades).
En 1869 Francis Galton publica el libro Genio Hereditario
donde plantea a travs de estudios estadsticos que la
inteligencia se hereda y que es posible medirla
(estudios estadsticos en psicologa).
Entre 1904 y 1910 Charles Spearman funda la

Teora Clsica de los tests o del modelo lineal y
publica su teora de los factores de la
inteligencia y las formulas de atenuacin
(Estrategias de medicin y TCT).
En 1905 Alfredo Binet y Theodore Simon
publican la primera escala de inteligencia para
nios, con el fin de establecer su edad mental y
predecir su rendimiento acadmico (uno de los
primeros tests psicolgicos).
En 1960 Lee Cronbach propone su Teora de la

Generalizacin en la cual utiliza el anlisis de
varianza para interpretar las fuentes de error en
los
puntajes.
Igualmente
l
desarroll
estrategias para la medicin de la confiabilidad
de un test.
En 1980 Rasch plantea la Teora de la Respuesta
al tem o del rasgo latente que permite conocer
la informacin de cada tem para disear
pruebas individualizadas.
Modelos de medicin
Teora Clsica de los
Tests (TCT)
Teora de la Respuesta al
tem (TRI)
Anlisis de la prueba
completa
Anlisis de tems
individuales
En una muestra pequea

de sujetos (N < 500)
En grandes muestras de
sujetos (N 500)
Teora clsica de los Tests
El modelo de puntuacin verdadera se concreta en

un primer supuesto:
X=V+E
que indica que la puntuacin emprica directa
de una persona en un test (X) est compuesta por
la puntuacin verdadera de la persona (V) y un
error de medida (E) que se comete al medir el rasgo
con el test.
El error de medida se establece como la diferencia
entre la puntuacin emprica y la verdadera:
E=X-V
La puntuacin verdadera se obtiene con el promedio

de las puntuaciones empricas que obtiene la
persona en un nmero elevado de aplicaciones del
test:
V = E[X]
Si en una poblacin se conocen las puntuaciones V y
E de los individuos, la correlacin entre ambas
variables sera nula, porque se asume que
puntuaciones verdaderas elevadas no tienen porqu
tener asociados errores elevados:
r VE = 0
Si en una poblacin conociramos los errores de

medida de cada individuo quien ha realizado dos
tests diferentes (j y k), la correlacin entre
ambas variables tambin sera nula:
E jEk = 0
Si en una poblacin conociramos las

puntuaciones E en un test j y las puntuaciones V
en un test k, ambas variables correlacionaran
cero:
E jVk = 0
Limitaciones de la Teora Clsica
Las caractersticas de los tems (dificultad y

discriminacin) dependen del grupo de personas en el
que se han aplicado.
La puntuacin que una persona obtenga ser diferente si

se le aplican dos tests que midan la misma caracterstica
pero cuyo nivel de dificultad sea diferente.
La TCT supone que el error de medida es una propiedad
del test y, por lo tanto, igual para todos los sujetos,
independientemente de cual sea su puntuacin.
Teora de la Respuesta al tem
Unidimensionalidad: todos los tems que forman el test han
de medir un mismo y nico rasgo. El supuesto de

unidimensionalidad exige que todos y cada uno de los tems
del test midan una nica dimensin.
No hay como tal puntuaciones verdaderas sino una
probabilidad de acierto determinada por unos parmetros.
Independencia local: entre los tems de un test si la respuesta
que una persona da a uno de ellos no depende de las

respuestas que da a los otros, ni por el orden de presentacin
de los tems, las respuestas que ya se hayan dado, etc.
Un prueba psicolgica o test
Es un instrumento en formato impreso o digital

que consta de una serie de preguntas o
reactivos que miden unas variables psicolgicas
especificas a travs de un sistema de
puntuacin.
Puede aplicarse en diferentes campos de la
psicologa, para fines diversos como diagnstico
clnico (psicologa clnica) , seleccin de personal
(psicologa organizacional) o anlisis de
aptitudes vocacionales (psicologa educativa).
Estructura general de un test

impreso
Cuadernillo de instrucciones.
Cuadernillo de preguntas.
Hoja(s) de respuestas.
Plantilla de correccin.
Tabla de puntuaciones y baremos.
El cuadernillo de instrucciones
Es un documento donde se menciona:

El nombre de la prueba, sus autores y el
ao de publicacin.
La(s) variable(s) que mide y sus objetivos.
Los antecedentes (marco conceptual y
terico) de la prueba.
Las instrucciones generales de aplicacin
(para los psiclogos).
El cuadernillo de preguntas
Es un documento que consta de:

Las instrucciones de respuesta (para quien la va
a responder).
Los tems o preguntas.
No puede rayarse ni se puede escribir sobre este
ya que se usa en diferentes aplicaciones.
La hoja de respuestas y plantilla de

correccin
Es la hoja donde la persona anota las respuestas

a de los tems planteados en el cuadernillo de
preguntas.
Una vez que la persona entrega la hoja de
respuestas al psiclogo, l o ella la califican
poniendo encima de la hoja de respuestas, la
plantilla de correccin para ver en cuales acert
el sujeto y en cuales no.
El sistema de puntuacin
Puntuacin cruda o bruta
Puntuacin de los tems Errores
Puntuacin estndar o tpica
Centiles
Puntuaciones T, S o Z
Perfil del sujeto
La tabla de puntuaciones y
baremos
Una vez que se han obtenido los aciertos y

errores de la persona con ayuda de la plantilla,
se obtiene una puntuacin cruda o bruta,
que es especifica para ese sujeto.
Esa puntuacin bruta se analiza en la tabla de
puntuaciones estndar, para obtener una
puntuacin estndar o tpica del sujeto
dentro de la poblacin o muestra de sujetos que
present la prueba (baremo).
Los baremos
Son tablas de puntuaciones estndar que se

clasifican por grupos poblacionales o muestrales
segn la edad, profesin o gnero.
Por ejemplo, para una misma prueba existen
baremos para hombres, mujeres, hombres
profesionales,
mujeres
profesionales,
estudiantes de secundaria, etc.
Tipos de pruebas o tests

Clasificacin de las pruebas
Segn
la aplicacin
Segn la forma de
medir la(s) variable(s)
Segn la(s) variable(s)

que miden
- Autoaplicacin
-De desempeo
- De poder
- De velocidad
- De capacidad mental
- De conocimientos
- De personalidad
- Individual
- Grupal
Clasificacin de las pruebas por aplicacin
Pruebas de autoaplicacin: son tests que no requieren la
Pruebas de aplicacin individual: son aquellas que el
Pruebas de aplicacin grupal: son aquellas que el
aplicacin por parte de un psiclogo sino que puede

hacerlas la persona con ayuda de un computador.
psiclogo administra a una sola persona. Por ejemplo, en

un caso clnico.
psiclogo pueden aplicar a varias personas al mismo
tiempo, pero controlando que no conversen entre ellas.
Por ejemplo, una prueba de aptitudes e intereses
vocacionales.
Clasificacin de las pruebas segn la forma

de medir la(s) variable(s)
Pruebas de desempeo: miden el rendimiento mximo
Pruebas de poder: miden el nivel de destreza mental de
Pruebas de velocidad: miden cuantos tems responde el
Pruebas con referencia a la norma o al criterio: mide la
(individual) o el rendimiento normal o tpico (de un

grupo).
un sujeto o su nivel de conocimiento.
sujeto en un tiempo especifico.
variables psicolgica segn objetivos especficos.
Clasificacin de las pruebas segn las

variables que miden
Pruebas de capacidad mental (inteligencia).
Pruebas de aprovechamiento o conocimiento.
Pruebas de personalidad.
Pruebas de actitudes, aptitudes,

motivacin, opinin y valores.
Pruebas neuropsicolgicas.
intereses,
Estructura general de un tem
Enunciado: menciona las instrucciones para contestar el
Pregunta(s):
Opciones de respuesta: incluyen una(s) respuestas(s)
tem y plantea un contexto o situacin a partir del cual

se hace la pregunta.
son cuestionamientos que evalan
directamente la variable psicolgica de forma implcita.
Pueden ser abiertas (libre respuesta) o cerradas
(opciones especificas).
correcta(s)
falsa(s).
un(os)
distractor(es)
respuesta(s)
Clasificacin del formato de respuestas

Clasificacin de los tems
En tests de
rendimiento ptimo
- De eleccin
- De emparejamiento
En tests de
rendimiento tpico
- De opcin binaria
- De categoras ordenadas
- De adjetivos
Clasificacin de las respuestas en tests

de rendimiento ptimo
Eleccin binaria: de dos alternativas, se elige la
Eleccin mltiple: entre ms de dos alternativas
Emparejamiento: consiste en encontrar las
que se considera
(verdadero-falso).
correcta
(S
No)
se elige la que se considera correcta.
parejas entre dos conjuntos de conceptos.
Clasificacin de las respuestas en tests

de rendimiento tpico
Opcin binaria: la persona debe manifestar si est de
Categoras ordenadas: el formato establece un continuo
Adjetivos bipolares: este formato es tpico de lo que se
acuerdo o en desacuerdo con una afirmacin.
ordinal de ms de dos categoras, que permite a la

persona matizar mejor su respuesta.
denomina "diferencial semntico".
Confiabilidad
Es el grado en el cual las mediciones

repetidas de un fenmeno relativamente
estable son aproximadas entre s o
consistentes.
Permite predecir el desempeo de un
grupo o de un sujeto e igualmente sirve
para describirlo en ambos casos.
Formas de medir la confiabilidad
Test-retest: consiste en aplicar un test dos veces a un

mismo grupo en un intervalo de das o meses (no
superior).
Formas paralelas: consiste en aplicar un test homologo o
equivalente a un mismo grupo pero en tiempos
diferentes.
Divisin por mitades: consiste en comparar los
resultados de los tems pares e impares en la aplicacin
grupal de un test.
Coeficientes de confiabilidad
Test-retest: coeficiente de estabilidad (r).

Formas
paralelas:
equivalencia (r).
Divisin por mitades:

consistencia interna (r).
coeficiente
coeficiente
de
de
Coeficientes ms usados en divisin

por mitades
Formas de mejorar la confiabilidad

de un test
Para calcular el nmero de tems K para lograr

una confiabilidad RXY deseada (superior a 0.7)
se usa la formula:
K = RXY * (1 rXY) / rXY) * (1 RXY)
donde rX es la confiabilidad inicial.
Una vez obtenido el nmero K se multiplica por
el nmero de items inicial y luego se le resta a
ese resultado el nmero de tems inicial.
Para calcular la confiabilidad al quitar un

nmero de tems X con un total de tems Y
y con una confiabilidad conocida C se usa
la siguiente formula:
YX/Y
El resultado obtenido con esta formula
debe operarse con la formula 2:
[resultado 1 * C]
[1 + (resultado 1 1) * C]
VALIDEZ
Es el grado en el cual una prueba mide lo

que pretende medir.
Conjunto de pruebas y datos que han de
recogerse para garantizar la pertinencia
predictiva de las inferencias que hacen a
partir de un test.
Tipos de validez
Validez del contenido.
Validez con relacin a criterio.
Validez del constructo.
VALIDEZ DEL CONTENIDO
Es la muestra adecuada y representativa de los

contenidos que se pretende evaluar con un test.
Los tems o preguntas se seleccionan segn su:
Coherencia: con las caractersticas y variables.
Relevancia: de acuerdo con el indicador.
Buena redaccin: la gramtica del tem.
Validez aparente: para el evaluado.
VALIDEZ CON RELACIN AL

CRITERIO
Es la comparacin del desempeo de un

grupo de sujetos en un test respecto
patrones de medida ya establecidos.
Se clasifica en:
Validez concurrente.
Validez predictiva.
Validez concurrente
Es el anlisis de variabilidad que efecta al

comparar el desempeo de dos grupos de
distintos de sujetos en un mismo test.
Tambin se le denomina validez cruzada o
entre distintas muestras.
Validez predictiva
Es el grado de precisin con que las

calificaciones de la prueba predicen las
calificaciones del criterio.
Se obtiene mediante la correlacin entre
una variable de indicador y una variable
criterio a partir de r (Pearson), cuyo valor
es igual o menor a 0,60.
Factores que afectan la validez con

relacin a los criterios
Las diferencias de grupo:
sexo, edad y rasgos de personalidad.
La contaminacin de los criterios:
evidencias falsas que les restan validez.
El ndice de base (debe ser mayor de 50):
nmero de personas que poseen la variable medida.
El incremento de la validez:
costo razonable del instrumento.
VALIDEZ DEL CONSTRUCTO
Es el grado de exactitud con el que se

mide un constructo o concepto psicolgico
particular.
Depende de unas condiciones que son
externas al evaluador y la persona que
disea la prueba.
Condiciones de la
validez del constructo
Valoracin por parte de jueces expertos

de la correspondencia contenido-concepto.
Anlisis de la consistencia interna de la
prueba.
Estudio de las variables intervinientes en
la calificacin.
Anlisis factorial y correlacin con otras

pruebas.
Anlisis de las respuestas.
Correlaciones altas con otras medidas o
mtodos para medir el mismo constructo
(Validez convergente).
Correlaciones bajas con las medidas de
constructos
diferentes
(Validez
discriminante).
CONSTRUCCIN DE LOS TEMS
La Taxonoma de Bloom
1.
2.
3.
4.
5.
6.
El dominio cognoscitivo comprende 6

categoras:
Recuerdo
Comprensin
Aplicacin
Anlisis
Sntesis
Evaluacin
Recuerdo:
Incluye situaciones de examen que acentan la
importancia del recuerdo de datos, ideas, materiales
o fenmenos, ya sea como reconocimiento o
evocacin. Supone, el recuerdo o reconocimiento
de: Datos especficos como terminologas o hechos;
modos y medios para el tratamiento de datos
especficos como convenciones, clasificaciones,
metodologas, tcnicas o procedimientos y,
universales y abstracciones en un campo
determinado como principios, generalizaciones,
teoras y estructuras (Herrera, 2003).
Ejemplo 1: Pregunta que evala Recuerdo
A continuacin encontrar preguntas que constan de un enunciado y cuatro (4) o cinco (5) opciones de respuesta. Usted
debe marcar en su hoja de respuesta, aquella opcin que
considere correcta.
El modelo de control social propuesto por Max Weber para las
organizaciones, se denomina modelo:
A.- de los sistemas
B.- burocrtico
C.- estructuralista
D.- de las organizaciones
Comprensin:
Implica la inteleccin y fraccionamiento de un mensaje.
Operacionalmente se define como cualquier conducta que vaya
desde la presentacin de una proposicin con palabras distintas
de las del enunciado original, hasta la aplicacin de un principio
en una situacin nueva para el examinado, pasando por la
ejemplificacin. Se define en trminos de tres operaciones: a)
Traduccin o capacidad para expresar un concepto o mensaje

conocido en palabras diferentes o pasarlo de un sistema
simblico a otro, b) Interpretacin o reordenamiento de ideas de
una comunicacin en una nueva configuracin. Incluye la
habilidad para captar el contenido de una comunicacin como un
todo y distinguir entre conclusiones legtimas y contradictorias y
c) Extrapolacin o hacer explcitas algunas conclusiones,
colorarios, consecuencias o efectos de una comunicacin dada
(Herrera, 2003).
Ejemplo 2: Pregunta que evala Comprensin
Si un psiclogo afirma que una prueba que ha preparado para

seleccin de personal tiene un coeficiente de validez predictiva mas
alto que el de fiabilidad, concluira que
A. est bien, por cuanto lo mas importante para la seleccin es la
validez de prediccin
B. debera tener mas alta fiabilidad que validez ya que lo principal es
la confianza en el instrumento
C. debe tener un error ya que la validez predictiva NO puede ser
mayor al coeficiente de fiabilidad
D. debe tener un error ya que los dos coeficientes, el de validez y el
de fiabilidad deben tener igual valor
E. no debera utilizar la prueba ya que debe tener mas alta fiabilidad
que validez para el objeto propuesto
Aplicacin:
Se refiere a la capacidad para aplicar teoras, principios,

mtodos o ideas en la solucin de un problema prctico. Es la
habilidad para aplicar principios y generalizaciones a nuevos
problemas y situaciones. Comprende entonces tareas como a)
identificar los principios o generalizaciones apropiados para
resolver un problema o reformularlo para lograr tal
identificacin, b) especificar los lmites dentro de los cuales un
principio o generalizacin es verdadero o relevante y reconocer
las excepciones a los mismos y las razones para ello, c) explicar
nuevos fenmenos a partir de principios o generalizaciones
conocidas, predecir lo que suceder en una situacin nueva
mediante el uso de principios y generalizaciones apropiadas, y
d) determinar o justificar una decisin o accin en una situacin
usando principios o generalizaciones e indicar el razonamiento
que apoya la utilizacin de los mismos ante un determinado
problema (Herrera 2003).
Ejemplo 3: Pregunta que evala Aplicacin
Escoja la caracterstica del pensamiento infantil que mejor se ajusta a

la conducta descrita por Piaget:
- Cmo se hace para tener madera? Se cortan los troncos de los
rboles.
- Qu se hace para tener rboles? Se siembran los granos. - Y los
granos? Se compran.
- Dnde? En los almacenes. - Y el dueo del almacn? Pinsalo un
poco. Los hace.
- Con qu? Con otros granos. - Cuando vinieron los primeros
hombres, haba ya rboles? No.
- Cmo han comenzado? Por los granos. - De dnde venan estos
granos? Del almacn.
A.
B.
C.
D.
E.
Realismo
Animismo
Artificialismo
Sincretismo
Funcionalismo
Anlisis:
Hace referencia a la habilidad para fraccionar una comunicacin en sus

elementos, de manera que aparezcan explcitas la jerarqua de las ideas
y las relaciones existentes entre ellas. Esta es un proceso complejo que
implica las tres categoras anteriores; recuerdo, comprensin y
aplicacin, pero va mas all de ellas. Aqu se incluyen tres
subcategoras: a) anlisis de elementos o habilidad para fraccionar una
informacin en sus elementos, como supuestos no explcitos, hechos e
hiptesis; b) anlisis de relaciones o identificar la relaciones que
existen entre los elementos de una comunicacin; inferir los criterios,
relaciones, cualidades, suposiciones o condiciones implcitas en una
comunicacin; o bien, determinar las relaciones entre las hiptesis y las
pruebas que la apoyan, entre las conclusiones y las hiptesis, o entre
las conclusiones y las evidencias; y c) anlisis de principios de
organizacin que es la habilidad para explicitar los principios
organizadores que ha seguido un autor, reducir su propsito, su punto
de vista, su actitud o su interpretacin (Herrera 2003).
Ejemplo 4: Pregunta que evala Anlisis
Considere los resultados del siguiente estudio:

En una investigacin sobre heredabilidad de rasgos psicosociales, en este caso
la criminalidad, se conformaron tres grupos de sujetos as: el grupo A por
parejas de gemelos univitelinos, el grupo B por parejas de gemelos bivitelinos y
el grupo C por parejas de hermanos naturales. En ningn caso los hermanos
fueron separados. Una vez aplicados los instrumentos de medida
(cuestionarios, encuestas, etc.,), se encontraron los siguientes porcentajes de
acuerdo en relacin con la presencia de conductas criminales:
GRUPOS
A
B
C
% DE ACUERDO
77
35
8
Escoja la interpretacin que mejor se ajuste a los datos de la investigacin
A. A mayor concordancia gentica corresponde un mayor porcentaje de
acuerdo
B. La criminalidad depende del medio ambiente en un 23%.
C. El bajo porcentaje registrado por el grupo C se debe a que es el grupo con
el menor nivel de homogeneidad gentica
D. No se puede concluir en favor de la heredabilidad de las conductas
criminales.
Sntesis:
Es la capacidad para reunir diferentes elementos o partes
para formar un todo. Esto es, la habilidad para combinar
elementos con el fin de constituir una estructura o
esquema que no estaba presente con claridad. La
capacidad de sntesis incluye: a) produccin de una
comunicacin nica, b) produccin de un plan o conjunto
de operaciones con un fin determinado y c) derivacin de
un conjunto de relaciones abstractas, explicaciones o
hiptesis para dar cuenta de un fenmeno dado. Es difcil
construir preguntas estructuradas que evalen esta
categora, son mucho ms frecuentes las preguntas
abiertas de tipo ensayo (Herrera 2003).
Evaluacin:
Es la capacidad para emitir juicios sobre ideas, obras,
mtodos, materiales o soluciones, con algn propsito
determinado. Esta categora incluye formulacin de juicios:
a) con base en pautas internas como exactitud, precisin y
cuidado con que ha sido elaborada una comunicacin
dada; consistencia de los razonamientos, relaciones entre
supuestos, evidencias y conclusiones y reconocimiento de
los valores y puntos de vista utilizados en un juicio
particular sobre una obra b) en trminos de criterios
externos como comparacin de un trabajo u obra con
otros, utilizando criterios o normas explcitas. Al igual que
en la categora anterior, es difcil construir preguntas
estructuradas que evalen esta categora, son ms
apropiadas las preguntas abiertas de tipo ensayo (Herrera
2003).
Tipos de Preguntas
NOMBRE
ELEMENTOS
CARACTERISTICAS
Eleccin
mltiple
con nica
respuesta
Un enunciado y cuatro
o cinco opciones
de respuesta
Slo una de las opciones completa correctamente el enunciado. Puede

utilizarse para evaluar cualquier objetivo educativo especialmente
recuerdo, comprensin y aplicacin.
Eleccin
mltiple
con
mltiple
respuesta
Un enunciado y cuatro
(4) opciones de
respuesta
Una, dos, tres o todas las opciones de respuesta pueden completar

correctamente el enunciado, el examinado debe elegir una
combinacin de ellas. Adecuado para evaluar cualquier objetivo
educativo.
Un problema y dos
informaciones
relacionadas con
el mismo
Una o las dos informaciones pueden ser necesarias y suficientes para

resolver el problema o pueden ser necesarias pero no suficientes. El
evaluado no debe resolver el problema, slo evaluar la informacin
disponible. Excelente para evaluar aplicacin.
Una afirmacin y dos

postulados
Tanto la afirmacin como los postulados son VERDADEROS. El

examinado evala la relacin lgica entre ellos. Excelente para
evaluar anlisis.
Dos afirmaciones
separadas por la
palabra PORQUE
Tanto la afirmacin como la razn pueden ser VERDADERAS o FALSAS.

El examinado evala tanto su valor de verdad como la relacin lgica
entre ellas. Excelente para evaluar anlisis.
Informacin
suficiente
Anlisis de
postulado
s
Anlisis de
relaciones
Eleccin Mltiple con nica

Respuesta
Es el tipo de pregunta ms conocido y usado en las pruebas
objetivas. Estn conformadas por un enunciado y cuatro (4)
o cinco (5) opciones de respuesta. El enunciado puede
contener una frase incompleta, una interrogacin, un texto o
una grfica; las opciones de respuesta aparecen identificadas
con las letras A, B, C, D y E. Una sola de las opciones
completa o responde correctamente el enunciado. Este tipo
de pregunta es til para evaluar cualquiera de las cuatro
primeras categoras de la taxonoma de Bloom. Los ejemplos
1 a 4 son preguntas de eleccin mltiple con nica
respuesta.
Eleccin Mltiple con nica

Respuesta
Adems de las consideraciones generales sobre
construccin de preguntas, en este tipo de tems es
altamente recomendable evitar expresiones como
TODAS LAS ANTERIORES o NINGUNA DE LAS
ANTERIORES. Si ms de una opcin es correcta
probablemente la pregunta quede mejor formulada con
el formato de eleccin mltiple con mltiple respuesta.
Eleccin Mltiple con Mltiple

Respuesta
Este tipo de pregunta consta de un enunciado y cuatro
(4) opciones de respuesta identificadas con los
nmeros 1, 2, 3 y 4. Una o varias opciones de estas
pueden completar correctamente el enunciado. Este
tipo de pregunta es til para evaluar cualquiera de las
categoras de objetivos educativos. Sin embargo, se
usa frecuentemente para evaluar comprensin y
aplicacin utilizando: a) una situacin en la que es
necesario considerar varias consecuencias posibles, b)
una situacin en la que es necesario especificar una o
ms condiciones para definirla adecuadamente, c) dos
situaciones semejantes o dismiles con respecto a uno
o ms puntos de comparacin, d) un principio que
puede aplicarse a ms de una situacin o e) varias
consideraciones que pueden conducir al mismo

Respuesta
Las instrucciones que se dan al examinado son,
generalmente de la siguiente forma:
"A continuacin encontrar preguntas que constan de

un enunciado y cuatro (4) opciones de respuesta. Una
o varias opciones pueden completar correctamente el
enunciado. Usted debe marcar su hoja de respuestas
segn el cuadro siguiente:
Marque A
Marque B
Marque C
Marque D
si las opciones 1, 2 y 3 son correctas

si las opciones 1 y 3 son correctas
si las opciones 2 y 4 son correctas
si slo la opcin 4 es correcta

Respuesta
Este tipo de pregunta no debe incluir distractores
mutuamente excluyentes por cuanto estaran anulando
una o varias opciones de respuesta; tampoco debe
incluir en las opciones de respuesta expresiones como
TODAS LAS ANTERIORES o NINGUNA DE LAS
ANTERIORES.

Respuesta
Ejemplo:
La investigacin emprica ha encontrado que:

1. Las personas toman menos tiempo en el aprendizaje de
un concepto cuando hay muchos atributos irrelevantes
2. En el aprendizaje de un concepto son mejores los
ejemplos negativos que los positivos
3. En el aprendizaje de un concepto la velocidad de
aprendizaje es una funcin directa del nmero de atributos
4. Las personas toman ms tiempo en el aprendizaje de un
concepto cuando hay muchos atributos relevantes
Informacin Suficiente
Estas preguntas constan de un problema y dos
informaciones identificadas con los nmeros I y II.
No se requiere que el examinado resuelva el
problema, sino que decida si las informaciones
proporcionadas son necesarias y suficientes para
resolverlo. Este tipo de pregunta es muy til para
evaluar aplicacin.
Las instrucciones son, generalmente, las siguientes:
"Las preguntas que encontrar a continuacin constan de

un problema y dos informaciones identificadas con los
nmeros I y II. Usted debe decidir si las informaciones son
necesarias y suficientes para solucionar el problema y
marcar su hoja de respuestas segn el cuadro siguiente: ...
Marque A s necesita y basta con las informaciones I y II
Marque B si necesita y basta con la informacin I
Marque C si necesita y basta con la informacin II
Marque D si cualquiera de las dos informaciones sirve
Marque E si no es suficiente con las dos informaciones
Adems de las normas generales, para la construccin
de este tipo de preguntas es necesario tener en
cuenta: a) las informaciones NO deben ser
contradictorias entre s o mutuamente excluyentes, b)
en las preguntas de clave A, el problema debe poder
solucionarse con las dos informaciones sin requerir de
otra, c) en las preguntas de clave B, C o D, el
problema planteado debe poder solucionarse con una
sola informacin y d) en las preguntas de clave E las
informaciones deben ser necesarias pero NO
suficientes para resolver el problema.
Ejemplo 6: Pregunta de Informacin Suficiente
Se quiere comparar el tiempo de reaccin ante un

estmulo en dos poblaciones. Se toman muestran
aleatorias de las poblaciones, se recogen los datos y
se elige un estadstico de prueba. Para decidir si se
acepta o rechaza una hiptesis de igualdad de medias
con un nivel de significancia , se requiere conocer:
I. la distribucin del estadstico de prueba
II. la probabilidad de obtener un valor mayor que el
observado en el estadstico de prueba
Anlisis de Postulados
Este tipo de pregunta consta de una afirmacin y dos

postulados identificados con los nmeros I y II. Entre la
afirmacin y los postulados se encuentra la palabra
POR CONSIGUIENTE. Para responder este tipo de
pregunta el examinado no necesita evaluar el valor de
verdad de las afirmaciones, todo se supone verdadero;
solo debe analizar la relacin lgica existente entre
afirmacin y postulados. Es un tipo de pregunta de
difcil elaboracin y requiere de cuidadoso anlisis
previo para que la respuesta sea inequvoca. Es muy
adecuado para evaluar anlisis.
Las instrucciones para responder este tipo de pregunta son,
generalmente, como se muestra a continuacin
"Las preguntas que encontrar a continuacin constan de

una afirmacin VERDADERA y dos postulados tambin
VERDADEROS identificados con los nmeros I y II. Usted
debe decidir si los postulados se deducen lgicamente de la
afirmacin y contestar segn el cuadro siguiente: ...
Marque A s de la tesis se deducen los postulados I y II
Marque B si de la tesis solo se deduce el postulado I
Marque C si de la tesis solo se deduce el postulado II
Marque D si ninguno de los postulados se deduce de la tesis
Ejemplo 7: Pregunta de Anlisis de Postulados
Es inimputable quien comete el delito bajo
influencia determinante de un trastorno mental
POR CONSIGUIENTE
I. Un psictico puede ser inimputable
II. Un inimputable comete un hecho tpico y
antijurdico pero no culpable ni punible
Adems de las normas generales, para la construccin de este

tipo de preguntas es necesario tener en cuenta: a) aun
cuando la instruccin le indica al examinado que debe
suponer todo verdadero, es recomendable que las
afirmaciones lo sean en efecto o, por lo menos que no sean
absurdos u obviamente falsos, b) todas las afirmaciones
deben ser gramaticalmente completas e independientes unas
de otras, c) la construccin de la pregunta debe ser tal que la
deduccin lgica sea indiscutible, de manera que la respuesta
correcta sea inequvoca y d) este tipo de pregunta es til para
poblaciones de alto nivel educativo.
Anlisis de Relaciones
Las preguntas de este tipo presentan dos afirmaciones

unidas por la palabra PORQUE y la segunda afirmacin se
considera una RAZON verdadera o supuesta de la primera.
El examinado debe evaluar tanto el valor de verdad de las
afirmaciones como la relacin entre ellas. A diferencia de
las preguntas de anlisis de postulados, en stas las
afirmaciones pueden ser verdaderas o falsas. Este tipo de
preguntas es particularmente til para evaluar anlisis y
presenta menos dificultades prcticas que la pregunta de
anlisis de postulados.
Las preguntas que encontrar a continuacin constan de una
afirmacin y una razn unidas por la palabra PORQUE. Usted
debe juzgar tanto el grado de verdad o falsedad de cada una de
ellas como la relacin existente entre las mismas, y contestar en
su hoja de respuestas segn el cuadro siguiente:
Marque A
si ambas afirmaciones son verdadera y la segunda
es una razn o explicacin correcta de la primera
Marque B
si ambas afirmaciones son verdaderas pero la
segunda NO es una razn o explicacin correcta de la primera
Marque C
si la primera afirmacin es verdadera pero la
segunda es falsa
Marque D si la primera afirmacin es falsa pero la segunda
es verdadera
Marque E
si ambas afirmaciones son falsas
Las preguntas que encontrar a continuacin constan de
una afirmacin y una razn unidas por la palabra PORQUE.
Usted debe juzgar tanto el grado de verdad o falsedad de
cada una de ellas como la relacin existente entre las
mismas, y contestar en su hoja de respuestas segn el
cuadro siguiente:
Marque A
si ambas afirmaciones son verdadera y la
segunda es una razn o explicacin correcta de la primera
Marque B
si ambas afirmaciones son verdaderas pero la
segunda NO es una razn o explicacin correcta de la
primera
Marque C
si la primera afirmacin es verdadera pero la
segunda es falsa
Marque D si la primera afirmacin es falsa pero la
segunda es verdadera
Marque E
si ambas afirmaciones son falsas
Para la construccin de este tipo de preguntas es

necesario tener en cuenta: a) las afirmaciones no
deben ser obviamente falsas u obviamente
verdaderas, b) las afirmaciones no deben ser
contradictorias entre s o mutuamente excluyentes
y c) las afirmaciones deben estar construidas de
manera que pueda juzgarse su verdad o falsedad
independientemente, es decir, deben ser frases
gramaticalmente completas.
Para la construccin de este tipo de preguntas es

necesario tener en cuenta: a) las afirmaciones no
deben ser obviamente falsas u obviamente
verdaderas, b) las afirmaciones no deben ser
contradictorias entre s o mutuamente excluyentes
y c) las afirmaciones deben estar construidas de
manera que pueda juzgarse su verdad o falsedad
independientemente, es decir, deben ser frases
gramaticalmente completas.
Ejemplo 8: Pregunta de Anlisis de Relaciones
El hemisferio cerebral izquierdo regula las

contracciones musculares del lado derecho del
cuerpo
PORQUE
las fibras motoras y sensitivas se cruzan en el
bulbo
ANLISIS DE LOS TEMS
Estimacin de la Dificultad del tems

xito en la estimacin en contextos variados
Propiedades del sujeto
Propiedades de los tems
Halo
Azar
Juicios Subjetivos
Covarianza con la prueba

(Homogeneidad)
Frecuencia de cada opcin
Calificacin
Dificultad
Administracin
Rapport
Discriminacin
Correlacin con la prueba
INDICE DE DIFICULTAD
1.
2.
3.
4.
Indica la proporcin de aciertos en la muestra de

alumnos que estamos utilizando. Es la media de ste
50% de sujetos analizados.
El trmino de dificultad se presta a equvocos: in ndice
mayor indica un pregunta mas fcil.
Este ndice de dificultad sirve para evaluar cuatro
variables:
La complejidad de la habilidad medida.
Las caractersticas del logro del grupo.
La comparacin de distintos reactivos que miden la
misma habilidad.
La comparacin de reactivos que miden la misma
habilidad pero con una relacin jerrquica.
INDICE DE DIFICULTAD
Se fija un mnimo valor aceptable de p = 0.5 para
considerar el reactivo bueno, cualquier medida inferior a
0.5, aunque no quiere decir que el reactivo no sirve, es
mejor no usarlo porque podra ser que lo que est mal son
las instrucciones.
Criterios para calificar la dificultad de los reactivos de

acuerdo al valor del ndice de dificultad de los reactivos p.
Muy difcil
0% - 49%
Optima
50% - 69%
Ligeramente fcil
70% - 89%
Muy fcil
90% - 100%
INDICES DE DISCRIMINACION
Los ndices de discriminacin expresan en que

medida cada pregunta o tem diferencia a los que
mas saben de los que menos saben.
Es el ndice probablemente ms utilizado. Expresa
hasta que punto la pregunta discrimina, establece
diferencias, contribuye a situar a un sujeto en el
grupo superior e inferior.
A mayor diferencia, en numero de acertantes entre
los grupos superior e inferior, el tem es mas
discriminante, contribuye mas a situar a un sujeto
entre los primeros o entre los ltimos.
Las preguntas muy fciles y muy difciles no

discriminan, no establecen diferencias; nos dicen
que todos saben o no saben una pregunta, pero
no quien sabe mas y quien menos. Estas
preguntas no contribuyen a la fiabilidad del test,
pero eso no quiere decir necesariamente que
sean malas preguntas.
Si todos y solos los del grupo superior

responden correctamente, tendremos que:
ID=1.
Si todos y solos los del grupo inferior
responden correctamente, tendremos que: ID=
-1.
Si el ID es menor de 0.30 el tem debe

eliminarse porque no discrimina, an
cuando su nivel de dificultad sea ptimo.
Si el tem tiene un ID igual o superior a

0.30 y su nivel de dificultad no es ptimo
debe entonces corregirse y mejorarse ya
que discrimina y puede considerarse como
un tem adecuado para la prueba. A
mayor valor, mayor poder discriminativo.
Forma de calcular D y P
1.
2.
Procedimiento:
Hallar los puntajes totales por sujeto.
Ordenarlos de mayor a menor o al revs. Nos
interesan los puntajes extremos (27% de
bajos) y (27% de altos) y los puntajes
promedio no sirven para el anlisis, se ocultan.
Por ejemplo, si hay 100 datos el 27% serian
27 datos y si fueran 70 datos el 27% seria
equivalente a 18 datos.
3.
4.
Calcular el nmero de sujetos del grupo de los

altos que responde correctamente bien cada
tem y calcular el nmero de sujetos del grupo
de los bajos que responde bien cada tem.
Identificar el ndice de dificultad por la
formula:
P = nG(altos)A + nG(bajos)B
G(total)A + G(total)B
y el ndice de dificultad con la formula:
D = GA + GB
G(total).

Psicometra 100509194052 Phpapp01

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Psicometra 100509194052 Phpapp01

Diunggah oleh

Hak Cipta:

Format Tersedia

PSICOMETRA

En China se utilizan tests para acceder a puestos en el gobierno.

Thurstone publica su libro The reliability and validity of tests.

Wechsler propone su escala de medida para la inteligencia.

Aparece el cuestionario de personalidad de Minnesota Multiphasic Personality

Cronbach propone su Teora de la Generalizacin en la cual utiliza el anlisis de

Diferencia entre psicometra y

Hacia el ao 1115 a.C. se utilizan comienzan a utilizar en

Entre 1904 y 1910 Charles Spearman funda la

En 1960 Lee Cronbach propone su Teora de la

En una muestra pequea

Teora clsica de los Tests

El modelo de puntuacin verdadera se concreta en

La puntuacin verdadera se obtiene con el promedio

Si en una poblacin conociramos los errores de

Si en una poblacin conociramos las

Limitaciones de la Teora Clsica

Las caractersticas de los tems (dificultad y

La puntuacin que una persona obtenga ser diferente si

Teora de la Respuesta al tem

Unidimensionalidad: todos los tems que forman el test han

de medir un mismo y nico rasgo. El supuesto de

Independencia local: entre los tems de un test si la respuesta

que una persona da a uno de ellos no depende de las

Un prueba psicolgica o test

Es un instrumento en formato impreso o digital

Estructura general de un test

Tabla de puntuaciones y baremos.

Es un documento donde se menciona:

Es un documento que consta de:

La hoja de respuestas y plantilla de

Es la hoja donde la persona anota las respuestas

Una vez que se han obtenido los aciertos y

Son tablas de puntuaciones estndar que se

Tipos de pruebas o tests

Segn la(s) variable(s)

Clasificacin de las pruebas por aplicacin

Pruebas de autoaplicacin: son tests que no requieren la

Pruebas de aplicacin individual: son aquellas que el

Pruebas de aplicacin grupal: son aquellas que el

aplicacin por parte de un psiclogo sino que puede

psiclogo administra a una sola persona. Por ejemplo, en

Clasificacin de las pruebas segn la forma

Pruebas de desempeo: miden el rendimiento mximo

Pruebas de poder: miden el nivel de destreza mental de

Pruebas de velocidad: miden cuantos tems responde el

Pruebas con referencia a la norma o al criterio: mide la

(individual) o el rendimiento normal o tpico (de un

sujeto en un tiempo especifico.

variables psicolgica segn objetivos especficos.

Clasificacin de las pruebas segn las

Pruebas de capacidad mental (inteligencia).

Pruebas de aprovechamiento o conocimiento.

Pruebas de actitudes, aptitudes,

Estructura general de un tem

Enunciado: menciona las instrucciones para contestar el

Opciones de respuesta: incluyen una(s) respuestas(s)

tem y plantea un contexto o situacin a partir del cual

Clasificacin del formato de respuestas

Clasificacin de las respuestas en tests

Eleccin binaria: de dos alternativas, se elige la

Eleccin mltiple: entre ms de dos alternativas