Anda di halaman 1dari 88

PSICOMETRA

Diseado por:
Germn Andrs Torres Escobar

Hitos en la historia de la
psicometra
AO

HITO O ACONTECIMIENTO

1115 a.C.

En China se utilizan tests para acceder a puestos en el gobierno.

1869 d C.

Francis Galton publica el libro Genio Hereditario (1869) donde plantea a travs
de estudios estadsticos que la inteligencia se hereda.

1904 1910 d. C.

Charles Spearman funda la Teora Clsica de los tests o del modelo lineal
y publica su teora de los factores de la inteligencia y las formulas de atenuacin.

1905 d.C.

Alfredo Binet y Theodore Simon publican la primera escala de inteligencia para nios,
con el fin de establecer su edad mental y predecir su rendimiento acadmico.

1918 d.C.

Se crean los tests de inteligencia Army Alpha y Beta para clasificar a los soldados
durante la Primera Guerra Mundial y Robert Woodworth elabor el primer Personal
Data Sheet para detectar los soldados que pudieran tener crisis nerviosas.

1931 d.C.

Thurstone publica su libro The reliability and validity of tests.

1939 d.C.

Wechsler propone su escala de medida para la inteligencia.

1940 d.C.

Aparece el cuestionario de personalidad de Minnesota Multiphasic Personality


Inventory (MMPI).

1960 d.C.

Cronbach propone su Teora de la Generalizacin en la cual utiliza el anlisis de


varianza para interpretar las fuentes de error en los puntajes.

1980 d.C.

Rasch plantea la Teora de la Respuesta al tem o del rasgo latente que permite
conocer la informacin de cada tem para disear pruebas individualizadas.

La psicometra

Es la rama de la
psicologa
que
desarrolla y estudia
las propiedades de las
pruebas psicolgicas
o tests para medir las
variables psicolgicas
con
la
mayor
precisin posible.

Diferencia entre psicometra y


evaluacin psicolgica
Psicometra

Evaluacin psicolgica

nfasis en la medicin

nfasis en el diagnstico

Instrumentos y tests

La persona

Historia de la psicometra
Antecedentes

Modelos

histricos.

de medicin.

Antecedentes histricos

Hacia el ao 1115 a.C. se utilizan comienzan a utilizar en


China los primeros tests que buscan medir las
capacidades de aspirantes para acceder a puestos del
gobierno (primera medicin de capacidades).
En 1869 Francis Galton publica el libro Genio Hereditario
donde plantea a travs de estudios estadsticos que la
inteligencia se hereda y que es posible medirla
(estudios estadsticos en psicologa).

Entre 1904 y 1910 Charles Spearman funda la


Teora Clsica de los tests o del modelo lineal y
publica su teora de los factores de la
inteligencia y las formulas de atenuacin
(Estrategias de medicin y TCT).
En 1905 Alfredo Binet y Theodore Simon
publican la primera escala de inteligencia para
nios, con el fin de establecer su edad mental y
predecir su rendimiento acadmico (uno de los
primeros tests psicolgicos).

En 1960 Lee Cronbach propone su Teora de la


Generalizacin en la cual utiliza el anlisis de
varianza para interpretar las fuentes de error en
los
puntajes.
Igualmente
l
desarroll
estrategias para la medicin de la confiabilidad
de un test.
En 1980 Rasch plantea la Teora de la Respuesta
al tem o del rasgo latente que permite conocer
la informacin de cada tem para disear
pruebas individualizadas.

Modelos de medicin
Teora Clsica de los
Tests (TCT)

Teora de la Respuesta al
tem (TRI)

Anlisis de la prueba
completa

Anlisis de tems
individuales

En una muestra pequea


de sujetos (N < 500)

En grandes muestras de
sujetos (N 500)

Teora clsica de los Tests

El modelo de puntuacin verdadera se concreta en


un primer supuesto:
X=V+E
que indica que la puntuacin emprica directa
de una persona en un test (X) est compuesta por
la puntuacin verdadera de la persona (V) y un
error de medida (E) que se comete al medir el rasgo
con el test.
El error de medida se establece como la diferencia
entre la puntuacin emprica y la verdadera:
E=X-V

La puntuacin verdadera se obtiene con el promedio


de las puntuaciones empricas que obtiene la
persona en un nmero elevado de aplicaciones del
test:
V = E[X]
Si en una poblacin se conocen las puntuaciones V y
E de los individuos, la correlacin entre ambas
variables sera nula, porque se asume que
puntuaciones verdaderas elevadas no tienen porqu
tener asociados errores elevados:

r VE = 0

Si en una poblacin conociramos los errores de


medida de cada individuo quien ha realizado dos
tests diferentes (j y k), la correlacin entre
ambas variables tambin sera nula:

E jEk = 0

Si en una poblacin conociramos las


puntuaciones E en un test j y las puntuaciones V
en un test k, ambas variables correlacionaran
cero:

E jVk = 0

Limitaciones de la Teora Clsica

Las caractersticas de los tems (dificultad y


discriminacin) dependen del grupo de personas en el
que se han aplicado.

La puntuacin que una persona obtenga ser diferente si


se le aplican dos tests que midan la misma caracterstica
pero cuyo nivel de dificultad sea diferente.
La TCT supone que el error de medida es una propiedad
del test y, por lo tanto, igual para todos los sujetos,
independientemente de cual sea su puntuacin.

Teora de la Respuesta al tem

Unidimensionalidad: todos los tems que forman el test han

de medir un mismo y nico rasgo. El supuesto de


unidimensionalidad exige que todos y cada uno de los tems
del test midan una nica dimensin.
No hay como tal puntuaciones verdaderas sino una
probabilidad de acierto determinada por unos parmetros.

Independencia local: entre los tems de un test si la respuesta

que una persona da a uno de ellos no depende de las


respuestas que da a los otros, ni por el orden de presentacin
de los tems, las respuestas que ya se hayan dado, etc.

Un prueba psicolgica o test

Es un instrumento en formato impreso o digital


que consta de una serie de preguntas o
reactivos que miden unas variables psicolgicas
especificas a travs de un sistema de
puntuacin.
Puede aplicarse en diferentes campos de la
psicologa, para fines diversos como diagnstico
clnico (psicologa clnica) , seleccin de personal
(psicologa organizacional) o anlisis de
aptitudes vocacionales (psicologa educativa).

Estructura general de un test


impreso

Cuadernillo de instrucciones.

Cuadernillo de preguntas.

Hoja(s) de respuestas.

Plantilla de correccin.

Tabla de puntuaciones y baremos.

El cuadernillo de instrucciones

Es un documento donde se menciona:


El nombre de la prueba, sus autores y el
ao de publicacin.
La(s) variable(s) que mide y sus objetivos.
Los antecedentes (marco conceptual y
terico) de la prueba.
Las instrucciones generales de aplicacin
(para los psiclogos).

El cuadernillo de preguntas

Es un documento que consta de:


Las instrucciones de respuesta (para quien la va
a responder).
Los tems o preguntas.
No puede rayarse ni se puede escribir sobre este
ya que se usa en diferentes aplicaciones.

La hoja de respuestas y plantilla de


correccin

Es la hoja donde la persona anota las respuestas


a de los tems planteados en el cuadernillo de
preguntas.
Una vez que la persona entrega la hoja de
respuestas al psiclogo, l o ella la califican
poniendo encima de la hoja de respuestas, la
plantilla de correccin para ver en cuales acert
el sujeto y en cuales no.

El sistema de puntuacin
Puntuacin cruda o bruta
Puntuacin de los tems Errores
Puntuacin estndar o tpica
Centiles

Puntuaciones T, S o Z
Perfil del sujeto

La tabla de puntuaciones y
baremos

Una vez que se han obtenido los aciertos y


errores de la persona con ayuda de la plantilla,
se obtiene una puntuacin cruda o bruta,
que es especifica para ese sujeto.
Esa puntuacin bruta se analiza en la tabla de
puntuaciones estndar, para obtener una
puntuacin estndar o tpica del sujeto
dentro de la poblacin o muestra de sujetos que
present la prueba (baremo).

Los baremos

Son tablas de puntuaciones estndar que se


clasifican por grupos poblacionales o muestrales
segn la edad, profesin o gnero.
Por ejemplo, para una misma prueba existen
baremos para hombres, mujeres, hombres
profesionales,
mujeres
profesionales,
estudiantes de secundaria, etc.

Tipos de pruebas o tests


Clasificacin de las pruebas
Segn
la aplicacin

Segn la forma de
medir la(s) variable(s)

Segn la(s) variable(s)


que miden

- Autoaplicacin

-De desempeo
- De poder
- De velocidad

- De capacidad mental
- De conocimientos
- De personalidad

- Individual
- Grupal

Clasificacin de las pruebas por aplicacin

Pruebas de autoaplicacin: son tests que no requieren la

Pruebas de aplicacin individual: son aquellas que el

Pruebas de aplicacin grupal: son aquellas que el

aplicacin por parte de un psiclogo sino que puede


hacerlas la persona con ayuda de un computador.

psiclogo administra a una sola persona. Por ejemplo, en


un caso clnico.
psiclogo pueden aplicar a varias personas al mismo
tiempo, pero controlando que no conversen entre ellas.
Por ejemplo, una prueba de aptitudes e intereses
vocacionales.

Clasificacin de las pruebas segn la forma


de medir la(s) variable(s)

Pruebas de desempeo: miden el rendimiento mximo

Pruebas de poder: miden el nivel de destreza mental de

Pruebas de velocidad: miden cuantos tems responde el

Pruebas con referencia a la norma o al criterio: mide la

(individual) o el rendimiento normal o tpico (de un


grupo).
un sujeto o su nivel de conocimiento.

sujeto en un tiempo especifico.

variables psicolgica segn objetivos especficos.

Clasificacin de las pruebas segn las


variables que miden

Pruebas de capacidad mental (inteligencia).

Pruebas de aprovechamiento o conocimiento.

Pruebas de personalidad.

Pruebas de actitudes, aptitudes,


motivacin, opinin y valores.

Pruebas neuropsicolgicas.

intereses,

Estructura general de un tem

Enunciado: menciona las instrucciones para contestar el

Pregunta(s):

Opciones de respuesta: incluyen una(s) respuestas(s)

tem y plantea un contexto o situacin a partir del cual


se hace la pregunta.
son cuestionamientos que evalan
directamente la variable psicolgica de forma implcita.
Pueden ser abiertas (libre respuesta) o cerradas
(opciones especificas).

correcta(s)
falsa(s).

un(os)

distractor(es)

respuesta(s)

Clasificacin del formato de respuestas


Clasificacin de los tems
En tests de
rendimiento ptimo

- De eleccin
- De emparejamiento

En tests de
rendimiento tpico
- De opcin binaria

- De categoras ordenadas

- De adjetivos

Clasificacin de las respuestas en tests


de rendimiento ptimo

Eleccin binaria: de dos alternativas, se elige la

Eleccin mltiple: entre ms de dos alternativas

Emparejamiento: consiste en encontrar las

que se considera
(verdadero-falso).

correcta

(S

No)

se elige la que se considera correcta.

parejas entre dos conjuntos de conceptos.

Clasificacin de las respuestas en tests


de rendimiento tpico

Opcin binaria: la persona debe manifestar si est de

Categoras ordenadas: el formato establece un continuo

Adjetivos bipolares: este formato es tpico de lo que se

acuerdo o en desacuerdo con una afirmacin.

ordinal de ms de dos categoras, que permite a la


persona matizar mejor su respuesta.

denomina "diferencial semntico".

Confiabilidad

Es el grado en el cual las mediciones


repetidas de un fenmeno relativamente
estable son aproximadas entre s o
consistentes.
Permite predecir el desempeo de un
grupo o de un sujeto e igualmente sirve
para describirlo en ambos casos.

Formas de medir la confiabilidad

Test-retest: consiste en aplicar un test dos veces a un


mismo grupo en un intervalo de das o meses (no
superior).
Formas paralelas: consiste en aplicar un test homologo o
equivalente a un mismo grupo pero en tiempos
diferentes.
Divisin por mitades: consiste en comparar los
resultados de los tems pares e impares en la aplicacin
grupal de un test.

Coeficientes de confiabilidad

Test-retest: coeficiente de estabilidad (r).


Formas
paralelas:
equivalencia (r).

Divisin por mitades:


consistencia interna (r).

coeficiente

coeficiente

de

de

Coeficientes ms usados en divisin


por mitades

Formas de mejorar la confiabilidad


de un test

Para calcular el nmero de tems K para lograr


una confiabilidad RXY deseada (superior a 0.7)
se usa la formula:
K = RXY * (1 rXY) / rXY) * (1 RXY)
donde rX es la confiabilidad inicial.
Una vez obtenido el nmero K se multiplica por
el nmero de items inicial y luego se le resta a
ese resultado el nmero de tems inicial.

Para calcular la confiabilidad al quitar un


nmero de tems X con un total de tems Y
y con una confiabilidad conocida C se usa
la siguiente formula:
YX/Y
El resultado obtenido con esta formula
debe operarse con la formula 2:
[resultado 1 * C]
[1 + (resultado 1 1) * C]

VALIDEZ

Es el grado en el cual una prueba mide lo


que pretende medir.
Conjunto de pruebas y datos que han de
recogerse para garantizar la pertinencia
predictiva de las inferencias que hacen a
partir de un test.

Tipos de validez

Validez del contenido.

Validez con relacin a criterio.

Validez del constructo.

VALIDEZ DEL CONTENIDO

Es la muestra adecuada y representativa de los


contenidos que se pretende evaluar con un test.
Los tems o preguntas se seleccionan segn su:
Coherencia: con las caractersticas y variables.
Relevancia: de acuerdo con el indicador.
Buena redaccin: la gramtica del tem.
Validez aparente: para el evaluado.

VALIDEZ CON RELACIN AL


CRITERIO

Es la comparacin del desempeo de un


grupo de sujetos en un test respecto
patrones de medida ya establecidos.
Se clasifica en:
Validez concurrente.
Validez predictiva.

Validez concurrente

Es el anlisis de variabilidad que efecta al


comparar el desempeo de dos grupos de
distintos de sujetos en un mismo test.
Tambin se le denomina validez cruzada o
entre distintas muestras.

Validez predictiva

Es el grado de precisin con que las


calificaciones de la prueba predicen las
calificaciones del criterio.
Se obtiene mediante la correlacin entre
una variable de indicador y una variable
criterio a partir de r (Pearson), cuyo valor
es igual o menor a 0,60.

Factores que afectan la validez con


relacin a los criterios

Las diferencias de grupo:

sexo, edad y rasgos de personalidad.

La contaminacin de los criterios:

evidencias falsas que les restan validez.

El ndice de base (debe ser mayor de 50):

nmero de personas que poseen la variable medida.

El incremento de la validez:

costo razonable del instrumento.

VALIDEZ DEL CONSTRUCTO

Es el grado de exactitud con el que se


mide un constructo o concepto psicolgico
particular.
Depende de unas condiciones que son
externas al evaluador y la persona que
disea la prueba.

Condiciones de la
validez del constructo

Valoracin por parte de jueces expertos


de la correspondencia contenido-concepto.
Anlisis de la consistencia interna de la
prueba.
Estudio de las variables intervinientes en
la calificacin.

Anlisis factorial y correlacin con otras


pruebas.
Anlisis de las respuestas.
Correlaciones altas con otras medidas o
mtodos para medir el mismo constructo
(Validez convergente).
Correlaciones bajas con las medidas de
constructos
diferentes
(Validez
discriminante).

CONSTRUCCIN DE LOS TEMS

La Taxonoma de Bloom

1.

2.
3.
4.
5.
6.

El dominio cognoscitivo comprende 6


categoras:
Recuerdo
Comprensin
Aplicacin
Anlisis
Sntesis
Evaluacin

La Taxonoma de Bloom
Recuerdo:
Incluye situaciones de examen que acentan la
importancia del recuerdo de datos, ideas, materiales
o fenmenos, ya sea como reconocimiento o
evocacin. Supone, el recuerdo o reconocimiento
de: Datos especficos como terminologas o hechos;
modos y medios para el tratamiento de datos
especficos como convenciones, clasificaciones,
metodologas, tcnicas o procedimientos y,
universales y abstracciones en un campo
determinado como principios, generalizaciones,
teoras y estructuras (Herrera, 2003).

La Taxonoma de Bloom
Ejemplo 1: Pregunta que evala Recuerdo

A continuacin encontrar preguntas que constan de un enunciado y cuatro (4) o cinco (5) opciones de respuesta. Usted
debe marcar en su hoja de respuesta, aquella opcin que
considere correcta.
El modelo de control social propuesto por Max Weber para las
organizaciones, se denomina modelo:
A.- de los sistemas
B.- burocrtico
C.- estructuralista
D.- de las organizaciones

La Taxonoma de Bloom
Comprensin:
Implica la inteleccin y fraccionamiento de un mensaje.
Operacionalmente se define como cualquier conducta que vaya
desde la presentacin de una proposicin con palabras distintas
de las del enunciado original, hasta la aplicacin de un principio
en una situacin nueva para el examinado, pasando por la
ejemplificacin. Se define en trminos de tres operaciones: a)

Traduccin o capacidad para expresar un concepto o mensaje


conocido en palabras diferentes o pasarlo de un sistema
simblico a otro, b) Interpretacin o reordenamiento de ideas de
una comunicacin en una nueva configuracin. Incluye la
habilidad para captar el contenido de una comunicacin como un
todo y distinguir entre conclusiones legtimas y contradictorias y
c) Extrapolacin o hacer explcitas algunas conclusiones,
colorarios, consecuencias o efectos de una comunicacin dada
(Herrera, 2003).

La Taxonoma de Bloom
Ejemplo 2: Pregunta que evala Comprensin

Si un psiclogo afirma que una prueba que ha preparado para


seleccin de personal tiene un coeficiente de validez predictiva mas
alto que el de fiabilidad, concluira que
A. est bien, por cuanto lo mas importante para la seleccin es la
validez de prediccin
B. debera tener mas alta fiabilidad que validez ya que lo principal es
la confianza en el instrumento
C. debe tener un error ya que la validez predictiva NO puede ser
mayor al coeficiente de fiabilidad
D. debe tener un error ya que los dos coeficientes, el de validez y el
de fiabilidad deben tener igual valor
E. no debera utilizar la prueba ya que debe tener mas alta fiabilidad
que validez para el objeto propuesto

La Taxonoma de Bloom
Aplicacin:

Se refiere a la capacidad para aplicar teoras, principios,


mtodos o ideas en la solucin de un problema prctico. Es la
habilidad para aplicar principios y generalizaciones a nuevos
problemas y situaciones. Comprende entonces tareas como a)
identificar los principios o generalizaciones apropiados para
resolver un problema o reformularlo para lograr tal
identificacin, b) especificar los lmites dentro de los cuales un
principio o generalizacin es verdadero o relevante y reconocer
las excepciones a los mismos y las razones para ello, c) explicar
nuevos fenmenos a partir de principios o generalizaciones
conocidas, predecir lo que suceder en una situacin nueva
mediante el uso de principios y generalizaciones apropiadas, y
d) determinar o justificar una decisin o accin en una situacin
usando principios o generalizaciones e indicar el razonamiento
que apoya la utilizacin de los mismos ante un determinado
problema (Herrera 2003).

La Taxonoma de Bloom
Ejemplo 3: Pregunta que evala Aplicacin

Escoja la caracterstica del pensamiento infantil que mejor se ajusta a


la conducta descrita por Piaget:
- Cmo se hace para tener madera? Se cortan los troncos de los
rboles.
- Qu se hace para tener rboles? Se siembran los granos. - Y los
granos? Se compran.
- Dnde? En los almacenes. - Y el dueo del almacn? Pinsalo un
poco. Los hace.
- Con qu? Con otros granos. - Cuando vinieron los primeros
hombres, haba ya rboles? No.
- Cmo han comenzado? Por los granos. - De dnde venan estos
granos? Del almacn.
A.
B.
C.
D.
E.

Realismo
Animismo
Artificialismo
Sincretismo
Funcionalismo

La Taxonoma de Bloom
Anlisis:

Hace referencia a la habilidad para fraccionar una comunicacin en sus


elementos, de manera que aparezcan explcitas la jerarqua de las ideas
y las relaciones existentes entre ellas. Esta es un proceso complejo que
implica las tres categoras anteriores; recuerdo, comprensin y
aplicacin, pero va mas all de ellas. Aqu se incluyen tres
subcategoras: a) anlisis de elementos o habilidad para fraccionar una
informacin en sus elementos, como supuestos no explcitos, hechos e
hiptesis; b) anlisis de relaciones o identificar la relaciones que
existen entre los elementos de una comunicacin; inferir los criterios,
relaciones, cualidades, suposiciones o condiciones implcitas en una
comunicacin; o bien, determinar las relaciones entre las hiptesis y las
pruebas que la apoyan, entre las conclusiones y las hiptesis, o entre
las conclusiones y las evidencias; y c) anlisis de principios de
organizacin que es la habilidad para explicitar los principios
organizadores que ha seguido un autor, reducir su propsito, su punto
de vista, su actitud o su interpretacin (Herrera 2003).

La Taxonoma de Bloom
Ejemplo 4: Pregunta que evala Anlisis

Considere los resultados del siguiente estudio:


En una investigacin sobre heredabilidad de rasgos psicosociales, en este caso
la criminalidad, se conformaron tres grupos de sujetos as: el grupo A por
parejas de gemelos univitelinos, el grupo B por parejas de gemelos bivitelinos y
el grupo C por parejas de hermanos naturales. En ningn caso los hermanos
fueron separados. Una vez aplicados los instrumentos de medida
(cuestionarios, encuestas, etc.,), se encontraron los siguientes porcentajes de
acuerdo en relacin con la presencia de conductas criminales:
GRUPOS
A
B
C
% DE ACUERDO
77
35
8
Escoja la interpretacin que mejor se ajuste a los datos de la investigacin
A. A mayor concordancia gentica corresponde un mayor porcentaje de
acuerdo
B. La criminalidad depende del medio ambiente en un 23%.
C. El bajo porcentaje registrado por el grupo C se debe a que es el grupo con
el menor nivel de homogeneidad gentica
D. No se puede concluir en favor de la heredabilidad de las conductas
criminales.

La Taxonoma de Bloom
Sntesis:
Es la capacidad para reunir diferentes elementos o partes
para formar un todo. Esto es, la habilidad para combinar
elementos con el fin de constituir una estructura o
esquema que no estaba presente con claridad. La
capacidad de sntesis incluye: a) produccin de una
comunicacin nica, b) produccin de un plan o conjunto
de operaciones con un fin determinado y c) derivacin de
un conjunto de relaciones abstractas, explicaciones o
hiptesis para dar cuenta de un fenmeno dado. Es difcil
construir preguntas estructuradas que evalen esta
categora, son mucho ms frecuentes las preguntas
abiertas de tipo ensayo (Herrera 2003).

La Taxonoma de Bloom
Evaluacin:
Es la capacidad para emitir juicios sobre ideas, obras,
mtodos, materiales o soluciones, con algn propsito
determinado. Esta categora incluye formulacin de juicios:
a) con base en pautas internas como exactitud, precisin y
cuidado con que ha sido elaborada una comunicacin
dada; consistencia de los razonamientos, relaciones entre
supuestos, evidencias y conclusiones y reconocimiento de
los valores y puntos de vista utilizados en un juicio
particular sobre una obra b) en trminos de criterios
externos como comparacin de un trabajo u obra con
otros, utilizando criterios o normas explcitas. Al igual que
en la categora anterior, es difcil construir preguntas
estructuradas que evalen esta categora, son ms
apropiadas las preguntas abiertas de tipo ensayo (Herrera
2003).

Tipos de Preguntas
NOMBRE

ELEMENTOS

CARACTERISTICAS

Eleccin
mltiple
con nica
respuesta

Un enunciado y cuatro
o cinco opciones
de respuesta

Slo una de las opciones completa correctamente el enunciado. Puede


utilizarse para evaluar cualquier objetivo educativo especialmente
recuerdo, comprensin y aplicacin.

Eleccin
mltiple
con
mltiple
respuesta

Un enunciado y cuatro
(4) opciones de
respuesta

Una, dos, tres o todas las opciones de respuesta pueden completar


correctamente el enunciado, el examinado debe elegir una
combinacin de ellas. Adecuado para evaluar cualquier objetivo
educativo.

Un problema y dos
informaciones
relacionadas con
el mismo

Una o las dos informaciones pueden ser necesarias y suficientes para


resolver el problema o pueden ser necesarias pero no suficientes. El
evaluado no debe resolver el problema, slo evaluar la informacin
disponible. Excelente para evaluar aplicacin.

Una afirmacin y dos


postulados

Tanto la afirmacin como los postulados son VERDADEROS. El


examinado evala la relacin lgica entre ellos. Excelente para
evaluar anlisis.

Dos afirmaciones
separadas por la
palabra PORQUE

Tanto la afirmacin como la razn pueden ser VERDADERAS o FALSAS.


El examinado evala tanto su valor de verdad como la relacin lgica
entre ellas. Excelente para evaluar anlisis.

Informacin
suficiente
Anlisis de
postulado
s
Anlisis de
relaciones

Eleccin Mltiple con nica


Respuesta
Es el tipo de pregunta ms conocido y usado en las pruebas
objetivas. Estn conformadas por un enunciado y cuatro (4)
o cinco (5) opciones de respuesta. El enunciado puede
contener una frase incompleta, una interrogacin, un texto o
una grfica; las opciones de respuesta aparecen identificadas
con las letras A, B, C, D y E. Una sola de las opciones
completa o responde correctamente el enunciado. Este tipo
de pregunta es til para evaluar cualquiera de las cuatro
primeras categoras de la taxonoma de Bloom. Los ejemplos
1 a 4 son preguntas de eleccin mltiple con nica
respuesta.

Eleccin Mltiple con nica


Respuesta
Adems de las consideraciones generales sobre
construccin de preguntas, en este tipo de tems es
altamente recomendable evitar expresiones como
TODAS LAS ANTERIORES o NINGUNA DE LAS
ANTERIORES. Si ms de una opcin es correcta
probablemente la pregunta quede mejor formulada con
el formato de eleccin mltiple con mltiple respuesta.

Eleccin Mltiple con Mltiple


Respuesta
Este tipo de pregunta consta de un enunciado y cuatro
(4) opciones de respuesta identificadas con los
nmeros 1, 2, 3 y 4. Una o varias opciones de estas
pueden completar correctamente el enunciado. Este
tipo de pregunta es til para evaluar cualquiera de las
categoras de objetivos educativos. Sin embargo, se
usa frecuentemente para evaluar comprensin y
aplicacin utilizando: a) una situacin en la que es
necesario considerar varias consecuencias posibles, b)
una situacin en la que es necesario especificar una o
ms condiciones para definirla adecuadamente, c) dos
situaciones semejantes o dismiles con respecto a uno
o ms puntos de comparacin, d) un principio que
puede aplicarse a ms de una situacin o e) varias
consideraciones que pueden conducir al mismo

Eleccin Mltiple con Mltiple


Respuesta
Las instrucciones que se dan al examinado son,
generalmente de la siguiente forma:

"A continuacin encontrar preguntas que constan de


un enunciado y cuatro (4) opciones de respuesta. Una
o varias opciones pueden completar correctamente el
enunciado. Usted debe marcar su hoja de respuestas
segn el cuadro siguiente:
Marque A
Marque B
Marque C
Marque D

si las opciones 1, 2 y 3 son correctas


si las opciones 1 y 3 son correctas
si las opciones 2 y 4 son correctas
si slo la opcin 4 es correcta

Eleccin Mltiple con Mltiple


Respuesta
Este tipo de pregunta no debe incluir distractores
mutuamente excluyentes por cuanto estaran anulando
una o varias opciones de respuesta; tampoco debe
incluir en las opciones de respuesta expresiones como
TODAS LAS ANTERIORES o NINGUNA DE LAS
ANTERIORES.

Eleccin Mltiple con Mltiple


Respuesta
Ejemplo:

La investigacin emprica ha encontrado que:


1. Las personas toman menos tiempo en el aprendizaje de
un concepto cuando hay muchos atributos irrelevantes
2. En el aprendizaje de un concepto son mejores los
ejemplos negativos que los positivos
3. En el aprendizaje de un concepto la velocidad de
aprendizaje es una funcin directa del nmero de atributos
4. Las personas toman ms tiempo en el aprendizaje de un
concepto cuando hay muchos atributos relevantes

Informacin Suficiente
Estas preguntas constan de un problema y dos
informaciones identificadas con los nmeros I y II.
No se requiere que el examinado resuelva el
problema, sino que decida si las informaciones
proporcionadas son necesarias y suficientes para
resolverlo. Este tipo de pregunta es muy til para
evaluar aplicacin.

Informacin Suficiente
Las instrucciones son, generalmente, las siguientes:

"Las preguntas que encontrar a continuacin constan de


un problema y dos informaciones identificadas con los
nmeros I y II. Usted debe decidir si las informaciones son
necesarias y suficientes para solucionar el problema y
marcar su hoja de respuestas segn el cuadro siguiente: ...
Marque A s necesita y basta con las informaciones I y II
Marque B si necesita y basta con la informacin I
Marque C si necesita y basta con la informacin II
Marque D si cualquiera de las dos informaciones sirve
Marque E si no es suficiente con las dos informaciones

Informacin Suficiente
Adems de las normas generales, para la construccin
de este tipo de preguntas es necesario tener en
cuenta: a) las informaciones NO deben ser
contradictorias entre s o mutuamente excluyentes, b)
en las preguntas de clave A, el problema debe poder
solucionarse con las dos informaciones sin requerir de
otra, c) en las preguntas de clave B, C o D, el
problema planteado debe poder solucionarse con una
sola informacin y d) en las preguntas de clave E las
informaciones deben ser necesarias pero NO
suficientes para resolver el problema.

Informacin Suficiente
Ejemplo 6: Pregunta de Informacin Suficiente

Se quiere comparar el tiempo de reaccin ante un


estmulo en dos poblaciones. Se toman muestran
aleatorias de las poblaciones, se recogen los datos y
se elige un estadstico de prueba. Para decidir si se
acepta o rechaza una hiptesis de igualdad de medias
con un nivel de significancia , se requiere conocer:
I. la distribucin del estadstico de prueba
II. la probabilidad de obtener un valor mayor que el
observado en el estadstico de prueba

Anlisis de Postulados

Este tipo de pregunta consta de una afirmacin y dos


postulados identificados con los nmeros I y II. Entre la
afirmacin y los postulados se encuentra la palabra
POR CONSIGUIENTE. Para responder este tipo de
pregunta el examinado no necesita evaluar el valor de
verdad de las afirmaciones, todo se supone verdadero;
solo debe analizar la relacin lgica existente entre
afirmacin y postulados. Es un tipo de pregunta de
difcil elaboracin y requiere de cuidadoso anlisis
previo para que la respuesta sea inequvoca. Es muy
adecuado para evaluar anlisis.

Anlisis de Postulados
Las instrucciones para responder este tipo de pregunta son,
generalmente, como se muestra a continuacin

"Las preguntas que encontrar a continuacin constan de


una afirmacin VERDADERA y dos postulados tambin
VERDADEROS identificados con los nmeros I y II. Usted
debe decidir si los postulados se deducen lgicamente de la
afirmacin y contestar segn el cuadro siguiente: ...
Marque A s de la tesis se deducen los postulados I y II
Marque B si de la tesis solo se deduce el postulado I
Marque C si de la tesis solo se deduce el postulado II
Marque D si ninguno de los postulados se deduce de la tesis

Anlisis de Postulados
Ejemplo 7: Pregunta de Anlisis de Postulados
Es inimputable quien comete el delito bajo
influencia determinante de un trastorno mental
POR CONSIGUIENTE
I. Un psictico puede ser inimputable
II. Un inimputable comete un hecho tpico y
antijurdico pero no culpable ni punible

Anlisis de Postulados

Adems de las normas generales, para la construccin de este


tipo de preguntas es necesario tener en cuenta: a) aun
cuando la instruccin le indica al examinado que debe
suponer todo verdadero, es recomendable que las
afirmaciones lo sean en efecto o, por lo menos que no sean
absurdos u obviamente falsos, b) todas las afirmaciones
deben ser gramaticalmente completas e independientes unas
de otras, c) la construccin de la pregunta debe ser tal que la
deduccin lgica sea indiscutible, de manera que la respuesta
correcta sea inequvoca y d) este tipo de pregunta es til para
poblaciones de alto nivel educativo.

Anlisis de Relaciones

Las preguntas de este tipo presentan dos afirmaciones


unidas por la palabra PORQUE y la segunda afirmacin se
considera una RAZON verdadera o supuesta de la primera.
El examinado debe evaluar tanto el valor de verdad de las
afirmaciones como la relacin entre ellas. A diferencia de
las preguntas de anlisis de postulados, en stas las
afirmaciones pueden ser verdaderas o falsas. Este tipo de
preguntas es particularmente til para evaluar anlisis y
presenta menos dificultades prcticas que la pregunta de
anlisis de postulados.

Anlisis de Relaciones
Las preguntas que encontrar a continuacin constan de una
afirmacin y una razn unidas por la palabra PORQUE. Usted
debe juzgar tanto el grado de verdad o falsedad de cada una de
ellas como la relacin existente entre las mismas, y contestar en
su hoja de respuestas segn el cuadro siguiente:
Marque A
si ambas afirmaciones son verdadera y la segunda
es una razn o explicacin correcta de la primera
Marque B
si ambas afirmaciones son verdaderas pero la
segunda NO es una razn o explicacin correcta de la primera
Marque C
si la primera afirmacin es verdadera pero la
segunda es falsa
Marque D si la primera afirmacin es falsa pero la segunda
es verdadera
Marque E

si ambas afirmaciones son falsas

Anlisis de Relaciones
Las preguntas que encontrar a continuacin constan de
una afirmacin y una razn unidas por la palabra PORQUE.
Usted debe juzgar tanto el grado de verdad o falsedad de
cada una de ellas como la relacin existente entre las
mismas, y contestar en su hoja de respuestas segn el
cuadro siguiente:
Marque A
si ambas afirmaciones son verdadera y la
segunda es una razn o explicacin correcta de la primera
Marque B
si ambas afirmaciones son verdaderas pero la
segunda NO es una razn o explicacin correcta de la
primera
Marque C
si la primera afirmacin es verdadera pero la
segunda es falsa
Marque D si la primera afirmacin es falsa pero la
segunda es verdadera
Marque E

si ambas afirmaciones son falsas

Anlisis de Relaciones

Para la construccin de este tipo de preguntas es


necesario tener en cuenta: a) las afirmaciones no
deben ser obviamente falsas u obviamente
verdaderas, b) las afirmaciones no deben ser
contradictorias entre s o mutuamente excluyentes
y c) las afirmaciones deben estar construidas de
manera que pueda juzgarse su verdad o falsedad
independientemente, es decir, deben ser frases
gramaticalmente completas.

Anlisis de Relaciones

Para la construccin de este tipo de preguntas es


necesario tener en cuenta: a) las afirmaciones no
deben ser obviamente falsas u obviamente
verdaderas, b) las afirmaciones no deben ser
contradictorias entre s o mutuamente excluyentes
y c) las afirmaciones deben estar construidas de
manera que pueda juzgarse su verdad o falsedad
independientemente, es decir, deben ser frases
gramaticalmente completas.

Anlisis de Relaciones
Ejemplo 8: Pregunta de Anlisis de Relaciones

El hemisferio cerebral izquierdo regula las


contracciones musculares del lado derecho del
cuerpo
PORQUE
las fibras motoras y sensitivas se cruzan en el
bulbo

ANLISIS DE LOS TEMS

Estimacin de la Dificultad del tems


xito en la estimacin en contextos variados
Propiedades del sujeto

Propiedades de los tems

Halo

Azar

Juicios Subjetivos

Covarianza con la prueba


(Homogeneidad)
Frecuencia de cada opcin

Calificacin

Dificultad

Administracin
Rapport

Discriminacin

Correlacin con la prueba

INDICE DE DIFICULTAD

1.
2.
3.
4.

Indica la proporcin de aciertos en la muestra de


alumnos que estamos utilizando. Es la media de ste
50% de sujetos analizados.
El trmino de dificultad se presta a equvocos: in ndice
mayor indica un pregunta mas fcil.
Este ndice de dificultad sirve para evaluar cuatro
variables:
La complejidad de la habilidad medida.
Las caractersticas del logro del grupo.
La comparacin de distintos reactivos que miden la
misma habilidad.
La comparacin de reactivos que miden la misma
habilidad pero con una relacin jerrquica.

INDICE DE DIFICULTAD
Se fija un mnimo valor aceptable de p = 0.5 para
considerar el reactivo bueno, cualquier medida inferior a
0.5, aunque no quiere decir que el reactivo no sirve, es
mejor no usarlo porque podra ser que lo que est mal son
las instrucciones.

Criterios para calificar la dificultad de los reactivos de


acuerdo al valor del ndice de dificultad de los reactivos p.

Muy difcil
0% - 49%

Optima
50% - 69%

Ligeramente fcil
70% - 89%

Muy fcil
90% - 100%

INDICES DE DISCRIMINACION

Los ndices de discriminacin expresan en que


medida cada pregunta o tem diferencia a los que
mas saben de los que menos saben.
Es el ndice probablemente ms utilizado. Expresa
hasta que punto la pregunta discrimina, establece
diferencias, contribuye a situar a un sujeto en el
grupo superior e inferior.
A mayor diferencia, en numero de acertantes entre
los grupos superior e inferior, el tem es mas
discriminante, contribuye mas a situar a un sujeto
entre los primeros o entre los ltimos.

Las preguntas muy fciles y muy difciles no


discriminan, no establecen diferencias; nos dicen
que todos saben o no saben una pregunta, pero
no quien sabe mas y quien menos. Estas
preguntas no contribuyen a la fiabilidad del test,
pero eso no quiere decir necesariamente que
sean malas preguntas.

Si todos y solos los del grupo superior


responden correctamente, tendremos que:
ID=1.
Si todos y solos los del grupo inferior
responden correctamente, tendremos que: ID=
-1.

Si el ID es menor de 0.30 el tem debe


eliminarse porque no discrimina, an
cuando su nivel de dificultad sea ptimo.

Si el tem tiene un ID igual o superior a


0.30 y su nivel de dificultad no es ptimo
debe entonces corregirse y mejorarse ya
que discrimina y puede considerarse como
un tem adecuado para la prueba. A
mayor valor, mayor poder discriminativo.

Forma de calcular D y P

1.
2.

Procedimiento:
Hallar los puntajes totales por sujeto.
Ordenarlos de mayor a menor o al revs. Nos
interesan los puntajes extremos (27% de
bajos) y (27% de altos) y los puntajes
promedio no sirven para el anlisis, se ocultan.
Por ejemplo, si hay 100 datos el 27% serian
27 datos y si fueran 70 datos el 27% seria
equivalente a 18 datos.

3.

4.

Calcular el nmero de sujetos del grupo de los


altos que responde correctamente bien cada
tem y calcular el nmero de sujetos del grupo
de los bajos que responde bien cada tem.
Identificar el ndice de dificultad por la
formula:
P = nG(altos)A + nG(bajos)B
G(total)A + G(total)B
y el ndice de dificultad con la formula:
D = GA + GB
G(total).

Anda mungkin juga menyukai