Anda di halaman 1dari 37

ASIGANTURA :

CONSTRUCCION DE PRUEBAS
DOCENTE :
FERNANDO PAREDES JARA

INTEGRANTES:
ALEJOS CHANAME JOSSELYN
CAMPOS SANCHES YULI
DIAZ CARLOS YORKA
TORRES FERNANDEZ SUSAN

CICLO :
V I

VALIDEZ Y
CONFIABILIDAD
En trminos generales, se refiere al
grado en que un instrumento realmente
mide la variable que se pretende medir.

DEFINICIN

Hernndez
Sampieri

Grado en que un instrumento realmente
mide la variable que pretende medir.
Para Baechle y
Earle (2007:277-
278)
La validez es el grado en que una
prueba o tem de la prueba mide lo que
pretende medir; es la caracterstica ms
importante de una prueba.
Thorndike
Grado en que un instrumento realmente
mide lo que el investigador pretende
TIPOS
A travs de la validez de contenido
se trata de determinar hasta
dnde los tems de un instrumento
son representativos del dominio o
universo de contenido de la
propiedad que se desea medir.
El procedimiento ms comnmente empleado para determinar este tipo de
validez, es el que se conoce con el nombre de juicios de expertos, para lo cual
se procede de la siguiente manera:
Se seleccionan dos jueces o expertos por lo menos, a los fines
de juzgar, de manera independiente, la bondad de los tems
del instrumento,
Cada experto recibe suficiente informacin escrita acerca de:
(a) el propsito de la prueba.
(b) (b) conceptualizacin del universo de contenido.
(c) (c) plan de operacionalizacin o tabla de especificaciones
(en el caso de las pruebas de rendimiento acadmico).
Cada juez recibe un instrumento de validacin en el cual se
recoge la informacin de cada experto.
Se recogen y analizan los instrumentos de validacin y
se toman las decisiones siguientes:

(a) Los tems donde hay un 100 por ciento de
coincidencia favorable entre los jueces (los tems son
congruentes, estn escritos claramente y no son
tendenciosos) quedan incluido en el instrumento.

(b) Los tems donde hay un 100 por ciento de
coincidencia desfavorable entre los jueces, quedan
excluidos del instrumento.

(c) Los tems donde slo hay coincidencia parcial entre
los jueces deben ser revisados, reformulados, si es
necesario, y nuevamente validados.
Intenta responder la pregunta
Hasta dnde un instrumento mide realmente un determinado
rasgo latente o una caracterstica de las personas y con cunta
eficiencia lo hace?
Gronlund (1976) seala que la validez de
constructo interesa cuando queremos utilizar el
desempeo de los sujetos con el instrumento para
inferir la posesin de ciertos rasgos o cualidades
psicolgicas.
Por ejemplo, en lugar de hablar de los
puntajes que una persona obtuvo en
un instrumento determinado, podemos
hablar de:

(a) la actitud hacia la matemtica

(b) la satisfaccin o disfrute con el
aprendizaje de la matemtica

(c) la valoracin o significado de la
matemtica
Determina hasta dnde podemos anticipar el
desempeo futuro de una persona en una actividad
determinada, a partir de su ejecucin actual en
dicho instrumento.
por ejemplo, se podra estudiar, hasta dnde la Prueba de
Aptitud del Consejo Nacional de Universidades predice el xito
acadmico de los estudiantes en los primeros semestres
universitarios, o anticipar el desempeo futuro de un vendedor a
partir de su ejecucin en un test de inteligencia social.
FACTORES QUE
AFECTAN LA VALIDEZ
DE UNA PRUEBA
1. Construccin del
instrumento.
a) instrucciones imprecisas o vagas
b) estructura sintctica de la oracin demasiado
difcil
c) preguntas con niveles de dificultad inapropiados
d) preguntas que sugieren la respuesta
e) ambigedad en la formulacin de los reactivos,
lo cual lleva a diferentes interpretaciones de los
mismos
f) pruebas demasiado cortas
g) tems incongruentes con el dominio o universo
de contenido
h) ordenamiento inadecuado de los tems
i) patrn identificable de respuestas

2. Administracin y
calificacin de la prueba.
3. RESPUESTAS DE LOS SUJETOS.
4. NATURALEZA DEL GRUPO Y DEL
CRITERIO.
Anlisis estadstico



Flores, Gil(1996)
El Anlisis Estadstico de Datos se ha asociado de manera
general con la investigacin de corte experimental, o
podemos decir que es caracterstico de los enfoques
positivistas.
Este trmino se define de muchas maneras segn se conciba
desde una perspectiva ms amplia o ms restringida, y segn
se entienda tambin el proceso de investigacin.

El estudio de los fenmenos estadsticos
utilizando los mtodos matemticos y
proporciona conocimiento acerca de
las tcnicas que integran los mtodos
estadsticos.
Anlisis
Estadstico de
Datos
(propiamente
matemtico)
Este carcter aplicado ha estado
presente desde los inicios de esta
ciencia
Anlisis
Estadstico de
Datos
Aplicado
Caractersticas propias que
definen el concepto de
Anlisis Estadstico de Datos

Carcter terico y aplicado.
Estudio de conjunto de datos.
Trabajo con datos procedentes de
observaciones o mediciones.
Carcter cuantitativo de los datos.
Reduccin de la informacin.

CONFIABILIDAD.
DEFINICION SEGN DIVERSOS AUTORES.

Hernndez et al
(2003:243), indican que la
confiabilidad de un
instrumento de medicin
se refiere al grado en que
su aplicacin repetida al
mismo sujeto u objeto,
produce iguales
resultados.
Segn Hernndez, Fernndez y
Baptista (2006), la confiabilidad de un
instrumento de medicin se refiere al
grado en que su aplicacin repetida
al mismo sujeto u objeto produce
resultados iguales (consistentes y
coherentes)
Ander Egg (2002),
el trmino
confiabilidad se
refiere a "la
exactitud con que
un instrumento
mide lo que
pretende medir.
Definicin
La confiabilidad tambin se refiere a la consistencia de los
resultados.
En trminos de confiabilidad lo que preocupa es la
consistencia de los resultados. Se necesita la confiabilidad
para poder hablar de resultados vlidos, puesto que no es
posible evaluar algo que cambia continuamente.
El mejor estimado de confiabilidad de un cuestionario vendra
de tomar dos grupos de medidas en idnticas condiciones y
entonces comparar los resultados.
Mtodos que requieren una
sola administracin
Estos mtodos se utilizan
cuando el inters del
constructor del
cuestionario no se dirige
a determinar cunto
han cambiado los
sujetos en el tiempo.
Los procedimientos que
se utilizan para analizar
este tipo de
confiabilidad se llaman
mtodos de
consistencia interna.
Factores que afectan la consistencia interna.
los sujetos ejecutan consistentemente en todos los
tems de un cuestionario se dice que el cuestionario es
homogneo, Para que esto sea as es imprescindible
que todas las partes del cuestionario representen el
mismo dominio .
Si en el mismo cuestionario los tems se seleccionan de
diversas reas, la homogeneidad del cuestionario
disminuye y por lo tanto el coeficiente de consistencia
interna tambin lo hace.

El coeficiente alfa de Cronbach se basa en el clculo de la
confiabilidad de un compuesto.
La frmula para el coeficiente alfa es:

=

1
1

2


k = nmero de tems.
(

)
2
= varianza de cada tem.
(

)
2
= varianza de la cuestionario total.

Relacin del coeficiente alfa
y los mtodos de mitades
El coeficiente alfa se
puede utilizar como un
ndice de consistencia
interna. Pero no implica
nada sobre la
estabilidad en el tiempo
ni sobre la equivalencia
entre formas alternas del
instrumento.
El coeficiente alfa
se puede visualizar
como el promedio
de todos los
coeficientes de
confiabilidad que
se obtienen por los
mtodos de las dos
mitades.
El coeficiente alfa
no es un ndice de
unidimensionalidad
del instrumento.
Por lo tanto no se
puede utilizar
como mtodo
para validar la
unidimensionalidad
de un constructo.
Factores que afectan la
confiabilidad
Homogeneidad del grupo
La confiabilidad es una propiedad del cuestionario para un grupo particular
de sujetos. Por lo tanto el coeficiente de confiabilidad se afecta por la
variabilidad entre los sujetos.

mayor es la dispersin de las puntuaciones, mayor es la confiabilidad.
cuando se adquiere un instrumento construid para otra poblacin asegurarse
que el coeficiente de confiabilidad se obtuvo con una poblacin semejante a
la que va a utilizar el instrumento.
Tiempo
Si un cuestionario
tiene un tiempo lmite
para completarse
algunos sujetos van a
terminar a tiempo y
otros no.
Para evitar este tipo
de aumento artificial
de la confiabilidad
del instrumento, la
mejor estrategia es
dar suficiente tiempo
para que todos o casi
todos los sujetos
puedan contestar
todos los tems.
La confiabilidad de
los cuestionarios en
los que la rapidez
para contestar es una
variable importante,
debe ponerse en
duda.
Tamao del cuestionario
Mientras ms largo es el instrumento, mayor es la
confiabilidad. Esto ocurre por dos razones principales:
1. En un cuestionario ms largo la muestra de tems es
mayor y el universo del constructo est mejor
representado.
2. La varianza de un cuestionario aumenta cuando
aumenta el nmero de tems (Compuesto). Por lo
tanto mientras ms tems, ms varianza y por lo tanto
ms confiabilidad.

Objetividad del proceso de
asignar puntuaciones


Mientras ms objetivo es el proceso para determinar las
puntuaciones, mayor es la confiabilidad. Esto ocurre pues
se elimina la variable extraa de la subjetividad de los
jueces y con ello la dispersin de las puntuaciones
depende de una variable menos.

El grado de confiabilidad
esperado

El grado de confiabilidad que se espera de los
instrumentos de medicin depende de la decisin que
se vaya a tomar con los resultados del instrumento.
La confiabilidad puede ser baja si las decisiones no
tienen consecuencias importantes.
Sugerencias para obtener
un grado alto de
confiabilidad
Tener un mximo
de variabilidad en
la muestra de
encuestados o
examinados,
Asegurarse que las
dos parte son
paralelas
Llevar cabo un
anlisis de tems
para eliminar los
tems que no
correlacionan
Informes sobre los estudios de confiabilidad.

Diversos estimados de
confiabilidad obtenida por
diferentes mtodos.
El error estndar de
medicin y algunos
intervalos de confianza,
para facilitar la
interpretacin de las
puntuaciones.
Descripcin de los sujetos
utilizados en los estudios de
confiabilidad para poder
determinar semejanzas con
la poblacin a la que se va
a administrar el cuestionario.
El estimado de confiabilidad
y el error estndar de
medicin tanto del
cuestionario en su totalidad,
como de los diferentes
subcuestionarios que lo
componen.
Si el cuestionario se va a
administrar a un subgrupo
de la poblacin para la que
fue creada el cuestionario,
se debe incluir el estimado
de confiabilidad y el error de
medicin del subgrupo
Si se utiliza otra teora que no
sea la clsica para calcular
los estimados de
confiabilidad, se debe
indicar, pues sino, se
interpreta que esa es la que
se est utilizando.
Concepto
El anlisis estadstico es un apartado
dentro del protocolo cuya finalidad es
exponer la estrategia de anlisis a
seguir.
Plan de anlisis estadsticos
En el plan de anlisis se expone y
detalla a, de acuerdo a los objetivos
propuestos, las medidas de resumen de
las variables y cmo sern
presentadas, indicando los modelos y
tcnicas analticas que se utilizarn
para comprobar las hiptesis del
estudio.

Relacin entre la confiabilidad y
validez.
Un instrumento de medicin puede ser confiable,
pero no necesariamente vlido

la improvisacin
se utilizan instrumentos desarrollados en el
extranjero que no han sido validados en
nuestro contexto
el instrumento resulta inadecuado para
las personas a quienes se les aplica.
agrupa diversas cuestiones vinculadas con
los estilos personales de los participantes.
puede influir est constituido por las
condiciones en las que se aplica el
instrumento de medicin.
falta de estandarizacin.
Aspectos mecnicos.
Generalmente se tiene un grado de error. Desde luego, se
trata de que este error sea el mnimo posible, por la cual la
medicin de cualquier fenmeno se conceptualiza con la
siguiente frmula bsica.
X= t+ e
x representa los valores observados (resultados disponibles)
t, los valores verdaderos
y e, el grado de error en la medicin.
Si no hay un error de medicin (e es igual a cero), el valor
observado y el verdadero son equivalentes. Esto puede
verse claramente as.
X= t+ 0
X= t

Gracias