Anda di halaman 1dari 43

Mg.

IRMA LUZ YUPARI AZABACHE


Requisitos de
la Medición

Validez Confiabilidad

Validez de Validez de Validez de


Contenido Criterio Constructo

Factores Que Atentan Contra La Validez Y Confiabilidad


RELACIÓN ENTRE LA CONFIABILIDAD Y VALIDEZ
Un instrumento de medición puede ser confiable pero no
necesariamente válido (un aparato puede ser consistente en lo
resultados que produce pero puede no medir lo que pretende).

Tirador 1: Ni Tirador 2: Tirador 3:


confiabilida Confiabilidad, Confiabilidad y
d ni validez pero no validez validez
CONFIABILIDAD DEL INSTRUMENTO DE
RECOLECCIÓN DE DATOS:

 La confiabilidad responde a la pregunta ¿con cuánta


exactitud los ítems, reactivos o tareas representan al
universo de donde fueron seleccionados?.

 Un cuestionario, es confiable cuando su aplicación


repetida al mismo sujeto u objeto, produce los mismos
resultados y es operativo cuando su vocabulario es
entendido en un sentido unívoco, o sea exactamente con
el significado definido por el diseñador del instrumento.
Los procedimientos más utilizados son:
1. Test-retest( Medida de Estabilidad) Un mismo
instrumento es aplicado dos o más veces a un mismo
grupo de personas en condiciones similares. Si la
correlación entre los resultados de las diferentes
aplicaciones es altamente positiva, el instrumento se
considera confiable.

2. Medidas paralelas o formas equivalentes (Dos


versiones diferentes pero equivalentes, se administra a
un mismo grupo de personas ).

3. División por mitades o mitades partidas (Una prueba


fragmentada en dos partes equivalentes).

4. Alfa de Cronbach y Kuder Richarson


Número de
Número de veces versiones Número de Inquietud o
Estadístico a
Método que el instrumento diferentes participantes que pregunta que
usar
es administrado del proveen los datos contesta
instrumento
¿Responden Coeficiente
Estabilidad Dos veces en Una Cada los individuos de
(test-retest) tiempos versión participante de una manera Correlación
distintos responde al similar a un
instrumento dos instrumento si
veces se les
administra dos
veces?
Cuando dos Coeficiente
Formas Dos veces al Dos Cada versiones de de
alternas mismo tiempo o versiones participante un Correlación
con una diferentes responde a cada instrumentos
diferencia muy pero versión del son similares
corta equivalent instrumento ¿Hay
es convergencia o
divergencia en
las respuestas
a ambas
versiones?
Dos Cada Cuando dos Coeficiente
Formas Dos veces en versiones participante versiones de de
alternas y tiempos diferentes responde a cada un Correlación
prueba- distintos pero versión del instrumentos
posprueba equivalent instrumento son similares
es ¿Hay
convergencia o
divergencia en
las respuestas
a ambas
versiones?
Una Cada ¿Son las Coeficiente
Mitades Una vez fragmenta participante puntuaciones de
partidas da en dos responde a la de una mitad Correlación
partes única versión del
equivalent instrumento
es similares a las
obtenidas en la
otra mitad?
Cada ¿Las Coeficiente
Medidas de Una vez Una participante respuestas a de Alfa de
consistencia versión responde a la los ítems del Cronbach y
interna(alfa y única versión instrumento de KR
KR20 y21) son
coherentes?
En este caso, el análisis se realizo a través del Alpha de Cronbach (10% de
la población objeto de estudio ):
Para el puntaje de los ítems, se utilizó la escala de Likert, de la siguiente
forma:
Totalmente De Acuerdo: 5 puntos
De Acuerdo: 4 puntos
Neutral: 3 puntos
En Desacuerdo: 2 puntos
Totalmente en Desacuerdo: 1 punto
Tabla: Escala de Valoración del Alfa de Cronbach
Valor Alfa de Cronbach Apreciación

[0.95 a + > Muy elevada o Excelente


[0.90 - 0.95> Elevada
[0.85 - 0.90> Muy buena
[0.80 - 0.85> Buena
[0.75 - 0.80> Muy Respetable
[0.70 - 0.75> Respetable
[0.65 - 0.70> Mínimamente Aceptable
[0.40 - 0.65> Moderada
[0.00 - 0.40> Inaceptable
Fuente: De Vellis (1991)
RESULTADOS DEL PROCESAMIENTO DE LA
CONFIABILIDAD DEL INSTRUMENTO DE
RECOLECCIÓN DE DATOS:

Estadísticos total-elem ento


Estadísticos de fiabilidad
Media de la Varianza de Alfa de
Alf a de N de escala si se la escala si Correlación Cronbach si
Cronbach elementos elimina el se elimina el elemento-tot se eleimina
.790 10 elemento elemento al corregida el elemento
P1 35.3500 25.818 .637 .750
P2 35.0000 25.263 .756 .738
Se alcanzo un Nivel de P3 34.9500 23.945 .829 .724
P4 35.0000 25.263 .650 .747
Confiabilidad Muy
P5 35.0000 27.474 .595 .760
Respetable con un Alpha P6 34.5500 31.839 .063 .806
= 0.79, siendo este test P7 35.0500 26.155 .677 .748
consistente y adecuado P8 35.0500 24.787 .572 .756
para el estudio P9 34.9500 24.576 .623 .749
P10 35.6500 36.661 -.363 .879

Sin embargo se puede observar que si se elimina la pregunta 10, el


alfa de cronbach aumentaría pero por decisión del autor se decidió
conservar la pregunta dado que era importante para el test.
Al comprobar la fiabilidad para los elementos con todos los datos
se obtiene lo siguiente:
Estadísticos total-el emento

Media de la Varianza de Alf a de


es cala si s e la es c ala s i C orrelación C ronbach si
elim ina el s e elim ina el elemento-t otal s e eleimina
Estadísticos de fiabilidad elemento elemento c orregida el elem ent o
P1 31.6475 22.259 .549 .718

Alf a de P2 31.3597 23.348 .520 .725

Cronbach N de elem ent os P3 31.4604 23.424 .535 .724

.756 10 P4 31.7698 23.526 .513 .726

P5 31.5252 23.382 .439 .734

P6 31.5396 23.018 .464 .730

P7 31.7914 22.514 .544 .719

P8 31.8561 22.588 .423 .736

P9 31.8417 22.337 .490 .726

P10 32.4748 27.396 -. 055 .813

Para la motivación intrínseca:


Estadísticos total-el emento

Medi a de la Var ianza de Alfa de


escal a si se la escala si Correlación Cronbach si
Estadísticos de fiabi li dad
elimina el se eli mina el elemento-total se eleimi na
elemento elemento cor regida el elemento

Alf a de P1 14.8921 7.256 .500 .829

Cronbac h N de element os P2 14.6043 7.009 .710 .765

P3 14.7050 7.267 .673 .776


.825 5
P4 15.0144 7.377 .633 .787

P5 14.7698 6.932 .614 .792


Para la motivación extrínseca :

Estadísticos total-elemento
Estadísticos de fiabilidad
Media de la Varianza de Alf a de
escala si se la escala si Correlación Cronbach si
Alf a de elim ina el se elim ina el elemento-t otal se eleimina
elemento elemento corregida el elem ent o
Cronbach N de element os
P6 13.0432 7.926 .338 .588
.623 5 P7 13.2950 7.470 .456 .535

P8 13.3597 6.435 .548 .473

P9 13.3453 6.894 .499 .506

P10 13.9784 8.413 .120 .709

Estadísticos de la escala

Media Varianza Desviación típica N de elem entos


16.7554 10.606 3.25675 5
En el caso de instrumentos con coeficientes de confiabilidad
moderados como en este caso (0.623), una manera de saber hasta
dónde los mismos pueden ser aceptables, consiste en comparar
la desviación estándar de la distribución de puntajes (Sy) con el
error estándar de medición (EEM) (Carlos Ruiz Bolívar,), cuya
fórmula es:

EEM = error estándar de medición.


Sy = Desviación estándar de la distribución de puntajes totales.
rtt = Coeficiente de confiabilidad.
En estos casos se recurre al criterio del error estándar de
medición para decidir sobre la aceptabilidad de un coeficiente de
confiabilidad moderado, se requiere que se cumpla la condición
de que Sy > EEM.
EEM: 3.26*

EEM: 2.001

 Como se puede observar, en el caso el EEM


(2.001) no excede el valor de la Sy(3.257); es
decir, que se cumple la condición de
aceptabilidad señalada anteriormente. (Sy >
EEM). En consecuencia, el instrumento puede
ser utilizado
VALIDEZ DEL INSTRUMENTO DE RECOLECCIÓN DE
DATOS:
- Según Hernández, la validez se refiere, al grado en que un
instrumento (cuestionario) realmente mide las variables que pretende
medir.
-Una pregunta es válida si estimula información exacta y relevante.
-La selección y la redacción influyen en la validez de la pregunta.
- Algunas preguntas que son válidas para un grupo de personas,
pueden no serlo para otro grupo.
- Entre menos tenga que reflexionar el sujeto, más válida será la
respuesta. La validez implica congruencia en la manera de plantear
las preguntas.
La validez puede ser :
• De contenido
• De criterio
• De constructo
VALIDEZ DE CONTENIDO
Se refiere al grado en que el test presenta una muestra
adecuada de los contenidos a los que se refiere, sin
omisiones y sin desequilibrios de contenido.
La validez de contenido se utiliza principalmente con tests
de rendimiento, y especialmente con los tests educativos y
tests referidos al criterio. En este tipo de tests se trata de
comprobar los conocimientos respecto a una materia o un
curso.
La validez de contenido descansa generalmente en el
juicio de expertos (métodos de juicio). Se define como el
grado en que los ítems que componen el test representan
el contenido que el test trata de evaluar.
Para este análisis se ha utilizado el programa Excel
Versión 2007,y se aplicó la técnica estadística
denominada Coeficiente de Proporción de Rangos (CPR)
basado en el método a juicio de expertos, que consiste
en un examen sistemático de cada de uno de los ítems -
preguntas del mismo, para determinar si miden las
variables que se espera medir, la pertinencia del
contenido, la claridad de los enunciados de cada uno de
ellos, y el nivel de concordancia entre los evaluadores.
Se siguió el siguiente procedimiento:
Se solicitó la colaboración de tres expertos de la carrera
de psicología, con el objeto de determinar la pertinencia
de contenido de los ítems del instrumento. Se les entregó
el cuestionario y la información necesaria y se obtuvo la
evaluación del cuestionario de cada uno de los expertos.
TESIS: RELACIÓN ENTRE LA MOTIVACIÓN Y EL RENDIMIENTO
ACADÉMICO DEL CURSO DE ESTADÍSTICA EN ESTUDIANTES
DEL CUARTO CICLO DE LA FACULTAD DE DERECHO DE LA
UNIVERSIDAD “CÉSAR VALLEJO” EN EL SEMESTRE 2008-II

OBJETIVOS DE LA INVESTIGACION:

Objetivo General:
Determinar el nivel de relación existente entre la motivación de
los estudiantes de la facultad de derecho de la UCV y el
rendimiento académico del curso de estadística.

Objetivos específicos:
Determinar el nivel de relación existente entre la motivación
intrínseca del alumno y el rendimiento académico en estadística.
Determinar el nivel de relación existente entre la motivación
extrínseca del alumno y el rendimiento académico en
estadística.
ANEXO B: VALIDACION DEL CUESTIONARIO

FORMATO PARA EVALUACIÓN DEL CUESTIONARIO

Datos del Evaluador:………………………………………………………………

Apellidos y Nombres: …………………………………………………………….

Número de Colegiatura:…………………………………………………………..

Profesión:………………………………………………………………………….

Lugar de Trabajo:……………………………………………………………….…

Cargo que desempeña:……………………………………………………………

Área:………………………………………………………………………………

Ítems- Objetivos Escala Evaluativa Observaciones


Preguntas Específicos A B C
1,2,3,4 y 5 1
6,7,8,9 y 10 2

ESCALA EVALUATIVA DE CORRESPONDENCIA ITEMS- OBJETIVOS:

A: TOTALMENTE DE ACUERDO

B: DE ACUERDO

C: DESACUERDO
La información proporcionada por cada uno de los expertos se
procesó y analizó calculando el coeficiente de proporción de
rango corregido.

TABLA B1: TABULACIÓN DE LOS DATOS RESPECTO A LA EVALUACIÓN


DEL INSTRUMENTO

EVALUADORES
ITEM PREGUNTAS
1 2 3

I 1, 2, 3, 4, 5 A A A

II 6, 7, 8, 9, 10 A B A

Fuente: Cálculos Propios


Puntaje escala Evaluativo de los Ítems:
A: Totalmente De Acuerdo : 3 puntos
B: De Acuerdo : 2 puntos
C: Desacuerdo: 1 punto
TABLA B2:
TABULACION SEGÚN ESCALA EVALUATIVA DE LOS ITEMS
EVALUADORES
ITEM PREGUNTAS
1 2 3

I 1, 2, 3, 4, 5 3 3 3

II 6, 7, 8, 9, 10 3 2 3
Fuente: Cálculos Propios

Según los especialistas, existe una muy alta validez y


concordancia de los mismos, esto se evidencia al calcular el
Coeficiente de Proporción de Rango que alcanzó un 87 %.
Proporcion
EVALUADORES Promedio
S ri de Rangos Pe
ITEM PREGUNTAS 1 2 3 ri de cada item
I 1, 2, 3, 4, 5 3 3 3 9 3 1.00 0.037
II 6, 7, 8, 9, 10 3 2 3 8 2.667 0.89 0.037
TOTALES 6 5 6 0 17 5.667 1.89 0.074
Promedio de Rangos
para cada ítem Pr i 
 ri
j
Proporción de Rangos para cada ítem i: Es el K= Numero
Pr i
promedio de rangos de cada ítems individuo
dividido entre el puntaje máximo de la escala
P Pr i  ( k ) de rangos
de la escala
evaluativa
evaluativo de los ítems (coeficiente de validez de
cada ítem) j
1
Corrección:
J: Número de jueces : 3
Pe   
 j
Coeficiente de Proporción de Rangos:

P Pr i 1.89
CPR  CPR  CPR : 0.944
N 2
N= Número de dimensiones

Coeficiente de Proporción de Rangos


Corregido :
INTERPRETACION
CPRc: CPR - Pe
Mayor que Menor igual que Validez y concordancia
CPRc: 0.944-0.074
0 0.4 Baja
CPRc: 0.870 Muy Alta
0.4 0.6 Moderada
0.6 0.8 Alta
0.8 1 Muy Alta
VALIDEZ DE CONSTRUCTO

Se refiere al grado en que el instrumento de medida cumple


con las hipótesis que cabría esperar para un instrumento de
medida diseñado para medir precisamente aquello que
deseaba medir. Se puede considerar un concepto general
que abarcaría los otros tipos de validez.
El término constructo hace referencia a un concepto
teórico psicológico inobservable (ej. la inteligencia, cada
factor de personalidad, las aptitudes, las actitudes, etc.)
La definición operativa de estos constructos presenta
considerables dificultades en la práctica, ya que no son
directamente observables. Debido a esto, la validación de
un constructo es un proceso laborioso y difícil.
TECNICAS CORRELACIONALES
En resumen, las técnicas correlacionales o de la o
consistencia interna relativa empleados en la validez
de constructo son procedimientos de correlación
entre:
Item – Test
Item – Escala (Subtests)
Escala – Test o Test – Subtests
ESCALA DE VALORACIÓN PARA INTERPRETAR LA CORRELACIÓN EN LA VALIDACIÓN

ri.t Nivel de discriminación


0.40 a más Muy bueno
0.30 – 0.39 Bueno
0.20 – 0.29 Deficiente
0 – 0.19 Insuficiente
Fuente: Elosua Oliden y Bully Garay ( 2012), Pág. 58.
ANÁLISIS FACTORIAL

El análisis factorial nos indica cómo tienden a


agruparse los ítems o variables. Examinando el
contenido conceptual de los ítems que pertenecen al
mismo factor podemos comprender qué factores [o
constructos] subyacentes explican las correlaciones
entre los ítems. El análisis factorial de un
instrumento de medición ayuda a establecer la
validez de constructo de lo que estamos midiendo,
en el sentido de que nos analiza la estructura del
constructo que estamos pretendiendo medir.
EL ANÁLISIS DE COMPONENTES PRINCIPALES

Según Johnson(2000), el ACP comprende un


procedimiento matemático que transforma un conjunto de
variables correlacionadas de respuesta en un conjunto
menor de variables no correlacionadas llamadas
componentes principales . También menciona que la
mayoría de libros sobre Métodos Multivariados sugieren
que los objetivos principales de un ACP son :
1) Reducir la dimensionalidad de un conjunto de datos,
2) Identificar nuevas variables significativas subyacentes

Uriel, E. y Aldas (2005) plantean que el método de


Componentes Principales tiene por objeto transformar
un conjunto de variables , a las que denominan
variables originales , en un nuevo conjunto de variables
denominadas componentes principales. Estas últimas
se caracterizan por estar intercorrelacionadas entre sí.
Agregan que como medida de la cantidad de
información incorporada en una componente se utiliza
su varianza.
PROCEDIMIENTO PARA HALLAR LOS
COMPONENTES PRINCIPALES

1.- Analizar si los datos cumplen con las condiciones


mínimas para la aplicación de la prueba (Prueba KMO y
de Esfericidad de Bartlett)
2.- Hallar comunalidades, es decir , la proporción de la
varianza del indicador que es explicada por los
componentes o factores comunes.
3.- Obtención de los componentes principales.
4. Selección del Número de Componentes
5. Interpretación de los Componentes
6.Aplicación de los resultados al análisis
Para realizar esta prueba es necesario analizar si los datos
cumplen las condiciones mínimas para la aplicación de la
técnica:
Podemos comprobar que se presenta una buena adecuación
muestral a los datos, ya que el estadístico de Keiser-Meyer-Olkin
(KMO), que nos indica la proporción de la varianza que tienen en
común las variables analizadas, presenta un valor de 0,802,
coeficiente cercano a la unidad que es lo más aconsejado para
este tipo de análisis, y la prueba de esfericidad de Bartlett que
comprueba las variables están correlacionadas. Esto nos indicaría
una buena adecuación de los datos a un modelo de análisis
factorial.
KMO y prueba de Bartlett
Medida de adecuación muestral de
Kaiser-Meyer-Olkin. .802

Prueba de esfericidad Chi-cuadrado


438.374
de Bartlett aproximado
gl 45
Sig. .000
TABLA :VARIANZA TOTAL EXPLICADA

Fuente: Cálculos Propios


EN EL GRÀFICO SE
PUEDE OBSERVAR
QUE EXISTEN 2
COMPONENTES CON
AUTOVALORES
SUPERIORES A 1
. Al llevar a cabo la rotación de factores, encontramos que
los dos componentes con autovalores mayores a uno
explicaron el 55.01 % de la varianza total

TABLA MATRIZ DE COMPONENTES ROTADOS

Componente
PREGUNTAS DIMENSIÒN 1 2
P1 1 0.52 0.47
P2 1 0.80 0.13
P3 1 0.78 0.19
P4 1 0.76 0.16
P5 1 0.79 0.07
P6 2 0.39 0.47
P7 2 0.28 0.69
P8 2 0.02 0.81
P9 2 0.13 0.72
P10 2 0.44 0.42
Fuente: Cálculos Propios
Las rotaciones son transformaciones lineales que facilitan la interpretación sin alterar
la proporción de varianza explicada por los factores
VALIDEZ DE CRITERIO

 Se establece al validar un instrumento de medición al


compararlo con algún criterio externo que pretende medir
lo mismo.
 Si el criterio se fija en el presente de manera paralela se
habla de validez concurrente (los resultados se
correlacionan con el criterio en el mismo momento o punto
de tiempo).
 Si el criterio se fija en el futuro se habla de validez
predictiva( ejem: una prueba para determinar la capacidad
gerencial de candidatos a ocupar puestos ejecutivos se
validaría comparando los resultados con el desempeño
posterior de los ejecutivos)
Escala de valoración del coeficiente de correlación de Pearson
Valor de r Grado de correlación
-1.00 Correlación negativa Perfecta
-0.90 Correlación negativa Muy fuerte
-0.75 Correlación Negativa Considerable
-0.50 Correlación Negativa Media
-0.25 Correlación Negativa débil
0.00 No existe correlación alguna entre las variables
+0.10 Correlación Positiva Muy Débil
+0.25 Correlación Positiva Débil
+0.5 Correlación Positiva Media
+0.75 Correlación Positiva Considerable
+0.90 Correlación positiva Muy fuerte
+1.00 Correlación positiva Perfecta
Hernández, Fernández y Baptista ( 2010)
Factores que pueden afectar la confiabilidad y la
Validez
La improvisación. Algunas personas creen que elegir un
instrumento de medición o desarrollar uno es algo fácil y que no
requiere de supervisión alguna.

La traducción, aún cuando adaptemos los términos a nuestro


lenguaje no es ni remotamente validarlo.

La inadecuación o falta de empatía. Hay instrumentos que tienen


un lenguaje muy elevado para el entrevistado o no toma en cuenta
diferencias de sexo, edad, nivel ocupacional y educativo.

Las condiciones de aplicación. El ruido, presionar para que una


persona conteste un instrumento largo en un período de tiempo
corto, el hambre o falta de motivación para responder influirá
negativamente en la validez y confiabilidad de la medida.

Los aspectos mecánicos. Que el instrumento tenga instrucciones


precisas, que se lea bien (si se trata de un cuestionario escrito), que
no le falten páginas, que haya un espacio adecuado para contestar.

Anda mungkin juga menyukai