Anda di halaman 1dari 30

UNIVERSIDAD NACIONAL DEL SANTA

FACULTAD DE INGENIERA
ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

VALIDACIN DE LOS INSTRUMENTOS DE


INVESTIGACIN

Monografa para aprobar el curso de


Tcnicas de Estudios dictado por el
docente Jos Cerna Montoya
AUTOR:
CRUZ SILVA TANIA MAKELY
ASESOR:
CERNA MONTOYA JOS

Octubre de 2015
Nuevo Chimbote - Per

VALIDACIN DE LOS INSTRUMENTOS DE


INVESTIGACIN

DIOS

TODOPODEROSO,

quien gracias a su bondad y


misericordia, me permite seguir
viva, cuidando a mi familia y a m.

A m amada madre: MARINA,


por

sus

consejos,

su

apoyo

incondicional y su cario; a quien


le debo todo lo que he logrado, ya
que ha hecho de mi mejor
persona.

mis

abuelos

FRANCISCO,

JOSEFA

quienes

constituyen mi mayor inspiracin


y son la razn de cada da
esforzarme ms y ser mejor
estudiante.

AGRADECIMIENTO

Al Dios Todopoderoso, quien me ayuda y me da fuerzas para cada da seguir


adelante, por su amor y misericordia.
A mis familiares, por siempre preocuparse por m, por siempre estar a mi lado
cuando ms los necesito, y por ser la fuente de inspiracin para cada da mejorar en
todo aspecto.
A mi estimado asesor Jos Cerna Montoya, por sus conocimientos impartidos en
momentos de clase, y por su orientacin y ayuda.
A mis compaeros, por su apoyo y colaboracin durante el desarrollo del informe.

Atentamente,
Makely

PRESENTACIN
Seor profesor Jos Cerna Montoya:

El presente trabajo monogrfico constituye uno de los elementos fundamentales para


la obtencin de una nota aprobatoria en el curso de Tcnicas de Estudio, en tanto, la
autora lo ha estructurado en el marco de la formalidad y segn los criterios terico
cientfico que en la actualidad se puede encontrar en el mbito de nuestra realidad.
La investigacin, por su propia naturaleza de investigacin bibliogrfica ha
condicionado nuestro accionar no slo el revisar libros, sino a navegar en internet y
encontrarnos con algunas particularidades que sin duda muestran esta monografa.

Atentamente,
Makely

INDICE
DEDICATORIA
AGRADECIMIENTO
PRESENTACIN
INDICE
INTRODUCCIN
I.

CONFIABILIDAD
Teora clsica de la confiabilidad
Coeficiente test-retest
Coeficiente de formas paralelas
Coeficientes de consistencia interna
Mtodo de divisin por mitades.
Mtodo de Kuder-Richardson.
Confiabilidad entre calificadores

II.

VALIDEZ
Validez de contenido
Validez con relacin a criterio
Validez concurrente.
Validez predictiva.
Error estndar de estimacin.
Factores que afectan la validez con relacin a criterios
Validacin convergente y discriminante.

III.

METODOLOGIA
Tipo de investigacin
Identificacin de variables
Operalizacin de las variables

IV.

SIGNIFICADO DE CIERTAS PALABRAS

CONCLUSIN
REFERENCIAS BIBLIOGRFICAS

INTRODUCCIN
Todo instrumento de recoleccin de datos debe resumir dos requisitos esenciales:
validez y confiabilidad. Con la validez se determina la revisin de la presentacin del
contenido, el contraste de los indicadores con los tems (preguntas) que miden las
variables correspondientes. Se estima la validez como el hecho de que una prueba sea
de tal manera concebida, elaborada y aplicada y que mida lo que se propone medir.
Algunos autores como Black y Champion (1976), Johnston y Pennypacker
(1980:190-191), Kerlinger (1980:190-191), citados por Barba y Sols (1997:232-234),
sealan que la validez es un sinnimo de confiabilidad. El primero, se refiere al
significado de la medida como cierta y precisa. El segundo, se refiere al hecho de lo que
se mide actualmente es lo que se quiere medir. Se estima la confiabilidad de un
instrumento de medicin cuando permite determinar que el mismo, mide lo que se
quiere medir, y aplicado varias veces, indique el mismo resultado.
Hernndez et al (2003:243), indican que la confiabilidad de un instrumento de
medicin se refiere al grado en que su aplicacin repetida al mismo sujeto u objeto,
produce iguales resultados.
Para Baechle y Earle (2007:277-278) la validez es el grado en que una prueba o tem
de la prueba mide lo que pretende medir; es la caracterstica ms importante de una
prueba. Al referirse a la validez relativa a un criterio definen a ste como la medida en
que los resultados de la prueba se asocian con alguna otra medida de la misma aptitud;
Consideran los autores que en muchas ocasiones la validez relativa a un criterio se
estima en forma estadstica utilizando el coeficiente de correlacin de Pearson (tambin
denominado tabulacin cruzada, a este tipo de validez se le denomina validez
concurrente. Al definir el trmino fiabilidad, los autores argumentan que es la medida
del grado de consistencia o repetibilidad de una prueba. Una prueba tiene que ser fiable
para ser vlida, porque los resultados muy variables tienen muy poco significado.

Seisdedos (2004:19) opina que el grado en que la prueba mide una variable o
conjunto de conductas definidas por el investigador se le denomina validez de
constructo y al grado de concomitancia (correlacin) entre pruebas que apuntan a
variables o constructos similares los denomina validez concurrente o validez criterial.
Para acercarnos a la validacin de este trabajo adoptamos la tipologa propuesta por
Maxwell y Stake (2006:109), que plantea cinco tipos de validez que se pueden
relacionar con algunas etapas de nuestra investigacin:
1. Validez descriptiva. Se refiere a la que est relacionada con la etapa inicial de la
investigacin. Usualmente involucra la recopilacin de datos. El resultado principal es
la informacin que describe lo que fue observado y experimentado. Para ello es muy
importante tanto la seleccin del lenguaje como de los datos relevantes.
2. Validez interpretativa. La certeza en la interpretacin es vlida si los actores
pueden confirmar o reconocer los descubrimientos de la investigacin en particular.
3. Validez terica. La validez terica es un anlisis ms abstracto que la validez
descriptiva e interpretativa, relacionada con la inmediatez fsica y mental del fenmeno
estudiado. Las construcciones y marcos tericos de los investigadores, sean teoras o
metateoras conocidas, definen intrnsecamente la recopilacin y la interpretacin de los
datos en la etapa inicial de la investigacin.
4. Generalidad. Este tipo de validez se refiere al grado en que la explicacin es
aceptada para ser generalizable. Sin embargo es pertinente aclarar que para algunos
investigadores cualitativos, el generalizar descubrimientos, es considerado de poca
importancia.
5. Validez evaluativa. Se refiere a la aplicacin de un marco evaluativo, que es
similar en la investigacin cualitativa y cuantitativa. Es pertinente aclarar que la
evaluacin no puede ser considerada como un comunicado conclusivo.
Llama la atencin lo expresado por Smaling (s.f.:1), cuando relata que el carcter
cientfico de una investigacin incluida la cualitativa, lleva implcito la persuasin
argumentativa. Despus de todo, una investigacin que reclama su cientificidad debe
tener defensibilidad, para lo que se requiere calidad en la argumentacin para el pblico
lector.

Debe admitirse que los otros aspectos de la persuasin deben permanecer en un


segundo plano, tales como: la persuasin del ethos (que se acenta por la excelencia o
autoridad del investigador), y la persuasin del pathos (que apela a los sentimientos
estticos). Actualmente, el carcter retrico de la ciencia ha sido ampliamente aclamado.
Sin embargo, un texto que reclama su carcter cientfico, debe, finalmente, persuadir
por el logos (por la razn o la argumentacin). En la retrica de la ciencia, la persuasin
por el logos puede no ser suficiente, pero siempre ser necesaria. Como cientfico, el
escritor de una investigacin dice algo que supone est sustentado por argumentos tales
como las observaciones, asunciones aceptables intersubjetivamente, interpretaciones,
principios, reglas, regulaciones y teoras. En otras palabras, el reclamo del cientfico de
basarse en una argumentacin aceptable y plausible.
Yin (2009:40-45), asegura en relacin a la validez, que un diseo de investigacin
supone que representa un conjunto de estados lgicos donde se puede juzgar la calidad
de un diseo dado, de acuerdo a ciertas pruebas lgicas.
En la presente investigacin se utiliza un texto cientfico con el fin de armar una
estructura argumentativa de los textos en forma explcita y clara, adecuada y fructfera.
Los textos incluyen, o al menos sealan una clara indicacin de los puntos a tratar, por
lo que se toma la responsabilidad de enunciar la sustentacin argumentativa del punto
que reclama. Adems permite realizar una propuesta que se sustente en un plan de
accin factible y orientada a resolver un problema.
En sntesis, la propuesta debe tener apoyo, bien sea en una investigacin de campo,
o en una investigacin de tipo documental; y puede referirse a la formacin de polticas,
programas, tecnologas, mtodos o procesos. En la elaboracin del diseo de
investigacin, uno de los aspectos que debe cuidarse es el concerniente con la validez,
buscando con ese precepto que el proyecto tenga la calidad ineludible. Sin embargo, el
concepto de validez puede ser entendido de mltiples formas, por ello se presentaron
algunas de las definiciones de diversos autores que nos dan una idea de lo amplio de
este concepto.
Para tal efecto, en la ejecucin del procedimiento metodolgico cuantitativo se
aplic la prueba piloto cuestionario de satisfaccin del servicio ya validada, a usuarios
que no formaban parte de la muestra, pero que presentaban las mismas caractersticas de

los sujetos de la muestra. Para hallar el coeficiente de confiabilidad se procedi de la


siguiente manera:
* Aplicacin de la prueba piloto a un grupo de 15 sujetos pertenecientes a la muestra
de estudio, con caractersticas equivalentes a la misma.
* Codificacin de las respuestas; trascripcin de las respuestas en una matriz de
tabulacin de doble entrada con el apoyo del programa estadstico Dyane versin 4.
* Interpretacin de los valores tomando en cuenta la escala de Likertt.
* Determinacin de resultados con tabulacin simple y de tabulacin cruzada.
I.

CONFIABILIDAD
Ningn instrumento psicomtrico puede considerarse de valor a menos que sea una
medida consistente, o confiable. En consecuencia, una de las primeras cosas que ser
necesario determinar acerca de una prueba de elaboracin reciente es si resulta lo
suficientemente confiable como para medir lo que fue diseada para medir. Si, en
ausencia de cualquier cambio permanente en una persona debido al crecimiento, al
aprendizaje, a alguna enfermedad o lesin, las puntuaciones en una prueba varan con la
ocasin o la situacin, es probable que la prueba no sea lo suficientemente confiable
como para ser usada en describir y evaluar a la gente y hacer predicciones sobre su
conducta. Hablando en trminos estrictos, ms que ser una caracterstica de una prueba,
la confiabilidad es una propiedad de las puntuaciones obtenidas cuando se administra la
prueba a un grupo particular de personas en una ocasin particular y bajo condiciones
especficas (Thompson, 1994).
Note que confiabilidad no es lo mismo que estabilidad: al determinar la confiabilidad
se asume que la prueba mide una caracterstica relativamente estable. A diferencia de la
inestabilidad, la falta de confiabilidad es resultado de errores de medicin producidos
por estados internos temporales, como la baja motivacin o la falta de disposicin, o de
condiciones externas como un ambiente de prueba incmodo o con distracciones.
Teora clsica de la confiabilidad
En la teora clsica de los retest se supone que la calificacin observada de una
persona en una prueba est compuesta por una puntuacin "real" ms algn error no
sistemtico de medicin. La puntuacin real de una persona en una prueba particular se

define como el promedio de las puntuaciones que obtendra si presentara la prueba un


nmero infinito de veces. Es obvio que la puntuacin real de una persona nunca puede
medirse de manera exacta; tiene que ser estimada a partir de su puntuacin observada en
la prueba. Tambin se asume en la teora clsica de los tests que la varianza de las
puntuaciones observadas (s2 obs) de un grupo de personas es igual a la varianza de sus
puntuaciones reales (s2 rea) ms la varianza debida a los errores no sistemticos de
medicin (s2 err):

Entonces la confiabilidad (r11) de las calificaciones se define como la razn de la


varianza de la calificacin real con la varianza de la calificacin observada, o la
proporcin de la varianza observada que es explicada por la varianza real:

La proporcin de la varianza observada explicada por la varianza de error o que no se


explica por la varianza real puede determinarse a partir de las frmulas 5.1 y 5.2 como:

La confiabilidad de un conjunto de calificaciones en una prueba se expresa como un


nmero decimal positivo que flucta entre .00 y 1.00. Una ru de 1.00 indica una
confiabilidad perfecta, y una r,, de .00 indica una falta absoluta de confiabilidad de la
medicin. Como la varianza de las calificaciones reales no puede calcularse de manera
directa, la confiabilidad se estima analizando los efectos de variaciones en las
condiciones de la administracin y el contenido de la prueba en las calificaciones
observadas. Como advertimos antes, la confiabilidad no es influida por cambios
sistemticos en las calificaciones que tienen un efecto similar en todos los examinados,
sino slo por cambios no sistemticos que tienen efectos diferentes en personas
distintas. Dichos factores no sistemticos influyen en la varianza de error y, por lo tanto,
en la confiabilidad de las calificaciones en la prueba. Cada uno de los diversos mtodos
para estimar la confiabilidad (test-retest, formas paralelas, consistencia interna) toma en
consideracin los efectos de circunstancias algo diferentes que pueden producir cambios

no sistemticos en las puntuaciones y, por ende, afectan la varianza de error y el


coeficiente de confiabilidad.
Coeficiente test-retest
Se calcula un coeficiente test-retest para determinar si un instrumento mide de
manera consistente de una ocasin a otra. Este coeficiente, conocido tambin como
coeficiente de estabilidad, se encuentra correlacionando las calificaciones obtenidas por
un grupo de personas en una aplicacin con sus puntuaciones en la segunda aplicacin
de la prueba. El procedimiento tcst-retcst toma en consideracin los errores de medicin
que resultan de diferencias en las condiciones (ambientales, personales) asociadas con
las dos ocasiones en que se administr la prueba. Dado que en ambas ocasiones se
aplic la misma prueba, los errores debidos a diferentes muestras de los reactivos de la
prueba no se reflejan en un coeficiente test-retest. Adems, es probable que las
diferencias entre las condiciones de la aplicacin sean mayores luego de un intervalo
largo que de uno corto. Como resultado, la magnitud de un coeficiente de confiabilidad
test-retest tiende a ser mayor cuando el intervalo entre la prueba inicial y el retest es
corto (unos cuantos das o semanas) que cuando es largo (meses o aos).
Coeficiente de formas paralelas
Cuando el intervalo entre la prueba inicial y el retest es corto, los examinados
recuerdan, por lo general, muchas de las preguntas y respuestas de la prueba inicial.
Como es obvio, esto afecta sus respuestas en la segunda aplicacin, un hecho que por s
mismo no cambia el coeficiente de confiabilidad si todos recuerdan igual cantidad. Sin
embargo, por lo regular algunas personas recuerdan ms del material de la prueba que
otras, ocasionando que la correlacin entre el test y el retest sea menos que perfecta. Lo
que parece necesitarse para superar esta fuente de error es una forma paralela del
instrumento, esto es, una que conste de reactivos similares pero no de los mismos
reactivos. Entonces puede calcularse como ndice de confiabilidad un coeficiente de
formas paralelas, tambin conocido como coeficiente de equivalencia.
En principio, la idea de formas paralelas es razonable: al aplicar una forma paralela
luego de un intervalo apropiado que sigue a la aplicacin de la primera forma puede
determinarse un coeficiente de confiabilidad que refleje los errores de medicin debidos
a los diferentes reactivos y los distintos momentos de aplicacin. Para controlar los
efectos de confusin de la forma de la prueba con el momento de la aplicacin, la forma

A debe administrarse primero a la mitad del grupo y la forma B a la otra mitad; luego,
en la segunda aplicacin, el primer grupo presenta la forma B y el segundo la forma A.
La correlacin resultante entre las calificaciones de las dos formas, conocida como
coeficiente de estabilidad y equivalencia, toma en cuenta errores debidos a los
diferentes momentos de aplicacin o a los distintos reactivos.
Coeficientes de consistencia interna
Se dispone de formas paralelas para una serie de pruebas, en particular para pruebas
de habilidad (aprovechamiento, inteligencia, aptitudes especiales). Sin embargo, una
forma paralela de una prueba a menudo es costosa y difcil de elaborar. Por esta razn se
elabor un mtodo menos directo de tomar en cuenta los efectos de diferentes muestras
de los reactivos de una prueba sobre la confiabilidad. Este es el mtodo de consistencia
interna, que incluye el mtodo de divisin por mitades de Spearman, las frmulas de
Kudcr-Richardson y el coeficiente alfa de Cronbach. Sin embargo, los errores de
medicin causados por diferentes condiciones o momentos de aplicacin no se reflejan
en un coeficiente de consistencia interna. En consecuencia, este tipo de coeficientes no
pueden verse como verdaderos equivalentes de los coeficientes test-retest o de formas
paralelas.
Mtodo de divisin por mitades.
En este enfoque simplificado de la consistencia interna una sola prueba se considera
compuesta por dos partes (formas paralelas) que miden la misma cosa. De este modo,
puede aplicarse una prueba y asignar calificaciones separadas a sus dos mitades
seleccionadas de manera arbitraria. Por ejemplo, los reactivos con nmeros nones
pueden calificarse por separado de los que tienen nmeros pares. Entonces la
correlacin (roc) entre los dos conjuntos de calificaciones obtenidas por un grupo de
personas es un coeficiente de confiabilidad de formas paralelas para una mitad de la
prueba tan larga como la prueba original. Suponiendo que las dos mitades equivalentes
tienen medias y varianzas iguales, la confiabilidad de la prueba como un todo puede
estimarse mediante la frmula Spearman-Brown:

Para demostrar el uso de la frmula 5.4, suponga que la correlacin entre las
calificaciones totales obtenidas en los reactivos con nmeros nones y en los reactivos
con nmeros pares de una prueba es .80. Entonces la confiabilidad estimada de toda la
prueba es r11 = 2(.80)/(l +.80) = .89.
Mtodo de Kuder-Richardson.
Una prueba puede dividirse de muchas formas diferentes en dos mitades que
contengan igual nmero de reactivos. Como cada forma puede dar por resultado un
valor algo diferente de rM, no queda claro qu estrategia de divisin producir el mejor
estimado de confiabilidad. Una solucin al problema es calcular el promedio de los
coeficientes de confiabilidad obtenidos de todas las divisiones por mitades corno el
estimado global de confiabilidad. Esto puede hacerse, pero el siguiente procedimiento
abreviado fue elaborado por Kuder y Richardson (1937).
Bajo ciertas condiciones, la media de todos los coeficientes de divisin por mitades
puede estimarse mediante una de las siguientes frmulas:

En estas frmulas, k es el nmero de reactivos en la prueba,

es la media de las

calificaciones totales de la prueba, s2 es la varianza de las calificaciones totales de la


prueba (calculadas con n en lugar de n - 1 en el denominador), y p i es la proporcin de
examinados que dan la respuesta de la clave al reactivo i. Las pi se suman a lo largo de
todos los reactivos k. Las frmulas 5.5 y 5.6 se conocen como frmulas KuderRichardson (K-R) 20 y 21, respectivamente. A diferencia de la frmula 5.5, la 5.6 se
basa en la suposicin de que todos los reactivos son de igual dificultad; esto tambin
conduce a una estimacin ms conservadora de la confiabilidad y es ms fcil de
calcular que la frmula 5.5.

Para demostrar la aplicacin de la frmula 5.6, suponga que una prueba que contiene
75 reactivos tiene una media de 50 y una varianza de 100. Entonces r,, = [75 - 50(75 50)/100]/74 = .84.
Coeficiente alfa. Las frmulas 5.5 y 5.6 son casos especiales del coeficiente alfa ms
general (Cronbach, 1951). El coeficiente alfa se define como:

Donde k es el nmero de reactivos, .s 2i la varianza de las calificaciones en el reactivo


i, y s2t la varianza de las calificaciones totales de la prueba. Las frmulas de KuderRichardson slo son aplicables cuando los reactivos de la prueba se califican con 0 o 1,
pero el coeficiente alfa es una frmula general para estimar la confiabilidad de una
prueba que consta de reactivos en los cuales pueden asignarse calificaciones de distinto
peso a respuestas diferentes.
Todos los procedimientos de consistencia interna (divisin por mitades, KuderRichard-son, coeficiente alfa) sobrestiman la confiabilidad de las pruebas de velocidad.
En consecuencia, deben modificarse para proporcionar estimaciones razonables de
confiabilidad cuando la mayora de los examinados no termina la prueba en el tiempo
permitido. Para ello, una posibilidad consiste en aplicar las dos mitades de la prueba en
momentos diferentes, pero con lmites de tiempo iguales. Se calcula entonces la
correlacin entre las calificaciones de las dos mitades cronometradas por separado y los
coeficientes resultantes se corrigen con la frmula 5.4. Tambin pueden usarse los
procedimientos de test-retest y de formas paralelas para estimar las confiabilidades de
las pruebas de velocidad.
Confiabilidad entre calificadores
Salvo por errores administrativos, las calificaciones calculadas por dos calificadores
diferentes de una prueba objetiva presentada por un individuo deben ser idnticas. Sin
embargo, la calificacin de las pruebas de ensayo y orales, adems de otros juicios
evaluativos (calificaciones de personalidad, calificacin de pruebas proyectivas) es un
proceso bastante subjetivo. Al evaluar las calificaciones que implican el juicio subjetivo
del calificador, es importante conocer el grado en que diferentes calificadores estn de

acuerdo en las calificaciones y otros valores numricos dados a las respuestas de


diferentes examinados y reactivos. El enfoque ms comn para determinar la
confiabilidad entre calificadores es hacer que dos personas califiquen las respuestas de
un nmero considerable de examinados y calcular luego la correlacin entreds dos
conjuntos de calificaciones. Otro enfoque es hacer que muchas personas califiquen las
respuestas de un examinado o, mejor an, que muchas personas califiquen las respuestas
de varios examinados. Esta ltima estrategia arroja un coeficiente intraclase o
coeficiente de concordancia, el cual es un coeficiente generalizado de confiabilidad
entre calificadores. En muchos libros de estadstica se describen los procedimientos para
calcular estos coeficientes.
Las pruebas orales no se distinguen por tener una elevada confiabilidad, pero se
dispone de formas especiales que pueden mejorar la objetividad, y por ende la
confiabilidad, con la que se juzga el desempeo oral. Aunque los exmenes orales
tienen, por lo general, una confiabilidad menor que pruebas escritas comparables, la
atencin cuidadosa al diseo de las preguntas orales, a la elaboracin de las respuestas
modelo a las preguntas antes de aplicar la prueba, y al uso de calificadores mltiples,
puede mejorar la confiabilidad de las calificaciones en las pruebas orales. Dichos
procedimientos han dado por resultado coeficientes de confiabilidad entre calificadores
de .60 y .70 para las pruebas orales aplicadas en ciertos cursos de licenciatura, posgrado
y de escuelas profesionales. Otras sugerencias para mejorar la confiabilidad de las
evaluaciones del desempeo oral incluyen alentar a los examinados a demorar la
respuesta hasta que hayan pensado por un momento en la pregunta, y registrar las
respuestas de manera electrnica para que ms tarde sean reproducidas y reevaluadas
por los calificadores.
II.

VALIDEZ
De manera tradicional, la validez se ha definido como el grado en que una prueba

mide lo que est diseada para medir. Una desventaja de esta definicin es la
implicacin de que una prueba slo tiene una validez, la cual supuestamente es
establecida por un solo estudio para determinar si la prueba mide lo que se supone debe
medir. En realidad, una prueba puede tener muchas clases de validez, dependiendo de
los propsitos especficos para los cuales fue diseada, la poblacin objetivo, las
condiciones en que se aplica y el mtodo para determinar la validez.

Los mtodos por los cuales puede determinarse la validez incluyen (1) analizar el
contenido de la prueba, (2) calcular la correlacin entre las calificaciones en la prueba y
las calificaciones en el criterio de inters y (3) investigarlas caractersticas psicolgicas
particulares o constructos medidos por la prueba. Todos esos procedimientos son tiles
en la medida que mejoran la comprensin de lo que mide una prueba y proporcionan
informacin para tomar decisiones sobre la gente. Tambin puede ser de inters evaluar
la validez creciente de una prueba, es decir, qu tanto aade la prueba a la prediccin y
comprensin de los criterios que ya son anticipados por otras medidas.
A diferencia de la confiabilidad, la cual es influida slo por los errores no
sistemticos de medicin, la validez de una prueba es afectada tanto por los errores no
sistemticos como por los sistemticos (constantes). Por esta razn, una prueba puede
ser confiable sin ser vlida, pero no puede ser vlida sin ser confiable. La confiabilidad
es una condicin necesaria, pero no suficiente, para la validez.
Validez de contenido
La apariencia fsica de una prueba con respecto a sus propsitos particulares {validez
de facie) es ciertamente una consideracin importante a tener en cuenta al
comercializarla. No obstante, el concepto de validez de contenido se refiere a algo ms
que a la apariencia. La validez de contenido atae a si ste produce un rango de
respuestas que son representativas del dominio entero o universo de habilidades,
entendimientos y otras conductas que supuestamente debe medir la prueba. Se supone
que las respuestas a la muestra de reactivos de una prueba bien diseada son indicativas
de lo que seran las respuestas al universo entero de conductas de inters.
Un anlisis de la validez de contenido ocurre ms a menudo en conexin con las
pruebas de aprovechamiento, para las cuales por lo general no existe un criterio externo
especificado. La validez de contenido tambin es de inters en las medidas de aptitud,
inters y personalidad, aunque quiz menos que la validez de constructo o la relacionada
con un criterio. En una prueba de aprovechamiento se evala la validez de contenido
analizando la composicin de la prueba para determinar el grado en que representa los
objetivos de la enseanza. Una forma de lograr esto es comparar el contenido de la
prueba con un bosquejo o tabla de especificaciones concernientes a la materia que va a
ser cubierta por la prueba. Si expertos en la materia coinciden en que una prueba parece
y acta como un instrumento diseado para medir lo que se supone debe medir,
entonces se dice que posee validez de contenido.

Dichos juicios involucran no slo la apariencia de los reactivos de la prueba, sino


tambin los procesos cognitivos implicados al responderlos. Es obvio que el proceso de
evaluar la validez de contenido no debera esperar hasta que se haya elaborado la
prueba. El juicio de los expertos en lo que se refiere a qu reactivos incluir es necesario
desde el principio del proceso de elaboracin de la prueba. Al definir el universo del
contenido de la prueba y la muestra de ese universo que se va a incluir, los diseadores
establecen las condiciones indispensables para lograr construir un instrumento con
validez de contenido.
Validez con relacin a criterio
La validacin de cualquier prueba de habilidad consiste en relacionar las
calificaciones en la prueba con el desempeo en medidas o estndares de criterio con los
cuales pueden compararse las calificaciones. Sin embargo, de manera tradicional, el
trmino validez con relacin a criterio hace referencia a procedimientos en los cuales las
calificaciones en la prueba de un grupo de personas se comparan con las puntuaciones,
clasificaciones u otras medidas de desempeo. Algunos ejemplos de criterios contra los
cuales se validan las pruebas son las notas escolares, calificaciones de un supervisor y
nmero o cantidad de dlares en ventas. Siempre que se dispone de una medida de
criterio en el momento de la prueba puede determinarse la validez concurrente del
instrumento. Cuando las calificaciones en el criterio no estn disponibles sino hasta
cierto tiempo despus de que se aplic la prueba, se enfatiza la validez predictiva de la
prueba.
Validez concurrente.
Los procedimientos de validacin concurrente se emplean siempre que una prueba se
aplica a personas clasificadas en varias categoras, como grupos de diagnstico clnico o
niveles socioeconmicos, con el propsito de determinar si las puntuaciones en la
prueba de las personas ubicadas en una categora son significativamente diferentes de
las de los individuos que se hallan en otras categoras. Si la calificacin promedio vara
de modo sustancial de una categora a otra, entonces la prueba puede usarse como otra
forma, quiz ms eficiente, de asignar a la gente a esas categoras. Por ejemplo, las
puntuaciones en el Inventario Multifsico de Personalidad de Minnesota (MMPI) han
sido tiles en la identificacin de trastornos mentales especficos, porque se ha

encontrado que los pacientes a quienes los psiquiatras diagnostican trastornos


particulares tienden a diferir del resto de la poblacin en las puntuaciones que obtienen
en ciertos grupos de reactivos (escalas).
Validez predictiva.
La validez predictiva atae a la precisin con que las puntuaciones de una prueba
predicen puntuaciones de criterio, segn lo indica la correlacin entre la prueba
(predictor) y un criterio del desempeo futuro. La validez predictiva es de inters sobre
todo para las pruebas de aptitud o de inteligencia, ya que las puntuaciones en esos tipos
de instrumentos a menudo se correlacionan con las puntuaciones, notas de cursos,
calificaciones de pruebas de aprovechamiento y otros criterios de desempeo.
La magnitud de un coeficiente de validez predictiva est limitada por la confiabilidad
de las variables de prediccin y de criterio; no puede ser mayor que la raz cuadrada del
producto de esas dos confiabilidades. Por sta y por otras razones, la correlacin entre
un predictor y una variable de criterio, calculada mediante procedimientos descritos en
el apndice A, varia con el criterio especfico, pero rara vez es mayor a .60. Como la
proporcin de la varianza en la variable de criterio que puede ser explicada por la
variacin en la variable predictora es igual al cuadrado de la correlacin entre las
variables predictora y de criterio, por lo general no puede predecirse ms de 36% de la
variacin en las puntuaciones de criterio a partir de las puntuaciones obtenidas en una
prueba u otro instrumento psicomtrico. Esto deja sin explicar o predecir 64% de la
varianza de criterio. Considerando que la validez predictiva de la mayora de las pruebas
es menor de .60, es comprensible por qu deben hacerse con cuidado las afirmaciones
concernientes a la posibilidad de predecir los criterios de desempeo a partir de las
puntuaciones obtenidas en las pruebas psicolgicas.
Error estndar de estimacin.
La seccin sobre regresin y prediccin en el apndice A describe el procedimiento a
seguir para determinar una ecuacin de regresin (ecuacin de prediccin) y pronosticar
las calificaciones de criterio de un grupo de personas a partir de sus puntuaciones en
pruebas o en otras variables. Sin embargo, ingresar la puntuacin de una persona en una
prueba a una ecuacin de regresin slo produce un estimado de la calificacin que la
persona obtendr en realidad en la variable de criterio. Si la calificacin de criterio que
se predice para una persona se considera como la media de una distribucin normal de

las calificaciones de criterio obtenidas por un grupo de individuos que obtuvieron la


misma calificacin que la persona en la variable predictora, entonces la desviacin
estndar de esta distribucin es un ndice del error promedio en esas predicciones. Este
estadstico, conocido como errar estndar de estimacin (Sest), es aproximadamente
igual a:

Donde s es la desviacin estndar de la calificacin de criterio y r es la correlacin


producto-momento entre el predictor (prueba) y el criterio.

Factores que afectan la validez con relacin a criterios


La validez con relacin a criterios de una prueba puede ser influida por una serie de
factores, incluyendo las diferencias de grupo, la extensin de la prueba, la
contaminacin del criterio y la tasa base. La validez creciente de una prueba, es decir, la
contribucin de la prueba que excede a las contribuciones de otras variables, tambin
debera ser considerada al decidir si se va a utilizar la prueba con propsitos de
seleccin y ubicacin.
Diferencias de grupo. Las caractersticas de un grupo de personas en quienes se
valida una prueba incluyen variables como sexo, edad y rasgos de personalidad. Esos
factores, que en este contexto se conocen como variables moderadoras, pueden afectar
la correlacin entre una prueba y una medida de criterio.
La magnitud de un coeficiente de validez, como la de un coeficiente de confiabilidad,
tambin est influida por el grado de heterogeneidad del grupo de validacin en lo que
mide la prueba. Los coeficientes de validez tienden a ser ms pequeos en los grupos
ms homogneos, es decir, los grupos que tienen un rango ms estrecho de
calificaciones. El tamao de un coeficiente de correlacin es una funcin de las
variables de prediccin y de criterio, por lo que estrechar el rango de calificaciones en
cualquier variable tiende a disminuir el coeficiente de validez predictiva.

Como la magnitud de un coeficiente de validez vara con la naturaleza del grupo


probado, una prueba recin elaborada que resulte ser un predictor vlido de una variable
de criterio particular en un grupo de gente debe tener una validacin cruzada en un
segundo grupo. En la validacin cruzada se aplica una prueba a una segunda muestra de
personas para determinar si conserva su validez entre muestras diferentes. Debido a la
operacin de los factores del azar, la magnitud de un coeficiente de validez por lo
general se reduce en alguna medida en la validacin cruzada. En consecuencia, en la
mayor parte de los casos se considera que la correlacin entre las calificaciones de
prediccin y de criterio en la validacin cruzada es un mejor indicador de la validez
predictiva que la correlacin original prueba-criterio.
La validacin cruzada, que es una manera de determinar la generalizacin de la
validez de una prueba, es decir, si la prueba sigue siendo vlida en situaciones
diferentes, tambin puede involucrar una muestra diferente (paralela) de reactivos. Con
diferentes muestras de examinados, diferentes muestras de reactivos de la prueba, o en
ambos casos, suele darse alguna reduccin del coeficiente de validez en la validacin
cruzada. Se han propuesto frmulas para "corregir" dicha reduccin, pero implican
ciertas suposiciones que no siempre se cumplen.
Extensin de la prueba.
Al igual que la confiabilidad, la validez vara directamente con la extensin de la
prueba y con la heterogeneidad del grupo de personas examinadas. Hasta cierto punto,
las puntuaciones en una prueba ms larga y en una prueba administrada a un grupo de
individuos que varan de manera considerable en las caractersticas a medir tienen
varianzas ms grandes y, en consecuencia, mayor validez predictiva que las
puntuaciones de pruebas ms cortas o de pruebas aplicadas a grupos ms homogneos.
Se han propuesto frmulas que corrigen los efectos que tienen en la validez la
restriccin de rangos de calificacin y la extensin acortada de la prueba, pero slo son
apropiadas bajo ciertas circunstancias especiales.
Contaminacin de criterios. La validez de una prueba est limitada no slo por su
confiabilidad y el criterio, sino tambin por la validez del propio criterio como medida
de la variable de inters. En ocasiones el criterio se hace menos vlido, o se contamina,
por el mtodo particular de medir las calificaciones de criterio. Por ejemplo, un

psiclogo clnico enterado de que un grupo de pacientes ya ha sido diagnosticado como


psictico puede percibir mal los signos psicticos en las respuestas de esos pacientes a
las pruebas de personalidad. Entonces el mtodo de comparacin de grupos, en el cual
se comparan las calificaciones obtenidas por los psicticos en la prueba con las
obtenidas por los normales, arrojar evidencia falsa a favor de la validez de la prueba.
Dicha contaminacin del criterio (psicticos contra normales) puede controlarse por
medio de un anlisis ciego, esto es, haciendo que quien emite el diagnstico no
disponga de informacin acerca de los examinados a excepcin de sus puntuaciones en
la prueba. Sin embargo, muchos psiclogos clnicos sostienen que el anlisis ciego no es
natural ya que no es la forma en que las pruebas se emplean en realidad en los
escenarios clnicos.
Validez creciente.
Cuando se intenta decidir si la aplicacin de un instrumento particular de evaluacin
con propsitos predictivos o de diagnstico est justificada por su costo, tambin
debera considerarse la validez creciente. La validez creciente se refiere a la cuestin de
qu tanta precisin ms tienen las predicciones y los diagnsticos cuando se incluye una
prueba particular en una batera de procedimientos de evaluacin. Es posible que otros
mtodos de evaluacin menos costosos (observacin, entrevista, inventario biogrfico)
puedan satisfacer los propsitos de la evaluacin igual de bien sin usar una prueba
adicional. La validez creciente se relaciona con el concepto de utilidad, tal como se
aplica en los contextos de seleccin de personal. La utilidad de una prueba se define
como un incremento medido en la calidad de los empleados que son contratados o
promovidos sobre la calidad de los empleados cuando no se usa una prueba u otro
procedimiento de evaluacin (Cascio, 2000).
Validez de constructo
La validez predictiva es del mayor inters en la seleccin y ubicacin en un contexto
ocupacional o educativo. Diferentes tipos de pruebas de habilidad, y en ocasiones
pruebas de personalidad y de inters, se utilizan con propsitos de seleccin y
ubicacin. La validez de constructo es de un inters mayor an con respecto a las
pruebas de personalidad. La validez de constructo de un instrumento de evaluacin
psicolgica se refiere al grado en que el instrumento mide un constructo particular, o
concepto psicolgico como la ansiedad, la motivacin para el logro, la extraversin-

introversin o el neuroticismo. La validez de constructo, que es el tipo ms general de


validez, no se determina de una sola manera o por una investigacin. Ms bien
involucra una red de investigaciones y otros procedimientos diseados para determinar
si un instrumento de evaluacin que supuestamente mide una determinada variable de
personalidad en realidad lo hace.
Evidencia a favor de la validez de constructo.
Entre las fuentes de evidencia a favor de la validez de constructo de una prueba se
encuentran las siguientes:
1. Los juicios de expertos de que el contenido de la prueba corresponde al constructo
de inters.
2. Anlisis de la consistencia interna de la prueba.
3. Estudios, tanto en grupos formados de manera experimental como en grupos que
se presentan de manera natural, de las relaciones entre las puntuaciones de la prueba y
otras variables en las cuales difieren los grupos.
4. Correlaciones de las puntuaciones en la prueba con las puntuaciones en otras
pruebas y variables con las cuales se espera que tengan cierta relacin, seguidas por un
anlisis factorial de esas correlaciones.
5. Interrogar con detalle a los examinados o a los calificadores acerca de sus
respuestas a una prueba o escala de calificacin para revelar los procesos mentales
especficos implicados al dar respuesta a los reactivos.
Como lo revela esta lista, varios tipos de informacin contribuyen al establecimiento
de la validez de constructo de un instrumento psicomtrico. La informacin puede
obtenerse de anlisis racionales o estadsticos de las variables evaluadas por el
instrumento y por estudios de su capacidad para predecir la conducta en las situaciones
en que opera el constructo.
Las demostraciones experimentales como las usadas en la validacin de constructo
de la Escala de Taylor de Ansiedad Manifiesta (TMAS) (Taylor, 1953) son
particularmente importantes en el establecimiento de la validez de constructo. De
acuerdo con la teora hulliana del aprendizaje, la ansiedad es una pulsin y, por
consiguiente, la gente muy ansiosa debe condicionarse con mayor facilidad que la gente
menos ansiosa. Suponiendo que esta teora es correcta, los individuos que tienen un alto
nivel de ansiedad deben adquirir con ms rapidez que quienes tienen un bajo nivel de

ansiedad un parpadeo condicionado en una situacin de condicionamiento clsico


donde estn presentes una luz, un soplo de aire y el parpadeo. Por lo tanto, si es una
medida vlida del constructo de ansiedad, quienes obtienen puntuaciones altas en la
escala TMAS deberan condicionarse con mayor facilidad en esta situacin que quienes
obtienen bajas puntuaciones. La verificacin de esta prediccin contribuy de manera
significativa a aceptar la validez de constructo de la TMAS.
Validacin convergente y discriminante.
Un instrumento con validez de constructo debe tener correlaciones altas con otras
medidas o mtodos de medicin del mismo constructo (validez convergente), pero
correlaciones bajas con las medidas de constructos diferentes (validez discriminante).
La evidencia a favor de estas validaciones de un instrumento psicomtrico puede
obtenerse comparando las correlaciones entre las medidas de:
1. El mismo constructo usando el mismo mtodo.
2. Diferentes constructos usando el mismo mtodo.
3. El mismo constructo usando mtodos diferentes.
4. Diferentes constructos usando mtodos diferentes.
La validez de constructo de un instrumento psicomtrico se confirma por este
planteamiento de caractersticas y mtodos mltiples (Campbell y Fiske, 1959) cuando
las correlaciones entre el mismo constructo medidas por el mismo y por diferentes
mtodos son significativamente mayores que las correlaciones entre diferentes
constructos medidas por los mismos o por diferentes mtodos. Por desgracia, los
resultados de dichas comparaciones no siempre resultan de esta manera.
Ocasionalmente las correlaciones entre diferentes constructos medidas por el mismo
mtodo son ms altas que las correlaciones entre el mismo constructo medidas por
mtodos diferentes. Esto significa que el mtodo (inventario de lpiz y papel, tcnica
proyectiva, escala de calificacin, entrevista, etc.) es ms importante que el constructo o
rasgo particular en la determinacin de lo que est siendo medido que el constructo o
rasgo que supuestamente est siendo evaluado.

III.

METODOLOGA

3.1 TIPO DE INVESTIGACION: Investigacin descriptiva.

3.2 IDENTIFICACION DE VARIABLES:


3.2.1
3.2.2

Variables Independientes: Validacin.


Variables Dependientes: Instrumentos de investigacin.

3.3. MATRIZ DE DISPERSIN TEMATICA

VALIDEZ
De manera tradicional, la validez se ha definido como el
grado en que una prueba mide lo que est diseada para
medir.
Los mtodos por los cuales puede determinarse la
validez incluyen: (1) analizar el contenido de la prueba,
(2) calcular la correlacin entre las calificaciones en la
prueba y las calificaciones en el criterio de inters y (3)
investigarlas caractersticas psicolgicas particulares o
constructos medidos por la prueba..
Los tipos de validez son:
Validez de contenido:
El concepto de validez de contenido se refiere a algo
ms que a la apariencia. La validez de contenido
atae a si ste produce un rango de respuestas que
son representativas del dominio entero o universo de
habilidades, entendimientos y otras conductas que
supuestamente debe medir la prueba.
Validez con relacin a criterio:
La validacin de cualquier prueba de habilidad
consiste en relacionar las calificaciones en la prueba
con el desempeo en medidas o estndares de criterio
con los cuales pueden compararse las calificaciones.
Validez concurrente:
Los procedimientos de validacin concurrente se
emplean siempre que una prueba se aplica a personas
clasificadas en varias categoras, como grupos de
diagnstico clnico o niveles socioeconmicos, con el
propsito de determinar si las puntuaciones en la
prueba de las personas ubicadas en una categora son

INSTRUMENTOS DE INVESTIGACIN
El xito de una investigacin, adems de
la plena identificacin de las variables,
la correcta formulacin de la hiptesis,
la estrategia adecuada para probar dichas
hiptesis, etc., depende de la calidad de
los instrumentos de investigacin de
datos, de ah que resulta muy importante
que el investigador asuma esta tarea con
la mayor responsabilidad posible.

Esto quiere decir que el investigador


debe preocuparse en cuidar que los
instrumentos que elabora para acopiar
los datos, posean cualidades bsicas y
necesarias. Si un instrumento no posee
las cualidades necesarias, la
investigacin puede adoptar un sesgo
peligroso y se puede llegar a lo que los
expertos denominan, resultados espurios
o incorrectos en una investigacin.

Los instrumentos de investigacin de


datos deben poseer estas cualidades que
pongan en evidencia su bondad para
recolectar los datos que requiere el
investigador. Muchas veces, el
investigador fracasa en sus esfuerzos al
recolectar los datos debido a que sus
instrumentos no poseen las cualidades
mnimas y le proporcionan datos falsos o
equivocados. Un buen instrumento debe
reunir ciertas cualidades que lo
tipifiquen como tal.

significativamente diferentes de las de los individuos


que se hallan en otras categoras.

Validez predictiva:
La validez predictiva atae a la precisin con que las
puntuaciones de una prueba predicen puntuaciones
de criterio, segn lo indica la correlacin entre la
prueba (predictor) y un criterio del desempeo
futuro.

IV.

Son muchas las cualidades que deben


poseer los instrumentos de investigacin
de datos, pero las ms importantes son
las siguientes: validez, confiabilidad,
objetividad, amplitud, practicabilidad y
adecuacin.

SIGNIFICADO DE CIERTAS PALABRAS


Confiabilidad de instrumentos: se refiere al grado en que su aplicacin repetida al

mismo sujeto u objeto produce resultados similares o consistentes con mediciones


previas.
Validez de un instrumento: se refiere al grado en que un instrumento de medicin
realmente mide la variable que pretende medir. Por ejemplo: que un instrumento de
inteligencia mida inteligencia y no ausencia de memoria.
Mtodos para evaluar la confiabilidad: medida de Estabilidad, tambin llamada
confiabilidad test - retest. Un mismo instrumento es administrado a un mismo grupo de
personas despus de un perodo de tiempo. Se mide la confiabilidad a travs de la
correlacin entre ambos puntajes.
La confiabilidad y validez son ms difciles de lograr mientras ms abstracto sea el
constructo que se desea medir (motivacin, actitudes, inteligencia, valores, etc.)En este
sentido, toda medicin est expuesta a un margen de error de medicin, por lo que sta
nunca es perfecta. La manera de controlar el error dela medicin es calculando la
confiabilidad y validez de los instrumentos de medicin.
Mtodo de Forma paralelas o alternativas. Se Administran dos formas equivalentes,
por tanto no es el mismo instrumento. Las formas son equivalentes en contenidos,
preguntas, instrucciones, duracin, etc. Las formas se administran a un mismo grupo

dentro de un perodo de tiempo corto. Se mide la confiabilidad a travs de la correlacin


entre ambos puntajes.
Mtodo de las Mitades partidas (split -halves).Requiere una sola medicin en un
mismo grupo de sujetos. Se divide la prueba en dos mitades y se comparan los
resultados en correlaciones.
Coeficiente de Cronbach. Este coeficiente requiere una sola medicin y mide la
consistencia interna de los tems encada escala y el instrumento como conjunto. Es decir
entrega un valor estadstico que nos indica en qu medida un conjunto de tems apuntan
en la misma direccin.
Validez de contenido: Se refiere al grado en que un instrumento refleja un dominio
especfico de contenido de lo que se mide. Es el grado en que la medicin representa al
concepto medido.
Validez de Criterio: Se establece la validez comparndolo con algn criterio externo.
Es un criterio estndar con el que se juzga la validez de un instrumento.
Validez de Constructo: Se refiere al grado en que una medicin se relaciona
consistentemente con otras mediciones de acuerdo con hiptesis derivadas tericamente
y que conciernen a los conceptos (o constructos) que estn siendo medidos. Cuando el
criterio se fija en el presente se llama validez concurrente. Cuando el criterio se fija en
el futuro se llama validez predictiva
CONCLUSIN
La confiabilidad se refiere a la libertad relativa que tienen las calificaciones de
prueba de los errores de medicin. En la teora clsica de las calificaciones de prueba, la
confiabilidad se define como la razn de la varianza de la calificacin real en una
prueba con la varianza de su calificacin observada. Dado que la varianza de la
calificacin real no puede calcularse directamente, la confiabilidad debe estimarse
mediante uno de varios procedimientos que toman en consideracin varias fuentes de
error de medicin. Tres mtodos tradicionales para estimar la confiabilidad de una
prueba u otro instrumento de evaluacin son test-retest, formas paralelas y consistencia
interna.

El mtodo de formas paralelas, que tiene en consideracin los errores debidos a


diferentes momentos de aplicacin, as como los debidos a diferentes muestras de los
reactivos de prueba, es el ms satisfactorio. Debido a que la elaboracin de las formas
paralelas es costosa y consume tiempo, los procedimientos de test-retest y de
consistencia interna son las fuentes ms populares de evidencia de confiabilidad. Los
enfoques de consistencia interna, que son menos apropiados para las pruebas de
velocidad, comprenden la divisin por mitades, las frmulas Kuder-Richardson y el
coeficiente alfa.
El error estndar de medicin, que vara inversamente con la magnitud del
coeficiente de confiabilidad, se emplea al calcular intervalos de confianza para las
calificaciones reales en una prueba. Entre ms grande sea el error estndar de medicin,
ms amplio es el rango de calificaciones que puede decirse, con un grado especificado
de confianza, contiene la calificacin real de un examinado en la prueba.
La confiabilidad de una prueba vara directamente con el nmero de reactivos y la
heterogeneidad del grupo que la presenta. La confiabilidad tambin vara con el nivel de
dificultad de los reactivos que componen la prueba, siendo ms alta con reactivos de
dificultad intermedia.
Se analiz de manera breve los procedimientos para determinar la consistencia entre
diferentes calificadores (confiabilidad entre calificadores) y la confiabilidad de las
pruebas referidas a criterio. Tambin se prest atencin a la teora de la generalizacin,
la cual conceptualiza la calificacin de una prueba como la muestra de una poblacin y.
por ende, como el estimado de una calificacin real o valor universal.
La confiabilidad es una condicin necesaria pero no suficiente para lograr la validez,
que es el grado en el cual una prueba mide lo que est diseado para medir. La
informacin sobre la validez de una prueba puede obtenerse de varias maneras:
analizando el contenido de la prueba (validez de contenido), correlacionando las
calificaciones de la prueba con calificaciones en un criterio medidas al mismo tiempo
(validez concurrente), correlacionando las calificaciones de la prueba con calificaciones
en un criterio medidas en un momento posterior (validez predictiva), y por el estudio
sistemtico de lo adecuado de la prueba para valorar un constructo psicolgico
especificado (validez de constructo). En las pruebas de aprovechamiento, por lo regular,

se valida el contenido, mientras que la validez predictiva es de mayor inters con


respecto a las pruebas de aptitud. La validez concurrente y la de constructo son
importantes para las pruebas de personalidad.
La magnitud de un error cometido al predecir la calificacin de criterio de una
persona a partir de su calificacin en una prueba es calculada mediante el error estndar
de estimacin, el cual vara inversamente con el tamao del coeficiente de validez
relacionado con el criterio. Tanto el coeficiente de validez relacionado con el criterio
como el error estndar de estimacin son afectados por varios factores que comprenden
las diferencias de grupo. la extensin de la prueba y la contaminacin del criterio. Como
la magnitud de un coeficiente de validez puede ser afectada por factores aleatorios, las
pruebas usadas con propsitos predictivos deberan someterse a validacin cruzada en
muestras separadas de personas. Tambin es importante considerar cunto contribuyen
las calificaciones de prueba al proceso de tomar buenas decisiones acerca de la gente
mucho ms all de las contribuciones de otras variables (validez creciente).
La informacin sobre la validez de constructo de una prueba como medida de una
variable o caracterstica psicolgica particular puede obtenerse de varias maneras. En
particular, es til un anlisis de correlacin entre la prueba y otras medidas del mismo
constructo obtenidas por el mismo mtodo o por mtodos diferentes, as como medidas
de diferentes constructos obtenidas por el mismo mtodo o por mtodos diferentes
(matriz de rasgos y mtodos mltiples).
Las pruebas psicolgicas se aplican en escenarios ocupacionales con propsitos de
seleccin, clasificacin, promocin y valoracin peridica de empleados. Algunos de
los procedimientos estadsticos que se utilizan con esos propsitos son tablas de
expectativas, razones de seleccin y mtodos de lmites mltiples y regresin mltiple.

REFERENCIAS BIBLIOGRFICAS

Baechle, Thomas R., Earle, Roger W. (2007). Principios del entrenamiento de la


fuerza y el acondicionamiento fsico. 2, edicin. Madrid, Espaa. Editorial Mdica
Panamericana.

Hernndez Sampieri. R. et.al. (2003). Metodologa de la investigacin.3 .Edicin.


Mxico: Mc Graw-Hill.

Maxwell, D.L., Stake E. (2006). Research and Statistical Methods in Comunication


Sciences and Disorders. Universidad de Michigan, EE. UU. Thomson/Delmar
learninf.

Seisdedos, Cuberos Nicols (2004). Cambios. Test de flexibilidad cognitiva.


Madrid, Espaa.TEA ediciones.

Thompson, R. (1994). Regulacin emocional: Un tema en busca de la definicin. En


N. Fox (Ed.), El desarrollo de la regulacin de las emociones: consideraciones
biolgicas y de comportamiento.

Yin, Robert K. (2009). Case Study Research, design and mhetods. Fourth edition,
California, U.S.A.. SAGE Inc.

Anda mungkin juga menyukai