Anda di halaman 1dari 8

0.

- INTRODUCCIN
Estos apuntes han sido previstos en el programa de la asignatura de Psicometra (curso 20102011) como una ayuda o gua para los alumnos que cursan los estudios de Psicologa de la Universidad de Sevilla. Cuando se aborda el tema de la docencia en reuniones o congresos del rea de metodologa los autores se pronuncian como partidarios de una docencia muy prctica, conceptual e intuitiva; que haga uso de los avances matemticos, estadsticos e informticos, pero sin demostraciones ni justificaciones sobre los mismos. En este sentido: Al igual que antiguamente el conductor de un coche deba saber revisar y reponer los distintos niveles del vehculo, cambiarle la polea al ventilador, cambiar una rueda, etc. y hoy da los coches vienen preparados para que ninguna de estas cosas haya que hacerlas tan frecuente ni tan inexcusablemente; en la misma lnea presentaremos una asignatura de Psicometra eminentemente prctica y en la que slo se desarrollarn los fundamentos matemticos en aquellos casos que los consideremos necesarios para la comprensin del tema. As lo que antes costaba ms trabajo al tenerlo que hacer con calculadora, papel y lpiz; actualmente, con los avances de la informtica, el ordenador lo hace en el mnimo tiempo y sin ningn esfuerzo. As pues con la ayuda de la informtica quizs no sean tan engorrosas las aplicaciones psicomtricas, ni haya que basar la docencia en frmulas y clculos que, por otra parte, el alumno nunca va a tener que realizar a mano. Este ao nos planteamos la asignatura como un acercamiento a la Psicometra de los nuevos programas de Grado en Psicologa. En este sentido ms prctico con el que se plantean en dichos programas las asignaturas metodolgicas, nos planteamos una psicometra ms centrada en el proceso de construccin depuracin, validacin y estandarizacin de un test (estas son las competencias que nos planteamos desarrollen los alumnos). Despus de un tema 0 y 1" de tipo introductorio (este) en el que se presenta el programa, el plan didctico, la definicin y los contenidos de la disciplina, pasamos a la presentacin del modelo de la Teora Clsica de los Test (TCT) (tema 2) como fundamento o justificacin delos distintos procedimientos de clculo de la fiabilidad. El tema 3, nucleo principal de esta asignatura que presentamos , desarrolla el proceso de construccin de un test para que las puntuaciones globales obtenidas con l sean tiles a nuestros objetivos de instigacin, diagnstico y/o seguimiento de una intervencin social, educativa o teraputica. Dentro de este tema, una vez explicada la depuracin de tems (en la que hacemos uso del mdulo ITEMAN de MICROCAT y de las tcnicas de Anlisis factorial con SPSS y AMOS), pasaremos a contrastar la calidad del test resultante o puntuacin total de sus tems, por lo que respecta a Fiabilidad y Validez (temas 4 y 5). Para terminar la materia del curso con la Baremacin y Estandarizacin del test resultante (tema 6), si el resultado ha sido aceptable.

1.- LA MEDICIN PSICOLGICA


1.1.- Definicin y Objeto de estudio de la Psicometra Como su propio trmino indica (definicin etimolgica) Psicometra es la disciplina que desarrolla todos los aspectos relacionados con la medida (metra) de la psique (psico). Como los atributos psicolgicos no son abordables de forma directa para medirlos, podemos decir que la Psicometra tiene como objeto material la medida de la psique a travs de los comportamientos psicolgicos externos de sujetos o grupos sociales (ver fig. 1.). Por lo tanto, el objeto material de la medicin psicolgica y consecuentemente de la psicometra es tan amplio y variado como lo son la gran variedad de atributos de psicolgicos y de comportamientos que de ellos se deriven. Pero la Psicometra no slo se encarga de solucionar el problema de la medicin de atributos psicolgicos ya integrados en teoras desarrolladas en otros campos de la psicologa, sino que, a veces, informa a la psicologa de determinadas estructuras perceptivas, aptitudinales o de personalidad (ver fig. 2).

Rasgo

x
1

x
2

x
4 1

. . . .

n 1

Ilustracin 1.- Objeto material de la Psicometra

TEORIAS

PSICOLOGICAS

P S I C O M E T R A
FUNDAMENTACION ESTADISTICA Y MATEMATICA

TEORIA PSICOMETRICA

APLICACION PSICOMETRICA

USO PSICOMETRICO

Ilustracin 2.- Delimitacin del contenido de Psicometra

De lo afirmado en el prrafo anterior no se desprende que la Psicometra est desprovista de un objeto de estudio que le sea especfico dentro de la Psicologa. Al igual que ocurre con las disciplinas mtricas de otras titulaciones (como Fsica, Qumica, Biologa, Astronoma, Medicina, Sociologa o Pedagoga) la Psico-metra queda delimitada y diferenciada del resto de disciplinas psicolgicas por su objeto formal: la elaboracin de teoras y la implantacin de metodologas para la medicin en Psicologa (ver fig. 2). As pues lo que delimite el objeto de estudio especfico de la Psicometra no es el atributo que se mide en cada caso (objeto material) ni el resultado de la medida (uso psicomtrico) sino la fundamentacin terica que justifica el uso de determinadas metodologas para medir en los distintos contextos psicolgicos que se presenten, esto es el objeto formal de la psicometra. Dentro la especialidad de Psicologa se pueden encontrar otras disciplinas relacionadas con la tarea de la medida, el diagnostico o la evaluacin de personas en las muy distintas manifestaciones del comportamiento individual o colectivo ( p.e. Psicodiagnstico, evaluacin escolar, ... etc), pero el campo de la Psicometra queda delimitado por su matiz metodolgico que la hace responsable de la fundamentacin, elaboracin y evaluacin de las distintas pruebas y tcnicas de medicin psicolgica. As pues, resumiendo todo lo anterior, la Psicometra tiene como objeto propio el estudio de los distintos aspectos tericos (Teora Psicomtrica) en los que se basan las Aplicaciones Psicomtricas

(Meli, 1990), consistentes en la construccin de escalas de medida que despus pueden ser utilizadas para medir a cualquier sujeto y/o estmulo de la poblacin en la que se ha obtenido la muestra representativa para ensayar, depurar y calibrar el test (ver Ilustracin 2). En el mismo sentido Olea (1989) atribuye a la psicometra el objetivo de elaborar mtodos para y teoras sobre la medicin psicolgica. En un intento de delimitar an ms el objeto de estudio de la Psicometra, Ponsoda (1984) afirma que la elaboracin de modelos formales con la finalidad de investigar algn sector de la psicologa entrara dentro del campo de la psicologa matemtica, mientras que si esos modelos formales se plantean como finalidad el escalamiento de algn tipo de comportamiento ms que su comprensin, estamos dentro del campo de la Psicometra. Por el lado prctico de la disciplina psicomtrica conviene distinguir la aplicacin y el uso diagnstico de un test (uso psicomtrico) de la propia construccin, adaptacin o contrastacin de las bondades psicomtricas (Teora y Aplicaciones Psicomtricas) de dicho test (ver fig. 1). Las aplicaciones psicomtricas tratan del proceso de elaboracin de un instrumento de medida siguiendo la teora psicomtrica del modelo de medida correspondiente. Los usos psicomtricos tratan de la utilizacin con fines de diagnstico de un instrumento de medida construido previamente. Los usos psicomtricos no son Psicometra pero se nutren de los productos de las aplicaciones psicomtricas (ver Ilustracin 2.) y proporcionan, a su vez, a la psicometra masas de datos que depuran sus instrumentos de medida; as como peticiones que requieren investigaciones de las que se obtengan productos (aplicaciones psicomtricas) que se necesiten en un momento dado. En el mismo sentido, la Psicometra hace uso de herramientas matemticas y estadsticas (ver iluatracin 2) planteadas en otras asignaturas metodolgicas; as como proporciona, para un posible uso metodolgico general, modelos y tcnicas que se descubrieron, en principio, para solucionar necesidades psicomtricas. Cualquier libro que consultemos y que trate sobre la construccin de instrumentos de medida o sobre el diseo de situaciones de medida, tratar de concienciarnos de la gran dificulta de la medicin psicolgica, al tratar de abordar criterios o atributos internos al sujeto y, por lo tanto, no puestos de manifiesto de forma directa sino indirectamente, esto es, a travs del comportamiento. Se suele poner la Fsica como ejemplo de reas del saber que no tienen este problema, debido a que sus medidas las realizan sobre atributos considerados externos. Esto explica que en el campo de la solucin de los problemas metodolgicos de la medicin psicolgica las mayores aportaciones hayan sido hechas por psiclogos, especialmente en el campo de la Teora Clsica de los Test. El modelo lineal aditivo propio de la Teora Clsica de los Tests es un tipo de escalamiento muy adecuado a las necesidades y posibilidades del comportamiento psicolgico en cuanto al nivel de escala de medida que con dicha teora (TCT) se obtiene. Resumiendo, despus de esta contextualizacin de la asignatura se puede entender mejor la definicin de la Psicometra como la disciplina que trata de los distintos modelos y tcnicas de escalamiento. Entendiendo por escalamiento el proceso emprico por el que, a travs de una muestra de sujetos, elaboramos una escala o regla con la que podemos medir posteriormente a cualquier sujeto de la poblacin. 1.2.- El error de medida 1.2.1.-Tipos de errores de medida y sus consecuencias Como no siempre se es lo suficientemente cuidadoso en la medicin de las variables psicolgicas. Esta fase de medicin de variables psicolgicas (constructos), previa a todo anlisis estadstico descriptivo o inferencial, condiciona de manera importante los resultados de toda investigacin. Si no se realiza adecuadamente el proceso de medicin, quedarn desvirtuadas de manera significativa las conclusiones psicolgicas obtenidas. En estas circunstancias, qu valor tendrn nuestras decisiones? Estaramos cometiendo errores de medida que haran ms confusa loa teora subyacente al comportamiento psicolgico. El trmino error de medida comprende errores de muy diferente naturaleza. Jenck y colaboradores (1979, pgs.. 34-36) distinguen tres tipos de errores fundamentales: conceptuales, sistemticos y aleatorios. Aunque en una clasificacin ms completa tendramos que clasificar los errores por su grado y sentido en Sistemticos vs. Aleatorios. A su vez, por lo que respecta a las causas de dicho error, los sistemticos pueden ser conceptuales vs. Procedimentales. Los errores conceptuales son consecuencia no tanto de medir mal una determinada variable cuanto de medir equivocadamente otra en su lugar. Se trata de un problema relativamente frecuente en psicologa donde no suele estar muy claro qu es lo que estamos midiendo. Ocurre, por ejemplo, cuando utilizamos una prueba de razonamiento o de vocabulario como expresin de la inteligencia, o bien cuando tomamos los ingresos como indicador del nivel social. Son errores que quedaran enmarcados dentro del tema de la validez, que estudiaremos ms adelante. Los errores procedimentales o simplemente sistemticos (segn Jenck) son aquellos que siempre se producen en

una misma direccin. Por ejemplo, una prueba puede medir siempre de ms, o bien, todos los individuos de un grupo han realizado un cierto test con diez minutos menos del tiempo especificado en el manual, o bien, un encuestador induce sistemticamente a una determinada respuesta. Todas estas situaciones darn lugar a respuestas sesgadas que repercutirn en los valores estimados como resultado del anlisis. Es obvio que la estadstica como tal poco tiene que hacer con este tipo de errores, donde slo cabe ser cuidadoso en la planificacin y desarrollo del proceso de medicin. Tanto los errores conceptuales como los procedimentales son errores sistemticos, ya que se cometen sistemticamente y en el mismo sentido con todos los sujetos. El mejor ejemplo de error sistemtico es el del ejemplo de tiro a de la Ilustracin 4, en el que todos los disparos dan sistemticamente por encima de la diana. Por ltimo, los errores aleatorios son consecuencia de los mltiples factores desconocidos que inciden en toda medicin y que introducen en la misma una cierta variabilidad, como en las dianas b y c de la Ilustracin 4. A diferencia de los errores sistemticos, los errores aleatorios no guardan relacin alguna con el atributo objeto de la medida. Se supone que estos errores aleatorios unas veces actan en un sentido y otras en otro, de forma tal que se compensan entre ellos (los positivos con los negativos) y a la larga su suma vale cero. Posiblemente un determinado sujeto tenga la misma inteligencia hoy que maana, pero si le aplicsemos el mismo test en ambos das, presumiblemente obtenga puntuaciones diferentes. Variables tales como estado de nimo, cansancio, grado de adivinacin, errores de codificacin ..etc, puedan afectar a los resultados de la prueba aplicada. Tales errores hacen referencia a la precisin de las medidas y entran dentro del terreno de la fiabilidad. Los errores conceptuales y los errores procedimentales son consecuencia fundamentalmente de un diseo defectuoso del proceso de medicin. En el caso de los conceptuales, planteamientos tericos ms rigurosos en torno a la naturaleza del constructo es lo que se hace exigible, mientras que en los procedimentales, se hace necesario una mayor estandarizacin de aquellas circunstancias que inciden en la medicin, en el sentido de mantener su constancia en todo momento. Los errores aleatorios, aunque pueden reducirse con una mejora en el diseo de medida, nunca pueden ser eliminados por completo. Estos errores aleatorios son inherentes a las caractersticas de la medicin psicolgica. Nunca sern controlados en su totalidad, por lo que la estadstica ha de hacerse cargo de ellos. Su naturaleza de "aleatorios" con sus supuestos de media cero e incorrelacin (TCT) los hace idneos para ser tratados estadsticamente y conocer su cuanta, cuestin que es ms difcil de cuantificar en los otros tipos de error. 1.3.- Conceptos de Fiabilidad y Validez. De los errores que hemos visto anteriormente hay dos tipos que no interesan especialmente: los conceptuales y los de medida (aleatorios). El error conceptual lo identificamos como la diferencia entre lo que tiene un sujeto de lo que medimos con el test y lo que tiene el sujeto de lo que pretendemos medir con el test ( Vx-Vy), mientras que el error de medida lo identificamos como la diferencia entre la medida emprica y verdadera de dicho sujeto en el atributo que se mide con el test (X-Vx). Asociados a estos dos tipos de error nos encontramos con las dos cualidades principales de los tests a las que vamos a dedicar mayor espacio en esta asignatura: validez (Vx-Vy) y fiabilidad (X-Vx) (p.e. diferencia entre puntuacin directa obtenida en un examen y el nivel de conocimientos en los contenidos del examen). As pues, resumiendo, toda medida ha de ser til para medir lo que nos proponemos en cada caso (validez) y no otra cosa por error conceptual, y adems ha de medirlo con precisin y no con error de medida (fiabilidad). A partir de ahora nos vamos a centrar en el concepto de fiabilidad como precisin, concepto que se manifiesta en dos situaciones distintas: como cercana entre lo que medimos y lo que tiene el sujeto de lo que medimos (fiabilidad absoluta) y como cercana entre medidas repetidas de un mismo constructo a un mismo sujeto ( fiabilidad relativa). As pues, tenemos el concepto de fiabilidad absoluta como precisin y de fiabilidad relativa como estabilidad de medidas. Pero en Psicometra esta cualidad de la fiabilidad, que puede asumir diferentes grados o niveles, ha de poder fijarse con un nmero o valor cuantitativo que nos de una idea ms precisa del grado en el que una medida es fiable (ndice de fiabilidad o coeficiente de fiabilidad). En este sentido, los indicadores o ndices que ponen de manifiesto estos conceptos de fiabilidad absoluta y fiabilidad relativa los vamos a llamar ndice de fiabilidad y coeficiente de fiabilidad. Segn lo dicho, el ndice de fiabilidad sera el nmero que pone de manifiesto la cantidad de fiabilidad absoluta, y coeficiente de fiabilidad sera el nmero que pone de manifiesto la cantidad de fiabilidad relativa. Pero conceptuar la fiabilidad directamente como error de medida (X-V) es problemtico por dos motivos: su magnitud sera distinta cada vez que se mide con un mismo test, y, adems su clculo es imposible al desconocerse la puntuacin verdadera. El primer problema se evitara calculando el error cuadrtico medio (o su raz cuadrada) de los posibles ensayos de

medida. Pero, an suponiendo que el error tpico de medida fuera calculable (no olvidemos el segundo problema), su valor no tendra un significado estndar sino que dependera de la unidad de medida en la que el test ofrece las puntuaciones directas. Este problema se soluciona dividiendo

Se2 . Con lo cual tenemos la proporcin de error en las medidas como el mejor indicador de la falta de fiabilidad de un S x2
test (ver ecuacin 1). No se puede ni imaginar el paciente lector cul fue nuestra sorpresa al llegar a la conclusin anterior, pues coincide con lo que vamos a estudiar en el tema tres como proporcin de varianza no asociada o proporcin de error en las medidas realizadas con el test, que es igual a 1" menos la proporcin de acierto o de varianza asociada ya que ambas proporciones son complementarias y suman 1".

S S

Pero no se desespere el lector si le decimos que ninguna de las expresiones de la igualdad anterior son calculables empricamente ya que tratan con errores y puntuaciones verdaderas de cada sujeto, que son trminos desconocidos para el psicmetra humano y por lo tanto sin poderes divinos. Para que no cunda el pnico, os informamos que la 2 solucin, que esperamos poder justificar a continuacin est en que rxv es igual a rxx que es lo que vamos a llamar coeficiente de fiabilidad como indicador de la fiabilidad relativa, y eso s que est al alcance de los humanos. Y su raz cuadrada es el ndice de fiabilidad que es el concepto del que partimos en el prrafo anterior ( rxv rxx ). Para los que quieran conocer la justificacin o demostracin de que en la (TCT) el coeficiente de fiabilidad (fiabilidad relativa) es igual al cuadrado del ndice de fiabilidad (fiabilidad absoluta), desarrollamos a continuacin a qu es igual ndice y coeficiente de fiabilidad como correlacin entre x y v o x y x respectivamente.

2 e 2 x

( X i Vi ) 2 N S x2

( Ei ) N S x2

2 2 rxe 1 rxv

(1)

rxv

xv NS x Sv

( v e) v NS x Sv
2 NS x

(v 2

ev )

v2 N
2 NS x

ve N

NS x Sv

1 S x Sv

Sv2 S x Sv

Sv Sv S x Sv

Sv Sx

rx1x2

x1 x2 NS x1 S x2 v2 N ve2 N

(v e1 )(v e2 ) e1v N e1e2 N 1 2 Sx

(v 2 ve2 e1v e1e2 ) S v2 2 Sx


2 2 rxv ; rxv

(2)

Sv Sx

rx1x2

V
rxv rx*v

A aquellos menos amantes de las demostraciones os ofrezco una explicacin ms intuitiva en la ilustracin 3. En ella aplicando la regla del trazado de los diagramas causales a la explicacin de la relacin entre dos pasadas de un test, se comprueba que sta que explicada como un efecto espreo de la puntuacin verdadera en ambas medidas.

Resumimos los pasos seguidos en este apartado. El concepto de fiabilidad absoluta siempre ir unido al de error de medida, pero como el X* error de medida es fluctuante preferimos como indicador la varianza de X los errores. Como esta varianza depende de la escala de medida en que Coef. de fiab. rxx* = rxvrx*v estn los errores dividimos estos por la varianza del test o varianza de las puntuaciones empricas y obtenemos un indicador estndar de la varianza Ilustracin 3.- Coeficiente como producto de los errores en trminos de proporcin de varianza error (ver ecuacin de los ndices de fiabilidad 1) Calculamos su complementario o proporcin de varianza acierto. Para reconvertir dicho indicador a puntuaciones no cuadrticas (puntuaciones directas) calculamos su raz cuadrada y obtenemos el nmero que vamos a utilizar como indicador de la fiabilidad absoluta o ndice de fiabilidad. Tambin se ha explicado que como dicho indicador no puede ser calculado empricamente, se obtiene a partir de raz cuadrada del coeficiente de fiabilidad. As pues, la fiabilidad, en cuanto precisin, es un concepto que no puede ser conocido empricamente en trminos

absolutos (Fiabilidad Absoluta), si entendemos por precisin el grado de correspondencia entre la medida emprica y la magnitud real, que llamaremos verdadera, de aquello que estamos midiendo. As, por ejemplo, sera preciso un examen que reflejara fielmente los verdaderos conocimientos del alumno sobre los contenidos del examen. Es obvio que la nica informacin de la que disponemos en cualquier medida es la propia puntuacin observada, mientras que desconocemos la verdadera magnitud de lo medido. Es por ello que se recurre a otro concepto de fiabilidad (Fiabilidad Relativa) que nos permite saber de forma indirecta si estamos midiendo con cierta precisin, ya que la fiabilidad relativa depende, como veremos despus, de la fiabilidad absoluta. En este sentido, como no conocemos cules son los conocimientos de los sujetos (puntuacin verdadera) si no es a travs de su medida en un examen, para apreciar el grado de precisin del examen tendr que examinar dos veces al sujeto y deducir la precisin del examen de su estabilidad cuando se mide una misma cosa (p.e. los conocimientos de Periquito Prez). Del mismo modo que detectamos la fiabilidad (precisin) del tirador hacindole disparar repetidas veces a una diana (ver Ilustracin 4). El concepto de validez es algo ms complejo, aunque no lo parezca en esta primera aproximacin que hemos ofrecido. Parece una obviedad sin ms complicaciones afirmar como hemos hecho que "una medida es vlida si es til para medir aquello que pretende". Segn esta definicin, un metro es vlido para medir longitudes y una balanza lo es para medir pesos. Y no parece necesario en este contexto replantearse la validez del metro o de la balanza, ya que las magnitudes fsicas estn ah, al alcance de la mano. Esto es que el valor verdadero del objeto (tamao o peso) se percibe directamente con los sentidos y puede resultar fcil apreciar la covariacin entre las medidas obtenidas y el dicho valor verdadero. Pero en psicologa las cosas cambian sustancialmente porque... Dnde est aquello que pretendemos medir? Realmente, tal test mide la inteligencia? No medir razonamiento o fluidez verbal? Y cuando mido ansiedad, estoy seguro de que no estar midiendo depresin? En psicologa la cuestin es que las variables ms que darse en la naturaleza (peso, longitud, densidad) son variables creadas por nosotros mismos (esto no quiere decir que sean arbitrarias o irreales como esperamos poder mostrar). Se trata de conceptos -constructos- constituyentes de una teora. En estas circunstancias, supongo que el lector estar de acuerdo en que es ms difcil saber, cuando medimos, qu es exactamente lo que estamos midiendo. En una primera aproximacin, estamos considerando la validez (que llamamos terica) como la correspondencia entre lo que tiene el sujeto de lo que medimos y la magnitud en la que posee el concepto o constructo que se pretende medir. Pero dado que el concepto o constructo que se pretende medir no se suele conocer empricamente y sin error, est claro que las evidencias sobre validez de las medidas obedece ms a consideraciones tericas que empricas. As en el tema cinco, ms que presentar un ndice incuestionable de la validez de un test, presentaremos distintos tipos de evidencias de validez en funcin del uso que habitualmente se de a dicho test. Por lo que respecta a la fiabilidad de las medidas, no nos preguntamos qu estamos midiendo sino con cuanta precisin. Este grado de precisin es fcil de determinar (indirectamente) por la constancia de los resultados. Hay un aspecto cuantitativo, emprico, al cual aferrarse como criterio de fiabilidad. Por el contrario, en la validez, el "qu se mide" otorga a la cuestin una dimensin cualitativa, dependiendo la validez de nuestra especial consideracin sobre lo que son las cosas, esto es dependiendo de nuestro criterio de validez.

VALIDO NI FIABLE FIABLE FIABLE NO VALIDO NO FIABLE NI VALIDO Y VALIDO (A) (B) (C) (D)
Ilustracin 4.- Cuatro pruebas de tiro distintas tanto en variabilidad como en distancia del centro (fiabilidad y validez respectivamente) (Trochin 1997 p.1)

As, si recurrimos al ejemplo de los disparos de un tcnico a una diana (ver Ilustracin 4) con un rifle, nos encontramos con una situacin anloga a lo que ocurre cuando un psiclogo evala un atributo a un sujeto en repetidas ocasiones a travs de un test. El psiclogo es el tcnico, el test es el rifle y el centro es el valor del sujeto en el atributo que se pretende medir. La cercana entre los puntos de cada nube es equiparable a la estabilidad entre las medidas coeficiente de fiabilidad-. La cercana entre la nube de puntos de cada diana se deber tanto a caractersticas del rifle (Qu pasara si fuera de goma) como a fluctuaciones en el pulso del que dispara. As la falta de estabilidad entre las medidas puede deberse tanto a imprecisiones en la materia prima que son los tems como a fluctuaciones en las distintas circunstancias de aplicacin entre las que la actuacin del psiclogo es fundamental. Por otra parte, por lo que respecta a la validez, la cercana entre el centro de la nube y el de la diana es equiparable a la relacin o cercana entre lo que en realidad mide el test y lo que se pretende medir con su uso. Posibles explicaciones de falta de validez del rifle seran el tener alto o bajo el punto de mira as como disponer de un can curvado, de igual forma veremos muchas explicaciones de faltas de validez pero todas ellas englobables como errores conceptuales al confundir nuestro objetivo de medida con lo que en realidad medimos. As pues, los conceptos de fiabilidad y validez son diferentes e independientes por lo que respecta a la validez terica como correspondencia entre el verdadero nivel del sujeto en lo que medimos y en lo que pretendemos medir. Pero, dado que esta validez terica es difcil de contrastar, frecuentemente hacemos uso de la validez emprica de los tests con respecto a determinados criterios. Es en este sentido en el que se suele decir que una deficiente fiabilidad hace que tambin se muestre baja la validez emprica, aunque una baja validez emprica se puede producir por baja fiabilidad o por baja validez terica. Nos serviremos de algunos ejemplos tpicos y tpicos para explicar el hecho de que la fiabilidad es condicin necesaria aunque no suficiente para que se produzca validez emprica. As, si representamos en un diagrama causal la medida emprica en el test como X; el constructo que en realidad mide el test o puntuacin verdadera en el test como Vx; el constructo o criterio que se pretende medir con el test como Vy y la medida emprica del criterio por Y; entonces, segn las siguientes Ilustracin; podemos encontrarnos con distintas situaciones en las que, utilizando la regla del trazado del path anlisis, la validez emprica rxy es igual a el ndice de fiabilidad del test r xv por la validez de terica r vv por el ndice de fiabilidad del criterio r yv..

X rxy
=

rxvx = 0.80 xvx = 0.80 rxvx


*

rvxvy = 0.10 V y rxvy

ryvy xvy

= 0.98 = 0.98

Ilustracin 5.- Baja fiabilidad por baja validez terica

rvxvy

= 0.80 * 0.10 * 0.98 = 0.0784

En las dos Ilustracin 5 y 6 presentamos, a modo de ejemplo, dos casos con resultados parecidos por lo que respecta al valor de su coeficiente emprico de validez pero opuestos por lo que respecta a su configuracin de fiabilidades y validez terica. As en la Ilustracin 5 se representa el caso supuesto de que medimos la inteligencia de las personas en base a la longitud de cierta lnea de la mano izquierda. Est claro que aunque midamos con gran rigor dicha lnea de la mano rxv e, incluso, midamos con un test muy preciso la inteligencia r yy , de poco nos servir (para despecho de los quiromnticos) pues parece ser que la relacin estricta de dicha lnea de la mano con la inteligencia de los sujetos es bastante baja rvv. Este es un ejemplo de baja validez emprica como consecuencia de baja validez terica. Algo parecido ocurre en la prueba de tiro a de la Ilustracin 4. Su autor tiene gran pulso (precisin en el disparo) pero no

X
xy =

xvx = 0.10 xvy = 0.10

Vx

vxvy = 0.98

Vy

yvy = 0.90 yvy = 0.90

xvx * vxvy * yvy = 0.1 * 0.98 * 0.9 = 0.0882

Ilustracin 6.- Baja validez emprica por baja fiabilidad del test

es consciente de que en lugar de al centro sus disparos van por sistema a la parte superior de la diana. En resumidas cuentas en este ejemplo el problema es la baja validez del arma para dar al centro de la diana y de las lneas de la mano para el diagnstico de la inteligencia. Igualmente, puede ser baja la validez emprica rxy (ver ilustracin 6) por existir una baja fiabilidad del test rxv igualmente hubiera sido baja la validez emprica por baja fiabilidad del criterio-, aunque sea alta la validez terica rvv . Esto es lo que achaca a los tests proyectivos, por gozar de una (supuesta) gran validez terica, pero de una gran imprecisin en la medida (baja fiabilidad). As como ocurre en la prueba de disparo b, en la que el arma est bien centrada (es vlida para dispara al centro de la diana) pero el sujeto que dispara es muy inestable o el can es de plstico. En este mismo sentido, los diagnsticos obtenidos con los tests proyectivos o las entrevistas personales parecen instrumentos muy adecuados para medir la complejidad del ser humano, pero la subjetividad de sus diagnsticos los hace poco fiables. Por ltimo, vase en la Ilustracin 7 cmo una alta validez emprica, implica tanto fiabilidades como validez terica, o validez en sentido estricto, buenas. Si un test de inteligencia, por ejemplo, predice de forma rigurosa el rendimiento en un examen rxy, es porque hay precisin en las medidas de ambos constructos rxx y r yy, y estricta validez o utilidad del constructo-inteligencia de ese test para predecir los conocimientos que mide el examen rvv.

X
xy =

xvx = 0.95 xvy = 0.95


xvx *

Vx

vxvy = 0.98

Vy

yvy = 0.90 yvy = 0.90

vxvy *

yvy = 0.95 * 0.98 * 0.9 = 0.8379

Ilustracin 7 Validez emprica alta con altas fiabilidades y alta validez terica

Para concluir, es evidente que una dbil o fuerte ligazn entre X y V x as como entre Y y Vy, no afecta de ninguna forma a la validez terica o validez en sentido estricto rvv, mientras que fiabilidades relativamente bajas de test o criterio s reducen la validez emprica rxy . Esto es, para que X e Y estn fuertemente relacionados, tambin lo estarn necesariamente los pasos intermedios (recordemos la regla del trazado). Habr de ser alta tanto la dependencia de X con respecto a su constructo Vx -ndice de fiabilidad del test- , como de Y con respecto al suyo (Vy) -ndice de fiabilidad del criterio, as como de un constructo con respecto a otro rvv. En resumidas cuentas, con la fiabilidad y la validez ocurre como cuando el ruido nos impide or la meloda, as como cuando la niebla nos impide ver la figura de un coche que se acerca por la carretera; una baja fiabilidad nos puede oscurecer la validez terica con una baja validez criterial emprica.

Anda mungkin juga menyukai