Anda di halaman 1dari 8

Capitulo 4

Normas, correlacion e inferencia

Normas

Norma en singular se usa en la literatura academica para referirse al


comportamiento que es usual, promedio, normal, estardar o tpico para los
miembros de un grupo particular.

En un contexto psicomtrico, normas son los datos de desempeo en la prueba de


un grupo particular de personas que estn diseados para su uso como referencia
para evaluar o interpretar puntuaciones de prueba individuales. Los manuales
tcnicos de todas las pruebas estandarizadas mas usadas contienen normas para
la prueba. El grupo particular de quienes responden una prueba puede definirse
en forma amplia (por ejemplo un muestra representativa de la poblacin adulta en
Estados Unidos) o en una forma mas limitada (Por ejemplo los internos de un
hospital comunitario con un diagnostico primario de depresin). Ya sea que tengan
un alcance amplio o limitado, los miembros del grupo sern tpicos con respecto a
alguna caracterstica o caractersticas de las personas para las que se diseo la
prueba en particular.

La normalizacin de una prueba, en especial con la participacin de una muestra


normativa representativa nacional, puede ser una proposicin muy costosa. Por
esta razn, algunos manuales de prueba proporcionan lo que se conoce de
manera variada como normas de usuario o normas de programa (APA, 1985), las
cuales consisten de estadsticas descriptivas basadas en un grupo de personas
que responden una prueba en un periodo determinado en lugar de normas
obtenidas con mtodos de muestreo formales.

Estandarizacion y normalizacin

El proceso de aplicar una prueba a una muestra representativa de personas que la


responden con el propositio de establecer normas se conoce como
estandarizacin de una prueba. Se dice que una prueba esta estandarizada
cuando tiene procedimientos definidos en forma clara para su administracin y
calificacin, incluyendo datos normativos . Pero Cmo se obtiene las normas? En
el proceso para elaborar una prueba, quien elabora las pruebas ha definido algn
grupo como la poblacin para la cual se ha diseado la prueba. Esta poblacin es
el universo completo o conjunto de individuos con al menos una caracterstica en
comn .

Quien elabora la prueba puede obtener una distribucin de respuestas


aplicndolas a una muestra de la poblacin, una porcin del universo de personas
considerada representativa de la poblacin entera. El tamao de la muestra podra
ser tan pequea como una persona, aunque conforme se aproxima al tamao de
la poblacin disminuyen las fuentes de error posibles como resultado de un
tamaa de muestra insuficiente.

Los subgrupos dentro de una poblacion definida pueden diferrir con respecto a
algunas caractersticas, y en ocaciones es escencial hacer que estas diferencias
estn representadas de manera proporcional en la muestra. Para disear
cualquier prueba seria deseable incluir en una muestra personas que representen
diferentes subgrupos (o estratos) de la poblacin, como: negro, blancos, asiticos,
otros que no son blancos, hombres, mujeres, persona pobres, de clase media,
rica, profesionales, gente de negocios, oficinistas, obreros calificados y no
calificados, desempelados., amas de casa, catlicos, judos, miembros de otras
religiones, etc., todos en proporcin a la ocurrencia de estos estratos en al
poblacin de personas que residen en X lugar. Este muestreo denominado
estratificado, ayudara a prevenir el sesgo en el muestreo y al final ayudara en la
interpretacin de los resultados. Si dicho muestreo fuera de naturaleza aleatoria
(es decir si cada miembro de la poblacin tuviera la misma oportunidad de ser
incluido en la muestra), entonces el procedimiento se denominara muestreo
aleatorio estratificado.

Otro tipo de muestreo es el muestreo intencional. Si seleccionamos de forma


arbitraria alguna muestra debido a que creemos que ser representativa de la
poblacin, la muestra que seleccionemos se denominara intencional

Otro tipo de muestra, que e sun tipo usado con mucha frecuencia, se llama
muestra incidental. En ocasiones el investigador puede emplear una muestra que
no necesariamente es la mas apropiada si no la mas conveniente.El investigador
que hace este tipo de muestra, no lo hace como resultado de un juicio deficiente
sino debido a limitaciones presupuestales y otras restricciones situacionales.

Habiendo obtenido una muestra, quien elabora la prueba la administra de acuerdo


con el conjunto estndar de instrucciones con la que se usara. Quien elabora la
prueba tambin proporciona un escenario para quienes la responden, que ser el
escenario recomendado en la que esta se aplicara.

Tipos de normas
Las normas de percentiles son los datos crudos de una muestra de
estandarizacin de una prueba convertidos a una forma de percentil.

Puede verse que un percentil es una clasificacin que transmite informacin sobre
la posicin relativa de una puntacin dentro de una distribucin de puntuaciones.
Un percentil es una puntuacin convertida que se refiere a un porcentaje de
quienes responden la prueba.

Normas de edad.
Tambien conocidas como puntaciones equivalentes de edad, las normas de edad
indican el desempeo promedio en diferentes muestras de quienes responden la
prueba que tenan diversas edades en el momento en que se aplico la prueba.

Normas de grado
Diseadas para indicar el desempeo promedio de quienes responden pruebas en
grado determinado, las normas de grado se elaboran aplicando la prueba a
muestras representativas de nios en de un rango de niveles de grado
consecutivos (como de primero a sexto).

Las normas de grado no proporcionan informacin sobre el contenido o tipo de


reactivos que un estudiante pudo responder en forma correcta o no. Quiza el uso
primario de las normas de grado es una estimacin conveniente, comprensible con
facilidad, de la forma en que el desempeo de un estudiante se compara con el de
sus compaeros estudiantes en el mismo grado.

Normas nacionales

Se deriva de una muestra de estandarizacin que ha sido representativa de una


poblacin a escala nacional.

Normas nacionales ancladas


Existen docenas de pruebas, por ejemplo, que pretenden medir la lectura. Para
comprar dos pruebas de lecturas que miden los grados 3 a 6 grados se ocupa
una tabla de equivalencia para las puntuaciones en las dos pruebas o normas
nacionales ancladas podra proporcionar la herramienta para dicha comparacin.
Del mismo modo en que un ancla proporciona alguna estabilidad a un barco, asi
las normas nacionales ancladas proporcionan alguna estabilidad a las
puntuaciones de prueba al anclarlas con otras puntuaciones de prueba.

Normas de subgrupos

Una muestra de estandarizacin puede segmentarse con cualquiera de los


criterios usados al inicio para seleccionar sujetos para la muestra y pueden
elaborarse normas de subgrupos para cualquiera de estos grupos definidos en
forma mas reducida.
Normas locales
Elaboradas generalmente por los mismo administradores de la prueba, las normas
locales proporcionan informacin normativa con respecto al desempeo de la
poblacin local en alguna prueba.

Sistema de calificacin grupal de referencia fija


Otro tipo de auxiliar para proporcionar un contexto para la interpretacin se
denomina sistema de calificacin grupal de referencia fija.. Aqu la distribucin de
puntuaciones obtenidas en la prueba de un grupo de individuos que la
respondieron, al que se le hace referencia como el grupo de referencia fija, se
usa como base para el clculo de las puntuaciones de prueba para aplicaciones
futuras de la prueba.

Correlacion
Es una expresin del grado y direccin de la correspondencia entre dos cosas; un
coeficiente de correlacin (r) expresa una relacin lineal entre dos variables.
Refleja el grado de variacin concominante entre la variable X y la variable Y. El
coeficiente de correlacin es el ndice numrico que expresa esta relacin, nos
dice el grado en que X y Y estn relacionadas en forma recproca.

El significado de coeficiente de correlacin se interpreta por su signo (positivo o


negativo, lo que indica una correlacin positiva o negativa) y por su magnitud
(entre mayor es su valor absoluto, mayor es el grado de relacin).

La r de Pearson
La correlacin producto- momento de Pearson, tambin conocida como el
coeficiente de correlacion de Pearson o tan solo como la r de Pearson, es la ms
usada de varias medidas alternativas de correlacion. Puede ser la herramienta
estadstica de eleccin cuando la relacin entre las variables es lineal y cuando las
dos variables que se estn correlacionando son continuas (es decir, pueden tomar
cualquier valor desde el punto de vista terico).

La rho de Sperman
La r de Pearson disfruta de un uso y aceptacin tan extendidos como un ndice de
correlacion que si, por alguna razn, no se usa para calcular un coeficiente de
correlacion, se hace mencin de la estadstica que se uso. Una estadstica
alternativa usada por lo comn es llamada en forma indistinta coeficiente de
correlacion de orden de rango, coeficiente de correlacin de diferencia de rango
o tan solo rho de Spearman. Desarrollado por Charles Spearman, un psiclogo
ingles, este coeficiente de correlacion se usa con frecuencia cuando el tamao de
la muestra es pequeo y en especial cuando ambos conjuntos de mediciones se
encuentran en forma ordinal. Se usan tablas especiales para determinar si un
coeficiente rho obtenido es significativo o no lo es.

Representaciones graficas de la correlacion


Un tipo de descripcin grafica de correlacion es la grafica de dispersin o
diagrama de dispersin.

Una grafica de dispersin tan solo es una grafica de los puntos coordinados para
los valores de la variable X. Las graficas de dispersin son tiles porque
proporcionan un indicio rpido de la direccin y magnitud de la relacin, si es que
hay alguna entre las dos variables.

Las graficas de dispersin son tiles para revelar la presencia de curvilinealidad en


una relacion.

Regresion
La palabra regresin es sinnimo de reversin a algn estado anterior. En el
lenguaje de la estadstica, regresin tambin describe una clase de regreso, un
regreso a la medida.
Capitulo 5

Confiabilidad
Una puntuacin en una prueba de capacidad refleja tanto la puntuacin verdadera
de quien responde la prueba en la capacidad que se est midiendo como tambin
el error. En su sentido ms amplio, error se refiere al componente de la
puntuacin observada en la prueba de capacidad que no tiene que ver con la
capacidad de quien responde la prueba. Si usamos X para representar una
puntuacin observada, T para representar una puntuacin verdadera y E para
representar el error, entonces el hecho de que una puntuacin observada sea
igual a la puntuacin verdadera ms el error puede expresarse como sigue:

X=T (MAS) E

Una estadstica til para para describir fuentes de variabilidad en las puntuaciones
de un aprueba es la varianza, la desviacin estndar al cuadrado. Esta estadstica
es til debido a que puede descomponerse en sus componentes .La varianza de
las diferencias verdaderas es varianza verdadera y la varianza de fuentes
aleatorias irrelevantes es varianza de error.

Fuentes de varianza de error


Las fuentes de varianza de error incluyen la construccin, administracin,
calificacin e interpretacin de la prueba.

Construccin de la prueba
Una fuente de varianza durante la construccin de pruebas es el muestreo de
reactivos o muestreo de contenido, un trmino que se refiere a la variacin entre
reactivos dentro de una prueba, al igual que a la variacin entre reactivos entre
pruebas. Considrense dos o ms pruebas diseadas para medir una habilidad,
atributo de personalidad o cuerpo de conocimiento especfico. Es seguro que se
encuentren diferencias en la forma en que se estn redactados los reactivos y
diferencias en el contenido exacto del que se ha sacado la muestra.

Administracin de las pruebas


Las fuentes de varianza de error que ocurren durante la aplicacin de la prueba
pueden influir en la atencin o motivacin de quien responde la prueba; por lo
tanto, sus reacciones ante estas influencias son la fuente de una clase de varianza
de error. Ejemplos de influencias adversas que operan durante la aplicacin de
una prueba incluyen factores relacionados con el ambiente de la prueba: la
temperatura del saln, el nivel de iluminacin y la cantidad de ventilacin y ruido.

Calificacin e interpretacin de pruebas


El advenimiento de la calificacin computarizada y una dependencia creciente de
reactivos objetivos calificables por computadora, casi han eliminado la varianza de
error causada por diferencias de los evaluadores en muchas pruebas. Sin
embargo, no todas las pruebas pueden calificarse con crculos rellenados con
lpices del numero 2. Las pruebas de inteligencia administradas de forma
individual, algunas pruebas de personalidad, pruebas de creatividad, diversas
medidas conductuales y otras innumerables pruebas todava requieren calificarse
en forma manual por personal capacitado.

Otras fuentes de error


Ciertos tipos de situaciones de evaluacin se presentan a variedades particulares
de error sistemtico y no sistemtico. Por ejemplo, considrese la evaluacin del
grado de acuerdo entre parejas respecto a la calidad y cantidad de abuso fsico y
psicolgico en su relacin. Como observaron debido a que el abuso de la pareja
por lo general ocurre en privado, solo hay dos personas que en realidad saben lo
que sucede detrs de sus puertas cerradas: los dos miembros de la pareja.

Del mismo modo que puede ser que nunca se conozca la cantidad de abuso que
sufre una persona a manos de su pareja, as puede ser que nunca se conozca la
cantidad de varianza de la prueba verdadera con relacin al error.

Estimacin de confiabilidad
Una forma de estimar la confiabilidad de un instrumento de medicin es usando el
mismo instrumento para medir lo mismo en dos puntos en el tiempo. En el
lenguaje psicomtrico, este enfoque de la valoracin de la confiabilidad se llama
mtodo de prueba y posprueba y el resultado de dicha valoracin es una
estimacin de la confiabilidad de prueba y posprueba.

La confiabilidad de prueba y posprueba es unan estimacin de la confiabilidad


obtenida al correlacionar pares de puntuaciones de las mismas personas en dos
aplicaciones diferentes de la misma prueba. La medida de prueba y posprueba es
apropiada cuando se valora la confiabilidad de un prueba que pretende medir algo
que es relativamente estable a lo largo del tiempo, como un rasgo de
personalidad.

Estimaciones de confiabilidad de formas alternas o equivalentes


Existen formas equivalentes de una prueba cuando para cada forma de la prueba
son iguales las medidas y las varianzas de las puntuaciones de prueba observada.

Estimaciones de confiabilidad de divisin por mitades


Se obtiene correlacionando dos pares de puntuaciones obtenidas de mitades
equivalentes de una sola prueba aplicada una sola vez. Es una medida de
confiabilidad til cuando es poco prctico o indeseable avaluar la confiabilidad con
dos pruebas o hacer dos aplicaciones de una prueba (debido a factores como
tiempo o costo). El clculo de un coeficiente de confiabilidad de divisin por
mitades por lo general implica 3 pasos:

Paso 1. Dividir la prueba en mitades equivalentes

Paso 2. Calcular una r de Pearson entre las puntuaciones en las dos mitades de la
prueba.

Paso 3. Ajustar la confiabilidad de la mitad de la prueba usando la frmula de


Spearman- Brown.

Medida de confiabilidad entre evaluadores


En algunos tipos de pruebas, bajo algunas condiciones, la puntuacin puede ser
ms una funcin del evaluador que de alguna otra cosa.

Es el grado de acuerdo o consistencia que existe entre dos o ms evaluadores.