Anda di halaman 1dari 81

Consideraciones sobre el resumen:

- En la medida de lo posible, he intentado mantener lo que pone en el libro literal. Aunque en algunas ocasiones he
puesto pequeas matizaciones, propias o provenientes de apuntes de otros aos.
- Se han excluido aquellos epgrafes y temas que han indicado los profesores en la gua.
- El tema 12 no est resumido pero s entra, el motivo? Dicen que lo colgarn en el ALF en pdf.
- No es un resumen de leerse la tarde antes del examen. Es un resumen amplio, con muchos ejemplos, frmulas y
dems, he querido incluir algo que no he visto en otros resmenes (obviamente, no los he visto todos), qu
significa un resultado u otro, es decir, no me he limitado a las frmulas. Esto lo he hecho para que la comprensin
sea mayor, imprescindible, a mi parecer, si se quiere llegar a comprender el qu, cmo y por qu.
- Se ha corregido el libro segn la fe de erratas que hay en el ALF.
- Si al estudiar encuentras algn fallo o errata (seguramente habrn bastantes surgidos al mecanografiar, pues el
repaso que he hecho ha sido superficial), ponlo en el grupo de Facebook, todo/as te lo agradeceremos
enormemente ( https://www.facebook.com/groups/138337692940963/).
TEMA 1.- LA ESTADSTICA EN EL PROCESO DE INVESTIGACIN PEDAGGICA EMPRICA.
1.1.- Introduccin.
Las razones que justificaran la presencia de la Estadstica en los estudios pedaggicos, se pueden agrupar en
los siguientes campos:
- Comprender los trabajos que se publican en revistas cientficas, libros, informes, etc.
- Entender los procesos implicados en la investigacin educativa que hacen posible la inferencia desde la
muestra a la poblacin y conocer las garantas que nos ofrecen estas decisiones.
- Facilitar el propio desarrollo de la investigacin socio-educativa. Ello exige que los futuros graduados
han de llevar a cabo trabajos empricos en su campo de trabajo profesional, algo que ser difcil de
abordar si no se tiene un conocimiento bsico de la estadstica.
1.2.- Concepto y funciones de la Estadstica.
El trmino estadstica se puede entender como una serie de conjuntos de nmeros como mtodo de trabajo
propio del campo emprico, como a la forma de resolver problemas educativos, e incluso, a considerarla como
ciencia.
Entendida como conjunto de datos numricos propia de los censos de personas que se ubican en un
determinado espacio fsico, podemos resear las estadsticas sobre los niveles de escolarizacin obligatoria, sobre
el acceso a los estudios superiores de los inmigrantes.
Desde el otro extremo, al considerarla como ciencia, dirige su atencin al estudio de los fenmenos aleatorios,
con este enfoque se ha conseguido avanzar en el desarrollo de mtodos, tcnicas y modelos que nos ayudan e la
resolucin de problemas pedaggicos y, sobre todo, en la toma de decisiones.
La Estadstica acta como una disciplina puente entre los modelos matemticos y fenmenos reales, que,
adems, proporciona una metodologa para evaluar las discrepancias entre la realidad y la teora.
KERLINGER (1985) define la estadstica como:
La teora y el mtodo de analizar datos cuantitativos obtenidos de muestras de observaciones, para estudiar
y comparar fuentes de variancia de fenmenos, ayudar a tomar decisiones sobre aceptar o rechazar relaciones
hipotticas entre los fenmenos y ayudar a hacer inferencias fidedignas de observaciones empricas.
Para VLEZ y otros (2006):
La estadstica es la ciencia que estudia, mediante mtodos cuantitativos, las poblaciones que se obtienen
como sntesis de la observacin de unidades estadsticas. Por lo tanto, cumple un importante papel instrumental
de apoyo a la investigacin socioeducativa: nos permite comprender las posibilidades y limitaciones de los
trabajos empricos y desarrollar un pensamiento crtico y antidogmtico en el estudio de la realidad.
MCMILLAN y SCHUMANCHER (2005) sealan que las funciones que puede desempear la Estadstica
para los pedagogos, educadores sociales o maestros, se pueden concretar en los siguientes puntos:
- Entender y criticar artculos profesionales.
- Mejorar la evaluacin del aprendizaje de los estudiantes.
- Dirigir, incluso a modo de iniciacin e informal, trabajos sencillos de investigacin, para ir
profundizando a medida que se avanza en los estudios de los grados.
- Entender las propuestas de evaluacin de programas socioeducativos del profesorado y de las
instituciones educativas y sociales.
- Ayudar a la preparacin ciudadana y como consumidor de productos tomando decisiones bien
fundamentadas en datos o argumentos cuantitativos.
- Mejorar la profesin socioeducativa, pues proporciona habilidades de comunicacin, debate, discusin
de investigaciones que tengan implicaciones para la prctica social y educativa.
As pues, la Estadstica puede aportar una primera aproximacin al campo de estudio a partir de los datos que
facilita al investigador, con posterioridad se pueden aplicar los principios derivados de la Estadstica, entendida
como ciencia, para la resolucin de problemas o para la roma de decisiones.
DOWNIE y HEATH (1983) sealan que la Estadstica nos ofrece las siguientes posibilidades:
- Permite calcular las medias aritmticas de los grupos, para comparar niveles de dominio de las variables.
- Establece el grado de dispersin o variabilidad de las observaciones y datos.
- Representar grficamente, mediante tablas y figuras, los grupos o los sujetos individuales.
- Ayuda en la transformacin puntuaciones tpicas).
- Establece relaciones entre variables y calcula el grado de relacin entre las mismas.
- Facilita el clculo de la fiabilidad y la validez de los instrumentos de recogida de datos y de medida.
- Recurre a diversas mediciones o combinacin de variables para predecir el comportamiento futuro.
- Permite extrapolar los resultados de muestras representativas a grupos ms amplios (poblaciones).
- Compara las actuaciones de dos o ms grupos y establece la existencia o no de diferencias significativas,
lo que permite comprobar qu procedimiento de trabajo ofrece mejores resultados.
De forma sinttica, las principales funciones de la Estadstica se pueden agrupar en torno a tres grandes
apartados:
- Facilitar el manejo de datos amplios y dispersos: funcin eminentemente simplificadora y descriptiva,
pretende reducir a ndices o estadsticos las caractersticas que identifican a un conjunto de datos.
- Inferir desde la muestra a la poblacin: anlisis que sigue el investigador para extrapolar los resultados
obtenidos. Hablamos de la generalizacin de los resultados de muestras, cuando stas cumplen los
requisitos de suficiencia y representatividad. Es decir, desde los estadsticos (proceden de muestras) se
pueden estimar los parmetros (medidas de poblacin)
- Ayudar en la toma de decisiones. Tanto desde los meros anlisis descriptivos de grupos como el anlisis
de los valores crticos que ponen de relieve la existencia de diferencias significativas entre los grupos de
tratamiento. En ambos supuestos se trata de incorporar cambios en las actuaciones educativas que
redunden en mejoras de las formas de actuacin en el campo socioeducativo.
1.3.- Tipos de Estadstica.
La presencia de la Estadstica no nos asegura la calidad de la investigacin, pero s se acepta como lenguaje
universal, aunque su significado se deriva del propio diseo de la investigacin.
Para la resolucin de problemas educativos, podemos identificar dos grandes tipos, segn las tareas a las que
debe enfrentarse, la descriptiva y la inferencial.
1.3.1.- Estadstica descriptiva.
A esta modalidad de Estadstica se le asocian los procesos de anlisis que se llevan a cabo con los datos
empricos recogidos en las muestras, en lneas generales este proceso concluye con la observacin de unos valores
numricos que reciben la denominacin de estadsticos. Transforma un conjunto de nmeros u observaciones en
ndices que sirven para describir o caracterizar esos datos dentro de los grupos de sujetos.
La podemos considerar como una parte de la Estadstica que se ocupa del estudio de los mtodos y tcnicas
necesarios para la descripcin grfica y numrica de los conjuntos de datos numerosos. Ello nos ofrece una visin
global del grupo de sujetos que es objeto de estudio. Esta propuesta tiene limitaciones en la interpretacin de los
estadsticos, pues en muchas ocasiones nos debemos centrar en una comparacin entre el valor de la muestra y
otros que procedan de muestras similares, por lo que no aporta suficientes argumentos cientficos al investigador
en la toma de decisiones sobre los grupos.
La Estadstica descriptiva es aquella parte de la Estadstica que utiliza estadsticos procedentes de muestras
o de poblaciones con una finalidad eminentemente descriptiva o informativa de las mismas. As pues, realiza una
tarea de sntesis y descripcin de las caractersticas de uno o ms conjuntos de datos, lo que refleja su propia
naturaleza. El uso de la misma es la forma ms adecuada para resumir los datos y resulta indispensable para
interpretar los resultados de los trabajos empricos.
En esta lnea de anlisis sobre Estadstica descriptiva, FOX (1981) seala cinco funciones principales:
- Conocerlos estadsticos o caractersticas esenciales de un conjunto de datos.
- Interpretar lo que nos dicen los estadsticos muestrales sobre los parmetros o medidas de poblacin de
la que se extrajo la muestra.
- Conocer la existencia, el sentido y la magnitud de la relacin entre dos variables.
- Utilizar los estadsticos procedentes de muestras para conocer las tendencias en el comportamiento de
nuevos grupos de sujetos.
Segn la naturaleza o caractersticas de las muestras y los datos se puede diferenciar entre:
- Estadstica descriptiva univariada (Intenta descubrir y analizar una distribucin de datos que provienen
de la medicin de una variable en una muestra).
- Estadstica descriptiva bivariada (dos variables).
- Estadstica descriptiva multivariada (ms de dos variables).
1.3.2.- Estadstica inferencial.
Pretende avanzar mas en el estudio de la realidad socioeducativa, pues le corresponde decidir sobre aquellas
cuestiones no resultas por la descriptiva; as, trata de extrapolar los resultados que se han obtenido en muestras a
las poblaciones respectivas de las que proceden. En este sentido podemos afirmar que se ocupa de los mtodos
estadsticos que nos sirven para realizar inferencias objetivas sobre los datos disponibles y trasladarlos a grupos
ms amplios. Se emplea para realizar predicciones sobre la similitud de una muestra con la poblacin de la que
fue extrada, por lo tanto, se ocupa de los mtodos que son precisos para establecer conclusiones sobre una
poblacin a partir de una muestra de la misma.
La Estadstica inferencial tiene por finalidad la obtencin de una serie de conclusiones sobre algn aspecto o
variable presente en una poblacin a partir de las observaciones de comportamientos en una o varias muestras.
Los valores de la poblacin (parmetros) nos permiten conocer el fenmeno socioeducativo en muestras amplias,
adems de resolver y fijar las hiptesis, plantear leyes y tomar decisiones con rigor cientfico, valorando en estos
casos los mrgenes de error con los que realizamos nuestras afirmaciones (nivel de confianza).
Hemos de tener en cuanta que en el marco de la investigacin socioeducativa, las decisiones que se toman no
se pueden realizar en trminos de certeza, sino de probabilidad, por lo que en esas estimaciones debemos fijar los
mrgenes de error en nuestras afirmaciones que suelen ser de 0.05 y 0.01 (en trminos de porcentajes, del 5% y
1%); que llevan asociados los corespondientes niveles de confianza, complementarios a los anteriores,
generalmente expresados en porcentajes: 95% y 99% respectivamente.
La inferencia nos ayuda en la roma de decisiones sobre la aceptacin o el rechazo de las relaciones prevista en
la hiptesis (posible solucin del problema), aunque estas decisiones suelen matizarse con la fijacin del margen
de error. Debemos ser prudentes en la aplicacin prctica, pues en el campo educativo se presentan otros factores
no suficientemente planificadas que pueden distorsionar los resultados finales.
Entendemos que son dos los grandes campos que forman la Estadstica inferencial:
- La estimacin de parmetros: se puede llevar a cabo mediante la eleccin de un solo valor de la muestra
que se transforma en parmetro (estimacin puntual) o a travs de unos lmites entre los cuales se espera
se encuentre el verdadero valor del parmetro (estimacin por intervalos), en este caso debemos ser
conscientes de que esos lmites vienen influenciados por los errores aleatorios y los sistemticos.
- Contraste de hiptesis: consiste en probar mediante datos empricos las hiptesis que se planean en el
proceso de investigacin, de tal forma que son los datos los que deben ofrecer una respuesta a los
planteamientos iniciales del investigador y no al revs, pues se violaran el sentido de la ciencia. Como
deca Kerlinger deca: demos oportunidad a los datos de mostrar que los cambios en los comportamientos
son achacables a las tesis iniciales.
1.4.- El papel de la Estadstica en el proceso de investigacin.
La Estadstica descriptiva aporta informacin que puede servir de base para trabajos posteriores y anlisis ms
complejos que entran en el cometido de la Estadstica inferial.
Los datos recogidos deben responder a una hiptesis u objetivos previamente planteados, pues las tablas y
grficos no significan nada en s mismas, si no existen garantas de su representatividad, del control de variables
que es preciso tener en cuenta y la eleccin de los instrumentos ms adecuados. Por ello, queremos poner
de relieve el papel de la Estadstica en cada una de las fases del proceso, pues as quedarn delimitadas las
posibilidades y limitaciones de cada una de las propuestas de estudio en el campo socioeducativo.
1.4.1.- En el problema de investigacin.
El punto de arranque de toda propuesta de investigacin se ubica en la identificacin y seleccin del
problema, en estos momentos debe estar presente la Estadstica, no como clculo de estadsticos, sino como
garanta para poder establecer relaciones entre las caractersticas que se analizan; ello se lleva a cabo mediante
diversos modelos estadsticos, desde ellos buscamos si existe alguno que permita la resolucin del problema o
bien, si se pudieran aplicar varios, seleccionar aqul que es ms adecuado en funcin de unos criterios fijados.
As, cuando procedemos a analizar el problema y sus caractersticas identificativas se pondrn de manifiesto
las variables que intervienen en esos procesos, cmo actan en el contexto de la investigacin, qu datos de la
variable dependiente necesitan ser recogidos, qu calidad tiene la informacin, qu pruebas estadsticas es preciso
aplicar. En suma se trata de identificar si existe un modelo estadstico capaz de ofrecer una respuesta adecuada a
ese problema.
Si el investigador no completa estas sugerencias se puede encontrar ms adelante con un camino sin salida.
En sntesis podemos afirmar que es la estadstica la que nos permitir afirmar que el problema cumple una
condicin inexcusable en su formulacin que sea resoluble, es decir, que en los datos que se puedan recoger en un
futuro sea posible alcanzar las respuestas esperadas.
1.4.2.- En la formulacin de hiptesis y objetivos.
Cuando el investigador formula su hiptesis o enumera sus objetivos se le exige que las hiptesis sean
contrastables y los objetivos comprobables. Ello ser posible si disponemos de una serie de instrumentos de
recogida de datos que nos ofrezcan una informacin ntida y detallada sobre ese problema que nos ocupa y cuya
solucin se adelanta en la hiptesis.
Referido al tipo de hiptesis nos permite conocer qu estadsticos deben ser calculados, qu anlisis son
necesarios en ese problema. Tambin nos ayuda a determinar si la hiptesis que se plantea ha de ser unilateral o
bilateral, es decir, el sentido de la hiptesis de investigacin. Adems nos ofrece argumentos para seleccionar la
modalidad de anlisis estadstico que es el ms adecuado para la validacin o comprobacin emprica de esa
hiptesis.
En el supuesto de las hiptesis planteadas sobre la existencia o no de diferencias entre los grupos, es preciso
recurrir a las pruebas estadsticas de contraste que nos permitan decidir sobre la significacin estadstica o no de
esas diferencias. Esta eleccin viene condicionada por los conocimientos que sobre el tema de estudio posee el
investigador; as en la gran mayora de los casos nos decantamos por plantear hiptesis bilaterales (existirn
diferencias entre los grupos); mientras que cuando existen otros trabajos debidamente contrastados, o bien que
responden a teoras previas se pueden formular hiptesis unilaterales (se decantan por una de las opciones). Una
eleccin u otra de las hiptesis van a atener repercusiones en la bsqueda de los valores tericos o crticos de
distribucin del correspondiente estadstico. Con ello buscamos la existencia de diferencias significativas y no
meramente aleatorias.
Si la hiptesis se decanta por establecer el valor predictivo de una prueba sobre otra, nos estamos refiriendo a
los valores que alcanzar la correlacin, medidos en tiempos diferentes (validez predictiva). Desde esta
formulacin ser preciso determinar la funcin predictiva del coeficiente que se traslada a las correspondientes
frmulas derivadas de la regresin. Se trata de ofrecer el peso relativo de las variables independientes sobre la
dependiente mediante las ecuaciones de regresin lineal.
1.4.3.- En el control de variables extraas.
En la investigacin de naturaleza cuantitativa, uno de los elementos clave consiste en alcanzar un buen control
como medio que nos permita asegurar la validez de los resultados alcanzados. Se trata de llegar hasta donde sea
posible, respetando al objeto de estudio (la persona), para evitar la contaminacin de los resultados. Debemos
partir de la base que este control no ser equiparable al que se puede lograr en el mbito de las ciencias fsico-
naturales y, en general, en las ciencias experimentales.
Entre las diversas formas de control que tenemos en la investigacin en educacin hay algunas que apenas
guardan relacin con la estadstica (trabajar solamente con sujetos de un solo sexo, elegir un diseo determinado);
pero hay otras de naturaleza estadstica como pueden ser el tomar unos determinados valores en la variable
independiente, formar parejas o bloques de sujetos que puntan de forma similar en una prueba previa. En estos
supuestos la Estadstica nos aporta los anlisis pertinentes para a seleccin de sujetos en funcin de esas
caractersticas de control.
Garantizar el control en los procesos de investigacin emprica supone que se aslan o minimizan los efectos
de las covariaciones y la influencia de las variables extraas que pudieran llegar a ofrecer explicaciones
alternativas a las buscadas por el investigador. El hecho de poder cuantificar estos pesos relativos nos permitir
realizar afirmaciones con la suficiente validez y rigor en el campo socioeducativo.
1.4.4.- En la definicin de las variables.
En el caso de la investigacin emprico-experimental, en el que la hiptesis establece una relacin de
dependencia o de causalidad entre las variables, de tal forma que el investigador cuando formula sus hiptesis u
objetivos est indicando la relacin entre aquellas variables sobres las que interviene y modifica y aquella o
aquellas que recogern los efectos de esa intervencin. Ej.: As podemos establecer que la motivacin que reciben
los estudiantes (variable independiente Vi), influir de forma positiva sobre el rendimiento alcanzado en una
determinada asignatura (variable dependiente VD), rendimiento obtenido despus de la intervencin.
En la investigacin socioeducativa la Estadstica se manifiesta en la medicin de las variables que intervienen
en el proceso. Para determinar la fiabilidad y la validez de los instrumentos de recogida de datos y de medida es
preciso recurrir a la Estadstica, que mediante las oportunas frmulas nos garantiza la medida precisa de esas
variables y la forma en que se debe proceder a su medida y valoracin.
En ocasiones, las variables son constructos (cualquier entidad hipottica de difcil definicin dentro de una
teora cientfica) que no admiten una medida directa, por lo que es preciso definir conductas operativas y medibles
que nos indiquen el valor real de las mismas en el contexto de la investigacin socioeducativa. Esta operacin se
conoce como la definicin operativa de las variables y en ella la Estadstica desempea un cometido fundamental.
Dado que no podemos hablar en trminos de certeza, es conveniente reflejar en los trabajos empricos que los
datos obtenidos de la medida de la variable pueden estar sujetos a variaciones provocadas por mltiples factores y
que puede tener unas repercusiones sobre la investigacin y las aplicaciones de los resultados a la prctica real.
1.4.5.- En el contraste de hiptesis o comprobacin de objetivos.
El contraste de hiptesis o la comprobacin de objetivos es uno de los momentos importantes del proceso de
investigacin, donde se pone de manifiesto de forma explcita la utilizacin de la Estadstica. Si en las fases
anteriores actuaba de forma latente o de apoyo al proceso, en esta fase nos ayuda a resolver y a analizar los datos
recogidos en la investigacin.
Los modelos estadsticos generados por los datos sern sometido a prueba mediante los estadsticos ms
adecuados a esas caractersticas.
La Estadstica nos ofrece una amplia gama de pruebas estadsticas, cuya seleccin queda en manos del
investigador, si bien, debe basarse en el rigor y la veracidad de los datos, pues no todas las pruebas sirven para
todos los cometidos, aunque el uso de la informtica y los paquetes estadsticos de anlisis de datos nos puedan
ofrecer salidas, la utilizacin de una prueba debe quedar en manos del investigador, no del informtico, ste nos
puede ayudar y facilitar herramientas de clculo, mientras que los investigadores debemos conocer estas pruebas
y, sobre todo, ser capaces de interpretar las salidas del ordenador.
1.4.6.- En la decisin estadstica.
La fase anterior concluye con la obtencin del denominado valor emprico del estadstico correspondiente,
que ser diferente segn la prueba estadstica que se haya seleccionado (t, z, F, U...) y que ha de ser
interpretado, de tal forma que el investigador pueda concluir que las diferencias entre los grupos son diferencias
entre los grupos son reales y no meramente aleatorias, o que esas diferencias no son explicables por efecto del
azar.
Esa interpretacin consiste en decidir si la hiptesis de nulidad (H 0) se rechaza y, por consiguiente, se acepta
la hiptesis alternativa o hiptesis del investigador (H i); esta decisin se hace fijando unos niveles de confianza o
unos mrgenes de error.
La regla general asociada al contraste de hiptesis y la decisin estadstica nos dice que: cuando el valor
emprico del estadstico es mayor que el valor terico o crtico se rechaza H 0 , ello supone aceptar que las
diferencias encontradas son estadsticamente significativas (aunque esta regla general tiene sus excepciones).
Esta fase es fundamental en el desarrollo de la investigacin pedaggica emprica en el campo socioeducativo,
pues nos permite garantizar que los cambios producidos por la intervencin del investigador sobre la variable
independiente (VI ) ha producido sus frutos y podr ser recomendada en el futuro en contextos o simulaciones
similares a la estudiada.
1.5.- La Estadstica y su relacin con las Ciencias Sociales.
El desarrollo de la Ciencias Sociales en las ltimas dcadas no se puede entender sin el importante papel que
ha desempeado la Estadstica en esta tarea. As su origen se encuentra unido al inters de los investigadores y
cientficos por cuantificar los diferentes aspectos sociales de los grupos o comunidades. En este punto queremos
poner de relieve los diferentes mbitos de las Ciencias Sociales en que acta y aporta sus conocimientos la
Estadstica. Estos son:
- Educacin: vinculaciones estrechas que existen entre la Estadstica y la investigacin pedaggica
emprica.
- Psicologa: los estudios de naturaleza psicolgica han contribuido al desarrollo de algunas tcnicas
estadsticas como el anlisis factorial.
- Sociologa: el estudio de los fenmenos y las relaciones sociales forman el cometido principal de la
Sociologa.
- Economa: su cometido consiste en el manejo de datos numricos. Para su interpretacin y valoracin es
preciso emplear los mtodos estadsticos.
- Demografa: se ocupa del estudio de la poblacin. Importante papel de la Estadstica para perfilar y
desarrollar esta tarea.
- Administracin pblica: conocimientos obtenidos mediante el apoyo de la Estadstica para abordar una
planificacin de las actuaciones que son ms necesarias en cada zona.
- Humanidades: la Estadstica aporta mtodos ms rigurosos y contrastados en los campos de estudio
propios de las humanidades.
- Ciencias Jurdicas: uno de los campos del derecho en que nos encontramos alguna de las aplicaciones de
la Estadstica es el de la Criminologa, en los estudios de prevencin de delitos.
1.6.- Posibilidades y limitaciones de la Estadstica.
La Estadstica es una ciencia instrumental de apoyo a la investigacin, ello no lleva consigo que servir para
resolver todos los problemas que aquejan al campo de estudio que nos ocupa. Nos permite el manejo de datos y
nos facilita su anlisis e interpretacin, pero si la calidad de stos no es la adecuada se puede cuestionar la validez
de las conclusiones.
La Estadstica nos ayudar en la decisin de rechazar las hiptesis de nulidad (H 0) pero sin un buen control
sobre las variables extraas, podemos estar considerando que los cambios generados son achacables a una variable
independiente (Vi), cuando en realidad han sido otros factores o variables no controladas las que han generado los
cambios.
La Estadstica a travs de los paquetes de anlisis de datos es ciega y puede emplear diferentes procedimientos
de clculo, pero el investigador es el que debe tomar la decisin en elegir unas y descartar otras, para que los
resultados finales de los trabajos empricos sean vlidos en la toma de decisiones.
TEMA 2.- PROBLEMA, HIPTESIS/OBJETIVOS, VARIABLES Y DATOS. NIVELES DE MEDIDA.
2.1.- Introduccin.
Una vez enmarcado el papel de la Estadstica dentro del proceso general de la investigacin en educacin,
como ciencia instrumental de apoyo a la investigacin, es el momento de abordar de forma ms detallada los
aspectos fundamentales que nos ayuden a comprender mejor los puntos bsicos de este proceso.
2.2.- El problema de la investigacin.
El problema constituye el punto de partida de toda investigacin, en concreto se manifiesta cuando nos
planteamos una pregunta, un interrogante, alguna duda sobre diversas cuestiones relacionadas con la educacin a
las que no podemos dar una solucin satisfactoria. En la gran mayora de los casos se parte de una idea general
que despus se va perfilando hasta llegar a configurar el problema concreto de investigacin.
La aparicin de un problema para el que no encontramos una respuesta satisfactoria, viene condicionada por:
- La existencia de una laguna notoria en los resultados de otras investigaciones que hace que las
aportaciones no sean suficientes.
- La no concordancia entre los resultados aportados por diferentes trabajos, pues las soluciones parecen no
coincidir cundo existen muestras de sujetos diferentes.
- La existencia de un hecho para el que no tenemos una adecuada explicacin y resulta difcil su
comprensin en el contexto de actuacin.
Un aspecto importante a tener en cuenta es el de proponer investigaciones sobre problemas pertinentes ara
corroborar los supuestos de la propia teora y cubrir aquellos huecos y lagunas que se detecten en su estructura. Es
fundamental contemplar su concepcin desde una visin apropiada y con una perspectiva poco limitada, para
poder percibir su globalidad.
La caracterstica fundamental de los problemas que nos podemos plantear en el campo socioeducativo
consiste en la posibilidad de su resolucin; es decir, en la investigacin emprica no cabe la opcin de plantear
problemas de ndole moral y espiritual que entran dentro del ser de la persona; al contrario, se deben formular
problemas sobre los cuales podamos estudiar comportamientos, analizar hechos y evaluar resultados.
2.2.1.- Definicin y eleccin del tema de investigacin.
Segn GARCA DE LA FUENTE (1994), en el momento de elegir el tema sobre el que se va a trabajar,
influyen dos tipos de elementos:
- Subjetivos: relacionados con la personalidad, preparacin cientfica en un determinado campo y el
conocimiento de otros idiomas. Es necesario que el tema sea elegido de forma libre por el investigador y
que se sienta identificado con el mismo, adems debe tener una preparacin previa que le permita un
desarrollo fundamentado del mismo. Es preciso tener un nivel adecuado en las lenguas extranjeras, sobre
todo ingls o francs, para poder recopilar informacin. Es interesante que el problema mantenga vnculos
con la actividad profesional actual o de futuro y tener un buen manejo de las nuevas tecnologas.
- Objetivos: relacionados con la posibilidad real de acceso a los campos de investigacin, es decir, el
investigador debe tener la posibilidad de acceso a las fuentes documentales, si realmente existe
informacin sobre el problema y dnde se puede encontrar, la posibilidad de traslado si as lo exige la
investigacin. Todo ello implica que no se podra estudiar en profundidad un tema si no existe la
posibilidad de traslado a la zona donde ocurren los hechos.
La caracterstica bsica de todo problema es la posibilidad de resolucin. La resolutibilidad exige formular
problemas en los que se puedan estudiar comportamientos y evaluar resultados de forma analtica, aspecto ste en
el que la Estadstica nos va a apuntar si el problema es resoluble en el marco de la investigacin emprica.
Conseguir una buena formulacin de un problema supone tener muy avanzada su posible solucin, por eso
KERLINGER (1985) indica que una gran parte de la solucin reside en saber qu es lo que se intenta hacer. Se
suele aceptar que un buen planteamiento es la mitad de la solucin. FOX (1981) seala que de la existencia de la
idea original o impulsora del problema se debe pasar a realizar una primera revisin de la bibliografa relacionada
con el mismo, para, con estos datos, pasar a definir de forma ms precisa el problema de investigacin, lo que
podramos identificar con la formulacin operativa del problema.
2.2.2.- Estructura y caractersticas del problema.
Para completar la visin del problema, hemos de indicar una serie de caractersticas. Siguiendo las directrices
de Hernndez Pina (1998), se pueden concretar en las siguientes:
- Factible: nos indica que existen medios apropiados para investigar sobre l y stos puedan ser empleados
por el investigador.
- Claro: se entiende que todos los trminos incluidos en la formulacin estn perfectamente definidos y
son comprensibles, tanto para el investigador como para el sujeto que es objeto de investigacin.
- Significativo: nos indica el nivel de importancia del problema para la comunidad educativa en la que se
lleva a cabo. Supone una valoracin del problema en un contexto determinado, establecer orientaciones y
tomar decisiones de mejora en grupos ms amplios, llegar a establecer generalizaciones y producir teoras
- La formulacin de la pregunta debe reflejar la descripcin, la asociacin o la intervencin. Segn la
propuesta concreta que se formule se va a orientar la posible resolucin. Los pasos a seguir van a tener
unas diferencias apreciables en cada una de las situaciones de investigacin.
El origen de los desencadenantes y las causas de los problemas pueden ser diversos; se parte, 0en general, de
los hechos ms prximos que nos preocupan.
Por ejemplo, cuando nos cuestionamos sobre algn aspecto de algn trabajo cotidiano que demanda nuestra
atencin y una adecuada explicacin o deseamos adquirir un conocimiento ms preciso de los factores que estn
actuando sobre los hechos; en suma, cuando nos formulamos algn interrogante importante, estamos poniendo las
bases para la identificacin de un problema relevante.
Tambin puede surgir de las propias vivencias personales o profesionales, de la experiencia cientfica propia o
ajena, del estudio, de la lectura de temas, de reuniones de trabajo... En todos los casos se nos presenta una
cuestin a modo de desafo, que mueve nuestro inters y nos invita a buscar una solucin.
Por ello, la investigacin situada fuera de los contextos de problemas reales no contribuye a su superacin, al
contrario, acta como traba de la misma, dada la visin, en no pocas ocasiones fragmentada, del problema. No
obstante, cuando existe una intervencin directa en la accin hay mayores posibilidades de captar el problema en
toda su plenitud, de forma ms real.
As, debemos exigir al problema como caracterstica fundamental el que sea resoluble, es decir, que se puedan
recoger datos empricos sobre el mismo que permitan ofrecer una respuesta adecuada a ese interrogante.
Reconocer que la realidad es bastante m compleja que una simple formulacin didctica de un problema. A modo
de ejemplo:
- Cul es el nivel de participacin de los estudiantes en la clase de Matemticas en un aula de
Bachillerato en el centro X? (Investigacin basada en la observacin).
- Qu opinan los profesores sobre la reforma de las enseanzas humansticas? (Investigacin por
encuesta).
- Cules son las variables que inciden de forma ms significativa en el rendimiento de los estudiantes de
la UNED? (investigacin correlacional).
- Qu mtodo de aprendizaje sera ms eficaz en la enseanza a distancia en Teora de la Educacin?
(Investigacin experimental o cuasiexperimental) Segn el nivel de control establecido en la propuesta.
- Qu caractersticas definen personal y profesionalmente a los estudiantes del primer curso de
Educacin Social en la UNED? (Investigacin descriptiva).
Debemos ser conscientes de que plantear un problema y optar por su desarrollo supone un proceso de
seleccin sobre aquellos temas en los que estamos interesados, adems, exige excluir otras propuestas, pues si este
tema es muy amplio puede ocurrir, lo que indica el saber popular: que los rboles no nos permitan ver el
bosque. De hecho, la inmensa mayora de los autores consultados sealan que es recomendable volver a
reformular el problema de investigacin una vez hayamos realizado la tarea de anlisis sobre el estado de la
cuestin del tema objeto de estudio.
2.2.3.- Criterios para la evaluacin de problemas de investigacin.
Una vez planteado el problema en sus trminos ajustados a la realidad educativa, sera interesante proceder a
una primera valoracin, tanto en lo que hace referencia al marco terico como a las posibles implicaciones
prcticas y las conexiones con otros trabajos de investigacin. Por tanto, podemos sealar, entre otros, los
siguientes criterios:
- Viabilidad: esta condicin enlaza de forma directa con la posibilidad de resolucin del problema, el
investigador debe cuestionarse si el problema que se ha planteado es adecuado al contexto educativo y se
puede abordar con los medios disponibles, tanto personales como materiales.
- Inters: que tiene el tema para el investigador, el equipo y la persona, autoridad o grupo que encarga el
trabajo; lo que lleva consigo un nivel de implicacin personal, adems e la implicacin de la comunidad
educativa y, a ms largo plazo, de la comunidad cientfica.
- Relevancia terica y prctica: pues la informacin suministrada puede contribuir al aumento de los
conocimientos sobre un determinado campo y a conducir a la toma de decisiones de mejora que
repercutan sobre la persona y la sociedad.
- Coherencia: el problema debe enmarcarse dentro de propuestas generales de investigacin en el campo
educativo y procurar no estar al margen de otras consideraciones de tipo personal que puedan invalidad
las aportaciones a la comunidad.
- Adecuacin al contexto: un tema excesivamente genrico presenta dificultades a la hora de intentar
ofrecer una respuesta coherente vinculada al contexto socio-educativo en que debe ponerse en prctica.
Este criterio es muy relevante en la denominada investigacin aplicada.
- Otros aspectos: se relaciona con su presentacin minuciosa, con un lenguaje claro y conciso, sin adornos
externos, adems de estar enmarcad en mbitos concretos de actuacin.
Con esta enumeracin se ofrecen una serie de pautas para poder valorar de forma precisa los diferentes
problemas con que se ha de enfrentar el profesional de la educacin, de forma que sea factible llevar a cabo su
estudio detallado en el campo emprico.
2.3.- La revisin de fuentes y el estado de la cuestin.
Una vez planteado el problema objeto de investigacin, es necesario efectuar una serie de consultas a
diferentes fuentes para conocer qu se ha dicho y cmo, sobre ese tema que se trata de investigar; necesitamos
saber si ya se ha solucionado en otras investigaciones y con qu resultados o, por el contrario, necesitamos
abordarlo desde la novedad.
Para FOX (1981) debemos diferenciar entre la denominada bibliografa de la investigacin (informes sobre
trabajos ya realizados, con aportaciones de datos empricos, orientaciones y sugerencias, recomendaciones,
limitaciones...) y la bibliografa de tipo conceptual (referida a los textos, artculos, libros, informes, opiniones y
sugerencias).
Esta consulta vendr condicionada por el nivel de conocimiento previo que tenga el investigador sobre el
tema. Ante un tema novedoso debemos partir de un estudio sobre la bibliografa conceptual, para avanzar hacia los
documentos de los estudios empricos. En el caso de un tema conocido debemos ser ms selectivos en la revisin
y dirigir la bsqueda hacia campos concretos y especficos, donde primar la bibliografa de investigacin.
Los soportes de la informacin se diversifican y multiplican sin cesar, por lo que resulta esencial conocer
cmo obtener y utilizar la documentacin, tanto de carcter textual, como de naturaleza audiovisual e informtica.
En las circunstancias actuales, resulta mas interesante conocer las vas de acceso a la informacin que una
acumulacin indiscriminada de conocimientos.
2.3.1.- Fuentes y bases de documentacin.
Para los profesionales de la educacin es fundamental el conocimiento sistemtico de las fuentes de
informacin, ya sean documentos o centros dedicados de forma exclusiva o parcial a la labor de documentar e
informar en materia educativa, en este sentido se pueden clasificar en dos grupos:
- Fuentes bibliogrficas: centradas en los textos escritos a los que se acude para recabar a informacin
sobre el problema de investigacin:
Obras generales: recopilaciones amplias que se recogen en diccionarios, enciclopedias,
manuales y anuarios, thesaurus.
Publicaciones bibliogrficas peridicas. Ligadas a diversas instituciones y organismos
pblicos o privados. Boletines bibliogrficos, ndices y abstracts.
Revistas de Investigacin especializadas. Especializadas en publicar trabajos tericos o
empricos sobre temas diversos.
- Fuentes no bibliogrficas:
Recursos tecnolgicos informticos: las herramientas informticas que dispone el
investigador son bsicas en las diferentes fases del desarrollo de los trabajos. Diferentes
bases de datos, correo electrnico, los buscadores, revistas electrnicas...
Centros de Investigacin en Educacin: existen una gran cantidad de instituciones y
centros dedicados a la investigacin en el campo educativo. As el IBE (Directory of
educational Research Institutions) recoge en su ndice una gran cantidad de estos centros
repartidos por todo el mundo. En muchos casos aparecen vinculados a las universidades,
la Administracin o entidades y asociaciones que se ocupan de la investigacin.
Centros de Documentacin: son centros especializados en un mbito determinado. CSIC
(Consejo Superior de Investigaciones Cientficas), ISOC (Instituto de Informacin y
Documentacin en Ciencias Sociales), etc.
Asociaciones de Investigacin en Educacin: se trata de asociaciones dedicadas a la
investigacin en el campo educativo. Para la difusin de sus trabajos suelen recurrir a
revistas en formato papel y electrnico. Por ejemplo AIDIPE Asociacin
Interuniversitaria de Investigacin Pedaggica) que edita la Revista de Investigacin
Educativa (RIE).
2.3.2.- Criterios de valoracin de la informacin recogida.
La revisin de fuentes debe reflejarse por escrito en los correspondientes informes de investigacin, para ello
es preciso reelaborar las conclusiones de forma crtica y personal, para hacerla comprensible a la comunidad
cientfica. Solamente las aportaciones trascendentes y que supongan un avance apreciable en el estudio del
problema analizado procede su cita textual. Por ello, estimamos que para valorar la informacin recogida se deben
tener en cuenta los siguientes criterios:
- Relevancia.
- Claridad.
- Actualidad. Acudir a las citas ms prximas en el tiempo, ello no exime de citar estudios relevantes del
pasado.
- Adecuacin (es preciso que la informacin mantenga una estrecha relacin con el problema y aporte
datos para facilitar su resolucin y el enfoque ms apropiado segn los objetivos fijados en el trabajo)
- Contextualizada (sera interesante que los contextos en que se desarrolla la investigacin de referencia
sean similares a los que nos vamos a encontrar en nuestro trabajo. No resulta fcil, pues las circunstancias
cambian de forma constante, sin olvidarnos de las situaciones personales de los grupos, que no pueden
detener su evolucin.
2.4.- Hiptesis y objetivos de la investigacin.
Una vez concretado el problema y revisadas las fuentes, el investigador est en condiciones de aventurar
posibles soluciones al mismo, nos referimos a las hiptesis, que vienen a representar el enlace entre las variables
que se analizan. El trmino hiptesis, en sentido estricto, se debe circunscribir a la investigacin de tipo
experimental y cuasiexperimental, si bien, tambin se usa en algunos supuestos para probar el establecimiento de
relaciones causales entre las variables.
En la mayor parte de las investigaciones se suele emplear el trmino hiptesis directiva, si bien, algunos
autores prefieren hablar de objetivos de investigacin, pues sern los que nos permitan establecer a posteriori,
posibles relaciones y dependencias entre las variables estudiadas. Hemos de tener en cuenta que los objetivos
tienen un carcter ms descriptivo, mientras que las hiptesis buscan la relacin causan entre las variables.
2.4.1.- Concepto y naturaleza de las hiptesis.
Hiptesis: es una proposicin o conjunto de proposiciones no demostradas, cuyo anlisis puede llevar a una
conclusin lgica; es un medio o una aporte de cualquier investigacin y estudio, una explicacin razonable
sobre el tema a tratar, que debe ser sometida a comprobacin emprica.
Para VAN DALEN y MEYER (1992) son posibles soluciones del problema, que se expresan como
generalizaciones y proposiciones; por su parte KERLINGER (1985) la define como una expresin conjetural de la
relacin entre dos o ms variables. Siempre suelen aparecer en forma de oracin aseverativa y relaciona de
manera general o especfica una variable con otra. HERNNEZ PINA (1998) nos indica que son conjeturas,
proposiciones o especulaciones que el investigador ofrece como respuesta a su problema de estudio.
Bunge (1981) nos indica que se deben reunir tres requisitos en la formulacin de hiptesis cientficas:
- Tiene que ser bien formada y significativa.
- Fundada, en alguna medida, en los conocimientos previos
- Ser empricamente contrastable mediante diversos procedimientos.
Se desprende que las dos notas que identifican una buena formulacin de hiptesis son:
- Que estn bien fundamentadas: exige una profunda revisin de las fuentes, adems de una teora
subyacente. Tambin se les pide verosimilitud o congruencia con las leyes naturales.
- Que sean contrastables empricamente: es preciso que sea contrastable mediante procedimientos
empricos y que ste sea pblico e intersubjetivo. Si una explicacin no se puede formular como una
hiptesis contrastable, se debe considerar como una explicacin de tipo metafsico y, por tanto, no
susceptible de investigacin cientfica.
A estas condiciones cabra aadir que deben establecer relaciones causales entre las variables, de un lado las
antecedentes sobre las que interviene el investigador y de otro las consecuentes, que son las que reciben los
efectos de esa actuacin. Adems, es preciso que las hiptesis sean claras y sencillas en su formulacin, pues de lo
contrario no guiarn de forma apropiada el proceso.
En resumen, las hiptesis son los elementos directivos de la investigacin cientfica, pues nos indican qu
buscamos, qu variables se deben observar, medir y manipular; as como sobre la realizacin de la observacin,
la experimentacin y el anlisis de datos. Por tanto, es preciso que las hiptesis se formulen previamente a la
recogida de datos, pues si fueran stos quienes justificaran a las hiptesis se estara violando gravemente el rigor
cientfico exigible a esta metodologa.
Existe una relacin estrecha entre el problema que se pretende investigar y las hiptesis a contrastar o los
objetivos a comprobar. As el problema plantea el interrogante que pretende resolver el investigador, tras la
realizacin de la consulta a las fuentes, se est en disposicin de formular operativamente los objetivos de la
investigacin (en las propuestas de investigacin descriptiva y correlacional) o bien las hiptesis que deben ser
validadas empricamente a lo largo del proceso.
En algunas investigaciones nos encontramos con los trminos:
- Objetivo o Propsito general: se refiere al marco general de la investigacin sealando lo fundamental
del trabajo.
- Objetivos operativos: se recogen de forma ms concisa los puntos principales, de tal forma que se
expresan las tareas que se debe realizar el investigador. Por ello, en su redaccin debemos ser cuidadosos
y redactarlos en forma expositiva y afirmativa, evitando los interrogantes y las dobles negaciones.
Adems conviene indicar que las hiptesis recogen en sus enunciados la existencia de diferencias o
relaciones entre las variables, en cambio los objetivos se dirigen hacia el campo de las descripciones e
implicaciones.
2.4.2.- Diferentes tipos de hiptesis.
Para clasificar las hiptesis de investigacin en educacin se pueden tener en cuenta diferentes criterios, que
no deben ser excluyentes sino complementarios, pues nos ayudan a enmarcar de forma ms precisa la propuesta
investigadora:
Clasificacin de hiptesis:
- Segn la posibilidad de generalizacin:
Existenciales: establecen relacin entre dos o ms variables para al menos un caso (ej: los
estudiantes que empleen el mtodo X en el centro Y obtienen mejores resultados que los que no lo
utilicen).
Universales: vlidas para todos los casos, prcticamente imposible en el campo de la educacin,
se pueden encontrar resultados similares, pero difcilmente idnticos (ej: en un determinado
centro con unas caractersticas definidas para los estudiantes, en unas condiciones particulares
es posible que ocurra esto).
Probables: se trata de establecer una gradacin en el trmino universalidad para determinados
casos. Esta formulacin tiene mayor sentido en nuestro campo de trabajo, debemos ser
conscientes que nuestras afirmaciones pueden quedar validadas, no en trminos de certeza, sino
en trminos de probabilidad.
- Segn su forma de expresin cuantitativa:
Substantiva o cientfica: expresa la relacin entre variables con definicin expresa de las
mismas. Esta hiptesis de investigacin puede venir derivada de la observacin y la experiencia
(inductiva), adems se puede partir de la realidad para llegar a las teoras; en cambio cuando se
derivan de la teora (deductivas) el proceso se realiza a la inversa, de arriba hacia abajo, sirven
para comprobar el funcionamiento de las teoras en el campo educativo. (ej:comprobar que el
mtodo de aprendizaje basado en la solucin de problemas es ms adecuado para favorecer el
razonamiento matemtico).
Estadstica: definida en trminos de relaciones estadsticas deducidas e la anterior. Se establece
una diferencia o relacin entre los parmetros poblacionales, que debe ser comprobada
empricamente. Pueden enunciarse en forma de hiptesis nula (H 0 ), que postula la no existencia
de diferencias o relaciones entre los grupos. Mientras que la hiptesis alternativa (H 1 ) es la que
establece la relacin entre variables, bien de forma genrica (bidireccional), bien decantndose
por una de las opciones (direccional). [Ej. H0: el mtodo utilizado en el aprendizaje de la Lengua
no influye en los resultados acadmicos alcanzados por los estudiantes; H 1: el mtodo utilizado
en el aprendizaje de la Lengua influir en los resultados acadmicos (bidireccional). O bien, el
mtodo X empleado en el aprendizaje de la Lengua mejorar los resultados de los estudiantes
(direccional)].
- Segn el nivel de aproximacin a la realidad:
Operacional: la que implica que las variables relacionadas vengan expresadas en trminos
observables. La formulacin establece una relacin de dependencia entre aquellas variables que
estn perfectamente delimitadas por el investigador. En las grandes investigaciones se las
identifica como subhiptesis que se generan desde las grandes hiptesis generales (ej: la
utilizacin de la tcnica del subrayado influir en los resultados acadmicos alcanzados por los
estudiantes en Historia).
Conceptual: persigue establecer generalizaciones de mayor aplicacin en el futuro. Es la
denominada macrohiptesis, que enmarcan el campo de objeto de investigacin de forma
genrica, lo que ponen de manifiesto es el grado de inters y preocupacin del investigador por un
determinado tema (ej: las tcnicas de estudio influirn en el rendimiento).
- Segn el nmero de variables y sus relaciones:
Hiptesis descriptiva de una sola variable: se trata de afirmaciones que deben ser comprobadas,
pero que no se interesan por las explicaciones. Pretenden probar si en los sujetos seleccionados se
manifiesta una determinada caracterstica (Ej:los estudiantes que asistan a las tutoras de la
UNED probablemente obtendrn mejores resultados).
Hiptesis descriptiva con dos o ms variables y relacin de aseveracin: establece una relacin
simple de asociacin o covariacin entre ellas, el cambio en una variable va unido al cambio
correlativo en la otra del mismo o de distinto signo. Se busca comprobar los niveles de asociacin
y el grado en que se produce entre las variables (ej: los estudiantes que asistan a las tutoras de la
UNED, estudien 9 horas semanales y consulten bibliografa, es posible que alcancen buenos
resultados).
Hiptesis descriptiva con dos o ms variables y relacin de dependencia: se dirigen hacia la
explicacin y la prediccin de los fenmenos educativos. Es el campo propio de las hiptesis
causales que pretenden explicar o conocer las razones o motivos de los fenmenos. (los
estudiantes del curso X que realicen un curso sobre Tcnicas de Estudio mejorarn de forma
apreciable sus resultados acadmicos).
2.5.- Identificacin y definicin de variables.
La identificacin de las variables que intervienen en el proceso de investigacin en educacin constituye uno
de los momentos importantes dentro del proceso de validacin o comprobacin emprica de las hiptesis, ello
implica que los aspectos que interesa conocer se pueden traducir a lenguaje comprensible bien de forma
cualitativa o cuantitativa, es decir, mediante categoras o nmeros.
2.5.1.- Concepto y modalidades de variables.
La variable es aquella caracterstica que admite diversos valores, es decir, dos o ms modalidades; mientras
que la constante es un valor numrico que no cambia en un contexto determinado, dicho de otra forma, la
constante es aquella caracterstica que admite una nica forma de manifestarse, una nica modalidad de
presencia.
Aunque algunos autores suelen recurrir al trmino 'atributo' cuando se identifica con lo cualitativo y 'variable'
cuando se trata de lo cuantitativo, en la gran mayora de los manuales se tiende a englobar todo bajo el epgrafe de
variables. En el primer caso se les denomina categricas, atributivas o cualitativas; en el segundo caso se les
denomina cuantitativas, bien sean discretas o continuas
Ej: usando una circunferencia: una variable puede ser la medida del radio, que puede medir una cosa u otra,
otra variable sera la medida de la longitud, que puede medir una cosa u otra y la constante sera el valor de pi
que siempre y se use donde ser use, tendr el mismo valor 3,1416.
La variable es un constructo que permite al investigador definir y asignar valores, tanto de naturaleza
cuantitativa como cualitativa, dentro de un espacio simblico perfectamente delimitado.
Vamos a presentar las variables que se suelen emplear con ms frecuencia en nuestro contexto de trabajo, en
educacin:
- Segn los niveles de medida:
Categricas o atributivas: son aquellas que establecen distintas categoras para cada una de las
modalidades, se las denomina atributo, hacen referencia a las caractersticas que los sujetos no pueden
cuantificar. Es preciso que las categoras establecidas estn perfectamente definidas en el marco de la
investigacin, adems de ser mutuamente excluyentes y exhaustivas.
Dicotmicas: variable que slo admite dos categoras (si-no, sexo, verdad-falso)
Politmicas: variables que admiten ms de dos categoras (nivel de estudios, clase social, lugar
de residencia)
Cualitativas: son aquellas que expresan la posesin de una determinada cualidad y con cierta
intensidad (rangos). Su caracterstica principal radica en que la expresin de estas cualidades carece
de una precisin en la medida del rasgo, por lo tanto, se podrn establecer rangos o posiciones en las
medidas, pero no ser posible establecer diferencias numricas precisas. (ej: los datos de tipo
observacional directo son de naturaleza cualitativa, el inters y la atencin del estudiante en una
clase observad por su profesorado; la valoracin de una tarea desarrollada por el docente, opinin
sobre el funcionamiento de las tutoras)
Cuantitativas: reflejan las caractersticas de la poblacin que admiten medida numrica, por tanto, la
cuantificacin de una determinada cualidad. En funcin de su propia naturaleza pueden ser:
Discretas: las que slo admiten nmeros enteros en su definicin (nmero de sillas, de
habitantes de un lugar)
Continuas: las que pueden admitir un numero infinito de valores potenciales de la caracterstica
que medimos, entre dos valores dados cualesquiera (edad, peso, puntuaciones de un test).
- Segn su enfoque metodolgico:
Dependientes (VD): son las que reciben los efectos de la intervencin sobre la variable
independiente, se identifican con la situacin que queremos explicar. Los valores que alcance esta
variable dependern de la independiente, por ello refleja la consecuencia de los cambios que se han
producido.
Independientes (VI): son aqullas sobre las que interviene o acta el investigador con el fin de
analizar su influencia sobre la dependiente. Suele ser una variable experimental y controlada, en
ocasiones se las denomina como estmulos o antecedentes que permiten explicar determinados
fenmenos y comportamientos de los sujetos (mtodo de aprendizaje, motivacin hacia los estudios).
En el contexto de la investigacin emprica una variable puede actuar como independiente y, en otros
casos, como dependiente.
Extraas o intervinientes (VE): se trata de aquellas variables que estn presentes y que deben ser
controladas para evitar la contaminacin de los resultados finales. Lo que realmente interesa al
investigador es que estas variables no le ofrezcan soluciones alternativas a las realmente buscadas en
el trabajo.
- Segn el contexto terico-explicativo:
Estmulo: engloban dentro de s todas aquellas condiciones externas al sujeto que pueden ser objeto
de intervencin por parte del investigador; pues afectan directamente al comportamiento del individuo
dentro de un determinado contexto de actuacin.
Respuesta: reflejan el comportamiento manifiesto de los sujetos ante determinadas intervenciones en
el campo educativo, se trata de la respuesta que ofrece el individuo en la investigacin cuando se le
somete a un determinado estmulo.
Intermediarias: se trata de un conjunto de variables que no son objeto de investigacin, si bien, estn
presentes y pueden hacer variar los resultados previsibles; en realidad son una interposicin entre el
estmulo y la respuesta y deben ser objeto de atencin por el investigador, pueden influir sobre las
respuestas que ofrecen los sujetos en la investigacin. Una variable intermediaria se incorpora al
proceso general de la investigacin, puede analizarse como una variable estmulo ms dentro del
proceso, por lo tanto, el hecho de que se engloben en este apartado no lleva consigo que alguna de
ellas pueda presentarse tambin en otros apartados.
2.5.2.- Definicin operativa de las variables.
La definicin operacional es la traduccin de los conceptos tericos al lenguaje emprico, en otras palabras, es
la sustitucin de lo que no se puede observar por aquello accesible a la observacin y los instrumentos de medida.
Viene a significar la traduccin y sustitucin de algo inobservable en factores y propiedades observables. De esta
forma asigna significado a una construccin hipottica o a una variable mediante la especificacin de las
actividades y operaciones necesarias para medirla.
La operativizacin de las variables es un requisito indispensable para que se pueda llevar a cabo la
investigacin con las suficientes garantas de validez, pues facilita la prueba de hiptesis y permite el acuerdo
entre distintos observadores del mismo fenmeno. No obstante, hemos de tener presente que una definicin
extrema tiende a restringir de forma apreciable las posibilidades de validez externa de las investigaciones.
Debemos pues tratar de combinar los dos aspectos, de una parte ofrece una definicin clara y concisa de las
variables y de otra evitar su visin restringida, pues no olvidemos que el objetivo ltimo de la investigacin se
centra en la elaboracin de teoras.
2.6.- La recogida de datos y su calidad.
FOX (1981) nos recuerda que la calidad de la investigacin viene condicionada expresamente por la calidad
de los mtodos utilizados para recoger y analizar los datos.
El investigador en educacin debe tener un conocimiento sobre los diferentes instrumentos y elegir aqul que
estime ms apropiado. Cuando stos no le satisfacen totalmente puede optar por la modificacin parcial, la
eleccin de otro distinto o la construccin de uno nuevo. A veces, es preciso recurrir, en una misma investigacin,
a varios instrumentos complementarios de medida, de evaluacin, de observacin, e incluso de carcter
proyectivo.
2.6.1.- Criterios para la seleccin y elaboracin de los instrumentos de recogida de datos.
Para tomar la decisin en la seleccin de instrumentos debe contemplar una serie de criterios.
- La identificacin del rasgo o caracterstica que se pretende evaluar con el subyacente instrumento. Ello
exige una clarificacin del mismo, mediante una definicin operacional precisa.
- El tipo de validez empleado: el instrumento debe medir lo que dice medir y no otra cosa distinta,
centrado en el objetivo que se pretende cubrir y los sujetos a quienes se aplicar. Puede tratarse de la
validez predictiva, concurrente, de constructo, de contenido.
- La tcnica de fiabilidad identificada con la precisin de la medida, es decir, que un instrumento ser
fiable en la medida en que mida con precisin algo. El investigador debe saber qu tipo de fiabilidad es la
ms apropiada: como estabilidad, como equivalencia o como consistencia interna.
- Las caractersticas de la muestra con que se valid la prueba, debemos buscar la representatividad de los
sujetos seleccionados, comparados con la poblacin global, adems de que el tamao sea adecuado: todo
ello valorado desde la perspectiva de las necesidades del investigador.
- Los niveles de fiabilidad y validez alcanzados por la prueba o instrumentos y reflejados en la
correspondiente ficha tcnica. As para la fiabilidad se exigen valores altos, por encima de 0,85 en la
consistencia interna, aunque algunos autores no recomiendan el uso de instrumentos que no alcancen el
0,90. En el caso de la validez, se suelen aceptar valores ms bajos, a partir de 0,40; para algunos autores
sera recomendable que no bajara de 0,50.
- Otros criterios secundarios: como puede ser el tiempo que exige su respuesta y su valoracin posterior,
la facilidad de comprensin (lenguaje claro y conciso) y de ejecucin en el marco de la aplicacin, la
forma de los tems, el coste econmico.
En aquellos casos en los que se deba proceder a la elaboracin de instrumentos, la cuestin se complica, pues
esta tarea es ms exigente que la seleccin. Por ello vamos a presentar una serie de criterios generales a
contemplar en la elaboracin.
- Identificacin clara y concisa en el rasgo o caracterstica que nos conduce a una definicin operativa de
ste en forma de conductas o manifestaciones observables y estructuradas en categoras evaluables, que
pongan de manifiesto qu debemos apreciar; en qu aspectos hay que fijarse, cules son los ms
significativos y relevantes. Este rasgo o caracterstica debe ser trasladado al instrumento de forma
suficiente y representativa.
- Conocer los objetivos a conseguir con el instrumento: segn sea su concepcin, redaccin y valoracin.
Es preciso que los objetivos se encuentren debidamente categorizados.
- Seleccionar los tems o elementos ms apropiados: esta seleccin se lleva a cabo contemplando
cuestiones tcnicas relacionadas con el concepto a medir, el nivel previo de los sujetos, la edad, las
circunstancias particulares.
- Formular los tems o elementos con precisin: facilita la comprensin de la persona que responde, de tal
forma que se tenga evidencia de la posesin o no de un determinado rasgo o caracterstica. Segn el tipo
de elemento (verdadero-falos, eleccin de mejor respuesta, desarrollo de conceptos...) depender de su
formulacin (claridad, vocabulario empleado, correccin gramatical y ortogrfica...)
- Ordenar los tems de forma apropiada. es conveniente tratar de combinar el tipo de elementos, la
dificultad y la secuencia lgica.
- El tiempo preciso para responder (duracin): al conjunto de la prueba y a cada una de sus partes.
Debemos buscar un equilibrio entre una aplicacin excesivamente larga, produce fatiga o ansiedad, lo que
puede acarrear respuestas poco reflexionadas y al azar. Las pruebas excesivamente cortas, que se
contestan con rapidez, no tienen las suficientes garantas de la representatividad de los objetivos.
Debemos tener en cuenta, entre otros aspectos, la edad de los sujetos, la vinculacin con el tema
propuesto, el momento en que se va a aplicar y la finalidad de los resultados.
- Las respuestas que debe dar el sujeto: deben ser unvocas y registrarse con facilidad, sobre todo en el
caso de instrumentos escritos. Es conveniente que la respuesta sea sencilla (rodear con un crculo,
subrayado, tachado, escribir un nmero) para evitar errores de interpretacin.
Para alcanzar las suficientes garantas en todos y cada uno de los puntos contemplados, es conveniente
someter primero a lo que llamamos aplicacin piloto; en que se trabaja con una muestra reducida de sujetos, pero
que sea lo mas representativa posible, para que conste a dicha prueba y a la vez se le sugiere que critique los
aspectos que no estn claros, la duracin, el lenguaje, la forma de presentacin y las instrucciones que se ofrecen.
Adems, con los datos suministrados por la aplicacin piloto podemos determinar los niveles de fiabilidad y
validez de la prueba.
2.6.2.- Los datos y sus niveles de medida.
Debemos procurar garantizar una buena calidad de los datos, pues de su anlisis e interpretacin se van a
derivar conclusiones que repercutirn en futuras actuaciones en el campo educativo.
Aunque en ocasiones se utiliza la expresin escalas de medida, en el campo de la investigacin social y
educativa parece ms apropiado el trmino niveles de medida, pues vienen a reflejar de una forma ntida la
gradacin existente en la informacin recogida; adems cabe aadir que a medida que somos ms precisos en los
mismos, un nuevo nivel viene a incluir al anterior, de tal forma que se van a ir aadiendo nuevas propiedades en la
interpretacin y anlisis de datos.
Nivel nominal: (definicin: datos categricos; ejemplos: colores, sexo, categora profesional, nivel de
estudios).
Es un nivel de medida muy pobre que se caracteriza por atribuir nmeros o smbolos a las diferentes
categoras o clases en que se ha dividido un conjunto. Estas han de ser mutuamente excluyentes y agotar todas las
posibilidades del conjunto inicial. As, el mismo nmero o letra indica la pertenencia al mismo grupo o categora.
En este nivel se podrn llevar a cabo las operaciones de igualdad, desigualdad y de equivalencia. No se trabaja
con los nmeros como tales, sino con sus frecuencias, es decir, el nmero de veces que se presenta un hecho o
fenmeno en el grupo objeto de investigacin, y en cada una de las categoras definidas con anterioridad. Entre los
estadsticos que pueden calcularse con datos nominales se encuentran: la moda, la frecuencia, el coeficiente de
asociacin (C) o de contingencia, la prueba Ji cuadrado con sus diferentes modalidades.
Nivel ordinal: (definicin: datos ordenados por rangos con orden creciente o decreciente, rangos; ejemplos:
altos/bajos, pesados/ligeros).
Es aqul capaz de tomar enunciados de la forma mayor que o menor que, lo que supone que se puede
establecer con los objetos evaluados una escala ordenada de forma creciente o decreciente, de tal forma que nos
permita afirmar que un objeto que ocupa el sexto lugar se encuentra en una posicin de inferioridad frente a otro
que ocupa el sptimo (en una escala creciente).
Probablemente sea el nivel de medida de mayor empleo en la investigacin en Ciencias Sociales, pues las
variables que manejamos lo mximo que llegan a establecer son los criterios de comparacin ya explicados, de tal
forma que lo que nos interesa no es el nmero en s mismo, sino la posicin (el rango) que ocupa dentro del grupo
analizado.
Todos aquellos datos procedentes de la observacin, de las variables de tipo cualitativo y conseguidas con
instrumentos no del todo precisos se consideran datos ordinales. Para su tratamiento estadstico disonemos de la
mediana, la correlacin ordinal de Spearman y una gran cantidad de pruebas estadsticas englobadas
genricamente en la categora de pruebas no paramtricas.
Nivel de intervalo: (definicin: intervalos iguales siendo el cero arbitrario; ejemplos: tiempo de ejecucin de
tareas, tests, pruebas objetivas). La temperatura es una variable con nivel de medida de intervalo, dado que sus
escalas de medida estn construidas internamente con intervalos iguales pero siendo el punto cero de cada una de
ellas un punto arbitrario (de hecho, el cero en la escala Kelvin es distinto al cero en la escala Celsius o en la escala
Fahrenheit).
Implica que, dems de las caractersticas de la ordinal, se aade la igualdad de distancia o intervalo entre dos
valores consecutivos cualesquiera de la variable, lo que lleva consigo la existencia de una unidad comn y
constante de medida. La distancia entre 6 y 7 debe ser la misma que entre 4 y 5; de tal forma que a iguales
diferencias entre los nmeros correspondan diferencias idnticas en los atributos medidos.
En este caso podemos hablar de un nivel autnticamente cuantitativo de datos, por ello, vamos a trabajar
directamente sobre las puntuaciones alcanzadas por los sujetos en la aplicacin de las correspondientes pruebas
estadsticas. As se pueden calcular, en general, todas aquellas pruebas de resolucin de contraste de hiptesis
englobadas en la denominacin genrica de pruebas paramtricas, siempre que se cumplan ciertas condiciones
que veremos en captulos posteriores.
Nivel de razn o proporcin: (definicin: intervalos iguales, el cero se define como ausencia de la
caracterstica; ejemplos: peso, longitud) sera el nivel ms perfecto, pues a todas las caractersticas ya enumeradas
hemos de aadir la existencia del cero absoluto, o sea la no presencia del atributo o propiedad medida. Esta escala
permite ordenar elementos, establecer diferencias entre los mismos y, adems razones matemticas.
En este nivel, estn justificadas todas las operaciones matemticas, adems de poder determinar lo que es el
doble, el triple, la mitad. En el campo de la Estadstica tenemos la media geomtrica y el coeficiente de variacin
que requieren de la existencia del punto 0 de la escala.
TEMA 4.- LA ESTADSTICA EN EL PROCESO DE INVESTIGACIN PEDAGGICA EMPRICA.
4.1.- Introduccin.
En este captulo trataremos la recogida de datos y su primera ordenacin. Comenzaremos a aterrizar en el
campo de la Estadstica Descriptiva, donde se comienza con un conjunto de datos a los que hay que darles formas
ms interpretables (distribuciones de frecuencias, grficos) y con el clculo de ndices numricos (como
promedios, percentiles y medidas de variabilidad).
Hablaremos primero de organizacin y despus de anlisis exploratorio de datos, donde simplemente se
explora, se observa lo que sucede y se concluye al respecto, no hay todava una hiptesis, no hablamos todava del
mtodo confirmatorio, en el que el investigador parte de una hiptesis basada en la teora, recoge datos para
contrastar dicha hiptesis y concluye sobre su validez (no podemos decir verdad, slo que sometida a contraste
puede quedar validada, pero nunca verificada).
4.2.- De la definicin del problema y las variables a la observacin y recogida de datos.
Uno de los errores ms frecuentes de los investigadores es recoger datos sin seguir adecuadamente los pasos
del proceso de investigacin. Por eso es fundamental, antes de iniciar cualquier estudio, tratar de dar respuesta a
todas las fases del proceso de investigacin.
Una vez centrado el tema de investigacin, revisada la literatura al respecto e identificadas las variables que
van a ser utilizadas para dar respuesta al problema y a los objetivos planteados, se procede a realizar la recogida
de la informacin, es decir, atribuir valores a las variables que son objeto del estudio. Para ello necesitamos algn
procedimiento que nos permita asignar dichos valores (nmeros, rangos, categoras) a las variables conceptuales:
necesitamos un instrumento de medida adecuado y una regla de medida bien definida.
En la investigacin emprica que es a la que nos estamos refiriendo, siempre tenemos que trabajar con datos
empricos, es decir, transformar en nmeros la realidad observada. Para ello necesitamos instrumentos de medida
vlidos y fiables. La precisin (fiabilidad) de los instrumentos podr tener distintos grados (por ej. en variables
como la edad, el cociente intelectual, el rendimiento acadmico, la altura, la presin arterial, etc.) y eso afectar a
la validez de los resultados. En este sentido, la eleccin de los instrumentos de medida o el proceso de
construccin de los mismos es una parte fundamental de la investigacin.
Si nos planteamos un problema cuyas variables no son cuantificables (por ejemplo, la influencia de la
Revolucin Francesa en la literatura de la poca), no estamos ante una investigacin emprica, lo cual no quiere
decir que no sea importante. Hay otros mtodos de conocimiento que permiten estudiar la realidad.
Una vez realizado el diseo de investigacin y elegidos los instrumentos de medida, se puede realizar el
trabajo de campo, aplicar los instrumentos, recoger los datos.
4.3.- Permisos y tica en la investigacin y recogida de datos.
Todava no hay un consenso completamente claro sobre cmo debe procederse ticamente en la investigacin.
Lo que s parece claro es que no se caer en uno de estos dos extremos:
Proteger contra la experimentacin humana a toda costa
...frente a...
Permitir a cualquiera ser objeto de experimentacin
Estos debates se producen sobre todo en la investigacin mdica. En la investigacin educativa entre los
principios ticos que deben seguirse destacan la participacin voluntaria y el informe consentido (los sujetos
conocen que son objeto de investigacin y estn de acuerdo); evitar todo riesgo de dao fsico o psquico;
confidencialidad y anonimato.
Tambin debemos respetar el lugar donde realizamos la investigacin, causando las menos alteraciones
posibles (Ej. evitar hacer perder tiempo a profesores y estudiantes).
Por tanto la tica del investigador exige informar a toda persona que est participando como sujeto de
investigacin de la naturaleza de la misma, de la confidencialidad de los resultados y solicitar su permiso para
aplicarle los instrumentos de medida.
Aunque parece obvio, la tica del investigador tambin exige respetar a los sujetos objetos de la investigacin,
no manipular los datos obtenidos y reflejar fielmente los resultados y no plagiar. Esto incluye respetar a las
distintas audiencias que puedan tener acceso a los resultados y citar adecuadamente a los autores y las fuentes de
informacin (no plagiar).
Los aspectos ticos deberan ser objeto de consideracin al comienzo de una investigacin ms que un
pensamiento o una reflexin a posteriori.
4.4.- De los instrumentos a los datos: eleccin del programa, la matriz de datos y el libro de cdigos.
Una vez que hemos aplicado los instrumentos, debemos trasladar los datos a algn programa que nos permita
trabajar con ellos. A esto se le llama introducir o tabular los datos.
Las puntuaciones que vamos a introducir se llaman puntuaciones directas (Xi), que es la puntuacin que
obtiene el sujeto tras aplicarle un instrumento de medida (una pregunta, un test, una escala, etc.).
La codificacin de datos consiste en la asignacin de nmeros o caracteres a los valores de la variable. El
nivel de medida de las variables tiene repercusiones en la forma de codificar los datos (ej: cuando tenemos un
grupo de alumnos medidos en distintas variables, podemos encontrarnos que algunas de ellas son de tipo
clasificatorio, nivel nominal, como el sexo y el grupo o centro al que pertenecen; mientras otras tienen un nivel de
medida de intervalo, como las puntuaciones obtenidas en distintas pruebas estandarizadas). Cuando tenemos
variables con nivel de medida nominal podemos codificarlas con nmeros, con letras o de forma alfanumrica.
Antes de empezar a tabular o introducir datos, es conveniente escribir el libro de cdigos. Se trata de un
documento en el que se especifican todas las variables del estudio en el orden en el que sern introducidas en la
matriz de datos. Primero debe identificarse el tem junto al nombre de cada variable y su etiqueta (descripcin).
Posteriormente se anotan los posibles valores de la variable (cdigos) y, si procede, se les asigna tambin una
etiqueta de valor a dichos valores (descripcin de lo que indica cada valor). En el caso de variables continuas
basta con escribir el recorrido de la escala (por ej: 5-20).
La utilidad de dicho libro es decisiva para evitar errores de tabulacin.

Es importante definir el valor que asignemos a los datos perdidos o missing data. Por ejemplo, cuando
estamos tabulando un cuestionario y nos encontramos que un sujeto no ha contestado a una pregunta, tenemos dos
opciones:
- Se deja en blanco en la matriz de datos (missing de sistema), de modo que no se contabilice a la hora de
calcular los estadsticos. Un error muy comn es poner ceros, pero esto puede distorsionar el calculo de
los estadsticos ya que puede estar incluido como un valor vlido para esa variable o se olvida definir
como un valor perdido.
- Definir un valor perdido por el usuario, como por ejemplo 99 (siempre que no sea un valor admisible
dentro de la escala de medida de la variable). En este caso, debemos programar dicho valor en el
programa que utilicemos, de modo que el programa no utilice ese valor para los clculos. (Ej: en un test
de velocidad, con un valor perdido por el usuario podemos distinguir las preguntas intermedias que el
sujeto no supo responder y dej en blanco de las respuestas del final que dej en blanco porque no le dio
tiempo a responder a ms preguntas). Tambin es til cuando se distinguen en un cuestionario las
opciones no sabe (missing de usuario) y no contesta (missing del sistema)
La forma habitual de introducir los datos consiste en conformar lo que se denomina una matriz de datos. La
matriz de datos es simplemente una tabla de doble entrada en la que las filas representan sujetos y las columnas a
las distintas variables medidas.
La matriz de datos no proporciona gran informacin con un simple golpe de vista, menos an cuando tenemos
muchos sujetos y muchas variables. Debemos ordenar y categorizar los datos, para poder apreciar mejor las
caractersticas del grupo en cada una de las variables. Este primer anlisis se enmarca en el mbito conocido como
estadstica descriptiva, que ser completado por medidas de tendencia central, variabilidad y representaciones
grficas.
4.5.- Organizacin de los datos: depuracin de datos y distribuciones de frecuencia.
Antes de empezar a realizar los anlisis estadsticos, debemos hacer lo que entendemos como depuracin de
datos y exige dos fases:
- El control de calidad de la tabulacin, que consiste en comprobar la fidelidad de la tabulacin. Podemos
seleccionar aleatoriamente unos pocos cuestionarios y comprobar si existen errores en la tabulacin. Si los
errores son abundantes, se debe exigir realizar de nuevo la tabulacin.
- La depuracin de datos que consiste en verificar si hay valores fuera de rango segn se haba definido
en el libro de cdigos. Hay distintas maneras de hacerlo:
Realizar un anlisis descriptivo solicitando simplemente los valores mnimo y mximo para cada
variable. Una de las ms sencillas. Con el libro de cdigos en la mano, debemos ir comprobando que
estos valores estn dentro del rango definido.
Realizar una distribucin de frecuencias. En una distribucin de frecuencias aparecen:
Puntuaciones directas (Xi), son todas las puntuaciones obtenidas en una variable.
Frecuencias absolutas (fi), nmero de veces que se repite cada Xi .
Frecuencias relativas, frecuencia absoluta dividida por el nmero total de puntuaciones f i /N=
fr .
Porcentaje de aparicin, es la frecuencia relativa (fi/N) que multiplicada por 100, indica el
porcentaje de aparicin de una puntuacin respecto del total (fi/N) x 100.
Frecuencia acumulada, que muestra el nmero de sujetos a los que supera una puntuacin
determinada. Se calcula sumando las frecuencias relativas (f i/N) que queden por debajo del lmite
superior de cada puntuacin.
*N=nmero total de sujetos que han respondido a la pregunta, se halla sumando todas las frecuencias
absolutas*

La frecuencia absoluta indica que en la muestra haba 69 padres que respondieron al cuestionario en Shkoder
y 50 en Tirana. Esto equivale a un porcentaje absoluto del 58 el 42% respectivamente.
4.5.1.- Distribuciones de frecuencia y aproximacin al concepto de percentil.
Una distribucin de frecuencia suele incluir:
- Puntuacin directa. (Xi), son todas las puntuaciones obtenidas en una variable.
- Frecuencia absoluta. El nmero de sujetos o casos que corresponde a cada puntuacin directa. (fi).
- Porcentaje relativo (o frecuencia relativa multiplicada por 100) para cada cdigo, incluidos los valores
perdidos. (fi/N) x 100.
- Porcentaje vlido. Porcentaje relativo de cada valor excluidos los valores perdidos.
- Porcentaje acumulado. Indica el porcentaje de casos que deja por debajo de s el lmite superior de cada
puntuacin (entendiendo como lmite superior media unidad ms que la puntuacin de referencia). Se
calcula simplemente sumando los porcentajes relativos que quedan por debajo del lmite superior de cada
puntuacin. (fa/N) x 100.
- Frecuencia acumulada. Indica el nmero de sujetos que deja por debajo de s el lmite superior de una
puntuacin determinada.
Los porcentajes acumulados (sin decimales) se utilizan mucho en la construccin de baremos para interpretar
las puntuaciones en los test, donde reciben el nombre de percentiles. El percentil indica el porcentaje de sujetos
que deja por debajo de s una puntuacin determinada. As, en el ejemplo anterior, un sujeto con una puntuacin
directa de 6 estara en el percentil 74.
4.5.2.- Sntesis.
La distribucin de frecuencias es una forma rpida y fcil de transformar una columna de datos en algo
rpidamente inteligible. Con respecto a la depuracin de datos, como podr intuir el lector, ser muy sencillo ver
en la primera columna correspondiente a las puntuaciones directas, si hay algn valor fuera del rango establecido
en el libro de cdigos, as como cuntos hay. El paso siguiente, una vez identificados estos valores errneos, es su
correccin. Dependiendo de la magnitud de la base de datos y de la cantidad de errores detectados, podemos
adoptar dos soluciones:
-La primera, y ms sencilla, consiste en reemplazar los valores errneos por valores perdidos
(simplemente reemplazar dichos valores por espacios en blanco).
- La segunda, mejor pero ms costosa, consiste en identificar a cada sujeto en el que se ha introducido el
error, identificar el instrumento de medida (por ejemplo, el cuestionario, ya que cada cuestionario estar
registrado con un nmero de identificacin), buscar la variable en la que se introdujo mal el dato y
corregirlo en la matriz o base de datos.
Tras realizar las correcciones oportunas, volveremos a realizar las distribuciones de frecuencia para verificar
que se han corregido todos los errores. Una vez depurada la matriz de datos, estamos listos para comenzar el
anlisis de datos.
4.6.- Aproximacin intuitiva a las representaciones grficas y la curva normal.
Una representacin grfica es una forma de ordenar informacin disponible en la matriz de datos y
comprenderla con un simple golpe de vista. Para realizar un grfico necesitamos una distribucin de frecuencias.
En muchas variables biolgicas y psicoeducativas (peso, altura, cociente intelectual, rendimiento), cuando
realizamos una distribucin de frecuencias, observamos que esta distribucin adopta unas caractersticas
especiales. Entre las distintas formas que pueden adoptar las distribuciones de frecuencias en diferentes variables
se descubri que muchas de ellas adoptan un tipo de distribucin caracterstica que se denomina distribucin
normal o campana de Gauss.
La curva normal es una distribucin terica simtrica (si doblamos la distribucin sobre s misma por la
media, la forma de los dos lados coincide) y asintnica, donde la media la mediana y la moda coinciden. Los
puntos de inflexin coinciden con las puntuaciones tpicas 1.
Muchas variables se distribuyen segn este modelo, sobre todo si contamos con muestras grandes de sujetos:
rendimiento acadmico, inteligencia, aptitud, actitud, motivacin, peso, altura, etc.. La distribucin viene a indicar
cmo la mayora de las personas nos encontramos en torno a los valores medios de la distribucin, y segn nos
alejamos hacia valores extremos, el nmero de sujetos (la frecuencia) disminuyen progresivamente. En el eje de
ordenadas, en vez de frecuencias absolutas, tambin podemos situar frecuencias relativas, es decir, la proporcin
en que se da cada puntuacin (la forma de la distribucin ser exactamente igual, pero la escala del eje de
frecuencias variar entre 0 y 1).
La observacin emprica de la distribucin de estas variables permiti crear un modelo matemtico (curva
normal) que responda a dicha distribucin, de modo que es posible conocer la probabilidad asociada a cada uno
de los valores de la curva (como una frecuencia relativa).
Parece ser que los primeros que llegaron a describir el modelo terico de distribucin normal fueron DE
MOIVRE en 1733, en el contexto de los juegos de azar y, por otra parte, LAPLACE y GAUSS, entre finales del
s.XVII y principios del XVIII, en el contexto de las Matemticas y la Astronoma.
Las aplicaciones de la distribucin normal (la curva normal) y otras distribuciones tericas como la binomial,
t, F, 2, etc, son fundamentales en el campo de la inferencia estadstica, donde reciben el nombre de distribuciones
muestrales, estas distribuciones nos permiten conocer cundo una diferencia es o no estadsticamente
significativa, esto es, si el azar no puede explicar una diferencia de tal magnitud o si, por el contrario, puede
hacerlo.
TEMA 5.- REDUCCIN DE DATOS. MEDIDAS DESCRIPTIVAS BSICAS Y
REPRESENTACIONES GRFICAS.
5.1.-Introduccin. De la organizacin a la descripcin de datos.
Normalmente, antes de realizar anlisis ms complejos, se parte de la Estadstica Descriptiva para hacerse una
primera idea del comportamiento de cada una de las variables contenida en nuestra matriz de datos. Si para la
depuracin de datos hemos utilizado distribuciones de frecuencias, ya hemos realizado el primer anlisis para la
organizacin y comprensin de datos. Si nos hemos basado nicamente en los valores mximo y mnimo de cada
variable para encontrar posibles valores fuera de rango, conviene empezar por realizar una distribucin de
frecuencias para hacer una primera aproximacin a los datos.
En Estadstica, el concepto ms importante es la variabilidad, es decir, el estudio de la dispersin de las
puntuaciones, contribuyendo a explicar la magnitud y naturaleza de las mismas. En este momento, con la
estadstica descriptiva, pretendemos estudiar la magnitud de la variabilidad y alguna otra caracterstica ligada a la
misma. Cuando efectuamos contraste de hiptesis, se tratarn de encontrar posibles variables asociadas, que
expliquen la variabilidad de los datos.
- Variables: caractersticas o propiedades que pueden variar de unos sujetos a otros.
- Constante: contrario a variable. Cuando todos los sujetos tienen la misma puntuacin, cuando no hay
diferencias y, por tanto, no hay variabilidad.
Ya no hemos referido a las distribuciones de frecuencia para organizar y clasificar los datos. Veamos ahora
como se pueden reducir y resumir. De forma genrica, podemos distinguir dos grupos de medidas o ndices
numricos que deben estar presentes en todo estudio descriptivo (estas medidas describen grupos de datos y no los
datos individualmente):
- Medidas de tendencia central. Es decir, hacia qu puntuacin tiende el grupo. El ndice ms conocido es
la media aritmtica, sin embargo, este ndice por s solo no nos proporciona suficiente informacin como
para hacernos una idea del grupo. .
- Medidas de variabilidad o dispersin. Para ver si el grupo es homogneo en torno a la media o
heterogneo, es decir, si muchas puntuaciones distan considerablemente de la media, tanto por arriba
como por abajo. La desviacin tpica es una de estas medidas.
*Representaciones grficas de las distribuciones de datos, como los histogramas, polgonos de frecuencia,
son un buen complemento de los ndices numricos y ayudan a comprender rpidamente la informacin
descriptiva.
5.2.- Medidas de tendencia central: media, mediana y moda. Usos e interpretacin.
La tendencia central del grupo indica hacia qu valor tiende el grupo, cul es el valor que mejor lo representa.
El ndice o medida ms conocida es la media aritmtica, el promedio, su smbolo es X y se calcula:
suma de todaslas puntuaciones Xi
X= X=
nmero total de puntuaciones N
Interpretar una media aritmtica suele ser muy sencillo. Para interpretarla correctamente, es conveniente
conocer la puntuacin mnima y mxima de la escala de medida de la variable y situar la media aritmtica dentro
de ese recorrido. En sentido estricto, la media aritmtica slo puede utilizarse en variables cuyo nivel de medida
sea de intervalo o de razn. Tambin puede utilizarse con variables dicotmicas (las que slo pueden adoptar dos
valores).
Las otras medidas de tendencia central son la moda (Mo) y la mediana (Md). La moda es el valor con
frecuencia absoluta ms alta, la puntuacin que ms se repite. Por tanto, la moda no necesita ningn clculo. La
moda no es la frecuencia, es la puntuacin. Cuando tenemos dos puntuaciones con la misma frecuencia, diremos
que la distribucin es bimodal, y entonces diremos que las modas son, por ejemplo, 4 y 5.
Tambin podemos encontrarnos distribuciones de frecuencias en las que ms de dos puntuaciones tienen la
misma frecuencia y esta es considerablemente superior a la del resto de puntuaciones, en este caso hablaremos de
distribuciones plurimodales. Grficamente, sera una distribucin en la que observaramos varios picos a la misma
altura.
La mediana es aquel valor que deja por encima y por debajo de si al 50% de los sujetos de la muestra, es el
valor central de la distribucin de frecuencias. Es decir, si ordenamos las puntuaciones de menor a mayor (o al
contrario), aquella que ocupa la posicin central, esa es la mediana. En este sentido se dice que coincide con el
percentil 50, es decir, que deja por debajo de s al 50% de los sujetos de la muestra.
Para calcular la mediana, observamos la columna de frecuencias acumuladas (fa)y comprobamos qu
puntuacin (Xi) ocupa el lugar central, (50%) de los sujetos, es decir, buscamos N/2.
Ej: en la siguiente distribucin de frecuencias, la mediana es aquella puntuacin que ocupa la puntuacin
central (la posicin N/2), en este caso la puntuacin que ocupe la posicin 25. Para ello, miramos en la frecuencia
acumulada (fa) y vemos que dicha frecuencia corresponde a la X i =14. En este caso, la puntuacin 14 ocupa las
posiciones 23, 24 y 25, mientras que la X i =15 ocupa las puntuaciones 26 y 27. recurdese que la frecuencia
acumulada es aqulla cuyo lmite superior deja por debajo de s un nmero determinado de sujetos. En este caso,
el lmite superior de 14 (14,5) deja por debajo de s a 25 sujetos.

*Errata: en la segunda columna debera poner fi, correspondiente a frecuencias absolutas.


Cuando el nmero de puntuaciones es par, como en este caso no hay una puntuacin central, sino dos. Es
decir, la posicin 25 deja por debajo de s 24 sujetos y por encima 25. Por tanto, las posiciones centrales son 25 y
26. Frecuentemente se recomienda hallar la media aritmtica de las puntuaciones (X i) correspondientes a estas dos
posiciones. En este caso, la posicin 26 la ocupa la X i =15, luego la media aritmtica de ambas puntuaciones
centrales y, por tanto, la mediana, ser 14,5.

La medida ms precisa de tendencia central es la media aritmtica, ya que tiene en cuenta todas las
puntuaciones para su clculo. Sin embargo, slo podr utilizarse con niveles de medida de las variables de
intervalo o razn. En estos casos, tambin podemos completar la medida con la mediana y la moda; es
recomendable, siempre que sea posible, calcular las tres.
La media aritmtica es sensible a las puntuaciones extremas, no as la mediana ni la moda.
Ej: supongamos estas puntuaciones: 3, 3, 4, 4, 4, 5, 10. en este caso, tenemos una Mo=4, Md=4 y X=4,7.
Tanto la moda como la mediana son medidas ms bsicas basadas en un nico valor, por lo que no se ven
afectadas por las puntuacin extrema (en este caso Xi=10)
La media se ve arrastrada por las puntuaciones extremas, lo que no sucede con las otras dos medidas. Por eso,
la mediana puede ser una medida preferible a la media cuando las puntuaciones extremas puedan distorsionar la
verdadera tendencia central del grupo.
Cuando el nivel de medida de la variable es ordinal, slo podemos utilizar la mediana y la moda, mientras que
para variables con nivel de medida nominal, slo podemos utilizar la moda. (excepto en el caso de variables
dicotmicas).
Hay un tipo de distribucin de frecuencias muy comn y conocido, la distribucin normal, una de cuyas
caractersticas es que la media aritmtica, la mediana y la moda tienen el mismo valor.
5.3.- Medidas de variabilidad.
Las medidas de tendencia central por s solas no nos proporcionan suficiente informacin como para hacernos
una idea de las caractersticas del grupo. Nos podemos preguntar si el grupo es homogneo en torno a la media
aritmtica (la mayora de las puntuaciones estn cerca de la media) o heterogneo (muchas puntuaciones distan
considerablemente de la media, tanto por arriba como por abajo).

Por esta razn, el ndice de tendencia central debe ir acompaado por un ndice de dispersin o variabilidad
que indique en qu medida las puntuaciones de los sujetos se dispersan o varan en torno a la media aritmtica.
5.3.1.- La desviacin media.
Es una medida que indica la media aritmtica de las desviaciones de las puntuaciones directas, respecto de la
media aritmtica. Si la DM es alta significa que las puntuaciones en su conjunto, se desvan, estn alejadas de la
media aritmtica del grupo, mientras que si es pequea, significa que las puntuaciones del grupo estn prximas a
la media.
Valor absoluto de la suma de las diferencias entre cada puntuacin directa y la media
DM =
Nmero total de sujetos
esto es,

En el grupo 1 del ejemplo anterior, los cuatro sujetos tienen la misma puntuacin, luego no hay ninguna
desviacin respecto a la media (104), por tanto, la desviacin media es 0.
sin embargo, en el grupo 2, cada puntuacin directa se aleja 24 puntos de la media. As que (X i X) es igual a
24 o -24. Para evitar diferencias negativas, se toman las diferencias en su valor absoluto, ya que en caso contrario,
la desviacin siempre tenda al valor de 0. sta sera la desviacin media:

5.3.2.- La desviacin tpica.


La desviacin tpica es el ndice ms conocido y utilizado, representndose por s (estadstico) o por
(parmetro). Otro ndice muy utilizado para expresar la variabilidad de los grupos es la varianza (s2 2).
Conceptualmente se interpreta exactamente igual que la desviacin tpica, su clculo:
Al igual que en la desviacin media, el numerador expresa las distancias de cada puntuacin directa a la
media aritmtica. Dichas distancias se elevan al cuadrado (en lugar de utilizar el valor absoluto como en la
desviacin media) para evitar que el valor siempre fuera 0.
En nuestro ejemplo, la varianza sera:

y la desviacin tpica:

Al elaborar un informe descriptivo, lo usual es incluir la desviacin tpica como medida de dispersin. No
siempre es fcil interpretar una desviacin tpica, decir si es grande o pequea. En muchas ocasiones se utiliza
para comparar la dispersin entre grupos distintos. Si tenemos un solo grupo, los valores que podemos tomar de
referencia son la desviacin tpica mnima (siempre cero) y la mxima (puntuacin mayor menos puntuacin
menor entre dos), aunque dichos valores son muy difciles de obtener.
Para obtener la mnima desviacin tpica, todos los sujetos deben obtener la misma puntuacin. Para obtener
la desviacin tpica mxima, la mitad de los sujetos debera obtener la puntuacin mxima de la escala y la otra
mitad la puntuacin mnima (as se conseguiran las distancias mximas respecto de la media y, en este sentido, la
mxima heterogeneidad). Sin embargo, si bien esto es posible en variables dicotmicas, cuanto ms grande es la
amplitud de la variable, ms improbable es que se d esta situacin. En consecuencia, tendremos que ver en estos
casos cunto se aleja de cero la desviacin tpica.
Hasta ahora nos hemos referido al clculo de la desviacin tpica sesgada, que se utiliza frecuentemente al
trabajar con muestras. No obstante, es igualmente frecuente trabajar con la desviacin tpica insesgada, que no es
ms que la estimacin de la desviacin tpica de la poblacin a la que pertenece la muestra. Por lgica, se entiende
que la desviacin tpica en una poblacin ser ms elevada que en una muestra (al haber ms sujetos, ser ms
probable encontrar mayores diferencias interindividuales), por lo que si disminuimos el denominador, el cociente
ser mayor. Para calcular la desviacin tpica insesgada, simplemente se le resta una unidad al denominador:

Para distinguir ambas frmulas de la desviacin tpica suelen representarse como n (sesgada) y como n-1
(insesgada).
A efectos prcticos, no importa usar una u otra, lo importante es utilizar siempre la misma frmula en un
anlisis descriptivo con el fin de poder hacer comparaciones de la variabilidad entre grupos o entre variables.
5.3.3.- La amplitud o recorrido.
Como decamos, existen otras medidas de dispersin. La ms bsica es la amplitud o recorrido de una
variable. Se calcula como la diferencia entre la puntuacin mayor y menor ms uno:
A = Xi mayor Xi menor + 1
Esta medida se utiliza, sobre todo, para organizar los datos de una distribucin de frecuencias en intervalos y
realizar grficos. Tambin nos sirve para ayudarnos en la interpretacin de la desviacin tpica.
Ej: supongamos que tenemos una desviacin tpica de s=2. No es lo mismo cuando tenemos un recorrido de
A=5, donde sera una desviacin tpica muy alta, que cuando tenemos un recorrido de 101 puntos, donde sera una
desviacin tpica pequea.
La amplitud se utiliza como medida de dispersin nica, solamente cuando no es posible calcular otra o como
complemento de la moda (cuando el nivel de medida de la variable es nominal). Al igual que suceda con la moda
como ndice de tendencia central, es un ndice muy simple, basado en este caso slo en dos puntuaciones, lo que
puede dar lugar a malas interpretaciones si no se valora con precaucin, sobre todo cuando existen puntuaciones
extremas (outliers).
5.3.4.- La desviacin semi-intercuartlica.
Se representa con (Q). Es una medida que indica la dispersin en el 50% central de la distribucin. Es
adecuada cuando el nivel de medida de la variable es ordinal (en ese caso sera el complemento de la mediana).
Tambin es adecuado su uso cuando la existencia de puntuaciones extremas pueda distorsionar en exceso la
desviacin tpica, ya que la Q prescinde del 25% inferior y del 25% superior de las puntuaciones, calculando la
dispersin en el 50% central, entre los percentiles 25 y 75 o, lo que es lo mismo, entre los cuartiles 1 y 3.
Q3 Q1
Q=
2
En la interpretacin de Q, debemos recordar que indica la variabilidad de las puntuaciones en el 50% central
de la distribucin.
5.3.5.- El coeficiente de variacin.
Se representa con (V). A diferencia de los ndices anteriores, nos permite comparar la variabilidad entre
variables que tienen distinta amplitud (por ej: permite comparar la variabilidad de un grupo en la variable
coeficiente intelectual, con una amplitud de 50, con la de la variable actitud hacia el estudio, con una amplitud de
10). Dado que las desviaciones tpicas procedentes de instrumentos con distinto recorrido o distinta escala de
medida no son directamente comparables, el V se expresa en trminos porcentuales y se calcula as:
s
V= (100)
X
Hay que tener en cuenta, sin embargo, que este ndice NO tiene unos lmites fijos, ya que es un ndice de
variabilidad relativo, dependiendo del valor de la media.
5.4.- Media y desviacin tpica para variables dicotmicas.
Son variables que slo pueden tomar dos valores. Si sus dos posibles valores, como suele hacerse, se codifican
con ceros y unos (ceros para noes o respuestas incorrectas y unos para ses o respuestas correctas), entonces la
media aritmtica representa la proporcin de unos.
Si tenemos una muestra de 50 sujetos, y 30 han contestado que s (sabiendo que los ses se han codificado
como unos y los noes como ceros), cul es la media? Aplicando la frmula, el numerador es la suma de todas las
puntaciones directas, es decir, la suma de 30 unos y 20 ceros, y el denominador el nmero total de sujetos (N =
50). Por tanto, la media ser 30/50 = 0,6. Esta media indica la proporcin de sujetos que ha respondido con un 1
(S) a esta pregunta y se representa por p. Por otra parte, la proporcin de sujetos que contesta NO, se
corresponde con la proporcin de ceros, que lgicamente ser 1 p, en este caso 1 0,6 = 0,4. Si el 60%
contest que s, queda el 40% que contest que no. La proporcin de noes o errores se representa por q, de modo
que:
p + q =1
Las medias con variables dicotmicas son muy usadas cuando utilizamos pruebas objetivas y tests de
rendimiento en los que la respuesta a las preguntas es acierto/error. En este caso, la media nos dir la proporcin
de sujetos que ha contestado correctamente a la pregunta, que viene a denominarse ndice de dificultad del tem.
Por otra parte, la varianza es muy fcil de calcular:
s2 = p q
y, por tanto, la desviacin tpica es:
s = p q
con lo cual sabremos que la desviacin tpica variar entre 0 (ausencia de variabilidad) y 0,5 (mxima
variabilidad, es decir, cuando, por ejemplo, la mitad contesta que s y la otra mitad que no, con lo que p y q
valdrn 0,5, lo mismo que la desviacin tpica al aplicar la frmula, y la varianza 0,25)
5.5.- Asimetra y apuntamiento: relacin con la curva normal.
La asimetra y el apuntamiento son dos caractersticas relativas a la forma grfica de la distribucin de
frecuencias. El modelo de comparacin es la curva normal, en este sentido, la curva normal carece de asimetra, es
decir, es simtrica o tiene un ndice de asimetra igual a cero. De la misma forma, su apuntamiento es igual a cero.
Las representaciones grficas de las variables, sobre todo cuando trabajamos con muestras grandes, tienden a
ser curvas que, por su grado de asimetra, pueden asemejarse a una de estas tres:

La asimetra negativa indica que los sujetos tienden a agruparse en torno a las puntuaciones altas de la
distribucin. Si el grfico estuviera haciendo referencia a los resultados en un test de aptitud numrica, dicho
grfico estara indicando que ese grupo tiene ms sujetos concentrados en las puntuaciones altas de la distribucin,
esto no significa necesariamente que los sujetos de la muestra obtengan puntuaciones altas en trminos absolutos.
La asimetra positiva indica que la mayora de los sujetos tiende a concentrarse en la parte baja de las
puntuaciones de la distribucin de frecuencias. La cola de la distribucin est a la derecha.
El hablar de asimetra positiva o negativa se debe simplemente al signo del clculo del ndice. Hay distintas
formas de calcularlo. Una de ellas (ndice de Pearson) es la siguiente:
A diferencia de la moda y la mediana, la media aritmtica se ve atrada por las puntuaciones extremas, luego
su posicin relativa se ver desplazada hacia las puntuaciones extremas. Por ello, cuando las puntuaciones
extremas se encuentren en la parte alta (derecha) de la distribucin, la media ser mayor que la moda y la
asimetra ser positiva. Cuando las puntuaciones extremas se encuentren en la parte correspondiente a las
puntuaciones bajas del recorrido, la media se vera arrastrada hacia la izquierda, y entonces el valor de la moda
ser superior al de la media y, por tanto, la asimetra ser negativa.
El apuntamiento o la curtosis indica el grado en el que la distribucin es ms o menos picuda, es decir, el
grado en el que la distribucin resulta ms abierta o dispersa respecto a la media (las puntuaciones estn poco
concentradas respecto a la media) y, por tanto, ms chata o aplanada (platicrtica) o, por el contrario, ms
apuntada y, por tanto, ms estrecha o con las puntuaciones de la distribucin ms concentradas en torno a la media
(leptocrtica). Una curtosis igual a cero viene representada por la distribucin normal. Curtosis superiores a cero
nos indican una distribucin leptocrtica, mientras que si es inferior a cero ser platicrtica.

5.6.- Representaciones grficas.


A partir de una distribucin de frecuencias es muy fcil realizar una representacin grfica. Aunque no hay
unas normas muy estrictas, se recomienda adaptar el tipo de grfico al nivel de medida de las variables.
5.6.1.- Grfico de sectores.
El grfico de sectores, tambin llamado ciclograma o grfico de tarta, se utiliza para representar variables con
nivel de medida nominal (variables generalmente clasificatorias). Tiene forma circular y est divido en porciones,
de modo que cada porcin representa la presencia proporcional de cada uno de los niveles de la variable. (Tantos
por cientos %)
5.6.1.- Grfico de barras.
El grfico de barras suele utilizarse para variables con nivel de medida ordinal, aunque tambin es frecuente
utilizarlo cuando el nivel de medida es nominal y para realizar comparaciones de variables clasificatorias o
categricas.

5.6.3.- Histograma.
Muy parecido al grfico de barras, pero se utiliza para variables cuantitativas continuas con nivel de medida
de intervalo o de razn. Las barras, en vez de estar separadas, estn juntas.

A diferencia de un diagrama de barras, en un histograma no aparecen todos los valores de la variable


representada en el eje de abscisas, porque normalmente, cuando se representa una variable continua, son muchos
los valores que pueden obtener los sujetos y sera muy farragoso un grfico con, por ejemplo, 70 barras. En
consecuencia, lo que se hace es agrupar las puntuaciones en intervalos, de modo que cada intervalo contiene un
numero determinado de puntuaciones (es lo que se denomina valor del intervalo, que podemos representar por i).
Por ejemplo, si i = 5, cada intervalo contendr 5 puntuaciones, por ejemplo de 1 a 5, de 6 a 10, etc.
No hay reglas universalmente compartidas para realizar la agrupacin por intervalos. Lo usual es que vare
entre 5 y 15, dependiendo de la longitud de la escala de medicin (cuanto ms grande es la amplitud, ms barras
pueden dibujarse). Cuanto menor es el nmero de intervalos, ms suavizada (con menos picos y mayor
continuidad) aparece la grfica. El nmero de intervalos o barras y, en consecuencia, el valor de intervalo ( i) se
calcula por tanteo.

Una de las formas que suele usarse para la agrupacin en intervalos es la siguiente:
- Estimar por tanteo el nmero de intervalos que se desea, segn lo que acabamos de indicar.
- Iniciar el primer intervalo con la puntuacin que incluya la puntuacin directa ms baja y que sea
mltiplo del valor del intervalo. Ej: si nuestra puntuacin ms baja es 31 e i=10, la puntuacin que inicie
el primer intervalo ser 30. El ltimo intervalo ser el que contenga la puntuacin mayor.
- Situar la marca de clase (punto central del intervalo) en el eje de abcisas en el centro de cada barra. As,
por ejemplo, para el intervalo 30-39, la marca de clase ser 34,5 (la media aritmtica de los extremos del
intervalo). Hay grficos que no sealan la marca de clase, sino los extremos de cada intervalo. Como
decimos, no hay una forma universal de hacer la representacin grfica.
Hoy en da, la agrupacin por intervalos estn en desuso, es utilizada casi exclusivamente para las
representaciones grficas y para realizar las tablas de percentiles.
Si en este mismo grfico en vez de barras usamos una lnea que une el punto superior central de cada barra,
abriendo y cerrando el eje de abcisas, tendremos en grfico llamado polgono de frecuencias, que permite una
fcil comparacin de la distribucin de distintas variables en un mismo grfico.
5.6.4.- Grfico de caja.
El diagrama de caja, tambin conocido como caja y patillas o caja y bigotes, es un grfico muy prctico
porque permite hacerse una idea rpida de la distribucin de las puntuaciones en la zona central (el espacio
sombreado, que comprende desde el cuartil 1 o percentil 25 hasta el cuartil 3 o percentil 75) y en los extremos.
Otra de sus utilidades es que nos informa grficamente del grado de asimetra de la distribucin y presenta los
valores atpicos (outliers). Las patillas o bigotes tienen como extremos posibles los valores mximo y mnimo de
la variable. Sin embargo, las patillas tienen un mximo de prolongacin; para determinar los lmites de las patillas
suele utilizarse la frmula de multiplicar el intervalo intercuartil que es la simple diferencia entre el tercer y el
primer cuartil por 1,5. Si hay valores que se alejan de los lmites de este producto, se clasifican como atpicos.
Tambin puede especificarse la existencia de valores an ms extremos: Si hay puntuaciones que se alejan ms del
producto del intervalo intercuartil por 3, entonces se habla de puntuaciones extremas. Esto nos ayuda a
identificar valores que pueden distorsionar el comportamiento de la variable al calcular valores como la media
aritmtica, la desviacin tpica, una correlacin, etc. En ciertos casos, puede estar justificado eliminar de algunos
anlisis estadsticos a los sujetos con puntuaciones atpicas o extremas.
Este grfico corresponde a la misma variable presentada en el histograma anterior, y podemos ver que la mitad
del grupo se sita entre las puntuaciones 65 y 84, estando la mediana en 75. En este caso, el intervalo intercuartil
sera 84-65=19. 19*1.5=28.5. Entonces, si le sumamos y restamos este valor a la mediana, obtenemos los
extremos de las patillas: 7528.5= (46.5, 103.5). En el grfico vemos que la puntuacin menor sera el outlier, y
por ser un caso raro se le dibuja fuera de la patilla inferior, indicando que dicho caso debera ser analizado antes
de incluirlo en posteriores anlisis

Este tipo de grfico es muy til para comparar visualmente grupos medidos en distintas variables.
Presentamos a continuacin un grfico de este en el que se compara la eficacia de centros educativos percibida por
profesores de distintos centros.

Los centros estn representados por un nmero en el eje de abcisas: 11, 12, 13. Encima de cada uno aparece el
nmero de profesores que contest a esas preguntas. Tambin podemos comprobar que, dentro de un mismo
centro, los profesores tienen distinta percepcin de la eficacia. Adems puede verse que, dentro de un mismo
centro, cuanta ms distancia hay entre los extremos de las patillas, ms heterogeneidad o varianza hay en las
respuestas. La mediana ms alta corresponde al centro 42.
5.6.5.- Grfico de tallo y hojas.
Combina la representacin numrica y la grfica. Es muy frecuente encontrar este grfico en las salidas de los
programas informticos. Es una especie de histograma horizontal cuyas barras estn construidas con los nmeros
correspondientes a las puntuaciones. Es muy frecuente encontrar este grfico en las salidas de los programas
informticos.
Se distinguen las hojas (normalmente el ltimo dgito de la puntuacin) y el tallo (el resto de dgitos),
ordenando en ambos las puntuaciones de menor a mayor. Por ejemplo, en una puntuacin de 98, el tallo es 9 y la
hoja 8. tambin se utiliza con decimales; 0,25 tendra un tallo de 0,2 y una hoja de 5.

TEMA 6.- MEDIDAS INDIVIDUALES.


6.1.- Introduccin.
Si bien resulta interesante saber como se comportan los grupos, un punto de mximo inters es la atencin
individual a cada una de las personas para proporcionarle toda la ayuda disponible. En este captulo hablaremos de
las puntuaciones individuales, de su interpretacin y de la necesidad de su transformacin para su mejor
comprensin.
6.2.- Puntuaciones directas: problemas de interpretacin y transformaciones permisibles.
La puntuacin directa (Xi), es la puntuacin que obtiene un sujeto al realizar una prueba o al aplicarle un
instrumento de medida.
Ej: un sujeto realiza dos test, separados en el tiempo. El primero tiene 40 preguntas y obtiene X 1=18, el
segundo tiene 20 tems y obtiene X 2=18. Estas puntuaciones no son comparables directamente, puesto que el
recorrido de la variable es distinto en las dos pruebas (41 frente a 21 respectivamente). En consecuencia, para
poderlas comparar correctamente, necesitamos transformar las puntuaciones. Veamos distintas posibilidades de
transformacin:
6.2.1.- Puntuaciones proporcionales y porcentuales.
Una forma rpida y sencilla de comparar una puntuacin directa (X i) con otra, es convertirlas en una
proporcin de respuestas (nmero de respuestas correctas / por nmero total de preguntas), o un porcentaje de
respuestas correctas (multiplicando la proporcin por 100).
Sin embargo, no siempre es posible ni pertinente hacer esta transformacin. Por ejemplo, si hemos construido
un instrumento para evaluar la calidad de un profesor a partir de la opinin de los alumnos y otro para evaluar la
actitud hacia el estudio, no se puede hablar de respuestas correctas e incorrectas.
Por otra parte, un sujeto que obtiene un 45% de respuestas correctas en una prueba objetiva se corresponde
con un resultado medio-bajo pero dicha afirmacin es discutible. Podra ocurrir que el test hubiese sido tan difcil,
que el sujeto que obtuvo un 45% de aciertos fue el mejor de su grupo. Entonces, quizs podramos interpretar que
esta puntuacin no fue tan mala.
6.2.2.- Las puntuaciones diferenciales.
Una puntuacin diferencial (x) es una puntuacin individual relativa a la media aritmtica del grupo de
referencia. Por tanto, para calcular una puntuacin diferencial es necesario haber aplicado un instrumento de
medida a un grupo de sujetos. Para calcularla, simplemente se le resta a la puntuacin directa del sujeto la media
aritmtica del grupo al que pertenece.
X = Xi X
Por tanto, una puntuacin directa superior a la media aritmtica, ser una puntuacin diferencial positiva,
mientras que si es inferior a la media, ser negativa.
Ahora bien, una puntuacin diferencial slo nos permite saber si una puntuacin est por encima o por debajo
de la media aritmtica. Son comparables dos puntuacioens diferenciales que proceden de distintos instrumentos
de medida? Es evidente que no es lo mismo separarse dos puntos de la media cuando tenemos un recorrido de 5
puntos que cuando el recorrido es de 100. Necesitamos, por tanto, una puntuacin que permita situar a un sujeto
con respecto a su grupo de referencia y hacer comparaciones independientemente de la amplitud del instrumento
del que procedan las puntuaciones directas que deseamos comparar.
Consecuentemente, las puntuaciones diferenciales no son muy utilizadas como puntuaciones individuales. Sin
embargo, s son muy utilizadas en el clculo de otras puntuaciones (puntuaciones tpicas) y de algunos ndices
como las medidas de variabilidad. Ntese que en el numerador de la frmula de la desviacin tpica hay una
puntuacin diferencial.
6.2.3.- Las puntuaciones tpicas.
Una puntuacin tpica (z) indica el nmero de desviaciones tpicas que se desva una puntuacin directa de la
media aritmtica. Las dos propiedades ms importantes de las puntuaciones tpicas son que la media de dichas
puntuaciones es igual a cero y la desviacin tpica igual a uno.
Ej: Supongamos que un grupo de sujetos tiene una media en CI (cociente intelectual) de 100 puntos y una
desviacin tpica s=10. Decimos que una puntuacin tpica indica el nmero de desviaciones tpicas (es decir, la
unidad de medida es la desviacin tpica) que se aleja una puntuacin directa de la media. Luego, si un sujeto
tiene una puntuacin directa de X i=110, cuntas unidades de desviacin tpica se aleja de la media? Es claro:
como la s=10, se aparta una s por encima de a media, luego su puntuacin tpica ser z=1.
Y qu puntuacin directa correspondera a una z=2? Una z=2 nos indica que la puntuacin directa del sujeto
se aleja 2 unidades de desviacin tpica por encima de la media, luego su X i se aleja 2 desviaciones tpicas (10 x 2
= 20) por encima de la media, as que su X i=100 + 20 = 120. Igualmente, un sujeto con una X i = 90 se aleja una
desviacin tpica por debajo de la media, luego su z = -1. Y al contrario: si un sujeto tiene X i = 100 su puntuacin
z=0, ya que al ser Xi = X, no se aparta de ella.
Las puntuaciones tpicas son muy utilizadas porque nos permiten comparar cualquier puntuacin entre s,
independientemente del instrumento de medida o de la amplitud de la escala utilizada.
Ej: (siguiendo el ejemplo de los dos tests). Podemos comparar los resultados si las convertimos en
puntuaciones tpicas, que son unas puntuaciones relativas a la media y la desviacin tpica del grupo, tal y como se
ve en la frmula siguiente:

Si en el test de 40 preguntas, la media es 23 y la desviacin tpica 5, y en el de 20 pregutnas la media es 9 y la


desviacin tpica 3, para comparar una puntuacin directa de 18 en los dos tests, podemos calcular su puntuacin
tpica en ambos aplicando la frmula anterior.
1823 189
z= =1 z= =3
5 3
Esto indica que ha destacado mucho ms respecto al grupo en el segundo test 8se aleja 3 desviaciones tpicas
por encima de la media) que en el primero (se aleja una desviacin tpica por debajo de la media, puesto que la z
es negativa).
Debe entenderse que una puntuacin tpica, como hemos dicho, es una puntuacin que depende tanto de la
media como de la variabilidad del grupo. En consecuencia, las puntuaciones tpicas variarn dependiendo de la
homogeneidad o heterogeneidad del grupo. Si un grupo es muy homogneo, su desviacin tpica ser pequea y,
por tanto, a una puntuacin que no se aleje mucho de la media le puede corresponder una puntuacin tpica mucho
mayor que la que le correspondera si el grupo fuese heterogneo.
Una de las utilidades ms importantes de las puntuaciones tpicas, tanto en estadstica descriptiva como
inferencial, es la correspondencia que existe ente estas puntuaciones y la distribucin normal. De esta forma, se
podr saber qu probabilidad existe de obtener determinada puntuacin.
6.2.4.- Puntuaciones tipificadas o escalas derivadas.
Las puntuaciones tipificadas consisten en una simple transformacin de las puntuaciones tpicas, creadas con
el nimo de evitar las puntuaciones decimales y las negativas. La transformacin se reduce a multiplicar por una
constante a la puntuacin tpica, valor que se convertir en la nueva desviacin tpica y sumarle otra constante,
valor que se convertir en la nueva media de las puntuaciones tipificadas:
T=az+b
donde:
b=X
a=s
z=puntuacin tpica.
Entre las puntuaciones tipificadas ms usadas, se encuentran las siguientes:
T =10z + 50
S = 2z + 5
Entonces, un sujeto con una puntuacin directa igual a la media tendr una puntuacin T = 50 y una S = 5.
6.2.5.- Las puntuaciones cuantiles.
Un cuantil indica el porcentaje de sujetos que deja por debajo de si una puntuacin determinada. Las
puntuaciones cuantiles ms utilizadas son los percentiles, que dividen una distribucin de frecuencias en 100
partes, de modo que el percentil 85, corresponde a aquella puntuacin directa que deja por debajo de si al 85% de
los sujetos de su grupo.
Otros cuantiles utilizados son los deciles (10 divisiones) y los cuartiles ( 4 divisiones). Como podr suponerse,
el percentil 75 (P75) es igual al cuartil 3 (Q3), el percentil 50 (P50) se corresponde con el decil 5 (D 5) y el cuartil 2
(Q2) con la mediana.
Un cuantil es una medida relativa al grupo de referencia. Es decir, un sujet opuede encontrarse en el P 90 y
tener una mala puntuacin en valor absoluto.
Los percentiles son utilizados para construir los baremos de los tests estandarizados. Estos baremos estn
construidos con muestras grandes de sujetos, generalmente muestras que pueden considerarse representativas de la
poblacin. De este modo, cuando aplicamos un test a un sujeto y transformamos su puntuacin directa en un
percentil segn los baremos del test, simplemente estamos situando al sujeto en una posicin (de 1 a 100) en
referencia al grupo normativo. Es decir, lo comparamos con lo que es normal en la poblacin.
Existen dos formas de obtener los percentiles:
- La forma ms sencilla, es el clculo de percentiles por el procedimiento llamado clculo directo. Los
percentiles se obtienen directamente al realizar la distribucin de frecuencias y multiplicar por 100 las
frecuencias acumuladas relativas (fac /N x 100); es decir, desde los porcentajes acumulados (redondeados,
sin decimales)
- En otras ocasiones hay que calcular el percentil pues no aparece en la distribucin de frecuencias. Por
ejemplo, para calcular la mediana (puntuacin de tendencia central que deja por encima y por debajo de s
al 50% de los sujetos de la muestra) necesitamos saber el percentil 50, o para calcular la desviacin semi-
intercuarlica necesitamos los percentiles 25 y 75 (cuartiles 1 y 3). El clculo de estos percentiles se
denomina clculo por interpolacin, siendo stos los nicos percentiles que se pueden expresar con
decimales. Para hallar el P25 se puede utilizar la frmula siguiente:
- Cm = percentil que queremos hallar.
- (CN)/100 = nmero de sujetos que se encuentran en el
percentil que queremos hallar.
- C = percentil a hallar.
- N = Nmero total de sujetos.
- fa(I-1) = cifra en la columna de Frecuencias Acumuladas
que no supere el resultado anterior [(CN)/100]
- fi = Frecuencia Absoluta del intervalo superior a fa(I-1)
- a1 = valor del intervalo (la diferencia que hay entre cada
nmero de la Puntuacin Directa)
- Linf = Lmite inferior del intervalo en el que se encuentra
fi. El lmite inferior se halla restndole 0'5 a la Puntuacin
Directa de dicho intervalo)
6.3.- Las puntuaciones individuales en la curva normal.
Una distribucin de frecuencias puede representarse grficamente mediante un polgono de frecuencias donde
el eje de las x representa las puntuaciones obtenidas por los sujetos y el eje de las y las frecuencias.
Entre las distintas formas que pueden adoptar las distribuciones de frecuencias en distintas variables, se
descubri que muchas variables adoptan un tipo de distribucin caracterstica que se denomina distribucin
normal o campana de Gauss. La curva normal es una distribucin terica, simtrica y asinttica, en la que los
puntos de inflexin corresponden con las puntuaciones tpicas + 1 y donde la media, la mediana y la moda
coinciden. Por tanto la puntuacin tpica (z) en este punto es cero.
En casi todos los textos de Estadstica se pueden encontrar las tablas de la curva normal con las
probabilidades asociadas a cada puntuacin tpica. La interpretacin de las tablas es muy sencilla. Tenemos que
pensar que una puntuacin tpica divide la curva normal en dos partes: una grande y otra pequea (excepto z = 0
que la divide en dos partes iguales).
En este caso, hemos utilizado la puntuacin tpica 1,25. Si trazamos una lnea vertical a partir de dicha z, el
rea de la curva normal queda dividida en dos partes. El rea mayor, lgicamente, es el rea ms grande que queda
al realizar dicha divisin, es decir, desde la lnea gruesa hasta . Por tanto, una puntuacin tpica igual a 1,25
tiene una probabilidad acumulada de aparicin de p = 0,8944 (ver tablas de la curva normal), esto es, el 89,44% de
los sujetos obtienen una puntuacin z 1,25. Consecuentemente, en este caso, el rea menor indica la
probabilidad de obtener una puntuacin z 1,25 (p = 0,1056).
Tambin podemos saber cul es la probabilidad de obtener una puntuacin entre la media y z=1,25 (p=0,3944
= 0,5 0,1056).
Si la puntuacin tpica hubiera sido z= -1,25, qu probabilidad existe de obtener una puntuacin igual o
inferior a dicha z [p (z 1,25)]? En este caso, puesto que la distribucin normal es simtrica, consultaramos el
rea menor de Z = 1,25 (p = 0,1056). Es decir, por la propiedad de simetra de la curva normal, p (z 1,25) = p
(z 1,25)] = 0,1056).
Evidentemente, la probabilidad de obtener una puntuacin superior a la media es de p=05, es decir, en la
curva normal el 50% de los sujetos se encuentran por encima de la media y el otro 50% por debajo (recordemos
que en las puntuaciones x la media siempre es igual a cero).
Cuando tenemos una distribucin normal, la obtencin de una puntuacin tpica superior a 2 o inferior a -2
puede considerarse una puntuacin extrema.
Del mismo modo, si tenemos una distribucin de frecuencias con puntuaciones directas y sabemos que dicha
distribucin es normal, nos basta saber su X y su s (desviacin tpica) para aplicar las propiedades de la curva
normal.
Ej: supongamos que tenemos un test de aptitud numrica (cuyas puntuaciones se distribuyen normalmente)
con una X=90 y una s=10. Mediante una simple transformacin podemos saber que la puntuacin directa que
corresponde a z=1 (se aleja una desviacin tpica por encima de la media) es X i=100 y que un sujeto con esta
puntuacin superar al 84% de los sujetos de su grupo (rea mayor p=0,8413) y es superado por el 16%. Este
sujeto se encontrar, por tanto, en el percentil 84.
6.3.1.- Las puntuaciones individuales normalizadas.
La puntuacin normalizada es la puntuacin individual que le corresponde a un sujeto si la distribucin de
frecuencias original es una distribucin normal. En el caso de que no lo sea, esta transformacin estar tanto ms
distorsionada cuanto ms se diferencie dicha distribucin de la normal
Concretamente suelen utilizarse cuando en un test conocemos la media y la desviacin tpica, pero carecemos
de los baremos. Si hemos aplicado un test en estas condiciones y sabemos o es razonable suponer que la
distribucin de frecuencias del test original era una distribucin normal, entonces, a partir de estos datos, podemos
construir fcilmente nuestros propios baremos.
Ej: supongamos que queremos aplicar un test de inteligencia y sabemos que este test fue aplicado
anteriormente a una muestra grande de sujetos, obtenindose una distribucin normal de las puntuaciones directas.
Conocemos tambin que en aquella aplicacin se obtuvo una media aritmtica de 100 puntos y una desviacin
tpica de 15 Cmo construir los baremos para interpretar las puntuaciones al aplicar nosotros el test?
Como sabemos que la distribucin es normal, nos bastara mirar en las tablas para saber a qu percentil
corresponde cada puntuacin tpica. Por ejemplo, el P 1 es aquella puntuacin que deja por debajo al 1 % de los
sujetos, por tanto, a una proporcin del 0,01 sujetos. Buscamos en las tablas de la curva normal p = 0,01 en el rea
de la parte menor y encontramos que corresponde a una z = -2,33 (esta es la z normalizada, es decir, la puntuacin
tpica correspondiente a dicho percentil si la distribucin es normal).
*Buscamos en el formulario el valor de p = 0,01 en la columna C y encontramos que corresponde a una z =
-2,33 (es negativa porque estamos trabajando en la parte izquierda de la curva, por debajo de la X)
Ahora aplicamos la frmula y despejamos:

Por tanto, una puntuacin directa de 65 equivale al percentil normalizado P 1.


Si la muestra es de 150 sujetos, a cuntos sujetos superara uno que obtiene una puntuacin directa de 65?
Simplemente multiplicamos el nmero de sujetos por la probabilidad de obtener una X i menor o igual a 65.
*Entrando en tablas con 2,33 y la columna C p = 0,01*; 150 x 001=1,5 (aproximadamente dos sujetos de
los 150 obtendran una puntuacin igual o inferior a 65).
A veces se utiliza otro tipo de puntuaciones normalizadas, consistentes en una agrupacin por intervalo de las
puntuaciones tpicas, utilizando la desviacin tpica como unidad de agrupacin. As, por ejemplo los pentas son
puntuaciones que dividen la curva normal en cinco partes, de modo que cada puntuacin penta (excepto los
extremos 1 y 5), contiene una desviacin tpica.
Tambin existen los eneatipos o estaninos que dividen la curva normal en nueve partes, por lo que cada uno
contiene media desviacin tpica.
Del mismo modo, se puede construir la escala 20 (los intervalos comprenden 0,25 desviaciones tpicas,
excepto los extremos) o cualquier divisin que creamos oportuna.

La utilizacin de estas puntuaciones en vez de los percentiles se justifica en muchas ocasiones porque los
instrumentos de medida que utilizamos no son tan precisos como para pensar que los sujetos son clasificables en
torno a 100 categoras ordenadas, por lo que resulta ms coherente disminuir el nmero de categoras de
clasificacin. De este modo, basta mirar en las tablas para saber que el estanino 5 comprende desde el P 40 al P60
(desde z= -0,25 a z=,25).
Como vemos, cuando consideramos que una distribucin emprica es normal, podemos deducir algunas
conclusiones basndonos en dicha distribucin terica:
- El porcentaje de sujetos que deja por encima y por debajo de s una puntuacin individual, o, lo que es lo
mismo pero dicho en trminos proporcionales: la probabilidad de aparicin de una puntuacin igual o
superior e igual o inferior a una puntuacin individual. Para ello basta con consultar las tablas de la curva
normall.
- En la curva normal (y slo cuando la distribucin es normal), existe una correspondencia directa entre
las puntuaciones tpicas y los percentiles y dems cuantiles. Un percentil indica el porcentaje de sujetos
que deja por debajo de s una puntuacin individual determinada. Por tanto, dada una puntuacin tpica,
basta mirar el rea que deja a su izquierda para transformarla en un percentil multiplicando dicha rea por
100 y redondeando el valor obtenido.
- Si tenemos una muestra de sujetos cuya distribucin de frecuencias es normal, nos basta con saber el
nmero de sujetos de la muestra, su media aritmtica y su desviacin tpica para saber cuntos sujetos se
encuentran por encima o por debajo de una puntuacin directa o entre dos puntuaciones directas. Basta
multiplicar la probabilidad encontrada por el nmero de sujetos de la muestra.
TEMA 7.- RELACIN ENTRE VARIABLES. LAS CORRELACIONES Y LA REGRESIN.
7.1.- Introduccin.
En los procesos de investigacin en Educacin, en muchas ocasiones, nos interesa conocer la posible relacin
que puede manifestarse entre dos ms variables.
7.2.- El concepto de correlacin.
El estudio de la variabilidad es fundamental en el campo de la investigacin educativa, sin sta no es posible
realizar trabajos empricos, pues es la que despierta la curiosidad de los investigadores por conocer los motivos
que la producen y as poder explicarla, adems, es importante recordar que sin la existencia de variacin no es
posible establecer relaciones ni contrastar hiptesis estadsticas. De esta forma, se recurre al anlisis de las
covariaciones entre las variables que son objeto de estudio.
KERLINGER (1985) afirma que la esencia de la ciencia son las relaciones entre variables, que se pueden
poner de manifiesto entre grupos, clases o conjuntos de objetos, pero que no cabe hablar de relaciones entre
variables midiendo solamente a un individuo. Cuando conocemos la relacin entre variables, pueden llegar a
formularse predicciones de una a partir de la otra. Ahora bien, esta relacin se puede establecer entre ms de dos
variables, que es un caso muy frecuente en la investigacin educativa.
Las situaciones que se pueden analizar pueden ser diversas, en concreto podemos citar tres opciones
diferentes:
- Estudiar la relacin entre dos o ms variables medidas en un mismo grupo de sujetos.
- Con dos o ms grupos de individuos comprobar el grado de relacin entre dichas muestras de los grupos
en una sola variable.
- Tambin se puede dar el caso de una misma variable medida en dos momentos distintos en una misma
muestra.
Una relacin simple entre dos series de datos, bien procedan de una variable medida en dos grupos o de dos
variables medidas en un mismo grupo o una misma variable medida en dos momentos distintos, se identificar
con la correlacin entre dos variables, sin establecer distinciones particulares.
La correlacin nos indica la tendencia de dos o ms conjuntos de datos a variar de forma conjunta. Para
cuantificar la intensidad de la correlacin contamos con el coeficiente de correlacin que nos mide el ndice de
covariacin o variacin conjunta de dos, o ms, series de datos.
En el anlisis de la correlacin entre dos variables, teniendo en cuenta la intensidad y el sentido de la relacin,
se presentan diferentes posibilidades que se expresan mediante un diagrama de dispersin. Veamos cada una de
ellas:
- Relacin perfecta positiva.
Se manifiesta en aquellos supuestos en que al aumentar los valores de una de las variables los valores de
la otra lo hacen siempre en la misma proporcin, grficamente se expresa as:

Quiz el ejemplo ms claro sea la elacin existente entre el dimetro de la circunferencia y su longitud.
As para el valor de 1 (dimetro9 la longitud de la circunferencia es 314; para 2 es 628; para 3 es 942.
De tal forma que todos los pares de valores parecen alineados. Su expresin cuantitativa sera +1 y, en
realidad, nos situamos ante lo que se conoce como una funcin: la longitud de la circunferencia es funcin
de la de su radio o de su dimetro.
- Relacin imperfecta positiva.
Se la conoce como relacin directa de variables, es decir, que a valores elevados en una variable le
corresponden valores altos en la otra; de tal forma que si se mide un grupo en dos variables distintas el
sujeto que punta alto lo hace en las dos variables y, a la inversa. Ahora bien, esa tendencia no mantiene la
proporcionalidad que se da en el caso anterior.

Dentro del campo educativo gran parte de las variables que estudiamos en la investigacin se identifican
con este supuesto. As se puede constatar una relacin directa entre el iempo dedicado al estudio y las
calificacioens alcanzadas, capacidad de razonamiento y rendimiento en Matemticas, ambiente del aula y
nivel de integracin de los estudiantes de Primaria, etc. Su expresin cuantitativa se sita entre los valores
0 y +1.
- Relacin perfecta negativa.
En este caso se manifiesta una relacin inversa entre las variables, de tal forma que al aumentar los
valores en una de ella, los de la otra disminuyen y lo hacen en la misma proporcin.

Resulta difcil poner un ejemplo en que se manifieste este supuesto, su expresin cuantitativa es -1.
- Relacin imperfecta negativa.
La identificamos con la relacin inversa entre variables, lo que supone que las puntuaciones altas en una
variable se corresponden con las bajas en la otra; o bien cuando los sujetos que puntan alto en un
momento lo hacen de forma baja en otro momento o prueba distinta.
Dentro del campo educativo se manifiesta esta opcin cuando se analiza la relacin entre la agresividad de
los sujetos y los resultados acadmicos, el tiempo destinado al estudio y el nivel de inteligencia, etc. Su
forma de expresin cuantitativa se sita entre los valores 0 y -1.
- Relacin nula o ausencia de relacin.
Esta ausencia de relacin se da cuando dos variables son independientes una de la otra (ello implica que
no existe una tendencia definida en los valores alcanzados por los sujetos), se puede decir que las
puntuaciones en las dos variables se deben a factores aleatorios.

Dentro del campo de la educacin se trata de aquellas variables que, al menos en apariencia, no guardan
ninguna relacin. Por ejemplo, el color de los ojos y las calificaciones en Lengua, la personalidad y el
tiempo de estudio, etc. La forma de expresin cuantitativa sera 0 (ausencia de relacin). Conviene
recordar que desde el punto de vista estadstico, ese valor (0) puede ser ms elevado, positivo o negativo,
pero que no sea significativo a un nivel de confianza fijado.
7.3.- El coeficiente de correlacin simple.
El coeficiente de correlacin, como ya hemos indicado, nos mide el valor de la covariacin o variacin
conjunta de dos series de datos. El valor de ese coeficiente nos marca la existencia de una relacin directa de
variables (valores positivos) o inversa (valores negativos), es decir, los valores cuantitativos del coeficiente se
sitan entre +1 y -1.
Ene l campo de la investigacin en educacin nos debemos engrentar al problema de cmo interpretar los
valore de esos coeficientes por no ser algo uniforme. Hemos de tener en cuenta que depende de diversos factores,
entre otros, del procedimiento empleado en su clculo y de la calidad de medida de las variables. Ello nos indica
que no es lo mismo una correlacin de 060 en unas variables u otras o en unos grupos de sujetos u otros. Aunque
existen diversas directrices en su interpretacin, en general, la mayor parte de los investigadores tienden a
identificar tres aspectos:
- El tipo de variables que se relacionan: cuando se da una similitud entre el valor del coeficiente
encontrado en el estudio emprico y el encontrado en el mismo grupo en trabajos previos, tambin cuando
se han encontrado unos valores elevados en anteriores estudios y se repite en la actualidad la misma
tendencia en los datos.
- La variabilidad del grupo: cuanto mayor es la variabilidad del grupo mayor ser el valor del coeficiente
de correlacin. As cuando tenemos dos coeficientes de 0,70; el que se haya alcanzado en el grupo ms
homogneo (el de menor variabilidad) se identifica con una mayor intensidad de la correlacin.
- La finalidad a la que se destina el coeficiente: as cuando el coeficiente se emplea para determinar la
fiabilidad de un instrumento de medida debe tener unos valores por encima de 0,85; en cambio para
determinar la validez con 0,60 puede ser aceptable, tambin se debe exigir un valor ms alto en la
prediccin que en la prueba de hiptesis.
Aunque no existe acuerdo entre los diferentes autores consultados se pueden establecer unos intervalos para
categorizar y valorar los coeficientes de correlacin. En la mayora de las ocasiones se suelen aceptar las
interpretaciones que se muestran en la tabla siguiente:
Asimismo se puede interpretar a travs del coeficiente de determinacin (d), cuyo clculo se realiza a partir
del coeficiente de correlacin (r) elevado al cuadrado y multiplicado por 100.
d = (rxy)2 x 100
Se interpreta como el porcentaje de varianza de una variable explicada por la otra:
Ej.: cuando obtenemos un coeficiente rxy = 0,70 entre el tiempo de estudio (X) y las calificaciones escolares
(Y), el valor del coeficiente de determinacin d=(070) 2=0,49; si lo multiplicamos por 100 sera 49%. Lo que se
interpreta como que ambas variables comparten un 49% de su varianza de las calificaciones escolares. Tambin
podemos extraer la conclusin de que nos queda un 51% que se podra explicar por otras variables distintas a la
analizada.
*(No se puede decir, en el contexto de la correlacin, varianza de una variable explicada por la otra, sino que
hay que hablar de varianza compartida. En una correlacin nunca podemos hablar de relaciones causa-efecto, sino
de variacin concomitante)*
En la investigacin en educacin la interpretacin de los coeficientes se suele completar con su significacin
estadstica. En realidad se trata de poder afirmar que la correlacin ente dos variables es real y no se puede
explicar por efecto del azar. En los clculos de los diferentes oceficientes de correlacin mediante los paquetes
estadsticos, junto al valor cuantitativo del coeficiente, aparece el valor de la significatividad estadstica.
La eleccin de los diferentes coeficientes de correlacin depende de dos aspectos:
- El nivel de medida de esas variables (aspecto ya estudiado en el captulo 2).
- La categora de masas.
En las pginas siguientes nos vamos a centrar en el estudio y anlisis de aquellos coeficientes de correlacin que
solemos utilizar con mayor frecuencia en el campo de la investigacin en educacin.
7.4.- El coeficiente de correlacin de Pearson (r).
Este coeficiente tambin recibe la denominacin de correlacin producto-momento y es uno de los ms
exigentes en su empleo. Se utiliza cuando las dos variables que se relacionan son cuantitativas, sean continuas o
discretas, medidas a nivel de intervalo, cumplirn el requisito de que se distribuyen normalmente y estn
linealmente relacionadas. Cuando esto ocurre, existe una marcada tendencia en los pares de datos a agruparse en
torno a la diagonal en un diagrama de dispersin.
Para llevar a cabo su clculo emprico existen diferentes frmulas, segn el tipo de puntuaciones con el que se
trabaje: puntuaciones directas, diferenciales y tpicas.

Ej: en la siguiente tabla se presentan las calificaciones de los estudiantes en Matemticas (variable X) y Fsica
(variable Y) en un grupo compuesto por 10 sujetos y que vienen recogidas en las tres primeras columnas. Para
facilitar los clculos posteriores, hemos aadido aquellas columnas que nos permiten calcular el correspondiente
coeficiente.
As, la columna X2 se calcula elevando al cuadrado cada uno de los valores de X: 7 2 = 49, lo mismo haramos
con Y2, 82=64. La columna XY recoge los productos cruzados de los valores de cada sujeto: 78 = 56; 54 = 20.
Las letras minsculas se refieren a las puntuaciones diferenciales que se explican en la siguiente pgina.

Dado que nos encontramos con dos variables cuantitativas continuas 8las calificaciones escolares), medidas a
nivel de intervalo y suponemos que distribuidas normalmente, pues, en general, las puntuaciones de los escolares
suelen tener una distribucin que se asemeja a la curva normal, debemos emplear el coeficiente de correlacin de
Pearson.
En relacin a la tabla anterior debemos recordar que las puntuaciones diferenciales vienen representadas por
letras minsculas, aunque previamente se deben calcular las medias de las dos variables del problema:
55 60
X= = 55 Y= =6
10 10
Para la variable X:
xi =Xi X
En el sujeto 1: x = 7-55 = 15.
En el sujeto 2: x = 5-55 = -05.
Para la variable Y:
En el sujeto 4: y = 7-6 =1
En el sujeto 5: y = 3-6 = -3

Segn la escala de valoracin que hemos presentado en pginas anteriores (tabla del tema 7.3) el valor de 077
est comprendido entre 071 y 090; por lo tanto podemos afirmar que la correlacin entre las calificaciones de
Matemticas y Fsica es alta. Ello quiere decir que aquel sujeto que alcance una calificacin elevada en
matemticas, tiene muchas posibilidades de repetir los resultados en Fsica.
7.5.- El coeficiente de correlacin ordinal de Spearman (rs).
En muchas de las variables que utilizamos con frecuencia en el campo educativo no es posible alcanzar unos
niveles precisos de medida, por lo que tenemos que recurrir a datos de otra naturaleza, si bien se expresan
mediante valores numricos. Se suelen emplear los puestos que ocupan las puntuaciones en una serie ordenada: el
orden de las calificaciones en una variable, la integracin de los estudiantes en las actividades de clase, las
actitudes ante un determinado problema social, etc. en todos los casos, dada la dificultad de alcanzar una exactitud
en las puntuaciones alcanzadas, nos interesa conocer la posicin, orden o rango que ocupan en una serie ordenada
de valores.
Ante esos casos en que las dos variables tienen la misma naturaleza, y adems con esos datos, solamente
podemos garantizar que alcanza un nivel de medida ordinal, importa el lugar que ocupa no la puntuacin obtenida,
debemos recurrir al coeficiente de correlacin de Spearman.
Ej: si el profesor observa el comportamiento de los estudiantes en su aula y les asigna una puntuacin en una
escala entre 0 y 50; en el moemnto de la puntuacin al sujeto que mejor se comporta lo califica con un 50 (rango
1), al siguiente con un 47 (rango 2), al siguiente con un 40 (rango 3) y as sucesivamente. Ahora bien, el resultado
hubiera sido el mismo si se hubieran asignado a esos sujetos, respectivamente las siguientes puntuaciones: 48
(rango 1), 45 (rango 2) y 38 (rango 3), naturalmente si entre esos tres no hay ningn otro sujeto. Adems, la
distancia entre las puntuaciones es arbitraria, es decir, el que punta como 10 frente al que punta como 20 no
quiere indicar que su comportamiento sea el doble de mejor o peor; pues en estos casos no pdoemos garantizar la
unidad constante de medida.
Para proceder a la transformacin de las puntuaciones obtenidas de la aplicacin directa del instrumento de
recogida de datos en rangos se suele comenzar asignando el rango o posicin 1 a la puntuacin ms alta, la
siguiente tendr el rango 2, la siguiente el 3 y as sucesivamente hasta alcanzar el ltimo sujeto, de tal forma que
el ltimo rango que se asigne debe coincidir con el nmero de sujetos de la muestra. En aquellos casos en que
exista ms de una puntuacin similar, la asignacin de rangos se realiza calculando la media de las posiciones que
les corresponden o esos dos, tres o ms sujetos. Tambin es importante recordar que el criterio de asignacin de
rangos empleado (de mayor a menor o de menor a mayor) en una de las variables o de los grupos debe ser el
mismo que en el otro, pues se trata de pares de puntuaciones que van asociadas y no independientes.
Aunque existen varios procedimientos de clculo, quiz una de las ms sencillas procede de la aplicacin de la
siguiente frmula:
n = nmero de sujetos o de pares de puntuaciones.
D = diferencia de rangos o posiciones que ocupa un mismo sujeto en dos variables distintas.
Por ejemplo, queremos conocer la correlacin existente entre los niveles de comprensin oral (variable X) y
los de expresin escrita (variable Y) evaluados mediante una escala entre 0 y 50 que ha establecido el propio
docente en su aula de Primaria. Los resultados se recogen en la siguiente tabla:

El coeficiente de correlacin ordinal de Spearman, segn la frmula de clculo, solamente exige transformar
las puntuaciones a rangos en las dos variables y con el mismo criterio, seguidamente determinar el valor de la
diferencia de rangos (D) y elevar cada una de las diferencias al cuadrado.
Ojo: Si coinciden puntuaciones directas,la asignacin del rango se calcula haciendo el promedio de las
posiciones que ocupa y el criterio de asignacin de rangos debe ser el mismo para ambas variables
En el ejemplo anterior se puede proceder a la asignacin de rangos de forma directa en las dos variables o bien
ordenar las puntuaciones e los sujetos en la variable X y acompaar de su puntuacin en la variable Y. Nosotros
hemos elegido el criterio de asignacin de rangos de mayor a menor, aunque hemos de recordar que se poda
haber realizado a la inversa. Se han sintetizado todos los clculos previos en la tabla siguiente:

Como este valor de la correlacin est por encima de 090 podemos decir que la relacin que se establece
entre la comprensin lectora y la expresin escrita es muy alta.
7.6.- El coeficiente de contingencia (C)
En el caso de variables de atributo o nominales, la mayor parte de los autores prefiere utilizar la expresin
grado de asociacin en vez de grado de correlacin. Se utiliza en aquellos casos en que se recogen datos de
variables clasificadas en categoras, as las tablas de contingencia reflejan una asignacin de sujetos a grupos y
categoras en cada una de las variables.
Dentro del campo educativo se suelen utilizar con relativa frecuencia y se las identifica como variables de
categorizacin, pues nos permiten estudios diferenciados en funcin de las categoras de esas variables.Podemos
citar: el nivel de estudios (primarios, secundarios, superiores); categora profesional (empresarios, autnomos,
profesiones liberales, funcionarios); lugar de residencia (ncleos rurales, ciudades de menos de 100.000
habitantes); sexo, etc.
En aquellos casos en que nos interese conocer el grado de asociacin entre dos variables de naturaleza
nominal, tambin denominadas categricas, tenemos que recurrir al coeficiente de contingencia que se denota con
la letra C.
En el clculo de C, debemos comenzar por determinar los valores de las frecuencias esperadas (en el supuesto
de independencia de las distribuciones) de cada una de las celdillas de la distribucin, es decir, nos muestra el
valor de la frecuencia si el hecho de pertenecer a un determinado grupo no incide en asignarse a una determinada
categora. Para ello se multiplica el nmero total de sujetos de esa fila (f f) por el nmero de sujetos de esa columna
(fc) y se divide entre el nmero total de sujetos de la muestra (ft).
Por su parte el clculo del estadstico Ji Cuadrado ( 2), mide el grado de discrepancia que se manifiesta entre
las frecuencias observadas o empricas (f o) con las que realmente se identifican los sujetos de la muestra y las
frecuencias esperadas o aleatorias (fe).
Finalmente, el clculo de C se realiza mediante la raz cuadrada del cociente de Ji Cuadrado entre el nmero
total de sujetos de la muestra (n) ms Ji Cuadrado. Esta frmula pone de manifiesto que este coeficiente nunca
alcanzar el valor de 1, pues en todo caso el denominador siempre ser superior al numerador. De hecho, para su
interpretacin se suele recurrir al Cmax, aunque la frmula slo es vlida en las tablas de contingencia cuadradas, es
decir, cuando el nmero de filas y columnas es el mismo (3x3, 4x4).
Como el nivel de asociacin aparece vinculado al grado de discrepancia entre las frecuencias observadas y las
esperadas, en la medida en que se manifieste una mayor coincidencia, los valores del coeficiente de contingencia
sern ms bajos.
Ejemplo: queremos conocer el grado de relacin que existe entre el tipo de estudios que han elegido 320
sujetos y el nivel socioeconmico en que se ubica su familia. Datos:

As pues, debemos comenzar con la determinacin de las frecuencias esperadas en cada una de las 9 celdillas.

Debemos recordar que la suma de frecuencias observadas y esperadas dentro de la misma fila o la misma
columna deben sumar lo mismo.
Vamos a reflejar todos estos datos en la tabla siguiente (los datos dentro del parntesis indican las frecuencias
esperadas).
A partir de los datos de la tabla anterior ya podemos calcular el valor del estadstico Ji cuadrado ( 2).

Ahroa bien, como nos encontramos ante una tabla de ccontingencia de 3x3, podemos determinar el valor del
C mximo, teniendo en cuenta que c se refiere al nmero de columnas, que lgicamente coincidir con el de filas.

Por lo tanto, dado que el valor de 0,81 equivaldra a 1 en otros coeficientes, podemos afirmar que el
coeficiente calculado 0,28 nos indica una relacin entre las variables nivel socioeconmico y eleccin de estudios
de tipo bajo. Otra cosa ser determinar si ese valor es estadsticamente significativo.
7.7 El coeficiente de correlacin biserial-puntual (rbp)
En aquellos supuestos en que la naturaleza de las variables sea distinta, los coeficientes son diferentes. As
cuando buscamos el grado de relacin que se manifiesta entre una variable cuantitativa, continua o discreta y otra
autnticamente dicotmica (las que por su propia naturaleza admiten slo dos categoras), debemos recurrir al
coeficiente biserial-puntual. En realidad, nos encontramos ante una extensin del coeficiente de correlacin de
Pearson.
Para determinar el valor de este coeficiente tenemos dos frmulas:

Dado que lo ms interesante es analizar la intensidad de la relacin entre esas variables es normal que, en la
gran mayora de las frmulas, en el numerador se determine la diferencia de medias en valores absolutos, con el
fin de evitar los valores negativos para la correlacin, pues al ser una de las variables dicotmica, el signo se
modificara invirtiendo el orden de las categoras.
Ej: ei queremos calcular el nivel de relacin que existe entre el rendimiento acadmico de los estudiantes de
Matemticas de un Curso de Secundaria medido mediante la aplicacin de una prueba objetiva de 50 tem, y el
sexo. Generalmente los datos de la variable continua suelen agruparse en intervalos de clase, de tal forma que se
construye la siguiente tabla.
Debemos calcular las puntuaciones medias de cada uno de los grupos y la media del total de sujetos,
necesitamos conocer la desviacin tpica del conjunto de puntuaciones y es preciso determinar la proporcin de
cada uno de los grupos en relacin al total. Para calcular los estadsticos reseados, es necesario realizar una serie
de operaciones previas con los datos, tal y como figuran en la siguiente tabla. Recordemos que X i es la marca de
clase de cada uno de los intervalos de la distribucin, adems identificamos con p a la categora femenina y q a la
masculina.

Determinacin del coeficiente de correlacin biseral-puntual, segn las dos frmulas anteriores y tomando los
valores absolutos de la diferencia de medias:

Segn la escala de valoracin de las correlaciones presentada en pginas anteriores, entre 0 y 020 se
considera que la relacin entre las variables es muy baja, indiferente o despreciable. En este ejemplo podemos
sealar que existe muy poca relacin entre el rendimiento en Matemticas y el sexo de los estudiantes.
**Puntualizacin Equipo docente** para una mejor interpretacin del coeficiente r bp , se puede eliminar el
valor absoluto del numerador. As quedara r bp = -0,20 y la interpretacin sera: correlacin de intensidad muy baja
negativa: al valor bajo en la dicotmica q=0=hombres, se asocia (con muy poca intensidad) un nivel ms alto en la
variable cuantitativa.
7.8 otros coeficientes de correlacin.
En el campo de la investigacin social y educativa se puede dar una diversidad de situaciones, adems de los
cuatro coeficientes explicados. Pretendemos dar unas pinceladas sobre otros coeficientes que, en determinados
contextos, pueden aportar una informacin ms rica y centrada en el problema de estudio.
7.8.1 el coeficiente phi ()
Este coeficiente se emplea cuando buscamos la existencia de relaciones entre dos variables dicotmicas,
aunque excepcionalmente se podra utilizar en algunos supuestos de variables dicotomizadas (es decir, variables
continuas que han transformado sus puntuaciones en dos categoras, generalmente el punto de dicotomizacin
suele ser la mediana).
Ej: queremos comprobar la existencia de relacin entre la pertenencia a un centro de enseanza (pblico o
privado) y las respuestas que nos ofrece una muestra de cada centro a un tem o elemento con dos alternativas de
respuesta (verdadero/falso), siendo la respuesta correcta la opcin verdadero. Datos globales:

Se trata de un valor insignificante, pues se encuentra muy prximo al 0, lo que nos indica la ausencia de
relacin entre el tipo de centro y el acierto en el tem que se analizaba.
7.8.2 el coeficiente de correlacin tetracrico (rt)
Se emplea en aquellos casos en que las dos variables son de tipo cuantitativo y continuo, si bien, por razones
de la propia investigacin se procede a su dicotomizacin. Este proceso consiste en dividir las puntuaciones de las
dos variables en dos categoras, generalmente se toma como punto de dicotomizacin la mediana.
BxC
rt =
AxD
En el numerador figura el producto cruzado de la diagonal donde coinciden los mismos signos, mientras que
en el denominador figura el cruce en que no coinciden los valores, es decir, son distintos. Una vez determinado el
valor de ese cociente se busca en la tabla asociada a la distribucin de los cocientes, donde nos muestra el valor
del coeficiente para un intervalo entre el que se encuentra el cociente emprico.
No obstante, existe otro procedimiento directo, si bien exige disponer de una calculadora que incorpore las
funciones trigonomtricas, en este caso el coseno, mediante la siguiente frmula:

El valor as obtenido es el coeficiente de correlacin.


Ej: comprobar la relacin entre las puntuaciones alcanzadas en matemticas (X) medidas a travs de las
calificaciones escolares en la escala 1 a 10 y las obtenidas en una prueba de razonamiento matemtico (Y)
mediante una prueba de precisin entre 1 a 100. Por conveniencia del investigador se decide dicotomizar las dos
variables:
Para proceden a la dicotomizacin debemos buscar la puntuacin que ocupa el lugar central (mediana) en cada
una de las series (entre el 10 y el 11).

Con estos dos valores de referencia construimos una tabla de contingencia:

Como este valor est comprendido entre 5389 y 5595 el valor del coeficiente de correlacin, segn la tabla,
es 059.

Segn los valores de la tabla, podemos indicar que existe una correlacin media, marcada o notable, por estar
comprendido entre 041 y 070, entre las calificaciones en matemticas y los resultados en la prueba de
razonamiento matemtico.
7.8.3 coeficiente de correlacin biserial (rb)
Este coeficiente se utilizada cuando se trata de establecer la relacin que existe entre una variable cuantitativa,
continua o discreta, y otra dicotomizada (recordemos que en el fondo subyace una variable continua que se divide
en dos categoras de forma artificial). As pues las dos variables son de naturaleza cuantitativa, una de las cuales es
presentada en escala de intervalo y la otra ha sido dicotomizada, y debajo de las cuales subyace una distribucin
normal.
Las ecuaciones de clculo son dos:

Donde necesitamos conocer la puntuacin media de cada uno de los grupos y la total, la desviacin tpica del
total de puntuaciones y los valores de p y q que son las proporciones de las dos categoras de dicotomizacin.
Con y representamos la ordenada en el punto en que se establece el cambio de categora, que viene recogido en la
tabla de valores de z o curva normal (primera columna).
Ej: queremos calcular el grado de relacin que existe entre las puntuaciones en una prueba de rendimiento
(prueba objetiva de 40 tems) y el nivel de integracin de los estudiantes de Secundaria que se ha evaluado
mediante un test, si bien, con los datos recogidos y teniendo en cuenta los baremos previos se han categorizado en
dos grupos: integrados (p) y no integrados (q). Resultados:
Segn las frmulas de clculo de la correlacin biserial (r b), es preciso proceder a realizar una serie de
operaciones con los datos que nos permitan obtener los valores de las medias de cada grupo y la total, la
desviacin tpica total y las proporciones; para facilitar esos clculos ofrecemos la siguiente tabla completa con las
operaciones previas de forma conjunta:

**Errata en la frmula**

Para establecer el valor de y, debemos tener en cuenta que se trata de una variable cuantitativa que se
distribuye siguiendo el modelo de curva normal (z). Por lo tanto, al conocer los valores de p (rea de la parte
mayor) y q (rea de la parte menor), buscamos en las columnas correspondientes a estos valores y, en la misma
fila, viene asociado el valor de y que es 03857 (por mayor proximidad a los dos valores).
As pues, las dos frmulas de clculo son las siguientes:

Segn las tablas de interpretacin de los coeficientes, al estar el valor 0255 comprendido entre 021 y 040
podemos indicar que se trata de una relacin baja o moderada.
7.9 la regresin lineal simple
La interpretacin de los coeficientes de correlacin se basa en la intensidad o el grado de esa relacin, desde
valores prximos a 0 hasta los que se acercan a 1, que indican la mayor intensidad. Esos valores permiten conocer
la varianza compartida, o sea la parte de la variabilidad de una de ellas explicada por la otra. Para su clculo se
eleva el valor del coeficiente al cuadrado y se obtiene el llamado coeficiente de determinacin.
Por tanto, es este coeficiente de determinacin el que hace posible que se puedan estimar los valores de una
variable conociendo los valores en la otra. Este procedimiento de estimacin es el que conocemos como regresin
lineal simple, cuya funcin primordial nos permite la prediccin. En el campo educativo, es de suma importancia
poder predecir las puntuaciones que puede obtener un estudiante en una determinada variable, conociendo los
resultados obtenidos en otra prueba con la que guarda un buen nivel de relacin. As pues, tratamos de predecir
puntuaciones en una variable sin aplicar el instrumento de medida, simplemente conociendo la relacin de esa
variable con otra y de la que tenemos los resultados de determinados sujetos.
Francis GALTON fue el primero que puso en prctica este tipo de anlisis.
Obtenemos as una relacin positiva y prcticamente lineal, conocida como la lnea de regresin y que se
emplea para llevar a cabo la prediccin o estimacin de los valores de una variable Y (variable criterio) a partir
del conocimiento de los valores de la otra variable X (variable predictora) con la que sabemos que mantiene un
buen nivel de relacin. El procedimiento de clculo de la cuanta de la ecuacin es la siguiente:

En esta frmula debemos tener en cuenta que a xy es una constante equivalente al valor de Y cuando el valor de
Xij
es igual a cero, es decir, es la distancia media sobre el eje Y desde el origen al punto donde la recta de
regresin corta a dicho eje. Mientras que byx nos indica la pendiente de esa recta de Y sobre X o coeficiente de
regresin de Y sobre X. La pendiente describe la razn del incremento de Y con respecto a X, es decir, es el
coeficiente medio del cambio de Y por unidad de crecimiento de X. Por su parte Xij nos muestra el valor de la
variable predictora. Las puntuaciones en Y se refieren a la variable criterio recogidas por observacin, que unidas
a la X forman la nube de puntos. Finalmente, la Yij se refiere a las puntuaciones pronosticadas e la variable
dependiente despus del ajuste de las puntuaciones Y en sujetos de otra muestra obtenidas a travs de la
correspondiente ecuacin de regresin.
La principal ventaja del anlisis de regresin se encuentra en que resume en una expresin simple gran
cantidad de informacin y permite a la vez conocer o predecir los valores que tomar la variable criterio
conocidos los valores de la variable predictora. Una aplicacin concreta de esta ecuacin la encontramos en el
siguiente captulo al estudiar la validez de las pruebas de medida.
TEMA 8.- APLICACIONES DE LA CORRELACIN: FIABILIDAD Y VALIDEZ DE LAS
MEDIDAS.
8.1.- Introduccin.
En el presente captulo vamos a analizar aquellos aspectos relacionados con las caractersticas tcnicas de los
instrumentos de medida. Para garantizar esos requisitos tcnicos, y que las interpretaciones sean adecuadas a la
realidad estudiada, es preciso que los instrumentos sean precisos en sus apreciaciones (fiabilidad), y que sirvan
para lo que realmente se disearon (validez).
Para finalizar, ofrecemos unas directrices para el estudio y anlisis de los elementos que configuran las pruebas:
ndice de dificultad, de homogeneidad y de validez.
8.2.- Estudio de la fiabilidad.
Entendemos que la fiabilidad de las medidas se identifica con la precisin, de tal forma que decimos que un
instrumento es fiable cuando mide algo con precisin, independiente de lo que se est midiendo. Aceptar esta
definicin lleva consigo contemplar la posibilidad de error en el momento de medir. Por ello, una puntuacin
observada en un sujeto podr descomponerse en dos partes: la que se corresponde con la puntuacin verdadera y
el posible error que se comete.
Se acepta que esos errores los podemos dividir en:
- Sistemticos: vienen asociados a las caractersticas internas del instrumento que afectara a todo lo que
se mida con l,
- Aleatorios: son debidos a aquellas variables cuyos efectos nos resultan desconocidos, se rigen por la ley
del azar: la magnitud de los errores viene condicionada por el margen de error o nivel de confianza con
que el investigador realiza sus apreciaciones. Naturalmente, cuando menor sea el error ms fiable es el
instrumento.
Tambin podemos expresar la fiabilidad como la constancia en las puntuaciones de los sujetos o bien la
concordancia entre varias mediciones sucesivas de una misma realidad; en cada uno de los casos nos vamos a
enfrentar a diferentes procedimientos de clculo de la fiabilidad, aunque en todos ellos se procede a la obtencin
de dos conjuntos de datos a partir de los cuales se puede determinar el coeficiente de correlacin que estime la
fiabilidad del instrumento.
8.2.1.- Procedimientos para determinar la fiabilidad.
Existen diferentes procedimientos de clculo de fiabilidad, as podemos establecer tres:
- Fiabilidad como estabilidad.
- Fiabilidad como equivalencia.
- Fiabilidad como consistencia interna.
8.2.1.1.- La fiabilidad como estabilidad.
Tambin se la identifica como procedimiento de la repeticin o del test-retest, dado que se busca la
correlacin que existe entre las puntuaciones obtenidas por un mismo grupo de sujetos, debidamente
identificados, en dos aplicaciones sucesivas de una misma prueba en dos momentos diferentes, entre ambas
aplicaciones debe transcurrir un tiempo, que no sea muy corto ni muy largo.
Si transcurre poco tiempo los sujetos pueden recordar las respuestas anteriores. Si transcurre mucho pueden
influir los efectos de la maduracin, la prctica del aula. Se suelen fijar entre 20-25 das de la primera a la segunda
aplicacin.
Ejemplo: un investigador est interesado en construir una buena prueba objetiva para evaluar a los estudiantes
de Estadstica en la Facultad de Educacin, para ello construye una prueba que consta de 20 tems. Realiza una
primera aplicacin a una muestra de 40 sujetos, transcurridos 22 das, vuelve a aplicar la misma prueba a los
mismos 40 sujetos, obteniendo:

Nos encontramos ante datos que proceden de una variable cuantitativa continua y cuyo nivel de medida lo
consideramos de intervalo (se aplica una prueba objetiva precisa); debemos establecer una correlacin entre las
puntuaciones de la primera aplicacin y los de la segunda. En este procedimiento deben estar perfectamente
identificados los sujetos de la muestra, pues se trata de obtener dos valores de cada uno de ellos.
Dada la naturaleza de los datos debemos recurrir al coeficiente de Pearson. As identificamos por X los
resultados de la primera aplicacin y por Y los de la segunda, de tal forma que nos queda la siguiente frmula
expresada en puntuaciones directas:

Una vez realizados los clculos previos de la suma de cada aplicacin, suma de cada una de las puntuaciones
elevadas al cuadrado y el producto cruzado de las puntuaciones de cada sujeto en las dos aplicaciones nos queda:

En este caso hemos alcanzado un alto ndice de fiabilidad, pues la correlacin entre la primera y la segunda
aplicacin es de 0923; as cuando los valores estn por encima de 095 se considera que la prueba tiene una muy
buena fiabilidad.
8.2.1.2.- La fiabilidad como equivalencia.
Tambin recibe la denominacin de formas paralelas; consiste en aplicar dos pruebas diferentes pero que
miden el mismo rasgo o caracterstica, de tal forma que los resultados de la aplicacin de la primera prueba se
correlacionan con los de la segunda, lo que nos permite calcular el coeficiente de correlacin o equivalencia entre
ambas puntuaciones.
Este procedimiento es difcil y complicado, sobre todo por los problemas que plantea encontrar pruebas
equivalentes, que tengan los mismos objetivos y que los contenidos y las condiciones de aplicacin sean similares.
Generalmente, se considera que son formas paralelas cuando coinciden en los siguientes aspectos: objetivos,
contenidos y forma de la prueba, grado de dificultad de los tems, mismas instrucciones para contestar la prueba,
nmero de elementos (longitud), duracin o tiempo de contestacin
Si el tiempo transcurrido entre la aplicacin de la prueba y la forma paralela supera los 20 das, los expertos
consideran que nos puede ofrecer el clculo de la fiabilidad como equivalencia y tambin como estabilidad, as el
ndice que obtengamos se conoce como de estabilidad y equivalencia. Si transcurre poco tiempo nos hallamos
ante el coeficiente de equivalencia.
Para calcular el valor del coeficiente debemos tener en cuenta el nivel de medicin de las respuestas, aunque
en la gran mayora de los casos se recurre al coeficiente de correlacin de Pearson.
8.2.1.3.- La fiabilidad como consistencia interna.
Los instrumentos de medida estn representados por una serie de elementos o tems bastante amplio; por ello
cabe esperar que cada uno de ellos medir una parte de ese rasgo o caracterstica que mide la prueba en su
conjunto; en consecuencia, es lgico suponer que existir una coherencia o consistencia en las respuestas que
ofrecern un conjunto de sujetos a los diferentes elementos que integran tal instrumento.
Este procedimiento tambin conocido de las mitades nos permite dividir la puntuacin total del sujeto en una
prueba en dos partes (mitades), bien eligiendo como criterio los tems pares y los impares o bien la primera y la
segunda mitad.
En realidad obtenemos dos puntuaciones para cada sujeto. En efecto: por un lado est la puntuacin que
corresponde a los tems impares y por otro la de los pares; de tal forma que estableciendo una relacin entre
ambas partes nos dar el coeficiente de fiabilidad como consistencia interna, si bien de un instrumento cuya
longitud es la mitad. Somos partidarios de utilizar este criterio de mitades, pues en muchas pruebas, y con el fin
de estimular las respuestas de los estudiantes, los tems ms fciles se colocan al comienzo de la prueba y los ms
difciles al final, por ello la divisin impares/pares recoger tems del comienzo y del final y ser ms equilibrada
que la primera y la segunda mitad.
Existen varios procedimientos para determinar la fiabilidad de una prueba por medio de la consistencia
interna. Para la ejemplificacin vamos a recurrir a los datos de la siguiente tabla, tambin recogemos todas las
operaciones previas con los datos; en los tres primeros procedimientos nos limitaremos a la aplicacin de las
correspondientes frmulas de clculo:
Ejemplo: se ha aplicado una prueba que consta de 30 tems a una muestra de 12 sujetos de Enseanza
Secundaria. Sobre esos datos queremos determinar el valor de la fiabilidad mediante la consistencia interna de esa
misma prueba; para ello, la puntuacin de cada sujeto se ha dividido en dos puntuaciones, una se corresponde con
los resultados de los tems impares (primera mitad: variable X 1) y la otra con los tems pares (segunda mitad:
variable X2). Con esos valores procedemos a calcular el coeficiente de consistencia interna.
- Procedimiento de Spearman-Brown.
Este procedimiento se basa en la correlacin entre las mitades, generalmente mediante el coeficiente de
Pearson, si bien esta correlacin referida a las mitades ha de ser corregida mediante una frmula sencilla para
calcular la fiabilidad de la prueba en su conjunto.
As pues:

Los subndices son iguales, pues se trata de una correlacin interna, dado que se establece una relacin entre
dos partes de la misma variable.
Adems rxx se calcula mediante el coeficiente de correlacin de Pearson entre las mitades, as llamamos X 1 a
las puntuaciones de los tems impares (1 mitad) y X2 a la suma de los tems pares (2 mitad).
Siendo:

Consideramos que este valor 093 se interpreta como que esa prueba tiene una buena fiabilidad, por endima de
090.
- Procedimiento de Rulon.
Este procedimiento se basa en la varianza de las diferencias, es decir, debemos comprobar la relacin entre la
varianza total del instrumento y la existente entre ambas mitades. Parece obvio que si los sujetos mantuvieran la
misma puntuacin en ambas, al valor 1 (correlacin perfecta, fiabilidad perfecta) le restaramos 0. A medida que
las diferencias entre las puntuaciones de los sujetos en las mitades es ms elevada, menor ser el valor del
coeficiente, tal y como se expresa en la siguiente frmula de clculo.

Para llegar a determinar el valor del coeficiente de fiabilidad debemos calcular previamente tanto la varianza d
ellas diferencias como la total. Como nos encontramos ante muestras pequeas (nmero de sujetos menor o igual
30), se debe dividir entre n-1.
- Procedimiento de Guttman.
Este procedimiento se basa en la varianza de las mitades, de tal forma que a menor valor las de varianzas ms
elevada ser la fiabilidad de la prueba. As pues la frmula de clculo es la siguiente:

Dado que trabajamos con los mismos datos y ya tenemos calculada la varianza total, solamente debemos
obtener los valores de las varianzas de las mitades (impares/pares):

Los tres procedimientos anteriores nos conducen al mismo valor del coeficiente de fiabilidad (093), dado que
su funndamento es el mismo, aunque en unos casos se calcula la correlacin y en otros las varianzas 1 de las
mitades o las diferencias y la total.
- Procedimiento de Kuder-Richardson.
Este procedimiento es distinto a los anteriores pues el clculo de la fiabilidad se realiza a partir de las
intercorrelaciones de cada uno de los elementos o tems, pues se divide la prueba en tantas partes como tems
posee; con ello obtenemos adems del coeficiente de consistencia interna, el coeficiente de homogeneidad.
Aunque existen varios procedimientos de clculo segn sea la naturaleza de los elementos (respuesta mltiple
o dicotmicos) y el grado de dificultad de esos tems, en estos momentos slo vamos a aplicarlo al supuesto de
tems dicotmicos, mediante la siguiente frmula:

ne = nmero de elementos de que consta la prueba.


p = proporcin de sujetos que aciertan.
q=1p
Esta operacin se debe realizar con cada uno de los tems, pues el valor que necesitamos es la suma de pq de
todos los elementos. El procedimiento es largo y laborioso, por ello se recurre a los clculos mediante los
correspondientes paquetes estadsticos en el ordenador.
En la mayora de los casos el valor alcanzado en el procedimiento de Kuder-Richardson suele ser ms bajo
que el calculado por las anteriores frmulas (en el ejemplo, con este procedimiento se obtiene 091 frente a los
093 anteriores, pero sigue siendo un valor alto para la fiabilidad de la prueba).

1 Merece la pena dejar constancia de la relacin entre varianza y correlacin. Cuando la varianza de dos series de
datos es nula, la correlacin tambin lo es: donde no hay varianza, no hay correlacin.
- Procedimiento alfa de Cronbach.
Este procedimiento de clculo de la fiabilidad se emplea con frecuencia cuando recurrimos como instrumento
de recogida de datos al cuestionario. Dada la dificultad de clculo manual, se suele recurrir a paquetes
estadsticos, entre ellos el SPSS. Su expresin matemtica es:

La fiabilidad de los cuestionarios est relacionada directamente con el nmero de tems del mismo, a mayor
cantidad de tems mayor fiabilidad.
Tras realizar los clculos con el ordenador nos da que = 09145, esto nos indica que ese cuestionario o
prueba alcanza un buen nivel de fiabilidad.
8.3.- Estudio de la validez.
Podemos afirmar que un instrumento es vlido cuando mide lo que dice medir y no otra cosa distinta. Ahora
bien, debemos indicar que ningn instrumento va a ser absolutamente vlido, sino que tendremos que matizar el
grado y la naturaleza de la validez.
En la investigacin socioeducativa existen diferentes enfoques o tipos de validez de los instrumentos de
medida y recogida de datos, en cada caso debemos recurrir a aquella validez que guarda una relacin ms estrecha
con el propio instrumento y la forma en que est configurado, as como la informacin que nos suministra.
Seguidamente pasamos a analizar de forma ms detallada las principales.
8.3.1.- La validez de contenido.
Dos son las cuestiones principales a resolver para determinar la validez de contenido de un instrumento: la
suficiencia y la representatividad de sus tems o elementos integrantes. Todo instrumento est compuesto por
cierto nmero de elementos relacionado a priori con el objetivo concreto que se quiere alcanzar, referidos a las
conductas, las opiniones, las actitudes y valores, etc. No obstante, ser muy difcil que en ese instrumento estn
recogidos todos y cada uno de los elementos relacionados con ese objeto, por lo que debemos conformarnos con
una parte debidamente seleccionada de los mismos.
Esta muestra ha de ser suficiente y representativa en funcin del universo de los tems relacionados con el
objeto de estudio.
- La suficiencia se relaciona con el nmero mnimo de elementos que debe incluir el instrumento, para tener
garantas de que comprende aquellos aspectos que son esenciales para el estudio.
- La representatividad, exige un conocimiento profundo sobre el tema, de tal forma que esas tareas sean
definidas con precisin y claridad, en ese caso ser ms sencillo proceder a la seleccin de los tems. En el caso de
que la relacin entre las tareas no sea tan directa, es conveniente elaborar una tabla de especificaciones realizada
por varios expertos, que ser sometida a estudio y crtica de aquellas personas que tienen un buen conocimiento
del tema que se analiza. A este proceso se le denomina validacin.
El investigador debe comprobar si los elementos o tems que integran esa prueba permiten recoger una
informacin vlida conforme a los objetivos marcados.
Aunque no existe una tcnica concreta para determinar la validez de contenido, en la investigacin
socioeducativa, se puede recurrir a varios procedimientos, como son la tabla de especificaciones y, sobre todo, la
opinin de jueces o expertos.
8.3.2.- La validez predictiva.
Nos permite conocer la capacidad que tiene la prueba para avanzar las expectativas sobre futuros hechos o
fenmenos; se pretende establecer predicciones sobre la variable que se mide o bien sobre los diversos aspectos
relacionados con ella. Su clculo se realiza estableciendo una correlacin entre las puntuaciones alcanzadas en la
prueba a validar por un determinado nmero de sujetos y los obtenidos en otra prueba denominada criterio.
La seleccin de la prueba tomada como criterio es una cuestin problemtica, pues debe ser una prueba ya
validada y que guarde una estrecha relacin con la prueba a validar. Naturalmente, es preciso que todos los sujetos
que responden estn previamente identificados, pues se trata de relacionar las puntuaciones de cada sujeto en las
dos pruebas.
Para proceder a su clculo estadstico es preciso determinar el coeficiente de correlacin entre ambas
puntuaciones; segn las caractersticas y los niveles de medida de la prueba y del criterio debemos recurrir al
coeficiente que mejor se ajuste a las mismas. Ahora bien, en la gran mayora de los casos, recurriremos al
coeficiente de correlacin de Pearson.
8.3.3.- La validez concurrente.
En realidad este tipo de validez es una modalidad de la predictiva, pues se calcula mediante una correlacin
entre las puntuaciones de los sujetos en la prueba a validar y el criterio externo. La diferencia estriba en que ambas
mediciones se llevan a cabo en el mismo tiempo, adems los resultados permiten realizar pronsticos a corto
plazo, es decir, de utilizacin inmediata. Mientras que en la predictiva no coinciden la aplicacin de la prueba y la
recogida de datos del criterio.
Los clculos del coeficiente de validez concurrente se realizan por el mismo procedimiento de la validez
predictiva. En cada caso el investigador tendr que revisar y definir con claridad el objetivo del instrumento de
medida para as elegir aqul tipo de validez que es el ms apropiado en cada situacin.
8.3.4.- La validez de constructo.
Tambin se denomina de elaboracin o de construccin, se refiere al objeto mismo de la medicin, es una
opcin interesante pues acude a la base del problema de la validez. No obstante, es la ms compleja y la que
requiere en su determinacin de procedimientos ms complejos y las tcnicas estadsticas ms elevadas. En
esencia, se trata de analizar la conexin que se manifiesta entre la teora en la que se basa la prueba y los tems
que la componen.
En la validez de constructo se comienza deduciendo aquellas consecuencias que se derivan del hecho que se
ponga de manifiesto o no la caracterstica que se estudia. Ello implica que se deben establecer una serie de
hiptesis iniciales, que, una vez comprobadas empricamente, nos ofrecer tanto la validez del instrumento como
la teora subyacente al instrumento. Cuando las hiptesis no sean confirmadas, se puede deber a que la prueba
carece de validez o a que es insuficiente. Tambin puede ocurrir que la hiptesis no est bien planteada o que la
propia investigacin no permita validar la hiptesis.
FOX: la validez de constructo es la capacidad que tiene el instrumento para distinguir entre aquellos grupos
cuyo comportamiento difiere en relacin a la variable estudiada. Esta forma de comprobacin del ajuste entre el
instrumento de medida y la realidad es posible cuando se recoja informacin sobre hechos o fenmenos. Cuando
nos enfrentamos a mediciones indirectas de la conducta, habr que encontrar aquellos indicadores de la variable
que es objeto de estudio.
8.3.5.- La validez aparente.
Tambin recibe la denominacin de validez didctica, y se refiere a la serie de aspectos externos de la prueba.
Por lo tanto, aborda la validez superficial pero sin entrar en disquisiciones profundas sobre lo que se est
midiendo. Aunque carece de inters cientfico para la medida, es conveniente tenerla en cuenta para conocer la
influencia sobre las respuestas de la muestra analizada. Por ejemplo:
- Un instrumento muy largo puede provocar rechazo o fatiga, y no reflejar opiniones y valoraciones reales.
- Si el formato es ms o menos atractivo, puede motivar a la persona que responde.
- El lenguaje ha de ser adecuado a la edad y cultura de las personas que responden.
- Las instrucciones para las respuestas deben ser claras y fciles de aplicar.
Contribuye a mejorar aquellos aspectos externos, cuya influencia puede ser relevante para alcanzar una mayor
participacin y que las respuestas sean vlidas.
8.4.- Estudio de los elementos o tems de una prueba.
Para tener las suficientes garantas cientficas de que la prueba que vamos a aplicar a un grupo de sujetos es la
ms adecuada, es preciso conocer el comportamiento de cada uno de los tems que la componen. As se podrn
eliminar aqullos que no pasen el control o aadir otros que s cumplan esos requisitos. En el mbito
socioeducativo se recurre a tres ndices: el de dificultad, el de homogeneidad y el de validez.
Estos ndices no son aplicables a las pruebas de medida de actitudes.
8.4.1.- El ndice de dificultad (ID).
La dificultad de los elementos depende del grupo de sujetos que lo conteste y se expresa numricamente por el
nmero de ellos que los resuelven satisfactoriamente, de tal forma que cuando es contestado bien por un nmero
pequeo de sujetos ese tem ser muy difcil y, a la inversa, si prcticamente todos lo responden acertadamente ese
elemento ser muy fcil. En este sentido se suele aceptar que una buena composicin de una prueba debe
contemplar la siguiente distribucin de elementos:
- Muy fciles: 10%
- Fciles: 20%
- Normales (dificultad media): 40%
- Difciles: 20%
- Muy difciles: 10%
Desde un punto de vista ms pedaggico, es lgico que los elementos ms fciles se ubiquen al comienzo de
la prueba, de tal forma que prcticamente todos los pueden responder y les sirva de estmulo para los siguientes;
mientras que los ms difciles se situaran en la parte final; a ellos llegaran una parte de los sujetos, adems de la
influencia del tiempo en las pruebas de velocidad.
Cuando se pretende evocar una respuesta, la calificacin final ser igual al nmero de aciertos de cada sujeto,
en este caso los errores no penalizan, por ello el ndice de dificultad se calcula de la siguiente forma:

A = nmero de sujetos que aciertan el tem.


n = nmero de sujetos que lo intentan.
En el supuesto de que la prueba est compuesta por tems es decir (entre varias opciones) elegir la correcta,
los errores penalizan, pues se deben corregir las respuestas ofrecidas al azar.

Donde E se refiere al nmero de errores en la prueba y na es el nmero de alternativas de respuesta que se


ofrecen. As, en una prueba con tres alternativas de respuesta, por cada dos errores en los tems, se descuenta un
punto de los aciertos; por ello se recomienda que se conteste a los elementos en que se tenga seguridad, se
arriesgue en alguno y por supuesto que no conteste los que no conoce.
Para este caso de elementos de varias alternativas de respuesta la frmula que debemos aplicar es la siguiente:

Segn estas frmulas de clculo, este ndice oscilar entre 0 y 1, de tal forma que cuando el valor se aproxima
a 1, ser muy sencillo y contestado acertadamente por la mayora de los sujetos, mientras que si se aproxima a 0 el
elemento ser muy difcil.
Para proceder a la interpretacin de los ndices de dificultad de los tems se suelen emplear cinco categoras:
- Muy fciles: ID por encima de 0,75
- Fciles: ID comprendido entre 0,55 y 0,75
- Normales: ID comprendido entre 0,45 y 0,54
- Difciles: ID comprendido entre 0,25 y 0,44
- Muy difciles: ID por debajo de 0,25
Por lo tanto se trata de un tem normal o de dificultad media por estar comprendido entre 045 y 054.
8.4.2.- El ndice de homogeneidad (IH).
La homogeneidad de los elementos pone de manifiesto la coherencia de cada uno de ellos con el total de la
prueba, si sta mide un rasgo o caracterstica es lgico que cada uno de los tems mida hasta cierto punto lo
mismo. Por ello se debe calcular el valor de la correlacin entre cada elemento y el conjunto de los dems, as
pues, cuanto mayor es el coeficiente entre ambas puntuaciones, mayor ser la homogeneidad. El coeficiente de
correlacin depender del tipo de datos que nos proporciona la prueba y la forma de respuesta de cada elemento.
Si los tems son dicotmicos se utilizara el coeficiente biserial-puntual, en otros casos se podr emplear el
coeficiente biserial o el tetracrico. Ahora bien, el valor de este coeficiente debe ser corregido mediante la
siguiente frmula:

donde rAB es la correlacin entre el tem y el total, s A la desviacin tpica de las puntuaciones en la prueba, s B
la desviacin tpica en el tem que se calcula sB = pq
Ejemplo:

Podemos concluir que efectivamente este elemento es homogneo con el resto de la prueba y puede ser
seleccionado dado que el valor es superior a 020. un exceso de homogeneidad puede hacer innecesarios ciertos
tems y, en ocasiones, puede repercutir negativamente sobre la validez, sobre todo si la caracterstica medida es
compleja.
8.4.3.- El ndice de validez (IV).
Los elementos de la prueba se consideran vlidos cuando miden lo que dicen medir y no otra cosa. Ello exige
la existencia de una relacin clara entre las puntuaciones obtenidas por los sujetos de la muestra en cada uno de
los tems y las alcanzadas en el criterio de validez, cuanto mayor sea esta relacin, mayor ser el (IV).
Para seleccionar el coeficiente de correlacin ms adecuado habr que tener en cuenta las condiciones de los
datos, tanto las referidass a los elementos como al criterio. Pueden usarse los coeficientes biserial-puntual
(dicotmicos), el biserial, el tetracrico o el Phi. Generalmente, se consideran satisfactorios aquellos tems cuyos
valores del IV sean iguales o superiores a 020.
TEMA 9.- MODELOS ESTADSTICOS Y PROBABILIDAD. LA CURVA NORMAL DE
PROBABILIDADES.
9.1.- Presentacin.
La tendencia de los seres humanos a representar la realidad es un hecho evidente.
Esa tendencia a veces se convierte en necesidad; cuando la realidad a describir o explicar no es directamente
apreciable por sus caractersticas (dimensiones, cualidades), cuando lo representable es una realidad del pasado o
cuando su complejidad es muy elevada; en estos y otros casos, el hombre necesita contar con alguna forma
intuitiva de acercamiento a la misma.
En nuestro mbito de reflexin, los modelos cumplen en gran medida con esa funcin, nos van a permitir
adentrarnos en la comprensin de la realidad, acercarnos a su explicacin y hasta tomar determinadas decisiones
en el campo de la prueba de hiptesis.
9.2.- Introduccin.
El Diccionario de la RAE nos acerca a la complejidad de este concepto al presentar hasta once acepciones.
La cuarta definicin (esquema terico, generalmente en forma matemtica de un sistema o una realidad
compleja, que se elabora para facilitar su comprensin y el estudio de su comportamiento) est muy prxima al
sentido que, por lo general, se atribuye al concepto de modelo en nuestro mbito de reflexin. De una parte, nos
hace ver la dimensin terica y su componente matemtico; de otra, la nota de complejidad: y, junto a ello, su
sentido y utilidad.
Es frecuente entre los autores hacer mencin de la relacin entre teora y modelo, aunque no hay acuerdo en
lo relativo a la direccin de tal relacin; para algunos, nuestro concepto puede ser considerado sinnimo de aquel,
por lo que sera perfectamente prescindible; para otros, la realidad es muy diferente: el modelo se construye a
partir de los hechos observados.
Sea un caso o el otro, a partir de un determinado momento, el modelo basado en la teora debe funcionar bien
en la realidad, y el modelo surgido de la realidad debe encontrar una teora que lo respalde.
Entre realidad y modelo debe existir una ntima relacin y no cabe pensar en una sin tener en cuenta el otro.
Un modelo que no explique con razonable adecuacin la realidad, no nos sirve. Una realidad para la que no somos
capaces de encontrar un modelo que la represente con fidelidad, nos hace muy difciles tanto su comprensin
como la toma de decisiones en torno a la misma. Y es que si una cualidad deben tener los modelos es la de resultar
tiles, precisamente por la fidelidad con que representan tal realidad
Ahora bien, tal utilidad deriva de una caracterstica propia de la teora, como es su comprobabilidad. Si la
teora es correcta, se podr contrastar con la realidad; es ms, precisamente por ello, cuanto se repite un
procedimiento emprico, como es el contraste de hiptesis, cabe esperar no tanto los mismos resultados cuanto
unos resultados compatibles con los primeros.
9.3.- Modelo.
Modelo es una representacin de la realidad, con frecuencia de las relaciones que se dan en la realidad
representada; la forma en que la representa puede ser muy variada: desde una representacin icnica (un cuadro,
una escultura...), a la matemtica, en la que, mediante frmulas, se establece una igualdad, ms o menos compleja
pasando por la analgica, en la que, mediante esquemas, diagramas y representaciones de diverso tipo, nos es
permitido acercarnos a la comprensin de realidades abstractas y muchas veces slo observables a travs de
aparatos complejos, como puede ser el caso del sistema solar o del tomo.
Todo modelo es una representacin simplificada de la realidad a la que se refiere. Este hecho debe ser tenido
en cuenta, an en el caso de modelos icnicos, como una estatua o una fotografa, no queda representada la
realidad compleja del ser representado sino una parte, la externa, y solamente en su aspecto observable.
No obstante esta limitacin, si el modelo es adecuado, y dada su relacin con la teora en que se sustenta, las
propiedades del modelo pueden ser aplicadas a la realidad emprica. Y aqu reside su importancia y su gran
utilidad: siempre que se cumpla que una realidad es razonablemente bien representada por un modelo, las
cualidades de este, con una base terico-cientfica, se pueden aplicar a aquella, haciendo posible su comprensin
ms all de lo externamente visible, haciendo posible su comprensin ms all de lo externamente visible,
facilitando la explicacin de la realidad y permitiendo tomar decisiones de gran relevancia.
9.3.1.- Utilidad de los modelos.
La complejidad de los fenmenos humanos es sumamente superior a la de los fsicos; por ello, cualquier
prediccin a partir de los modelos est limitada por todo lo que representa esa complejidad y, sobre todo, por el
don de la libertad humana, que siempre admite hasta la posibilidad de ir en contra del bien propio.
Si bien las predicciones a partir de modelos difcilmente pueden aplicarse a sujetos concretos, s pueden
predecirse las tasas de incidencia de un determinado fenmeno en trminos de porcentajes y, siempre,
debidamente moderadas a travs de la probabilidad. As, no tiene sentido decir si una persona concreta morir o
no en la carretera en un determinado fin de semana, pero Trfico puede estimar, con el determinado riesgo de
error, por lo general bastante reducido, cuntas personas morirn en un fin de semana.
En nuestro campo, si somos capaces de establecer modelos suficientemente cercanos a la realidad, podremos
hacer predicciones del tipo de las anteriores, tales como el porcentaje de suspensos en el aula, o de nios
violentos en una determinada poblacin escolar.
9.3.2.- Modelos matemticos y modelos estadsticos.
Por lo general, se considera que un modelo estadstico es un tipo de modelo matemtico el que se incorpora
como componente fundamental la probabilidad.
Los modelos matemticos se expresan mediante igualdades que reflejan la relacin existente entre los
componentes de la realidad. La funcin es un modelo matemtico; de todos es conocido que la longitud de la
circunferencia es funcin de la de su radio multiplicada por la constante 2, as: C=2r
Como puede apreciarse se da una relacin determinstica entre C y r: conocido el valor del radio establecemos
cules es el valor que, seguro, alcanzar C.
Un modelo matemtico clave en nuestro campo es la campana de Gauss, cuya funcin es la siguiente:

esta frmula puede escribirse del siguiente modo, conocido como distribucin normal tipificada [z = (X i -
media aritmtica)/desviacin tpica]:

Los valores de cualquier ordenada se pueden calcular, para cada distribucin emprica de N datos, conociendo
el valor de su media aritmtica y los de la media y desviacin tpica de la poblacin de la que se obtiene la
muestra ( y respectivamente).
Los modelos estadsticos parten de un supuesto: las relaciones entre ambos trminos de la igualdad no son
determinsticas o necesarias, sino estocsticas. En consecuencia, toda prediccin asume un cierto riesgo de error,
un error que se considera aleatorio. Los errores aleatorios tienden a compensarse y su magnitud puede estimarse.
Si un modelo matemtico como el siguiente establece una relacin funcional necesaria:
(Y1 , Y2 , Y3 , , Yi ) = f(Y1 , Y2 , Y3 , , Yi )
en el caso de un modelo estadstico nos encontraramos con:
(Y1 , Y2 , Y3 , , Yi ) = f(Y1 , Y2 , Y3 , , Yi ) + e
Aqu, e es el error que afecta a la prediccin. Como podemos comprender, el inters de los estadsticos es
reducir a su mnima expresin tal valor, siendo la meta alcanzar e 0. La anterior expresin se conoce como
Modelo Lineal Clsico.
9.4.- Probabilidad.
Hay una diferencia esencial entre los fenmenos determinsticos o necesarios y los aleatorios y estocsticos,
regidos por las leyes de la probabilidad.
9.4.1.- La estadstica.
La estadstica ha sido definida desde dos perspectivas diferentes:
- Como un conjunto de datos numricos que se refieren a un conjunto de sujetos.
- Como la ciencia de recoger, analizar e interpretar tales datos. Esta segunda acepcin sita a la estadstica
como una rama del saber matemtico.
Puede parecer chocante que el objeto de la Estadstica sean los fenmenos aleatorios, sobre todo si tenemos en
cuenta que, segn la RAE, tal concepto tiene que ver con los juegos de azar y se refiere a los sucesos fortuitos.
Una explicacin razonable la encontramos en KERLINGER, para l: el principio bsico de las pruebas
estadsticas de significacin puede resumirse en una sentencia: comparar los resultados obtenidos con los
esperados al azar. Cuando los resultados de una prueba estadstica superan a lo esperado por puro azar, se
aceptar que el fenmeno en cuestin no se explica por el azar sino por la accin del investigador, sometida a
contraste en condiciones controladas y analizada mediante tal prueba.
9.4.2.- La probabilidad.
Como podemos apreciar, aleatoriedad y probabilidad son dos conceptos ntimamente ligados. A los
fenmenos determinsticos no se les aplica la probabilidad: son fenmenos que ocurren porque tienen que ocurrir
necesariamente. Pero los fenmenos aleatorios, que ocurrirn o no, antes de que ocurran pueden ser ms o menos
probables. Todos entendemos que es ms fcil que nos toque la lotera si jugamos 1.000 nmeros que si solo lo
hacemos con uno. Pero tambin sabemos que una persona que juegue un solo nmero, le puede tocar el gordo,
mientras a la otra no le corresponda ni el reintegro.
He aqu la diferencia entre dos conceptos de probabilidad:
- Probabilidad a priori: antes de que ocurra un fenmeno podemos estimar las probabilidades de que ocurra o
de acertar una prediccin.
- Probabilidad a posteriori: cuando los fenmenos ya han ocurrido, podemos establecer la probabilidad de
ocurrencia de tal fenmeno. Esta probabilidad se calcula empricamente y se traduce en la frecuencia relativa con
la que ocurre tal fenmeno cuando se repite un elevado nmero de veces en las mismas condiciones.
9.4.2.1.- Probabilidad a priori y a posteriori.
La probabilidad a priori se establece sobre la base del nmero de casos favorables dividido por el numero
de casos posibles. Ej: Si en la lotera nacional se juega con 90.000 nmeros y una persona juega con un nmero, la
probabilidad a priori de que le corresponda el primer premio ser de 1/90.000.
Esta probabilidad a priori es la base de la probabilidad matemtica, de la probabilidad en trminos tericos.
Para muchos fenmenos no tenemos claro cules son las probabilidades a priori, pero podemos llegar a
establecerlas a partir del estudio de la realidad; tendremos, eso s, que partir de unos estudios suficientemente
amplios para que nuestras estimaciones se acerquen a la realidad.
Cuando estudios reiterados vienen a arrojar resultados compatibles, es posible establecer la probabilidad a
priori de tal fenmeno. Y, a partir de ah, hacer estimaciones sobre la probabilidad de que, en ocasiones sucesivas,
ocurra un determinado acontecimiento. Como se puede apreciar, ambos enfoques tienden a ser complementarios.
Es ms, si los datos empricos tienen un tamao suficiente, ambos resultados tienden a coincidir.
9.4.3.- Clculo de la probabilidad.
Calcular la probabilidad de un fenmeno puede ser tan sencillo como en los casos anteriores (lotera o dados),
pero tambin puede resultar sumamente complejo y requerir una formacin matemtica y estadstica que no
consideramos necesarias. Sin embargo, s parece conveniente que el lector conozca los siguientes trminos:
- Espacio Muestral: es el conjunto de todos los resultados posibles de un fenmeno. El valor de un
determinado espacio muestral puede ser establecido fcilmente en los casos de los dados o similares, acudiendo a
la teora de conjuntos. Tambin puede establecerse mediante rboles, esto es, diagramas en los que se presentan
todas las combinaciones posibles cuando, por ejemplo, se tiran dos dados, tres dados, cuatro a la vez.
Ahora bien, junto a casos como ese hay otros ms complicados. Conviene acercarnos al tema, aunque de
forma breve.
Cuando dos conjuntos, A y B, no tienen elementos en comn, decimos que A B = ; donde la probabilidad
del conjunto A o del conjunto B es igual a las probabilidades combinadas de A y de B, y se lee A interseccin con
B, es igual al conjunto vaco. Entonces:
p (A B) = p (A) + p (B)
Pero esto no es lo normal, pues se da con bastante frecuencia que dos o ms conjuntos tengan elementos en
comn.
Ej: cuando una muestra de personas que abusan del alcohol lo hacen tambin de las drogas. Si las muestras
obtenidas nos dan 34 del conjunto A (abuso de alcohol), 18 del B (abuso de drogas) y 4 que lo hacen de ambas
sustancias, la ecuacin A B = no es correcta, debiendo sustituirse por A B . En este caso la ecuacin
ms general para los clculos es:
n (A B) = n (A) + n (B) n (A B)
que nos permite obtener la ecuacin siguiente para el clculo de la probabilidad:
p (A B) = p (A) + p (B) p (A B)
A partir de aqu podemos entender los otros conceptos necesarios:
- El fenmeno de la Exhaustividad o Agotamiento se produce cuando los diferentes subconjuntos (dos o ms)
son subconjuntos del espacio muestral y todos ellos juntos lo agotan, lo cubren por completo. En tales situaciones,
dado que el conjunto queda agotado a travs de todos los subconjuntos, su probabilidad es 1.
Ejemplos: tal puede ser el caso del conjunto de estudiantes de un colegio que obtienen toda la gama de
calificaciones, desde 0 a 10. Entonces, las sumas de las probabilidades de cada una de las calificaciones ser 1,
porque todos los subconjuntos agotan el conjunto de calificaciones.
Sin embargo, si a un grupo de jvenes preguntados por sus preferencias musicales se les ofrecen varias
opciones, pero no aparece un tipo concreto, pero alguno o algunos de ellos lo eligieran, el nmero de casos de
cada uno de los subconjuntos no agotara el conjunto de preferencias musicales, lo que impedira obtener las
probabilidades de cada subconjunto porque faltan algunos elementos del espacio muestral.
- Mutua Exclusin: dos acontecimientos son mutuamente excluyentes cuando su interseccin es un conjunto
vaco. Dado que, en tal caso A B = , las probabilidades de cada subconjunto pueden sumarse.
- La Independencia , supone que la probabilidad de que ocurra el fenmeno conjunto es igual al producto de
las probabilidades de cada uno por separado:
(A B) = p (A) . p (B)
La independencia es una de las condiciones o supuestos de algunas de las pruebas ms utilizadas en el
contraste de hiptesis. La violacin de este supuesto puede ser muy grave porque podemos estar asignando a los
resultaddos unas probabilidades que nos permitan o no rechazar la hiptesis de nulidad cuando, en realidad, tal
decisin es equivocada.
- Precisamente por este hecho, conviene analizar el concepto de Probabilidad Condicional. En nuestro mbito
de trabajo es bastante frecuente encontrarnos con acontecimientos relacionados, es decir, no independientes.
Sealbamos ms arria que, en determinados casos A B . Este hecho puede deberse a que A y B estn
relacionados. Pues bien, nos situamos ante el fenmeno de la probabilidad condicional si deseamos conocer la
probabilidad de un determinado acontecimiento o suceso cuando el otro es conocido (por ejemplo: cul es la
probabilidad de aprobar la asignatura de Fsica si se aprob el pasado curso la de Matemticas?
El smbolo de la probabilidad condicional es, p(B|A) y la frmula correspondiente:
p( A B)
p ( A|B ) =
p(B)
El resultado cambia respecto de otras situaciones dado que el denominador no es el espacio muestral total sino
el dato conocido (probabilidad del fenmeno B).
9.4.3.1.- El caso de las variables aleatorias continuas y discretas.
Para el clculo de ese espacio muestral debemos distinguir el caso de las variables aleatorias discretas y el de
las variables aleatorias continuas.
Una variable cuantitativa es discreta cuando no puede adquirir todos los valores posibles, es decir, cuando el
conjunto de sus valores es numerable. Ej: el nmero de alumnos de un aula, que deben ser nmeros enteros, no
podemos hablar de 19,3 alumnos (aunque ese valor puede resultar de dividir el nmero de alumnos de diversas
clases por el nmero de clases, siendo su media aritmtica).
Una variable cuantitativa es continua cuando admite un nmero no numerable de casos o valores. Ejem: las
calificaciones de los alumnos, al menos en teora, pueden admitir infinitos valores entre 0 y 10. Cuando la variable
aleatoria es continua, admitimos que, aunque slo utilicemos algunos valores, los enteros y, tal vez, algunos
decimales, en realidad cabra utilizar ese nmero infinito.
Podemos hacernos una idea de esta realidad si representramos una serie de datos mediante histogramas de
base igual a 1. A partir de tal situacin, podramos encontrarnos con datos cuya base fuera 05 o 03 o 01 hasta
llegar a tener como base un punto. Por tanto, habramos pasado de una serie de rectngulos de base ms o menos
ancha a una curva que unira los infinitos puntos posibles de esa distribucin. Las siguientes figuras nos permiten
apreciar intuitivamente este fenmeno:

Esas sucesivas representaciones grficas tendran determinadas cualidades, que nos van a permitir establecer
dos valores de probabilidad: la funcin de probabilidad y la funcin de distribucin.
Esas cualidades son:
- El rea ocupada por ambas representaciones tiene como valor la unidad.
- En todos los casos, las representaciones tienen siempre valores positivos, esto es, no presentan valores
por debajo del eje de abcisas.
- En aquellos casos en que la representacin lo es en forma de histograma, con barras de base ms o
menos amplia, el eje de abscisas representa una variable aleatoria discreta.
- Cuando la base son puntos y la representacin es una curva, estamos ante una variable aleatoria
continua.
En el caso de las variables aleatorias discretas, el rea que queda entre dos valores, A y B, nos indica la
proporcin de casos del total enmarcados en tales valores. En el caso de variables cuantitativas continuas, ese
espacio traduce la probabilidad de que tal variable tome esos valores. Como vemos, la probabilidad viene a
representar lo mismo que la proporcin.
La funcin de densidad de probabilidad de una variable aleatoria continua cumple estas dos condiciones:

Segn la primera, tal funcin es no negativa; en relacin con la segunda debemos entender que el rea total es
igual a la unidad.
La funcin de distribucin de la variable aleatoria continua X es la que cumple.

Esta funcin nos permite establecer la probabilidad de que X tome valores iguales o menores que x.
- Tal probabilidad ser mayor que 0 y menor que 1.
- La funcin es no decreciente.
- Si la probabilidad es 1, el suceso es seguro.
- Si la probabilidad es 0, el suceso es imposible.
9.5.- Algunas funciones de densidad de probabilidad.
Hay algunas funciones de gran valor y utilidad, dado que debemos aplicarlas en el marco de determinadas
pruebas estadsticas, especialmente adecuadas para la resolucin de problemas pedaggicos mediante ciertos
diseos2.
9.5.1.- Funcin de densidad de probabilidad normal.
La funcin de densidad de probabilidad ms frecuentemente utilizada entre nosotros es la denominada normal,
conocida como Campana de Gauss.

Algunas de sus caractersticas ms importantes son:


Se pueden apreciar los porcentajes de casos entre dos valores de determinados.
* Entre : 68%
* Entre 2: 95%
* Entre 45: 99,99932%
Los anteriores valores, en trminos de porcentajes se convierten en probabilidades dividiendo por 100;
estamos afirmando que el conjunto de los casos situados entre tiene una probabilidad de ocurrencia de 0,68.
Mediante la tabla de reas de la curva normal podemos atribuir probabilidades a un caso concreto, como la
puntuacin a la que corresponde (su probabilidad sera de 084, esto es, 05 por debajo de la media aritmtica y

2 Diseo: plan, estructura y estrategia de una investigacin, cuyo objetivo es dar respuesta a ciertas preguntas y
controlar la varianza.
034 por encima de ella); si le correspondiera - , su probabilidad sera de 016 (05-034). Para este tipo de
clculos conviene manejar correctamente la tabla de reas de la curva normal, en sus diversas columnas:
- rea desde la media a la z (x/s).
- rea de la parte mayor.
- rea de la parte menor.
9.5.2.- Funcin de densidad de probabilidad 2 (Ji cuadrado).
Al margen de la frmula siguiente que representa esta funcin, nos interesa resaltar que las variables aleatorias
a las que le es aplicable se distribuyen segn 2 con n grados de libertad (g.l.)

Los g.l. en cada caso son n-1, esto es, el nmero de casos menos 1, dado que, mientras los primeros casos
pueden variar libremente, el ltimo viene condicionado por los valores de los anteriores.
Segn aumenta el numero de los grados de libertad, la distribucin se aproxima progresivamente a la
distribucin normal (ver figura siguiente). De hecho, las tablas de nos ofrecen valores de probabilidad hasta 30
g.l. A partir de ah, la distribucin sigue con un valor de:

para una media de 0 y una desviacin tpica de 1.

La importancia de esta distribucin radica en sus aplicaciones:


- Como prueba de bondad de ajuste.
- Como prueba de independencia.
- Como prueba del grado de asociacin entre dos conjuntos de variables de atributo, para calcular C o
coeficiente de contingencia:

9.5.3.- Funcin de densidad de probabilidad T.


La distribucin de probabilidad t se conoce como t de Student. Si tenemos Y y Z, dos variables aleatorias
independientes, Y con una distribucin con n grados de libertad, y Z con una distribucin normal estndar (0,1),
entonces la distribucin de la variable:

Cuando aumentan los grados de libertad., la distribucin se aproxima progresivamente a la campana de Gauss,
en la siguiente figura podemos apreciar ese progresivo acercamiento:
Esta distribucin se utiliza frecuentemente en pruebas de contraste de hiptesis para decidir si la diferencia de
medias es o no es estadsticamente significativa, a un determinado nivel de confianza.
En caso de que las muestras sean correlacionadas 3, la distribucin de t tiene un estadstico de contraste
diferente del aplicado con muestras independientes.
9.5.4.- Funcin de densidad de probabilidad F.
Denominada F de Fisher, esta funcin de probabilidad, junto con la anterior t, son de las ms utilizadas en el
mbito del contraste de hiptesis.
Si t se puede aplicar para probar si la diferencia entre dos medias aritmticas es o no estadsticamente
significativa, F, que no es sino el cuadrado de t, se puede aplicar, adems a contrastes con tres o ms pares de
medias en los diseos con tres o ms grupos.
F = t2
Es una distribucin aplicada en los diseos en los que se utiliza el Anlisis de varianza (ANAVA o ANOVA).
F nos informa si se dan o no diferencias estadsticamente significativas entre varios grupos de medias. En caso
afirmativo, es preciso averiguar entre qu dos pares de medias se concreta tal diferencia, razn por la cual
debemos continuar el trabajo mediante las denominadas pruebas a posteriori.
La distribucin F se define como la razn entre dos distribuciones independientes, dividida cada una de
ellas entre sus respectivos grados de libertad.

Sin entrar en ms detalles, sealaremos que, en realidad hay una gama de distribuciones F. Las tablas nos
ofrecen los valores de probabilidad que corresponden a diversos valores de grados de libertad del numerador (en
el ANAVA la varianza entre grupos) y del denominador (en el ANAVA la varianza dentro de los grupos).
La distribucin F es no negativa, sesgada hacia la derecha y sus valores oscilan entre 0 e infinito, si bien por
mucho que se aproximen al eje de las abscisas nunca llegan a cortarlo.
9.6.- La curva normal de probabilidades.
O Campana de Gauss, es uno de los modelos estadsticos ms frecuentes en nuestro mbito de estudio y ms
fructfero por sus aplicaciones.
Slo tiene sentido utilizar este modelo, esto es, valerse de sus propiedades, cuando el fenmeno al que lo
aplicamos se conforme al mismo.

3 Se utiliza esta expresin cuando la seleccin de un sujeto para una muestra implica tener otro sujeto que forma con
l una pareja, que goza de ciertas cualidades similares. Por ejemplo, si X es un sujeto con alto nivel de inteligencia,
su pareja deber tener un cociente intelectual similar; si Y es un sujeto con actitudes xenfobas, su pareja deber ser
similar en esa caracterstica.
Ejemplos:
Representacin de estudio 1:

Es fcil comprobar que no parece compatible con una curva normal de probabilidades o campana de Gauss,
por lo que no estara justificado aplicarle sus propiedades.
Representacin grfica de estudio 2:

Aunque los valores no se acercan en demasa a una campana, no podemos negar su mayor proximidad; desde
luego se acercan en mayor medida que los anteriores.
En el campo de la ciencia no parece correcto responder desde una apreciacin subjetiva sobre el grado de
parecido y cercana entre el modelo y la realidad. Pues bien, esta es la cuestin que nos ayudar a resolver la
Estadstica mediante la correspondiente prueba de bondad de ajuste. Si los datos empricos se ajustan
razonablemente al modelo, esto es, si las discrepancias son compatibles con las esperadas por puro azar,
consideraremos estos datos como normales, y les aplicaremos todas las propiedades del modelo. En caso
contrario, esta actuacin no estara justificada.
9.6.1.- El modelo.
La curva normal de probabilidades o campana de Gauss es un modelo matemtico cuyos valores se obtienen
con la frmula citada. Afortunadamente no es necesario hacer ese tipo de operaciones ya que contamos con tablas
que nos ofrecen, para cada puntuacin z tipificada:
- El valor de la ordenada (y).
- El rea desde la media a tal valor z.
- El rea de la parte mayor, en el caso de z correspondientes a valores empricos mayores que la media.
- El rea de la parte menor, en el caso de z correspondientes a valores empricos menores que la media.
No hay una nica curva normal, sino una por cada par de valores de la media y desviacin tpica. Esto nos
conduce a una familia de curvas normales que cumplen las siguientes caractersticas:
- El valor mximo de la ordenada corresponde a la media del grupo, y por tanto, a una puntuacin tpica
z = 0.
- A ambos lados de la media (en el eje de las abscisas, z = 0) se encuentran dos puntos de inflexin, que se
corresponden con los valores de z 1, esto es, una desviacin tpica por encima y otra por debajo de la
media.
- La curva es simtrica respecto de la media, coinciden media, mediana y moda. La ordenada de la media
divide la curva en dos partes iguales, cada una con el 50% de los casos.
- La curva es asinttica, esto es, por mucho que se acerque al eje de las abscisas, nunca llegar a cortarlo,
o mejor, la curva tocar el eje de abscisas en el infinito. Esta es la razn por la que nunca trabajaremos en
el 100% de casos.
9.6.2.- La prueba de bondad de ajuste.
Para decidir si una distribucin emprica, esto es, tomada de la realidad, se acomoda al modelo, o si se
prefiere, si el modelo lo es de esa realidad de la que hemos obtenido los datos empricos, se acude a los que se
denominan pruebas de bondad de ajuste.
Una de ellas es la Ji cuadrado ( 2 ). Sin embargo existen otras como la prueba Binomial, al Kolmogorov-
Smirnov o la de las Rachas.
9.6.3.- Prueba de Ji cuadrado (2).
Esta prueba valora las discrepancias entre los valores de las frecuencias empricas y las tericas segn un
determinado patrn o modelo. Si estas discrepancias no fueran significativas a un determinado nivel de
confianza4, admitiramos que los datos empricos y el modelo o patrn son una misma cosa, en otros trminos: no
podramos rechazar la hiptesis de nulidad (H o). Estaramos admitiendo que las discrepancias encontradas pueden
explicarse por puro azar como consecuencia de los errores de muestreo.
Debe quedar claro que 2 puede ser aplicada para valorar la discrepancia entre valores empricos y valores
tericos de muy diferente naturaleza (Ej: si se dan discrepancias significativas entre varones y mujeres estudiantes
de ingeniera, o entre lectores de varios peridicos teniendo en cuenta la edad, el sexo, clase social...). Aqu se
presenta su aplicacin para decidir sobre el ajuste o no al modelo de la curva normal de probabilidades o campana
de Gauss.
Para decidir si una distribucin emprica, por ejemplo la de los datos de la tabla siguiente, es compatible con
la curva normal, debemos aplicar la frmula correspondiente, que nos permitir establecer la magnitud de las
discrepancias entre frecuencias observadas o empricas (fo) y frecuencias esperadas o tericas (fe) segn el modelo
(en nuestro caso el de la curva normal de probabilidades.

Este estadstico se distribuye segn la distribucin 2 para g.l. igual al de filas menos 1 cuando y son
conocidas, y con -3 en caso de ser estimadas. Vale la pena recordar aqu que 2 es un modelo estadstico.

Procedemos a comprobar si los datos de la tabla anterior son compatibles con el modelo normal para un nivel
de confianza del 99%. para ello disponemos los datos segn la siguiente tabla:

Xi puntuaciones obtenidas por el alumno (entre 0 y 10 en nuestro caso).


fo frecuencias observadas

4 Esto es, si no fueran ms all de lo que se puede explicar por efecto del azar.
Li lmite superior de cada intervalo (en el caso que nos ocupa, cada puntuacin va desde medio punto antes
a medio punto por encima).
zi las puntuaciones tpicas de tales lmites.
p(zi) probabilidades que corresponden a tales puntuaciones tpicas.
P i probabilidad de cada intervalo, que se calcula restando de su valor P(z i), el valor que corresponde al
intervalo anterior.
fe frecuencias esperadas o tericas con arreglo al modelo. Para su clculo:
-Buscar en las tablas de la curva normal la probabilidad que corresponde a valores iguales o menores que z i. A
cada valor de z le corresponder un valor de probabilidad, el valor que buscaremos en la tabla de reas de la curva
normal bajo la columna rea de la parte mayor cuando z es positiva, y en el rea de la parte menor cuando es
negativa.
- El caso de la primera fila es diferente: como empricamente no tenemos puntuaciones superiores a 10, pero
la curva normal va hasta el infinito, buscaremos la probabilidad de un valor superior a z=354 en el rea de la
parte menor, esto es, desde z=+254 hasta el infinito.
- Calcular, para cada intervalo su propia probabilidad, restando de su valor p(z i) el mismo valor en el intervalo
anterior (columna pi).
- Multiplicar tal valor por N (en nuestro caso, 2.814), obteniendo la columna fe.
La columna zi nos exige los clculos previos de la media y la desviacin tpica; sus valores son los siguientes:
Media: 5058; s=1935.
El resultado de nuestros clculos es:

171,17

Si nuestro valor emprico (171,17) fuera igual o mayor que el de las tablas para los g.l. correspondientes,
rechazaramos H 0 y afirmaramos que nuestros datos empricos no son compatibles con el modelo de la curva
normal de probabilidades con una probabilidad de tomar una decisin errnea . Pues bien, las tablas de ji
cuadrado, para un nivel de confianza del 99 % ( = 0,01), y (11- 1) g.l. nos dan un valor de 23,209. Para 11 3
g.l., el valor es de 20,090.
Como puede apreciarse, se da una discrepancia claramente mayor de la esperada por efecto del azar: los datos
empricos no son compatibles con el modelo de la curva normal de probabilidades; consideramos que hay algo
ms que errores de muestreo, tal vez que esa variable no sigue el modelo de la campana de Gauss o distribucin
normal.
Intuitivamente comprobaremos esto con facilidad commparando las dos distribuciones:
- Con las frecuencias esperadas o tericas en el supuesto de una distribucin normal.
- Con las frecuencias observadas.
9.7.- Resumen.
La utilidad de este modelo, como de cualquier otro, deriva de la aplicacin de sus propiedades a la realidad
emprica objeto de estudio. Pero, para ello, es preciso comprobar que, en efecto, los datos estudiados,
generalmente muestras, son compatibles con el modelo normal en la poblacin. Para ello es preciso aplicar
pruebas de bondad de ajuste. Nosotros hemos presentado una de ellas, la de Ji cuadrado.
TEMA 10.- LOS BAREMOS O NORMAS. MUESTREO. APLICACIONES.
10.1.- Presentacin.
La estadstica debe estar presente en la mente del investigador desde que se plantea el plan de accin, en
momentos tales como los relativos al establecimiento de la calidad de los datos a recoger (Tema 8) y en la
interpretacin de los valores que nos ofrecen tales instrumentos (Tema 10).
10.2.- Introduccin.
Para interpretar una puntuacin necesitamos de algn tipo de referencia. En Educacin es frecuente acudir a
alguna de estas tres:
- La idiosincrsica o personalizada: la puntuacin alcanzada por una persona en una prueba se valora
atendiendo bien a la puntuacin que alcanz en una prueba anterior, apreciando si da mejora, prdida o
estancamiento; o bien estableciendo previamente un nivel adecuado a sus caractersticas.
El juicio valorativo de la comparacin suele ser de satisfactorio / insatisfactorio.
- La criterial: la referencia es un nivel objetivo, previamente fijado por las personas competentes como
deseable o adecuado para decidir sobre la suficiencia / insuficiencia. Los profesores establecen lo que se
conoce en la denominada evaluacin criterial como un dominio perfectamente definido, quienes lo
alcanzan obtienen una valoracin de suficiente, frente a la insuficiencia de quienes no llegan.
En el mbito del aprendizaje, esta es la referencia ms adecuada, compatibilizndola siempre que sea
posible con la anterior, ms adecuada en el caso de los primeros niveles del sistema educativo (infantil y
primaria).
- La normativa: para la medida de muchas variables, especialmente en el mbito de la inteligencia o de la
personalidad, ni es fcil ni posible, en ocasiones, el fijar unos estndares, ni podemos decidir qu o cunto
es lo propio de cada persona, ni resulta factible establecer unas puntuaciones como las que deben ser
alcanzadas en los diferentes aspectos.
Desde la Psicologa se ha acudido con frecuencia al establecimiento de una referencia normativa, lo que
se viene a traducir en la elaboracin de una regla de medida que nos permita situar a cada persona en el
conjunto de sus semejantes. Es, por tanto, una referencia relativa, ya que, dependiendo del grupo en que
uno est integrado, una misma puntuacin puede ser ms positiva o favorable en unos casos que en otros.
Esta regla para medir e interpretar las puntuaciones, se conoce como baremo o norma.
10.3.- Normas o baremos.
Segn el Diccionario de la Real Academia Espaola, el trmino baremo procede de un matemtico francs del
siglo XVII e inicios de XVIII, llamado B. F. Barrme, tercera de sus acepciones: Cuadro gradual establecido
convencionalmente para evaluar los mritos personales, la solvencia de empresas, etc., o los daos derivados de
accidentes o enfermedades.
Baremar es construir un baremo, esto es una escala de puntuaciones obtenidas con un instrumento de medida
que permite su interpretacin mediante la atribucin a cada una de ellas de un determinado valor.
Las puntuaciones brutas alcanzadas por las personas en una prueba resultan de difcil interpretacin en s
mismas. Afirmar que un nio ha alcanzado 35 puntos en una prueba de ingls no nos dice nada si no disponemos
de algn tipo de referencia. Hay algunos elementos que deben ser conocidos para interpretar una puntuacin:
- El suelo y el techo de las puntuaciones posibles (10.3.1): Depende del nmero de tems y de la propia
regla de medida (Ej. en el caso del tabaco, el suelo est claro: 0 cigarrillos; lo que no podemos saber es
cul es el techo.)
- La regla de medida (10.3.2): cmo se atribuye valor a cada uno de los componentes del instrumento de
medida, por lo general denominados tems. Se debera cuidar de decidir con rigor si cada cuestin tiene la
misma dificultad para poder valorar el xito o fracaso por igual, si todos los errores pueden tener la misma
penalizacin o los hay que deberan restar puntos en mayor medida. En el caso del tabaco la cosa es ms
sencilla y no admite dificultades: cada cigarrillo fumado es una unidad, si bien, puestos a poner
dificultades, las podemos encontrar en el grado en que se apura cada cigarrillo, en si se traga o no el
humo
Estas decisiones previas pueden hacer variar notablemente los posibles valores de una prueba y, en
consecuencia, el valor de una puntuacin concreta, lo que dificulta si es que no imposibilita, su
interpretacin directa.
- El propio contenido del citado instrumento (10.3.3): No todos los objetos a medir pueden serlo con la
misma precisin, fiabilidad y validez. Su naturaleza decide en gran medida hasta qu punto los valores
obtenidos con cada uno pueden situarse en uno u otro tipo de las denominadas escalas de medida.
Cuando se trata de obtener puntuaciones de un grupo de sujetos en relacin con la Comunidad Autnoma
de nacimiento, los valores atribuidos a cada una son puramente nominales, eso es, son autnticos
nombres, y la asignacin de un nmero u otro es totalmente arbitraria, si los nmeros se refieren a la
clase social de sus padres, difcilmente se podr pasar de una escala ordinal, creciente o decreciente, segn
comencemos por la clase ms elevada o por la ms baja. Sin embargo, no parece descabellado considerar
que la escala es de intervalo cuando se trata de medir la velocidad lectora de los nios, por ejemplo.
En nuestro campo, es ms fcil alcanzar niveles o escalas de medida ms perfectos en el mbito del
rendimiento que en el de la inteligencia y, mucho ms, que en la medida de determinadas variables de la
personalidad, como la competencia emocional, la autoestima, la motivacin o la seguridad en s mismo.
En todos estos casos, la distancia entre la realidad u objeto a medir y los reactivos a utilizar para hacerlo
es muy grande; estamos ante lo que se denomina constructo, es decir, construcciones en torno a algo
que nada tiene de visible, pesable, audible... y s de supuesto: suponemos que existe algo que
denominamos inteligencia, lo definimos de una manera y sobre esa definicin se construye un instrumento
que pretende medirla. La persona que construye el instrumento para medirlos supone que tal variable se
define como l lo hace y que el reactivo que propone es una manifestacin de esa definicin.
Pero no basta con esto; es frecuente que estos constructos sean complejos, que estn integrados por
aspectos o dimensiones diferentes, en tal caso, es necesario asegurar la presencia adecuada, equilibrada y
ponderada de reactivos de cada aspecto o dimensin, a fin de evitar sesgos que se sobredimiensionen unos
frente a otros, desequilibrando el instrumento de medida (por ejemplo: el constructo vida sana).
Asegurar que tales supuestos son ciertos es difcil de mantener, y que, con el nmero de reactivos
utilizados, se aprecia suficientemente el conjunto de manifestaciones de tal constructo es algo muy difcil
de argumentar; sin embargo, cuando se recogen datos con tales instrumentos y asignamos puntuaciones a
las respuestas dadas por los sujetos, estamos ante unos nmeros tan dciles que se dejan operar como si
fueran autnticos nmeros con todas sus propiedades. Y ah puede estar el gran error: que teniendo tales
nmeros ciertas cualidades o caractersticas, los manejemos como si tuvieran otras ms amplias y ricas.
En el nivel de la personalidad no es posible asegurar que los mismos sntomas en dos personas indiquen el
mismo rasgo ni que diferentes respuestas indiquen necesariamente rasgos diferentes.
- A quines va destinado tal instrumento. Todos admitimos que existe algo que denominamos
inteligencia, motivacin Pero no parece correcto pensar que es posible elaborar un instrumento
para medirlas vlido en general, para todas las edades, clases sociales, niveles acadmicos, naciones o
momentos histricos.
La medida siempre va a acudir a reactivos familiares para las personas a las que se destina el instrumento.
Los reactivos aplicados a nios del tercer mundo difcilmente podrn ser los mismos que los que se
manejan en EE.UU o en Europa; y, desde luego, los utilizados en nuestro pas hace un siglo pueden
parecer fuera de lugar en nuestro tiempo, dando lugar a lo que se conoce como falta de validez aparente5.
Todos estos aspectos tienen que ser tenidos en cuenta no tanto estrictamente para la interpretacin de las
puntuaciones pero s para que los nmeros arrojados por la aplicacin de los instrumentos de medida sean
vlidos y podamos proceder adecuadamente a interpretacin.
10.4.- Cualidades de los baremos o normas.
Nos corresponde ahora afrontar el procedimiento de construccin de baremos o normas para la interpretacin
de las puntuaciones obtenidas en una prueba concreta, especialmente en el caso de variables del mbito de la
personalidad y la inteligencia pues, como hemos afirmado, para la medida del rendimiento acadmico es
preferible la referencia criterial.
La construccin de un baremo de calidad depende de la muestra 6 utilizada para servir de referencia. En efecto,
si de lo que se trata es de conformar una serie de valores, debidamente ordenados, para valorar los resultados, los
valores seleccionados no pueden ser valores cualesquiera sino valores representativos del grupo al que
pertenezcan los sujetos cuyas puntuaciones deseamos interpretar.
Ejemplo:
Si deseamos valorar la inteligencia de un alumno espaol de ingeniera informtica, las puntuaciones de
referencia, esto es, el baremo o norma de comparacin, deber estar integrado por estudiantes de ingeniera
informtica. Pero no estudiantes cualquiera sino estudiantes representativos del total de estudiantes de ingeniera
informtica, sin sesgos de ningn tipo, esto es, sin que se trate de los mejores o los peores, sin que determinados
subgrupos estn sobre o infra representados.

5 La falta de este tipo de validez puede conducir a resistencia de las personas a las que se aplica por considerar que no
se les trata adecuadamente (ej: un test hecho para nios que se le da a unos adultos).
6 Recuerde que una muestra es un subconjunto de casos extrado de otro ms amplio, denominado poblacin, al que
pretende representar, y para lo cual deber reunir ciertas cualidades.
La cuestin clave para la representatividad reside en que la muestra sea una especie de fotografa fiel del
conjunto de la poblacin. La muestra de referencia, la que se toma como norma o baremo para la interpretacin,
debe acercarse cuanto sea posible a las caractersticas ms relevantes de la poblacin de la que ha sido extrada.
Para alcanzar la representatividad de una muestra es preciso tomar dos decisiones clave:
- Fijar el tamao de la misma, de forma que sea suficiente para que puedan manifestarse las caractersticas
que definen a la poblacin (en el caso de muestras pequeas esto no siempre es posible).
- Utilizar un procedimiento de seleccin imparcial, que evite todo tipo de sesgos.
10.4.1.- Tamao de la muestra: suficiencia.
En el apartado siguiente se presentarn las lneas del muestreo destinadas a establecer el tamao de la muestra.
Digamos ahora simplemente que disponemos de tablas que nos permiten fijarlo en funcin de una serie de
factores a los que nos referiremos ms adelante.
10.4.2.- Procedimiento de seleccin: aleatoriedad.
Aunque existan varios procedimientos de seleccin de los componentes de una muestra, el que ofrece mayores
garantas a priori es el muestreo aleatorio simple, cuya ventaja fundamental es que permite establecer la magnitud
de los errores muestrales (los que se dan entre las puntuaciones obtenidas en la muestra y los verdaderos valores
en la poblacin), con lo que es posible conocer mediante el intervalo de confianza deseado, los lmites entre los
que se encontrar el valor en la poblacin7.
As pues, tamao suficiente y seleccin aleatoria, son las dos condiciones fundamentales para construir una
norma o baremo, para la interpretacin de las puntuaciones obtenidas en un instrumento de medida.
10.5.- Construccin de los baremos o normas.
Cuando disponemos de una muestra de tamao suficiente, seleccionada de un modo imparcial, que nos
permita confiar en su representatividad, el procedimiento a seguir depende del tipo de normas o baremos a
construir.
10.5.1.- Normas cronolgicas o de edad.
Uno de los primeros tipos de normas utilizados fue el de las cronolgicas o de edad. La denominada Edad
Mental (EM) es el ejemplo ms conocido. El procedimiento es sumamente sencillo aunque sean complejas las
tareas subyacentes; se trata de que realicen la prueba o cumplimenten el instrumento de medida de que se trate
unas muestras imparciales y de adecuado tamao para cada edad o grupo de edad cronolgica.
La puntuacin media de los sujetos de cada edad se convierte en representativa de la misma. En adelante, las
puntuaciones de cualquier sujeto, tenga la edad cronolgica (EC) que tenga, se comparan con las del baremo o
norma resultante y se le asigna la edad mental correspondiente. Cuando la puntuacin obtenida corresponde a una
edad mental superior, estamos ante personas que llevan un desarrollo superior, ocurriendo lo contrario en el caso
de que su puntuacin corresponda a edades inferiores a la cronolgica.
Una alternativa, utilizada en las revisiones de las escalas de Binet-Simn, a principios del pasado siglo,
consisti en seleccionar los tems resueltos por cada grupo de edad; cuando un nuevo nio resuelve los tems de
una edad determinada se le asigna la edad correspondiente. Como es frecuente que los sujetos puedan fallar en
algn tem de una determinada edad y, por el contrario, resolver algunos de edades superiores, se procede a
obtener la edad de base, esto es, aquella que corresponde a la resolucin de todos los tems de la misma; la edad
mental final se obtiene sumando a la misma determinado nmero de meses en funcin de los tems de edades
superiores resueltos correctamente.
La edad mental no es constante a lo largo del tiempo, con el paso de los aos, las diferencias en edad mental
en relacin con la edad cronolgica tienden a reducirse.
Otra medida es el Cociente Intelectual (CI), que consiste en dividir EM/EC. El resultado obtenido se suele
multiplicar por 100 a fin de eliminar la presencia de decimales. Lo normal se sita alrededor de CI = 100; los
sujetos adelantados obtienen un CI > 100 y los valores inferiores (CI < 100) representan a los sujetos con retraso.
Este tipo de normas no es aplicable ms all de los 14-15 aos; la edad cronolgica sigue creciendo pero no es
fcil encontrar reactivos que permitan ir ms all de la EM de tales edades cronolgicas; por tanto, si se aplicaran
a adultos, los resultados nos llevaran a creer que las personas mayores cada vez tienen un desarrollo mental ms
bajo.
10.5.2.- Normas cuantiles.
Otro tipo de normas, son las denominadas genricamente cuantiles, entre las que destacaremos las cuartiles,
deciles y centiles o percentiles, esto es: cuantiles de orden cuatro, diez o cien.
Entendemos por cuantil cada una de las partes en que puede dividirse una serie ordenada de puntuaciones.
Conocemos ya el ms sencillo de todos: en efecto, la mediana es el cuantil 1 de orden 2, se trata de aquella
puntuacin que divide la serie en dos partes con un nmero de frecuencias igual, en concreto el 50% en cada una:
mediana (Md), que es a la vez:

7 El intervalo de confianza es el conjunto de puntuaciones entre cuyos lmites se considera que estar la verdadera
puntuacin de la poblacin, si bien no con seguridad sino para un determinado nivel de probabilidad (por lo general
el 095 o el 099, esto es, el 95% o el 99%).
* Cuantil 1 de orden 2.
* Cuantil 2 de orden 4, o cuartil 2 (Q2 )
* Cuantil 5 de orden 10, o decil 5 (d5 )
* Centil o percentil 50 de orden 100, (p50)
Los cuantiles ms frecuentemente utilizados, adems de la mediana, son:
- Cuartiles o cuantiles de orden 4: Q1 ,Q2 ,Q3 : puntuaciones que dejan por debajo de si el 25, 50 y 75% de
los casos.
- Deciles o cuantiles de orden 10: d 1 , d2 ,.,d9 : que dejan cada uno por debajo de si el 10, 20,., 90% de
casos.
- Centiles o percentiles: cuantiles de orden 100: C i (i = 1,2,3,.,99), que dejan por debajo de si el 1,2,3,
., 99% de los casos.
10.5.3.- Construccin de un baremo en cuantiles.
La construccin de normas cuantiles para la interpretacin de las puntuaciones obtenidas en un instrumento de
medida es sencilla, pero conviene recordar que este es el momento final del trabajo y que el baremo que
construyamos no tendr valor alguno, si la muestra no cumple con las exigencias de tamao e imparcialidad para
hacerla representativa.
El procedimiento comienza con la elaboracin de una distribucin de frecuencias acumuladas, sean estas con
puntuaciones directas o agrupadas en intervalos. Veamos:
Supongamos que disponemos de la siguiente serie de puntuaciones en una prueba de aptitud manual que
integran una muestra imparcial y suficiente (representativa) de alumnos de una ciudad que no han obtenido el
Graduado en ESO. Aunque no sera imprescindible, s es recomendable su ordenacin, ascendente o descendente:

Como podemos apreciar, el rango total de la serie va de 7 a 40 puntos, esto es, 33, por lo que en total hay 34
posibles puntuaciones diferentes. Si hacemos 9 intervalos, un nmero razonable, cada intervalo tendr una
amplitud de 4, lo que nos da 36 puntuaciones, lo que representa que habr dos puntuaciones ms de las posibles.
Podemos atribuirlas al intervalo superior, al inferior o una a cada uno. En este caso, sin razones de peso, lo
hacemos con primero de tales intervalos, como sigue8.

La columna de porcentajes acumulados nos permite interpretar como porcentajes de casos que dejan por
debajo cada una de las puntuaciones superiores del intervalo, en realidad autnticos percentiles. No obstante, lo
que suelen presentar los baremos de las pruebas no es este tipo de datos sino una serie de puntuaciones a las que
corresponden los cuantiles habituales (ver tabla siguiente), para cuya construccin utilizamos la frmula:

8 Donde I = intervalo; Xi = marca de clase o puntuacin media del intervalo; fi = frecuencia; fa = freccuencia
acumulada.
El procedimiento ms sencillo consiste en calcular, en primer lugar, el intervalo en el que se encuentra el
cuantil (mediana, cuartil, decil o percentil) multiplicando el cociente C/100 por n o nmero de casos de la serie.
C/100 se sustituye por D/10, Q/4 o 1/2 si se trata de deciles, cuartiles o mediana.
Este valor nos permite identificar el lmite inferior de dicho intervalo (L inf) al que deberemos sumar el
resultado de una regla de tres.
*Si a la amplitud del intervalo le corresponde una frecuencia concreta, al nmero de casos que van desde la
frecuencia acumulada del intervalo anterior hasta el lugar en que se encuentra el cuantil le corresponder x.
Veamos con Med., Q2 , d5 , p50 : debemos comenzar con el clculo del lugar en el que se encuentra el cuantil:

El puesto 35 se encuentra en el intervalo 17 a 20 (tabla anterior, columna de frecuencias acumuladas (fa).


Como el luegar de la mediana, del Q2 , d5 , del p50 , coincide con el ltimo valor del intervalo, la regla de tres ser:
- Si a los 20 casos del i ntervalo le corresponden 4 puntos.
- A 20 casos le correspondern x puntos, o sea, 4.
Por tanto, al lmite inferior del intervalo en que se encuentran estos cuatro cuantiles, 165, deberemos sumarle
4, con lo que la mediana, el segundo cuartil, el quinto decil y el quicuagsimo percentil ser 205 puntos, que es el
lmite superior de ese intervalo.
Hagamos lo propio con el cuartil 3. el cuartil 3 ocupa el lugar 525 en la serie de frecuencias acumuladas:
3 /4 x 70 = 525.
Por tanto, est en el intervalo 25 a 28, cuyo lmite inferior es 245.
La regla de tres ser:
- Si a los 11 casos del intervalo le corresponden 4 puntos de amplitud.
-A los 25 (que van de los 50 acumulados hasta los 52) le corresponden x.
Pues bien, x=091, que habr que sumar a los 245 del lmite inferior: 2541.
En la tabla siguiente aparecen todos los valores habitualmente utilizados (columna de puntuacin); se incluye
as mismo la columna con la puntuacin redondeada al nmero entero ms prximo 9.

El sentido del redondeo se explica fcilmente: nuestra muestra es un caso de una poblacin completa. Si en
lugar de una muestra de 70 casos lo fuera de 700 o 7000, los saltos de intervalo a intervalo estaran ms
suavizados, tendiendo cada vez ms a una curva en lugar de a un polgono de frecuencias acumuladas.
Normas tpicas.
Adems de las puntuaciones cuantiles, tambin es posible acudir a otro tipo de normas, las llamadas tpicas.
En la tabla anterior se puede observar que las puntuaciones centiles estn muy cerca unas de otras en el centro de
la tabla, mientras las distancias entre valores extremos son progresivamente mayores.
Una forma de evitar esto consiste en expresar la puntuacin de cada sujeto tomando una unidad constante de
medida. Las puntuaciones tpicas (z) indican la distancia de cada puntuacin directa hasta la media (X)del grupo
medida en unidades de desviacin tpica (s).
Recordamos la frmula de las puntuaciones tpicas:

9 Observe que nunca se calcula el 100% de los casos, eso es el cuartil 4, el decil 10 o el percentil 100.
As, afirmar que un alumno le corresponde z=15, es tanto como decir que se aparta de la media 15 veces lo
que valga la desviacin tpica (simbolizada por s).
Los sujetos con puntuaciones superiores a la x, tienen z positiva, y la tienen negativa en caso contrario.
Conviene recordar que un sujeto con una puntuacin x=0 no se encuentra en el lmite inferior de la distribucin
sino justamente en el centro de la misma, pues este valor indica que no se aparta de la puntuacin media.
10.5.4.- Puntuaciones tpicas normalizadas.
Una distribucin de frecuencias se acerca ms a la normal, cuanto mayor sea el nmero de casos (N) de la
serie, siempre que la variable medida se distribuya normalmente en la poblacin.
Partiendo de ese supuesto, cuando nuestros datos empricos sean compatibles con la curva normal (para
comprobarlo podemos aplicar pruebas estadsticas ad hoc, como 2), no es descabellado sino todo lo contrario
normalizar la distribucin, y, en consecuencia, procedemos a normalizar las puntuaciones tpicas (z).
Se puede mantener que las puntuaciones z se apartan tanto ms de las z normalizadas cuanto menos se parezca
la distribucin emprica de la distribucin ideal: el modelo de la curva normal. En consecuencia, aqullas no sern
sino aproximaciones o estimaciones de stas.
Podemos obtener una puntuacin tpica normalizada mediante las tablas. Para ello:
- calculamos el porcentaje de casos que se encuentren por debajo (o por encima) de cada puntuacin
- se busca tal porcentaje en la tabla de reas de la curva normal y se identifica la z normalizada
correspondiente.
En la tabla 10.1. tenemos estos valores en la columna de la derecha, correspondientes no a las marcas de clase
sino a los lmites superiores de cada intervalo.
Veamos algn caso diferente de aqullos:

36,521,5
X = 21,5 S = 6,29 Xi = 36,5 z= =2,384
6,29
- En la tabla 10.1, una puntuacin de 36,5 deja por debajo de s a 69 de 70 de los casos, es decir, la
proporcin: 69/70 = 0,9857.
- Buscamos en tablas de la curva normal esta proporcin en la columna B, y encontramos 219 = z norm
En el caso de otro sujeto con puntuacin directa de 13, su z = -1,35. Si deseamos obtener su z normalizada
deberemos comprobar qu % de casos deja por debajo de s. Como 13 deja 6 casos, el % es de 8,57. En la tabla de
reas de la curva normal, columna rea de la parte menor, encontramos que z = -1,37 supera al 8,53 %. Esta
sera, por tanto, su z normalizada10
Las z normalizadas corresponden a una distribucin de frecuencias con media = 0 y s =1. Para evitar
decimales , podramos transformarla en otra con media = 50 y s = 10, dando lugar a una puntuacin T, o en otra
con media = 50 y desviacin tpica = 20, propia de la escala S. A estas puntuaciones suele denominrselas
puntuaciones tpicas derivadas.
La siguiente figura recoge la equivalencia de una serie de puntuaciones normalizadas. Vale la pena sealar que
las normas o baremos utilizados en PISA toman como media = 500 y s =100. por tanto, a una alumna que obtenga
600 puntos le corresponde una puntuacin normalizada en PISA igual a +1. si fuera -1 su puntuacin directa sera
de 400 puntos y si hubiera obtenido 950 su puntuacin normalizada seria de +4,5.

10 Podemos comprobar que, mientras en esta ocasin la z emprica y la normalizada son muy prximas, en el caso
anterior son muy diferentes. Este hecho se explica porque la distribucin emprica se aleja claramente de la normal
en la parte superior de los datos, como puede comprobar el lector en el histograma correspondiente
10.5.5.- Estaninas y pentas.
En EEUU es frecuente una escala de 10 rangos (creados a partir de 9 puntos), con x = 5 y s = 2. En nuestro
pas, se utiliza en ocasiones una escala de 5 rangos (que permite dividir la serie en 5 grandes bloques, cuyos
lmites en puntuaciones z se aprecian en la siguiente tabla), con x = 3 y s = 1. La primera se llama de estaninos o
eneatipos, y la segunda se conoce como pentas.

La ubicacin de un sujeto cualquiera en un determinado penta o eneatipo es sumamente fcil. Primero


calculamos la puntuacin z del sujeto y posteriormente hacemos la transformacin:
Para la escala de eneatipos (cuya media es 5 y la desviacin tpica 2)5 + 2 z
Para la escala de pentas (cuya media es de 3 y la desviacin tpica de 1) 3 + z
Siguiendo los datos originales, el sujeto cuya Xi =33, tendremos:
z=(33-215)/629=183

En la tabla anterior aparecen las puntuaciones que limitan la escala de eneatipos y de pentas, tanto en z como
en puntuaciones directas. Como puede apreciarse, la primera escala crece (o decrece) a razn constante de 315
puntos (la mitad del valor de s), mientras en la segunda lo hace justamente a razn de 630, esto es, el valor de s).
10.6.- El muestreo.
Hasta ahora, lo que hemos afirmado es que las normas se construyen sobre muestras que, para bien, deben
representar con fidelidad a la poblacin de la que han sido extradas.
Una muestra no es sino una parte, un subconjunto, de una poblacin o universo. Una muestra de calidad es
aqulla que representa fielmente el conjunto de caractersticas de la poblacin. La utilizacin de muestras en lugar
de la poblacin correspondiente deriva de la dificultad real para acceder a todos los elementos de la poblacin.
Una muestra debe cumplir ciertas condiciones o exigencias; las dos fundamentales, resumidas en una, son su
adecuado tamao y su seleccin imparcial. Ambas notas dan lugar a muestras representativas, esto es, a muestras
que reflejan con fidelidad, sin sesgos ni desviaciones, las caractersticas de la poblacin.
10.6.1.- Tamao de la muestra.
El tamao de una muestra est en relacin con el de la poblacin, si bien no en una relacin directamente
proporcional.
Para la fijacin del tamao de las muestras deberemos atender, en primer lugar, al tamao del universo,
considerado como infinito a partir de 100.000 casos; junto a ello, se deben tomar en consideracin otras tres
caractersticas que debe fijar el investigador en funcin de sus intereses:
- El nivel de confianza con el que desea trabajar.
- El error de estimacin que considera adecuado asumir.
- La proporcin en que la caracterstica a estudiar se encuentra en el total de la poblacin.
Del mismo modo, se supone la distribucin normal de la caracterstica muestreada.
A los efectos del tamao, una poblacin se toma como finita si no supera las 100.00 unidades. En este caso, se
da una relacin entre el tamao de la poblacin y el de la muestra, de forma que aqul se incluye en la
correspondiente frmula para la fijacin de ste, algo que no ocurre con tamaos infinitos, donde no aparece el
valor de N.
El nivel de confianza, decidido por el investigador, dando por hecho que estemos una distribucin normal de
la caracterstica muestreada, se suele fijar en el 95, 99 o 99% admitiendo la distribucin normal, y conociendo
como conocemos la curva normal de probabilidades, este dato se traduce en las frmulas en valores de 196, 258
o 33 desviaciones tpicas.
En cuanto al error de estimacin que decide admitir el investigador se fija en t de porcentaje; el investigador
es consciente de que entre muestra y poblacin siempre dar alguna diferencia; le cabe la decisin de admitir un
error, en trminos de porcentaje, ms o menos grande. Obviamente, cuanto menor error est dispuesto a aceptar,
mayor no deber tener la muestra.
Por ltimo, se debe tomar en consideracin la proporcin en que una caracterstica encuentra en la
poblacin. En ocasiones podemos conocer este dato por contar con censos ficheros de diferente naturaleza.
Con frecuencia se desconoce este dato, en cuyo caso lo habitual es considerar que tal caracterstica se da al
50% en la poblacin, lo que representar un mayor tamao para la muestra. En el caso de que la poblacin
estuviera organizada en diversos grupos (estratos) esta decisin debera aplicarse a cada uno de ellos. Tal puede
ser el caso de seleccionar una muestra de estudiantes universitarios, atendiendo al sexo, pero representando a
diferentes subgrupos de carreras; por ejemplo, humanidades, ciencias de la salud, ciencias econmicas, ciencias
jurdicas, ingenieras.
Para el clculo del tamao de la muestra contamos con dos frmulas diferentes, sepia que el tamao de la
poblacin de origen sea infinita (10.3) o finita (10.4).

Donde N es el tamao de la poblacin, n el de la muestra; z es el valor que corresponde al nivel de confianza


elegido (nmero de desviaciones tpicas precisas para que la curva normal deje en su interior el 95, 99, 99,9 %
etc.) y p y q el correspondiente a la proporcin de la caracterstica en la poblacin. E representa el error de
estimacin admitido por el investigador. Tanto z como E estn elevados al cuadrado.
Ejemplo:
Aplicaremos ambas frmulas al caso de una poblacin con 108.000 sujetos, en el primer caso, y con 35.600 en
el segundo, tomando un nivel de confianza del 99% y un error de estimacin del 3%. En el primer caso
desconocemos la proporcin en que se encuentra la caracterstica en la poblacin; en el segundo sabemos que es
de 35 a 65 (esta es, aproximadamente, la relacin de alumnos que se examinan en la UNED en la primera y en la
segunda semana de pruebas presenciales).
En el primer caso tendramos:
n = (2,582 x 50 x 50)/9 = 1.849 sujetos
En el segundo:
n = (2,5 2 x 35 x 65 x 35.600)/(9 x 35.599) + (2,58 2 x 35 x 65) = = 539.101.836/320.391 + 15.143,31 =
1.606,69 (redondeando, 1.607 sujetos)
Para obtener el tamao de las muestras puede acudirse a tablas especficas en las que aparecen diferentes
valores de p y q, con los correspondientes niveles de confianza y error de estimacin.
N = Tamao de la poblacin
n = Tamao de la muestra
z =Valor de la puntuacin tpica que corresponde al nivel de confianza elegido
E = Error de estimacin muestral
p y q = Nivel de confianza y error de estimacin (estn en las tablas)
10.6.2.- Procedimientos de seleccin.
El principal procedimiento de extraccin de muestras imparciales es el muestreo aleatorio simple. Lo
caracterstico de este muestreo es que todos los sujetos tienen, a priori, las mismas posibilidades de ser
seleccionados para integrar la muestra.
Para lograrlo se dispone de tablas de nmero aleatorios; las tablas completas tienen un determinado nmero de
hojas y estn organizadas por columnas. Seleccionada la hoja y columna al azar, se eligen los primeros sujetos
hasta alcanzar el valor del tamao de la muestra. En el caso de que entre esos nmeros aleatorios aparezcan
valores superiores al tamao de la poblacin, se despreciarn, pasando al siguiente, hasta completar el valor de n.
El muestreo sistemtico es una modalidad del anterior que nos permite fijar el primero de los sujetos de la
muestra y, a partir de l, seleccionar sistemticamente el resto sumndole un valor constante, en concreto el
denominado coeficiente de elevacin, esto es, el cociente entre el tamao de la poblacin y el de la muestra. Por
ejemplo, en nuestro primer caso, tal coeficiente sera: 108000 / 1849 = 58,41. Pues bien: seleccionado al azar el
primer caso, seguiramos eligiendo en las tablas de 58 en 58, hasta llegar a los 1849 que integran la muestra.
Vale la pena dejar constancia de que utilizar estos procedimientos es lo mejor que podemos hacer, pero nunca
nos asegura que el resultado sea el deseado.
10.6.3.- Procedimientos de muestreo.
Adems de los dos anteriores:
Estratificado: los sujetos de cada estrato pueden seleccionarse mediante el sistema aleatorio simple o el
sistemtico.
Por cuotas: cuando una determinada poblacin est estratificada por nivel de estudios, clase social, consumo
de drogas, religin, grupo poltico al que votan,., pueden seleccionarse sujetos representativos de los mismos, a
fin de contar con representantes de los diferentes estratos poblacionales.
Incidental o casual: es el ms usual por ser el ms asequible. Se toman los sujetos disponibles o asequibles.
10.6.4.- El error muestral.
La propia teora de la probabilidad nos va a permitir estimar la magnitud del error muestral para un
determinado nivel de confianza en nuestras afirmaciones.
El error muestral puede calcularse mediante dos frmulas; al igual que en el caso del tamao, una se aplica a
muestras finitas (<100.000) y la otra para muestras infinitas.

Ejemplo:
As, en el caso de las dos muestras anteriores, para poblaciones de 108.000 y 35.600 casos respectivamente,
los errores muestrales, para el caso de que p = q = 50 en el primer caso, y de que p = 35 y q = 65 en el segundo,
tendramos:

Estos valores nos permiten establecer, en torno a los resultados obtenidos con las muestras, un intervalo de
confianza, esto es, un conjunto de puntuaciones entre las cuales consideramos que se encontrar la verdadera
puntuacin de la poblacin, si bien no con certeza sino con una determinada probabilidad, establecida por el
investigador.
As, asumiendo que en una muestra de 1.849 adultos, de una poblacin de 108.00 que no obtuvieron el
graduado en ESO, distribuida normalmente, el 46% fueron mujeres, podemos crear un intervalo de confianza,
para una probabilidad del 99%, sumando y restando a ese 46% el valor del error muestra, esto es:
463=43 y49
Obviamente, cuanto menor sea el error muestral, menor ser el intervalo de confianza, y ese error muestral
ser tanto mayor cuanto ms elevada sea la seguridad que deseamos tener de que el valor de la caracterstica en la
poblacin se encuentra en ese intervalo. En nuestro caso, el error muestral sera menor si el nivel de confianza
fijado hubiera sido del 95% y mayor si nos hubiramos decidido por el 999%.
Este dato es importante para tomar o no en consideracin determinadas diferencias. Por ejemplo, en el caso
anterior surge de inmediato una pregunta: en la poblacin, hay ms varones que mujeres que no obtienen ese
graduado? A simple vista, s, ya que el 46% es menor que el 54% de varones. Sin embargo, para comprobarlo
estadsticamente debemos aplicar a este 54% el error muestral; al hacerlo podramos encontrarnos con que el
intervalo de confianza se superpusiera con el de las mujeres, lo que nos indicara que es posible que en la
poblacin no hubiera diferencias reales. Veamos:
543=51 y 57
Ahora s podemos afirmar que, en toda la poblacin, con una probabilidad del 099 (nivel de confianza del
99%) el nmero de sujetos que no obtuvieron el graduado es superior entre los varones que entre las mujeres.
Si en vez de 46% hubiera sido el 48% frente al 52%, ambos intervalos de confianza se superpondran (45 a 51
en el primer caso y 49 a 55 en el segundo), y no podramos dar por bueno, admitiendo ese grado de error, que
hubiera diferencias estadsticamente significativas con una probabilidad del 099.
TEMA 11.- ESTIMACIN DE PARMETROS. ERRORES DE ESTIMACIN.
11.1.- Introduccin.
Hasta ahora hemos visto:
- Un primer bloque: relativo a describir los conceptos bsicos en relacin la estadstica y el proceso de
investigacin.
- Un segundo bloque: relativo a organizacin, tratamiento y anlisis de datos, procedentes de grupos o
muestras con el fin de explicar el comportamiento general.
- Y este tercer bloque que comenzamos: relativo a los estudios centrados en grupos o muestras para extrapolar
los resultados: inferencia estadstica.
11.2.- Aproximacin intuitiva a la inferencia estadstica.
La Estadstica es la ciencia que se ocupa de la ordenacin y anlisis de datos procedentes de muestras, y de la
realizacin de inferencias acerca de las poblaciones de las que stas proceden.
- Poblacin: conjunto de todos los elementos que cumplen una o varias caractersticas o propiedades. Los
valores numricos que describen a la poblacin se denominan parmetros (PP). Normalmente los valores
paramtricos son desconocidos porque resultara enormemente costoso y complicado obtener datos de todos los
sujetos de la poblacin. Por esta razn se trabaja con muestras a partir de las cuales, si procede, se trata de estimar
el valor de los parmetros.
- Muestra: es un subconjunto de los elementos de una poblacin. Los ndices numricos que describen a las
muestras se denominan estadsticos. La tcnica para seleccionar a los sujetos que entrarn a formar parte de la
muestra se denomina muestreo. Siempre que sea posible debe utilizarse el muestreo aleatorio porque nos da
mayores garantas de que la muestra sea representativa de la poblacin.
Lo ms fcil es seleccionar una muestra suficiente en nmero (existen procedimientos para calcular el nmero
de sujetos necesarios) y representativa de la poblacin, es decir, que no est sesgada. El muestreo aleatorio no
asegura la representatividad de la muestra, pero es el mtodo que nos ofrece mayores garantas de obtener una
muestra representativa de la poblacin.
A mayor tamao de la muestra mayores garantas de representatividad, si bien es preciso matizar que a partir
de cierto tamao, su aumento no aporta mejoras sustanciales a la representatividad.
Una vez que hemos elegido la muestra, el paso siguiente sera el proceso de medicin.
La medicin, es uno de los problemas ms graves en Educacin y en Psicologa. Pensemos que nos estamos
enfrentando en muchas ocasiones a la medida de lo que se denominan constructos, es decir, caractersticas del ser
humano que no son directamente mensurables. Lo que medimos son las manifestaciones observables que
atribuimos a dichos constructos. As, por ejemplo, cuando medimos la inteligencia a travs de un test, lo que
medimos son las manifestaciones observables que tericamente atribuimos a la inteligencia, como la capacidad
verbal, numrica, abstracta, etc., que son ms fcilmente mensurables. Se sigue el mismo procedimiento para
medir el rendimiento acadmico, la memoria, la capacidad de resolucin de problemas, las aptitudes, las actitudes,
etc.
Lo que debe quedar claro es que necesitaremos uno o varios instrumentos adecuados para recoger los datos
que permitan responder a los objetivos e hiptesis de investigacin. Una vez elaborados los instrumentos de
medida, se aplican a la muestra, se recogen los datos y se elabora la matriz de datos. A partir de aqu volveramos
a lo dicho sobre ordenacin y categorizacin de datos y anlisis descriptivo.
La Estadstica inferencial o inferencia estadstica pretende sacar conclusiones sobre el conjunto de datos a
travs de observaciones de parte de esos datos. Mediante ella, se pueden estimar parmetros y realizar contraste de
hiptesis.
Es importante notar que se habla de estimacin y no de clculo de parmetros.
Ej: Nos puede interesar saber el cociente intelectual de una poblacin de 10.000 alumnos. Sin necesidad de
aplicar un test a todos ellos, es decir, seleccionando una muestra aleatoria suficiente y representativa,
probablemente obtengamos un valor cercano al verdadero valor de la media aritmtica del CI poblacional (el
parmetro). Decimos probablemente porque hemos podido tener tan mala suelte en la seleccin aleatoria no sea
representativa de la poblacin. Por esta razn, en la inferencia estadstica nunca se habla de certezas, sino de
probabilidades de acierto y de error en nuestras afirmaciones.
Dentro del marco de la Estadstica inferencial suelen distinguirse dos objetos de estudio: la estimacin de
parmetros y el contraste de hiptesis.
*Un parmetro se estima siempre a partir de un estadstico calculado en una muestra. Se habla de dos tipos de
estimacin:
estimacin puntual: se hace coincidir el estadstico con el parmetro, es decir, se escoge un solo punto (el
estadstico) para estimar el valor del parmetro.
estimacin por intervalos: se ofrece un intervalo de puntuaciones en el cual es ms probable que se encuentre
el valor del parmetro.
11.3.- Propiedades de los estimadores.
La estimacin consiste en la tcnica que permite conocer el valor aproximado de un parmetro de una
poblacin con una determinada probabilidad a partir de los datos proporcionados por una muestra. Un estimador
es un estadstico muestral que permitir la estimacin de un parmetro poblacional. Estas son las caractersticas
que debe poseer un buen estimador:
- Carencia de sesgo: podemos decir que un estimador insesgado es aqul que tiene sesgo igual a cero. La
propiedad del insesgamiento nos garantiza que las estimaciones que hagamos con el estimador se encuentran
alrededor del parmetro en cuestin, de forma simtrica, es decir, que el promedio de los estadsticos coincide con
el verdadero valor del parmetro.
- Eficiencia: un estimador es tanto ms eficiente cuanto menor es su desviacin tpica. Cuanto ms estrecha
sea, cuanto menor sea su error tpico, ms cercanos estarn los estadsticos al valor del parmetro.
- Consistencia: un estimador es consistente si a medida que aumenta el tamao de la muestra, la probabilidad
de que el valor del estadstico se acerque al valor del parmetro va siendo mayor. Si el valor de N tiende a infinito,
un estimador consistente es, a la vez, insesgado.
- Suficiencia: un estimador es suficiente cuando es capaz de obtener de la muestra toda la informacin que
sta contenga acerca del parmetro.
11.4.- Distribucin muestral, el error muestral y error tpico: estimacin del parmetro media
aritmtica.
Entre las distintas formas que pueden adoptar las distribuciones de frecuencias en distintas variables, ya nos
hemos referido a un tipo de distribucin caracterstica que se denomina distribucin normal o campana de Gauss.
Pues bien, al igual que la distribucin normal, hay otra serie de distribuciones tericas como la binomial, la t de
Student, la multinomial, la F, etc., en las que se conoce la probabilidad de aparicin asociada a todos los posibles
valores.
La naturaleza de las variables y el tamao muestral son algunas de las caractersticas que dan lugar a las
diferentes distribuciones. Estas distribuciones son como un polgono de frecuencias suavizado: frecuencias
relativas en el eje de ordenadas y puntuaciones en el eje de abcisas.
Pues bien, existe un concepto terico de distribucin (funcin de densidad de probabilidad)que es la
distribucin muestral y que puede definirse como la distribucin de un estadstico en el muestreo. Est formada
por los infinitos valores de un estadstico obtenidos de infinitas muestras aleatorias del mismo tamao extradas de
la misma poblacin.
Si nos remitimos a la distribucin muestral de la media aritmtica (), est demostrado segn el teorema
central del lmite (la distribucin de la suma de variables aleatorias tiende a una distribucin normal) para
muestras grandes (N > 30), esta distribucin se asemeja a una distribucin normal.
Cmo se formara esta distribucin terica?
Dada una poblacin definida, podramos extraer de sta (tericamente, claro) infinitas muestras aleatorias y en
cada una de ellas calcular su media aritmtica. Si el parmetro fuese conocido, comprobaramos como la
mayora de las X de las muestras se encontraran cerca del valor paramtrico, pero precisamente por ser muestras
aleatorias, algunas se alejan un poco y otras, muy pocas, se alejan mucho de ese valor.
No obstante, en la inmensa mayora de los casos, si queremos estimar el valor del parmetro ser porque su
valor es desconocido. Por tanto, confiamos en que la muestra elegida sea una de las que el valor de la X sea
prximo a (porque hay una alta probabilidad de que sea as), pero no lo podemos asegurar. Sin embargo, hemos
podido tener tan mala suerte que nuestra muestra estuviera sesgada.
Por esta razn, en inferencia siempre hablamos de nivel de confianza (porcentaje de confianza al hacer la
estimacin; tambin puede darse en probabilidad y se denomina 1- ) y del nivel de significacin (, probabilidad
de error que estamos dispuestos a asumir en la estimacin). Obviamente, se trata de conceptos complementarios
que se refieren a lo mismo.
Ej: si estamos dispuestos a trabajar con una probabilidad de error de =005, nuestro nivel de confianza ser
del 95% (o 095 en trminos de probabilidad).
Por tanto, para hallar el intervalo confidencial, es decir, los valores entre los cuales es ms probable que se
encuentre el verdadero valor del parmetro (recordamos que ahora estamos hablando del parmetro media
arirmtica, pero es anlogo en casi todos los casos), necesitamos calcular la X , a la que sumaremos y restaremos
el error muestral, es decir, la diferencia ms probable entre el estadstico y el parmetro.
IC = X EM
El error muestral nos da una idea de la precisin de nuestra inferencia estadstica. Cuanto ms grande sea el
error muestral, menor ser la precisin en la estimacin y menor ser la utilidad de la estimacin (pensemos, por
ejemplo, lo intil que sera estimar que la calificacin media de un grupo en Matemticas se encontrar en el
intervalo de 1 a 9).
Una distribucin muestral tiene variabilidad (es decir, que en ese proceso de obtencin de infinitas muestras
aleatorias, los estadsticos que obtendramos presentaran diferentes valores). En ndice descriptivo que expresa la
variabilidad es la desviacin tpica, por tanto tendr su propia desviacin tpica . A la desviacin tpica de la
distribucin muestral se le denomina error tpico. Es una medida de dispersin con respecto al parmetro, es este
caso con respecto al parmetro media aritmtica; es decir, nos indica la dispersin de las medias de las infinitas
muestras aleatorias extradas respecto a la media poblacional (la gran media o la media de las medias de la
distribucin muestral) .
Pero de nuevo nos encontramos con la misma pregunta. Si es una distribucin muestral terica, cmo
podremos conocer este dato? Nuevamente lo estimaremos y nos basaremos en los datos de la muestra, en este caso
en su desviacin tpica. En el caso de la distribucin muestral de medias, esta es la frmula:

Pondremos N-1 en el denominador cuando se haya calculado en la muestra la desviacin tpica sesgada y slo
N cuando hayamos calculado la desviacin tpica insesgada. Como vemos, el error tpico no slo depende de la
desviacin tpica, sino, en gran medida, del tamao de la muestra. Cuanto ms grande N, ms pequeo el
cociente, ms pequeo el error tpico y ms precisin en la estimacin del parmetro.
Solo nos queda saber cmo calcular el error muestral.
Para ello hemos tenido que definir el nivel de significacin con el que vamos a realizar la estimacin, Si
es conocido (o tambin si la muestra es grande), debemos entonces recurrir a la distribucin normal y escoger la
puntuacin z correspondiente a dicho nivel de significacin, calcular la puntuacin z correspondiente a ese nivel
(puntuacin conocida gracias a que la distribucin muestral es normal) y multiplicar dicha z por el error tpico,
esto es, la desviacin tpica de la distribucin muestral.
EM = z( /2) x
donde la z( /2) es la puntuacin tpica correspondiente al nivel de significacin ( ) que hemos establecido (o al
nivel de confianza).
Si trabajamos con un nivel de confianza del 95%, esto equivale a =005. Puesto que tomamos el valor del
estadstico como estimador del parmetro, tomamos el 95% de los valores situados en el centro de la distribucin
muestral, esto es, el 475% a cada lado del estadstico, como la zona donde es ms probable que se encuentre el
parmetro. En otras palabras, consideramos que en la zona ms grande de la distribucin muestral (zona no
sombreada de la siguiente figura) se producen las diferencias normales o esperables por efecto del azar entre el
estadstico y el parmetro, y que sera muy improbable que el verdadero valor del parmetro se encontrara en la
zona sombreada (tan improbable como ).
Como el error que estamos dispuestos a cometer es de =005, esta probabilidad de error tenemos que
repartirla en ambas colas de la distribucin; de ah que la z utilizada sea la z de la /2 que encontramos
directamente en las tablas de la curva normal buscando en el rea de la parte menor 0025. de modo anlogo, la z
para un nivel de confianza del 99% es 257.
De la misma forma que estimamos el parmetro media aritmtica, se pueden estimar otros como la varianza,
el coeficiente de correlacin, la diferencia de medias La lgica del proceso en la mayora de los casos es
exactamente igual: partiremos del estadstico cuyo parmetro se desea estimar, al que se le sumar y restar el
error muestral (siempre que la distribucin muestral sea simtrica). Para calcular el error muestral debemos
conocer la distribucin muestral del estadstico que se trate (por lo que hay que consultar las tablas apropiadas
para saber el valor del estadstico correspondiente al nivel de significacin) y consultar la frmula especfica para
calcular el error tpico.
Ejemplo:
Con muestra aleatoria de 1000 sujetos (N = 1.000) queremos estimar el cociente intelectual (CI) medio de la
poblacin. Obtenemos una media de la muestra X = 105 y una desviacin tpica s = 10. Estimar el valor del
parmetro (intervalo confidencial) con un nivel de confianza del 99%.
1) Empleamos la frmula del intervalo confidencial: IC = X EM.
- Para esta frmula tenemos la media X = 105, pero no el error muestral (EM)
2) Empleamos la frmula del error muestral: EM = z( /2) x
- Para esta frmula hallamos la z( /2); como es un nivel de confianza del 99%, a cada lado de la media habra
un 49,5%. Miramos esta cifra en la columna del rea desde la media de las tablas de la curva normal y nos da un z
= 2,57 (pag. 342 tablas de la curva normal).
- Slo nos queda calcular la desviacin tpica de las medias ( x ), cuya frmula es
sustituimos con los datos que nos dan;
10 10
x= = =32
10001 999
3) Con este dato completamos la frmula del punto 2, EM = z ( /2) x , sustituimos datos y tenemos que EM
= 2,57 X 0,32 = 0,82
4) Volvemos al punto 1 y completamos la frmula: IC = X EM. Sustituimos datos y tenemos que IC = 105
0,82.
LCI = 104,18
LCS = 105,82
En definitiva, I.C. = 105 0,82, con lo que obtenemos ambos lmites confidenciales, inferior y superior: L.C. I
= 104,18 y L.C.S = 105,82. En conclusin, podemos decir con un nivel de confianza del 99 % que, si repitisemos
la estimacin un nmero muy elevado de ocasiones, en el 99% de esas muestras, la media en inteligencia de los
adolescentes de la Comunidad de Madrid se encontrara entre los valores 104,18 y 105,82.
11.4.1.- Estimacin del parmetro media aritmtica ( desconocido y para muestras pequeas).
Cuando contamos con muestras pequeas (N < 30), la distribucin muestral de la media sigue la distribucin t
de Student. La distribucin t vara en funcin del nmero de sujetos (y, en consecuencia, de los grados de
libertad), aunque se trata tambin de una distribucin simtrica y asinttica. Cuando N tiende a infinito, la
distribucin t tiende a la distribucin z.
En la figura siguiente puede verse cmo vara la forma de la distribucin muestral segn lo hace el de la
muestra.
La lgica de la estimacin del parmetro media con muestras pequeas es exactamente la misma; lo nico que
cambia es el estadstico para calcular el error muestral. En lugar de trabajar con z ( /2) , lo haremos con t( /2) (ver
tablas en la pgina 347 de t de Student).
Un ejemplo: los mismos datos del ejemplo anterior pero ahora con N = 25.
1) Empleamos la frmula del intervalo confidencial: IC = X EM.
- Para esta frmula tenemos la media X = 105, pero no el error muestral (EM)
2) Al ser una muestra pequea (N<30), ahora empleamos esta frmula para el clculo del error muestral:
EM =t( /2) x
- Para esta frmula hallamos la t( /2) ; como es un nivel de confianza del 99%, nos queda hasta el 100%, un
0,01, por lo que = 0,01, entonces 2 / = 0,005. Miramos esta cifra en la columna correspondiente de la tabla de
la t de Student (pag. 347), y buscamos su coincidencia de 0,005 con la fila 24 (N-1: 25 -1=24) y nos da una t de
2,797.
- Slo nos queda calcular la desviacin tpica de las medias (x ), cuya frmula es
; sustituimos con los datos que nos dan;
10 10
x= = =2,04
251 24
3) Con este dato completamos la frmula del punto 2, EM = t ( /2) x , sustituimos datos y tenemos que EM
= 2,797 X 2,04 = 5,71
4) Volvemos al punto 1 y completamos la frmula: IC = X EM. Sustituimos datos y tenemos que IC = 105
5,71.
LI = 99,29
LS= 110,71
En definitiva, I.C. = 1055,71, con lo que obtenemos ambos lmites confidenciales, inferior y superior: L.C. I =
99,29 y L.C.S = 110,71. En conclusin, podramos afirmar que el intervalo de confianza del 99% alrededor de la
medida de la muestra cae entre los valores de 99,29 y 110,71. Tambin podemos decir que si utilizsemos este
mismo procedimiento de estimacin en cientos o miles de muestras, con un nivel de confianza del 99 %, en el
99% de esas muestras, la media en inteligencia de los adolescentes de la Comunidad de Madrid se encontrara
entre los lmites confidenciales establecidos (y la nuestra podra ser, o no, una de ellas). Sera un error decir que
tenemos una probabilidad de 0.99 de que el valor del parmetro se encontrar entre esos lmites confidenciales.
Como vemos, en nuestro ejemplo, hemos perdido un gran nivel de precisin al disminuir el tamao de la
muestra, de modo que ahora la horquilla del intervalo de confianza es superior a 11 puntos.
La utilidad de la estimacin de parmetros (en este caso del parmetro media) se concreta en distintas
aplicaciones. Por ejemplo, nos puede interesar saber si el CI de nuestra muestra puede considerarse igual al CI de
la poblacin (podramos considerar como CI poblacional el obtenido en una prueba comercial aplicada a una
muestra muy grande de sujetos).
Por otra parte, el error tpico utilizado en la frmula tiene tambin importantes aplicaciones, como es el
clculo del tamao muestral necesario en funcin del margen de error mximo (error muestral mximo) que
estamos dispuestos a aceptar. As, se entender que, a menor error muestral deseado, mayor tendr que ser el
tamao de la muestra.
11.4.2.- Estimacin del parmetro proporcin ().
Es un caso particular del anterior, en el que la media aritmtica oscila entre 0 y 1. En las variables dicotmicas
(si/no, acierto/error) ya vimos que p corresponde a la proporcin de unos y q a la proporcin de ceros (q = 1-p).
Pues bien, si en el caso de la media, el error tpico era:
*Error tpico de la proporcin p = p
El intervalo de confianza se establece igual que en la media aritmtica, pero ahora partiendo de una
proporcin.
Ej: Este es el tpico caso del muestreo electoral. Supongamos una intencin de voto del 36% para el partido X
(p = 0,36) en una muestra de 300 sujetos, es decir, la media es 0,36. El numerador sera la raz cuadrada de
0,64*0,36 (esto es, 0,48). Por tanto, el error tpico sera 0,028. Tomando un = 0,01-->/2 = 0,005 --> z (/2) =
2,57; calculamos los lmites confidenciales para decir que la horquilla de votantes a ese partido se encuentra en el
intervalo IC = 0,36 EM = 0,36 2,57* 0,028 = 0,36 0,07; es decir entre el 29% y el 43% de intencin de voto.
11.5.- Estimacin de la puntuacin verdadera en una prueba.
En el Tema 8 ya vimos aplicaciones de la correlacin, entre ellas las relativas al clculo de la fiabilidad de una
prueba. Distinguamos dos enfoques de la fiabilidad: fiabilidad relativa y fiabilidad absoluta. Hasta ahora nos
estamos refiriendo a la fiabilidad relativa, es decir, el grado en que en distintas aplicaciones del mismo
instrumento los sujetos quedan ordenados del mismo modo, en que sus posiciones relativas, son iguales en las
distintas aplicaciones (aunque la puntuacin no sea exactamente la misma).
La fiabilidad absoluta est ms directamente relacionada con el error tpico de medida y en consecuencia con
la inferencia estadstica. Su utilidad fundamental es la estimacin de la puntuacin verdadera de un sujeto en un
instrumento, o dicho de otra forma, entre qu puntuaciones es ms probable que se encuentre la verdadera
puntuacin, ya que toda medida tiene algn margen de error.
Ej: supongamos que hemos aplicado una prueba objetiva de Matemticas de 100 tems a un grupo. El sujeto X
ha obtenido una puntuacin de 47. nos podemos preguntar: si le hubiera aplicado infinitas veces y en las mismas
condiciones la misma prueba, habra obtenido siempre la misma puntuacin? Pues bien, esto depender en buena
parte de la fiabilidad de la prueba, de su precisin. A partir de la fiabilidad y de la lgica de la inferencia, se podra
llegar a estimar que en el 99% de los casos de esas hipotticas infinitas aplicaciones, su puntuacin se encontrara
entre 44 y 50.
De nuevo se trata de hallar el intervalo de confianza en el que es probable que se encuentre la verdadera
puntuacin del sujeto en la prueba. Sabiendo que la distribucin muestral es normal, necesitamos conocer el error
tpico de medida que en este caso es el siguiente:

rxx = coeficiente de fiabilidad.


St = desviacin tpica total en el instrumento de medida.
11.6.- Intervalo de confianza de la puntuacin estimada en la regresin lineal simple.
Una de las aplicaciones de la regresin lineal es estimar la puntuacin de un sujeto en una variable
denominada criterio a partir de la puntuacin conocida en otra variable denominada predictora.
Para realizar esta prediccin o estimacin, en realidad estamos llevando a cabo una estimacin del parmetro
Y o puntuacin del sujeto en el criterio. Si aplicamos la frmula de la regresin, obtenemos la estimacin puntual
del sujeto. Pero, si queremos ser ms realistas, dadas las limitaciones de toda prediccin, deberemos establecer el
intervalo de puntuaciones entre las cuales cabe esperar, con una determinada probabilidad, que se encuentre la
puntuacin predicha para el sujeto
Para ello, sabiendo que la distribucin muestral de Y es la normal, debemos conocer el error tpico de
estimaciones, que para muestras grandes es:
11.7.- Estimacin del parmetro correlacin de Pearson. Introduccin al concepto de la significatividad
estadstica.
En muchas ocasiones, cuando calculamos una correlacin, en realidad estamos ms interesados en la relacin
que existe entre esas dos variables en la poblacin, que en la muestra. Para saber si la correlacin calculada en una
muestra si la relacin entre dos variables se da en la poblacin, se trata de calcular el intervalo de confianza para
la correlacin de Pearson, de modo que podamos estimar entre qu valores se encuentra dicho coeficiente entre la
poblacin.
Sabemos que la distribucin muestral de la correlacin de Pearson se asemeja a la distribucin normal con el
siguiente error tpico:

Ejemplo:
Supongamos que tenemos una muestra con 20 sujetos (N = 20) y obtenemos una correlacin de r xx = 0,35.
Cmo ser la correlacin en la poblacin con un nivel de confianza del 95%?.
1) Empleamos la frmula del intervalo confidencial: IC = rxx EM.
- Para esta frmula tenemos la correlacin es rxx = 0,35, pero no el error muestral (EM)
2) Ahora empleamos esta frmula para el clculo del error muestral: EM = z ( /2) r
- Para esta frmula hallamos la z ( /2) ; como es un nivel de confianza del 95%, nos queda hasta el 100%, un
0,05, por lo que = 0,05, entonces 2 / = 0,025. Miramos esta cifra en la columna del rea menor (columna C) de
las tablas de la curva normal y nos da un z =1,96 (pag. 341 tablas de la curva normal).
- Slo nos queda calcular la desviacin tpica ( rxx ), que al tratarse de una muestra pequea (N<100) su
frmula es

; sustituimos con los datos que nos dan;

020

OJO: Si se tratara de una muestra grande (N>100) la frmula la utilizar sera:

3) Con este dato completamos la frmula del punto 2, EM = z ( /2) r , sustituimos datos y tenemos que EM
= 1,96 X 0,20 = 0,39
4) Volvemos al punto 1 y completamos la frmula: IC = r xx EM. Sustituimos datos y tenemos que IC =
0,35 0,39.
Respuesta: En consecuencia, la correlacin en la poblacin estar entre los lmites -0,04 y 0,74.
Efectivamente, como pensar el estudiante, es un enorme intervalo de confianza, desde una correlacin negativa
(o nula) hasta una correlacin positiva y alta.
El intervalo tan amplio es debido al pequeo tamao de la muestra. Cuanto ms pequea sea la muestra, ms
imprecisa ser la estimacin, ya que es ms probable que est sesgada o que no sea representativa de la poblacin.
Si esta clculo se hubiera hecho sobre una muestra grande (N>100) la diferencia entre los valores obtenidos habra
sido menor, ya que a muestras ms grandes menor mayor precisin de la estimacin.
Introduccin al concepto de la significatividad estadstica.
Hablamos de significacin estadstica o significatividad cuando nos referimos al significado de la diferencia
entre dos medidas. Decimos tambin que un coeficiente de correlacin es estadsticamente significativo cuando es
distinto de cero, es decir, cuando el coeficiente de correlacin (estadstico) es lo suficientemente grande (cercano a
1: 0,99; 0,98; etc) como para decir que la correlacin en la poblacin (parmetro) de referencia es distinta de
cero. Si queremos conocer cul es su magnitud en la poblacin, entonces calcularemos el intervalo de confianza.
Cuando estimamos el intervalo de confianza en el cual es probable que se encuentre la verdadera correlacin
en la poblacin, y este intervalo contiene el valor cero (ausencia absoluta de correlacin) diremos que dicha
correlacin NO es estadsticamente significativa, es decir, que estadsticamente hablando, esa correlacin es
(puede ser) igual a cero y la diferencia con r=0 que hemos obtenido en la muestra se debe al azar, al error de
muestreo.
Sin embargo, debemos ser cuidadosos en la interpretacin. Cuando una correlacin no es estadsticamente
significativa (y, por ejemplo, nuestra conclusin es que p>005):
- Una correlacin no significativa es una correlacin que no podemos generalizar sin ms. Con los datos que
tenemos no podemos afirmar que en la poblacin (en otras muestras semejantes) hay una relacin, aunque sea
pequea, y distinta de cero.
- Por otra parte una correlacin no significativa no es prueba de no relacin en la poblacin (podramos
encontrarla quizs en muestras mayores, o utilizando otras medidas ms precisas; no probar que hay relacin no
es lo mismo que probar que no hay relacin.
En el ejemplo anterior, estaramos diciendo que, con los datos que tenemos r=035 puede ser lo mismo que r =
0 (al menos, no podemos probar que en la poblacin r 0), ya que, al calcular el intervalo de confianza, el 0 est
dentro de dicho intervalo; por lo tanto, no es estadsticamente significativo.
Hablar de significatividad estadstica no es lo mismo que hablar d ella magnitud de las diferencias, de que
existan grandes diferencias o, en este caso, que la correlacin sea elevada. La magnitud de la correlacin (o de su
diferencia con un r =0) la juzgaremos igualmente conforme a los criterios explicados en el Captulo 7.
Ej: vemos en una matriz de correlaciones entre tres preguntas de un cuestionario. Las magnitudes de las
correlaciones varan entre 018 y 041, pero todas ellas son estadsticamente significativas con un nivel de
confianza del 99% ( = 001). Correlacin significativa, es decir, distinta de cero en la poblacin de referencia. El
valor de r =018 es una correlacin muy baja, poco relevante en la prctica, pero estadsticamente significativa
(vase que el tamao de la muestra es grande, lo que favorece la significatividad). Esas dos variables tienen una
correlacin en la poblacin distinta de 0 Cul es su magnitud en la poblacin? Para eso debemos estimar el
intervalo de confianza.
11.8.- Estimacin del parmetro diferencia de medias (1 2)
La estimacin del parmetro diferencia de medias nos acerca a la lgica del contraste de hiptesis.
Ej: si una universidad encuentra que el CI medio de sus estudiantes es de 110, y otra universidad lo tiene de
105, cmo es la diferencia entre estas dos puntuaciones en la poblacin de referencia? La diferencia entre estas
dos puntuaciones es estadsticamente igual a cero?, es decir, podemos considerar que esa diferencia de 5 puntos
obtenida en ambas muestras puede ser fruto del azar, fruto de la seleccin aleatoria? Si dicha diferencia es
compatible con una diferencia igual a cero, concluiremos, al nivel de confianza fijado, que ambas muestras tienen
el mismo CI y que la diferencia encontrada es aleatoria, es estadsticamente igual a cero.
Si establecemos el intervalo de confianza a partir del estadstico diferencia de medias, obtendremos los lmites
confidenciales entre los cuales es ms probable que se encuentre la diferencia de medias en la poblacin.
Si este intervalo de confianza incluye la puntuacin cero, entonces dicha diferencia es compatible con una
diferencia de medias igual a cero, y en consecuencia, podremos interpretar que dicha diferencia es
estadsticamente igual a cero.
**Errata** la segunda frmula tambin sirve para muestras grandes**
**Errata** Encima del grfico, en vez de decir z(/2), debera decir t(/2)
Podemos concluir que el parmetro diferencia de medias en la poblacin se encontrar entre una diferencia de
192 y 808. Por tanto, es una diferencia incompatible con una diferencia de medias igual a 0, por lo que
podremos decir que dicha diferencia es estadsticamente significativa, esto es, que las diferencias de medias en CI
entre ambos grupos no son aleatorias, sino que esas muestras pertenecen a poblaciones con parmetro media
distinto. Esto, sin embargo, no quiere decir que las diferencias sean importantes o relevantes en la prctica; slo
que son estadsticamente significativas.
11.8.1.- Estimacin del parmetro diferencia de proporciones.
Lo nico que vara en este caso es el error tpico. Al igual que en el contraste de medias, lo ms interesante
suele ser la diferencia entre dos proporciones. Por ejemplo: hay diferencias en la proporcin de estudiantes que
aprob la asignatura de Estadstica en el turno de maana y en el grupo de tarde? Es compatible esta diferencia
con una diferencia igual a cero en la poblacin?
El error tpico de la diferencia de proporciones es:

Y la estimacin del intervalo de confianza y su interpretacin ser la misma que en el caso anterior, pero con
medias en trminos de proporcin, que frecuentemente se multiplican por 100 para convertirlos en porcentajes.
11.9.- Estimacin de parmetros y contraste de hiptesis: interpretacin intuitiva.
EL contraste de hiptesis sigue esta misma lgica inferencial. De hecho, todo se reduce al contraste de una
hiptesis estadstica, denominada hiptesis nula (Ho), segn la cual se plantea una distribucin muestral que indica
la no existencia de diferencias estadsticamente significativas. Es decir, es una distribucin muestral que indica
que todas las diferencias encontradas entre dos sucesos se deben simplemente al azar.
Ej: si estamos estudiando el efecto de un programa para mejorar la capacidad verbal de los sujetos, podemos
realizar un diseo de dos grupos: a un grupo (grupo experimental) le aplicamos el programa y despus le pasamos
una prueba de rendimiento verbal. Al otro grupo (grupo de control) no se le aplica el programa pero se le pasa
tambin la prueba de rendimiento. De esta forma obtenemos dos medias aritmticas, una por cada grupo,
esperando que nuestro programa sea eficaz, es decir, que el grupo de sujetos al que hemos aplicado el programa
obtenga una media aritmtica superior a la del grupo de control (tambin podra plantearse simplemente la
existencia de diferencias significativas entre ambas medias).
Pues bien, la hiptesis nula indica que la diferencia entre estas dos medias aritmticas no es estadsticamente
significativa porque se puede explicar por efecto del azar.
Al igual que hacamos en la estimacin de parmetros, se establece una zona central alrededor de la media en
la curva normal, en la que es ms probable que las diferencias encontradas entre las medias de las muestras se
deban efectivamente a los efectos del azar. Es la zona de aceptacin (ms bien, de no rechazo) de la hiptesis nula
Ho. Por tanto, al no poder rechazar la H o (decimos que no es falsa) estamos deduciendo que las muestras que
comparamos pertenecen a la misma poblacin, y que si hemos encontrado una diferencia emprica, sta se de
probablemente a los efectos de la seleccin aleatoria de dichas muestras.
Adems, establecemos otra zona en la que las diferencias entre las medias son de un tamao tal que resultara
muy improbable (segn la distribucin muestral conforme a H o) que fueran aleatorias, por lo que dicha diferencia
la atribuimos a la variable independiente.
En este caso, expresamos la distribucin muestral de la hiptesis nula del modo siguiente:
Hiptesis nula: Ho: E - C= 0 (las diferencias entre las medias aritmticas de los grupos experimental y
control son estadsticamente igual a cero, es decir, las diferencias empricas que existan entre las medias de las
muestras se deben al azar; los valores paramtricos son iguales, las dos muestras pertenecen a la misma
poblacin).
Se trata de la distribucin muestral de diferencia de medias que parte de una diferencia de medias igual a cero.
Por tanto, las frmulas para hallar el intervalo de confianza son las mismas que en el epgrafe anterior, para
muestras grandes y pequeas.

Si resulta que nuestra diferencia emprica de medias se encuentra dentro del intervalo de confianza de la
distribucin muestral conforme a H o, diremos que nuestra diferencia de medias es compatible con una diferencia
de medias igual a cero y, por tanto, que se trata de una diferencia estadsticamente no significativa o igual a cero.
Es decir, habremos obtenido una diferencia de medias lo suficientemente pequea entre los grupos como para
concluir que se debe al efecto del azar y no a la variable independiente.
En realidad, lo que haremos es calcular un estadstico (t, z, ) que nos dir cuntas desviaciones tpicas
(errores tpicos) se aleja nuestra diferencia de medias de una diferencia de medias igual a cero. Un valor grande de
z (por ejemplo mayor que 196 o 257, segn nuestro nivel de significacin) indicar una probabilidad pequea
de que nuestra diferencia de medias pertenezca a una poblacin cuya diferencia de medias sea igual a cero).
Desde el punto de vista pedaggico la significatividad es importante, pero lo es ms el tamao del efecto, que
se refiere a la relevancia prctica de los resultados, a la interpretacin de si se puede considerar que la diferencia
encontrada entre las medias es grande o pequea, independientemente de que sea o no significativa.
Los intervalos de confianza y el tamao del efecto proveen una lectura ms prctica de los resultados. Por
ello, en los informes de investigacin actuales se recomienda informar de las tres estimaciones: contraste de
hiptesis, intervalos de confianza y tamao del efecto.
El tamao del efecto nos dice cunto de la variable dependiente se puede controlar, predecir o explicar por la
variable independiente o en qu grado la hiptesis nula es falsa. En definitiva, nos va a permitir hablar de
magnitudes, de diferencia grande o pequea.
Habitualmente, el tamao del efecto se presenta mediante una diferencia tipificada, es decir, una puntuacin
interpretable como una puntuacin tpica. Su clculo: en el numerador tendremos la diferencia de medias y en el
denominador una desviacin tpica que puede ser una desviacin combinada (o tambin la del grupo de control o
la del post-test, dependiendo del tipo de diseo).

Anda mungkin juga menyukai