Introducción
Analizar información procedente de diversas vías es una actividad común en el ser humano.
Habitualmente examinamos aspectos de nuestra realidad, indagamos en un problema vital o
damos diferentes interpretaciones a las cosas que nos ocurren. Desde este punto de vista
llevamos a cabo un proceso de asimilación de la información externa y acomodación en nuestro
intelecto, que muchas veces es realizado de manera automática.
Cuando nos referimos aquí al Análisis de Datos hablamos de un proceso de indagación científica
sobre un problema de investigación concreto con relevancia social y educativa. La información
que recogemos puede ser tanto numérica como textual, y ante ella nos disponemos a la
realización de diferentes actividades o tareas de análisis acordes con el tipo de dato recogido, el
problema de investigación formulado, y las características propias del diseño de investigación al
que nos enfrentamos. De esta manera, el Análisis de Datos no constituye un fin en sí mismo
sino que es un proceso subordinado a otro más amplio como es la investigación educativa.
Este término se define de muchas maneras según se conciba desde una perspectiva más amplia
o más restringida, y según se entienda también el proceso de investigación.
El concepto de Análisis Estadístico de Datos no se agota en las acepciones que se identifican con
un conjunto de datos o enumeración de hechos, o con procedimientos de tipo descriptivo
destinados a recoger, organizar y presentar la información relativa a un conjunto de casos. De
esta manera, el Análisis Estadístico de Datos ha dejado de ser únicamente la ciencia de recopilar
datos y, tras fusionarse con la corriente de estudios sobre el cálculo de probabilidades, se ha
Investigación Educativa 2
constituido en una rama de la matemática aplicada, entendiendo ésta como el uso de principios
y modelos matemáticos en diversos ámbitos de la ciencia o la técnica.
• Análisis Estadístico de Datos Aplicado; este carácter aplicado ha estado presente desde los
inicios de esta ciencia, sobre todo en cuanto a su conexión con el estudio y resolución de
problemas prácticos con datos reales. Todo ello ha estimulado la innovación de nuevos
métodos y procedimientos, y el avance de análisis estadísticos.
Terminaremos este apartado sintetizando los rasgos más relevantes que llevan a definir el
Análisis Estadístico de Datos:
• Los métodos desarrollados por esta ciencia pueden ser aplicados a distintos campos del
saber, constituyendo un importante instrumento para el estudio científico.
Nos permite reducir los datos en una forma significativa y conveniente, poniendo orden en el
caos.
Facilita la extracción de conclusiones generales, siguiendo reglas aceptadas para llegar a ellas.
Permite hacer predicciones sobre lo que ocurrirá bajo condiciones que conocemos y hemos
medido. Tales predicciones pueden contener error, pero el Análisis Estadístico de Datos nos
informa también del margen de error que cometemos.
Nos permite analizar algunos de los factores causales que explican fenómenos complejos.
De esta manera, intentamos resalta la presencia del Análisis Estadístico de Datos en diferentes
momentos del proceso de investigación y la utilidad de las técnicas estadísticas en y para el
mismo. Dicho proceso constituye un todo interrelacionado en el que la toma de decisiones que
realicemos sobre cualquier elemento del mismo supone un condicionante de cara a los demás
elementos.
Definimos problema como una laguna en el conocimiento (un interrogante que nos hacemos)
para la cual no tenemos solución aceptable. El problema ha de ser relevante y verificable
empíricamente y se debe formular de manera clara y breve. En este sentido, es muy importante
la resolubilidad del problema de investigación, aspecto que en ocasiones sólo queda
garantizado si contamos con técnicas estadísticas adecuadas y potentes, capaces de abordar los
interrogantes de partida. Por ejemplo, el planteamiento de problemas que supongan
comparaciones entre múltiples grupos no podría hacerse sin contar con técnicas como el
análisis de la varianza; un gran número de problemas de investigación en los que se incluyen
múltiples dimensiones o variables simultáneamente no han llegado a ser estudiados hasta que
no se ha contado con técnicas de análisis multivariante que permiten abordar su estudio.
2. Diseño de investigación
Como expusimos en un apartado anterior, el Análisis Estadístico de Datos forma parte de los
diseños de investigación experimentales. En el concepto de diseño contemplamos por un lado
la organización de los aspectos que constituyen el experimento (en los que el Análisis
Estadístico de Datos está presente en la medida que facilitan el análisis de datos y posibilitan el
control de la varianza debida a variables extrañas), y por otro, el procedimiento estadístico que
hace posible la interpretación de los resultados.
El Análisis Estadístico de Datos también está presente cuando el diseño contempla la selección
de sujetos. La teoría de muestras proporcionará tanto los procedimientos de selección como la
determinación del tamaño muestral necesario para mantener el error dentro de los límites
aceptables.
Por otro lado, la recogida de datos es una tarea para la que aparentemente las técnicas
estadísticas parecen no jugar un papel relevante. Sin embargo, el Análisis Estadístico de Datos
tiene un lugar especial en la construcción y validación de instrumentos que se utilizan para la
recogida de datos. Por ejemplo, la determinación de la fiabilidad y validez de algunos
instrumentos se apoya directamente en coeficientes de correlación, o la aplicación de técnicas
de análisis de componentes principales o análisis factorial permite explorar la dimensionalidad
de los instrumentos.
3. Análisis de Datos
El procedimiento de Análisis suele comenzar con una depuración de los datos para tratar de
eliminar o corregir los posibles errores que se hayan cometido en la fase de registro o
codificación de la información recogida. Una segunda fase es la descripción de las variables que
entrarán a formar parte del estudio, teniendo en cuenta el enfoque del que partimos
(univariante, multivariante o aplicación de técnicas inferenciales).
• Análisis Cualitativo, que expresa, ordena, describe, interpreta los datos mediante
conceptos, razonamientos y palabras, y
• Análisis Cuantitativo, en el que se recurre a conceptos y razonamientos que se apoyan en
números y estructuras matemáticas.
Estas conclusiones, al igual que todo el proceso de investigación, deben contar con la inclusión
de resultados estadísticos. De esta manera, el Análisis Estadístico de Datos está presente en la
fase de redacción del informe de investigación. Para ilustrar tales conclusiones se utilizarán
cuadros, tablas y gráficos, que recogerán medias, porcentajes, coordenadas, correlaciones, o
cualquier otro tipo de estadísticos necesarios para ilustrar de manera adecuada la investigación
realizada.
Lejos de realizar una exhaustiva revisión de todas las técnicas y métodos estadísticos existentes,
nuestra pretensión en este apartado es apuntar a grandes rasgos los principales campos en que
se estructura el Análisis Estadístico de Datos, y sobre todo el que habitualmente se aplica en el
campo de las Ciencias de la Educación.
• Estadística univariada.
• Bivariada.
• Multivariada.
1. Concepto de medida
Toda medición implica establecer una regla para hacer corresponder los números con las
distintas formas en que se presenta una característica de los objetos o individuos. En el caso de
la investigación educativa, se suelen asignar números a conductas, opiniones, actitudes,
intereses, etc. manifestadas por individuos o grupos.
2. Niveles de medida
Según el modo en que se utilizan los números en la medición, podemos hablar de distintos
niveles de medida:
a) Nivel nominal.
El nivel nominal de medición consiste en asignar números que hacen la función de meros
nombres o etiquetas.
Si empleamos un nivel de medida nominal lo único que podemos inferir es que los objetos
difieren entre sí respecto del atributo medido, aunque ello no implica ninguna otra propiedad.
b) Nivel ordinal.
El nivel ordinal de medida supone que podemos establecer una ordenación, creciente o
decreciente, con los objetos o hechos que medimos.
Con un nivel de medida ordinal podríamos establecer sin dificultad que algo es diferente de
algo, y que es mayor o menor, pero no cuánto mayor o menor.
Investigación Educativa 11
c) Nivel de intervalo
En este nivel de medida, distancias numéricamente iguales representan distancias iguales con
respecto a la propiedad que se está midiendo.
Una medición a nivel de intervalo posee las características de los dos niveles anteriores, por lo
que podemos establecer diferencias entre objetos, determinar una ordenación entre ellos y
además, conocer en qué cuantía unos objetos son mayores o menores que otros.
Además de las propiedades de los niveles anteriores, en las medidas en escala de razón puede
afirmarse que el valor cero indica ausencia total del rasgo medido.
Una constante es una característica que se manifiesta de manera similar en todos los objetos o
individuos sobre los que se realiza la medición. Es decir, presenta un único valor posible.
Una variable es una característica que puede manifestarse de manera diferente en un grupo de
objetos o individuos sobre los que se realiza la medición. Cada uno de los valores asumidos es
una modalidad.
Cuando el número de modalidades bajo el que se mide una variable es muy grande, las
modalidades pueden ser agrupadas en clases. De esta manera, se pasa de un número amplio de
modalidades a un número mucho más reducido de clases. Al definir clases, deben respetarse al
menos dos criterios:
Las clases deben ser mutuamente exclusivas. Es decir, una modalidad no puede formar parte de
dos clases; quedará incluida en sólo una clase.
Investigación Educativa 12
Las clases deben ser exhaustivas. La definición de clases debe cubrir todas las modalidades, de
forma que ninguna modalidad quede sin pertenecer a alguna clase.
Las técnicas más habituales para ordenar, clasificar y presentar datos son las distribuciones de
frecuencias. Comenzaremos concretando el concepto de frecuencia.
Frecuencia absoluta individual (fi) de un valor. Es el número de veces que aparece repetido
dicho valor en un conjunto de n puntuaciones. La suma de las frecuencias fi para todos los
valores coincide con el valor de n.
A partir de las frecuencias alcanzadas por las distintas modalidades de una variable, puede
organizarse una distribución de frecuencias. Una distribución de frecuencias consiste en
presentar ordenadamente todos los valores asumidos por la variable estudiada, situando a su
derecha la frecuencia con que aparecen (al menos, su frecuencia absoluta).
Frecuencia absoluta acumulada (fa) de un valor. Es la suma de las frecuencias absolutas que
corresponden a todos los valores iguales o menores que él. La frecuencia fa para el valor más
alto de la variable coincide con n.
Investigación Educativa 13
Frecuencia relativa acumulada (pa) de un valor. Es la suma de las frecuencias relativas de los
valores iguales o menores que él. Expresada en términos de porcentaje, aparece como Pa, y la
Pa correspondiente al valor más alto resulta ser 100.
• Límites aparentes de un intervalo. Son los valores que delimitan el segmento de valores que
constituyen un intervalo. Para cada intervalo existe un límite inferior y un límite superior.
• Límites reales de un intervalo. El límite real inferior de un intervalo es el valor que resulta
de disminuir el valor del límite aparente inferior en media unidad de medida. El límite real
superior de un intervalo resulta de incrementar el límite superior aparente en media unidad
de medida.
• Amplitud de un intervalo. Es la distancia existente entre el límite real inferior y el límite real
superior de un intervalo. También se podría definir como la diferencia entre los límites
aparentes del intervalo incrementada en la unidad de medida.
• Punto medio de un intervalo. Es el valor que se obtiene como promedio de los dos límites
del intervalo (real o aparente).
1. Diagrama de Barras
Consiste en indicar por medio de una barra o rectángulo las frecuencias correspondientes a
cada modalidad o clase de modalidades. Las alturas de las barras son proporcionales a las
frecuencias alcanzadas, con independencia de que se trate de frecuencias absolutas o relativas.
Cuando representamos variables medidas en una escala nominal, las modalidades o clases
pueden ser colocadas en cualquier orden.
Cuando las variables se miden en escala ordinal, las barras deben ser colocadas en un orden
determinado por la ordenación que se establece entre las modalidades.
2. Histograma
Cuando la variable a representar está medida en una escala de intervalos, en lugar del diagrama
de barras recurrimos al histograma. Este es similar al diagrama de barras, pero la base de cada
rectángulo coincide con los límites reales del intervalo y el orden de presentación de las
modalidades en el eje de abscisas no es arbitrario. El histograma puede construirse para
frecuencias absolutas o relativas, tanto si son individuales como acumuladas.
3. Polígono de Frecuencias
Consiste en una línea poligonal que une el punto medio de cada intervalo, tomado a una altura
que resulta proporcional a la frecuencia alcanzada en el intervalo. La línea obtenida de este
modo cierra el polígono al ser unida a los puntos medios del intervalo anterior y posterior sobre
el eje de abscisas Puede construirse a partir del histograma.
Es una línea poligonal mediante la cual se representan las frecuencias que acumulan los
intervalos. Se construye cómodamente sobre el polígono de frecuencias acumuladas, uniendo
el vértice inferior izquierdo de cada intervalo con su vértice superior derecho.
5. Ciclograma
Investigación Educativa 15
Problemas
• Problema 1
Hemos recogido los siguientes datos, correspondientes a las puntuaciones obtenidas por 25
alumnos en un test de inteligencia. Organízalos en una distribución de frecuencias sin agrupar
en intervalos.
105, 99, 109, 100, 94, 100, 97, 120, 99, 107, 96, 107, 100, 109, 105, 97, 100, 105, 96, 99, 100,
97, 105, 107, 99.
• Problema 2
3, 6, 7, 9, 9, 12, 12, 13, 13, 14, 14, 15, 15, 16, 16, 20, 20, 20, 20, 20, 22, 23, 24, 24, 24, 25, 25,
28, 35, 37.
• Problema 3
• Problema 4
Investigación Educativa 16
Representa mediante un histograma las edades (en meses) de los 60 alumnos del segundo
ciclo de Educación Infantil de un Centro, cuya distribución de frecuencias es la siguiente:
Edades Nº Alumnos
55 - 59 16
50 - 54 10
45 - 49 8
40 - 44 7
35 - 39 8
30 - 34 6
25 - 29 5
• Problema 5
C.I. Nº Alumnos
116 - 120 1
111 - 115 3
106 - 110 7
101 - 105 11
96 - 100 2
91 - 95 1
• Problema 6
• Solución Problema 1
Para realizar la distribución de frecuencias debemos, en primer lugar, ordenar los datos (de
mayor a menor o de menor a mayor), representarlos en una tabla y realizar el recuento
correspondiente a cada uno de los valores (las "marcas" facilitan dicha labor), tal y como se
expresa en la tabla siguiente:
• Solución Problema 2
En primer lugar, calculamos la amplitud total para la serie de puntuaciones con las que vamos a
trabajar.
Este valor nos indica que necesitamos un número superior a 7 intervalos para distribuir todas
nuestras puntuaciones en intervalos de amplitud 5. El número de intervalos mínimo necesario
sería 8. Una vez construidos los intervalos, determinamos la frecuencia absoluta individual (f)
en cada uno de ellos, la proporción (p), el porcentaje (P) y los correspondientes valores
acumulados para todos ellos (fa, pa y Pa).
Investigación Educativa 18
Intervalos Marcas f p P fa pa Pa
36 - 40 / 1 0.0333 3.33 30 1.0000 100.00
31 - 35 / 1 0.0333 3.33 29 0.9667 96.67
26 - 30 / 1 0.0333 3.33 28 0.9333 93.33
21 - 25 ///// // 7 0.2333 23.33 27 0.9000 90.00
16 - 20 ///// // 7 0.2333 23.33 20 0.6667 66.67
11 - 15 ///// /// 8 0.2667 26.67 13 0.4333 43.33
6 - 10 //// 4 0.1333 13.33 5 0.1667 16.67
1-5 / 1 0.0333 3.33 1 0.3333 33.33
No obstante, podríamos haber organizado los datos comenzando el primer intervalo con un
límite aparente inferior distinto (por ejemplo, 2 o 3). En ese caso, la distribución resultante
diferirá algo de la aquí construida.
• Solución Problema 3
En este caso la superficie del círculo (360 o) se reparte proporcionalmente a las frecuencias de
cada categoría. Los profesores definitivos ocuparán un sector circular que representa el 48.39%
de los 360o, es decir, 360 x 48.39/100 = 174 o que suponen algo menos de un ángulo llano. Los
profesores provisionales estarán representados por un sector de 360 x 3226/100 = 116 o, es
decir, algo más que un ángulo recto. Cálculos análogos determinan un sector circular de
47o para los profesores en comisión de servicios y 23 o para los interinos.
• Solución Problema 4
Investigación Educativa 19
El histograma es similar a un diagrama de barras en el que dichas barras se levantan sobre los
límites reales de los intervalos, apareciendo, por tanto, unidas lateralmente entre sí.
• Solución Problema 5
Para trazar el polígono de frecuencias se señala el punto medio de cada intervalo en el eje de
abscisas (horizontal), se marca la altura correspondiente, de acuerdo con las frecuencias y se
unen los puntos marcados con líneas rectas. El gráfico cortará el eje de abscisas en los puntos
medios de los intervalos inmediatamente superior al intervalo mayor e inferior al menor
(ambos con frecuencia cero).
• Solución Problema 6
Investigación Educativa 20
a) Media (Promedio): Es el valor obtenido como suma de todas las puntuaciones de un grupo
dividida por el número de ellas.
Cálculo:
Datos sin agrupar Datos agrupados por intervalos
donde: donde:
· Xi es cada puntuación · Xi es el punto medio de cada intervalo
· n es el número de casos · fi es la frecuencia de cada intervalo
· r es el número de intervalos
· n es el número de casos
Propiedades
Es decir, si entonces
Investigación Educativa 22
• Dados r grupos con n1, n2, ... nr casos y sus respectivas medias, la media global se obtiene
ponderando dichas medias.
Cálculo
· n es el número de casos
Propiedades.
Investigación Educativa 23
• Es menos sensible que la media a variaciones de las puntuaciones. Podría ocurrir que
la modificación de un valor no altera la mediana
• La mediana puede calcularse cuando se han medido las variables en escala ordinal o
superior.
Cálculo
Datos sin agrupar Datos agrupados por intervalos
· Se construye la distribución de Punto medio del intervalo con mayor frecuencia,
frecuencias. o bien:
· El valor con frecuencia máxima es la
moda.
· Si la frecuencia máxima se alcanza para
donde:
dos o más valores, éstos constituyen
· Li es el límite inferior del intervalo modal
modas. El grupo puede ser bimodal o
(que contiene a la moda).
multimodal.
· I es la amplitud de los intervalos.
· · Si dos valores adyacentes alcanzan la
· d1 es la diferencia entre las frecuencias del
máxima frecuencia, la moda es el
intervalo modal y el intervalo inferior.
promedio de ambos. · d2 es la diferencia entre las frecuencias del
intervalo modal y el intervalo inmediato
superior.
Propiedades
• Es la medida de tendencia central más inestable, pudiendo variar mucho de una muestra a
otra extraídas de la misma población.
• Para datos agrupados por intervalos, el valor de la moda dependerá de la amplitud de los
intervalos, el número de ellos y los límites fijados.
• Puede determinarse para variables medidas en cualquier escala.
2. Medidas de posición
Investigación Educativa 24
a) Percentiles: Son los 99 valores que dividen en cien partes iguales a una serie de
puntuaciones ordenadas, de forma que el percentil Pm deja por debajo de sí el m por
ciento de las puntuaciones del grupo.
Cálculo
donde:
b) Deciles: Son los 9 valores que dividen en diez partes iguales a una serie de puntuaciones
ordenadas, de forma que el decil Dm deja por debajo de sí a m décimas partes del total de
puntuaciones del grupo.
Cálculo
c) Cuartiles: Son los 3 valores que dividen en cuatro partes iguales a una serie de
puntuaciones ordenadas, de manera que el cuartil Qm deja por debajo de sí m cuartas
partes del total de puntuaciones del grupo.
Cálculo
3. Medidas de dispersión
Son medidas que informan sobre la variabilidad que existe en un conjunto de puntuaciones.
Indican en qué medida las puntuaciones se sitúan próximas entre sí.
El rango es la más imperfecta de las medidas de dispersión, pues sólo tiene en cuenta las
puntuaciones extremas.
b) Desviación media: Es la media del valor absoluto de las diferencias de todas las
puntuaciones respecto a la media aritmética.
Cálculo:
Datos sin agrupar Datos agrupados por intervalos
Investigación Educativa 26
donde: donde:
· Xi es cada puntuación · Xi es el punto medio de cada intervalo
· es la media · es la media
· n es el número de casos · fi es la frecuencia de cada intervalo
· r es el número de intervalos
· n es el número de casos
c1) Varianza: La varianza es el promedio del cuadrado de las diferencias de todas las
puntuaciones respecto a la media aritmética.
Cálculo
Podemos proponer dos fórmulas equivalentes, tanto para datos sin agrupar como para datos
agrupados por intervalos.
c2) Desviación típica: Se define como la raíz cuadrada de la varianza, tomada con signo
positivo.
Investigación Educativa 27
Se obtiene a partir del número de veces que la desviación típica contiene a la media.
Problemas
• Problema 1
Las puntuaciones obtenidas por un grupo de 38 alumnos en una prueba valorada de 0 a 100,
las cuales se suponen medidas en escala de intervalos, son las que se presentan en la tabla.
b) ¿Qué puntuación deja por debajo de sí el 75% de los casos? ¿Y el 25%? ¿Cómo se denominan
dichas puntuaciones?
Intervalos f
91 - 100 2
81 - 90 0
71 - 80 3
61 - 70 6
51 - 60 7
41 - 50 9
31 - 40 4
21 - 30 5
11 - 20 1
1 - 10 1
• Problema 2
Las puntuaciones obtenidas por 59 alumnos en una prueba de diagnóstico en lectura son las
que se recogen en la tabla siguiente.
Intervalos F fa
47 - 49 4 59
44 - 46 7 55
41 - 43 4 48
38 - 40 8 44
35 - 37 4 36
32 - 34 1 32
29 - 31 5 31
26 - 28 6 26
23 - 25 6 20
20 - 22 4 14
17 - 19 3 10
14 - 16 2 7
Investigación Educativa 29
11 - 13 2 5
8 - 10 2 3
5-7 0 1
2-4 1 1
• Problema 3
Los 25 niños de un aula de Educación Parvularia han sido evaluados para determinar el nivel
que presentan en ciertas variables relevantes para el aprendizaje de las matemáticas. Teniendo
en cuenta que los resultados obtenidos en una prueba de discriminación de formas son los que
aparecen a continuación, determina la tendencia central del grupo mediante la media, la
mediana y la moda, así como el grado de dispersión que presentan las puntuaciones, expresado
a partir de su rango y su desviación típica.
27, 35, 40, 26, 32, 31, 35, 28, 29, 25, 36, 31, 27, 29, 25, 32, 34, 28, 33, 35, 29, 30, 39, 27, 25.
• Problema 4
Tras aplicar una prueba de cálculo mental a 70 alumnos de 4° Básico, pretendemos describir la
dispersión del conjunto de puntuaciones obtenidas. Determina el valor del rango, la desviación
media, la varianza, la desviación típica y el coeficiente de variación.
I fi
19 - 21 5
16 - 18 9
13 - 15 12
10 - 12 25
7-9 13
4-6 4
1-3 2
• Problema 5
La directora de Recursos Humanos de una entidad educativa utiliza determinada prueba con la
que mide la aptitud de los candidatos para desempeñar cierto puesto de trabajo. El total de
Investigación Educativa 30
aspirantes es de 190 y los resultados alcanzados por cada uno de ellos en la prueba son los que
mostramos seguidamente.
Aptitud fi
125-129 7
120-124 8
115-119 12
110-114 20
105-109 27
100-104 41
95-99 32
90-94 30
85-89 11
80-84 2
• Solución Problema 1
Para calcular la media aritmética necesitamos los puntos medios de los intervalos y los
productos de dichos puntos medios por las frecuencias. Dichos cálculos se expresan en la tabla
que mostramos seguidamente.
Intervalos f Xi fiXi
91 - 100 2 95.5 191
81 - 90 0 85.5 0
71 - 80 3 75.5 226.5
61 - 70 6 65.5 393
51 - 60 7 55.5 388.5
41 - 50 9 45.5 409.5
31 - 40 4 35.5 142
21 - 30 5 25.5 127.5
11 - 20 1 15.5 15.5
1 - 10 1 5.5 5.5
n = 38 1899
[D]
La mediana es la puntuación que deja por encima y por debajo de sí el 50% de los casos. Como
tenemos 38 sujetos, la mediana será la puntuación que deje por encima y por debajo de = 19
sujetos. Su fórmula de cálculo, para datos agrupados en intervalos, es la siguiente:
Como n/2=38/2=19 es una frecuencia acumulada que se alcanza dentro del intervalo 41-50
(intervalo crítico), sustituyendo en la fórmula anterior los valores del límite inferior de ese
intervalo (Linfer), la amplitud de los intervalos (I), la frecuencia en el intervalo crítico (f i) y la
frecuencia acumulada en el intervalo anterior al crítico (f a) tendremos
b) Las puntuaciones que dejan por debajo de sí el 25 y el 75% de los casos se conocen con el
nombre de cuartil 1 (Q 1) y cuartil 3 (Q3), respectivamente. Dichas puntuaciones se
corresponden, igualmente, con los percentiles 25 y 75. Su cálculo viene dado por la fórmula
• Solución Problema 2
b) Se trata del problema inverso al apartado anterior, que podemos resolver aplicando la misma
fórmula. El valor que buscamos no es, como ocurría anteriormente, P m sino el valor m.
• Solución Problema 3
Investigación Educativa 33
En primer lugar organizamos las puntuaciones dadas en una distribución de frecuencias, lo cual
aunque no es necesario resulta conveniente, ya que facilita los cálculos. En la tabla que se
presenta a continuación incluimos, además de la distribución de frecuencias, los cálculos
previos necesarios para resolver las cuestiones planteadas.
El cálculo de la media aritmética resulta sencillo teniendo en cuenta los cálculos previos:
La moda es la puntuación o puntuaciones que más se repiten (las que tienen mayor frecuencia).
En este caso, la distribución es multimodal, contando con cuatro modas que son 25, 27, 29 y 35.
• Solución Problema 4
En la tabla siguiente se incluyen los cálculos previos para hallar las medidas de variabilidad
solicitadas. En la primera columna se presentan los intervalos, en la segunda las frecuencias, en
la tercera los puntos medios de cada uno de los intervalos, en la cuarta el producto de los
puntos medios de cada uno de los intervalos por su frecuencia, en la quinta las diferencias en
valor absoluto de cada punto medio de los intervalos con respecto a la media aritmética (x, por
tanto, representa puntuaciones diferenciales), en la sexta la columna anterior multiplicada por
la frecuencia de cada intervalo, en la séptima los valores de los puntos medios de cada uno de
los intervalos elevados al cuadrado y, en la octava y última el valor de la columna anterior
multiplicado por la frecuencia de cada intervalo.
• Solución Problema 5
c) Amplitud semi-intercuartil.
Investigación Educativa 36
Para calcular cada uno de los cuartiles debemos previamente determinar el intervalo en el que
se encuentran.
Una puntuación directa es la que se asigna a cada individuo como resultado de una medición;
por ejemplo la nota de un examen, el número de agresiones mensuales de cada alumno(a) a
sus compañeros.
Las puntuaciones transformadas son las que se derivan de las puntuaciones directas por
combinación lineal. Por ejemplo, medimos la velocidad y la comprensión lectora a través de dos
pruebas de las cuáles obtenemos dos puntuaciones directas; a través de estas dos
puntuaciones nos interesa conocer la eficiencia lectora. En este caso, la eficiencia lectora es una
puntuación transformada, o una variable de transformación.
Los softwares estadísticos contienen utilidades que permiten crear variables de transformación
a partir de las puntuaciones directas. Por tanto, si en un análisis tienen que utilizarse variables
de transformación, no se tienen que introducir las puntuaciones transformadas en el
computador, sino obtenerlas a partir de las puntuaciones directas, utilizando los recursos del
paquete estadístico.
a) Puntuaciones Diferenciales
xi = X i - X
Ejemplo
Un grupo de 8 estudiantes que rinden examen de análisis de datos han obtenido las siguientes
puntuaciones: 7, 3, 2.5, 9, 2, 8.5, 5 y 3. Calcular las puntuaciones diferenciales para cada uno de
los(as) alumnos(as).
Solución: Se debe calcular la media de las puntuaciones, a partir de ese valor, podremos
determinar las puntuaciones diferenciales restando la media a la puntuación directa.
Xi xi
7
7-5= 2
3
Cálculo de la media 3-5= -2
2,5
2,5 -5= -2,5
9
9-5= 4
2
2-5= -3
8,5
8,5-5= 3,5 5-5= 0
5
3-5= -2
3
b) Puntuaciones típicas
Son puntuaciones transformadas de gran utilidad en estadística. Son conocidas también por
"puntuaciones z", siendo la siguiente expresión que se utiliza para su cálculo.
La media de las puntuaciones típicas vale 0 y la desviación típica es igual a 1. Por tanto, cuando
hablamos de tipificar los valores de una variable, significa que debemos transformarlos en
puntuaciones z.
Ejemplo:
Considerando las puntuaciones del ejemplo anterior, las vamos a transformar en puntuaciones
típicas.
Investigación Educativa 39
Solución:
1º) determinar el valor de la desviación típica del grupo
�( x - x )
2
�( x - x ) = �x
2
= 55,5 i 55,5
i i s= = = 2, 63
n 8
2º) Luego, se divide cada una de las puntuaciones diferenciales por la desviación típica
Xi xi xi2 zi
7 2 4 0,76
3 -2 4 -0,76
2,5 -2,5 6,25 -0,95
2 -3 9 -1,14
9 4 1,6 1,53
8,5 3,5 12,25 1,33
5 0 0 0
3 -2 4 -0,76
Las puntuaciones típicas permiten establecer comparaciones entre distintas variables. Sin
embargo el inconveniente de las puntuaciones típicas es que suelen ser negativas y pueden
presentar cifras decimales. Contamos solamente con siete puntuaciones enteras posibles (-3,
-2, -1, 0, 1, 2, 3), ya que la mayoría de las observaciones suelen quedar incluidas entre tres
desviaciones típicas a la derecha de la media y tres a la izquierda.
Tanto los signos negativos como las cifras decimales y los redondeos pueden ocasionar errores
de cálculo. Para evitar esto, podríamos multiplicar las puntuaciones z por una constante S
determinada y para evitar los valores negativos, sumar una constante J.
D = J + Sz
De esta forma, y teniendo en cuenta las puntuaciones de las propiedades típicas, obtendremos
una distribución de media J y de desviación típica S. A las puntuaciones obtenidas siguiendo
este proceso se les denomina puntuaciones típicas derivadas.
Investigación Educativa 40
Entre las más usadas se encuentran el caso concreto de las puntuaciones T, que tienen como
media 50 y como desviación típica 10.
T = 50 + 10z
CI = 100 + 15z
Otra de las puntuaciones típicas que se suele utilizar en educación son los eneatipos o
estaninos, que son puntuaciones de media 5 y de desviación típica 2.
E = 5 + 2z
Ejemplo: Supongamos que un sujeto obtiene en una prueba de inteligencia una puntuación
directa de 70 puntos. Sabiendo que la media del grupo de referencia es 63,04 y su desviación
típica 10,8, podremos transformar la puntuación directa en una puntuación típica z= 0,64.
T = 50 + 10 (0,64) = 56,4
C.I. = 10 + 15 (0,64) = 109,6
E = 5 + 2 (0,64) = 6,28
2. La curva normal
μ = media
σ = desviación típica
Se utilizan μ y σ, en lugar de X y s, porque hablamos de un modelo teórico.
N = número de casos, lo que significa que el área total bajo la curva es N.
2
1 �X - m �
1 - � �
f ( x) = e 2� s �
2ps
Se dice que una variable aleatoria continua tiene distribución normal tipificada X ~ N (0,1), si su
función de densidad tiene la siguiente forma:
Investigación Educativa 42
1 - 12 x2
f ( x) = e
2p
La curva normal tipificada o reducida es, por tanto, la que opera con puntuaciones z, es un caso
especial de distribución normal que tiene de media cero y de desviación típica uno. Tiene
múltiples aplicaciones y su uso es frecuente en investigación educativa.
Al observar una variable tipificada que se distribuye normalmente, puede observarse que la
mayor parte de las puntuaciones se encuentran comprendidas entre los valores que van de -3 a
+3 (figura 2)
Para muchos propósitos es necesario conocer la proporción del área bajo la curva normal entre
las ordenadas de diferentes puntos sobre la línea de base. Podemos desear conocer:
• La proporción del área bajo la curva entre la ordenada de la media y cualquier punto
específico que se encuentre por encima o por debajo de la media.
• La proporción del área total por encima o por debajo de la ordenada de cualquier punto
sobre la línea base.
• La proporción del área que se encuentra entre las ordenadas de dos puntos cualesquiera
sobre la línea base.
Investigación Educativa 43
Mediante la tabla de la Ley Normal pueden calcularse las áreas entre dos puntos. Por tanto,
pueden resolverse cualquiera de las tres situaciones anteriores. A continuación se desarrollan
algunos ejemplos teniendo en cuenta las siguientes consideraciones:
Ejemplo
Caso 1: ¿Qué porcentaje de sujetos han obtenido una puntuación superior a 36?
3º) Mirando en la tabla de la Ley Normal encontramos que este valor de z (buscar a la derecha
de z), corresponde a un área de 0,34458.
4º) Pero obsérvese que el área que hay que calcular es la contraria, la parte rayada. Por tanto
tendremos que quitar a 1 (valor del área total) el valor del área calculada (que es la proporción
que obtiene puntuaciones mayores).
1-0,34458 = 0,65542
Caso 3: ¿Qué probabilidad existe de que al elegir un individuo al azar esté comprendido entre
25 y 35?
Caso 4: ¿Qué porcentaje de alumnos/as queda comprendido entre las puntuaciones 19 y 26?
2º) Mirando en la tabla de la Ley Normal los respectivos valores de z encontramos que el valor
de la probabilidad de z 1 (buscar la derecha) es de 0,3446 y el valor dez 2 (buscar a la derecha de
z), corresponde a un área de 0,0359.
3º) se le resta al valor del área de z1 el valor del área de z2.
0,3446-0,0359 = 0,3087
Bibliografía