DISTRIBUCIONES UNIDIMENSIONALES.
LA ESTADÍSTICA
INTRODUCCIÓN.
Por todo lo expuesto en el punto anterior, saber Estadística es una necesidad para
todo ciudadano, pero especialmente para un estudiante de Bachillerato, ya que tienen
valores formativos, desarrollando el pensamiento inductivo y contribuyendo a la
construcción del conocimiento empírico.
EL ORIGEN DE LA ESTADÍSTICA.
El origen de la Estadística está estrechamente relacionado con los censos
realizados a lo largo de la historia. Desde las culturas más antiguas existe una enorme
preocupación por conocer el capital humano y la distribución de los recursos.
En China, desde la dinastía Han (principios de nuestra era) hasta los tiempos
modernos se han llevado a cabo numerosos recuentos de la población.
El Imperio Romano erigió la figura del “censor”, que con el paso del tiempo fue
desempeñando una labor fundamental en el control del Imperio. La misión de los
censores romanos consistía en controlar el número de habitantes y su distribución por
los distintos territorios. El primer censo romano fue mandado realizar por el rey Servio
Tulio (578-535 a.C.).
Distribuciones unidimensionales. 1
ESTADÍSTICA
A principios del siglo XIX la Estadística entró en una nueva fase de desarrollo.
Pierre Simón de Laplace (1.749-1.827) fue el pionero en hacer del cálculo de
probabilidades la herramienta fundamental del análisis estadístico. En su obra “Théorie
analytique del probabilités” (1.812) puso en evidencia las ventajas que se pueden sacar
en el estudio de fenómenos naturales, cuyas causas son demasiadas complejas para que
se puedan conocer todas y analizarlas individualmente.
Distribuciones unidimensionales. 2
ESTADÍSTICA
Distribuciones unidimensionales. 3
ESTADÍSTICA
DISTRIBUCIONES UNIDIMENSIONALES.
INTRODUCCIÓN.
La mayoría de las personas entienden por estadísticas los conjuntos de datos
distribuidos en tablas y representados en gráficos, que se utilizan en la publicidad,
aparecen en la prensa, en la televisión, etc.
Distribuciones unidimensionales. 4
ESTADÍSTICA
POBLACIÓN Y MUESTRA.
Supongamos que la Consejería de Educación y Ciencia de la Junta de Andalucía
desea conocer en un corto período de tiempo cuáles son las preferencias, a la hora de
elegir carrera, de los alumnos matriculados de 2º de Bachillerato, en un determinado
año. Para ello deberá solicitar de todos los centros que impartan Bachillerato esta
información. Se comprende que este proceso puede resultar complicado y largo. Por
esta razón, la Consejería de Educación y Ciencia elige al azar una serie de centros de
Bachillerato de toda la Comunidad Autónoma, para que contesten a un formulario
diseñado al efecto.
En general:
CARACTERES Y MODALIDADES.
Se llama carácter estadístico a una propiedad que permite clasificar a los
individuos de la población.
Distribuciones unidimensionales. 5
ESTADÍSTICA
Por ejemplo:
La talla de un individuo, el diámetro de una pieza de precisión, el número
de acciones vendidas en la Bolsa de Madrid, el cociente intelectual de un
alumno, la renta “per-cápita” en cada una de las comunidades autónomas, las
calificaciones de los alumnos de un grupo en un determinado examen, .....
Por ejemplo:
La profesión de una persona, el estado civil, el color de los ojos, la
carrera que piensa estudiar un alumno/a de 2º de Bachillerato, el idioma elegido
por los alumnos/as de un instituto como primera lengua extranjera, ....
Se llama constante a un carácter que sólo tiene una modalidad única. Por
ejemplo, para los alumnos y alumnas que inician la Educación Secundaria Obligatoria
consideramos el siguiente carácter: “número de cursos que han de superar para obtener
el título de Graduado en Educación Secundaria”. Puesto que para todos los alumnos el
número de cursos es similar e igual a 4, podemos afirmar que esta característica resulta
ser una CONSTANTE, es decir, sólo presenta un único valor posible.
VARIABLE ESTADÍSTICA.
Supongamos, por ejemplo, el carácter estadístico cuantitativo “talla de los
alumnos y alumnas de 2º de Bachillerato” de este instituto. Es evidente que este carácter
toma distintos valores: 1’62 m., 1’75 m., 1’69 m., 1’78 m., .... El conjunto de estos
valores se llama VARIABLE ESTADÍSTICA talla.
Por ejemplo:
Número de empleados de una fábrica, número de hijos de 20 familias,
número de goles marcados en 1ª división en cada una de las jornadas de una
temporada, número de ejemplares vendidos al día de cinco diarios determinados,
....
Distribuciones unidimensionales. 6
ESTADÍSTICA
Por ejemplo:
La talla de un individuo, el diámetro de una pieza de precisión, tiempo en
el que 20 atletas recorren los 1.000 metros, .....
FRECUENCIAS.
El concepto de frecuencia hace alusión al número de veces que se presenta un
fenómeno. En estadística, la frecuencia va referida al número de veces en que aparece
un determinado valor para un carácter. Podemos diferenciar varios tipos de frecuencias.
coincide con N.
Distribuciones unidimensionales. 7
ESTADÍSTICA
TRATAMIENTO DE LA INFORMACIÓN.
A continuación vamos a estudiar cómo debemos proceder ordenadamente para
analizar una muestra:
REPRESENTACIONES GRÁFICAS.
Incluso cuando las tablas estadísticas contienen toda la información, a veces es
conveniente expresarla mediante un gráfico, con el fin de hacerla más clara y evidente.
DIAGRAMA DE BARRAS.
Distribuciones unidimensionales. 8
ESTADÍSTICA
POLÍGONO DE FRECUENCIAS.
HISTOGRAMA.
DIAGRAMA DE SECTORES.
PICTOGRAMA.
CARTOGRAMA.
Los cartogramas son las gráficas que se realizan sobre un mapa, señalando sobre
determinadas zonas con distintos colores o rayados lo que se trate de poner de
manifiesto. Por ejemplo, se suelen utilizar estos tipos de diagramas para representar la
densidad demográfica de una nación, la renta per-cápita, las horas de Sol anuales sobre
una determinada parte de la Tierra, los índices de lluvia de una nación, etc.
Distribuciones unidimensionales. 9
ESTADÍSTICA
DIAGRAMA LINEAL.
Los diagramas lineales son muy utilizados para mostrar las fluctuaciones de un
determinado carácter estadístico con el paso del tiempo.
PIRÁMIDES DE POBLACIÓN.
Distribuciones unidimensionales. 10
ESTADÍSTICA
Distribuciones unidimensionales. 11
ESTADÍSTICA
1.
2.
3.
Distribuciones unidimensionales. 12
ESTADÍSTICA
4.
MEDIDAS DE CENTRALIZACIÓN.
MEDIA ARITMÉTICA.
DEFINICIÓN.
Sea X una variable discreta que toma los valores x1 , x2 , x3 ,...., xk , con frecuencias
absolutas n1 , n2 , n3 ,...., nk , respectivamente, donde n1 + n2 + n3 + .... + nk = N . La media
aritmética de la variable X viene dada por la expresión:
∑ x ·n i i
x= i =1
1. Si sumamos a todos los valores una constante “a”, la media aritmética queda
incrementada en esa constante. Si multiplicamos todos los valores por una
constante “b”, la media aritmética queda multiplicada por esa misma constante.
En definitiva, si se hace una transformación lineal en la variable, la media
aritmética queda transformada de igual manera.
Distribuciones unidimensionales. 13
ESTADÍSTICA
Demostración:
k k k
y = ∑ (a + b · xi )· f i = a · ∑ f i + b · ∑ xi · f i = a + b · x
i =1 i =1 i =1
n1 · x1 + n2 · x 2 + n3 · x3 + .... + n p · x p
x=
n1 + n2 + n3 + .... + n p
Demostración:
p
ni p
ni
n1 · x1 + n2 · x 2 + n3 · x3 + .... + n p · x p
∑ n i ∑ nj · x j
· ∑ ∑nj ·x j
=
i =1 j =1 = i =1 j =1 =x
n1 + n2 + n3 + .... + n p N N
OBSERVACIONES:
Distribuciones unidimensionales. 14
ESTADÍSTICA
MEDIA GEOMÉTRICA.
DEFINICIÓN.
Sea X una variable discreta que toma los valores x1 , x2 , x3 ,...., xk , con frecuencias
absolutas n1 , n2 , n3 ,...., nk , respectivamente, donde n1 + n2 + n3 + .... + nk = N . La media
geométrica de la variable X viene dada por la expresión:
k
G = N ∏ xi
ni
i =1
Si multiplicamos todos los valores por una constante “b”, la media geométrica
queda multiplicada por esa misma constante. Si elevamos todos los valores a una
constante positiva “c” la media geométrica queda elevada a esa constante. En
conclusión, si se hace una transformación potencial en la variable, la media
geométrica queda transformada de igual manera.
c c
Si llamamos: y i = b · xi , tenemos que: GY = b· G X
Demostración:
∑ ni k
k
c
( )
k k
GY = N ∏ y i = N ∏ b · xi · ∏ xi
ni c ni ni c
= N b i =1 = b · G X
i =1 i =1 i =1
OBSERVACIONES:
1. Esta medida de posición sólo es válida si todos los valores observados son
mayores que cero.
2. En la práctica se suelen tomar logaritmos para calcular la media geométrica,
ya que el logaritmo de G es la media aritmética de los logaritmos de los
valores de la variable.
Distribuciones unidimensionales. 15
ESTADÍSTICA
MEDIA ARMÓNICA.
DEFINICIÓN.
Sea X una variable discreta que toma los valores x1 , x2 , x3 ,...., xk , con frecuencias
absolutas n1 , n2 , n3 ,...., nk , respectivamente, donde n1 + n2 + n3 + .... + nk = N . La media
armónica de la variable X viene dada por la expresión:
N
H= k
1
∑
i =1 x i
· ni
Si multiplicamos todos los valores por una constante “b”, la media armónica
queda multiplicada por esa misma constante.
Demostración:
N N N ·b
HY = k
= k
= k
= b· H X
1 1 1
∑
i =1 yi
· ni ∑
i =1 b · x i
· ni ∑
i =1 x i
· ni
OBSERVACIONES:
1. Esta medida de posición sólo es válida si todos los valores observados son
distintos de cero.
2. Su cálculo se puede simplificar hallando la media aritmética de los valores
inversos de la variable y calcular el inverso de ésta.
Distribuciones unidimensionales. 16
ESTADÍSTICA
H ≤G≤ x
Las tres medias son valores que representan al conjunto del colectivo pero de
forma diferente. Cada una de ellas tiene propiedades distintas, ventajas e inconvenientes
respecto de las otras dos, y situaciones en las que son claramente preferibles. Las tres
tienen unas propiedades comunes importantes: utilizan todos los valores observados y
son únicas para cualquier distribución.
La media aritmética tiene las ventajas, cómo más adelante se probará, de ser el
centro de gravedad de los datos y de hacer mínima la media cuadrática de las
desviaciones. La contrapartida es el gran inconveniente de ser muy sensible a la
existencia de valores extremos en los datos observados.
MODA.
DEFINICIÓN.
La moda no tiene por qué ser única, puede haber varios valores de la variable
con la mayor frecuencia. En este caso se dirá que la distribución es bimodal, trimodal,
etc., según que sean 2, 3, etc., los valores de la variable que presentan mayor frecuencia.
CÁLCULO DE LA MODA.
Distribuciones unidimensionales. 17
ESTADÍSTICA
intervalos es fácil determinar la clase modal (clase con mayor frecuencia), pero el valor
dentro del intervalo que se presume tenga mayor frecuencia se obtiene a partir de la
siguiente expresión:
D1
M O = Li + ci ·
D1 + D2
donde:
Li , es el límite inferior de la clase modal.
ci , es la amplitud del intervalo modal.
D1 , es la diferencia entre la frecuencia absoluta de la clase modal
y la frecuencia absoluta de la clase anterior.
D2 , es la diferencia entre la frecuencia absoluta de la clase modal
y la frecuencia absoluta de la clase siguiente.
Seguidamente se unen con líneas los extremos de la clase modal con las
contiguas como en el diagrama adjunto. La moda M O viene dada por la abscisa del
punto de corte.
Mo
Distribuciones unidimensionales. 18
ESTADÍSTICA
OBSERVACIONES:
1. Puede que existan distribuciones que no tengan moda; eso ocurre cuando las
frecuencias de todos los datos son iguales.
2. La moda es menos representativa que la media aritmética, pero en algunos
ocasiones es más útil que ésta; por ejemplo, cuando se trata de datos
cualitativos.
3. En la moda no intervienen todos los datos de la distribución.
4. Aun cuando la moda se considera una medida o parámetro de centralización,
no siempre tiene por qué situarse en la zona central; es frecuente encontrar la
moda próxima a los valores extremos de la distribución.
5. La moda representa el valor dominante de la distribución; así, por ejemplo,
en unas elecciones la moda es el partido más votado.
6. En el caso de datos agrupados por intervalos, el valor de la moda depende de
la amplitud, el número y los límites para los intervalos.
MEDIANA.
DEFINICIÓN.
CÁLCULO DE LA MEDIANA.
En este caso se ordenan los datos de menor a mayor y la mediana será el término
o valor central.
Distribuciones unidimensionales. 19
ESTADÍSTICA
N
− N i −1
M = Li + ci · 2
ni
donde:
OBSERVACIONES:
Distribuciones unidimensionales. 20
ESTADÍSTICA
Gracias a esta relación se puede obtener, con cierto error, alguno de estos
parámetros en función de los otros, siempre y cuando se compruebe que la distribución
es simétrica o ligeramente asimétrica.
MEDIDAS DE POSICIÓN.
Al estudiar la mediana hemos visto que, una vez ordenados de menor a mayor
los datos de la distribución, la mediana divide a éstos en dos partes iguales.
Análogamente tiene interés estudiar otros parámetros que dividan a los datos de la
distribución en función de otras cuantías. Estos parámetros se conocen como cuantiles,
medidas de posición o parámetros de estructura, ya que nos proporcionan información
acerca de la estructura o distribución interna de los datos. Los más importantes son los
cuartiles, quintiles, deciles y percentiles.
CUARTILES.
Se llama cuartiles a tres valores que dividen a la serie de datos en cuatro partes
iguales. Se representan por Q1 , Q2 y Q3 , y se designan cuartil primero, segundo y
tercero, respectivamente.
QUINTILES.
Se llama quintiles a cuatro valores que dividen a la serie de datos en cinco
partes iguales. Se representan por K1 , K 2 , K 3 y K 4 , y se designan quintil primero,
segundo, tercero y cuarto, respectivamente.
DECILES.
Se llama deciles a nueve valores que dividen a la serie de datos en diez partes
iguales. Se representan por D1 , D2 , D3 ,..... y D9 , y se designan decil primero,
segundo, tercero ..... y noveno, respectivamente.
Distribuciones unidimensionales. 21
ESTADÍSTICA
PERCENTILES.
Se llama percentiles a 99 valores que dividen a la serie de datos en cien partes
iguales. Se representan por P1 , P2 , P3 ,..... y P99 , y se designan percentil primero,
segundo, tercero ..... y nonagésimo noveno, respectivamente.
m·N
− N i −1
Cálculo de los cuartiles: Qm = Li + ci · 4
ni
m·N
− N i −1
Cálculo de los quintiles: K m = Li + ci · 5
ni
m·N
− N i −1
Cálculo de los deciles: Dm = Li + ci · 10
ni
m· N
− N i −1
Cálculo de los percentiles: Pm = Li + ci · 100
ni
donde:
Distribuciones unidimensionales. 22
ESTADÍSTICA
Para obtener el cuantil de que se trate, se traza una paralela al eje X por el punto
correspondiente al cuantil deseado. Ésta corta al polígono de frecuencias en un punto.
Por este punto de corte se traza una paralela al eje Y, que corta al eje X en el punto
buscado. Evidentemente, este método es aplicable para el cálculo gráfico de la mediana.
MEDIDAS DE DISPERSIÓN.
RANGO O RECORRIDO.
DEFINICIÓN.
OBSERVACIONES:
RANGO INTERCUARTÍLICO.
DEFINICIÓN.
Distribuciones unidimensionales. 23
ESTADÍSTICA
OBSERVACIONES:
Dada una variable estadística X que toma los valores x1 , x2 , x3 ,...., xk , con media
aritmética, x , las desviaciones respecto a la media son:
x1 − x, x2 − x, x3 − x, ...., xk − x
Demostración:
∑( )
k k k
xi − x · ni ∑ xi · ni ∑n i
i =1
= i =1
− x· i =1
= x− x = 0.
N N N
Distribuciones unidimensionales. 24
ESTADÍSTICA
Demostración:
∑ ( x − x ) − ( k − x )
k k 2
∑ ( xi − k )
2
· ni i · ni
i =1
= i =1
=
N N
∑ ( x − x) ( ) ( )
k 2 k 2 k
i · ni + ∑ k − x · ni − 2· ∑ ( xi − k ) · xi − x · ni
= i =1 i =1 i =1
=
N
∑ ( x − x) ( ) ( )
k 2 2 k k
i · ni + k − x · ∑ ni − 2· ( xi − k )· ∑ xi − x · ni
= i =1 i =1 i =1
=*
N
∑n i
Utilizando la propiedad anterior y que i =1
= 1 , tenemos que:
N
∑ ( x − x)
k k 2
∑ ( xi − k )
2
· ni i · ni
( )
2
i =1
= i =1
+ k−x
N N
DESVIACIÓN MEDIA.
DEFINICIÓN.
Distribuciones unidimensionales. 25
ESTADÍSTICA
O lo que es lo mismo.....
Dada una variable discreta, X, que toma los valores x1 , x2 , x3 ,...., xk , con
frecuencias absolutas n1 , n2 , n3 ,...., nk , respectivamente, donde n1 + n2 + n3 + .... + nk = N .
La desviación media de la variable X viene dada por la expresión:
∑ x − x ·n i i
D.M . = i =1
VARIANZA.
DEFINICIÓN.
CÁLCULO DE LA VARIANZA.
Sea X una variable estadística que toma los valores x1 , x2 , x3 ,...., xk , con
frecuencias absolutas n1 , n2 , n3 ,...., nk , respectivamente, donde n1 + n2 + n3 + .... + nk = N .
La varianza viene dada entonces por la siguiente expresión:
∑ ( x − x)
k 2
i · ni
s =
2 i =1
Para simplificar los cálculos que implica la fórmula anterior, proponemos otra
expresión equivalente a ella en la que éstos se simplifican:
∑x i
2
· ni
2
s =
2 i =1
−x
N
Distribuciones unidimensionales. 26
ESTADÍSTICA
DESVIACIÓN TÍPICA.
DEFINICIÓN.
OBSERVACIONES:
Demostración:
∑ ( x − x)
k k 2
∑(x − k )
2
i · ni i · ni
( )
2
i =1
= i =1
+ k − x , para cualquier valor de k, de donde:
N N
∑ ( x − x)
k k 2
∑(x − k)
2
i · ni i · ni
i =1
≥ i =1
= s2
N N
Si llamamos: yi = a + b · xi ⇒ s y 2 = b 2 · sx 2 , s y = b · sx .
Distribuciones unidimensionales. 27
ESTADÍSTICA
Demostración:
( ) ( ( )) · f = ∑ (b · x − b · x ) · f
k 2 k 2 k 2
s y 2 = ∑ yi − y · f i =∑ ( a + b · xi ) − a + b · x i i i =
i =1 i =1 i =1
( ) ( )
k 2 k 2
= ∑ b 2 · xi − x · fi =b 2 · ∑ xi − x · f i =b 2 · sx 2
i =1 i =1
( )
3. En el intervalo x − 3s , x + 3s se encuentra el 99% de los datos.
DESIGUALDAD DE TCHEBICHEFF.
Distribuciones unidimensionales. 28
ESTADÍSTICA
x − s ·t x x + s ·t
(
Un intervalo tal como x − s · t , x + s · t contiene todos los números reales “x” )
tales que: x − s · t < x < x + s · t .
∑ ( x − x)
k 2
i · ni
Sabemos que: s = 2 i =1
.
N
k1 k2
∑( ) ∑( ) ∑ ( x − x)
k 2 2 2
xi − x · ni xi − x · ni i · ni
s =
2 i =1
= i =1
+ i =1
N N N
xi dentro del int. xi fuera del int.
( )
2
Para los valores xi que están dentro del intervalo se verifica: xi − x < s2 ·t 2 , y
( )
2
para los xi que están fuera del intervalo se cumple: xi − x ≥ s 2 · t 2 . Y como, además,
ambas sumas son positivas, tenemos:
k2 k2 k2
∑ ( x − x)
2
i · ni ∑s 2 2
· t · ni ∑n i
s ≥
2 i =1
= = s ·t ·i =1 2 2 i =1
N N N
xi fuera del int./ xi fuera del int./ xi fuera del int.
k2
∑n i =1
i
Como el cociente es la frecuencia relativa de los datos xi que se hallan
N
k2
∑n i
s2
(
fuera del intervalo x − s · t , x + s · t , resulta finalmente: ) i =1
N
≤ 2
s ·t 2
t
1
= 2.
Distribuciones unidimensionales. 29
ESTADÍSTICA
DESIGUALDAD DE TCHEBICHEFF:
La frecuencia relativa de los valores xi que están fuera del intervalo de centro x
1
y de radio r = s · t , es menor o igual que 2 .
t
k2
∑n i
1
i =1
≤ para los xi que están fuera del intervalo de centro x y radio s · t ,
N t2
DEFINICIÓN.
CÁLCULO DE MOMENTOS.
Sea una variable discreta, X, que toma los valores x1 , x2 , x3 ,...., xk , con
frecuencias absolutas n1 , n2 , n3 ,...., nk , respectivamente, donde n1 + n2 + n3 + .... + nk = N .
El momento de orden “h” respecto a un punto P se calcula mediante la siguiente
expresión:
k
∑( x − P)
h
i · ni
Oh = i =1
OBSERVACIONES:
Distribuciones unidimensionales. 30
ESTADÍSTICA
∑x i
h
· ni
Si P es el origen, se utiliza la notación: ah = i =1
∑ ( x − x)
k h
i · ni
Si P es la media aritmética, se utiliza la notación: mh = i =1
X −x
En definitiva la variable tipificada Z se obtiene: Z=
sX
COEFICIENTE DE APERTURA.
DEFINICIÓN.
xmax
Para determinar el coeficiente de apertura basta aplicar: A= .
xmin
Distribuciones unidimensionales. 31
ESTADÍSTICA
OBSERVACIONES:
COEFICIENTE DE VARIACIÓN.
DEFINICIÓN.
s
Para determinar el coeficiente de variación basta aplicar: C.V . = .
x
OBSERVACIONES:
DEFINICIÓN.
Distribuciones unidimensionales. 32
ESTADÍSTICA
OBSERVACIONES:
ASIMETRÍA Y CURTOSIS.
La medidas de posición central y las medidas sobre su representatividad no
agotan las medidas posibles para describir un colectivo. Cuando se trata de resumir toda
la información, hay otras medidas que se refieren esencialmente a la forma en que las
frecuencias se reparten entre los valores: nos referimos a la asimetría y la curtosis.
COEFICIENTE DE ASIMETRÍA.
La desviación típica de una variable tipificada se convierte en una especie de
medida del error de cada individuo, cuya suma ponderada por las frecuencias para el
conjunto de los valores siempre es cero (recordemos las propiedades de las desviaciones
respecto a la media aritmética), y cuya suma de cuadrados, también ponderada, es
siempre uno. Cuando hay asimetría positiva hay un gran número de desviaciones
pequeñas negativas y un número menor de desviaciones grandes positivas. Ya que su
suma es siempre cero, es preciso usar alguna forma de promediarlas sin que se anulen ni
se pierda el signo. La forma más lógica es elevar las desviaciones tipificadas a la tercera
potencia ponderando por la frecuencia que tiene cada individuo en el colectivo.
DEFINICIÓN.
Sea X una variable estadística que toma los valores x1 , x2 , x3 ,...., xk , con
frecuencias absolutas n1 , n2 , n3 ,...., nk , respectivamente, donde n1 + n2 + n3 + .... + nk = N .
Distribuciones unidimensionales. 33
ESTADÍSTICA
3
k xi − x
∑
i =1 s
· ni
C. As. =
N
OBSERVACIONES:
COEFICIENTE DE CURTOSIS.
Esta medida descriptiva es mucho menos intuitiva que las anteriores y tiene que
ver con la forma en que los valores se reparten a lo largo del recorrido de la variable.
Las situaciones que se contemplan comparan variables con la misma variabilidad y poca
o ninguna asimetría: si una variable comparada con la otra tiene más valores en los
extremos y en la zona central y menos en la intermedia, entonces se dice que tiene un
menor apuntamiento que la otra, que tiene una menor curtosis. Para medir esta
característica habrá que utilizar de nuevo las desviaciones respecto a la media aritmética
y eliminar el signo elevándolas a una potencia par. Como la potencia dos ya se ha
Distribuciones unidimensionales. 34
ESTADÍSTICA
Ya hemos comentado que esta medida tiene sentido si se comparan variables con
la misma dispersión. Por eso se suele utilizar una variable modelo, la distribución
Normal (que estudiaremos en temas posteriores) que tiene en la expresión anterior un
valor igual a 3.
DEFINICIÓN.
Sea X una variable estadística que toma los valores x1 , x2 , x3 ,...., xk , con
frecuencias absolutas n1 , n2 , n3 ,...., nk , respectivamente, donde n1 + n2 + n3 + .... + nk = N .
4
k xi − x
∑
i =1 s
· ni
C.Cur. = −3
N
OBSERVACIONES:
Distribuciones unidimensionales. 35
ESTADÍSTICA
DIAGRAMA DE CAJA.
Se trata de un procedimiento descriptivo que combina varias de las medidas que
se han visto en los apartados precedentes, y que proporciona una información
complementaria al diagrama de barras o al histograma correspondiente, además de
detectar los posibles datos atípicos de un colectivo, por lo que habitualmente se presenta
junto a ellos. También se le denomina BOX-PLOT o BOX-WHISKER.
Las dos rectas que salen del rectángulo delimitan un intervalo cuyos
extremos son: LI = Q1 − 1,5· ( Q3 − Q1 ) y LS = Q3 + 1,5· ( Q3 − Q1 ) .
Los datos que caen fuera del intervalo mencionado se consideran atípicos y
se marcan mediante puntos o círculos.
Distribuciones unidimensionales. 36