Medidas
El siguiente paso que debe dar el analista de la informacin es resumir la informacin que tiene disponible una vez que la ha organizado y representado
mediante la tabulacin y los grcos. Para resumir la informacin dispone de
las siguientes medidas que son distintas funciones de la variable:
Medidas de tendencia central.
Medidas de dispersin
Medidas de posicin.
1.1
Estas medidas pretenden caracterizar la distribucin de la variable/s que estamos analizando por los valores del centro. Es decir, son valores representativos
de todos los valores que toma la variable.
Media aritmtica:
Representa el centro de gravedad de una distribucin y se dene como la
suma ponderada de los valores de la variable por sus frecuenci as relativas y lo
denotaremos por X y se calcula mediante la expresin:
X=
n
X
ci fi =
i=1
n
X
ci ni
N
i=1
ni
ci ni
61
64
67
71
73
5
18
42
27
8
100
305
1152
2814
1890
584
7645
X=
n
P
i=1
ci ni
N
7645
100
150)
160)
180)
200)
N o P ersonas
ni
M:Clase
ci
20
100
80
10
n = 210
145
155
170
190
ni ci
2900
15500
13600
1900
33900
n
X
ci ni
33900
=
= 161:42
M edia : X =
N
210
i=1
Mediana:
La mediana es el valor central de la variable, es decir, supuesta la muestra
ordenada en orden creciente o decreciente, el valor que divide en dos partes la
muestra. Para calcular la mediana debemos tener en cuenta si la variable es
discreta o continua.
Variables Discretas
- Datos en serie:
1. N impar de observaciones: Ejemplo:
2; 2; 2; 3; (5) ; 6; 7; 7; 8
Me = 5
4; 6; 6; 6; j7 ; 8; 8; 9
Me = 6 7
Indeterminado entre 6 y 7
- Datos en tabla:
Para determinar el intervalo en el que se encuentra la mediana se acumulan
las frecuencias y el primer intervalo cuya frecuencia
acumulada (Ni ) sea mayor o igual a N2 es el intervalo que contiene la
mediana. Si llamamos Li y Li+1 a los lmites del intervalo que contiene la
mediana, ni a la frecuencia ordinaria de dicho intervalo, Ni a la frecuencia
acumulada, Ni 1 la frecuencia acumulada hasta el intervalo anterior y Ai la
amplitud del inter valo entonces la frmula es la siguiente:
M e = Li +
N
2
Ni
ni
Ai
Ejemplo:
clase
f recuencia
absoluta
f recuencia
absoluta
acumulada
[49; 5 59; 5)
[59; 5 69; 5)
[69; 5 79; 5)
[79; 5 89; 5)
[89; 5 99; 5)
[99; 5 109; 5)
3
7
18
12
8
2
3
10
28
40
48
50
N
2
M e = Li +
Ni
ni
Ai = 69; 5 +
25
10
18
10 = 77; 83
Moda
La moda es el valor de la variable que tenga mayor frecuencia absoluta, la
que ms se repite, es la nica medida de centralizacin que tiene sentido estudiar
en una variable cualitativa, pues no precisa la realizacin de ningn clculo.
Por su propia denicin, la moda no es nica, pues puede haber dos o ms
valores de la variable que tengan la misma frecuencia siendo esta mxima. En
cuyo caso tendremos una distribucin bimodal o polimodal segn el caso.
Variables discretas
- Datos en serie
2; 2; 3; 3; 3; 3; 5; 6; 7
Mo = 3
- Datos en tabla
Xi
ni
1
2
3
4
5
34
36
45
22
17
por lo tanto M o = 3
Variables continuas
M o = Li +
(ni
(ni ni 1 )
ni 1 ) + (ni ni+1 )
Ai
M o = Li +
(ni
(ni+1 )
1 ) + (ni+1 )
Ai
ni
60
63
66
69
72
63
66
69
72
75
5
18
42
27
8
100
M o = 66 +
(42
(42 18)
18) + (42
M o = 66 +
1.2
27
18 + 27
27)
3 = 67; 846
3 = 67; 8
Medidas de dispersin
Rango o recorrido
El rango o recorrido intercuartlico es la diferencia entre el valor mximo y
el valor mnimo en un grupo de nmeros aleatorios. Se le suele simbolizar con
R
Rango = f(M ax
Varianza
M in)g
X1
+ X2
X
N
+ ::: + Xn
Pn
i=1
Xi
N
n
X
c2 ni
i
i=1
9; 3; 8; 8; 9; 8; 9; 18
X=
9+3+8+8+9+8+9+18
8
(X1
=9
X ) +(X2 X ) +:::+(Xn X )
N
15
(9 9)2 +(3 9)2 +(8 9)2 +(8 9)2 +(9 9)2 +(8 9)2 +(9 9)2 +(18 9)2
8
[10; 20)
[20; 30)
[30; 40)
[40; 50)
[50; 60)
[60; 70)
[70; 80)
X=
1820
42
ci
ni
ci :ni
c2i :ni
15
25
35
45
55
65
75
1
8
10
9
8
4
2
42
15
200
350
405
440
260
150
1820
225
5000
12250
18225
24200
16900
11250
88050
= 43; 33
Pn
i=1
c2i ni
N
X =
88050
42
Propiedades de la varianza
Desviacin tpica
X1
+ X2
X
N
+ ::: + Xn
Pn
i=1
Xi
N
Ejemplos:
- Calcular la desviacin tpica de la distribucin:
9; 3; 8; 8; 9; 8; 9; 18
X=
=
3; 87
9+3+8+8+9+8+9+18
8
(X1
=9
X ) +(X2 X ) +:::+(Xn X )
N
(9 9)2 +(3 9)2 +(8 9)2 +(8 9)2 +(9 9)2 +(8 9)2 +(9 9)2 +(18 9)2
8
1820
42
= 43; 33
q
Pn
c2i ni
i=1 N
X =
88050
42
43; 332 =
Coeciente de variacin
Cv =
8
Cv =
:100
El coeciente de variacin permite comparar las dispersiones de dos distribuciones distintas, siempre que sus medias sean positivas.
Se calcula para cada una de las distribuciones y los valores que se obtienen
se comparan entre s. La mayor dispersin corresponder al valor del coeciente
de variacin mayor.
= 28:28 y otra X = 150 y
Una distribucin tiene X = 140 y
Cul de las dos presenta mayor dispersin?
Cv =
Cv =
:100 =
= 24.
28; 28
:100 = 20; 2%
140
:100 =
24
:100 = 16%
150
Ct = Li
1+
N:K
4
Ni
Ai
ni
(b)
1
3; 5; 2; 7; 6; 4; 9:
3
#
Q1
5
#
Me
7
#
Q3
3; 5; 2; 7; 6; 4; 9; 1
2 3
2; 5
#
Q1
3
5 6 7
4; 5
6; 5
#
#
Me
Q3
ni
Ni
[10; 15)
[15; 20)
[20; 25)
[25; 30)
[30; 35)
12; 5
17; 5
22; 5
27; 5
32; 5
3
5
7
4
2
21
3
8
15
19
21
25
100
= 5; 25
75
100
= 15; 75
21
21
25; 9375
C1 = Li
1+
C3 = Li
N:K
4
1+
10
Ni
ni
N:K
4
Ni
ni
Ai = 15+ 5;255
5 = 17; 25
Ai = 25+ 515;75
4
15
5=
Deciles
Medidas de localizacin que divide a la poblacin en diez partes iguales dk =
Decil k-simo es aquel valor de la variable que deja a su izquierda el k 10% de
la distribucin.
Dt = Li
N:K
10
Ni
Ai
ni
Ejemplos:
1. Dadas las series estadstica:
Calcular: Los deciles 2o y 7o .
3; 5; 2; 7; 6; 4; 9:
Nmero de elementos: 8
Clculo del segundo decil:
2
10
= 1; 6
D2 = 2
D2 = 6
[50; 60)
[60; 70)
[70; 80)
[80; 90)
[90; 100)
[100; 110)
[110; 120)
ni
Ni
8
10
16
14
10
5
2
65
8
18
34
48
58
63
65
1
10
= 6; 5
D1 = 50 +
6;5 0
8
10 = 58; 12
2
10
= 13
D2 = 60 +
11
13 8
10
10 = 65
65
= 58; 5
D9 = 100 +
58;5 58
5
10 = 101
Percentiles
Medidas de localizacin que divide a la poblacin en cien partes iguales. El
primer percentil supera al uno por ciento de los valores y es superado por el
noventa y nueve por ciento restante.
P k = Percentil k-simo es aquel valor que deja a su izquierda el K 1% de
la distribucin
Pt = Li
1+
N:K
100
Ni
ni
Ai
Quintiles
Los QUINTILES dividen a la poblacin en cinco partes iguales, cada una
de ellas contiene al 20% de los datos de la poblacin. Existen 4 quintiles que se
denotan por Q1 ; Q2 ; Q3 ; Q4 :
Qt = Li
N:K
5
Ni
ni
12
Ai