INDICE .
1. Estadstica Descriptiva
1.1 Introduccin
1.2 Organizacin de los datos de un conjunto
1.3 Distribuciones de frecuencias
1.3.1 Definicin de distribucin de frecuencia. Terminologa
1.3.2 Reglas generales para formar distribuciones de frecuencia
1.3.3 Ejercicios
1.4 Representacin grafica de los datos de un conjunto
1.4.1 Variables Cualitativas
1.4.2 Variables Cuantitativas Discretas
1.4.3 Variables Cuantitativas Continuas
1.4.4 Ejercicios
1.5 Medidas de tendencia central
1.5.1 La media aritmtica (Media Ponderada)
1.5.2 La moda
1.5.3 La mediana
1.5.4 Ejercicios
1.6 Medidas de dispersin
1.6.1 Amplitud (recorrido o rango)
1.6.2 Desviacin tpica (o estndar).Varianza
1.6.3 Ejercicios
1.7 Medidas de Posicin
1.7.1 Cuantiles(cuartiles, deciles y percentiles)
1.7.2 Ejercicios
2
1. ESTADSTICA DESCRIPTIVA
1.1 INTRODUCCION
Definicin:
Las distribuciones de frecuencias son disposiciones tabulares de los datos,
por clases con sus respectivas frecuencias absolutas.
Terminologa:
CLASES. (Para una caracterstica continua): Son intervalos abiertos o
cerrados. Deben ser exhaustivos y excluyentes; es decir, tales que se
elimine la posibilidad
- Los nmeros que definen una clase: 28-32, 33-37, etc. se llaman
Lmites de Clase.
- Los valores a la izquierda: 28, 37, etc. se llaman Limites Inferiores
aparentes, los valores a la derecha: 32, 37, etc. son los Limites
Superiores aparentes de la clase.
- La diferencia entre el lmite superior (ls) y el lmite inferior (li), ms 1,
es un Intervalo de Clase (o Amplitud de Clase); y se denota por ic .
En smbolos:
ic = l s l i + 1
- Marca de clase o punto medio: Es la mitad de la suma de los
lmites
de la clase.
Los datos que corresponden a una variable continua, generalmente no son
medidas exactas. As decimos por ejemplo que 58 es un valor que est entre
57.5 y 58.5; el primero es el lmite real inferior y el segundo es el lmite
real superior. Para estas distribuciones ic = lrs lri.
A continuacin se presenta la distribucin de frecuencias del ejemplo
anterior, con lmites reales.
Ejemplo 2.
Clase Puntajes Frecuencias Absolutas
1ra. 27.5 a menos de 32.5 10
2da. 32.5 a menos de 37.5 15
3ra. 37.5 a menos de 42.5 20
4ta. 42.5 a menos de 47.5 35
5ta. 47.5 a menos de 52.5 19
6ta. 52.5 a menos de 57.5 12
7ma. 57.5 a menos de 62.5 9
Total 120
4
clase i Fi
clase k Fk
Total n
k
La frecuencia relativa es fi/n, donde 0 fi/n 1 y fi / n = 1.
i 1
Cuando fi/n se multiplica por 100, se llama frecuencia porcentual. La
frecuencia acumulada menor que fi se denota por Fi y es la suma de las
frecuencias absolutas que van desde la clase 1 hasta la clase i. En smbolos:
Fi = f1 +f2 + f3 ++ fi
Ejemplo 3.
Distribucin de frecuencias porcentuales y acumuladas, basada en los datos
que aparecen en la ejemplo 1.
1.3.3 EJERCICIOS
6.7 6.3 8.7 7.9 8.8 9.2 8.6 8.3 7.8 4.1
6.6 6.8 7.7 4.6 7.6 8.1 9.2 8.4 8.6 7.0
6.0 7.7 8.1 9.8 7.5 8.1 8.2 8.7 7.8 7.0
6.1 9.4 8.1 5.2 7.9 8.2 7.7 7.7 7.0 7.4
Xi f
80 - 81 6
82 83 14
84 85 30
86 87 33
88 - 89 13
90 - 91 4
x F
100-106 2
107-113 6
114-120 11
121-127 8
128-134 9
135-141 6
142-148 5
149-155 2
156-162 1
Total 50
0.19 0.29 0.30 0.27 0.32 0.22 0.22 0.15 0.22 0.27
0.35 0.19 0.32 0.27 0.39 0.32 0.24 0.27 0.23 0.28
0.37 0.17 0.37 0.26 0.37 0.27 0.32 0.29 0.26 0.28
0.25 0.20 0.22 0.27 0.32 0.27 0.34 0.27 0.26 0.27
BARRAS SEPARADAS.
Ejemplo 4.
Una pequea encuesta estudiantil sobre preferencias de bebidas gaseosas
produjo los siguientes resultados:
i bebida fi fri % Fi %
1 Coca 17 34 34%
2 Fanta 8 16 50%
3 Pepsi 11 22 72%
4 Salva 8 16 88%
5 Sprite 6 12 100%
9
total 50
CIRCULAR
Ejemplo 5.
10
Ejemplo 6.
Clasificacin de 40 alumnos de una escuela rural de acuerdo a su peso en
libras.
11
Frecuencia
Clases Frecuencia Puntos medios acumulada Frecuencia
menos de relativa
29.5 34.5 1 32 1 0.025
34.5 39.5 3 37 4 0.075
39.5 44.5 8 42 12 0.200
44.5 49.5 9 47 21 0.225
49.5 54.5 7 52 28 0.175
54.5 59.5 4 57 32 0.100
59.5 64.5 3 62 35 0.075
64.5 69.5 3 67 38 0.075
69.5 74.5 2 72 40 0.050
Total 40 1.000
N
Suma de todos los datos
x
Nmero total de datos = x1 x 2 .....x N x i
i 1
N N
SOLUCION:
8 16 4 12 10 50
x 10
5 5
Advierta: la media es uno de los datos.
SOLUCION:
8 16 4 12 5 45
x 9
5 5
La media, 9, no es uno de los datos
Si los nmeros x1 x 2 .....x N ocurren f 1 , f 2 ,....., f N veces, respectivamente (o
sea con frecuencias f 1 , f 2 ,....., f N ), la media aritmtica es
N N
f x f x ........f N x N fi x i f x i i
x 1 1 2 2 i 1
i 1
f1 f 2 ..........f N N
N
f
i 1
i
w x w2 x 2 .....wN x N w x i i
x 1 1 i 1
w1 w2 .....wN N
w
i 1
i
14
VERIFICANDO SU COMPRENSIN
1.5.2 LA MODA
1.5.3 LA MEDIANA
SOLUCION:
Primero se ordenan los nmeros (orden creciente): 2,2,5,5,6,6,7,8,9 y 10.
Como hay un nmero impar de datos, la mediana es 6 (la mediana es uno de
los datos)
EJEMPLO 11. Calcular la mediana del conjunto: 7,4,7,4,5,5,6,6,6,3,3,2,1 y 1
SOLUCION:
Primero se ordenan los nmeros (orden creciente): 1,1,2,3,3,4,4,5,5,6,6,6,7 y
45
7. Como hay un nmero par de datos, la mediana es 4.5 (la mediana
2
no es uno de los datos)
VERIFICANDO SU COMPRENSION
Calcule la mediana a cada uno de los conjuntos de nmeros dados.
a) 7,5,6,4,4,4,3,3,1 y 10 b) -4, -6, -1, 1, 4, 10 y 3
Lic. Mauro H. Henrquez Rauda
1.5.4 EJERCICIOS
27 30 31 36 28 30 31 26 29
32
EJEMPLO 1.
Suponga que en un hospital, el nivel de azcar en la sangre de cada
paciente se mide tres veces por semana. En cierta semana los registros de
dos pacientes indican:
En efecto:
90 100 110 300
Paciente A: 100
3 3
40 100 160 300
Paciente B: 100
3 3
Observe la diferencia en variabilidad. Mientras que el paciente A es bastante
estable, el nivel del paciente B flucta ampliamente. Este resultado deber
tomarse en cuenta cuando se prescriba su tratamiento.
EJEMPLO 2.
Se va a seleccionar a un atleta para que represente a la Universidad en los
juegos estudiantiles, en la prueba de los 100 metros. Se tienen dos
candidatos: A y B. Para decidir por uno de ellos se les toman los tiempos que
se tardan en recorrer los 100 metros en cinco ocasiones. A continuacin de
detallan:
EJEMPLO 3.
En el ejemplo 1, el rango para el nivel de azcar en la sangre del paciente A
es 110 90 = 20 y de 160 40 = 120, para el paciente B.
media
Conjunto B:
3 8 9 10 11 12 13 14 19
(x i x) 2
i 1
N
Si x1 , x 2 ,.....,.x N ocurren con frecuencias f 1 , f 2 ,..... f N respectivamente, la
desviacin tpica puede expresarse como
N
f (x i i x) 2
donde N =
N
f i
i 1
i 1
N
(x i x) 2
para datos sin agrupar
S i 1
N 1
N
f (x i i x) 2
para datos agrupados en tablas de frecuencia
S i 1
N 1
NOTA: Muestra es el conjunto de datos que se pueden utilizar, en forma
razonable, para hacer generalizaciones acerca de la poblacin de la cual
provienen.
SOLUCION.
Para la muestra A.
3 4 5 6 11 16 17 18 19 99
Paso 1. x 11
9 9
9
Paso 2. El clculo de S ( xi x) 2 se facilita con una tabla como la que
i 1
sigue:
Variable x Desviacin ( xi x ) Cuadrado de la
desviacin ( xi x) 2
3 -8 64
4 -7 49
5 -6 36
6 -5 25
11 0 0
16 5 25
17 6 36
18 7 49
19 8 64
9
S ( xi x) 2 = 64 + 49 + 36 + 25 + 0 + 25 + 36 + 49 + 64 = 348 y
i 1
9
(x i x) 2
=
348
=
348
= 6.6
S i 1
9 1 9 1
N 1
Para la muestra B
3 8 9 10 11 12 13 14 19 99
Paso 1. x 11
9 9
9
Paso 2. Calculamos (x
i 1
i x) 2
(x
i 1
i x) 2 = 64 + 9 + 4 + 1 + 0 + 1 + 4 + 9 + 64 = 156 y
9
(x i x) 2
=
3156
=
3156
= 4.4
S i 1
9 1 9 1
N 1
Puesto que la desviacin tpica del conjunta A es mayor que la del conjunto
B, concluimos que la muestra A es la ms dispersa.
VERIFICANDO SU COMPRENSION
SOLUCION
Para facilitar los clculos usamos la siguiente tabla
f i xi
616 f ( x x)
i i
2
27.6
x i 1
15.4 S i 1
0.84
N 40 N 1 39
VERIFICANDO SU COMPRENSION
a) x f
2 4
3 3
4 5
5 2
1.6.3 EJERCICIOS
1.7.1 CUANTILES
As, el primer cuartil, Q1, es un valor tal que una cuarta parte de los datos
son menores que l y tres cuartas partes son mayores. Q2, es igual a la
mediana y Q3, supera a los tres cuartos de los datos y solo es superado por
un cuarto de ellos.
Adems de la mediana y los cuartiles pueden calcularse tambin lo deciles:
D1, D2, ......D9, los cuales dividen al conjunto en dcimas. Los percentiles:
P1, P2,....P99, que lo dividen en centsimos. Todos stos valores reciben el
nombre de cuantiles y pueden resultar muy apropiados para apreciar la
posicin de los datos de un conjunto y su posicin.
Tanto la mediana como los cuartiles y los deciles constituyen casos
particulares de los percentiles y pueden expresarse como percentiles.
n
La posicin de k-simo percentil se encuentra calculando ( )k, donde n
100
es el nmero de datos. S el resultado es un nmero decimal, seleccione
como indicador del orden al entero prximo superior y el percentil a localizar
es Pi.
Si el resultado es un entero seleccione como indicadores de orden al entero
obtenido i y al siguiente i + 1. El percentil se obtiene haciendo Pk =
xi ( xi i)
2
Ejemplo.
Calcular Q2 y la mediana. Considrense para ello, los siguientes datos, que
se refieren a los pesos de 40 estudiantes de una escuela rural y que se
presentan en el orden en que fueron pesado los alumnos:
49 60 45 37 54
44 59 40 62 47
46 52 55 41 66
45 36 50 51 48
42 53 53 68 56
35 74 43 47 60
51 67 40 70 49
41 46 32 57 43
As como estn los datos resulta difcil sacar una conclusin, por lo tanto,
como no son muchos, puede iniciarse el anlisis haciendo una ordenacin en
forma creciente.
32 42 47 52 60
35 43 47 53 60
36 43 48 53 62
37 44 49 54 66
40 45 49 55 67
40 45 50 56 68
41 46 51 57 70
41 46 51 59 74
40
La posicin de Q2 es igual a la posicin de P50, la cual se obtiene as: x 50
100
= 20 Los datos a localizar son: X20 y X21. El valor de Q2 es:
Lic. Mauro H. Henrquez Rauda
X 20 X 21 50 53
Q2 = = 51.5
2 2
La mediana es igual a P50 = Q2 = 51.5
25
1.7.2 EJERCICIOS .
Salarios (x) f
500-599 8
600-699 12
700-799 18
800-899 10
900-999 6
1000-1099 2
Calcule:
a) El valor del cuartil uno.
b) El valor del cuartil dos.
c) El valor del cuartil tres.
d) El valor del decil cinco.
e) El valor del decil cinco.
f) El valor del percentil ochenta.
g) El valor del percentil cincuenta.
h) El salario que limita el 20% superior de la distribucin.
i) El salario que se deja sobre s, el 70% de los casos.
j) Entre qu salarios est el 60% central de la distribucin.