1
La Estadística Sumaria
Después de construir tablas y gráficos, a partir de una
colección de datos, se requieren medidas más
exactas.
La estadística sumaria o de resumen, proporciona
medidas para describir un conjunto de datos.
Existen tres tipos de medidas de resumen:
• De tendencia central.
• De dispersión.
• De la forma de la distribución.
2
(A) Las medidas de tendencia central
3
(B) Las medidas de dispersión
Se refieren a la extensión o amplitud de los datos de
una distribución
Representan el grado de variabilidad de los datos.
Ejemplo:
Observe que la curva A en el siguiente gráfico tiene una
mayor dispersión que la curva B, a pesar que la
posición central es la misma.
4
(C) Las medidas de la forma de la curva
Las curvas que representan a un conjunto de datos,
pueden ser analizadas de acuerdo a su:
a)Simetría b) Curtosis
Las curvas simétricas, tienen una forma tal que con
una línea vertical que pase por el punto más alto de la
curva, dividirá el área de esta en dos partes iguales.
5
Las curvas sesgadas son aquellas cuyos valores están
concentrados en el extremo inferior o superior de la
escala de medición del eje horizontal. La “cola” indica
el tipo de sesgo.
6
Cuando medimos la curtosis nos referimos al grado de
agudeza. Pueden ser: leptocúrtica (concentración al
centro) mesocúrtica (distribuidos simétricamente)
platicúrtica (aplanada).
7
3.3 Las medidas de tendencia central
c) Simbología:
Tamaño Media aritmética
Muestra n (equis
x barra)
Población N (mu)
X
: frecuencia absoluta
n i
de la clase i
fi Xi : marca de la clase i
x n i 1
fi
i 1
x 1575
60
x 26.25
Oswaldo Quiroz Marín 14
Interpretación : Si se elige al azar a un técnico, se
espera que tenga un puntaje de 26,25 en su
evaluación de desempeño.
w X i i wi = factor de ponderación
xp i 1
n
w
i 1
i X i = datos
Nº de teléfonos Comisión
Vendedor vendidos por venta $
wi Xi
Pedro 30 30
Juan 25 40
Pablo 20 50
Oswaldo Quiroz Marín 16
30(30) 25(40) 20(50) 2900
xp $38.67
30 25 20 75
Interpretación:
Si se elige al azar un vendedor se espera que cobre
una comisión de $38.67 por teléfono vendido.
xg n X1 X2 X3 .........Xn
Oswaldo Quiroz Marín 19
Ejemplo:
La siguiente tabla muestra la tasa de aumento en las
ventas durante los últimos meses. Calcule e
interprete la tasa media mensual.
Meses Enero Febrero Marzo Abril Mayo
Aumento de
2.6% 5.4% 3.8% 0.5% 1.4%
Ventas
1
xh n 1
i 1
X
i
n
Oswaldo Quiroz Marín 23
Ejemplo:
Los siguientes datos registran el tiempo que utilizan
cuatro clientes al realizar una compra de un artefacto
doméstico. Calcule e interprete el tiempo medio.
Cliente A B C D
Tiempo
45 38 52 40
(minutos)
xh 43 minutos 7 segundos
b) Interpretación:
Si se selecciona al azar a uno de los cuatro clientes, se
espera que realice la compra de un artefacto en 43
minutos aproximadamente.
mediana
c) Reglas
1º Si la serie es impar, la mediana ocupa el lugar
central de la serie previamente ordenada.
18 23
mediana 20.5
2
Mediana = 11 años
Oswaldo Quiroz Marín 31
Interpretación:
La mitad de los profesionales técnicos que laboran en
esta empresa tienen una experiencia laboral igual o
menor a 11 años. La otra mitad de los profesionales
tienen una experiencia laboral igual o menor a 10 años
y 6 meses.
Ejemplo:
4, 5, 7, 8, 8 , 10, 12, 15
1
Mo L c
donde:
i
1 2
Mo:: moda
limite real (o frontera) inferior de la clase
L modal (la de mayor frecuencia)
i
: frecuencia de la clase modal menos la
1 frecuencia de la clase anterior
: frecuencia de la clase modal menos la
2 frecuencia de la clase siguiente
c : amplitud de clase
Kn F 1
100
P L c
K i f
P
K
K : el percentil
n : número de datos
percentil K
c : amplitud de clase
Oswaldo Quiroz Marín 39
Ejemplo:
La tabla muestra la experiencia (en años) de los
trabajadores de una gran compañía textil.
Experiencia Trabajadores
(años)
0-3 18
4-7 42
8 - 11 68
12 - 15 120
16 - 19 40
20 - 23 34
24 - 27 12
Total 334
Oswaldo Quiroz Marín 40
¿Sobre qué edad se ubica el 25% de los trabajadores de
mayor experiencia?
75 % 25 %
P75
Menor Mayor
Experiencia Experiencia
K = 75
K n 75(334)
Lugar del P75 250.5o (de los números ordenados )
100 100
Para saber en qué clase se halla este dato, se calculó la
frecuencia acumulativa.
Oswaldo Quiroz Marín 41
Experiencia Nº Trabajadores Frec. Acumulada
(años) fi Fi
0-3 18 18
4-7 42 60 F=248
8 - 11 68 128
12 - 15 120 248 En esta clase
16 - 19 40 288 se ordenan del
20 - 23 34 322 249º - 288º
24 - 27 12 334
334
Percentil 5:
El 5% de las familias con menor ingreso tienen un ingreso promedio máximo de S/ 200.00
Percentil 20: = Quintil 1:
• El 20% de las familias con menor ingreso tienen un ingreso promedio máximo de S/
500.00
• El primer quintil de ingresos es de S/ 500.00 ( el 20% familias con menores ingresos
como máximo obtienen S/ 500.00 de ingreso
Percentil 25: = Cuartil 1:
• El 25% de las familias con menor ingreso tienen un ingreso promedio máximo de S/
500.00
• El primer cuartil de ingresos es de S/ 500.00 ( el 25% familias con menores ingresos
como máximo obtienen S/ 500.00 de ingreso
donde:
R = (Ls - Li ) + 1 : Limite superior de la
L última clase
s : Limite inferior de la
L
i primera clase
Ventajas
fácil de calcular
fácil de entender e interpretar
Desventajas
sólo considera los valores extremos
no toma en cuenta ni el número de datos ni el valor de
estos
no es posible calcular en tablas con extremos abiertos.
Permite ubicar el
50% de los datos que
se encuentran en el
centro de la
distribución, es decir,
el 25% de los datos
son menores al
primer cuartil y
también 25% de los
datos son mayores al
tercer cuartil.
Experiencia
Trabajadores
(años)
A)¿En qué valores se
0-3 18
4-7 42 encuentra el 50%
8 - 11 68 intermedio de estos
12 - 15 120 datos?
16 - 19 40
B)¿Cuál es el rango
20 - 23 34
24 - 27 12
intercuartílico?
Total 334
Q1 Q3
Rango
Intercuartílico
25(334)
Lugar Q1 P25 83.5o se ubica en la 3ra clase
100
(X i x )
2
2 i 1
S n 1
para un población
N
(X i )
2
2 i 1
60
x
8 8 - 10 = 2 4
10 10 - 10 = 0 0
5 5 - 10 = 5
6
25
12 12 - 10 = 2 4
10 10 - 10 = 0 0 x 10
15 15 - 10 = 5 25
X 60 Xi x 0 Xi x
Oswaldo Quiroz Marín
2
58
56
Xi x 58
2
(X i x )
2
S
2
n 1
58
S 6 1 11.6
2
para la muestra n
(X i x )
2
S
2 i 1
s n 1
para la población
N
(Xi )
2
2 i 1
N
S
2
s
S 11,6
S 3,4 articulos
Oswaldo Quiroz Marín 59
3.4.5 El coeficiente de variación
Es una medida relativa de variabilidad de los datos,
permite comparar la variabilidad de dos o más conjuntos
de datos expresados en unidades diferentes (peso; kgs y
libras).
para la muestra:
s
para la población: CV 100
x
CV 100
Oswaldo Quiroz Marín 60
Ejemplo:
A continuación se presentan las ventas (en unidades
monetarias) logradas durante una semana por dos tiendas
de artículos electrodomésticas. La tienda I vende en soles
y la tienda II en dólares ¿Cuál de ellos tiene un
desempeño más estable, en cuanto a nivel de ventas?.
x Xi x Xi x 2
40 -16.14 260.50
70 13.86 192.10
60 3.86 14.90
48 -8.14 66.26
52 -4.14 17.14
65 8.86 78.50
58 1.86 3.46
n
(X i x )
2
632.86
S i 1
10.27
n 1 7 1
S
CV 100
x
10.27
CV 100 18.29
56.14 Oswaldo Quiroz Marín 63
Tienda II
n
Xi 847
x i 1 105.87
n 8
x Xi x Xi x 2
70 -35.87 1286.6569
35 -70.87 5022.5569
150 44.13 1947.4569
140 34.13 1164.8569
82 -23.87 569.7769
110 4.13 17.0569
140 34.13 1164.8569
120 14.13 199.6569
X 847 XOswaldo
i x 0,04
Quiroz Marín
Xi x
2
11372,88
64
n
Si X i x
2
11372.88
i 1
n
(X i x )
2
11372,88
S i 1
40.30
n 1 8 1
S 40,30
CV 100 CV 100 30,06
x 105,87