Anda di halaman 1dari 65

Medidas de Tendencia Central

Oswaldo Quiroz Marín Marín

1
La Estadística Sumaria
Después de construir tablas y gráficos, a partir de una
colección de datos, se requieren medidas más
exactas.
La estadística sumaria o de resumen, proporciona
medidas para describir un conjunto de datos.
Existen tres tipos de medidas de resumen:
• De tendencia central.
• De dispersión.
• De la forma de la distribución.

2
(A) Las medidas de tendencia central

Se refieren al punto medio de una distribución


Se conocen como medidas de posición
Ejemplo:
A partir del gráfico siguiente, se observa que la
posición central de la curva B está a la derecha de la
posición central de las curvas A y C. Obsérvese que
la posición central de la curva A es la misma que la
curva C.

3
(B) Las medidas de dispersión
 Se refieren a la extensión o amplitud de los datos de
una distribución
 Representan el grado de variabilidad de los datos.
Ejemplo:
Observe que la curva A en el siguiente gráfico tiene una
mayor dispersión que la curva B, a pesar que la
posición central es la misma.

4
(C) Las medidas de la forma de la curva
 Las curvas que representan a un conjunto de datos,
pueden ser analizadas de acuerdo a su:
a)Simetría b) Curtosis
 Las curvas simétricas, tienen una forma tal que con
una línea vertical que pase por el punto más alto de la
curva, dividirá el área de esta en dos partes iguales.

5
 Las curvas sesgadas son aquellas cuyos valores están
concentrados en el extremo inferior o superior de la
escala de medición del eje horizontal. La “cola” indica
el tipo de sesgo.

6
 Cuando medimos la curtosis nos referimos al grado de
agudeza. Pueden ser: leptocúrtica (concentración al
centro) mesocúrtica (distribuidos simétricamente)
platicúrtica (aplanada).

7
3.3 Las medidas de tendencia central

 En general se denominan promedios.


 Los más importantes son la media, la mediana y la
moda.
Aritmética
Media Geométrica
Medidas de Mediana Armónica
tendencia central Moda

 También es útil conocer los percentiles (o fráctiles).

Oswaldo Quiroz Marín 8


3.3.1 La Media

(A) La media aritmética ( x)


a) Obtención: Se obtiene sumando los valores
registrados y dividiéndolos entre el número de
datos.
Ejemplo:
La siguiente tabla muestra el número de reclamos y
quejas presentadas por vecinos por la demora en la
construcción de carreteras . Calcule e interprete la
media.
Día/Semana Lun Mar Mier Jue Vier Sab
Reclamos/día 8 10 5 12 10 15
Oswaldo Quiroz Marín 9
Media aritmética = 8  10  5  12  10  15 60

6 10
x = 10 reclamos
b) Interpretación: Si elige al azar un día de la semana, se
espera que los clientes de esta tienda realicen 10
reclamos por día.

c) Simbología:
Tamaño Media aritmética
Muestra n (equis
x barra)
Población N  (mu)

Oswaldo Quiroz Marín 10


d) Cálculos a partir de datos no agrupados, se utilizan
las siguientes formulas.
Para una muestra x
donde:  X i : : media muestral
n
n : suma de todos
 Xi lo datos
i 1
x  : número de datos
n
(muestra)

para una población


donde:  : media poblacional
N
 X i : suma de todos los
 Xi
  i 1 datos
N N : número de datos
(población)
Oswaldo Quiroz Marín 11
e) Cálculo a partir de datos agrupados.
Se utiliza la formula siguiente
donde: x
fi : media muestral

X
: frecuencia absoluta
n i
de la clase i
 fi Xi : marca de la clase i
x n i 1

 fi
i 1

Oswaldo Quiroz Marín 12


Ejemplo:
La distribución de frecuencias siguiente, representa los
puntajes obtenidos en una evaluación del desempeño,
aplicado al personal técnico de una empresa. El puntaje
máximo en la prueba es 50. Calcule e interprete en
media.
Desempeño Número de
(puntos) técnicos
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
TOTAL 60

Oswaldo Quiroz Marín 13


Primero se calcularán las marcas de clase ( Xi); es
decir, el valor intermedio de cada clase
Marca de Frecuencia
clase
clase ( xi) absoluta(fi)
12 - 16 14 4
17 - 21 19 8
22 - 26 24 15
27 - 31 29 23
32 - 36 34 10
Total 60
x  14(4) + 19 (8) + 24 (15) + 29 (23) + 34 (10)
4+8+15+23+10

x  1575
60
x  26.25
Oswaldo Quiroz Marín 14
Interpretación : Si se elige al azar a un técnico, se
espera que tenga un puntaje de 26,25 en su
evaluación de desempeño.

f) La media aritmética ponderada ( x p )


donde:
n

w X i i wi = factor de ponderación
xp  i 1
n

w
i 1
i X i = datos

Oswaldo Quiroz Marín 15


Ejemplo: Una empresa comercializadora de teléfonos
celulares dispone de 3 vendedores, cada uno de los
cuales cobra diferente comisión por teléfono vendido, y
realiza diferente número de ventas. Calcule e interprete
el valor medio de la comisión

Nº de teléfonos Comisión
Vendedor vendidos por venta $
wi Xi
Pedro 30 30
Juan 25 40
Pablo 20 50
Oswaldo Quiroz Marín 16
30(30)  25(40)  20(50) 2900
xp    $38.67
30  25  20 75

Interpretación:
Si se elige al azar un vendedor se espera que cobre
una comisión de $38.67 por teléfono vendido.

Oswaldo Quiroz Marín 17


g)Ventajas y desventajas de la media aritmética
Ventajas:
 Concepto familiar para muchas personas
 Es única para cada conjunto de datos
 Es posible comparar medias de diferentes
muestras
Desventajas
 Se ve afectada por los datos extremos
 Si la muestra es grande y los datos no están
agrupados, su cálculo es tedioso
 Si los datos están agrupados en clases con
extremos abiertos, no es posible calcular la
media.
Oswaldo Quiroz Marín 18
xg (
(B) La media geométrica )

Se utiliza para calcular tasas medias de variación, como


la tasa media de crecimiento poblacional, la tasa media
de inflación mensual, la tasa media de mortalidad, entre
otros.

a) Obtención Se obtiene extrayendo la raíz


enésima del producto de los n valores de
una serie.

xg  n X1  X2  X3  .........Xn
Oswaldo Quiroz Marín 19
Ejemplo:
La siguiente tabla muestra la tasa de aumento en las
ventas durante los últimos meses. Calcule e
interprete la tasa media mensual.
Meses Enero Febrero Marzo Abril Mayo
Aumento de
2.6% 5.4% 3.8% 0.5% 1.4%
Ventas

La tasa 2.6% también se puede expresar como 0.026


y, ya que como se refiere a un aumento a partir de
100%, el factor de variación será 1.026. Para los
otros datos se opera igual.

Oswaldo Quiroz Marín 20


b) Cálculos
Por lo tanto, la media geométrica se calcula:
xg  n x1, x 2, x 3,......x

x g  5 (1.026) (1.054) (1.038) (1.005)(1.014)


x g  5 1.143903377
x g  1,0272540 ( Factorde crecim iento m edio)
Tasa media
de variación= (x g  1) 100

= (1,0272540 - 1) x 100 = 2.72%


Oswaldo Quiroz Marín 21
c) Interpretación
Si se selecciona al azar un mes entre enero y
mayo, se espera que las ventas se hayan
incrementado 2.72% con respecto al mes
anterior.

Oswaldo Quiroz Marín 22


xh (
(C) La media armónica )

Se utiliza para calcular el tiempo medio, velocidad y


aceleración media, como el tiempo medio para
realizar un proceso productivo.

a)Obtención: se obtiene calculando el inverso de la


media aritmética de los inversos de una serie.

1
xh  n 1

i 1
X
i
n
Oswaldo Quiroz Marín 23
Ejemplo:
Los siguientes datos registran el tiempo que utilizan
cuatro clientes al realizar una compra de un artefacto
doméstico. Calcule e interprete el tiempo medio.

Cliente A B C D
Tiempo
45 38 52 40
(minutos)

Oswaldo Quiroz Marín 24


4 4
xh  1 1 1 1

1976  2340  1710  2223
  
45 38 52 40 88920

xh  4  88920  43.117953 minutos


8249

xh  43 minutos 7 segundos

b) Interpretación:
Si se selecciona al azar a uno de los cuatro clientes, se
espera que realice la compra de un artefacto en 43
minutos aproximadamente.

Oswaldo Quiroz Marín 25


3.3.2 La Mediana

Es la medida que divide en dos subconjuntos iguales a


datos, de tal manera que 50% de los datos es menor a
la mediana y el otro 50% es mayor a la mediana.

a)Obtención: Se obtiene ordenando la serie de datos


(en forma ascendente o descendente) y ubicando el
dato central.

Oswaldo Quiroz Marín 26


Ejemplo:
Los siguientes datos se refieren al número de clientes
atendidos durante los últimos 11 días en una tienda de
artefactos. Calcule e interprete la mediana.
12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16

Primero se ordenan lo datos:


5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17
5 datos menores 5 datos mayores

mediana

Oswaldo Quiroz Marín 27


b) Interpretación: Durante 5 días se atendieron a
menos de 11 clientes, y durante 5 días se atendieron
a más de 11 clientes.

c) Reglas
1º Si la serie es impar, la mediana ocupa el lugar
central de la serie previamente ordenada.

Ejemplo: 5, 10, 10, 12, 15 , 17, 20, 21, 24

Oswaldo Quiroz Marín 28


2º Si la serie es par, la mediana se obtiene de la
semisuma de los dos valores centrales de la serie
previamente ordenada.
Ejemplo:
8, 10, 14, 18, 23, 24, 32, 34

18  23
mediana   20.5
2

3º Sea la serie par o impar, la mediana ocupa el lugar


 n  1

 2   , de la serie previamente ordenada.
Oswaldo Quiroz Marín 29
d) Cálculo a partir de datos agrupados.
 n 1 
 2   F  1 
Md  Li   c
 f Md 
 
donde:
Md : mediana
: limite real (o frontera) inferior de la clase
Li medial (o mediana).
n : número total de datos.
F : suma de todas las frecuencias hasta, pero
sin incluir, la clase mediana.
f Md : frecuencia de la clase medial
c : amplitud de clase

Oswaldo Quiroz Marín 30


Ejemplo: La tabla siguiente muestra la experiencia
profesional (años) del personal técnico que labora en
una empresa. Calcule e interprete la mediana.
Lugar de la mediana:
Experiencia Número de
n  1 69  1
profesional trabajadores   35o
(años) técnicos 2 2
0-3 4
4-7 12  69  1  (17) 
Md  8   2 4
Clase
8 - 11 24
Medial  24 
12 - 15 16  
16 - 19 10
20 - 23 3
 8
 35  17  4
69  24 

Mediana = 11 años
Oswaldo Quiroz Marín 31
Interpretación:
La mitad de los profesionales técnicos que laboran en
esta empresa tienen una experiencia laboral igual o
menor a 11 años. La otra mitad de los profesionales
tienen una experiencia laboral igual o menor a 10 años
y 6 meses.

Oswaldo Quiroz Marín 32


e) Ventajas y desventajas de la mediana
Ventajas:
 Los valores extremos no afectan a la mediana como en el caso de
la media aritmética.
 Es fácil de calcular, interpretar y entender.
 Se puede determinar para datos cualitativos.
Desventajas:
 Como valor central, se debe ordenar primero la serie de datos.
 Para una serie amplia de datos no agrupados, el proceso de
ordenamiento de los datos demanda tiempo y usualmente
provoca equivocaciones.

Oswaldo Quiroz Marín 33


3.3.3 La Moda
La moda es el valor que más se repite dentro de un
conjunto de datos.
a) Obtención: se obtiene organizando la serie de datos
y seleccionando el o los datos que más se repiten.

Ejemplo:

4, 5, 7, 8, 8 , 10, 12, 15

4, 7, 12,12 , 15, 16, 20, 20 , 24, 27

7, 12, 15, 18, 25, 30,Oswaldo


31, 38 Quiroz Marín 34
b) Cálculo a partir de datos agrupados

 1 
Mo  L    c
 
donde:
i
 1 2
Mo:: moda
limite real (o frontera) inferior de la clase
L modal (la de mayor frecuencia)
i
 : frecuencia de la clase modal menos la
1 frecuencia de la clase anterior
 : frecuencia de la clase modal menos la
2 frecuencia de la clase siguiente
c : amplitud de clase

Oswaldo Quiroz Marín 35


La clase medial pueden coincidir pero conceptualmente
son diferentes.
Ejemplo: La tabla siguiente muestra los errores de
facturación durante un mes, en una empresa
comercializadora.
Errores de
Calcule e interprete la moda.
facturación Días  6
1 Clase moda : (4 - 7)
0-3 6
Clase
4-7 12
 6 
Modal
 4 Mo  4   4
8 - 11 8 2
64
12 - 15 3
16 - 19 1 Mo = 6.4
Total Durante30
Interpretación: un mes, el número más frecuente de errores de facturación en esta
empresa comercializadora es 6.

Oswaldo Quiroz Marín 36


e) Ventajas y desventajas de la moda.
Ventajas:
 Se puede utilizar tanto para datos cualitativos como cuantitativos.
 No se ve afectada por los valores externos
 Se puede calcular, a pesar de que existan una o más clases abiertas.
Desventajas:
 No tiene un uso tan frecuente como la media.
 Muchas veces no existe moda (distribución amodal).
 En otros casos la distribución tiene varias modas, lo que dificulta su
interpretación.

Oswaldo Quiroz Marín 37


3.3.4 Los Percentiles
Son los valores que dividen en 100 partes iguales a un
conjunto de datos
a) Cálculo: para datos agrupados.

 Kn  F  1
 100 
P L  c
K i  f 
 P
K


Oswaldo Quiroz Marín 38


donde:
P : percentil
K

K : el percentil
n : número de datos

F : frecuencia acumulativa hasta la clase


anterior a la clase donde se ubica el percentil K
f
P : frecuencia absoluta de la clase donde se ubica el
K

percentil K
c : amplitud de clase
Oswaldo Quiroz Marín 39
Ejemplo:
La tabla muestra la experiencia (en años) de los
trabajadores de una gran compañía textil.

Experiencia Trabajadores
(años)
0-3 18
4-7 42
8 - 11 68
12 - 15 120
16 - 19 40
20 - 23 34
24 - 27 12
Total 334
Oswaldo Quiroz Marín 40
¿Sobre qué edad se ubica el 25% de los trabajadores de
mayor experiencia?

75 % 25 %

P75
Menor Mayor
Experiencia Experiencia

K = 75

K n 75(334)
Lugar del P75    250.5o (de los números ordenados )
100 100
Para saber en qué clase se halla este dato, se calculó la
frecuencia acumulativa.
Oswaldo Quiroz Marín 41
Experiencia Nº Trabajadores Frec. Acumulada
(años) fi Fi
0-3 18 18
4-7 42 60 F=248
8 - 11 68 128
12 - 15 120 248 En esta clase
16 - 19 40 288 se ordenan del
20 - 23 34 322 249º - 288º
24 - 27 12 334
334

 75(334)  248  1


 100  P  16.15 años
P  16 
75  40 4 75
 

Interpretación: Para que un trabajador esté comprendido


en el 25% de mayor experiencia laboral debe tener al
menos 16 años, 1 mesesy 24 días.
Oswaldo Quiroz Marín 42
Comparativo entre Percentiles;
Quintiles, Cuartiles y deciles
• Percentiles : Divide los datos en 100 partes
• Deciles : Divide los datos en 10 partes
• Quintiles : Divide los datos en 5 partes
• Cuartiles : Divide los datos en 4 partes
El percentil 10 = Decil 1
El percentil 20 = Quintil 1 = Decil 2
El percentil 25= Cuartil 1
El percentil 50 = Decil 5 = cuartil 2
Oswaldo Quiroz Marín 43
Estadísticos
Ingresos
Percentiles 5 200,00
20 500,00
25 500,00
50 1000,00
75 1600,00
95 3000,00

Percentil 5:
El 5% de las familias con menor ingreso tienen un ingreso promedio máximo de S/ 200.00
Percentil 20: = Quintil 1:
• El 20% de las familias con menor ingreso tienen un ingreso promedio máximo de S/
500.00
• El primer quintil de ingresos es de S/ 500.00 ( el 20% familias con menores ingresos
como máximo obtienen S/ 500.00 de ingreso
Percentil 25: = Cuartil 1:
• El 25% de las familias con menor ingreso tienen un ingreso promedio máximo de S/
500.00
• El primer cuartil de ingresos es de S/ 500.00 ( el 25% familias con menores ingresos
como máximo obtienen S/ 500.00 de ingreso

Oswaldo Quiroz Marín 44


3.4 Las medidas de dispersión

Llamadas también medidas de variabilidad


Son útiles porque:
 Permiten juzgar la confiabilidad de la medida de
tendencia central.
 Los datos demasiados dispersos tienen un
comportamiento especial.
 Es posible comparar dispersión de diversas
muestras.

Oswaldo Quiroz Marín 45


3.4.1 El rango (R)

Llamado también amplitud o alcance.

a) Obtención: se obtiene de la influencia entre el dato


mayor y el dato menor más una unidad significativa, a
fin de incluir ambos valores extremos.

Oswaldo Quiroz Marín 46


Ejemplo:

Los siguientes datos representan el peso de 10 niños al


nacer, (en kgs). Calcule e interprete el rango.
2,860 3,150 3,450 2,950 3,780
4,170 3,920 3,280 4,050 3,120

Rango = (4,170 - 2,860) + 0.001


Rango = 1,311 Kgs

Oswaldo Quiroz Marín 47


b) Interpretación
La diferencia entre el bebe de mayor peso y el bebe menor peso es
1,311 Kgs.

c) Cálculo a partir de datos agrupados


Se utiliza la siguiente formula:

donde:
R = (Ls - Li ) + 1 : Limite superior de la
L última clase
s : Limite inferior de la
L
i primera clase

Oswaldo Quiroz Marín 48


Ejemplo:
La distribución de frecuencias siguiente representa el
tiempo que demora un cliente en un banco. Calcule e
interprete el rango
Tiempo Nº de Clientes
(minutos) (por día)
Rango = (36-12) + 1
12 - 16 4
17 - 21 8
22 - 26 15 R = 25 minutos
27 - 31 23
32 - 36 10
Total 60
Interpretación: la diferencia de tiempo entre el cliente que más demora y el que
menos demoró es 25 minutos.

Oswaldo Quiroz Marín 49


f) Ventajas y desventajas del rango

Ventajas
fácil de calcular
fácil de entender e interpretar

Desventajas
sólo considera los valores extremos
no toma en cuenta ni el número de datos ni el valor de
estos
no es posible calcular en tablas con extremos abiertos.

Oswaldo Quiroz Marín 50


3.4.2 El rango intercuartil

Permite ubicar el
50% de los datos que
se encuentran en el
centro de la
distribución, es decir,
el 25% de los datos
son menores al
primer cuartil y
también 25% de los
datos son mayores al
tercer cuartil.

Oswaldo Quiroz Marín 51


Ejemplo:
La tabla muestra la experiencia (en años) de los
trabajadores de una gran compañía textil.

Experiencia
Trabajadores
(años)
A)¿En qué valores se
0-3 18
4-7 42 encuentra el 50%
8 - 11 68 intermedio de estos
12 - 15 120 datos?
16 - 19 40
B)¿Cuál es el rango
20 - 23 34
24 - 27 12
intercuartílico?
Total 334

Oswaldo Quiroz Marín 52


50 %
25 % 25 %

Q1 Q3
Rango
Intercuartílico

25(334)
Lugar Q1  P25   83.5o se ubica en la 3ra clase
100

 25(334)  60  1


 100  Q  8.82 años
Q  7.5  4
1  68  1
 

Oswaldo Quiroz Marín 53


75(334)
Lugar Q3  P75   250.5o se ubica en la 5ta clase
100

 75(334)  248  1


 100 
Q  15 .5  4
3  40  Q  15 .65 años
3
 

A)Es 50% de los trabajadores con experiencia


intermedia se encuentran entre 8.82 y 15.65
B) El rango intercuartílico es 6 años 10 meses
aproximadamente

Oswaldo Quiroz Marín 54


3.4.3 La varianza

Es una medida de desviación promedio con respecto a la


media aritmética

a) Cálculos a partir de datos no agrupados.

para una muestra


n

 (X i  x )
2


2 i 1
S n 1
para un población
N

 (X i   )
2

 
2 i 1

Oswaldo Quiroz Marín N 55


Ejemplo:
La siguiente información se refiere al número de
artículos vendidos durante una semana.
Calcule la varianza. 8, 10, 5, 12, 10, 15
Elaboramos un cuadro de la forma siguiente
x Xi  x Xi  x  2

60
x
8 8 - 10 = 2 4
10 10 - 10 = 0 0
5 5 - 10 = 5
6
25
12 12 - 10 = 2 4
10 10 - 10 = 0 0 x  10
15 15 - 10 = 5 25
 X  60  Xi  x   0  Xi  x 
Oswaldo Quiroz Marín
2
 58
56
 Xi  x   58
2

 (X i  x )
2

S 
2

n 1

58
S  6  1  11.6
2

Oswaldo Quiroz Marín 57


3.4.4 La desviación estándar

Es la raíz cuadrada de la varianza, sea poblacional o


muestral.
a) Cálculos a partir de datos no agrupados

para la muestra n

 (X i  x )
2

S 
2 i 1
s n 1

para la población
N
 (Xi   )
2

  2  i 1
N

Oswaldo Quiroz Marín 58


Ejemplo:
La siguiente información se refiere al número de
artículos vendidos durante una semana. Calcule la
desviación estándar.
8, 10, 5, 12, 10, 15
Ya sabemos por el ejemplo anterior que S2 = 11.6
Entonces

S
2
s
S  11,6

S  3,4 articulos
Oswaldo Quiroz Marín 59
3.4.5 El coeficiente de variación
Es una medida relativa de variabilidad de los datos,
permite comparar la variabilidad de dos o más conjuntos
de datos expresados en unidades diferentes (peso; kgs y
libras).

a) Calcular a partir de datos no agrupados

para la muestra:
s
para la población: CV  100
x


CV  100

Oswaldo Quiroz Marín 60
Ejemplo:
A continuación se presentan las ventas (en unidades
monetarias) logradas durante una semana por dos tiendas
de artículos electrodomésticas. La tienda I vende en soles
y la tienda II en dólares ¿Cuál de ellos tiene un
desempeño más estable, en cuanto a nivel de ventas?.

Tienda I (soles) Tienda II (dólares)


40,70,60,48,52,65,58 70,35,150,140,82,110,140,120

Calculamos la media y desviación estándar por cada una


de las tiendas

Oswaldo Quiroz Marín 61


Tienda I
n
 Xi 393
x  i 1
  56.14
n 7

x Xi  x Xi  x  2

40 -16.14 260.50
70 13.86 192.10
60 3.86 14.90
48 -8.14 66.26
52 -4.14 17.14
65 8.86 78.50
58 1.86 3.46

 X  393  Xi  x   0  Xi  x   632,86


2

Oswaldo Quiroz Marín 62


Si  Xi  x   632.86
2

n
 (X i  x )
2
632.86
S i 1
  10.27
n 1 7 1

S
CV   100
x
10.27
CV  100  18.29
56.14 Oswaldo Quiroz Marín 63
Tienda II
n

 Xi 847
x  i 1   105.87
n 8

x Xi  x Xi  x  2

70 -35.87 1286.6569
35 -70.87 5022.5569
150 44.13 1947.4569
140 34.13 1164.8569
82 -23.87 569.7769
110 4.13 17.0569
140 34.13 1164.8569
120 14.13 199.6569
X  847  XOswaldo
i  x 0,04
Quiroz Marín
 Xi  x 
2
 11372,88
64

n
Si  X i  x 
2
 11372.88
i 1

n
 (X i  x )
2
11372,88
S i 1
  40.30
n 1 8 1

S 40,30
CV   100 CV  100  30,06
x 105,87

La tienda II presenta una mayor variabilidad en el


volúmen de ventas.
Oswaldo Quiroz Marín 65

Anda mungkin juga menyukai