IN TRO D UC C IÓ N
Aun cuando existe una amplia bibliografía sobre el tema, dentro de la cual,
se deduce, que existen libros de excelente calidad en el país, creo que esta obra
tiene cualidades que le dan originalidad y la ubican como un libro de texto de
introducción a la estadística que ya hacia falta para llenar el hueco surgido por la
inexistencia del análisis estadístico aplicado a la economía mexicana. En otras
palabras, esta obra es original porque la presentación de su contenido se
caracteriza por; primero, la exposición del método, sus características y alcance,
fenómenos factibles de analizar y, finalmente, se aplica con el análisis e
interpretación correspondientes. Con ello se hace una aportación en la nueva
presentación del conocimiento, cuya transmisión resulta rápida y atractiva; en
ocasiones se ratifican o rectifican algunas interpretaciones superficiales o
radicales en cuanto a la bondad del método estadístico aplicado a la empresa y la
economía en general.
I. GENERALIDADES
Observan los estudiosos de esta ciencia que sus elementos básicos son:
Lógica e intuición, análisis y construcción, generalidad y particularidad.
Advierten que diversas actividades han destacado sus enfoques diferentes, y que
es únicamente el juego de estas fuerzas opuestas y la lucha por su síntesis lo que
constituye su teoría, su utilidad y el supremo valor de la ciencia matemática.
Sigificado de estadística
Al dar a conocer las definiciones que sobre ella existen, las estaremos
interpretando como la expresión de lo que se consideró en una fecha dada; lo que
era y para qué servía.
Así vemos que las definiciones que abarcan toda la segunda mitad del siglo XVIII
están enfocados a hacer de la Estadística una ciencia de información acorde con el
industrialismo que ya se gestaba en Inglaterra, y a la consolidación de los
Estados Europeos.
Con base en la doctrina del liberalismo y el surgimiento de nacionalismo
en la Europa continental, se fortalece el Estado cuyo poder se encuentra en
manos de esa clase social dinámica en sus orígenes llamada BURGUESIA, la que
diera impulso en general al estudio de las ciencias entre las cuales contamos la
Estadística.
Una vez terminadas las dos guerras mundiales, viene una paz que hace
posible que se logre un gran avance en la técnica de producción, en donde una vez
más surge la competencia entre las grandes corporaciones (monopolios), la que da
lugar a la búsqueda de nuevos métodos estadísticos que garanticen la producción
en masa y con el mínimo de defectivos (control estadístico de calidad). Hay otra
característica importante en esta segunda mitad del siglo XX; la liberación de una
gran cantidad de países que antes de la segunda guerra mundial eran "colonias",
y que, ahora como países independientes elaboran sus planes de desarrollo con
un conocimiento aceptable de la realidad en que se desenvuelven, gracias a la
aplicación de los métodos estadísticos en el estudio de sus economías.
1 10.334 "
2 9.756 "
3 9.339 "
4 8.357 "
5 7.364 "
6 7.401 "
7 6.531 "
Cada número expresa la edad de cada banco. Cuando los datos están
presentados en esta forma es difícil hacer observaciones; y se dice que estos
datos no están agrupados, que son simples o que pertenecen a una serie simple.
13 10 9 7 6 6
12 10 9 7 6 6
12 10 8 7 6 6
11 9 8 7 6 5
11 9 8 7 6 5
13 años 1
12 años 2
11 años 2
10 años 3
9 años 4
8 años 3
7 años 5
6 años 8
5 años 2
TOTAL 30
Amplitud 8
Amplitud de la clase = = =2
4
Número de clases que se desean
El número cuatro indica que se agruparon los datos en cuatro clases o grupos, y el
número dos expresa que cada clase tendrá una amplitud de dos unidades.
CLASES
(Grupos de edades)
F
De 5 a 7 15
De más de 7 a 9 7
De más de 9 a 11 5
De más de 11 a 13 3
Total 30
F=Frecuencia
Histograma
F
15
r
e 15
c
u 10 7
e 5
n 5 3
c
i 0
a 5 7 9 11 13
Clases (grupos de edades)
Intervalos de clase F Xi
De 5 a 7 15 6
De más de 7 a 9 7 8
De más de 9 a 11 5 10
De más de 11 a 13 3 12
Total 30
i= 1, 2, 3...n
Xi = marca de clase o punto medio.
Gráficamente tendremos
16
15
14
Frecuencias
12
10
8 7
6
5
4
3
2
0
5 61 7 82 9 10
3 11 12
4 13
Clases (grupos de edades)
Es interesante decir que autores como el Dr. Raúl Rojas Soriano(19), Croxton &
Cowden(2), entre otros, no cierran el Polígono de Frecuencias. Sin embargo, Yu
∗
Obsérvese que un punto medio es la suma de los límites inferior y superior de cada clase, la
cual se divide entre dos. También se le llama”punto medio de la clase o marca de clase”, que en
esencia es el valor representativo de cada clase.
1. Serie simple
2. Serie de frecuencia
3. Serie de clases y frecuencias
PASOS A SEGUIR
1. Se identifican el valor más grande y el más pequeño, que son: 96,500 - 11,169
2. Se calcula la amplitud: AM PLITUD = VALOR M AXIM O - VALOR
M INIM O
A = 96,500 - 11,169 = 85,331
PUNTOS MEDIOS
Intervalos de clase F PM
Total 50
Oscilación
Donde: i = i : Intervalo de clase
1 + 3.32 log(n )
n: Número de términos de la distribución
Oscilación
i=
1 + 3.32 log(n )
85,331
i= Oscilación = 96,500 - 11,169 = 85,331
1 + 3.32 log(50)
85,331 85,331
i= = = 12,929 ≈ 13, redondeando a miles
6.6
1 + 3.32 log(50)
de 11 a 24 6 17.5
de más de 24 a 37 7 30.5
de más de 37 a 50 11 43.5
de más de 50 a 63 6 56.5
de más de 63 a 76 6 69.5
de más de 76 a 89 8 82.5
de más de 89 a 102 6 95.5
Total 50
Frecuencia
Xi Acumulada
(fa)
menos de 24 6
menos de 37 13
menos de 50 24
menos de 63 30
menos de 76 36
menos de 89 44
menos de 102 50
OJIVA
60
50
F Acumulada
40
30
20
10
0
0 20 40 60 80 100 120
Clases
Serie Simple
3 13 8 5 14 10 5 6 14 18 6
1 10 13 14 2 10 11 6 19 9 3
10 9 2 9 6 14 10 10 6 5 11
17 6 17 13 8 18 19 9 8 17 5
11 9 11 13 9 8
X f(X)
1 1
2 2 5 Ls - Li = 19 - 1
3 2 19 - 1 = 18
18/5 = 3.6
5 4 10
6 6
8 4
9 6 20
10 6
11 4
13 4 8
14 4
17 3
18 2 7
19 2
50
∑ fx = 50
Con ello se puede construir una:
50 50/50*100 = 100
Frecuencias Relativas
15
10
0
1 2 3 4 5
1 2.8 4.6 6.4 8.2 10 11.8 13.6 15.4 17.2 19
Observación: La curva tiende a ser simétrica o normal aún con pocos datos. La
identificación de esta característica es muy importante, ya que permite aplicar
más métodos estadísticos al análisis de un mismo fenómeno económico, como se
verá posteriormente, haciendo o corroborando que la estadística es un apoyo
significativo para estudiar el comportamiento y caracterización de los fenómenos
económicos.
Los principales métodos usados para tal propósito son: Las de tendencia
central para medir la acumulación o concentración alrededor de cierto valor, y las
medidas de dispersión que sirven para medir la variación de los términos con
respecto a una medida de la tenencia central.
Entre las medidas de tendencia central encontramos que las más usadas
son la media aritmética, la media armónica, la media geométrica, la mediana y la
moda.
Se define como un valor medio tal, que si a cada término se le da ese valor,
resulta una suma igual a la de los valores de los términos de la sucesión dada.
Ejemplo (13) Sean los términos 1,5,2,9,7,8,5,3; como puede observarse
son términos no agrupados.
M ás generalmente:
x + x + x + x + x + ... + x = x1 + x 2 + x3 + ...xn
nx = x1 + x2 + ... + xn
n
∑ xi
Despejando la x , queda de la siguiente forma: x= i =1
x1 + x2 + x3 + ... + xn
x= donde i= 1,2,3,...,n
n
∑ xiF
x= i =1
N
Para una serie de clases y frecuencias:
∑ ( P . M.)F
i =1
x=
N
Demostración
∑ (xi − x ) = ∑ xi − ∑ x = ∑ xi − nx = nx − nx = 0
sean los términos 8, 3, 5, 10, 12.
Calculando su media X =
∑ xi = 38 = 7.6
n 5
Demostración.
∑ (xi − A) 2
= Q( X 1 , X 2 ,... X n ; A )
Tomando la derivada parcial de Q respecto a A se tiene:
∂Q
= −2∑ [( xi − A)] = − 2[∑ xi − nA];
∂A
1
∑ xi − nA = 0 → A = n ∑ xi = x
28
x= ∴ x = 56
.
5
= 4 + 1 + 1 + 9 + 4 = 19
Cuando A > x A = 6
Tenemos (3 - 6)2 + (4 - 6)2 + (6 - 6)2 + (7 - 6)2
= 9 + 4 + 0+ 1 = 18
Cuando A = x A = 5.6
(3-5.6)2 + (4-5.6)2 + (6-5.6)2 + (8-5.6)2 + (7-5.6)2 =
(-2.6)2+ (-1.6)2 + (0.4)2 + (2.4)2 + (1.4)2 =
6.76 + 2.56 + 0.16 + 5.76 + 1.96 = 17.20 l.q.q.d.
Demostración.
1
n∑
Como x = xi → nx = ∑ xi
nx = x1 + x 2 + ...+ x n
20
x= =4 n=5
5
Tendremos: 4(5) = 3 + 5 +6 + 4 + 2
20 = 20 1.q.q.d.
1. Su cálculo es sencillo.
2. Con su valor y el número de términos se puede calcular la suma de los valores
de los términos.
3. Puede calcularse conociendo solamente la suma y el número de los términos de
la serie.
1. Hay ocasiones en que un término que mide una modalidad anormal del
fenómeno influye en el promedio y puede ser que este no refleje la realidad.
2. Puede darse el caso de que el valor de la media para dos más series distintas
sea el mismo.
S erie S imple
x = A+
∑ ( xi − A ) x=
∑ xi
N N
X =A+
∑ Fi ( Xi − A ) x=
∑ Xifi
∑ fi ∑ fi
Con A = 3
30 87
X =3+ = 4.8 X= = 4.57
19 19
0 y menos de 2 1 1 -4 -4 1
2 y menos de 4 3 3 -2 -6 9
4 y menos de 6 5 5 0 0 25
6 y menos de 8 7 7 2 14 49
16 16 -4 4 84
X =A+
∑ Fi ( P * Mi − A ) x=
∑ ( fi * PMi )
∑ fi ∑ fi
Con A = 5
84
4 X= = 5.25
X =5+ = 5.25 16
16
Se define como el valor central que divide una distribución de modo que
quede de cada lado de ella un número igual de términos ordenados, éstos en
orden creciente ó decreciente.
N
−C
Md = Li + 2 ( i)
Fi
donde:
M d.=M ediana
M d. = 3
Xi Fi Fi
Acumulada
2 5 5
3 6 11
4 3 14
5 3 17
Total 17
∑ fi + 1
No. de orden o terminos =
2
17 + 1 18
No= = =9
2 2
1 y menos 2 5 10 0.07 5
3
3 y menos 4 2 8 -3.93 7
5
5 y menos 6 4 24 -1.93 11
7
7 y menos 8 4 32 -1.93 15
9
Total 15 74
74
x = = 4.93
15
Así, No= ∑
F + 1 15 + 1
= =8
2 2
7.5 − 7
Md . = 5 + ( 2)
4
Clase F Acumulado
Menos de 1 0
Menos de 3 5
Menos de 5 7
Menos de 7 11
Menos de 9 15
Ojiva
16
15
(9,15)
14
13
F
A 12 (7,11)
r
e c 11
u 10
c
m 9 (5.25,8)
u
u 8
e
l 7
n
a 6
c (5,7)
d 5
i
a 4
a
3 (3,5)
2
1
(1,0)
1 2 3 4 5 Md 6 7 8 9 10 11
Clases
M d = 5.25
Serie de frecuencias
X F
10 6
11 40
12 2
13 1
CLASES F
1 y menos de 3 5
3 y menos de 5 2
5 y menos de 7 4
7 y menos de 9 4
Total 15
Ejemplo:
Xi Fi
2 1
3 10
4 3
5 4
6 7
7 2
8 3
9 1
M o. = 3 M o. = 6 M o. = 8
En este caso se obtiene una situación multimodal, que, se reitera, en algunas
situaciones es útil conocerla.
RELACIÓN ENTRE LA MEDIA ARITMÉTICA,LA MODA Y LA MEDIANA
(7)
Por otra parte, si tomamos en cuenta la magnitud de cada error dentro del
criterio matemático, si denominamos a “e” como la cantidad del error sin
considerar su dirección o signo aritmético, y si deseamos minimizar la suma de
errores en que se incurre al estimar el valor de cada medición u observación, el
criterio matemático se expresa como Σe= mín, que solo la mediana lo
satisface. Lo anteror significa que si usaramos otra medida de tendencia central
para estimar cada estimación, la suma aritmética de los valores absolutos de los
errores sería mayor que la suma de los errores obtenidos cuando usamos la
mediana como estimador.
Ahora bien el tercer gran criterio que deben satisfacer los estimadores al
utilizarlos, es que la suma de errores al cuadrado sea un mínimo, que por
cierto, como ya vimos en páginas anteriores, solo lo satisface la media
aritmética; se representa por Σe 2 = mínimo, que es muy importante en el
análisis estadístico, en especial en el análisis de regresión ( relación de asociación
o de causalidad ), campo en el que se le conoce como el criterio de “mínimos
cuadrados” .
2 y menos de 4 2 3 -4 -8
4 y menos de 6 3 5 -2 -6
6 y menos de 8 5 7 0 0
8 y menos de 10 3 9 2 6
10 y menos de 12 2 11 4 8
Total 15 0
Verificación:
Si A = 7
∑ fi * ( P . M .− A)
X = A+
∑ fi
0
X = A+ = 7; X = 7
15
N
−C
Md . = L + 2 (i )
fi
15
−5
Md . = 6 + 2 (2 ) = 7
5
M d.=7
d1
Mo. = Li + ( i)
d1 + d 2
2
Mo.= 6 + ( 2) = 7
2+ 2
Mo. = Md . = x
histograma
X = Md. = Mo. = 7
Podemos concluir diciendo que la relación entre estas tres medidas de tendencia
central es indicativa de la dirección y extensión del alejamiento de los datos de la
distribución, de la simetría.
Definición: Es un valor tal, que multiplicado ese valor tantas veces como
el número de términos, resulta un producto igual al producto de los valores de los
términos de la serie dada.
Si los términos de la serie dada son: x1 , x 2 ,... x n , aplicando la propiedad
apuntada antes, resulta la expresión:
Despejando Mg = n x1 * x 2 * x3 *...*xn
Igualdad que nos dice: el promedio geométrico de una serie simple es igual
a la raíz que tiene como índice el número de términos, del producto de los valores
de los términos de la serie.
log( Mg) =
∑ log xi
n
Xi LogXi
1 0.00000
20 1.30103
7 0.84510
30 1.47712
18 1.25527
4.87852
Sustituyendo
Log M g = 4.87852/5 = 0.975704
Log M g = 0.975704
Antilog de 0.975704 = 9.0303
Luego M g. = 9.0303
log Mg =
∑ fi * log xi
∑ fi
Para una serie de clases y frecuencias :
log Mg =
∑ fi * log P .M .
∑ fi
Para fines prácticos es preferible calcular el logaritmo de la
media geométrica y luego el antilogaritmo de ésta.
Cálculo de M g
Xi Fi Log Xi Fi LogXi
12 3 1.0792 3.2375
10 6 1.0000 6.0000
15 9 1.1761 10.5848
20 12 1.3010 15.6124
22 7 1.3424 9.3970
37 44.8317
log Mg =
∑ fi * log xi
∑ fi
448313
.
log Mg = = 12116567
.
37
Antilog.de1.2116567=16.28
M g =16.28
Total 26 38.3023
log Mg =
∑ fi * log P .M .
∑ fi
383022
.
log Mg = = 14731615
.
26
M g.= 29.72
n = número de observaciones
xi = Observaciones i-ésima .
1
Xi Xi
1 1.0
2 0.5
3 0.3
4 0.3
5 0.2
15 2.28
2192
.
= 219
.
1
2192
.
= 1092
.
2
2192
.
= 0730
.
3
2192
.
= 0548
.
4
2192
.
= 0434
.
5
5=5 términos
SERIE DE FRECUENCIAS
Xi Fi 1/Xi Fi*(1/Xi)
3 1 0.33 0.33
4 2 0.25 0.50
2 3 0.50 1.50
5 4 0.20 0.80
Total 10 3.13
Ma =
∑ fi = ∑ fi
1 fi
∑ xi f ∑ xi
10
Ma = = 31948
.
313
.
CLASES Fi PM Fi/Pm
10 3.27
Ma =
∑ fi o ∑ fi
fi 1
∑ P .M . ∑ P .M . fi
10
Ma = = 3.08
3.24
0
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
0
2
X = Mo = Md
X < Md < Mo
SESGO NEGATIVO
PRÁCTICA I
Nombre:__________________________________________Grupo:_________
Problema 1. Construya usted una serie simple con los siguientes datos,
que representan la estatura de 20 estudiantes de la Facultad de Economía.
1.67, 1.72, 1.54, 1.57, 1.61, 1.61, 1.67, 1.54, 1.57, 1.72
1.85, 1.81, 1.54, 1.61, 1.81, 1.67, 1.81, 1.67, 1.61, 1.67
4 5 8 7 6 7 8 9 14 15
7 9 10 8 6 11 0 10 1 3
12 16 12 1 15 15 4 13 0 6
2 3 4 5 16 5 11 6 9 12
9 13 6 10 18 4 14 8 9 13
11 6 8 12 4 20 17 10 7 6
a) En base a estos datos, diga usted cuál es el número de hijos que se presentan
con mayor frecuencia en las familias campesinas y emita su opinión al respecto.
PRÁCTICA II
Problema 1. Los accidentes de trabajo ocurridos en 60 fábricas de la zona
industrial de Tlalnepantla en 1998, están dados en el siguiente cuadro.
0 a 4 3
5 a 9 6
10 a 14 15
15 a 19 12
20 a 24 10
25 a 29 9
30 a 34 5
60
a) Calcule usted la media aritmética, la media geométrica y la media armónica e
interprete cada uno de estos resultados, asimismo explique la relación que existe
entre ellas.
Miles de No. de
kilómetros llantas
de + 25 a 30 18
de + 30 a 35 12
de + 35 a 40 35
de + 40 a 45 20
de + 45 a 50 15
100
PRÁCTICA III.
PREGUNTAS
a) Ordene los datos anteriores en una serie de clases y frecuencias, de acuerdo al
método de Sturges.
'0-2 6
3-5 10
6-8 14
9-11 6
12-14 4
15-17 2
18-20 8
50
PREGUNTAS.
Ejemplo: datos: 2, 3, 4, 5, 6, 7, 8, 9
Rango = 9 - 2 = 7
D. M .=
∑ xi − x Serie simple
n
D. M .=
∑ fi xi − x Serie de frecuencias
∑ fi
D. M . =
∑ fi P .M .−x Serie de clases y frecuencias
∑ fi
Ejemplo: la temperatura en ciertos días del mes de mayo, expresada en
grados centígrados fué:
_
X1 | X1 - X |
22 2
23 1
23 1
24 0
25 1
26 2
27 3
170 10
170
x = = 24 o
7
D. M .=
∑ x1 − x
n
10
D. M . = = 142
. o
7
Primero se calcula X para después desviar con respecto a ella el valor de los
términos de la serie, en este caso las temperaturas observadas durante el mes de
mayo.
15
6
4
7
2
2
4
40
_ _
| X1 - X | Fi XiFi Fi | X1 - X |
3 5 120 15
2 4 102 6
2 2 46 4
1 7 168 7
0 8 200 2
1 2 52 2
2 2 54 4
30 742 40
x =
∑ x i fi D. M .=
∑ fi x − x
1
∑ fi ∑ fi
742 40
x = = 25 D. M . = = 133
. o
30 30
x =
∑ P . M. * f i
∑ fi
D. M . =
∑ fi P .M .−x
∑ fi
Temperatura en _
Intervalos Fi PM Fi PM | PM - X |
22 y menos de 24 5 23 115 -3
24 y menos de 26 9 25 225 -1
26 y menos de 28 10 27 270 1
28 y menos de 30 6 29 174 3
30 784 0
_
Fi | PM - X |
15
9
10
18
52
784 52
x = = 26o D. M . = = 173
. o
30 30
Xi δ a = Xi - X δa 2
1 -9 81
2 -8 64
5 -5 25
9 -1 1
11 1 1
13 3 9
14 4 16
25 15 225
80 0 422
X =
∑ x = 80 = 10
n 8
Xi Fi Xf δa δa 2 δa 2Fi
X =
∑ xifi = 201 = 287
.
∑ fi 70
σ=
∑ δ fi2
a
∑ fi
88.06
σ= = 11
.
70
σ =i
n(∑ δa F ) − ( ∑δaf )
2 2
= 0.5
85(169) − (33) 2
= 05
.
14365 − 1089
= 05
.
13276
= 05 . = 0.680
. * 136
n( n − 1) 85(85 − 1) 85(84) 7140
X =
∑ P . M. f
∑f
250.25
X =
85
X = 2.94
σ=
∑ ( P.M . − X ) fi = 39.38
2
∑ fi GENARO85SÁNCHEZ BARAJAS
PROFESOR: 61
LA ESTADÍSTICA APLICADA AL ANÁLISIS ECONÓMICO
II.3.2.4 VARIANZA
Se define como el cuadrado de la desviación estándar
σ 2
=
∑ ( Xi − X ) = ∑ xi
2 2
σ2=
∑ fi( Xi − X )
2
Se dice que cuando C.V. toma valores alrededor del 10% se acepta X
como medida central representativa de los datos de un fenómeno bajo estudio;
cuando C.V. es mayor a 10%, se debe optar por otra medida de tendencia central
para representar el promedio de los datos del fenómeno bajo estudio.
Ejercicios
obtenga:
Respuestas
Respuesta 2
−
X = Σ fi(PM i) / Σ fi = 668.4/50 = 13.368, redondeado a 13.36
Respuesta 3
−
3a. Primera propiedad: Σ ( PM i- x )fi = 0
− − − −
( PMi - x ) ( PMi - x )fi ( PMI − x )2 ( PMi − x )2 fi
9.7-13.36=-3.66 -3.66(7)= -25.62 13.3956 93.7692
11.1-13.36=-2.26 -2.26(5)=-11.30 5.1076 25.5380
12.5-13.36=-0.86 -0.86(11)=-9.46 0.7396 8.1323
13.9-13.36=0.54 0.54(10)= 5.40 0.2916 2.9160
15.3-13.36=1.94 1.94(12)=23.28 3.7636 45.1632
16.7-13.36=3.34 3.34(4)=13.36 11.1556 44.6224
18.1-13.36=4.74 4.74(1)=4.74 22.4676 22.4676
Total 0.00 242.6087
−
3b.- Segunda propiedad: Σ (PM i- x )2fi= M INIM O=242.6087
−
CV= σ / x *100 = 2.20/13.36*100 = 16.5%