ANTONIO CAMPANA
Este
documento
ha
sido
elaborado
slo
con
fines
pedaggicos y su objetivo es
presentar algunos de los temas
esenciales que se ofrecen en el
Curso
403:
Metodologa
estadstica.
CELADE - SI-':.;/'.'
D o c I'/. .: :
SO G R
DOOPAL
i A c 1o w
P ;.;S u A C S O i.;
A M E R IC A
L A T IN A
EN
principales
conceptos
tcnicas
la
relacin
entre
la
estadsticas -v^ara
la
Asimismo, se h a r ^ i n c a p i en
estadstica
Issr
ciencias
ESTADISTICA DESCRIPTIVA
puesto que
la tendencia a
LA MEDIA ARITMETICA
La media aritmtica -o, simplemente, la media- de un conjunto
de N mmeros X^, Xg, Xj, ...., X, se indica con el smbolo X y se
define como:
hJ
X, + X 2 + ... + X
. 2 X,
L-
X =
N
en
la que
X, representa
segundo valor de
el primer valor
de
la variable,
la variable y as sucesivamente,
siendo X el
ltimo valor.
Xj el
X-73
X-70
81
-1
8
2
11
86
13
16
69
-4
-1
57
-16
-13
72
0
2 .
15
(X-73)^
(X-70)^
72
81
64
121
86
169
256
69
16
57
256
169
506
551
la distribucin de
frecuencia resultante.
Al
estuvieran concentrados
respectivos.
en
sus
intervalos
S f,m,.
X =
t-i
Ejemplo 1:
Lmites fijados
fi
firn,
1950 - 2950
2450
17
41650
2950 - 3950
3450
26
89700
3950 - 4950
4450
38
169100
4950 - 5950
5450
51
277950
5950 - 6950
6450
36
232200
6950 - 7950
7450
21
156450
189
967050
967050
X =
= 5117
189
X = X' +
iF i
N
donde
d, = X, - X'
Escogemos 5450 como punto medio de un intervalo, puesto qe la
media debera ser un poco menor.
Ejemplo 2:
fijados
f,d,
fi
1950
2950
2450
17
-3000
-51000
2950
3950
3450
26
-52000
3950
4950
4450
38
4950
5950
5450
51
5950
6950
6450
36
7950
8950
7450
21
-2000
-1000
0
1000
2000
-38000
0
36000
42000
-63000
189
(-63000)
= 5450 - 333
X = 5450 +
5117
189
LA MEDIANA
La mediana de un conjunto de nmeros ordenados en relacin a
su magnitud es el valor medio o la media aritmtica de los dos
valores medios.
Por ejemplo, para el conjunto de nmeros 3, 4, 4, 5, 6 , 8 , 8 ,
N/2 Md = L
donde
X 1
Md
numero de casos
Para
obtener
el
clculo
de
la
media
aritmtica
de
datos
de
$5950,
la mediana
ha
de
quedar
en
algn
f,-
1950
2950
17
17
2950
3950
26
43
3950
4950
38
81
4950
5950
51
132
5950
6950
36
168
7950
8950
21
189
189
94.5 - 81
Md
4950 +
X 1000
51
lugar
del
1000
4950 + 13.5
51
4950 + 265
=
Asimismo,
agrupados
se
hay
puede
que
$ 5215
tener
obtener
presente
restando
que
la mediana
cierta
cantidad
de datos
al
lmite
F - N/2
Md = L
+ ----------- X i
f
5950 +
1000
51
$5215
EL MODO
El modo de un conjunto de nmeros se define como aquel valor
que ocurre ms frecuentemente; es decir, el valor ms comn. Puede
ocurrir que un conjunto de nmeros no tenga modo o que ste no sea
nico.
10
Por ejemplo,
(i)
(ii)
(iii)
el
idnticos.
Aquellas
series
de
nmeros
que
slo
cuenten
con
un
modo
LA MEDIA GEOMETRICA
La media geomtrica,
V,
X2X3X4____ X
G = l{2) (4) (8 )
11
LA MEDIA ARMONICA
La media
Xj,...,
armnica,
H,
Xj,
los nmeros.
N
H =
S
X
Por ejemplo, la media
H ------------1
_
1
+
----- 3.43.
1
_
7
_
estndar.
EL RANGO
El rango de un conjunto de datos se define como la diferencia
entre el nmero mayor y el menor.
hayan agrupado,
la diferencia entre
los
12
Por ejemplo:
(i)
(ii)
500
9500
pues el
LA DESVIACION MEDIA
La desviacin media de un conjunto de datos se define como la
media aritmtica de las diferencias absolutas de cada valor de la
variable con respecto a la media.
iJ
.s
Es decir:
Desviacin Media =
ix,-x|
l- L
Por ejemplo:
La media de
los nmeros
72,
81,
8 6 , 69 y 57 es 73.
Para
13
7 2 - 7 3 + I 8 1 - 7 3 I + |8 6 - 7 3 + 6 9 - 7 3 | + 5 7 - 7 3 |
Desviacin Media =
1 + 8 + 13 + 4 + 16
42
=
Podemos,
difieren
por consiguiente,
8.4
LA DESVIACION ESTANDAR
La desviacin estndar es la ms til y frecuente medida de
dispersin. Se define como la raz cuadrada de la media aritmtica
de las desviaciones cuadradas con respecto a la media.
-S
Es decir:
s =
(X,. - X)'
C'l
donde:
(X,- - X)^ =
s = desviacin estndar
14
Por ejemplo:
X,
(X, - X)
72
-1
81
64
86
13
169
69
-4
16
57
-16
256
X=73
506
(Xi -
s = \ 5 0 6 / 5 = VlOl.2 = 10.06
fi 2
^
2
N E X, - (S X,)"
s =
N
c-i
c=l
Por ejemplo:
X,
X,
72
5184
81
6561
86
7396
69
4761
57
3249
365
27151
15
2
Varianza
(X,
c'l
X)'
-a-
la desviacin
. Por lo tanto,
estndar de una
la varianza de una
se
define
principalmente,
como
que
(N-1)
el
en
valor
vez
de
obtenido
N.
Esto
representa
se
debe,
mejor
la
existe
diferencia
entre
ambas
definiciones.
En
el
caso
que
16
Puntos medios
fi
d'i
f|d'i
f,d',
1950 - 2950
2450
17
-3
-51
153
2950 - 3950
3450
26
-2
-52
104
3950 - 4950
4450
38
-1
-38
38
4950 - 5950
5450
51
5950 - 6950
6450
36
36
36
6950 - 7950
7450
21
42
84
-63
415
189
K.
IC
s =
N
C--1
L -1
1000
s =
189(415) - (-63)'
189
s = 5.291
S = 5.291
y ? 8 4 3 5 - 3969
04466
s = 5.291 (272.885)
s = 1443.84 = 1444
17
de la estadstica descriptiva,
dado que,
en primer
constante
(o proporcin
de
casos)
entre
la
media
una
colocarse
izquierda)
de
la
en
una
media,
desviacin
estndar
encontraremos
siempre
la
derecha
.3413
del
(o
rea
veces
dicha
rea,
.6826,
estar
incluida
entre
las
dos
aunque la
curva
en
ambas
la
curva
normal
direcciones.
se
Es
extienda
importante
tericamente
tener
al
presente
infinito
que
aunque
18
es
que
resulta
posible
tomar
cualquier
curva
normal
X - X
z =
donde
Por ejemplo:
Supongamos que tenemos una curva normal con una media de 50 y
una desviacin estndar de 10. Se desea obtener la proporcin de
casos que se encuentran en el
intervalo
50 a 65.
Para ello se
= 1.5
10
19
ESTADISTICA INDUCTIVA
l.~ Introduccin a la estadstica inductiva
Uno
de
los
comprensin de
entre
las
muestra,
aspectos
que
la estadstica
caractersticas
reviste
gran
inductiva es
propias
de
una
importancia
aquel
en
la
que distingue
poblacin
de
una
De
en cambio,
estadsticos.
As,
las caractersticas
en
adelante
se
de
designar
la muestra,
la
media
como
de
la
cualquiera.
herramienta
de
La
muestra
conveniencia
se
sin
debe
comprender
importancia
en
como
una
misma.
Las
expuesto
Blalock
en
su
libro
Estadstica
Social:
"En
las
estadsticas
especficas
si
dichos
supuestos
fueran
parmetros
Caracterstica de la muestra:
estadsticos
Media de la poblacin:
Media de la muestra:
20
y una varianza
otras
palabras,
respectivas medias X.
variar
con
respecto
alrededor de
se
obtienen
varias
muestras
con
sus
resto,
pero
en
general
se
agruparn
El teorema,
referirnos
las pruebas
estadsticas,
es ms
bien
la
las
desviaciones
estndar
de
las
tres
clases
de
Media
Poblacin
Muestra
fx
El
teorema
del
lmite
central
Desviacin estndar
a/
pone
de
manifiesto
que,
puede tenerse ms
21
la distribucin de
se
de
muestras
de
una
poblacin
cuya
media
desviacin
a f^ .
3.- Estimacin de intervalo
El procedimiento efectivo empleado para obtener una estimacin
de intervalo o,
confianza, es el siguiente:
Primero
de
error
que
se
est
En el
Esto
confianza de
se
obtiene
del
punto
apartndose
cierto
en
ambas
mltiplo
de
direcciones
errores
de
la
estndar
22
X 1.96
= X 1.96 ---
\jW
en donde 1.96 corresponde a la regin crtica de la curva normal,
usando el nivel de confianza equivalente a 95% y una prueba de dos
colas. Si X=15, a=5 y N=100, el intervalo de confianza sera;
15 1.96 ---
= 15 0.98
Vioo
en otros trminos el intervalo ira de 14.02 a 15.98. Por lo tanto,
sabemos
que
slo
un
5%
de
las
veces
obtendremos
con
este
El 95%
restante de
de una
muestra
lo
las veces
el procedimiento
suficientemente
cercanas
al
para
que
los
escoge un nivel
de
confianza mayor,
existe ms
certeza
Si se
que
el
Tamao de la muestra:
Para tener un intervalo corto y que al mismo tiempo tenga un
nivel alto de confianza se tendr que aumentar el tamao de la
muestra. Tomando un ejemplo sencillo para facilitar la comprensin,
tenemos
que
se
desea
confianza de 95%.
calcular
Dado que
el
la
longitud
de
un
intervalo
intervalo es X 1.96
a / '/,
de
la
23
2(1.96)120
60 =
v/n
2(1.96)120
\/
--------------- 7.84
60
n = 61.47 = 62.
La distribucin t:
En
la mayor
parte
varianza se desconoce,
de
las
investigaciones
el
valor
de
la
24
Intervalo de confianza para la inedia usando la distribucin t:
Cuando la desviacin estndar se estima de
intervalo de confianza para n,
la muestra,
un
normales.
Al
conocer
a,
el
intervalo
de
confianza
d.f.= 16
142.8
311.9 2.120
\/6
311.9 2.120(35.7)
311.9 75.7
236.2 a 387.6 gramos
25
Este intervalo de confianza debe interpretarse de la siguiente
manera:
de
tamao
17-
usando siempre
la
la misma
normales,
el
forma
que
se
efectu
equivalentes
distribucin
t.
95%
99%
mediante
De esta manera
el
podemos
con
las
distribuciones
intervalos de confianza
uso
de
la
estimar
tabla
de
la
la media
de
la
si -t 95 y t 95 son
los valores
de t para
los
X-n
-t .95
por
lo
que
\n-l
se puede estimar
<
t .95
que /i se ubicara
en el
siguiente
intervalo:
s
X - t 95
s
<
< X + t 9 5 -----
^ -1
\ n-l
general,
podemos
representar
limites
de
confianza
para
26
s
X t.
>/n-l
donde
los
valores
t^,
definidos
como
valores
crticos
el
nmero k
de parmetros
independientes en la muestra
de
la
poblacin
que
Es decir:
V = N - K
se
deben
27
BIBLIOGRAFIA
Blalock
Jr.,
Hubert
M . , Estadstica
social. Fondo
de
Cultura
Wilfred
J.
Y Massey
Frank J . , Introduccin
al
anlisis
1977.