ESTADISTICA DESCRIPTIVA
Docente:
2015-II
TEORIA
TEMAS A DESARROLLAR
Fabulacin y codificacin de los datos
continuos.
Estadgrafos de posicin media; mediana.
Estadgrafos de Dispersin: varianza,
Desviacin Standard, Coeficiente de
Variabilidad.
MEDIDAS ESTADSTICAS
En numerosas ocasiones, en
vez de trabajar con todos los
datos, es preferible disponer
de una o ms medidas
descriptivas que resumen los
datos de forma cuantitativa.
Las medidas descriptivas son
valores numricos calculados
a partir de la muestra y que
nos resumen la informacin
contenida en ella
CLASIFICACIN
MEDIDAS ESTADSTICAS
Medidas de Posicin
Medidas de Dispersin
Medidas de Forma
Medidas de Centralizacin
Media
Mediana
Moda
Cuantiles
Porcentiles
Cuartiles
Deciles
Varianza
Desviacin Tpica
Coeficiente de
Variabilidad
Coeficientes de
Asimetra
Coeficiente de
Concentracin
(ndice de Gini)
Apuntamiento o
Curtosis
MEDIDAS DE POSICIN
A continuacin
estudiaremos diferentes
parmetros estadsticos
que nos permitirn
conocer la tendencia
posicional de los datos.
Veremos en primer lugar
medidas de tendencia
central y posteriormente
otras medidas alusivas
igualmente a la posicin.
MEDIDAS DE CENTRALIZACIN
Llamadas as porque tratan de localizar el centro
de la distribucin de los datos.
Las principales medidas de centralizacin son:
a)
b)
c)
Media Aritmtica
Mediana.
Moda
a) MEDIA ARITMTICA( y )
Es el promedio del conjunto de datos, hay tres formas de
hallarlo.
I.- Datos No Agrupados:
y
y
n
, n Tamao de la muestra
Ejemplo:
13, 14, 17, 21, 24, y
13 14 .....24
5
y
i
Donde:
n i Frecuencia absoluta
y i Marca de clase
Ejemplo:
n Tamao de muestra
n i yi
Estimacin de la y para datos agrupados y
Limites
yi
ni
15.35
15.65
15.95
16.25
16.55
16.85
2
5
11
6
3
3
n i yi
y
n
i 1
6
y
i 1
n
30
c
ni Z i
Donde:
n Frecuencia absoluta
c Amplitud
O t Origen de trabajo, es una marca de clase que presenta mayor frecu e ncia
Zi C odificaci n
Si
Si
Ejemplo:
ny
y
i
Estaturas
(Limites)
yi
ni
1.525
-2
-4
1.575
12
-1
-12
1.625
42
1.675
36
36
1.725
25
50
[ 1.75 1.80]
1.775
Total
Ot
n=120
Zi
yi - O t
,
c
nizi
79
c 1.55 - 1.50 0
1.525 1.625
0.10
2
0.05
0.05
1.575 1.625
0.05
1
0.05
0.05
0
z1
z2
z3
1.675 1.625
0.05
1
0.05
0.05
2
z4
z5
z6 3
Mtodo Codificado:
c
y ot
n
n
i 1
zi
0.05
(79)
120
y 1.6579mts
y 1.625
Para
La
n1 y1 n 2 y 2 ............n k y k
n1 n 2 ........n k
K = cte.
- Si
yi x i k
y xk
- Si
y i kx i
y kx
- Si
xi
yi
k
x
y
k
y
i 1
y 0
desviacin : yi y
b) MEDIANA
Es aquel valor que divide en 2 partes iguales al conjunto de
datos, se halla de tres formas:
I.- Datos No Agrupados:
Se ordena ya sea en forma creciente y/o decreciente.
yn y n
Si
n par
Me
Si
n impar Me y n 1
2
2
n Tamao de la muestra
Ejemplo:
Si n es par sean los #: 10, 1, 2, 7, 6, 3, 4, 5,
Ordenando: 1, 2, 3, 4, 5, 6, 7, 10
y n/2 y n/21
Me
2
y 4 y5
45
Me
4.5
2
2
Si n es impar ; (n = 7) Impar.
Datos: 1, 2, 3, 4, 5, 6, 7.
Me y n 1 y 4 4
2
n
Si N J 1
2
n
Si N J -1
2
Me y J
y J -1 y J
Me
2
Ejemplo:
Si
yi
0
1
2
3
4
5
6
Si
ni
Ni
3
5
10
18
14
7
3
3
8
18
36
50
57
60
yi
ni
Ni
0
1
2
3
4
5
5
12
8
15
5
5
5
17
25
40
45
50
n 60
30
2 2
Com o
n
N j-1 Me y j
2
18 30 Me 3
n 50
25
2 2
n
Como N j-1 25
2
y j1 y j 2 3
Me
2.5
2
2
n/2 N J 1
Me L J C J
nJ
Donde:
Lj = Limite inferior de la clase mediana.
n = Numero total de observaciones.
Cj = Amplitud del intervalo de la clase mediana.
Nj-1 = Frecuencia absoluta acumulada hasta la clase
inmediata anterior a la clase mediana.
nj = Frecuencia absoluta de la clase mediana.
Propiedades de la Mediana
La
Si
yi x i k
Me y Me x k
y i kx i
Me y kMe x
xi
yi
k
Me x
Me y
k
c) MODA
Es aquel valor que se presenta c/mayor frecuencia, se halla
de dos formas:
I.- Datos No Agrupados:
Se escoge aquel valor que se repita ms.
Ejemplo:
4, 7, 8, 9, 9, 3, 6.
3, 3, 4, 5, 6, 7, 8, 8.
Mo = 9 (Unimodal)
Mo1 = 3, Mo2 = 8 (Bimodal)
d1
Mo L o C o
d1 d 2
Lo = Limite superior
Co = Amplitud de la clase modal.
d1 = Diferencia de la frecuencia absoluta
modal menos la anterior.
d2 = Diferencia de la frecuencia absoluta
modal menos la siguiente.
Ejemplo:
Limites
ni
Ni
[ 60 63 >
[ 63 66 >
[ 66 69 >
[ 69 72 >
[ 72 75 ]
5
18
42
27
8
5
23
65
92
100
d1
Mo L o C o
d1 d 2
24
24
Mo 66 3
66
24 15
29
Mo 67.84
d1 42 18
d 2 42 27
Propiedades de la Moda
Si
k = Constante
1. y i x i k
Mo y Mo x k
2. y i kx i
Mo y kMo x
xi
3. y i
k
Mo x
Mo y
k
MEDIDAS DE DISPERSIN
Las medidas de posicin central no
proporcionan,
en
general,
suficiente informacin para una
adecuada descripcin de los datos,
porque no toman en cuanta la
dispersin o concentracin de los
mismos, por lo tanto es claro que se
requieren otras medidas que
indiquen el grado de variabilidad
de los datos.
Estas medidas son necesarias para efectuar comparaciones significativas
entre grupos de observaciones. Cuando se mide la dispersin de los
valores de una variable respecto de unas de sus medidas de posicin, se
est midiendo el grado de representatividad que dicha medida de posicin
tiene en el conjunto de los datos a los cuales pretende resumir.
Varianza(S2)
Desviacin estndar o tpica(S).
Coeficiente de variabilidad(Cv)
Rango
a) Varianza ( S2 )
Mide la variabilidad absoluta de los datos y i, respecto a la
media
La varianza es una cantidad no negativa(S2 > 0 )
Si
n 30
n 30
n 60
S2n -1
y
i
Varianza Insesgada
n 1
2
y
S2n i
Varianza Sesgada
n
S2n -1 y/o
S2n son iguales
2
y
Donde:
y i Obsevacion es
y Promedio o media
n Tamao de muestra
Desarrollando:
2
y2
(n 30)
n i (y i - y)
Sy
n
i 1
2
Donde:
y i marca de clase
n i frecuencia absoluta
Desarrollando:
2
i
ni y
2
Sy n y (n 30)
2
yi O t
Zi
C
Donde:
yi = Marca de clase
Ot = origen de trabajo
C = amplitud de intervalo de clase Ls LI
c
V(v)
n
2
n z
2
i i
nz
i i
Propiedades de la Varianza
La
La
V(x c) V(x)
La
V(cx) c 2 V(x)
V(ax b) a 2 V(x)
c cte.
a y b ctes.
Ejemplo:
Sea xi = Variables de ingresos mensuales.
S2= 61.53
S =
S2
=7.84
c) Coeficiente de variabilidad(Cv)
S
Cv .100
y
Es
MEDIDAS DE FORMA
En otras ocasiones podemos estar interesados
sobre cuestiones de forma como la simetra de los
datos o su aplastamiento. La mayora de las
medidas de forma sern invariantes por cambio de
localizacin y de escala.
Coeficientes de Asimetra
Diremos que una distribucin es simtrica cuando
su mediana, su moda y su media aritmtica
coinciden.
Diremos que una distribucin es asimtrica a la
derecha si las frecuencias (absolutas o relativas)
descienden ms lentamente por la derecha que por
la izquierda.
Si las frecuencias descienden ms lentamente por
la izquierda que por la derecha diremos que la
distribucin es asimtrica a la izquierda.
CA2
3(x Me )
x Mo
CA1
x
CG
p q
i 1
n 1
p
i 1
Donde:
mediante la
Apuntamiento o Curtosis
Miden la mayor o menor cantidad de datos que se
agrupan en torno a la moda. Se definen 3 tipos de
distribuciones segn su grado de curtosis:
Distribucin Mesocrtica: presenta un grado de
concentracin medio alrededor de los valores centrales
de la variable (el mismo que presenta una distribucin
normal).
N
I