Anda di halaman 1dari 25

Estadstica Descriptiva

TEMA 3: MEDIDAS
ESTADSTICAS
3.0-PROPIEDADES DE YULE
Propiedades de Yule: Propiedades deseables de una medida
de tendencia central.
1) Definida objetivamente a partir de los datos de la
serie.
2) Que dependa de todas las observaciones.
3) De significado sencillo y fcil de entender.
4) De clculo rpido y fcil.
5) Poco sensible a las fluctuaciones del muestreo(valor
parecido al de la poblacin)
6) Adecuado a clculos algebraicos posteriores.
Mediana: La Mediana de la variable estadstica X se
define como el valor que verifica: Me = X
i
F
i
= 0,5
Si n (nmero de observaciones) es impar:
Me =

Si n es par:
Me =
Ejemplo:
2, 4, 6, 7, 8, 10, 10, 11 n = 8 (par)
Me = (7+8)/2 = 7,5
2
X X
1 (n/2) n/2 +
+
2
1 n
X
+
3.1-MEDIDAS DE TENDENCIA CENTRAL
Observacin
Posicin
Importante: Las observaciones deben estar ordenadas
cuantitativamente.
La Mediana cuando X viene en una tabla de frecuencias
agrupadas en intervalos:
I
i
= (e
i-1
, e
i
] F
i-1
< 0,5 < F
i



Ejemplo:


i
i
1 i
1 i
a
f
F 05
e Me -

+ =

i
i
1 i
1 i
a
n
N
2
n
e Me -

+ =

Intervalo ni Ni
(0,2] 5 5
(2,5] 10 15
(5,10] 15 30
15 n/2 = 30/2 = 15 30
Intervalo Mediano: (5,10]
Me = 5 + ((15 - 15)/15) * 5 = 5
3.1-MEDIDAS DE TENDENCIA CENTRAL
n/2
n = Nmero total de observaciones
Intervalo
mediano
3.1-MEDIDAS DE TENDENCIA CENTRAL
Propiedades de la Mediana:
(1) Cumple las condiciones 1, 3, 4, 5 de Yule.
(2) Distancia absoluta o media al valor a.
d
absoluta
(a) =

d
abs
(Me) d
abs
(a) , a e R

-
n
i
i i
f a x
Moda: La Moda de la variable estadstica X se define
como aquel/llos valores ms frecuentes.
Mo = x
i
/ n
i
= max n
j
f
i
= max f
j

j=1-->k
En Tabla de Frecuencias sin agrupar: Comparar las
frecuencias de cada modalidad , la que tenga mayor
frecuencia ser la Moda de nuestra variable estadstica.
En Tabla de Frecuencias agrupadas en Intervalos:
Intervalo Modal--> I
i
= (e
i-1
, e
i
] h
i
= max h
j
j = 1,,k
o
1
= h
i
-h
i-1

o
2
= h
i
-h
i+1

i
2 1
1
1 i
a


e Mo -
+
+ =

3.1-MEDIDAS DE TENDENCIA CENTRAL
Propiedades de la Moda:
(1) Cumple las propiedades 1, 3 y 4 de
Yule.
(2) Si hay dos modas = Bimodal
Si hay tres modas = Trimodal
...
Media Aritmtica: La media aritmtica o media de la
variable estadstica X es:
x = (x
1
+ + x
n
) / n
x = (x
1
* n
1
++ x
k
* n
k
) / n
x = x
1
* f
1
++ x
k
* f
k

Propiedades de la Media Aritmtica:
(1) Cumple las Propiedades 1, 2, 3, 4, 6 de Yule.
(2)
(3) Distancia Cuadrtica(a) =

(4) y = a*x + b a, b e R x : x
1
,, x
k
y : y
1
= a*x
1
+ b ,..., y
k
= a*x
k
+ b
(5) Z = a*X + b*Y z = a*x + b*y X, Y, a, b e R
( )

=
-
n
1 i
i i
f x x
( )

=
-
n
1 i
i
2
i
f x a

3.1-MEDIDAS DE TENDENCIA CENTRAL


k =
modalidades
diferentes
Relacin entre Media Aritmtica, Mediana y
Moda:

3 ( x - Me ) ~ ( x - Mo )
Media Geomtrica: La Media Geomtrica (G) de una
variable estadstica X, positiva, se define como:

Media Armnica: La Media Armnica (H) de una variable
estadstica X, positiva, se define como:

Media Cuadrtica: La Media Cuadrtica (Q) de una variable
estadstica X, positiva, se define como:


n
nk
k
2 n
2
1 n
1
x x x G =

=

=
k
1 i
i
i
n
x
1
n
H
n
n x
Q
k
1 i
i
2
i
=

=
3.1-MEDIDAS DE TENDENCIA CENTRAL
Comparacin de las diversas Medias:

H G X Q
3.2-CARACTERSTICAS DE DISPERSIN
Desviacin Absoluta Media
La desviacin absoluta media con respecto a la Mediana (Me),
se define como:


La desviacin absoluta media con respecto a la Media (x), se
define como:


D
Me
D
x

=
- =
k
1 i
i i Me
f Me x D

=
- =
k
1 i
i i X
f x x D
Varianza: La Varianza de X, se define como:
S
2
= o
2
= var(X) =

Desviacin Tpica: La desviacin Tpica de X, se define
como:
S = o = + s
2
0
Se vuelve a la misma unidad de la variable original.
Cuasivarianza: La Cuasivarianza de X, se define como:


Cuasivarianza Tpica: Sc = +S
2
c
( )

=
-
k
1 i
i
2
i
f x x
( )
1 n
x x
Sc
k
1 i
2
i
2

=
3.2-CARACTERSTICAS DE DISPERSIN
Relacin entre estas
Dispersiones:
n*S
2
= (n-1)*S
2
c
3.2-CARACTERSTICAS DE DISPERSIN
Coeficiente de Variacin de Pearson
El Coeficiente de Variacin de Pearson de la variable
estadstica X, se define como:

|x| es muy pequea
Si x = 0 no se usara el CV
x


CV
x
no cambia si utilizamos escalas distintas.
Para averiguar o comparar donde hay ms o menos variacin de
varias variables estadsticas podemos utilizar cual es su CV
x
,

ya que
las escalas pueden ser diferentes( no tiene unidad de Medida, es
adimensional).

x
S
CV
x
=
3.2-CARACTERSTICAS DE DISPERSIN
Cuantiles
Se define el Cuantil de orden (0 < < 1), como la
proporcin igual o mayor de observaciones que .

Casos Particulares:
Cuartiles: Q
1
= X
0,25
, Q
2
= X
0,50
, Q
3
= X
0,75
Deciles: D
1
= X
0,1
, D
2
= X
0,2
,, D
9
= X
0,9
Percentiles: P
1
= X
0,01
, P
2
= X
0,02
,, D
99
= X
0,99

Fx
X

=
3.2-CARACTERSTICAS DE DISPERSIN
Clculo de los cuantiles X


X no agrupada en Intervalos:

1) = F
i
X

= ( x
i
+ x
i+1
) / 2
2) F
i-1
<

< F
i
x

= x
i
X agrupada en Intervalos:
F
i-1


F
i
(e
i-1
, e
i
] X
a


i
i
1 i
1 i
a
f
F
e x -

+ =

3.2-CARACTERSTICAS DE DISPERSIN
Recorrido Intercuartlico
El Intervalo Intercuartlico de X, se define como:
[ Q
1
, Q
3
]
( 50 % de las observaciones ms centradas)
El rango Intercuartlico de X, se define como:
IQR = Q
3
- Q
1

El rango o recorrido de X, se define como:
Rg(X) = Max x
i
- Min x
i

Momentos
El Momento de Orden r respecto a c se define como:

Momentos no Centrales(c=0):

Momentos Centrales de orden r (c=x):

( )

=
- =
k
1 i
i
r
i r
f c x (c) m

=
- = =
k
1 i
i
r
i r r
f x (0) m (c) m
( )

=
- =
k
1 i
i
r
i r
f x x
3.2-CARACTERSTICAS DE DISPERSIN
Propiedades
(1)
(2)
(3)
1 1, m
0 0
= =
0 , x m (0) m
1 1 1
= = =
2
2
2
2
2
2
2
x m , x m = = + =
3.2-CARACTERSTICAS DE DISPERSIN
Indice de Diversidad
El Indice de Diversidad de X trata la dispersin en variables
nominales y se define como:

Donde H es:

log(n)
H
H
H
J
max
= =

=
- =
k
1 i
i i
) log(f f H
n = Nmero total de observaciones
Teora de la
Informacin
(SHANNON-1948)
Propiedades
(1)
(2)
(3)
(4)

(5)
(6)
0 H>
log(n) Hs
Mxima Diversidad log(n) H =

s s
Max Min
Diversidad
1 J 0
_X _Mxima_en Diversidad 1 J =
_X _Mnima_en Diversidad 0 J =
3.3-CARACTERSTICAS DE FORMA
Coeficientes de Asimetra
Coeficiente de Simetra de PEARSON de X:


Si: A
s
= 0 Situacin de Simetra
A
s
> 0 Situacin de Simetra a la Derecha
A
S
< 0 Situacin de Asimetra a la Izquierda

Medida Adimensional(Sin Medida)

S
Mo x
A
s

=
3.3-CARACTERSTICAS DE FORMA
Coeficiente de Simetra de FISHER de X:




Si:

= 0 Situacin de Simetra


> 0 Situacin de Simetra a la Derecha


< 0 Situacin de Asimetra a la Izquierda

Medida Adimensional(Sin Medida)
( )

=
- - = =
k
1 i
i
3
i
3 3
3
1
f x X
S
1
S

3.3-CARACTERSTICAS DE FORMA
Coeficiente de Curtosis
El Coeficiente de Curtosis de Fisher de la Variable
Estadstica X se define como:

Interpretacin:
= 0 > 0 < 0

Mesocrtica Leptocrtica Platicrtica

( )

=
- - =
k
1 i
i
4
i
4
2
3 f x x
S
1

3.4-CARACTERSTICAS DE CONCENTRACIN
Medidas de Concentracin
Las Medidas de Concentracin ponen de relieve el mayor
o menor grado de igualdad en el reparto de la suma total
de los valores de la variable.
Suelen ser variables de tipo econmico: Produccin,
Salarios, Ventas, ...
3.4-CARACTERSTICAS DE CONCENTRACIN
Curva de Lorentz
La Curva de Lorentz es la poligonal que une los puntos
(q
i
,P
i
), i = 0, , k , donde P
0
= 0 , q
0
= 0
s
i
: Es la suma de todas las observaciones que caen en el intervalo i-simo.
s
i
= x
i
* n
i
para (e
i-1
,e
i
]
S
i
: Acumulacin del nmero de observaciones entre intervalos.
S
i
= s
1
+ + s
i

P
i
: Porcentaje P
i
= F
i
* 100
q
i
: Porcentaje de la suma total que hay menores o iguales que el extremo
superior del intervalo.
100
s
s
q
k
i
i
- =
i i i
, q P >
3.4-CARACTERSTICAS DE CONCENTRACIN
Ejemplo(Curva de Lorentz):
X = Salario en miles de pesetas

X ni Fi Pi si Si qi
[0,250] 4 0,8 80 0 0 0
(250,500] 0 0,8 80 0 0 0
(500,750] 1 1 100 750 750 100
(0,0)
(0,80)
(100,100)
q
i

P
i

Concentracin
Mxima(debido a
que la curva de
Lorentz esta
bastante alejada
de la recta que
une los puntos
extremos)
Indice de GINI
El Indice de Gini se define como el rea encerrada entre la
bisectriz y la Curva de Lorentz, dividida por la mitad del rea
del cuadrado [0,100] x [0,100]:
2
100
a_Lorentz ado_y_Curv imer_cuadr riz_del_pr _la_Bisect rea_entre
I
2
e
G
=
( )
2
k
1 i
i 1 i i 1 i
e
G
100
P q q P
I

=

- -
=
3.4-CARACTERSTICAS DE CONCENTRACIN
Interpretacin


Concentracin Mxima
Concentracin Mnima
1 I 0
e
G
s s
1 I
e
G
~
0 I
e
G
~
3.4-CARACTERSTICAS DE CONCENTRACIN
Mediala
La Mediala de una variable estadstica positiva es el valor:
Ml = x
i
/ q
i
= 50
i 1 i
i
1 i i
1 i
1 i
q 50 q
a
q q
q 50
e Ml
s s
-

+ =

La Mediala slo se puede utilizar en variables


acumuladas en intervalos, ya que para las no
acumuladas utilizamos la Mediana.
Ml Me s
FIN
Jos Antonio Cortegana Camez 2001-2002

Anda mungkin juga menyukai