Anda di halaman 1dari 45

ESTADISTICA

DESCRIPTIVA
Docente:
Mercedes Aida Osorio Maza
mosorio@uni.edu.pe
SEMANA 2
2014 - II
TEORIA
TEMAS A DESARROLLAR
Fabulacin y codificacin de los datos
continuos.
Estadgrafos de posicin media; mediana.
Estadgrafos de Dispersin: varianza,
Desviacin Standard, Coeficiente de
Variabilidad.

MEDIDAS ESTADSTICAS
En numerosas ocasiones, en
vez de trabajar con todos
los datos, es preferible
disponer de una o ms
medidas descriptivas que
resumen los datos de forma
cuantitativa.
Las medidas descriptivas
son valores numricos
calculados a partir de la
muestra y que nos resumen
la informacin contenida en
ella
CLASIFICACIN
MEDIDAS ESTADSTICAS
Medidas de Posicin Medidas de Dispersin Medidas de Forma

Media
Mediana
Moda


Varianza
Desviacin Tpica
Coeficiente de
Variabilidad


Coeficientes de
Asimetra
Coeficiente de
Concentracin
(ndice de Gini)
Apuntamiento o
Curtosis

Medidas de Centralizacin
Otras Medidas de Posicin

Cuantiles
Porcentiles
Cuartiles
Deciles

MEDIDAS DE POSICIN
A continuacin
estudiaremos diferentes
parmetros estadsticos
que nos permitirn
conocer la tendencia
posicional de los datos.
Veremos en primer lugar
medidas de tendencia
central y posteriormente
otras medidas alusivas
igualmente a la posicin.
MEDIDAS DE CENTRALIZACIN
Llamadas as porque tratan de localizar el centro
de la distribucin de los datos.
Las principales medidas de centralizacin son:

a) Media Aritmtica
b) Mediana.
c) Moda
a) MEDIA ARITMTICA( )
y
Es el promedio del conjunto de datos, hay tres formas de
hallarlo.
I.- Datos No Agrupados:
muestra la de Tamao n ,
n
y
y
i
= =

Ejemplo:
5
.....24 14 13
y 24, 21, 17, 14, 13,
+ +
=
II.- Datos Agrupados en Tablas de Frecuencias:
n
y n
y
i i
=
Donde:
muestra de Tamao n
clase de Marca y
absoluta Frecuencia n
i
i
=
=
=
Ejemplo:
|
.
|

\
|
=

n
y n
y agrupados datos para y la de Estimacin
i i
Limites y
i
n
i

[ 15.2 115.5 >
[ 15.5 15.8 >
[ 15.8 16.1 >
[ 16.1 16.4 >
[ 16.4 16.7 >
[ 16.7 17.0 ]
15.35
15.65
15.95
16.25
16.55
16.85
2
5
11
6
3
3
30
.85) ......3(16 5(15.65) 2(15.35)
n
y n
y
n
y n
y
6
1 i
i i
k
1 i
i i
+ +
= =
=


=
=
III.- Mtodo Codificado:

+ =
i i t
Z n
n
c
O y
Donde:
n odificaci C Z
ncia e frecu mayor presenta que clase de marca una es trabajo, de Origen O
Amplitud c
absoluta Frecuencia n
i
t
=
=
=
=
Reglas para elegir O
t
(origen de trabajo)
Tomamos O
t
a una de las marcas de clase y
i
.
Si el numero de intervalos es impar O
t
es la marca de clase del intervalo
central.
Si el nmero de intervalos es par, O
t
es la marca de uno de los 2
intervalos centrales, prefiriendo el intervalo al cual le corresponde mayor
frecuencia.
Ejemplo:
Hallar la media aritmtica por el mtodo codificado
n
y n
y
i i
=
Estaturas
(Limites)
y
i
N
i
n
i
z
i

[ 1.50 1.55 >
[ 1.55 1.60 >
[ 1.60 1.65 >
[ 1.65 1.70 >
[ 1.70 1.75 >
[ 1.75 1.80]
1.525
1.575
1.625
1.675
1.725
1.775
2
12
42
36
25
3
-2
-1
0
1
2
3
-4
-12
0
36
50
9
Total n=120 79
,
c
O - y
Z
t i
i
=
t
O
3 z
2 z
1
05 . 0
05 . 0
05 . 0
625 . 1 675 . 1
z
0 z
1
05 . 0
05 . 0
05 . 0
625 . 1 575 . 1
z
2
05 . 0
10 . 0
05 . 0
625 . 1 525 . 1
z
0 1.50 - 1.55 c
6
5
4
3
2
1
=
=
= =

=
=
=

=
=

=
= =
Mtodo Codificado:
1.6579mts y
(79)
120
0.05
1.625 y
z n
n
c
o y
k
1 i
i i t
=
+ =
+ =

=
Propiedades de la Media Aritmtica
Si se tiene 2 o ms sub poblaciones de tamao n
1
y n
2
,
entonces la media total se calcula:
Para K = cte.

La suma de las desviaciones respecto al promedio es cero
k 2 1
k k 2 2 1 1
........n n n
y ..n .......... y n y n
y
+ +
+ +
=
k
x
y
k
x
y Si -
x k y kx y Si -
k x y k x y Si -
i
i
i i
i i
= =
= =
= =
( ) ( ) y yi : desviacin 0 y y
n
1 i
i
=

=
b) MEDIANA
Es aquel valor que divide en 2 partes iguales al conjunto de
datos, se halla de tres formas:

I.- Datos No Agrupados:
Se ordena ya sea en forma creciente y/o decreciente.
y Me impar n Si
muestra la de Tamao n
2
y y
Me par n Si
2
1 n
1
2
n
2
n
+
+
= =
=
+
= =
Ejemplo:
Si n es par sean los #: 10, 1, 2, 7, 6, 3, 4, 5,
Ordenando: 1, 2, 3, 4, 5, 6, 7, 10
4.5
2
5 4
2
y y
Me
2
y y
Me
5 4
1 n/2 n/2
=
+
=
+
=
+
=
+
Si n es impar ; (n = 7) Impar.
Datos: 1, 2, 3, 4, 5, 6, 7.
4 y y Me
4
2
1 n
= = =
+
II.- Datos Agrupados:
Tabla de frecuencias con variable cuantitativa discreta
2
y y
Me
2
n
N Si
y Me
2
n
N Si
J 1 - J
1 - J
J 1 J
+
= =
= <

Ejemplo:
Si
Si
y
i
n
i
N
i

0
1
2
3
4
5
6
3
5
10
18
14
7
3
3
8
18
36
50
57
60
3 Me 30 18
y Me
2
n
N
Como
30
2
60
2
n
j 1 - j
= <
= <
= =
y
i
n
i
N
i

0
1
2
3
4
5
5
12
8
15
5
5
5
17
25
40
45
50
2.5
2
3 2
2
y y
Me
2
25 N Como
25
2
50
2
j 1 j
1 - j
=
+
=
+
=
= =
= =

n
n
III.- Tabla de Frecuencias con Variable Cuantitativa Continua
(


+ =

J
1 J
J J
n
N n/2
C L Me
Donde:
L
j
= Limite inferior de la clase mediana.
n = Numero total de observaciones.
C
j
= Amplitud del intervalo de la clase mediana.
N
j-1
= Frecuencia absoluta acumulada hasta la clase
inmediata anterior a la clase mediana.
n
j
= Frecuencia absoluta de la clase mediana.

Propiedades de la Mediana
La mediana no esta afectada por los trminos extremos.

k
Me
Me
k
x
y
kMe Me kx y
k Me Me k x y
x
y
i
i
x y i i
x y i i
= =
= =
= =
Si k = Constante
c) MODA
Es aquel valor que se presenta c/mayor frecuencia, se halla
de dos formas:


I.- Datos No Agrupados:
Ejemplo:
Se escoge aquel valor que se repita ms.

4, 7, 8, 9, 9, 3, 6. Mo = 9 (Unimodal)
3, 3, 4, 5, 6, 7, 8, 8. Mo
1
= 3, Mo
2
= 8 (Bimodal)
II.- Datos Agrupados:
|
|
.
|

\
|
+
+ =
2 1
1
o o
d d
d
C L Mo
L
o
= Limite superior
C
o
= Amplitud de la clase modal.
d
1
= Diferencia de la frecuencia absoluta
modal menos la anterior.
d
2
= Diferencia de la frecuencia absoluta
modal menos la siguiente.

Ejemplo:
Limites n
i
N
i

[ 60 63 >
[ 63 66 >
[ 66 69 >
[ 69 72 >
[ 72 75 ]
5
18
42
27
8
5
23
65
92
100
27 42 d
18 42 d
67.84 Mo
29
24
3 66
15 24
24
3 66 Mo
2
1
=
=
=
|
.
|

\
|
+ =
|
.
|

\
|
+
+ =
|
|
.
|

\
|
+
+ =
2 1
1
o o
d d
d
C L Mo
Propiedades de la Moda
Si k = Constante

k
Mo
Mo
k
x
y 3.
kMo Mo kx y 2.
k Mo Mo k x y 1.
x
y
i
i
x y i i
x y i i
= =
= =
= =
OTRAS MEDIDAS DE POSICIN
Anlogamente a la mediana, que divide los datos en dos
partes iguales, se definen otras medidas que dividirn los
datos en cuatro, diez o cien partes.
Los cuantiles son valores de la distribucin que la dividen en
partes iguales, es decir, en intervalos, que comprenden el
mismo nmero de valores. Los ms usados son los cuartiles,
los deciles y los percentiles.
PERCENTILES: Son 99 valores que dividen en cien partes
iguales el conjunto de datos ordenados.
CUARTILES: Son los tres valores que dividen al conjunto
de datos ordenados en cuatro partes iguales.
DECILES: son los nueve valores que dividen al conjunto
de datos ordenados en diez partes iguales, son tambin un
caso particular de los percentiles.
Se definen genricamente como cuantiles a los cuartiles,
deciles, percentiles,.....Los cuantiles de denominan tambin
parmetros de estructuras y son muy utilizados en las
CC.Sociales.
MEDIDAS DE DISPERSIN
Las medidas de posicin central no
proporcionan, en general, suficiente
informacin para una adecuada
descripcin de los datos, porque no
toman en cuanta la dispersin o
concentracin de los mismos, por
lo tanto es claro que se requieren
otras medidas que indiquen el
grado de variabilidad de los datos.

Estas medidas son necesarias para efectuar comparaciones significativas
entre grupos de observaciones. Cuando se mide la dispersin de los valores
de una variable respecto de unas de sus medidas de posicin, se est
midiendo el grado de representatividad que dicha medida de posicin tiene
en el conjunto de los datos a los cuales pretende resumir.
Entre las medidas de dispersin mas conocidas son:

a) Varianza(S
2
)
b) Desviacin estndar o tpica(S).
c) Coeficiente de variabilidad(Cv)
d) Rango

a) Varianza ( S
2
)

Mide la variabilidad absoluta de los datos y
i
, respecto a la
media
La varianza es una cantidad no negativa(S
2
> 0 )
Si

( )
( )
iguales son S y/o S 60 n
Sesgada Varianza
n
y y
S 30 n
Insesgada Varianza
1 n
y y
S 30 n
2
n
2
1 - n
2
i 2
n
2
i 2
1 - n
= >

= >

= <

La varianza se halla de tres formas:


I.- Datos No Agrupados:
( )
n
y y
2
i 2


=
y
S
Donde:

muestra de Tamao n
media o Promedio y
es Obsevacion y
i
=
=
=
Desarrollando:

) 30 (n y
n
y

2 i
2
y
S
> =

II.- Datos Agrupados:
Donde:

=
=
k
1 i
2
i i
2
n
) y - (y n
S
y
absoluta frecuencia n
clase de marca y
i
i
=
=
Desarrollando:

> = 30) (n y
n
y n

2
2
i i
2
y
S
III.- Mtodo Codificado:
Se sabe por el mtodo codificado que:

yi = Marca de clase
Ot = origen de trabajo
C = amplitud de intervalo de clase Ls LI

Donde:

C
O y
Z
t i
i

=
Luego expresando como mtodo codificado ser:

( )
(
(

=


n
z n
z n
n
c
V
2
i i 2
i i
2
(v)
Propiedades de la Varianza
La desviacin de la constante es cero V(c) = 0

La variancia de una variable mas una constante es igual a la
variancia de la variable.
La variancia de una variable multiplicada por una constante es:

V(x) c) V(x =
ctes. b y a V(x) a b) V(ax
cte. c V(x) c V(cx)
2
2
= = +
= =

b) Desviacin estndar o tpica(S)

Mide el grado de uniformidad con respecto a la media.
Alto grado de variabilidad

Alto grado de uniformidad

Es til para juzgar la representatividad del promedio
aritmtico.
| S
+ S
Ejemplo:
Sea x
i
= Variables de ingresos mensuales.

S
2
= 61.53

S = =7.84

Esto significa que los ingresos mensuales presentan una
dispersin respecto a su media de 7.84 soles
2
S

c) Coeficiente de variabilidad(Cv)

.100
y
S
Cv =
Es til para comparar la uniformidad de 2 o poblaciones.
Se expresa en %
No presenta unidades.
MEDIDAS DE FORMA
En otras ocasiones podemos estar interesados
sobre cuestiones de forma como la simetra de los
datos o su aplastamiento. La mayora de las
medidas de forma sern invariantes por cambio de
localizacin y de escala.
Coeficientes de Asimetra
Diremos que una distribucin es simtrica cuando
su mediana, su moda y su media aritmtica
coinciden.
Diremos que una distribucin es asimtrica a la
derecha si las frecuencias (absolutas o relativas)
descienden ms lentamente por la derecha que por
la izquierda.
Si las frecuencias descienden ms lentamente por
la izquierda que por la derecha diremos que la
distribucin es asimtrica a la izquierda.
Si la distribucin de frecuencias es unimodal y tiene forma
de campana, se definen los coeficientes de asimetra :
)
2
3(
e
x
x M
CA
o

=
1
o
x
x M
CA
o

=
Su valor es cero cuando la distribucin es simtrica, positivo
cuando existe asimetra a la derecha y negativo cuando
existe asimetra a la izquierda.
Coeficiente de Concentracin (ndice de Gini)
El Coeficiente de Gini es una medida de la desigualdad
ideada por el estadstico italiano Corrado Gini.
Normalmente se utiliza para medir la desigualdad en los
ingresos, pero puede utilizarse para medir cualquier
forma de distribucin desigual. El coeficiente de Gini es
un nmero entre 0 y 1, en donde 0 se corresponde con la
perfecta igualdad (todos tienen los mismos ingresos) y 1
se corresponde con la perfecta desigualdad (una persona
tiene todos los ingresos y los dems ninguno). El ndice
de Gini es el coeficiente de Gini expresado en
porcentaje, y es igual al coeficiente de Gini multiplicado
por 100.
El coeficiente de Gini se puede calcular mediante la
siguiente frmula:
( )
1
1
1
1
n
i i
i
G
n
i
i
p q
C
p

Donde:

Apuntamiento o Curtosis
Miden la mayor o menor cantidad de datos que se
agrupan en torno a la moda. Se definen 3 tipos de
distribuciones segn su grado de curtosis:
Distribucin Mesocrtica: presenta un grado de
concentracin medio alrededor de los valores centrales
de la variable (el mismo que presenta una distribucin
normal).
Distribucin Leptocrtica: presenta un elevado grado
de concentracin alrededor de los valores centrales de la
variable.
Distribucin Platicrtica: presenta un reducido grado
de concentracin alrededor de los valores centrales de la
variable.
VIDEO DE MEDIDAS DE
POSICIN
VIDEO DE MEDIDAS DE
DISPERSIN

Anda mungkin juga menyukai