Anda di halaman 1dari 45

SEMANA 2

ESTADISTICA DESCRIPTIVA
Docente:

Mercedes Aida Osorio Maza


mosorio@uni.edu.pe

2015-II
TEORIA

TEMAS A DESARROLLAR
Fabulacin y codificacin de los datos
continuos.
Estadgrafos de posicin media; mediana.
Estadgrafos de Dispersin: varianza,
Desviacin Standard, Coeficiente de
Variabilidad.

MEDIDAS ESTADSTICAS
En numerosas ocasiones, en
vez de trabajar con todos los
datos, es preferible disponer
de una o ms medidas
descriptivas que resumen los
datos de forma cuantitativa.
Las medidas descriptivas son
valores numricos calculados
a partir de la muestra y que
nos resumen la informacin
contenida en ella

CLASIFICACIN
MEDIDAS ESTADSTICAS

Medidas de Posicin

Medidas de Dispersin

Medidas de Forma

Medidas de Centralizacin

Media
Mediana
Moda

Otras Medidas de Posicin

Cuantiles
Porcentiles
Cuartiles
Deciles

Varianza
Desviacin Tpica

Coeficiente de
Variabilidad

Coeficientes de
Asimetra
Coeficiente de
Concentracin
(ndice de Gini)
Apuntamiento o
Curtosis

MEDIDAS DE POSICIN
A continuacin
estudiaremos diferentes
parmetros estadsticos
que nos permitirn
conocer la tendencia
posicional de los datos.
Veremos en primer lugar
medidas de tendencia
central y posteriormente
otras medidas alusivas
igualmente a la posicin.

MEDIDAS DE CENTRALIZACIN
Llamadas as porque tratan de localizar el centro
de la distribucin de los datos.
Las principales medidas de centralizacin son:
a)
b)
c)

Media Aritmtica
Mediana.
Moda

a) MEDIA ARITMTICA( y )
Es el promedio del conjunto de datos, hay tres formas de
hallarlo.
I.- Datos No Agrupados:
y

y
n

, n Tamao de la muestra

Ejemplo:
13, 14, 17, 21, 24, y

13 14 .....24
5

II.- Datos Agrupados en Tablas de Frecuencias:


ny

y
i

Donde:

n i Frecuencia absoluta
y i Marca de clase

Ejemplo:

n Tamao de muestra

n i yi
Estimacin de la y para datos agrupados y

Limites

yi

ni

[ 15.2 115.5 >


[ 15.5 15.8 >
[ 15.8 16.1 >
[ 16.1 16.4 >
[ 16.4 16.7 >
[ 16.7 17.0 ]

15.35
15.65
15.95
16.25
16.55
16.85

2
5
11
6
3
3

n i yi
y
n
i 1
6

y
i 1

n i y i 2(15.35) 5(15.65) ......3(16.85)

n
30

III.- Mtodo Codificado:


y Ot

c
ni Z i

Donde:
n Frecuencia absoluta
c Amplitud
O t Origen de trabajo, es una marca de clase que presenta mayor frecu e ncia
Zi C odificaci n

Reglas para elegir Ot (origen de trabajo)


Tomamos

Ot a una de las marcas de clase yi.

Si

el numero de intervalos es impar Ot es la marca de clase del intervalo


central.

Si

el nmero de intervalos es par, Ot es la marca de uno de los 2


intervalos centrales, prefiriendo el intervalo al cual le corresponde
mayor frecuencia.

Ejemplo:

Hallar la media aritmtica por el mtodo codificado

ny

y
i

Estaturas
(Limites)

yi

ni

[ 1.50 1.55 >

1.525

-2

-4

[ 1.55 1.60 >

1.575

12

-1

-12

[ 1.60 1.65 >

1.625

42

[ 1.65 1.70 >

1.675

36

36

[ 1.70 1.75 >

1.725

25

50

[ 1.75 1.80]

1.775

Total

Ot

n=120

Zi

yi - O t
,
c

nizi

79

c 1.55 - 1.50 0
1.525 1.625
0.10

2
0.05
0.05
1.575 1.625
0.05

1
0.05
0.05
0

z1
z2
z3

1.675 1.625
0.05

1
0.05
0.05
2

z4
z5

z6 3
Mtodo Codificado:
c
y ot
n

n
i 1

zi

0.05
(79)
120
y 1.6579mts

y 1.625

Propiedades de la Media Aritmtica


Si

se tiene 2 o ms sub poblaciones de tamao n1 y n2,


entonces la media total se calcula:
y

Para

La

n1 y1 n 2 y 2 ............n k y k
n1 n 2 ........n k

K = cte.
- Si

yi x i k

y xk

- Si

y i kx i

y kx

- Si

xi
yi
k

x
y
k

suma de las desviaciones respecto al promedio es cero


n

y
i 1

y 0

desviacin : yi y

b) MEDIANA
Es aquel valor que divide en 2 partes iguales al conjunto de
datos, se halla de tres formas:
I.- Datos No Agrupados:
Se ordena ya sea en forma creciente y/o decreciente.
yn y n
Si

n par

Me

Si

n impar Me y n 1

2
2

n Tamao de la muestra

Ejemplo:
Si n es par sean los #: 10, 1, 2, 7, 6, 3, 4, 5,
Ordenando: 1, 2, 3, 4, 5, 6, 7, 10

y n/2 y n/21
Me
2
y 4 y5
45
Me

4.5
2
2
Si n es impar ; (n = 7) Impar.
Datos: 1, 2, 3, 4, 5, 6, 7.

Me y n 1 y 4 4
2

II.- Datos Agrupados:

Tabla de frecuencias con variable cuantitativa discreta

n
Si N J 1
2
n
Si N J -1
2

Me y J

y J -1 y J
Me
2

Ejemplo:
Si

yi
0
1
2

3
4
5
6

Si

ni

Ni

3
5
10
18
14
7
3

3
8
18
36
50
57
60

yi

ni

Ni

0
1
2
3
4
5

5
12
8
15
5
5

5
17
25
40
45
50

n 60

30
2 2
Com o
n
N j-1 Me y j
2
18 30 Me 3
n 50

25
2 2
n
Como N j-1 25
2
y j1 y j 2 3

Me

2.5
2
2

III.- Tabla de Frecuencias con Variable Cuantitativa Continua

n/2 N J 1
Me L J C J

nJ

Donde:
Lj = Limite inferior de la clase mediana.
n = Numero total de observaciones.
Cj = Amplitud del intervalo de la clase mediana.
Nj-1 = Frecuencia absoluta acumulada hasta la clase
inmediata anterior a la clase mediana.
nj = Frecuencia absoluta de la clase mediana.

Propiedades de la Mediana
La
Si

mediana no esta afectada por los trminos extremos.


k = Constante

yi x i k

Me y Me x k

y i kx i

Me y kMe x

xi
yi
k

Me x
Me y
k

c) MODA
Es aquel valor que se presenta c/mayor frecuencia, se halla
de dos formas:
I.- Datos No Agrupados:
Se escoge aquel valor que se repita ms.
Ejemplo:
4, 7, 8, 9, 9, 3, 6.
3, 3, 4, 5, 6, 7, 8, 8.

Mo = 9 (Unimodal)
Mo1 = 3, Mo2 = 8 (Bimodal)

II.- Datos Agrupados:

d1
Mo L o C o
d1 d 2

Lo = Limite superior
Co = Amplitud de la clase modal.
d1 = Diferencia de la frecuencia absoluta
modal menos la anterior.
d2 = Diferencia de la frecuencia absoluta
modal menos la siguiente.

Ejemplo:
Limites

ni

Ni

[ 60 63 >
[ 63 66 >
[ 66 69 >
[ 69 72 >
[ 72 75 ]

5
18
42
27
8

5
23
65
92
100

d1

Mo L o C o
d1 d 2
24

24
Mo 66 3

66

24 15
29
Mo 67.84
d1 42 18
d 2 42 27

Propiedades de la Moda
Si

k = Constante
1. y i x i k

Mo y Mo x k

2. y i kx i

Mo y kMo x

xi
3. y i
k

Mo x
Mo y
k

OTRAS MEDIDAS DE POSICIN


Anlogamente a la mediana, que divide los datos en dos
partes iguales, se definen otras medidas que dividirn los
datos en cuatro, diez o cien partes.
Los cuantiles son valores de la distribucin que la dividen en
partes iguales, es decir, en intervalos, que comprenden el
mismo nmero de valores. Los ms usados son los cuartiles,
los deciles y los percentiles.

PERCENTILES: Son 99 valores que dividen en cien partes


iguales el conjunto de datos ordenados.

CUARTILES: Son los tres valores que dividen al conjunto


de datos ordenados en cuatro partes iguales.

DECILES: son los nueve valores que dividen al conjunto


de datos ordenados en diez partes iguales, son tambin un
caso particular de los percentiles.
Se definen genricamente como cuantiles a los cuartiles,
deciles, percentiles,.....Los cuantiles de denominan tambin
parmetros de estructuras y son muy utilizados en las
CC.Sociales.

MEDIDAS DE DISPERSIN
Las medidas de posicin central no
proporcionan,
en
general,
suficiente informacin para una
adecuada descripcin de los datos,
porque no toman en cuanta la
dispersin o concentracin de los
mismos, por lo tanto es claro que se
requieren otras medidas que
indiquen el grado de variabilidad
de los datos.
Estas medidas son necesarias para efectuar comparaciones significativas
entre grupos de observaciones. Cuando se mide la dispersin de los
valores de una variable respecto de unas de sus medidas de posicin, se
est midiendo el grado de representatividad que dicha medida de posicin
tiene en el conjunto de los datos a los cuales pretende resumir.

Entre las medidas de dispersin mas conocidas son:


a)
b)
c)
d)

Varianza(S2)
Desviacin estndar o tpica(S).
Coeficiente de variabilidad(Cv)
Rango

a) Varianza ( S2 )
Mide la variabilidad absoluta de los datos y i, respecto a la
media
La varianza es una cantidad no negativa(S2 > 0 )
Si
n 30

n 30

n 60

S2n -1

y
i

Varianza Insesgada

n 1
2

y
S2n i
Varianza Sesgada
n
S2n -1 y/o
S2n son iguales

La varianza se halla de tres formas:

I.- Datos No Agrupados:

2
y

Donde:

y i Obsevacion es
y Promedio o media
n Tamao de muestra

Desarrollando:
2

y2

(n 30)

II.- Datos Agrupados:


k

n i (y i - y)
Sy
n
i 1
2

Donde:

y i marca de clase
n i frecuencia absoluta
Desarrollando:
2
i

ni y
2
Sy n y (n 30)
2

III.- Mtodo Codificado:


Se sabe por el mtodo codificado que:

yi O t
Zi
C
Donde:

yi = Marca de clase
Ot = origen de trabajo
C = amplitud de intervalo de clase Ls LI

Luego expresando como mtodo codificado ser:

c
V(v)
n
2

n z

2
i i

nz

i i

Propiedades de la Varianza
La

desviacin de la constante es cero V(c) = 0

La

variancia de una variable mas una constante es igual a la


variancia de la variable.

V(x c) V(x)
La

variancia de una variable multiplicada por una constante es:

V(cx) c 2 V(x)
V(ax b) a 2 V(x)

c cte.
a y b ctes.

b) Desviacin estndar o tpica(S)


Mide el grado de uniformidad con respecto a la media.

Alto grado de variabilidad

Alto grado de uniformidad

Es til para juzgar la representatividad del promedio


aritmtico.

Ejemplo:
Sea xi = Variables de ingresos mensuales.
S2= 61.53
S =

S2
=7.84

Esto significa que los ingresos mensuales presentan una


dispersin respecto a su media de 7.84 soles

c) Coeficiente de variabilidad(Cv)

S
Cv .100
y
Es

til para comparar la uniformidad de 2 o poblaciones.


Se expresa en %
No presenta unidades.

MEDIDAS DE FORMA
En otras ocasiones podemos estar interesados
sobre cuestiones de forma como la simetra de los
datos o su aplastamiento. La mayora de las
medidas de forma sern invariantes por cambio de
localizacin y de escala.

Coeficientes de Asimetra
Diremos que una distribucin es simtrica cuando
su mediana, su moda y su media aritmtica
coinciden.
Diremos que una distribucin es asimtrica a la
derecha si las frecuencias (absolutas o relativas)
descienden ms lentamente por la derecha que por
la izquierda.
Si las frecuencias descienden ms lentamente por
la izquierda que por la derecha diremos que la
distribucin es asimtrica a la izquierda.

Si la distribucin de frecuencias es unimodal y tiene forma


de campana, se definen los coeficientes de asimetra :

CA2

3(x Me )

x Mo
CA1
x

Su valor es cero cuando la distribucin es simtrica, positivo


cuando existe asimetra a la derecha y negativo cuando
existe asimetra a la izquierda.

Coeficiente de Concentracin (ndice de


Gini)
El Coeficiente de Gini es una medida de la desigualdad
ideada por el estadstico italiano Corrado Gini.
Normalmente se utiliza para medir la desigualdad en los
ingresos, pero puede utilizarse para medir cualquier
forma de distribucin desigual. El coeficiente de Gini es
un nmero entre 0 y 1, en donde 0 se corresponde con la
perfecta igualdad (todos tienen los mismos ingresos) y 1
se corresponde con la perfecta desigualdad (una persona
tiene todos los ingresos y los dems ninguno). El ndice
de Gini es el coeficiente de Gini expresado en
porcentaje, y es igual al coeficiente de Gini multiplicado
por 100.

El coeficiente de Gini se puede calcular


siguiente frmula:
n 1

CG

p q
i 1

n 1

p
i 1

Donde:

mediante la

Apuntamiento o Curtosis
Miden la mayor o menor cantidad de datos que se
agrupan en torno a la moda. Se definen 3 tipos de
distribuciones segn su grado de curtosis:
Distribucin Mesocrtica: presenta un grado de
concentracin medio alrededor de los valores centrales
de la variable (el mismo que presenta una distribucin
normal).

Distribucin Leptocrtica: presenta un elevado grado


de concentracin alrededor de los valores centrales de la
variable.

Distribucin Platicrtica: presenta un reducido grado


de concentracin alrededor de los valores centrales de la
variable.

VIDEO DE MEDIDAS DE POSICIN

VIDEO DE MEDIDAS DE DISPERSIN

N
I

Anda mungkin juga menyukai