Anda di halaman 1dari 37

ESTADSTICA I

MEDIDAS DE
VARIACIN O DE
DISPERSIN
Lic. Mariza Crdenas Pineda

VARIACIN O
DISPERSIN

Varianza
Alcance o
rango

Desviacin Estndar
o Tpica

Varianza de
la Poblacin
Varianza de
la Muestra

Alcance Intercuartil

Desviacin
Estndar de
la Poblacin
Desviacin
Estndar de
la Muestra

Coeficiente
de Variacin

MEDIDAS DE DISPERSIN
Las medidas de centralizacin proporcionan una informacin
incompleta del conjunto de datos.
Ejemplo: sean X e Y las notas de dos grupos de cuarenta alumnos,
con distribuciones de frecuencias:
xi

ni

yi

ni

20

20

20

10

34

11

Para ambas variables la media es


10, pero en el segundo caso 10 es
un valor ms representativo de los
datos que en el primero.

Las medidas de dispersin nos permiten valorar si el valor de la medida


de tendencia central es , o no es , representativo.

Alcance o Rango
Diferencia entre la mayor y la menor de las
observaciones
Alcance = xmayor xmenor

xmax

xmin

No toma en cuenta la forma en que estn


distribuidos los datos.
Alcance: 12 - 7 = 5

7
12

10

Alcance: 12 - 7 = 5

11

7
12

10

11

Cuartiles
Los datos se ordenan de menor a mayor.

25%

25%

Q1

25%

Q2

25%

Q3

Observacin
Menor

Observacin
Mayor

El alcance intercuartil es la distancia entre el tercer

cuartil Q3 y el primer cuartil Q1.

Rango Intercuartil
Medida de Variacion
Diferencia entre el primero y tercer Cuartil
No es afectado por valores extremos
Data in Ordered Array:

11 12 13 16 16 17

17 18 21

Interquartile Range Q3 Q1 17.5 12.5 5

VARIANZA
Es uno de los parmetros ms importantes en estadstica

paramtrica, se puede decir que, teniendo conocimiento de la


varianza de una poblacin, se ha avanzado mucho en el
conocimiento de la poblacin misma.
La varianza nos mide la mayor o menor representatividad de la
media aritmtica
- Si la varianza es grande nos indica gran dispersin, la media
aritmtica no es representativa.
- Si casi todos los valores estn muy cercanos a la media
aritmtica entonces la varianza se acercar a cero, con lo que se
dice que la serie es concentrada.

2
S

VARIANZA
Importante Medida de Variacion

Muestra Variacion respecto a la media


Varianza de una Muestra:
n

Xi
S2

i 1

n 1

Varianza de una Poblacin:


N

Xi
2

i 1

Varianza de la Poblacin
Desviacin cuadrtica promedio con relacin a

la media de la Poblacin
2

(x

) f
N

x marca de clase

VARIANZA DE LA
POBLACIN
Datos Agrupados
N

Xi
2

i 1

VARIANZA DE LA MUESTRA
Datos agrupados
n

Xi
S

i 1

n 1
x marca de clase

VARIANZA
Simbologa
S2

:Varianza de la muestra
:Varianza de la Poblacin

Datos No Agrupados
n

xi
s2

Datos Agrupados
m

i 1

xi
s2

n 1

i 1

n 1
m

xi
2

xi

2
2

i 1

i 1

x fi

fi

DESVIACION ESTANDAR
Es la ms Importante Medida de Variacin
Muestra Variacion respecto a la Media
Tiene la misma unidad que los datos originales
Desviacin Estandar de una muestra :
n

Xi
i

Desviacin Estandar de una poblacin:


N

Xi
i

DESVIACIN ESTNDAR O
TPICA

La desviacin estndar o tpica siempre es positiva porque la

varianza tambin lo es.


La desviacin estndar o tpica es la medida de dispersin ptima,
ms exacta, ms estable y ms utilizada, sirviendo de base para las
medidas de asimetra, estadsticos tpicas y correlacin.
Cuanto ms se acerca a cero la desviacin ms concentrada es la
serie.
Suele decirse que cuando la desviacin estndar o tpica es
menor que la media aritmtica la serie es concentrada y s la
desviacin estndar o tpica es mayor que la media aritmtica la
serie es dispersa.

Desviacin Estndar de la Poblacin


Datos Agrupados

f (x

) f
N

x marca de clase

Desviacin Estndar de la Muestra


Datos Agrupados

f (x
n

x marca de clase

x) f
1

Ejemplo Desviacin Estndar


de Datos Agrupados
CLASE
1-3
4-6
7-9
10 - 12
13 - 15
16 - 18

MARCA
2
5
8
11
14
17

2
FRECUENCIA M X FREC. (Marca - Media) x Frecuencia
1
2
66.94
66.94
3
15
26.85
80.55
5
40
4.76
23.80
7
77
0.67
4.69
4
56
14.58
58.31
2
34
46.49
92.98
22
224
327.27

MEDIA

10.18

VARIANZA

15.584

DESV. ESTAND.

3.948

4-17

COEFICIENTE DE
VARIACIN
El coeficiente de variacin es la razn de la desviacin
estndar a la media aritmtica, expresada como
porcentaje:

CV

s
(100 %)
x

4-14

Interpretacin y usos de la
Desviacin Estndar
Teorema de Chebyshev: para cualquier conjunto
de observaciones, la proporcin mnima de
valores que est dentro de k desviaciones
estndar desde la media es al menos 1 - 1/k2 ,
donde k es una constante mayor que 1.

4-15

Interpretacin y usos de la
Desviacin Estndar
Regla emprica: para una distribucin de

frecuencias simtrica de campana:


Cerca de 68% de las observaciones estar dentro

de 1 de la media ();
Cerca de 95% de las observaciones estar dentro
de 2 de la media ();
Casi todas (alrededor de 99.7%) las observaciones
estarn dentro de 3 de la media ().

MEDIDAS DE ASIMETRIA
Muestra el tipo de distribucin de una serie de datos mediante

un indicador ms representativo que se le conoce como el ndice


de Asimetra.
El ndice de asimetra de Pearson se define como

As

3( x Me)
s

Interpretacin:
Si As = 0, La distribucin es simtrica, esto es

Me

Mo

Si As > 0, La distribucin es asimtrica positiva, esto es


Mo Me x

Si As < 0, La distribucin es asimtrica negativa, esto es


x Me Mo

ASIMETRIA:

N AccidentesDas
.10
.11
.12
.14
.15
.18
.20

la curva que forman los valores de la serie


presenta la misma forma a izquierda y derecha de
un valor central (media aritmtica).

25
28
29
32
29
28
23

N AccidentesDas
.10
.11
.12
.14
.15
.18
.20

30
25
22
20
18
16
12

N AccidentesDas
.10
.11
.12
.14
.15
.18
.20

5
8
9
10
12
15
18

MEDIDAS DE CURTOSIS

MEDIDAS DE CURTOSIS
Compara

la dispersin de los datos observados


cercanos al valor central con la dispersin de los datos
cercanos a ambos extremos de la distribucin
Se aplica cuando la distribucin es simtrica.
Se calcula mediante:

P75
P90

P25
P10

0 .5

Interpretacin:
Si K tiende a 0 la distribucin es
normal
Si K tiende a 0.5 es leptocrtica
Si K tiende a -0.5 es platicrtica

CURTOSIS :

Analiza el grado de concentracin que presentan los


valores alrededor de la zona central de la distribucin.

Para detectar tanto asimetra como curtosis, es til dibujar


el histograma. Adems, para asimetra se comparan las
medidas de posicin, Media, Mediana y moda.

Histograma del nmero de accidentes de


trnsito en Pereira, ao 2002

40

30

30
Das

40

20
10

20
10

0
.10

.11

.12

.14

.15

.18

.20

.10

.11

N accidentes

.12

.14

.15

N accidentes

Histograma del nmero de accidentes por das en


Bogot, ao 2002
20
15

Das

Das

Histograma del nmero de accidentes de


trnsito por da en Cal, 2000

10
5
0
.10

.11

.12

.14

.15

N accidentes

.18

.20

.18

.20

Curva de Distribucin
Normal

-3

-2

-1

+1

+2

+3

34.13%

34.13%

13.60%

13.60%
2.135%

2.135%

0.135%

0.135%

-3

-2

-1

68.26%
95.46%
99.73%

+1

+2

+3

Resultado Estndar

-3

-2

Re

-1

+1

+2

+3

100

100

20

20

x 80

x 160

Re? oZ

Re?

-3

Re

-2

80 100
20

-1

80

100

+1

+2

+3
160

160 100
Re Z
20

Ejemplo de Dispersin
Relativa
Distribuci n A

Distribuci n B

x 10

x 100

Cul de las dos tiene menor dispersin?

Ejemplo de Dispersin
Relativa

CV

Distribuci n A

Distribuci n B

2
100
10

5
100
100

20 %

CV

5%

La distribucin B tiene menor dispersin

MEDIDAS DE ASIMETRIA
Muestra el tipo de distribucin de una serie de datos mediante

un indicador ms representativo que se le conoce como el ndice


de Asimetra.
El ndice de asimetra de Pearson se define como
Interpretacin:
Si As = 0, La distribucin es
simtrica, esto es
x

As

3( x Me)
s

Me

Mo

Si As > 0, La distribucin es
asimtrica positiva, esto es
Mo Me x
Si As < 0, La distribucin es
asimtrica negativa, esto es
x Me Mo

Medidas de dispersin
Caracterizar una distribucin solamente a travs de una

medida central no es apropiado.

Las distribuciones del ingreso de dos provincias con el

mismo ingreso medio por hogar son muy distintas si


una de ellas tiene extremos de pobreza y de riqueza,
mientras que la otra tiene poca variacin de ingresos
entre familias.

Estamos interesados en la dispersin o variabilidad de los

ingresos, adems de estarlo en sus centros.

Medidas de dispersin
Ejemplo de dos conjuntos de datos con igual media

Datos con baja dispersin

Datos con alta dispersin

Distribucin normal estandarizada


Si x es una observacin de una distribucin de media

de desviacin estndar , el valor estandarizado de x es:

La distribucin normal estandarizada es la distribucin

normal N(0,1): su media es 0 y su desviacin estndar es 1.


Si una variable x tiene una distribucin normal N( , ),

entonces z posee una distribucin normal estandarizada.

100

100

20

20

x 80

x 160

Re? oZ

Re?

-3

Re

-2

80 100
20

-1

80

100

+1

+2

+3
160

160 100
Re Z
20

Anda mungkin juga menyukai