Anda di halaman 1dari 22

ESTADSTICA DESCRIPTIVA EN GEOGRAFA

REPASO BLOQUE I:
TEMAS 1-4

Qu hemos visto?

Tipos de variables

Niveles de medicin de las variables

Tabulacin y representacin grfica de las variables

Estadsticos/ Parmetros:

Medidas de centralizacin: Media, mediana y moda


Diferenciar sus propiedades.

Posicin (cuantiles, percentiles,...)


Medidas de dispersin
con unidades: rango, rango intercuartlico, varianza, desv. Tpica
sin unidades: coeficiente de variacin intercuartlica, coeficiente
variacin Pearson

TIPOS DE VARIABLES
CUALITATIVAS
Se refieren a los aspectos no medibles o cualidades de los individuos
(estado civil, lugar de nacimiento...). Las variables cualitativas toman
valores que no pueden ser ordenados ni operados conforme a las reglas
aritmticas; a estos valores se les suele denominar modalidades
CUANTITATIVAS
Miden alguna cualidad o atributo "cuantificable" de los individuos. (Valor
numrico)

DISCRETAS
Las variables discretas, al ser
numerables, pueden tomar una serie de
valores determinados, pero no los
valores intermedios (Ej, nmero de
aos de escolarizacin, nmero de
hijos por familia).

CONTINUAS
Las variables continuas, aquellas
medibles que pueden tomar infinitos
valores dentro de un campo de
variacin (peso, altura, temperatura)

NIVELES DE MEDICIN DE LAS VARIABLES


TIPOS DE
VARIABLES

NIVELES DE
MEDICIN

PROPIEDADES DE LOS NIVELES


DE MEDICIN

CUALITATIVA

NOMINAL

- Nivel de medicin ms bsico


-Clasifica a los individuos u objetos en clases o
categoras meramente descriptivas y excluyentes

Ej: lugar de nacimiento

ORDINAL
Ej: nivel de instruccin

CUANTITATIVA INTERVALOS
(Discretas/
Ej: Temperatura, presin
continuas)
RAZONES/
PROPORCIONES
Ej: renta per cpita, peso

- Contiene las mismas propiedades del nivel de


medicin nominal + una nueva: ordena segn se
posea en mayor o menor grado la caracterstica que
se pretenda medir
-Adems de lo observado para las otras dos escalas,
sta tiene la propiedad de poder medir la distancia o
la diferencia numrica que aparece entre una
categora y otra
-Posee todas las propiedades de las anteriores ms el
cero absoluto, es decir, se emplea un punto natural u
origen no arbitrario en la escala de medida; de esta
forma no slo podremos establecer diferencias entre
las categoras sino que adems las cantidades en
esta escala, y por lo tanto las proporciones, tienen un
significado. Esta escala posee adems la propiedad
de que la razn de dos valores cualesquiera es
independiente de la unidad de medicin

TABULACIN Y REPRESENTACIN
GRFICA DE LAS VARIABLES
CUALITATIVA NOMINAL

CUALITATIVA
ORDINAL

CUANTITATIVA
DISCRETA

CUANTITATIVA
CONTINUA

TABULACIN

f y f%

f, f%, F y F%

f, f%, F y F%

MC, f, f%, F y F%

REPRESENTACIN
GRFICA

Diagrama de crculo;
diagrama rectangular;
diagrama triangular,
diagrama de barras (si
alto n de
modalidades y/o
frecuencia muy baja)

Diagrama de
crculo; diagrama
rectangular;
diagrama
triangular (si alto
n de
modalidades y/o
frecuencia muy
baja)

Diagrama de
barras; polgono
de frecuencias;
polgono de
frecuencias
acumuladas (ojiva)

Histogramas
frecuencias;
polgono de
frecuencias,
polgono de
frecuencias
acumuladas
(ojiva).

La correcta realizacin de un grfico necesita que se incluya en el mismo:


- la fuente origen de los datos que permita consultas directas a la informacin,
- las unidades de medida de los datos (porcentajes, nmeros absolutos...),
- el ao o periodo de referencia de la informacin
- el mbito de referencia de la informacin (regin, pas...).
- y un ttulo en el que se indique claramente la variable a que corresponde la informacin

TIPOS DE GRFICOS
100%
90%
80%
MADRID
BARCELONA
BILBAO
SEVILLA

70%

UNIVERSIDAD

60%

SECUNDARIA

50%

PRIMARIA

40%

ANALFABETO

30%
20%

CICLOGRAMA

10%
0%
1

DIAGRAMA
RECTANGULAR

DIAGRAMA DE BARRAS

HISTOGRAMA

Parmetros y estadsticos

Parmetro: Es un valor calculado sobre una poblacin

La altura media de los individuos de un pas

La idea es resumir toda la informacin que hay en la poblacin en unos pocos


nmeros (parmetros).

Estadstico: dem (cambiar poblacin por muestra)

La altura media de los que estamos en este aula.

Somos una muestra (representativa?) de la poblacin.

Un brevsimo resumen sobre


estadsticos

Centralizacin

Indican valores con respecto a los que los datos parecen


agruparse.
Media, mediana y moda

Posicin

Dividen un conjunto ordenado de datos en grupos con la misma


cantidad de individuos.
Cuartiles, quintiles, deciles y percentiles.

Dispersin

Indican la mayor o menor concentracin de los datos con respecto


a las medidas de centralizacin.
Desviacin tpica, coeficiente de variacin, rango, varianza,

MEDIA
Se define como la suma de todos los valores numricos (que adopta la variable
estudiada) divididos por el nmero total de valores observados
Media de 2,2,3,7 es (2+2+3+7)/4=3,5
-Conveniente cuando los datos se concentran simtricamente con respecto a
ese valor.
-Muy sensible a valores extremos. En estos casos es ms conveniente calcular
la mediana
-En distribuciones a partir de intervalos de clase no se puede estimar si existen
intervalos abiertos
a)Media aritrmtica:
Datos sin agrupar
X= x
N
b)Media Ponderada:
Xw= wx
w

Datos agrupados
X= fx
N

Ejemplo

xf

i i

Peso

M. Clase

Fr.

Fr. ac.

40 < 50

45

50 < 60

55

10

15

60 < 70

65

21

36

70 < 80

75

11

47

80 < 90

85

52

90 < 100

95

55

100 < 130

115

58

58

N
45 5 55 10 115 3
69,3
58

Mediana: de un conjunto de valores ordenados en magnitud es el valor central


o la media de los dos valores centrales. Es un valor que divide a las
observaciones en dos grupos con el mismo nmero de individuos .

Altura mediana

Mediana de n observaciones impar: N/2 + 0,5:


Ejemplo: 1,2,4,5,6,6,8
n observaciones, 7; (7/2)+0,5=4 ; hay que buscar el valor que ocupa la
posicin 4: 1,2,4,5,6,6,8 ;luego la mediana es 5

Mediana de n observaciones par es el valor medio de los valores que


ocupan las posiciones N/2 y N/2 +1
Ejemplo: 1,2,4,5,6,6,8,9
N observaciones par, 8; hay que buscar los valores que ocupan las
posiciones 8/2 y (8/2)+1, es decir, las posiciones 4 y 5; los valores que
ocupan las posiciones 4 y 5 son el 5 y el 6; la ,mediana es la media de
esos dos valores
1,2,4,5,6,6,8,9 es (5+6)/2=5,5

MEDIANA
- No es sensible a valores extremos.
-Es conveniente cuando los datos son asimtricos.
EJEMPLO

-Mediana de 3,5,6,8,9,11 es 7
-Mediana de 3,5,6,8,9,29 es 7

Ejemplo
Peso

M. Clase

Fr.

Fr. ac.

40 < 50

45

50 < 60

55

10

15

60 < 70

65

21

36

70 < 80

75

11

47

80 < 90

85

52

90 < 100

95

55

100 < 110

115

58

58

1 / 2 * N Fi 1
Mediana L c

fi
1 / 2 * 58 15
60 10
66 ,6
21

La moda: se define como el valor que tiene una mayor frecuencia en un


conjunto de datos (es decir, aquel que ms se repite).
Para datos agrupados en intervalos
Mo= Li + c.

D1
D1+D2

D1: fi-fi-1
D2: fi- fi+1
Peso

M. Clase

Fr.

Fr. ac.

40 < 50

45

50 < 60

55

10

15

60 < 70

65

21

36

70 < 80

75

11

47

80 < 90

85

52

90 < 100

95

55

100 < 110

115

58

58

Intervalo modal

Mo 60 10

11
65,24
11 10

Estadsticos de posicin

Cuartiles: Dividen a la muestra en 4 grupos homogneos.


Primer cuartil = Percentil 25 = Cuantil 0,25
Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana
Tercer cuartil = Percentil 75 = cuantil 0,75

Quintiles: 4 valores que dividen a una muestra en 5 grupos


homogneos
Quintil 2= Decil 2= Percentil 20

Deciles: 9 valores que dividen a una muestra en 10 grupos


homogneos
Decil 5= mediana= cuartil segundo= percentil 50

Percentil de orden k = cuantil de orden k/100


Percentil 50= mediana= cuartil segundo= decil quinto,
El percentil de orden 15 deja por debajo al 15% de las
observaciones. Por encima queda el 85%

Ejemplo
Peso

M. Clase

Fr.

Fr. ac.

40 < 50

45

50 < 60

55

10

15

60 < 70

65

21

36

70 < 80

75

11

47

80 < 90

85

52

90 < 100

95

55

100 < 130

115

58

58

P75 Li c

75 / 100 N Fi 1
43,5 36
70 10
76 ,8
f
11

Medidas de dispersin
Las medidas de dispersin indican el grado de representatividad de las
medidas de tendencia central. Miden el grado de dispersin/ concentracin de
los datos en torno a las medidas de tendencia central
Existen dos tipos de medidas de dispersin: ABSOLUTAS Y RELATIVAS

Mediana

Rango
Rango intercuartlico

Rango entre percentiles


ABSOLUTAS

Media

Desviacin media
Varianza
Desviacin tpica

RELATIVAS

Mediana

Coeficiente variacin intercuartlica

Media

Coeficiente variacin de Pearson

Rango entre percentiles (interquartile range):

Es la distancia entre percentil 90 y percentil 10.


Rango entre percentiles = P90

P50

Mx.

P75

25% 25%

25%

Rango intercuartlico

0.01

Es la distancia entre primer y tercer cuartil.


Rango intercuartlico = Q3

25%

Parecida al rango, pero eliminando las


observaciones ms extremas inferiores y superiores.
No es tan sensible a valores extremos

Rango intercuartlico:

P25

Rango

0.00

P10

Mn.

0.04

1, 2, 3,4,4,8. El rango es 8-1=7


Es muy sensible a los valores extremos.

0.03

0.02

Amplitud o Rango:
Diferencia entre observaciones extremas.

0.05

Dispersin absoluta: mediana

150

- Q1

Parecida al rango, pero eliminando las


observaciones ms extremas inferiores y superiores.
Es el menos sensible a valores extremos.

160

170

180

190

Dispersin absoluta: media


Desviacin media:
Mide el promedio de las desviaciones (absolutas) de las observaciones con respecto
a la media.
Es la menos sensible a valores extremos (alejados de la media).
Viene expresada en las mismas unidades de la variable.
Varianza S2 :
Mide el promedio de las desviaciones (al cuadrado) de las observaciones con
respecto a la media.
Es sensible a valores extremos (alejados de la media).
Sus unidades son el cuadrado de las de la variable. De interpretacin difcil para
un principiante.

Desviacin tpica
Es la raz cuadrada de la varianza
Tiene las misma dimensionalidad (unidades) que la variable. Es sensible a valores
extremos (alejados de la media).

Dispersin relativa: mediana

Q3 Q1
Vq
*100
me
Es la razn entre el rango intercuartlico y la mediana.
Mide el rango intercuartlico en forma dequ tamao tiene con respecto a
la mediana
Es frecuente mostrarla en porcentajes
Si la mediana es 80 y el rango intercuartlico es de 5 entonces
Vq=5/80*100=6,25%
Es una cantidad adimensional (independiente de las unidades de medida).
Interesante para comparar la variabilidad de diferentes variables.
Si el peso tiene Vq=6,25% y la edad tiene Vq=10%, los individuos
presentan ms dispersin en edad que en peso.

Dispersin relativa: media

Coeficiente de variacin de PEARSON

Es la razn entre la desviacin tpica y la media.

Mide la desviacin tpica en forma de


qu tamao tiene con respecto a la media

Tambin se la denomina variabilidad relativa.

Es frecuente mostrarla en porcentajes

S
CV *100
x

Si la media es 80 y la desviacin tpica 20 entonces CV=20/80=0,25=25% (variabilidad relativa)

Es una cantidad adimensional (independiente de las unidades de medida). Interesante


para comparar la variabilidad de diferentes variables.

Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan ms dispersin
en peso que en altura.

No debe usarse cuando para variables cuyo nivel de medicin es por intervalos, es decir,la
variable cuenta con un valor 0 fijado arbitrariamente.

Por ejemplo 0C 0F

Si la variable presenta valores negativos, al calcular el coeficiente de variacin de pearson los


habr que considerar como positivos

VARIABLES NORMALIZADAS O UNIDADES


TIPIFICADAS

VARIABLES NORMALIZADAS O UNIDADES TIPIFICADAS


Normal.............. |z| < 1
Anormal............ 1 < |z| < 2
Muy anormal...... |z| >=2
Variables normalizadas: nmero de unidades de desviacin tpica que
un individuo queda por encima o por debajo de la media del grupo.
Son unidades independientes de las unidades originales de medida
con lo cual facilitan enormemente la comparacin. til para comparar
un individuo respecto a los datos poblacionales a los que pertenece.
Las unidades Z se calculan: Z= x - x
S

Anda mungkin juga menyukai