REPASO BLOQUE I:
TEMAS 1-4
Qu hemos visto?
Tipos de variables
Estadsticos/ Parmetros:
TIPOS DE VARIABLES
CUALITATIVAS
Se refieren a los aspectos no medibles o cualidades de los individuos
(estado civil, lugar de nacimiento...). Las variables cualitativas toman
valores que no pueden ser ordenados ni operados conforme a las reglas
aritmticas; a estos valores se les suele denominar modalidades
CUANTITATIVAS
Miden alguna cualidad o atributo "cuantificable" de los individuos. (Valor
numrico)
DISCRETAS
Las variables discretas, al ser
numerables, pueden tomar una serie de
valores determinados, pero no los
valores intermedios (Ej, nmero de
aos de escolarizacin, nmero de
hijos por familia).
CONTINUAS
Las variables continuas, aquellas
medibles que pueden tomar infinitos
valores dentro de un campo de
variacin (peso, altura, temperatura)
NIVELES DE
MEDICIN
CUALITATIVA
NOMINAL
ORDINAL
Ej: nivel de instruccin
CUANTITATIVA INTERVALOS
(Discretas/
Ej: Temperatura, presin
continuas)
RAZONES/
PROPORCIONES
Ej: renta per cpita, peso
TABULACIN Y REPRESENTACIN
GRFICA DE LAS VARIABLES
CUALITATIVA NOMINAL
CUALITATIVA
ORDINAL
CUANTITATIVA
DISCRETA
CUANTITATIVA
CONTINUA
TABULACIN
f y f%
f, f%, F y F%
f, f%, F y F%
MC, f, f%, F y F%
REPRESENTACIN
GRFICA
Diagrama de crculo;
diagrama rectangular;
diagrama triangular,
diagrama de barras (si
alto n de
modalidades y/o
frecuencia muy baja)
Diagrama de
crculo; diagrama
rectangular;
diagrama
triangular (si alto
n de
modalidades y/o
frecuencia muy
baja)
Diagrama de
barras; polgono
de frecuencias;
polgono de
frecuencias
acumuladas (ojiva)
Histogramas
frecuencias;
polgono de
frecuencias,
polgono de
frecuencias
acumuladas
(ojiva).
TIPOS DE GRFICOS
100%
90%
80%
MADRID
BARCELONA
BILBAO
SEVILLA
70%
UNIVERSIDAD
60%
SECUNDARIA
50%
PRIMARIA
40%
ANALFABETO
30%
20%
CICLOGRAMA
10%
0%
1
DIAGRAMA
RECTANGULAR
DIAGRAMA DE BARRAS
HISTOGRAMA
Parmetros y estadsticos
Centralizacin
Posicin
Dispersin
MEDIA
Se define como la suma de todos los valores numricos (que adopta la variable
estudiada) divididos por el nmero total de valores observados
Media de 2,2,3,7 es (2+2+3+7)/4=3,5
-Conveniente cuando los datos se concentran simtricamente con respecto a
ese valor.
-Muy sensible a valores extremos. En estos casos es ms conveniente calcular
la mediana
-En distribuciones a partir de intervalos de clase no se puede estimar si existen
intervalos abiertos
a)Media aritrmtica:
Datos sin agrupar
X= x
N
b)Media Ponderada:
Xw= wx
w
Datos agrupados
X= fx
N
Ejemplo
xf
i i
Peso
M. Clase
Fr.
Fr. ac.
40 < 50
45
50 < 60
55
10
15
60 < 70
65
21
36
70 < 80
75
11
47
80 < 90
85
52
90 < 100
95
55
115
58
58
N
45 5 55 10 115 3
69,3
58
Altura mediana
MEDIANA
- No es sensible a valores extremos.
-Es conveniente cuando los datos son asimtricos.
EJEMPLO
-Mediana de 3,5,6,8,9,11 es 7
-Mediana de 3,5,6,8,9,29 es 7
Ejemplo
Peso
M. Clase
Fr.
Fr. ac.
40 < 50
45
50 < 60
55
10
15
60 < 70
65
21
36
70 < 80
75
11
47
80 < 90
85
52
90 < 100
95
55
115
58
58
1 / 2 * N Fi 1
Mediana L c
fi
1 / 2 * 58 15
60 10
66 ,6
21
D1
D1+D2
D1: fi-fi-1
D2: fi- fi+1
Peso
M. Clase
Fr.
Fr. ac.
40 < 50
45
50 < 60
55
10
15
60 < 70
65
21
36
70 < 80
75
11
47
80 < 90
85
52
90 < 100
95
55
115
58
58
Intervalo modal
Mo 60 10
11
65,24
11 10
Estadsticos de posicin
Ejemplo
Peso
M. Clase
Fr.
Fr. ac.
40 < 50
45
50 < 60
55
10
15
60 < 70
65
21
36
70 < 80
75
11
47
80 < 90
85
52
90 < 100
95
55
115
58
58
P75 Li c
75 / 100 N Fi 1
43,5 36
70 10
76 ,8
f
11
Medidas de dispersin
Las medidas de dispersin indican el grado de representatividad de las
medidas de tendencia central. Miden el grado de dispersin/ concentracin de
los datos en torno a las medidas de tendencia central
Existen dos tipos de medidas de dispersin: ABSOLUTAS Y RELATIVAS
Mediana
Rango
Rango intercuartlico
Media
Desviacin media
Varianza
Desviacin tpica
RELATIVAS
Mediana
Media
P50
Mx.
P75
25% 25%
25%
Rango intercuartlico
0.01
25%
Rango intercuartlico:
P25
Rango
0.00
P10
Mn.
0.04
0.03
0.02
Amplitud o Rango:
Diferencia entre observaciones extremas.
0.05
150
- Q1
160
170
180
190
Desviacin tpica
Es la raz cuadrada de la varianza
Tiene las misma dimensionalidad (unidades) que la variable. Es sensible a valores
extremos (alejados de la media).
Q3 Q1
Vq
*100
me
Es la razn entre el rango intercuartlico y la mediana.
Mide el rango intercuartlico en forma dequ tamao tiene con respecto a
la mediana
Es frecuente mostrarla en porcentajes
Si la mediana es 80 y el rango intercuartlico es de 5 entonces
Vq=5/80*100=6,25%
Es una cantidad adimensional (independiente de las unidades de medida).
Interesante para comparar la variabilidad de diferentes variables.
Si el peso tiene Vq=6,25% y la edad tiene Vq=10%, los individuos
presentan ms dispersin en edad que en peso.
S
CV *100
x
Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan ms dispersin
en peso que en altura.
No debe usarse cuando para variables cuyo nivel de medicin es por intervalos, es decir,la
variable cuenta con un valor 0 fijado arbitrariamente.
Por ejemplo 0C 0F