CÁTEDRA I
UNIDAD 3
UNIDAD 3
Resúmenes estadísticos
Contenidos:
Moda
Mediana
Media
Moda: es el valor de la variable con mayor frecuencia.
Condiciones de Aplicabilidad: desde el nivel nominal
Ejemplo:
Hallar la moda de la distribución de frecuencias del Estado civil de los individuos
de la Base Psicología y Humor recogidos 1c2012.
La moda representa X f
el valor de la variable
más probable para Soltero 246
una extracción hecha
Casado/Unido de hecho 196
al azar.
Separado/Divorciado 29
Viudo 9
n = 480
El valor de la variable de mayor frecuencia es la categoría ‘Soltero’.
Abreviadamente Mo=‘Soltero’
Nota. No confundir la moda con la mayor frecuencia que es 246. La mayor frecuencia es la
que corresponde a la moda que es ‘Soltero’.
Otros ejemplos para muestras con datos ficticios.
Muestra 1 Muestra 2
X f f
n = 480 n=480
Mo1=‘Soltero’
Mo2= ‘ Casado/Unido de hecho’
No hay moda
Una distribución de frecuencias puede ser:
Amodal
Unimodal
Bimodal
o con más modas.
Cuando la variable es cuantitativa y los valores con mayor frecuencia son adyacentes,
se toma como moda al promedio de tales valores.
Mediana: es quien ocupa una posición central determinando dos
subconjuntos de valores de la variable:
Mo1=‘Indiferente’
Mo=‘Indiferente’
Mo2=‘Acuerdo’
Mo=‘Acuerdo’ No hay Moda
No hay moda
Mdn= 25
En conjuntos de datos más numerosos pueden encontrarse los cuartiles
o bien
129
Luego: X X 25,8
5
Veamos como obtener las medidas de tendencia central de una variable
cuantitativa a partir de la distribución de frecuencias con calculadora o
Excel
Ejemplo
Sea la distribución del Agotamiento Emocional de los 35 enfermeros de Terapia
Intensiva del Hospital A presentada en la clase anterior:
x f x*f
n=35 n/2=17,5 x f fa ga
20 1 20
20 1 1 35
21 1 21 21 1 2 34
22 1 22 22 1 3 33
Valores Bajos
23 3 69 23 3 6 32
24 4 96 24 4 10 29
25 4 100 25 4 14 25
26 7 182 Mdn= 26 7 21 21
27 4 108 27 4 25 14
28 2 56 28 2 27 10
29 4 116 Valores Altos 29 4 31 8
30 3 90 30 3 34 4
31 1 31 31 1 35 1
35 911
Valores Bajos: B = {20,21,22,23,24,25} con fB = 14 ≤ 17,5 = n/2
Media= 911/35
Valores Altos: A = {27,28,29,30,31} con fA= 14 ≤ 17,5 = n/2
Media= 26,029
Luego la mediana es: Mdn=26
Cálculo del primer cuartil (q1) y del tercer cuartil (q3)
x f fa ga
x f fa ga
20 1 1 35
20 1 1 35
Primer intercuartil (Q1)l 21 1 2 34
21 1 2 34
22 1 3 33
22 1 3 33
23 3 6 32
23 3 6 32
24 4 10 29
q1= 24 4 10 29
25 4 14 25
25 4 14 25
26 7 21 21
26 7 21 21
27 4 25 14
27 4 25 14
q3= 28 2 27 10
28 2 27 10
29 4 31 8
29 4 31 8
Cuarto intercuartil(Q4) 30 3 34 4
30 3 34 4
31 1 35 1
31 1 35 1
Luego el primer cuartil es: q1=24 Luego el tercer cuartil es: q3=28
Obtención de las Medidas de Tendencia Central en Statistix
Dadas las observaciones de una variable,
además de la media (Mean) y la mediana (Median),
con Statistix también se pueden obtener:
Dados los valores 2, 3, 5 y 70, la media es 20. Ésta no representa adecuadamente a tal conjunto.
La medida adecuada en este caso es la mediana, que es 4. Este valor representa adecuadamente
a tres de las cuatro puntuaciones.
En símbolos: x x 0 o bien x x * f 0
Ejemplo.
-|------|------|-------|-
5 8
x 7
Comentario para datos agrupados en intervalos
Medidas de Dispersión
Una propiedad de los conjuntos de datos es el grado en que éstos
se parecen o se diferencian entre sí. Esta propiedad se denomina
variabilidad o dispersión.
o bien:
Ejemplo
Cálculo de SC para los datos de Agotamiento Emocional de las muestras A
yB
Muestra A X 21 24 25 29 30
-4,8 -1,8 -0,8 3,2 4,2
23,04 3,24 0,64 10,24 17,64 SC=54,8
Muestra B X 1 24 25 29 50
-24,8 -1,8 -0,8 3,2 24,2
615,04 3,24 0,64 10,24 585,64 SC=1214,8
Cálculo de la Suma de Cuadrados para datos presentados en tabla de
frecuencias
x f x*f
x f x*f
20 1 20
36,3488 20 1 20 400
21 1 21
25,2908 21 1 21 441
22 1 22 16,2328 22 1 22 484
23 3 69 27,5245 23 3 69 1587
24 4 96 16,4674 24 4 96 2304
25 4 100 4,2354 25 4 100 2500
26 7 182 0,0059 26 7 182 4732
27 4 108 3,7714 27 4 108 2916
28 2 56 7,7697 28 2 56 1568
29 4 116 35,3074 29 4 116 3364
30 3 90 47,3065 30 3 90 2700
31 1 31 24,7108 31 1 31 961
35 911 244,9714 35 911 23957
SC
s2
n 1
Nota. Otros autores definen a ésta como cuasi-varianza y como varianza a
la suma de cuadrados dividida por n. Ambos estadísticos son estimadores
de la varianza poblacional. Pero preferimos la definición dada por las
propiedades que lo caracterizan como estimador.
H=- fr*log10(fr)
Distribución con
máxima entropía
para variable con tres
categorías