Anda di halaman 1dari 32

MEDIDAS EN LA ESTADSTICA DESCRIPTIVA

Profesores: Tatiana Burga Wilver Rodrguez

MEDIDAS DE TENDENCIA CENTRAL


Las medidas de tendencia central nos permiten resumir el conjunto de

observaciones en un valor, que


describe a la caracterstica de estudio de la poblacin. Las tres medidas de tendencia central de uso ms frecuente son: La media La moda La mediana

Medidas de tendencia central para datos no agrupados


_ Media Aritmtica: X Es el valor representativo del conjunto de datos que se esta estudiando y caracteriza a toda una distribucin. Se define como: n _ xi /n i=1 X = Ejemplo: Los siguientes datos son das hospitalarios obtenidos de 5 pacientes Xi 10, 13, 15, 12 y 8 das El nmero promedio de das de hospitalizacin 58 X 10 + 13 + 15 + 12 + 8 = __ = 11.6 = 5 5 Interpretacin: El nmero das promedio aproximado de das de hospitalizacin en los pacientes es de 12 das aproximadamente.

PROMEDIO ARITMETICO PONDERADO.


Se define como suma del producto de cada dato por el peso, importancia o repeticin, dividido entre la suma de todos los pesos, importancia o repeticin. xi n i
n

i=1 _ X = ------------------n

i=1

ni

Ejemplo:
En un estudio se observo en nmero de das de hospitalizacin de los pacientes por servicio en un hospital. Los resultados son los siguientes: _ _ Servicio. Xi ni xi ni A 12 60 12 x 60 = 7 20 B 8 30 8 x 30 = 240 C 4 10 4 x 10 = 40 ni 100 xini = 1000 Luego: _ xini 1000 X = _______ ________ = 10 ni 100 Interpretacin: El nmero de das promedio de hospitalizacin de los pacientes por servicio es aproximadamente de 10 das.

DESVENTAJA DE LA MEDIA ARITMETICA.


La desventaja mas relevante de la media aritmtica es de que esta afectada por los valores extremos, ya que para el calculo se incluye todos los datos. Ejemplo: Se tiene las siguientes edades: 65,70,60,75,80,15,18 _ X = (65+70+60+75+80+15+18)/7 = 388/7 = 54.7aos El promedio est sub estimado. Ejemplo: Se tiene los siguientes edades: 20,15,20,30,28,25,75,90 _ X = (20+15+20+30+28+25+75+90)/8 = 303/8 = 37.875 El promedio esta sobre estimado.

LA MEDIANA (Me)
La mediana es un valor que divide a la distribucin ordenada (en forma ascendente o descendente) en dos grupos iguales, es decir a cada grupo le corresponde el 50% de los datos. 50% V. min. | Me. 50% V. mx.

Para calcular el valor de la mediana de los datos x1, x2 ... Xn se tendr en cuenta el siguiente procedimiento: 1. Se ordenan los datos en forma ascendente o descendente.

2. Si n es impar, el valor de la mediana es el valor del centro, es decir: Me = X (n+1) / 2 donde: (n+1) /2 es la posicin de la mediana. 3. Si n es par , el valor de la mediana ser el promedio entre X(n/2) y X(n/2)+1 ; es decir: X(n/2) + X(n/2)+1 Me = ____________ 2 Esto quiere decir, que el valor de la mediana se encuentra entre los valores cuya posicin son n/2 y (n/2) + 1 .

Ejemplo:
Hallar la mediana de los siguientes datos, que indica el nmero de das de hospitalizacin de 5 pacientes: 12, 15, 13, 4, 10 . Ordenando la serie se tiene : 4, 10, 12, 13, 15 Como el nmero de datos es impar (n=5), se tiene que la posicin de la mediana es (n+1)/2=(5+1)/2 =3, por consiguiente, el valor de la mediana est ubicada en la posicin 3, es decir Me= x3 = 12 das. Interpretacin: El 50% de los pacientes tienen 12 das de hospitalizacin o menos y el 50% restante tiene por encima de 12 das de hospitalizacin.

Ejemplo:
Calcular la mediana de los siguientes pesos (en Kg) de 6 nios: 35, 37, 40, 31, 27, 39 Ordenando los pesos en forma ascendente: Peso: 27, 31, 35, 37, 39, 40 En este caso n es un nmero par por consiguiente la mediana se localizara entre la posicin X n/2 y X (n/2+1) = X3 y X4 n/2 = 6/2 = 3 (n/2) + 1 = 3 + 1 = 4 Es decir entre los valores 35 y 37 Por tanto el valor de la mediana es: Me = 35 + 37 = 72 = 36 2 2 Interpretacin: El 50% pesos de los nios tienen son iguales o inferior es a 36 Kg. Y el 50% restante tendrn una peso por encima de los 36 Kg.

PROPIEDADES DE LA MEDIANA.
1. Es nica , existe solamente una

mediana para un conjunto de datos.


2. Los valores extremos no tienen efectos importantes sobre la mediana. 3. Se aplica tambin a variables que pertenecen a la escala ordinal.

La Moda (Mo)
Se utiliza mayormente cuando se esta interesado en la observacin mas frecuente. La Moda es la observacin que mayormente se repite (o es la observacin que posee la mayor frecuencia). Ejemplo: Hallar la moda en los siguientes datos:

2,5,7,2,8,2,2,1,2,4,2,2 1,8,6,4,2,4,3,2,1,5

La Mo = 2 Mo = 1 Mo = 2 Mo = 4 No existe moda

1,7,9,3,8,5,6

PROPIEDADES DE LA MODA
1. Si todos los valores son

diferentes, no hay moda.


2. En una distribucin puede existir

dos o ms modas.

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS. _ MEDIA ARITMETICA. ( X ).


Cuando los datos estn agrupados en intervalos, para hallar la media se utiliza la siguiente frmula: fi Xi
_ K

X=

i=1 ----------------------K

fi
i=1

donde: x1, X2 ... XK : Son marcas de clase. f1, f2 ... fK : frecuencias absolutas que corresponden a las marcas de clase o intervalos. K : nmero de clase o intervalos.

Ejemplos: Los siguientes datos son los pesor(Kg) en una muestra de pacientes que pasaron consulta en un hospital.

Peso 40-50 50-60 60-70 70-80 80-90 TOTAL

Xi 45 55 65 75 85

fi 7 10 20 8 5 50

Xi*fi 315 550 1300 600 425 3190

_ X = 3190 / 50 = 63.8 64 kilos. Interpretacin: El peso promedio aproximado de los pacientes es aproximadamente de 64 kilos.

E. MEDIANA (Me)
Para calcular la mediana en una tabla de distribucin se usa la siguiente frmula:

(n/2 - F i-1 ) ME= Li + _____________ x C f Me Donde: n / 2 : posicin de la Me L i : Lmite real inferior de la clase que contiene la Me. n : nmero total de observaciones. Fi-1 : Frecuencia absoluta acumulada de la que contiene a la mediana (clase mediana). fMe : frecuencia absoluta de la clase que contiene a la Me. C : Amplitud de la clase que contiene a la mediana. * Clase mediana: es la primera clase cuya frecuencia absoluta acumulada excede a n/2

Ejemplo:
Calcular la Me de la siguiente distribucin de frecuencias:

Peso(Kg) 40-50 50-60 60-70 70-80 80-90 TOTAL

Xi 45 55 65 75 85

fi 7 10 20 8 5 50

Fi
7 17 37 45 50

Procedimiento:
1. Calcular las frecuencias acumuladas Fi 2. Calcular n/2 = 50/2 = 25 sirve para detectar la clase mediana. 3. Clase mediana: clase cuyo Fi excede a 25 (60 - 70) 4. De la clase mediana se obtiene: L i = 60 Fi - 1 = 17 C =10 fMe = 20 Los valores encontrados en (2), (3) y (4) lo reemplazamos en la formula y se tiene: Me = 60 + 25 - 17 x 10 20 Me = 64 Interpretacin: El 50% de los pacientes tienen un peso igual o inferior a 64 kilos y el otro 50% tendr un peso superior a 64 kilos.

F. MODA (Mo)
En una tabla de distribucin de frecuencias es aproximadamente la marca de clase o punto medio de la clase que tiene la mayor frecuencia absoluta simple. Peso(kg) fi 40 - 50 7 50 - 60 10 60 - 70 20 70 - 80 8 80 - 90 5 total 50 La moda estar ubicado en el intervalo: Aptitud fi 60 - 70 20

Por lo tanto la marca de clase ser 60 + 70 _______ 2 Luego la Mo = 65 Interpretacin: El peso ms frecuente en los pacientes es aproximadamente de 65 kilos.

LOS CUANTILES.
Son aquellos que dividen a la distribucin en cuatro, diez o cien partes iguales.

Cuartiles. Deciles. Percentiles.

Cuartiles (Q).
Son aquellos que dividen a la distribucin en cuatro partes iguales, en donde cada uno de ellos incluye el 25% de las observaciones.

Las frmulas para calcular los cuartiles son parecidas a la de la mediana, as: Q1 = L1 + 1n/4 - Fi-1 x C fQ1 Q2 = Me Q3 = Li + 3n/4 - F i-1 xC fQ3 Donde: Li = Limite real inferior de la clase que contiene el Q1 Q3 . Fi-1 = frecuencia absoluta acumulada de la clase anterior a la que contiene a Q1 Q3 fQ1 fQ3 = frecuencia absoluta de la clase que contiene el Q1 Q3 C = ancho de la clase que contiene el Q1 Q3

Ejemplo:
Calcular el Q1 de la siguiente distribucin de frecuencias:

Peso(Kg) 40-50 50-60 60-70 70-80 80-90 TOTAL

fi 7 10 20 8 5 50

Fi
7 17 37 45 50

Q1.
Primero se calcula 1n/4; es decir 1x50/4 = 12.5 Luego se observa que frecuencia absoluta acumulada contiene a 12.5 La frecuencia absoluta acumulada que contiene a 12.5 es 17 Entonces el intervalo que contiene al Q1 es: 50 - 60 De esta informacin se tiene qu: Li = 50 Fi-1 = 7 fQ1 = 10 C = 10

Reemplazando en la frmula se Q1 = L1 + 1n/4 - Fi-1 x C fQ1 Q1 = 50 + 12.5 - 7 = 55.5 10 x 10 Interpretacin: El 25% de los pacientes tienen un peso igual o inferior a 55.5 kilos y el 75% tiene un peso superior a 55.5 kilos.

DECILES (D)
Son aquellos que dividen a la distribucin en diez partes iguales en donde cada uno de ello incluye el 10% de las observaciones

Las formulas son tambin similares a las de Q1 , Q3 As: D1 = Li +1n/10 - F i-1 x C fD1 D5 = Me D7 = Li + (7n/10 - F i-1 ) x C fD7 Donde: Li = Limite real inferior de la clase que contiene el D1 D7 . Fi-1 = frecuencia absoluta acumulada de la clase anterior a la que contiene a D1 Q7 fD1 fD7 = frecuencia absoluta de la clase que contiene el D1 D 7 C = ancho de la clase que contiene el D1 D7

Ejemplo:
Calcular el D4 de la siguiente distribucin de frecuencias:

Peso(Kg) 40-50 50-60 60-70 70-80 80-90 TOTAL

fi 7 10 20 8 5 50

Fi
7 17 37 45 50

D 4.
Primero se calcula 4n/10 ; es decir 4x50/10 = 20 Luego se observa que frecuencia absoluta acumulada contiene a 20 La frecuencia absoluta acumulada que contiene a 20 es 37 Entonces el intervalo que contiene al D4 es: 60 - 70 De esta informacin se tiene qu: Li = 60 Fi-1 =17 fQ1 = 20 C = 10

Reemplazando en la frmula se D4 = L1 + 4n/10 - Fi-1 x C fQ1 D4 = 60 + 20 - 17 = 61.5 20 x 10 Interpretacin: El 40% de los pacientes tienen un peso igual o inferior a 61.5 kilos y el 60% tiene un peso superior a 61.5 kilos.

PERCENTILES (P)
Son aquellos que dividen a la distribucin en cien partes iguales en donde cada uno de ello incluye el 1% de las observaciones
_1%_I. 1%_I. 1%_I._1%_I._1%_. .........._1%_I_1%_I._1%_I._1%_I._1%_
P1 P2 P3 P4 ........... P96 P97 P98 P99

Las formulas son parecidas a los cuartiles y deciles, As: P10 = Li + 10n/100 - F i-1 x C fP10 P60 = Li + 60n/100 - F i-1 fP60 C x C

= ancho de la clase que contiene el P10 P60

Ejemplo:
Calcular el P10 de la siguiente distribucin de frecuencias:

Peso(Kg) 40-50 50-60 60-70 70-80 80-90 TOTAL

fi 7 10 20 8 5 50

Fi
7 17 37 45 50

P10.
Primero se calcula 10n/100 ; es decir 10x50/100 = 5 Luego se observa que frecuencia absoluta acumulada contiene a 5 La frecuencia absoluta acumulada que contiene a 5 es 7 Entonces el intervalo que contiene al P10 es: 40 - 50 De esta informacin se tiene qu: Li = 40 Fi-1 =0 fQ1 = 7 C = 10

Reemplazando en la frmula se P10 = Li + 10n/100 - Fi-1 x C fQ1 P10 = 40 + 5 - 0 x 10 = 47.14 47 7 Interpretacin: El 10% de los pacientes tienen un peso igual o inferior a 47 kilos y el 90% tiene un peso superior a 47 kilos.

Ejercicio:
Los siguientes datos son nmero de das de hospitalizacin en una muestra de pacientes que fueron intervenidos quirrgicamente en un hospital. Los resultados se presentan a continuacin: __________________________ N de Das fi Fi __________________________ 5 - 7 50 50 8 - 10 100 150 11 - 13 20 170 14 - 16 10 180 17 - 19 5 185 ___________________________ Total 185 ____________________________ Calcular e interpretar las tres medidas de tendencia central. Calcular e interpretar Q1, Q3, D3, D8. P20. P90