Anda di halaman 1dari 40

MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIN

Lic. Esperanza Garca Cribilleros

ANLISIS EXPLORATORIO DE DATOS


Diagrama de tallo y hojas Diagrama de caja

DESCRIPCIN DE LOS DATOS


Tablas Grficos Medidas de

resumen

Diagrama de Tallos y hojas


Los datos tienen un decimal tallo Stem-and-Leaf Display: Perdida de peso Stem-and-leaf of Prdida de peso N = 65 Leaf Unit = 0.10 hojas
Terminacin de dgitos del 0 al 4 1 90 Terminacin de dgitos del 5 al 9 2 95 5 10 000 8 10 569 13 11 00003 15 11 78 26 12 00000000123 29 12 566 (11) 13 00000000224 25 13 555667 19 14 00000222333 8 14 556 5 15 00033

8 datos menores e iguales que 10.9

11 datos entre 13 y 13.4 y uno de ellos es la mediana 8 datos mayores e iguales que 14.5

BOXPLOT (Diagrama de Cajas)


Es un grfico que nos sirve para ver cmo estn distribuidas las observaciones (distribucin sesgada a la derecha o izquierda), comparacin de la dispersin de dos o mas conjuntos de datos y si existen valores extremos que afectan a la distribucin.

X mnimo Q1 Mediana Q3 Xmximo

Xmnino : Es la observacin de menor valor Xmximo : Es la observacin de mayor valor Q1 : Primer Cuartil Q3 : Tercer Cuartil Si aparece * en la grafica significa que es un valor extremo

EJEMPLO: Se tienen las edades de 35 pacientes:


35 36 45 36 22 32 12 23 45 38 21 54 64 55 35 43 45 21 20 56 39 37 34 38 45 28 53 22 46 33 28 26 29 27 28

Explorar los datos especialmente para ver la simetra.

DIAGRAMA DE CAJAS
EDAD DE 35 MADRES
70 60 50
Valor mximo

Valor Mximo

Edad

40 30 20 10

Q3 Me Q1 Valor mnimo

Diagrama de tallos y hojas


Stem-and-leaf of Edad N = 35 Leaf Unit = 1.0
12 madres tienen 29 aos o menos

11 madres tiene 43 aos o ms

1 12 (12) 11 5 1

1 2 3 4 5 6

2 01122367889 234556678889 355556 3456 4

Hojas

Tallo

MEDIDAS DE RESUMEN PARA VARIABLES CUANTITATIVAS


MEDIDAS DE TENDENCIA CENTRAL O DE POSICIN: MEDIA ARITMTICA, MEDIANA, MODA OTRAS MEDIDAS : PERCENTILES Y CUARTILES MEDIDAS DE DISPERSIN: RANGO VARIANZA DESVIACION ESTANDAR COEFICIENTE DE VARIACION INTERVALO CUARTILAR

MEDIDAS DE TENDENCIA CENTRAL O POSICIN


Son valores que indican el centro de la distribucin de los datos. Es el valor representativo de estos. Las ms usadas son: la media aritmtica o promedio, la mediana, moda, cuartiles y percentiles .

MEDIDA DE ASIMETRA

Distribucin simtrica: Cuando su curva de frecuencia es simtrica con respecto al centro de los datos, en este caso =Me=Mo.
Distribucion simetrica
9 8 7

Frequency

6 5 4 3 2 1 0 1 2 3


8 7 6

Distribucin asimtrica positiva >Me>Mo


Distribucion asimetrica positiva

Frequency

5 4 3 2 1 0 1 2 3

Distribucin
Distribucion asimetrica negartiva
8 7 6

asimtrica negativa <Me<Mo

Frequency

5 4 3 2 1 0 1 2 3

MEDIA ARITMETICA:
Medida descriptiva de tendencia central, llamada tambin promedio. Resulta de sumar los valores de todas las observaciones y dividir la sumatoria entre el total de ellas.

xi x1 + x2 + x3 +...+ xn x= = n n
Estadstica
Donde N es la poblacin n es la muestra xi Valores de x1, x2, , xn

xi N

Parmetro

la media muestral

Se caracteriza por: Ser nica Fcil de calcular Es afectada por todos los valores

PASOS PARA CALCULAR LA MEDIA:


1.

Verificar la simetra de los datos: Edades


35 36 45 36 22 32 12 23 45 38 21 54 64 55 35 43 45 21 20 56 39 37 34 38 45
2.

28 53 22 46 33
xi

28 26 29 27 28

EDAD DE 35 MADRES
70

60

50 Edad

40

n 35+ 36+ ...+ 28 = = 36.09 aos 35


Las madres tuvieron en promedio 36.09 aos

x=

30

20

10

MEDIANA
Es el valor que divide al conjunto ordenado de datos en dos grupos de igual tamao en cuanto al nmero de observaciones se refiere. Es nica, fcil de calcular y los valores extremos no afectan su valor. Pasos: 1. Los datos se ordenan en forma creciente: x1 + x2 ++xn 2. Calcular la mediana teniendo en cuenta: a) Si n es par: con la frmula

Me= x( n+1)/ 2

n Tamao de muestra Me es la mediana

x( n+1 ) / 2 Valor de la mediana

Datos ordenados
1 2 3 4 5 6 7 8 9 10 11 12 12 20 21 21 22 22 23 26 27 28 28 29 13 14 15 16 17 18 19 20 21 22 23 24 32 33 34 35 35 36 36 37 38 38 38 39 25 26 27 28 29 30 31 32 33 34 35 36 43 45 45 45 45 46 53 54 55 56 64

Me = xn+1 / 2 = 36 aos

n impar

Donde: Me es la mediana n es el tamao de la muestra (n+1)/2 es la posicin donde se encuentra la mediana.

b) Si n es par:
xn + xn Me =
2 2 +1

Donde:

X n/2 Valor en la pesa posicin X (n/2) +1 Valor en la posicin siguiente.

MODA
Valor ms frecuente en el conjunto. En el ejemplo es 45

Cuartiles
Tres valores que dividen a un conjunto de

datos en 4 partes iguales.


1 12 13 32 25 43 2 20 14 33 26 45 3 21 15 34 27 45 4 21 16 35 28 45 5 22 17 35 29 45 6 22 18 36 30 46 7 23 19 36 31 53 8 26 20 37 32 54

9 27 21 38 33 55

10 28 22 38 34 56

11 28 23 38 35 64

12 29 24 39 36

Q3
Q 1 =
Q3 =

Q1
35+ 1 Q1 = = 9 posicin 4
3( n + 1 ) Q3 = = 27 posicin 4

n + 1 4

3(n + 1) 4

Valor de Q=xn/2+0. ( x (n/2)+1 ) (xn/2)


Q1 25% 25% Q2 25% Q3 25%

RIC

Usos de los cuartiles:


Para indicar el porcentaje igual o menor que el valor de un cuartil Para construir la curva endmica Para describir el 50% central de las observaciones Elaboracin del grfico de caja.

CURVA ENDMICA

Q3 Q2 =Me Q1

PERCENTILES:

99 valores que dividen a un conjunto de datos en 100 partes iguales. Indica el porcentaje de la distribucin igual o menor a su valor. Ejemplo: Se tienen las edades de 35 madres.

1 2 3 4 5 6 7 8 9 10 11 12 12 20 21 21 22 22 23 26 27 28 28 29 13 14 15 16 17 18 19 20 21 22 23 24 32 33 34 35 35 36 36 37 38 38 38 39 25 26 27 28 29 30 31 32 33 34 35 36 43 45 45 45 45 46 53 54 55 56 64

Primero se ordenan los datos de menor a

mayor. Clculo: Pi =

k ( n +1 ) 100

P25 =

25( 35 + 1 ) = 9 posicin 100

El valor del percentil 25 es 27 aos Valor del percentil 70


70 * 36 P70 = = 25.2 43 + 0.2( 45 43 ) = 43.4 aos 10

Uso de los percentiles:


Para comparar un valor de un individuo

con un conjunto de normas. Para determinar Rangos normales de anlisis de laboratorio. Los lmites normales de muchos anlisis se ubican entre el percentil 2.5 y 97.5 . Tambin se usa para establecer el rango intercuartlico.

MEDIDAS DE DISPERSIN
Miden la variabilidad de un conjunto de datos.
Rango Varianza Desviacin estndar Coeficiente de variacin Intervalo cuartilar

RANGO
Es la diferencia entre el valor ms grande y el ms pequeo del conjunto de datos. Rango = Valor mximo - Valor mnimo R = 64 12 = 52

VARIANZA
Es la medida que cuantifica la variabilidad de los datos respecto al valor de la media.
(

s =
2

xi x ) n1

Donde: xi valores de la variable, x1 , x2, etc. n es de la muestra x es la media aritmtica

USOS:
En inferencia estadstica Para calcular la desviacin estndar. Para calcular el tamao de muestra.

Ejemplo: Los datos de la siguiente tabla son los mismos que se usaron para el clculo de las medidas de tendencia central.
35 36 45 36 22 32 12 23 45 38 21 54 64 55 35 43 45 21 20 56 39 37 34 38 45 28 53 22 46 33 28 26 29 27 28

s2 =

(35 36.09)2 + (32 36.09)2 + ... + (28 36.09)2


35 1

= 145.4436

(xi x) = 0

Propiedad de la media, por eso se eleva al cuadrado

PRUEBA DE HIPTESIS
One-Sample Kolmogorov-Smirnov Test respiraciones x minuti (muestra) 20 20.05 2.212 .111 .109 -.111 .496 .966

N Normal Parameters a,b Most Extreme Differences Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed)

Mean Std. Deviation Absolute Positive Negative

a. Test distribution is Normal. b. Calculated from data.

DESVIACION ESTANDAR: Es la raz cuadrada positiva de la varianza. Mide la variabilidad de los datos en las unidades en que se midieron originalmente. Los smbolos son: s, si es una muestra y ; si es una poblacin.

s =

Caractersticas de la desviacin estndar: 1. Siempre es un valor positivo 2. Est influenciada por todos los valores de la muestra o poblacin. 3. Mayor influencia ejercen los valores extremos debido a que son elevados al cuadrado en el clculo. 4. Sirve para definir la dispersin de los datos alrededor de la media.

s = s 2 = 145.4436 = 12.06
Interpretacin: Las madres tuvieron en promedio 36.09 aos con una desviacin estndar de 12.06

Aproximadamente el 68% de los alumnos tuvieron 36.09 12.06 aos.

5. Sirve para comparar

Tabla 1. Medidas Descriptivas de las Edades de dos Grupos Grupo A B Media 6 6 Varianza Desviacin Estndar 1.31 3.57

Dos grupos teniendo la misma media podemos identificar el ms disperso. Cuando las medias son diferentes , para identificar cul es el ms variado se tiene que hacer utilizando el COEFICIENTE DE VARIACIN.

COEFICIENTE DE VARIACIN:
Medida de variabilidad relativa: Se usa para comparar la variabilidad entre dos o ms muestras medidas en las mismas unidades o no.

s 12 .06 CV = 100 = = 33 .42 % x 36 .09


El CV es til cuando se quieren comparar el efecto de un tratamiento en dos o ms grupos.

Si el coeficiente es: < 10 % poca dispersin 10 33% aceptable 34 50% alta dispersin > 50% muy alta

PREGUNTAS
Porqu se usa la media junto con la desviacin

estndar en el anlisis de datos? Se quiere expresar una medida que represente a todos los datos (media) pero al mismo tiempo se desea expresar la variacin de los mismos respecto a esa medida de tendencia central. Cul es la medida que expresa homogeneidad de un conjunto de datos? El coeficiente de variacin Cul es la ventaja de calcular medidas de resumen con los datos sin agrupar? La mayor exactitud de stas.

MEDIDAS DE RESUMEN CON DATOS AGRUPADOS


Ejemplo: PRESIN SISTLICA EN 100 PACIENTES
Presin sistlica (mmHg) 107-116 117-126 127-136 137-146 147-156 157-166 Total Total

N
7 21 42 18 8 4 100 100

Pm
112 122 132 142 152 162

Fa
7 28 70 88 96

100

CLCULO DE LA MEDIA ARITMTICA:


(m i f i ) 100
k

x =

i=1

mi fi n

es el punto medio frecuencia absoluta absoluta tamao de la muestra

(1127) + (122 21) +...+ (162 4) x= =133 .1mm/ Hg 100

PRESIN SISTLICA EN 100 PACIENTES


Presin sistlica (mmHg)

N
7 21 42 18 8 4

Pm
112 122 132 142 152 162

Fa
7 28 70 88 96 100

107-116 117-126 127-136 137-146 147-156 157-166

Total

100
d1 Mo = LI + I d +d 1 2
21 Mo = 127 + 10 = 131.67mmHg 21 + 24

n Fa I Me = LI + 2 f Me 50 28 Me = 127 + 10 = 132.24 mmHg 42

Clculo de la Mediana:

Clculo de la Varianza: PRESIN SISTLICA EN 100 PACIENTES


Presin sistlica (mmHg)
107-116 117-126 127-136 137-146 147-156 157-166

N
7 21 42 18 8 4

Pm
112 122 132 142 152 162

Fa
7 28 70 88 96

100

Total
s2

100
2

2 2 (m i x ) x n (x ) = = n1 n1

2 2 2 ( ) ( ) ( ) 112 133 . 1 7 + 122 133 . 1 21 + ... + 162 133 . 1 4 2 2 s = =18 .6mmHg

99

DESVIACIN ESTNDAR

s = 18.6 = 4.31 mmHg

CALCULO DE CUARTILES Y PERCENTILES


Presin sistlica (mmHg)

N
7 21 42 18 8 4

Pm
112 122 132 142 152 162

Fa
7 28 70 88 96 100

107-116 117-126 127-136 137-146 147-156 157-166

Total
k (n) Fa I Q k = LI + 4 fQ1

100
25 7 Q1 = 117 + 10 = 125.57 mmHg 21

k ( n) Fa I Pk = LI + 100 f Pk

95 88 P95 = 147 + 10 = 155.75 mmHg 8

Anda mungkin juga menyukai