Anda di halaman 1dari 25

1

INDICE .

PARTE II. ELEMENTOS DE PROBABILIDAD Y ESTADSTICA

1. Estadstica Descriptiva
1.1 Introduccin
1.2 Organizacin de los datos de un conjunto
1.3 Distribuciones de frecuencias
1.3.1 Definicin de distribucin de frecuencia. Terminologa
1.3.2 Reglas generales para formar distribuciones de frecuencia
1.3.3 Ejercicios
1.4 Representacin grafica de los datos de un conjunto
1.4.1 Variables Cualitativas
1.4.2 Variables Cuantitativas Discretas
1.4.3 Variables Cuantitativas Continuas
1.4.4 Ejercicios
1.5 Medidas de tendencia central
1.5.1 La media aritmtica (Media Ponderada)
1.5.2 La moda
1.5.3 La mediana
1.5.4 Ejercicios
1.6 Medidas de dispersin
1.6.1 Amplitud (recorrido o rango)
1.6.2 Desviacin tpica (o estndar).Varianza
1.6.3 Ejercicios
1.7 Medidas de Posicin
1.7.1 Cuantiles(cuartiles, deciles y percentiles)
1.7.2 Ejercicios
2

PARTE II. ELEMENTOS DE PROBABILIDAD Y ESTADISTICA

1. ESTADSTICA DESCRIPTIVA

1.1 INTRODUCCION

La estadstica se puede definir como la ciencia encargada de recopilar,


organizar e interpretar conjuntos de datos, de manera que pueda llevar a
conclusiones vlidas. Los datos se obtienen (de una muestra o poblacin)
observando o experimentando.

- La primera parte de la definicin: recopilar, organizar e interpretar


conjuntos de datos se llama Estadstica Descriptiva.

- La segunda parte: interpretar datos de manera que pueda llevar a


conclusiones vlidas se llama Estadstica Inferencial.

Nos ocuparemos de la Estadstica Descriptiva.


Cuando el nmero de datos es relativamente grande, resulta conveniente,
para facilitar su interpretacin, primero organizarlos y luego representarlos
grficamente.

1.2 ORGANIZACIN DE LOS DATOS DE UN CONJUNTO

Los datos recopilados se analizan de acuerdo con una caracterstica:


CUALITATIVA, por ejemplo, el estado civil, sexo y nacionalidad de una
persona; calidad de un plaguicida, como daino o no daino para la salud.
Cuando la caracterstica es CUANTITATIVA se distinguen dos casos:
caractersticas discretas, como el nmero de hijos en la familia. En este
caso la variable toma valores aislados, 0, 1, 2, 3, etc. Caractersticas
continuas, como el peso y la estatura de una persona. Aqu la variable en
consideracin toma todos los valores reales en un intervalo.

1.3 DISTRIBUCIONES DE FRECUENCIAS

1.3.1 DEFINICION DE FRECUENCIA Y TERMINOLOGA

Definicin:
Las distribuciones de frecuencias son disposiciones tabulares de los datos,
por clases con sus respectivas frecuencias absolutas.

Terminologa:
CLASES. (Para una caracterstica continua): Son intervalos abiertos o
cerrados. Deben ser exhaustivos y excluyentes; es decir, tales que se
elimine la posibilidad

Lic. Mauro H. Henrquez Rauda


3

de que un dato dado no corresponda a clase alguna o que pueda quedar


incluido en ms de una.
FRECUENCIA ABSOLUTA: Es el nmero de datos que pertenecen a la clase.
Ejemplo 1.
Distribucin de frecuencias de puntajes obtenidos por 120 estudiantes en un
examen de matemtica.

Clase Puntajes (x) Frecuencias Absolutas


1ra. 28 - 32 10
2da. 33 - 37 15
3ra. 38 42 20
4ta. 43 47 35
5ta. 48 52 19
6ta. 53 57 12
7ma. 58 - 62 9
Total 120

- Los nmeros que definen una clase: 28-32, 33-37, etc. se llaman
Lmites de Clase.
- Los valores a la izquierda: 28, 37, etc. se llaman Limites Inferiores
aparentes, los valores a la derecha: 32, 37, etc. son los Limites
Superiores aparentes de la clase.
- La diferencia entre el lmite superior (ls) y el lmite inferior (li), ms 1,
es un Intervalo de Clase (o Amplitud de Clase); y se denota por ic .
En smbolos:
ic = l s l i + 1
- Marca de clase o punto medio: Es la mitad de la suma de los
lmites
de la clase.
Los datos que corresponden a una variable continua, generalmente no son
medidas exactas. As decimos por ejemplo que 58 es un valor que est entre
57.5 y 58.5; el primero es el lmite real inferior y el segundo es el lmite
real superior. Para estas distribuciones ic = lrs lri.
A continuacin se presenta la distribucin de frecuencias del ejemplo
anterior, con lmites reales.
Ejemplo 2.
Clase Puntajes Frecuencias Absolutas
1ra. 27.5 a menos de 32.5 10
2da. 32.5 a menos de 37.5 15
3ra. 37.5 a menos de 42.5 20
4ta. 42.5 a menos de 47.5 35
5ta. 47.5 a menos de 52.5 19
6ta. 52.5 a menos de 57.5 12
7ma. 57.5 a menos de 62.5 9
Total 120
4

Lic. Mauro H. Henrquez Rauda

En general, la distribucin de frecuencias para una muestra de tamao n y


un nmero k de clases, con frecuencias fk, respectivamente, se representa
as:

Clase Frecuencia Absoluta


clase 1 F1
clase 2 F2

clase i Fi

clase k Fk
Total n

k
La frecuencia relativa es fi/n, donde 0 fi/n 1 y fi / n = 1.
i 1
Cuando fi/n se multiplica por 100, se llama frecuencia porcentual. La
frecuencia acumulada menor que fi se denota por Fi y es la suma de las
frecuencias absolutas que van desde la clase 1 hasta la clase i. En smbolos:
Fi = f1 +f2 + f3 ++ fi
Ejemplo 3.
Distribucin de frecuencias porcentuales y acumuladas, basada en los datos
que aparecen en la ejemplo 1.

Puntajes Frecuencias Frecuencia fa Fia menor que Fia ms que


(x) absolutas porcentual
28 - 32 10 8.33 10 8.33 100
33 - 37 15 12.50 25 20.83 91.67
38 - 42 20 16.67 45 37.50 79.17
43 - 47 35 29.17 80 66.67 62.50
48 - 52 19 15.83 99 82.50 33.33
53 - 57 12 10.00 111 92.50 17.50
58 - 62 9 7.50 120 100.00 7.50

Con sta distribucin de frecuencias podemos tener, entre otras, las


siguientes informaciones:

- El 29.17 % de los estudiantes obtuvieron puntaje entre 43 y 47.


- El 61.67 % sacaron puntajes entre 38 y 52.
- La Fa, 45, que aparece en la tercera clase significa que 45 estudiantes
sacaron puntajes de 42 o menos.
- El 17.5 % de estudiantes obtuvieron 53 y ms puntos.
5

Lic. Mauro H. Henrquez Rauda

1.3.2 REGLAS GENERALES PARA FORMAR DISTRIBUCIONES DE


FRECUENCIAS

1. Determinar el mayor y el menor de todos los datos, hallando as el


rango (diferencia entre ambos).
2. Dividir el rango en un nmero adecuado de intervalos de clase del
mismo tamao (de igual amplitud).
3. Mediante una hoja de recuentos, determinar el numero de datos que
caen dentro de cada intervalo de clase; esto es hallar la frecuencia de
clases.

1.3.3 EJERCICIOS

1. A continuacin se le presenta las calificaciones de un examen de


matemtica, de un grupo de 40 estudiantes.

6.7 6.3 8.7 7.9 8.8 9.2 8.6 8.3 7.8 4.1
6.6 6.8 7.7 4.6 7.6 8.1 9.2 8.4 8.6 7.0
6.0 7.7 8.1 9.8 7.5 8.1 8.2 8.7 7.8 7.0
6.1 9.4 8.1 5.2 7.9 8.2 7.7 7.7 7.0 7.4

a) Transforme la serie simple en una distribucin de clases y frecuencias,


utilizando ic = 0.5.
b) Haga lo mismo utilizando ic = 0.7.
c) Determine las marcas de clase .

2. Con los datos del ejercicio anterior, utilizando un ic = 0.7 calcule:

a) Las frecuencias relativas.


b) Las frecuencias relativas acumuladas menos que y mas que.
c) Haga un comentario de sta variable.

3. Utilizando la siguiente tabla:


Estatura f Famenos Fa ms que f% Fa %ms Fa %menos
en cm que que que
178 184 4 40 4 10.0 100.00 10.00
0
171 177 10 36 14 25.0 90.00 35.00
0
164 - 170 15 26 29 37.5 65.00 72.50
0
157 -163 8 11 37 20.0 27.50 92.50
0
6
150 - 156 3 3 40 7.50 7.50 100.00
Total 40

Lic. Mauro H. Henrquez Rauda

a) Qu % de personas tienen estaturas de ms de 1.70 metros?.


b) Qu % de personas tienen estaturas de 1.64 o ms metros?.
c) Qu % de personas tienen estaturas de menos de 1.64 metros?.
d) Cuntas personas tienen estaturas debajo de 1.64 metros ?.
e) Cuntas personas tienen estaturas arriba de 1.63 metros ?.
f) Qu % de personas tienen estaturas entre 1.78 y 1.84 metros inclusive ?.

4) Dada la siguiente distribucin de frecuencias:

Xi f
80 - 81 6
82 83 14
84 85 30
86 87 33
88 - 89 13
90 - 91 4

a) Calcule las frecuencias acumuladas del tipo menos que y ms que.


b) Calcule el % de datos de 87 o menos.
c) Calcule el % de datos mayores o iguales a 82.
d) Calcule el % de datos mayores o iguales a 82 pero menores o iguales que
89

5. A continuacin se presenta los resultados del rendimiento escolar de los


alumnos de dos secciones A y B de un sexto grado de una escuela:

Calificaciones F (seccin A) F (seccin B)


1-2 2 2
3-4 5 8
5-6 15 22
7-8 5 9
9-10 3 5

Cree usted que la seccin B, ha salido mejor que la seccin A, ya que en la


seccin B hay 22 alumnos cuyas calificaciones estn entre 5 y 6, mientras
que en la seccin A slo hay 15 alumnos entre esas calificaciones. Justifique
su respuesta.
Sugerencia: Transforme las frecuencias absolutas, en frecuencias relativas.
7

7. La siguiente informacin corresponde al peso, en libras, de un grupo de 50


estudiantes.

Lic. Mauro Henrquez Rauda


100 103 113 110 110 107 108 110 114 115
116 117 118 117 117 120 117 121 120 120
124 124 124 124 127 125 125 128 128 130
131 131 131 132 133 134 135 136 138 138
140 141 142 145 148 146 145 162 152 150

Transforme esta serie en una distribucin de clases y frecuencias, con 9


clases.

8. Transforme la serie del ejercicio anterior en una distribucin de clases y


frecuencias, utilizando un intervalo de clase de ic = 10.

9. Dada la siguiente distribucin de clases y frecuencias:

x F
100-106 2
107-113 6
114-120 11
121-127 8
128-134 9
135-141 6
142-148 5
149-155 2
156-162 1
Total 50

Calcule las siguientes columnas: frecuencia relativa, frecuencia relativa


acumulada y marcas de clase.

10. A continuacin se presentan 40 mediciones del dimetro de arandelas:

0.19 0.29 0.30 0.27 0.32 0.22 0.22 0.15 0.22 0.27
0.35 0.19 0.32 0.27 0.39 0.32 0.24 0.27 0.23 0.28
0.37 0.17 0.37 0.26 0.37 0.27 0.32 0.29 0.26 0.28
0.25 0.20 0.22 0.27 0.32 0.27 0.34 0.27 0.26 0.27

Presente sta informacin mediante una distribucin de clases y frecuencias,


usando un intervalo de 0.05. Comience la primera clase con 0.15 como lmite
aparente inferior.
8

Lic. Mauro H. Henrquez Rauda


1.4 REPRESENTACION GRAFICA DE LOS DATOS DE UN CONJUNTO

La seleccin apropiada de una grfica puede relacionarse con el carcter de


la variable en estudio. Los principales tipos de grficas que corresponden a
las variables cualitativas , cuantitativas discretas y continuas, se pueden ver
en el cuadro siguiente:

Variable Tipo de Grfica


Barras separadas
Cualitativa Circular o de Pastel
Barras
Cuantitativa discreta Circular o de Pastel
Histograma
Cuantitativa continua Polgono de frecuencias

1.4.1 VARIABLES CUALITATIVAS.

BARRAS SEPARADAS.

Ejemplo 4.
Una pequea encuesta estudiantil sobre preferencias de bebidas gaseosas
produjo los siguientes resultados:

Pepsi coca fanta coca fanta coca pepsi salva pepsi


Salva coca fanta coca pepsi pepsi pepsi salva sprite
Sprite fanta pepsi fanta coca salva coca pepsi
Sprite pepsi coca pepsi sprite sprite salva coca
salva salva coca coca fanta pepsi salva coca
coca coca pepsi coca coca fanta coca fanta

Despus del conteo, la distribucin en clases y frecuencias queda como


sigue:

i bebida fi fri % Fi %
1 Coca 17 34 34%
2 Fanta 8 16 50%
3 Pepsi 11 22 72%
4 Salva 8 16 88%
5 Sprite 6 12 100%
9
total 50

Lic. Mauro H. Henrquez Rauda

Grafica de barras separadas para las compras de bebidas gaseosas.

CIRCULAR

Grafica circular para las compras de bebidas gaseosas.

1.4.2 VARIABLES CUANTITATIVAS DISCRETAS

Ejemplo 5.
10

Distribucin de frecuencias del nmero de maestros en una muestra de


escuelas pblicas, en Chalatenango.

Lic. Mauro H. Henrquez Rauda

Nmero de maestros Cantidad de escuelas


5 6
6 8
7 10
8 12
9 8
10 11
11 7
12 4

1.4.3 VARIABLES CUANTITATIVAS CONTINUAS

Un histograma es una grfica constituida por barras verticales no


separadas(lmites reales).
Para construirlo se marcan en el eje horizontal las clases y en el eje vertical
las frecuencias. Sobre el intervalo correspondiente a cada clase se dibuja
una barra de rea proporcional a su frecuencia.

Ejemplo 6.
Clasificacin de 40 alumnos de una escuela rural de acuerdo a su peso en
libras.
11
Frecuencia
Clases Frecuencia Puntos medios acumulada Frecuencia
menos de relativa
29.5 34.5 1 32 1 0.025
34.5 39.5 3 37 4 0.075
39.5 44.5 8 42 12 0.200
44.5 49.5 9 47 21 0.225
49.5 54.5 7 52 28 0.175
54.5 59.5 4 57 32 0.100
59.5 64.5 3 62 35 0.075
64.5 69.5 3 67 38 0.075
69.5 74.5 2 72 40 0.050
Total 40 1.000

La comparacin de dos o mas distribuciones de frecuencias resulta fcil, si en


lugar de levantar una barra sobre el intervalo correspondiente al la clase, se
marca un punto con abscisa el punto medio y como ordenada la frecuencia.
Luego los puntos se une con segmentos de recta y la figura resultante se
denomina polgono de frecuencias. El rea bajo el polgono de be ser
igual al rea comprendida por el histograma. Para lograr esto, usualmente el
polgono se prolonga tal como puede apreciarse en la grfica siguiente,
procediendo como si existiera una clase adicional al principio y otra al final,
ambas con frecuencia de cero.
12

Lic. Mauro H. Henrquez Rauda

1.4.4 EJERCICIOS PROPUESTOS: Ver gua de ejercicios.

1.5 MEDIDAS DE TENDENCIA CENTRAL

1.5.1 LA MEDIA ARITMETICA

Entre las medidas de tendencia central, la mas popular es la media


aritmtica, que comnmente se llama promedio

DEFINICION: La media aritmtica de un conjunto de N datos:


x1, x2, .., xN, se denota por x y se define as:
13

N
Suma de todos los datos
x
Nmero total de datos = x1 x 2 .....x N x i
i 1

N N

NOTA: El smbolo es la letra griega sigma mayscula que corresponde a


la letra S.

EJEMPLO 1: Calcular la media de 8, 16, 4, 12 y 10

SOLUCION:
8 16 4 12 10 50
x 10
5 5
Advierta: la media es uno de los datos.

Lic. Mauro H. Henrquez Rauda


EJEMPLO 2: Calcular la media de 8, 16, 4, 12 y 5

SOLUCION:
8 16 4 12 5 45
x 9
5 5
La media, 9, no es uno de los datos
Si los nmeros x1 x 2 .....x N ocurren f 1 , f 2 ,....., f N veces, respectivamente (o
sea con frecuencias f 1 , f 2 ,....., f N ), la media aritmtica es

N N

f x f x ........f N x N fi x i f x i i
x 1 1 2 2 i 1
i 1
f1 f 2 ..........f N N
N
f
i 1
i

EJEMPLO 3: 5,8,6 y 2 ocurren con frecuencias 3,2,4 y 1 respectivamente.


Hallar la media.
SOLUCION:
3(5) 2(8) 4(6) 2 15 16 24 2 57
x 5.7
3 2 4 1 10 10

A veces asociamos con los nmeros x1 , x 2 ,....,.x N , unas ponderaciones (o


pesos) w1 , w2 ,....., w N , dependiente de la relevancia asignada a cada nmero
(no a su frecuencia). En este caso:

w x w2 x 2 .....wN x N w x i i
x 1 1 i 1

w1 w2 .....wN N

w
i 1
i
14

Se llama media aritmtica ponderada con pesos w1, w2,......, wn

EJEMPLO 4: El primer examen parcial vale el 20%, el segundo parcial, el 25%,


las tareas el 30% y el examen final el 25% de la nota final. Si un estudiante
tiene las calificaciones 1er. P: 3.0; 2.P: 5.8; tareas: 8.0 y EF: 6.4, Cul es la
media aritmtica ponderada (nota final)?SOLUCION:

(0.2)(3.0) (0.25)(5.8) (0.3)(8.0) (0.25)(6.4)


x 6.05
0.2 0.25 0.30 0.25

VERIFICANDO SU COMPRENSIN

1. Calcule la media aritmtica para el conjunto de datos.


a) 6,8,3,9 y 5 b) 6,6,8,8,3,9,9,9,5 y 5

Lic. Mauro H. Henrquez Rauda


2. Calcule la media aritmtica ponderada para el conjunto de datos 3.0, 2.0,
6.5 y 8.4 con los pesos: 20%, 20%, 30% y 30% respectivamente.

1.5.2 LA MODA

DEFINICION: La moda de un conjunto de nmeros es el valor que ocurre


con mayor frecuencia (valor ms frecuente)

NOTA: La moda de un conjunto puede no existir, e incluso no ser nica, en


caso de existir.
EJEMPLO 5. El conjunto 1,2,3,3 y 4 tiene moda 3
EJEMPLO 6. El conjunto 1,2,3, y 4 no tiene moda
EJEMPLO 7. El conjunto 1,1,2,2,3 y 4 tiene dos modas: 1 y 2; se dice que es
bimodal.

1.5.3 LA MEDIANA

DEFINICION: La mediana (med) de un conjunto de nmeros ordenados en


sentido creciente (decreciente) es: el valor central, si el nmero de datos es
impar; o la media de los valores centrales, si el nmero de datos es par.

EJEMPLO 8. El conjunto de nmeros 3,4,4,5,6,8,8,8 y 10 tiene mediana 6


68
EJEMPLO 9. El conjunto de nmeros 5,5,6,8,9 y 10 tiene mediana x 7
2
EJEMPLO 10. Calcular la mediana del conjunto: 8,5,10,7,6,9,2,2,5 y 6
15

SOLUCION:
Primero se ordenan los nmeros (orden creciente): 2,2,5,5,6,6,7,8,9 y 10.
Como hay un nmero impar de datos, la mediana es 6 (la mediana es uno de
los datos)
EJEMPLO 11. Calcular la mediana del conjunto: 7,4,7,4,5,5,6,6,6,3,3,2,1 y 1
SOLUCION:
Primero se ordenan los nmeros (orden creciente): 1,1,2,3,3,4,4,5,5,6,6,6,7 y
45
7. Como hay un nmero par de datos, la mediana es 4.5 (la mediana
2
no es uno de los datos)
VERIFICANDO SU COMPRENSION
Calcule la mediana a cada uno de los conjuntos de nmeros dados.
a) 7,5,6,4,4,4,3,3,1 y 10 b) -4, -6, -1, 1, 4, 10 y 3
Lic. Mauro H. Henrquez Rauda
1.5.4 EJERCICIOS

1. Explicar que es una medida de tendencia central; cuales son y como se


definen.

2. Cul de las siguientes frmulas se utiliza para calcular la media de


x1 , x 2 y .x3 ?
x x 2 .x3 x .x 3
a) x x1 x 2 .x3 b) x 1 c) x 1
3 2

3. Encuentre la media, mediana y moda del conjunto de datos


a) 1,2,3,4 y 5 c) 4,7,10,6,9 y 10
b) 12,13,14 y 15 d) 79,90,95,95 y 96
e) 9,12,8,10,9,11,12,15,20,9,14,15,21 y 10

4. Considrese el conjunto de datos: 4,5,6,3,4,3,3,31 y 4.


a) Encontrar la media b) Hallar la mediana

5. Elimine el 31 del conjunto de datos en 4.


c) encontrar la media; d) Hallar la mediana
e)Comparar los resultados a), b), c) y diga Cul de las medidas de
tendencia central, la media o la mediana, es mejor para evitar la
distorsin
producida por un valor extremo?.

6. Se pidi a 30 reclutas de la Academia de Polica se sometieran a una


prueba que mide la capacidad para el ejercicio. Se midi esta capacidad
de cada recluta (en minutos)
25 27 30 33 30 32 30 34 30
27
26 25 29 31 31 32 34 32 33
30
16

27 30 31 36 28 30 31 26 29
32

Calcular la moda, media y mediana.

Lic. Mauro H. Henrquez Rauda


17

1.6 MEDIDAS DE DISPERSION

La localizacin o tendencia central no necesariamente proporciona


informacin para describir datos de manera adecuada. Para el caso,
consideramos los siguientes ejemplos.

EJEMPLO 1.
Suponga que en un hospital, el nivel de azcar en la sangre de cada
paciente se mide tres veces por semana. En cierta semana los registros de
dos pacientes indican:

Paciente A: 90, 100 y 110 miligramos por decilitro


Paciente B: 40, 100 y 160 miligramos por decilitro
El promedio de ambos pacientes es 100.

En efecto:
90 100 110 300
Paciente A: 100
3 3
40 100 160 300
Paciente B: 100
3 3
Observe la diferencia en variabilidad. Mientras que el paciente A es bastante
estable, el nivel del paciente B flucta ampliamente. Este resultado deber
tomarse en cuenta cuando se prescriba su tratamiento.

COMENTARIO: Un paciente con un nivel de azcar en la sangre de 40


mg/dl, convulsiona; con un nivel de 160 mg/dl podra ser diabtico.

EJEMPLO 2.
Se va a seleccionar a un atleta para que represente a la Universidad en los
juegos estudiantiles, en la prueba de los 100 metros. Se tienen dos
candidatos: A y B. Para decidir por uno de ellos se les toman los tiempos que
se tardan en recorrer los 100 metros en cinco ocasiones. A continuacin de
detallan:

Atleta A: 11.0, 11.8, 11.6, 11.3 y 12.3 segundos


Atleta B: 11.5, 11.6, 11.6, 11.8 y 11.5 segundos

El tiempo promedio de ambos atletas es 11.6 segundos (verificarlo) pero el


grado de variabilidad del atleta B es menos que el del atleta A. Por tener
menos altibajos, el atleta B tendra que ser el seleccionado.

Casos como los anteriores (medicina, deportes) muestran la necesidad de


descripciones estadsticas que midan el grado en que se dispersan (o varan)
los

Lic. Mauro H. Henrquez Rauda


18

datos, respecto a su centro; es decir; la necesidad de las medidas de


dispersin. Dos de ellas son: la amplitud (o rango) y la desviacin tpica.

1.6.1 AMPLITUD (RECORRIDO O RANGO)

DEFINICION: La amplitud (recorrido o rango) de un conjunto de datos


numricos es la diferencia entre el mayor y el menor de todos ellos.

EJEMPLO 3.
En el ejemplo 1, el rango para el nivel de azcar en la sangre del paciente A
es 110 90 = 20 y de 160 40 = 120, para el paciente B.

En el ejemplo 2, el rango para el tiempo del atleta A es de 12.3 11.0 = 1.3


segundos, y de 11.8 11.5 = 0.3 segundos, para el atleta B.

1.6.2 DESVIACION TIPICA (O ESTANDAR)

El rango se utiliza principalmente como indicacin fcil y rpida de la


variabilidad, pero por lo general, no es medida de dispersin til. Su
principal inconveniente radica en que nada se dice acerca de la dispersin de
los valores que estn entre el mayor y el menor valor.
Por ejemplo, cada uno de los conjuntos de datos siguientes:
Conjunto A: 3,4,5,6,11,16,17,18 y 19
Conjunto B: 3,8,9,10,11,12,13,14 y 19.

Tiene un rango de 19 - 3 = 16 ( y una media de 11); pero la dispersin (como


se ve en el diagrama adjunto) es completamente distinta en cada caso.
media
Conjunto A:
3 4 5 6 11 16 17 18 19

media
Conjunto B:
3 8 9 10 11 12 13 14 19

Observamos que la dispersin en un conjunto de datos:

Es pequea si los datos estn ubicados muy cerca alrededor de su


media aritmtica y
Es grande si los datos estn ubicados distantes alrededor de su media.

Por lo tanto, parece razonable tener una medida para la dispersin de un


conjunto de datos, en trminos de las cantidades por las que difieren de su

Lic. Mauro H. Henrquez Rauda


19

media aritmtica. A estas cantidades les asignaremos un nombre, en la


siguiente definicin.

DEFINICION: Si un conjunto de datos x1 , x 2 ,.....,.x N tiene la media x , las


diferencias x1 x, x 2 x,........,.x N x , se llaman desviaciones de la
media.

DEFINICION: La desviacin tpica de una poblacin de N datos: se


denota por , (letra griega sigma) y se define como
N

(x i x) 2
i 1

N
Si x1 , x 2 ,.....,.x N ocurren con frecuencias f 1 , f 2 ,..... f N respectivamente, la
desviacin tpica puede expresarse como
N

f (x i i x) 2
donde N =
N

f i
i 1
i 1
N

En palabras: es la raz cuadrada de la media aritmtica de los cuadrados


de las desviaciones.
DEFINICION: La desviacin tpica de una muestra de N datos: se denota
por S y se define como
N

(x i x) 2
para datos sin agrupar
S i 1

N 1
N

f (x i i x) 2
para datos agrupados en tablas de frecuencia
S i 1

N 1
NOTA: Muestra es el conjunto de datos que se pueden utilizar, en forma
razonable, para hacer generalizaciones acerca de la poblacin de la cual
provienen.

ADVIERTA: Las frmulas para S se obtienen escribiendo N-1 en el


denominador de las formulas para .

CASO 1: Desviacin tpica para datos sin agrupar


EJEMPLO 1. Considrese cada una de las siguientes muestras:
Muestra A: 3,4,5,6,11,16,17,18 y 19
Muestra B: 3,8,9,10,11,12,13,14 y 19

Lic. Mauro H. Henrquez Rauda


20

Obtenga la desviacin tpica de cada muestra e indique cul de ellas es la


que presenta mayor dispersin.

SOLUCION.
Para la muestra A.
3 4 5 6 11 16 17 18 19 99
Paso 1. x 11
9 9
9
Paso 2. El clculo de S ( xi x) 2 se facilita con una tabla como la que
i 1
sigue:
Variable x Desviacin ( xi x ) Cuadrado de la
desviacin ( xi x) 2
3 -8 64
4 -7 49
5 -6 36
6 -5 25
11 0 0
16 5 25
17 6 36
18 7 49
19 8 64
9
S ( xi x) 2 = 64 + 49 + 36 + 25 + 0 + 25 + 36 + 49 + 64 = 348 y
i 1
9

(x i x) 2
=
348
=
348
= 6.6
S i 1
9 1 9 1
N 1

Para la muestra B
3 8 9 10 11 12 13 14 19 99
Paso 1. x 11
9 9
9
Paso 2. Calculamos (x
i 1
i x) 2

Variable x Desviacin ( xi x ) Cuadrado de la desviacin


( xi x) 2
3 -8 64
8 -3 9
9 -2 4
10 -1 1
11 0 0
12 1 1
13 2 4
21
14 3 9
19 8 64
9

(x
i 1
i x) 2 = 64 + 9 + 4 + 1 + 0 + 1 + 4 + 9 + 64 = 156 y
9

(x i x) 2
=
3156
=
3156
= 4.4
S i 1
9 1 9 1
N 1

Puesto que la desviacin tpica del conjunta A es mayor que la del conjunto
B, concluimos que la muestra A es la ms dispersa.

DEFINICION: La varianza de un conjunto de datos se define como el


cuadrado de la desviacin tpica, de modo que 2 y S 2 representan la
varianza de la poblacin y la varianza de la muestra, respectivamente.

VERIFICANDO SU COMPRENSION

1. Determine cul de las siguientes muestras es la ms dispersa.


a) 6,3,12,5,8 y 9 b) 3,5,6,7,4,10 y 8
2. Determine cul de las siguientes muestras es la menos dispersa
a) 7,9,3,6,5,4 y 2 b) 8,7,4,11,2 y 5

3. Hallar, en cada caso, la desviacin tpica y la varianza


a) 3,6,2,1,7 y 5 b) 3,2,4,6,5 y 8

CASO 2: Desviacin tpica para datos agrupados


EJEMPLO 2. Supngase que en 9 grado hay 40 alumnos, cuyas edades se
resumen en la siguiente tabla de frecuencias

Edades x No. de alumnos (f)


14 6
15 15
16 16
17 3
Hallar el valor de S.

SOLUCION
Para facilitar los clculos usamos la siguiente tabla

Lic. Mauro H. Henrquez Rauda


X f f (x ) ( xi x ) 2
f ( xi x) 2
f ( xi x) 2
14 6 84 -1.4 1.96 11.76
22
15 15 225 -0.4 0.16 2.40
16 16 256 0.6 0.36 5.76
17 3 51 1.6 2.56 7.68
TOTAL 40 616 27.60
4 N

f i xi
616 f ( x x)
i i
2
27.6
x i 1
15.4 S i 1
0.84
N 40 N 1 39

VERIFICANDO SU COMPRENSION

1. Hallar en cada caso, la desviacin tpica y la varianza.


a) 3,2,4,6,2,8,5,2,4 y 4 b) 0,0,0,0,0,1,1 y 1

2. Hallar el valor de S para los datos agrupados en la siguientes tablas de


frecuencia

a) x f
2 4
3 3
4 5
5 2
1.6.3 EJERCICIOS

Seleccione la respuesta correcta

1. El recorrido de un conjunto de datos:


a) Se obtiene con las desviaciones promedio de los datos y la media
b) Es la diferencia entre el dato mayor y el dato menor
c) Es una medida de tendencia central
d) Es el promedio de la moda y la mediana

2. La desviacin estndar de un conjunto de datos:


a) Est cerca de cero si los datos estn dispersos.
b) Promedia las desviaciones entre cada dato y la media
c) No toma en consideracin todos los datos
d) Promedia las desviaciones entre cada dato y la mediana

3. Explicar que es una medida de dispersin

4. Comparar la desviacin estndar y el recorrido

Lic. Mauro H. Henrquez Rauda


5. Explicar que representa la desviacin estndar de un conjunto de datos

6. Si la desviacin estndar fuese cero qu podras decir acerca del conjunto


de datos?
23

En los ejercicios 7 - 10. Encontrar el recorrido, la varianza y la desviacin


estndar del conjunto de datos
7. 1,2,3,4 y 5 9. 3,5,8,13 y 21
8. 21,22,23,24 y 25 10. 79,90,95,95 y 96

11. Realizar las operaciones indicadas con los siguientes datos


3,8,5,3,10,13
a) Encontrar el recorrido.
b) Hallar la media.
c) Determinar la desviacin estndar poblacional.
d) Determinar la desviacin estndar muestral.

1.7 MEDIDAS DE POSICIN

1.7.1 CUANTILES

Para muchos propsitos, es importante obtener valores que dividen un


conjunto de datos ordenados, en fracciones especificas. LA mediana es un
ejemplo de ste tipo de medida; ella divide al conjunto en dos partes iguales:
La mitad de los valores son inferiores a la mediana y la otra mitad superiores.
En forma similar se pueden calcular:
- Los cuartiles, que son valores de la variable que dividen a conjunto en
cuartas partes.

As, el primer cuartil, Q1, es un valor tal que una cuarta parte de los datos
son menores que l y tres cuartas partes son mayores. Q2, es igual a la
mediana y Q3, supera a los tres cuartos de los datos y solo es superado por
un cuarto de ellos.
Adems de la mediana y los cuartiles pueden calcularse tambin lo deciles:
D1, D2, ......D9, los cuales dividen al conjunto en dcimas. Los percentiles:
P1, P2,....P99, que lo dividen en centsimos. Todos stos valores reciben el
nombre de cuantiles y pueden resultar muy apropiados para apreciar la
posicin de los datos de un conjunto y su posicin.
Tanto la mediana como los cuartiles y los deciles constituyen casos
particulares de los percentiles y pueden expresarse como percentiles.

Por ejemplo: Mediana = P50, Q3 = P75, D4 = P40, etc.


Lic. Mauro H. Henrquez Rauda
Resulta entonces que tenindose una frmula para el calculo de la posicin
de los percentiles, puede obtenerse con ella, la posicin de cualquier cuantil.

Para el calculo de la posicin de los percentiles se debe, en primer lugar,


ordenar los datos.
Una vez hecho esto, puede aplicarse la frmula siguiente:
24

n
La posicin de k-simo percentil se encuentra calculando ( )k, donde n
100
es el nmero de datos. S el resultado es un nmero decimal, seleccione
como indicador del orden al entero prximo superior y el percentil a localizar
es Pi.
Si el resultado es un entero seleccione como indicadores de orden al entero
obtenido i y al siguiente i + 1. El percentil se obtiene haciendo Pk =
xi ( xi i)
2
Ejemplo.
Calcular Q2 y la mediana. Considrense para ello, los siguientes datos, que
se refieren a los pesos de 40 estudiantes de una escuela rural y que se
presentan en el orden en que fueron pesado los alumnos:

49 60 45 37 54
44 59 40 62 47
46 52 55 41 66
45 36 50 51 48
42 53 53 68 56
35 74 43 47 60
51 67 40 70 49
41 46 32 57 43

As como estn los datos resulta difcil sacar una conclusin, por lo tanto,
como no son muchos, puede iniciarse el anlisis haciendo una ordenacin en
forma creciente.

32 42 47 52 60
35 43 47 53 60
36 43 48 53 62
37 44 49 54 66
40 45 49 55 67
40 45 50 56 68
41 46 51 57 70
41 46 51 59 74
40
La posicin de Q2 es igual a la posicin de P50, la cual se obtiene as: x 50
100
= 20 Los datos a localizar son: X20 y X21. El valor de Q2 es:
Lic. Mauro H. Henrquez Rauda
X 20 X 21 50 53
Q2 = = 51.5
2 2
La mediana es igual a P50 = Q2 = 51.5
25

1.7.2 EJERCICIOS .

1. Calcule los cuartiles uno, dos y tres en la siguiente serie simple:


0.10, 0.12, 0.15, 0.15, 0.18, 0.20, 0.25.

2. La siguiente distribucin corresponde a salarios mensuales de un grupo de


56 personas.

Salarios (x) f
500-599 8
600-699 12
700-799 18
800-899 10
900-999 6
1000-1099 2

Calcule:
a) El valor del cuartil uno.
b) El valor del cuartil dos.
c) El valor del cuartil tres.
d) El valor del decil cinco.
e) El valor del decil cinco.
f) El valor del percentil ochenta.
g) El valor del percentil cincuenta.
h) El salario que limita el 20% superior de la distribucin.
i) El salario que se deja sobre s, el 70% de los casos.
j) Entre qu salarios est el 60% central de la distribucin.

3. Determine la escala percentilar de la siguiente serie de puntajes de un


examen.
____Xi f____
30 1
25 5
38 10
40 4
45 2

4. Calcule el percentil del punto medio de la clase 700-799 de la distribucin


del ejercicio 2. Luego comprubelo.

Lic. Mauro H. Henrquez Rauda

Anda mungkin juga menyukai