Anda di halaman 1dari 32

CONTENIDO

INTRODUCCIN

DEFINICIN DE ESTADSTICA
ESTADSTICA DESCRIPTIVA
CONCEPTOS BSICOS
POBLACIN
VARIABLE: Cualitativas o Categricas y Cuantitativas (Discretas y
Continuas)
MUESTRA
TAMAO MUESTRAL
DATO

DISTRIBUCIONES DE FRECUENCIAS

FRECUENCIA ABSOLUTA
FRECUENCIA RELATIVA
FRECUENCIA ACUMULADA
FRECUENCIA RELATIVA ACUMULADA
DISTRIBUCIONES DE FRECUENCIAS AGRUPADAS

MTODOS GRFICOS

DIAGRAMA DE BARRAS
DIAGRAMA DE SECTORES O DE PASTEL
HISTOGRAMA

MEDIDAS DESCRIPTIVAS DE POSICIN Y DISPERSIN

MEDIDAS DE POSICIN

MEDIDAS DE POSICIN CENTRAL
MEDIA ARITMTICA
MEDIANA
MODA

MEDIDAS DE POSICIN NO CENTRALES
PERCENTILES
CUARTILES

MEDIDAS DE DISPERSIN

MEDIDAS DE DISPERSIN ABSOLUTAS
VARIANZA
DESVIACIN TPICA
RECORRIDO INTERCUARTLICO

MEDIDAS DE DISPERSIN RELATIVAS
COEFICIENTE DE VARIACIN DE PEARSON

OTRAS MEDIDAS DESCRIPTIVAS

TIPIFICACIN DE UNA DISTRIBUCIN DE FRECUENCIAS
ESTADISTICA DESCRIPTIVA
INTRODUCCION


1.1 DEFINICIN DE ESTADSTICA: es un conjunto de teoras y mtodos
desarrollados para la recopilacin, representacin y el uso de datos sobre una
o varias caractersticas de inters con el objeto de tomar decisiones, extraer
conclusiones o emprender acciones.

1.2 ESTADSTICA DESCRIPTIVA: es la parte de la estadstica que se encarga
de organizar, resumir y describir las caractersticas principales de los datos.
Generalmente se resumen en forma tabular, grafica o numrica. El anlisis se
limita en si mismo a los datos coleccionados y no se realiza inferencia alguna o
generalizaciones acerca de la totalidad de donde provienen esas
observaciones.

1.3 ESTADSTICA INFERENCIAL: Es la que trata de estimar las
caractersticas de una poblacin a travs del estudio de una muestra.

1.4 CONCEPTOS BSICOS:

POBLACIN: Es una coleccin finita o infinita de elementos con
caractersticas comunes. Ejemplo: las personas, libros de una biblioteca, etc.
Algunas poblaciones son finitas y pueden conocerse; otras pueden ser infinitas
y abstractas: Ej. el conjunto de hoteles, establecimientos comerciales de una
ciudad o el conjunto de todas las piezas fabricadas por una mquina.

VARIABLE: Toda caracterstica que puede tomar diferentes valores (Ej.
nmero de hijos, precio de la habitacin) Las variables se suelen denotar por
letras maysculas: X, Y,...
Tipos de variables:
1. Cualitativas o Categricas: aquellas que no son medibles, es decir,
aquellas cuyas observaciones no tienen carcter numrico. Expresan
cualidades o categoras. Ej. estado civil, sexo o profesin.(A las variables
cualitativas tambin se les llama atributos).

2. Cuantitativas: aquellas que son medibles, es decir sus observaciones
tienen carcter numrico. Estas se dividen a su vez en:
Discretas: toman valores enteros en un conjunto numerable. Ej.
Nmero de habitaciones de un hotel, nmero de hijos de una familia, nmero
de obreros de una fbrica.
Continuas: toman valores en un conjunto no numerable (los nmeros
reales o un intervalo). Ej. peso, estatura.

MUESTRA: Es un subconjunto de la poblacin. Se denota por n.

DATO: cada valor observado de la variable. Si representamos por X a la
variable, representaremos por x
i
cada dato diferente observado en la muestra,
el subndice i indica el lugar que ocupa si los ordenamos de menor a mayor.

Prof. Simn Cabrera pgina 2 de 32


ESTADISTICA DESCRIPTIVA
MEDICIN: La asignacin o magnitud que se aplica a las categoras o clases
de acuerdo a ciertas reglas o smbolos. Una medicin se puede definir como la
manera de obtener smbolos para representar propiedades de personas,
objetos, eventos o estados cuyos smbolos tienen la misma relacin relevante
entre si igual a las entidades que representan.

ESCALAS DE MEDICIN DE LAS VARIABLES

Las escalas de medicin son el conjunto de los posibles valores que
determinada variable puede tomar. Por tal razn, los tipos de escala de
medicin estn ntimamente ligadas con los tipos de variables a estudiar. Las
magnitudes de las observaciones cuantitativas se conocen como los valores
que una variable puede asumir. Dependiendo de la medicin y de la esencia de
las variables, se obtienen diversas clases de datos que originan diferentes
escalas. Resulta imprescindible conocer el tipo de escala que representan los
datos, debido a que, de su esencia dependen las tcnicas estadsticas que se
debern aplicar para su anlisis.

Al elaborar estadsticas con datos y su caracterstica es necesario contarlas,
jerarquizarlas y medirlas, es por ello que, se utilizan las escalas de medicin
como el proceso de asignar nmeros o establecer una correspondencia uno a
uno entre objetivos y observaciones. Las escalas de medicin s clasifican de
la siguiente forma: Escala Nominal, Escala Ordinal, Escala de Intervalos y
Escalas de razn o Proporcin.

Escala de Medicin Nominal: Consiste en clasificar a los elementos,
personas, animales, etc, asignndoles smbolos o nombres. Los datos que se
obtienen para una variable cualitativa se miden en una escala nominal y
simplemente se clasifican en distintas categoras que no implican orden. La
escala nominal es la forma ms dbil de medicin porque no se puede aplicar
operaciones aritmticas ni intentar el conteo de las diferencias dentro de una
categora determinada o especificar cualquier orden o direccin a lo largo de
las diversas categoras.

Propiedades de la Escala Nominal

1. No intervienen mediciones, ni escala, en vez de esto solo hay cuentas o
conteos.
2. No existe un orden especfico para esta categora.
3. No presentan el cero.
4. No se basa en diferencia cuantitativa.

Ejemplos: Una muestra de personas puede clasificarse con base en la religin
profesada: (1) Cristianos; (2) Judos; (3) Musulmanes; (4) Otros; y (5) Sin
Creencia alguna. O bien podran clasificarse segn el sexo, el color de los
ojos, algn partido poltico, etctera. Otros ejemplos de escala nominal puede
ser el numero de placa de los vehculos, los nmeros de los telfonos de una
ciudad, la Cedula de Identidad de los habitantes de un pas, etctera.

Prof. Simn Cabrera pgina 3 de 32


ESTADISTICA DESCRIPTIVA
El tipo de operacin estadstica ms utilizada en la escala nominal es el conteo
de las frecuencias (distribuciones de frecuencias), con que se presentan las
caractersticas en las unidades de las respectivas subclases. Estas frecuencias
pueden ser presentadas con nmeros absolutos, porcentajes y proporciones.
Adems, puede calcularse la moda, razones, tasas de incremento, y el
coeficiente de contingencia. Tipos de grficos: Diagrama de Barras.

Escala de Medicin Ordinal: Establece una relacin de orden entre los
elementos (personas, animales, objetos, etc.), en atencin a una caracterstica,
sin que reflejen distancia entre ellos. La diferencia entre dos nmeros ordinales
no tiene significado cuantitativo, slo expresan, por ejemplo, que una situacin
es mejor que otra, pero no dice cuanto es uno que el otro.

La escala ordinal sigue siendo una forma de medicin dbil porque no se
pueden hacer planteamientos numricos significativos con respecto a las
diferencias entre las categoras. Es decir, la ordenacin establece slo cul
categora es mayor, mejor o preferida; y no se habla cunto es mayor,
mejor o ms preferida.Esta escala se emplea, cuando un estudio esta
basado en ciertas normas que se asignan a un conjunto de objetos, personas
o caractersticas o a un conjunto de categoras ordenadas. Las categoras de
la escala se ordenan d acuerdo con la cantidad de rasgos o caractersticas
que representan cada una de ellas ya que la escala ordinal distingue los
diferentes valores de la variable, ubicando las caractersticas en orden, desde
la ms alta hasta la ms baja.

La diferencia fundamental entre una escala nominal y una ordinal es que en la
ordinal rige no slo la relacin de igualdad, de identidad, sino tambin la
relacin de mayor que.

Propiedades de la Escala Ordinal

1. Las observaciones o elementos se les ordena en rangos o categoras
diferentes.
2. Las categoras son mayores o menores que otras categoras, es decir,
que existe una clasificacin de mayor a menor (jerarqua).
3. Las categoras son mutuamente excluyentes y exhaustivas.
4. No presentan el cero.

Ejemplos:

Calificaciones de Estudiantes de Estadstica en el Semestre 2005-2006

Calificaciones N de calificaciones
Excelente 3
Sobresaliente 6
Distinguido 10
Bueno 38
Satisfactorio 25
Deficiente 50
Muy Deficiente 0
Prof. Simn Cabrera pgina 4 de 32


ESTADISTICA DESCRIPTIVA
Se pueden clasificar los habitantes de una ciudad de acuerdo a su situacin
econmica, a los estudiantes tomando en cuenta a su rendimiento acadmico,
el orden jerrquico de los militares (Subteniente, Teniente, Capitn, Mayor,
Teniente Coronel, Coronel, General) y la clasificacin acadmica de los
profesores universitarios (Instructor, Asistente, Agregado, Asociado, Titular),
etctera. Aunque la escala ordinal resulta en cierta forma ms precisa que la
nominal, no alcanza el grado de precisin deseado en una investigacin.

El tipo de operacin estadstica ms utilizada en la escala ordinal es la
mediana, percentiles, cuartiles, mnimo y mximo. Tipos de grficos: Diagrama
de barras (con un orden) y grficos de caja.

Escala de Medicin de Intervalos: Tiene todas las caractersticas de una
escala ordinal, adems permite conocer la distancia entre dos nmeros
cualquiera. Esta escala se caracteriza por tener una unidad de medida y un
origen (cero) arbitrario. La escala de intervalos a diferencia de la nominal y
ordinal, es una escala efectivamente cuantitativamente. Una escala de intervalo
es una escala ordenada en la cual la diferencia entre las mediciones es una
cantidad significativa.

La escala de intervalos posee adems, de las caractersticas de la escala
nominal y ordinal, la propiedad de que la distancia entre dos valores es de una
magnitud conocida, lo que le permite a esta escala un mayor grado de
perfeccin, ya que proporciona nmeros que manifiestan diferencias palpables
entre individuos, objetos o cosas.

La razn entre dos intervalos es siempre independiente del punto cero y de la
unidad que se emplee en la medicin. En el caso de las escalas de intervalos
las unidades de medicin son iguales.

Propiedades de la escala de Intervalo:

1. Esta escala implica la cuantificacin de los datos
2. En ests medidas se utilizan unidades constantes de medicin
(capacidad, peso, Cntimos, grados Fahrenheit o centgrados) los
cuales producen intervalos iguales entre puntos de la escala.
3. Proporcionan nmeros que manifiestan diferencias palpables entre
individuos, objetos o cosas.
4. En esta escala de intervalos el punto cero (0) y la unidad de medida es
arbitrario.
5. Se pueden aplicar todas las medidas estadsticas ms conocidas, con
excepcin del coeficiente de variacin.
6. Son mutuamente exclusivas y exhaustivas.







Prof. Simn Cabrera pgina 5 de 32


ESTADISTICA DESCRIPTIVA
Ejemplos:

Calificacin de una prueba de Estadstica realizada en la UCV

Puntuacin N de Estudiantes
90-99 2
80-89 6
70-79 15
60-69 30
Menos de 60 60

Otro ejemplo de esta escala lo constituyen las escalas utilizadas para medir
temperatura, bien sea en grados Centgrados o Fahrenheit. En estas escalas la
diferencia entre 80 y 85 es igual a la que existe entre 90 y 95 o entre dos
puntos cualesquiera de la escala.

Las estadsticas apropiadas para esta escala son: media, desviacin estndar,
rango, varianza, coeficiente de variacin, asimetra y kurtosis. Tipos de
grficos: histograma, polgono de frecuencias y grfico de tallos y hojas.

Escala de Medicin de Razn o Proporcin: Esta constituye el nivel ms alto
de medicin, posee todas las caractersticas de las escalas nominales,
ordinales y de intervalos; adems tiene un cero absoluto o natural que tiene
significado fsico. Si en ella la medicin es cero, significa ausencia o
inexistencia total de la propiedad considerada. Son posibles todas las
operaciones aritmticas. Los nmeros indican los valores concretos de la
propiedad que s esta midiendo; peso, estatura, ingresos monetarios y gastos
directos, son ejemplos de medidas con una escala de razn.
Cuando se emplea este tipo de escala, los nmeros indican razones o
cocientes entre ciertas magnitudes de los objetos, y los datos obtenidos con
tales escalas pueden ser sometidos a los tratamientos ms elaborados.

Propiedades de la escala a razn:

1. La distancia entre los nmeros es un tamao conocido y constante.
2. Los datos tienen un punto cero significativo.
3. Puede utilizarse cualquier prueba de tipo estadstico, incluyendo el
coeficiente de variacin.
4. Permite hacer comparaciones entre los nmeros verdaderos con un cero
aritmtico siendo arbitrario nicamente la unidad de medida.

Ejemplo de escala a razn:

Computadores vendidos en el ltimo trimestres del ao 2006

Meses N de computadores
Octubre 4.000
Noviembre 6.000
Diciembre 15.000

Prof. Simn Cabrera pgina 6 de 32


ESTADISTICA DESCRIPTIVA
Otros ejemplos de esta escala son: la medicin del peso o altura de un grupo
de personas, el ingreso familiar, la intensidad de corriente elctrica de un cable,
la edad de un grupo de personas, etc.

Generalmente, se supone que los datos que se obtienen para una variable
cuantitativa se miden en escalas de intervalo o de razn. Estas escalas
constituyen los niveles ms elevados de medicin. Son formas ms fuertes de
medicin que la escala nominal y ordinal, porque permiten comprender no slo
cul de los valores de un estudio es mayor o menor, sino por cuntas
unidades de medida. Las escalas de razn son medidas de Longitud, peso,
capacidad, etc., los nmeros reflejan razones entre particularidades y los datos
obtenidos segn tales escalas pueden ser sometidas a cualquier tratamiento
estadstico





































Prof. Simn Cabrera pgina 7 de 32


ESTADISTICA DESCRIPTIVA
ORGANIZACIN DE LOS DATOS

2. DISTRIBUCIONES DE FRECUENCIAS

La distribucin de frecuencia es una disposicin tabular de datos estadsticos,
ordenados ascendente o descendentemente, de acuerdo a la frecuencia de
cada dato. Las frecuencias pueden ser:

2.1 FRECUENCIA ABSOLUTA (f
i
):

Es el nmero de veces que se repite un determinado valor de la variable (x
i
).
Se designa por f
i.

PROPIEDAD: la suma de todas las frecuencias absolutas es igual al total de
observaciones (n).

2.2 FRECUENCIA ACUMULADA (F
i
):

Las frecuencias acumuladas de una distribucin de frecuencias son aquellas
que se obtienen de las sumas sucesivas de las fi que integran cada una de las
filas de una distribucin de frecuencia, esto se logra cuando la acumulacin de
las frecuencias se realiza tomando en cuenta la primera fila hasta alcanzar la
ultima. Las frecuencias acumuladas se designan con las letras F
i
. Se calcula:

=

+ = =
i
j
i i j i
f F f F
1
1

PROPIEDAD: La ltima frecuencia acumulada absoluta es igual al total de
observaciones.


2.3 FRECUENCIA RELATIVA (h
i
):

Es aquella que resulta de dividir cada una de las frecuencias absolutas entre el
nmero total de datos. Las frecuencias relativas se designan con las letras h
i.

Se calcula,
n
f
h
i
i
=

PROPIEDAD: la suma de todas las frecuencias relativas es igual a la unidad.
.
2.4 FRECUENCIA RELATIVA ACUMULADA (H
i
):

Es aquella que resulta de dividir cada una de las frecuencias acumuladas entre
nmero total de datos. Se designa con las letras H
i
. Se calcula;
n
F
H
i
i
=

PROPIEDAD: La ltima frecuencia relativa acumulada es la unidad.


Prof. Simn Cabrera pgina 8 de 32


ESTADISTICA DESCRIPTIVA
DISTRIBUCION DE FRECUENCIAS ABSOLUTAS

Es la representacin estructurada en forma de tabla de toda la informacin que
se ha recogido sobre la variable que se estudia, es decir, es una tabla que
presenta de manera ordenada los distintos valores de una variable y sus
correspondientes frecuencias. Su forma mas comn es la siguiente:

Variable (x
i
) f
i
F
i
h
i
H
i
x
1
f
1
F
1
h
1=
f
1
/n h
1
x
2
f
2
f
1
+f
2
h
2=
f
2
/n h
1
+h
2
... ... ... ... ...
x
n
f
n
f
1
+f
2
+ + f
n
h
n=
f
n
/n h
1
+h
2
+ + h
n
f
i
=n h
i
=1

Ejemplo 1:

El gobierno desea averiguar si el nmero medio de hijos por familia ha
descendido respecto de la dcada anterior. Para ello ha encuestado a 50
familias respecto al nmero de hijos, y ha obtenido los siguientes datos:

0 0 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 5 6
Se pide:
a. Construir la tabla de frecuencias absolutas
b. Cul es el nmero de familias que tiene como mximo dos hijos?
c. Cuntas familias tienen ms de 1 hijo pero como mximo 3?
d. Qu porcentaje de familias tiene ms de 3 hijos?

Solucin:

a. Para construir la tabla de frecuencias hay que tener en cuenta que la
variable en estudio es el nmero de hijos (discreta), que toma los valores
existentes entre 0 y 6 hijos y las frecuencias son el conjunto de familias, de
esta forma tenemos:
x
i
f
i
F
i
h
i
H
i
0 2 2 0.04 0.04
1 4 6 0.08 0.12
2 21 27 0.42 0.54
3 15 42 0.3 0.84
4 6 48 0.12 0.96
5 1 49 0.02 0.98
6 1 50 0.02 1
n=50

b. En la columna de las f
i
: 2+4+21=27 en la columna de las F
i
: F
2
= 27
c. En la columna de las f
i
: 21+15=36 en la columna de las F
i
: 42-6=36
d. En la columna de las h
j
: 0.12+0.02+0.02=0.16, que supone un 16% en
la columna de las H
i
: 1-0.84=0.16, 16%
Prof. Simn Cabrera pgina 9 de 32


ESTADISTICA DESCRIPTIVA
DISTRIBUCIONES DE FRECUENCIAS AGRUPADAS

Es aquella distribucin en la que la disposicin tabular de los datos estadsticos
se encuentran ordenados en clases y con la frecuencia en cada clase; es decir,
los datos originales de varios valores adyacentes del conjunto se combinan
para formar un intervalo de clase. No existen normas establecidas para
determinar cundo es apropiado utilizar datos agrupados o datos no
agrupados; sin embargo, se sugiere que cuando el nmero total de datos (N)
es igual o superior 50 y adems el rango o recorrido de la serie de datos es
mayor de 20, entonces, se utilizar la distribucin de frecuencia para datos
agrupados, tambin se utilizar este tipo de distribucin cuando se requiera
elaborar grficos lineales como el histograma, el polgono de frecuencia o la
ojiva.

La razn fundamental para utilizar la distribucin de frecuencia de clases es
proporcionar mejor comunicacin acerca del patrn establecido en los datos y
facilitar la manipulacin de los mismos. Los datos se agrupan en clases con el
fin de sintetizar, resumir, condensar o hacer que la informacin obtenida de una
investigacin sea manejable con mayor facilidad.

Al agrupar los datos en una distribucin de frecuencia de clase se pierde parte
de la informacin. La reduccin o agrupamiento a que son sometidos los datos
de una serie de valores cuando existen muchos valores diferentes, originan los
denominados errores de agrupamiento; sin embargo, estos errores son en
general muy pequeos, razn por la cual la distribucin de frecuencia de clase
tiene una validez estadstica prctica.

Para agrupar los datos en intervalos de clase se deben seguir las siguientes
reglas generales:
El numero de intervalos de clase se toma entre 5 y 15 dependiendo de
los datos.
Cada observacin debe estar incluida en una y solo una clase o
intervalo.
El valor mas pequeo y mas grande deben entrar en la clasificacin.
No deben existir brechas o vacos entre clases sucesivas.
Los intervalos no se deben sobreponer.
En la medida de lo posible, se debe utilizar la misma amplitud para todos
los intervalos.

COMPONENTES DE UNA DISTRIBUCIN DE FRECUENCIAS DE CLASES

1.- Clase o Intervalo de clase.- Son divisiones o categoras en las cuales se
agrupan un conjunto de datos ordenados con caractersticas comunes. Para
organizar los valores de la serie de datos hay que determinar un nmero de
clases que sea conveniente. En otras palabras, que ese nmero de intervalos
no origine un nmero pequeo de clases ni muy grande. Un nmero de clases
pequeo puede ocultar la naturaleza natural de los datos y un nmero muy alto
puede provocar demasiados detalles como para observar alguna informacin
de gran utilidad en la investigacin. A las fronteras del intervalo, la llamaremos,
lmites inferior y superior de la clase y los denotaremos por L
i-1
, L
i
.
Prof. Simn Cabrera pgina 10 de 32


ESTADISTICA DESCRIPTIVA
2.- Punto medio o Marca de clase ( X
&
).- Es la semisuma del lmite inferior y
superior de una clase, tal como lo indica la siguiente formula:
2
1

+
=
i i
i
L L
X .

3.- Amplitud , Longitud o Tamao del Intervalo.- Los intervalos de clases
pueden ser de tres tipos: Clases de igual tamao, clases de tamaos
desiguales y clases abiertas. En trminos generales, las clases de igual tamao
son los mas utilizados y recomendados para los clculos estadsticos. Se
designa por las letras Ic.

Nota: Al nmero de observaciones de una clase se le llama frecuencia de
clase, si dividimos esta frecuencia por el nmero total de observaciones, se
llama frecuencia relativa de clase, y del mismo modo que lo hacamos para
datos sin agrupar definiramos Hi, y Fi.


PROCEDIMIENTO PARA CONSTRUIR UNA DISTRIBUCIN DE
FRECUENCIAS AGRUPADA EN INTERVALOS

1. Determinar el mximo y mnimo entre los valores que tenemos en la
muestra y calcular el recorrido de la variable o rango, es decir,
R=X
max
-X
min


2. Calcular el nmero de clases a utilizar. Existen diversos criterios para
determinar el numero de clases, ante tanta diversidad de criterios, se ha
considerado que lo mas importante es dar un ancho o longitud de clases
a todos los intervalos de tal manera que respondan a la naturaleza de
los datos y al objetivo que se persigue y esto se logra con la practica.
Existe una forma para determinar el numero de clases y la misma puede
ilustrarse en el siguiente cuadro:

Numero de Datos Numero de Intervalos
10 - 100 De 4 a 8
100 - 1.000 De 8 a 11
1.000 - 10.000 De 11 a 14

Cuando se tenga dudas en determinar el numero de intervalos de clases, es de
gran utilidad utilizar el mtodo sugerido por Hebert A. Sturges, el cual establece
que: K= 1+3,322 log(n) = numero de intervalos. En este curso se utilizar este
mtodo siempre y cuando el mismo sea aplicable.

3. Determinamos la amplitud o tamao de los intervalos travs de la
siguiente formula:
ervalos de N
R
Ic
int
= = ancho o tamao del intervalo.

Prof. Simn Cabrera pgina 11 de 32


ESTADISTICA DESCRIPTIVA
Ejemplo 2

Un nuevo hotel va abrir sus puertas en una cierta ciudad. Antes de decidir el
precio de sus habitaciones, el gerente investiga los precios por habitacin de
40 hoteles de la misma categora de esta ciudad. Los datos obtenidos (en miles
de pesetas) fueron:

3.3 3.3 3.7 3.8 3.9 3.9 3.9 4.0 4.1 4.2
4.2 4.3 4.3 4.3 4.3 4.4 4.4 4.5 4.5 4.5
4.5 4.7 4.7 4.7 4.7 4.8 4.9 5.0 5.0 5.1
5.1 5.3 5.3 5.4 5.6 5.8 5.8 6.0 6.1 6.1

Procedimiento:

1.- El menor valor es 3.3 y el mayor 6.1, la diferencia es 2.8 y por tanto R=2.8.
2.- K= 1+3,322 log(40) = 6.3 6 nmeros de intervalos
3.- Ic = 2.8 / 6 = 0.467 0.5 tamao de los intervalos

As pues la tabla sera:


CLASES f
i
F
i Ci
h
i
H
i
[3.3, 3.8) 3 3 3.5 0.075 0.075
[3.8, 4.3) 8 11 4 0.2 0.275
[4.3, 4.8) 14 25 4.5 0.35 0.625
[4.8, 5.3) 6 31 5 0.15 0.775
[5.3, 5.8) 4 35 5.5 0.1 0.875
[5.8, 6.3) 5 40 6 0.125 1

Cuantos hoteles tienen un precio entre 3.3 y 3.8? 3
Cuantos hoteles tienen un precio superior a 4.8? 15
Que porcentaje de hoteles cuestan como mucho 4.3? 27.5 %

















Prof. Simn Cabrera pgina 12 de 32


ESTADISTICA DESCRIPTIVA
MTODOS GRFICOS

La forma de la distribucin de frecuencias se percibe ms rpidamente si la
representamos grficamente. Se resume la informacin de la muestra de forma
grafica con fines clarificadores o para enfatizar y descubrir determinadas
caractersticas que de otra manera seria muy difcil de apreciar. Un grafico
siempre es mas inmediato de comprender que un conjunto de datos
estadsticos. Las representaciones graficas varan segn el tipo de variable:

a. Grficos para variables Discretas y Categricas

DIAGRAMA DE BARRAS: Es la representacin grfica usual para variables
cuantitativas discretas o para variables cualitativas. En el eje de ordenadas
representamos los diferentes valores de la variable (x
i
). Sobre cada valor
levantamos una barra de altura igual a la frecuencia (absoluta o relativa).
Ejemplo:
0
20
40
60
80
100
120
140
160
180
1er
t rim.
2do
t rim.
3er
t rim.
4t o
t rim.



DIAGRAMA DE SECTORES O DE PASTEL: Es el ms usual en variables
cualitativas. Se representan mediante crculos. A cada valor de la variable se le
asocia el sector circular proporcional a su frecuencia.

Ejemplo: Los siguientes datos corresponden a una encuesta referente a
elecciones locales de un partido poltico:

x
i
f
i
a favor 50%
en contra 40%
abstencin 10%

Para construir el diagrama de sectores partimos del hecho de que un circulo
encierra un total de 360 grados. Luego, mediante una regla de tres simple,
repartimos los 360 grados en distintos sectores, de acuerdo con cada
porcentaje; tenemos as que para determinar el sector correspondiente al 50%,
resolvemos la ecuacin:
180
100
360 * 50
= = X
Prof. Simn Cabrera pgina 13 de 32


ESTADISTICA DESCRIPTIVA
Esto es, el 50% corresponde a un sector circular de medida 180 grados. A
continuacin, con ayuda de un transportador, sealaremos el sector circular de
medida 180 grados. Igualmente, para el 40% se tiene 144 grados y para el 10%
se tiene 36 grados. La siguiente figura muestra la representacin grafica.


Elecciones Locales
a favor
en contra
abstencion



b. Grficos para variables continuas

HISTOGRAMA: Es la representacin grfica de las frecuencias agrupadas de
una variable continua sobre intervalos. A diferencia de los diagramas de barras,
los histogramas dibujan rectngulos unidos entre si, lo que significa que existe
continuidad en la variable cuyos valores se representan en el eje horizontal que
se haya dividido en intervalos de igual amplitud. Las reas de los rectngulos
son proporcionales a las frecuencias que representan.

Ejemplo:
Histograma correspondiente a las horas extras
laboradas por un grupo de obreros petroleros.
16
21
16
4
6
11
3
15
8
0
5
10
15
20
25
15 20 25 30 35 40 45 50 55 60 65
Clases
F
r
e
c
u
e
n
c
i
a
s




Prof. Simn Cabrera pgina 14 de 32


ESTADISTICA DESCRIPTIVA
El histograma o diagrama de barras proporcionan mucha informacin respecto
a la estructura de los datos, nos permite evidenciar fundamentalmente tres
caractersticas:

1. Forma de la distribucin.
2. Acumulacin o tendencia posicional (valor central de la distribucin).
3. Dispersin o variabilidad.

Cuando nos encontramos en distribuciones donde los intervalos no tienen la
misma amplitud, las barras del histograma tienen que tener un rea
proporcional a la frecuencia que queramos representar


EJERCICIOS

1.- Los siguientes datos representan los ingresos diarios (en miles) de 20
obreros de cierta compaa.

16, 16, 17, 18, 18, 19, 19, 19, 20, 20, 20, 20, 20, 21, 21, 22, 22, 23, 23, 24.

a. Construya una tabla de frecuencias agrupadas utilizando la formula
de Sturges.
b. Construya un histograma de frecuencias. Comente.
c. Cuntos obreros tienen un ingreso diario menor de 22?
d. Qu porcentaje de obreros tienen un ingreso diario entre 16 y 19?

2.- Los siguientes datos corresponden al tiempo que han necesitado 30 clientes
de un banco para llevar a cabo una transaccin bancaria:

0.1 0.4 1.1 1.2 1.3 1.4 1.5 1.6 2.0 2.5 2.8 2.8 3.1 3.3 3.6
4.1 4.1 4.3 4.6 5.0 5.5 6.4 6.5 7.7 7.3 7.4 8.0 9.5 9.5 10.0

a. Construya una tabla de frecuencias agrupadas utilizando la formula
de Sturges.
b. Construya un histograma de frecuencias. Comente.

3.- Con el fin de asignar viticos, la compaa El Refinanciamiento obtuvo
unas estadsticas sobre le numero de kilmetros recorridos por sus
vendedores. A continuacin se muestran los resultados. Construya una tabla
de distribucin de frecuencias agrupadas a cinco intervalos.

10 11 12 12 13 13 13 14 14 15
15 16 16 16 16 16 16 16 17 19







Prof. Simn Cabrera pgina 15 de 32


ESTADISTICA DESCRIPTIVA
MEDIDAS DE POSICIN

INTRODUCCIN

Despus que los datos han sido reunidos y tabulados, se inicia el anlisis con el fin de
calcular un nmero nico, que represente o resuma todos los datos. Las medidas de
posicin forman parte del conjunto de medidas descriptivas numricas, las cuales se
clasifican en parmetros cuando se calculan a partir de la poblacin total- y los
estadgrafos - cuando se calculan a partir de los datos de una muestra. Una medida
de posicin es un nmero que se toma como orientacin para referirnos a un conjunto
de datos.
Uno de los problemas fundamentales que presenta un anlisis estadstico, es el de
buscar el valor ms representativo de una serie de valores. El primer paso que hay
que realizar para que se entienda una larga serie de valores u observaciones, es el de
resumir los datos en una distribucin de frecuencia; esto no es suficiente para fines
practico, puesto que a menudo es necesario una sola medida descriptiva, y en
especial cuando se requiere comparar dos o ms serie estadsticas. Es necesario
continuar el proceso de reduccin hasta sustituir todos los valores observados por uno
solo que sea representativo, de tal forma que permita una interpretacin global del
fenmeno en estudio; para que ese valor sea representativo debe reflejar la tendencia
de los datos individuales de la serie de valores. Un valor o dato de la serie con estas
caractersticas recibe el nombre de promedio, media o medida de posicin, esto es
debido a su ubicacin en la zona central de la distribucin. Las medidas de posicin
son de gran importancia en el resumen estadstico, ya que representan un gran
nmero de valores individuales por uno solo.
El valor ms representativo de un conjunto de datos por lo general no es el valor ms
pequeo ni el ms grande, es un nmero cuyo valor se encuentra en un punto
intermedio de la serie de datos. Por lo tanto un promedio es con frecuencia un valor
referido que representar la medida de posicin de la serie de valores. Las medidas de
posicin se emplean con frecuencia como mecanismo para resumir un gran nmero de
datos o cantidades con la finalidad de obtener un valor que sea representativo de la
serie.
Las Principales Medidas de Posicin son:

La Media Aritmtica, Mediana, Moda, los cuartiles, Deciles y Percentiles.

Todas ellas a su manera tratan de dar una idea del numero alrededor del cual se
centra a todo el conjunto de datos.

CARACTERSTICAS DE LAS MEDIDAS DE POSICIN

Deben ser definidas rigurosamente y no ser susceptibles de diversas
interpretaciones.

Deben depender de todas las observaciones de la serie, de lo contrario no
seria una caracterstica de la distribucin.

No deben tener un carcter matemtico demasiado abstracto.

Deben ser susceptibles de clculo algebraico, rpido y fcil.




Prof. Simn Cabrera pgina 16 de 32


ESTADISTICA DESCRIPTIVA
MEDIA ARITMTICA

La media aritmtica ( X ) o simplemente la media es la medida de posicin de ms
importancia y utilizacin en las aplicaciones estadsticas por su fcil calculo e
interpretacin. Se trata del valor medio de todos los valores que toma la variable
estadstica de una serie de datos. La media es el valor ms representativo de la serie
de valores, es el punto de equilibrio, el centro de gravedad de la serie de datos. Por lo
general se le designa con X .

La media aritmtica de una serie de n valores de una variable X
1
, X
2
, X
3
; X
4
,.........X
n
,
es el cociente de dividir la sumatoria de todos los valores que toma la variable Xi, entre
el nmero total de ellos. La formula se puede expresar as:
n
X
X
n
i
i
=
=
1
.
Desviaciones o desvos.- Son diferencias algebraicas entre cada valor de la serie
o cada punto medio y la media aritmtica de dicha serie, o un valor cualquiera tomado
arbitrariamente. Los desvos o desviacin se designan con la letra di.
Dado una serie de valores X
1
, X
2
, X
3
, .......X
n
, se llama desvo a la diferencia entre un
valor cualquiera X
i
de la serie y un valor indicado k de esa misma serie. Si el valor
indicado k de la serie corresponde precisamente a la media aritmtica de esos valores
dados, se dice entonces que los desvos son con respecto a la media aritmtica. En
smbolo: ). ( X X d
i i
=

PROPIEDADES DE LA MEDIA ARITMTICA

1. La suma de las desviaciones con respecto a la media aritmtica es igual a cero.
. 0 =
i
d

2. La suma de las desviaciones al cuadrado de los diversos valores con respecto a la
media aritmtica es menor que la suma de las desviaciones al cuadrado de los
diversos valores con respecto a cualquier punto K, que no sea la media aritmtica.
( )
2

X X
i
< ( )
2

K X
i
.

3. La media aritmtica total o conjunta de dos o ms serie de datos, se puede
calcular en funcin de las medias aritmticas parciales y del nmero de datos de
cada una de ellas, mediante la siguiente formula:

, .......
........
3
3
2
2
1
1
3 3 2 2 1 1
k
k
k k
t
n
X
n
X
n
X
n
X
N
X n X n X n X n
X

+ + + =
+ + + +
=
Donde:

, ......
3 2 1 k
n n n n N + + + + = en esta n
1
, n
2
, n
3
y n
k
es el nmero de datos de cada
serie.
Adems, son X y X X X
k
.,.. .. .,., .,.. ..,.
3 ., 2 1
las medias de cada una de las series.






Prof. Simn Cabrera pgina 17 de 32


ESTADISTICA DESCRIPTIVA
4. La media del producto de una constante por una variable, es igual al producto de la
constante por la media de la variable.

. X K
n
X K
n
KX
X
i i
= = =



5. La media de la suma de una constante ms una variable, es igual a la media de la
variable ms la constante.
( )
( )
. K X
n
K
n
X
n
K X
X
i i
K X
i
+ = + =
+
=

+
., de
la misma forma se cumple esta propiedad para la resta.

CARACTERSTICAS PRINCIPALES DE LA MEDIA ARITMTICA

El valor de la media depende de cada una de las medidas que forman la serie
de datos, y se halla afectada excesivamente por los valores extremos de la
serie de datos.

La media se calcula con facilidad y es nica para cada caso y permite
representar mediante un solo valor la posicin de la serie de valores.

La media es una medida de posicin que se calcula con todos los datos de la
serie de valores y es susceptible de operaciones algebraicas.

CLCULO DE LA MEDIA PARA DATOS NO AGRUPADOS

Para calcular la media de datos no agrupados en clases se aplica la siguiente formula:
n
X
X
i
= . En donde n es el nmero total de datos y son los valores de la
variable.
i
X

Ejemplo:

Calcule la media aritmtica de los siguientes valores: { } 14 , 11 , 9 , 8 , 7 , 5 =
i
X

. 9
6
54
6
14 11 9 8 7 5
= =
+ + + + +
= =

n
X
X
i
Por lo tanto la media es 9.

CLCULO DE LA MEDIA PARA DATOS AGRUPADOS

Cuando se trabaja con la distribucin de frecuencia agrupada, se parte del supuesto
de que todos los datos comprendidos en un intervalo de clase se distribuyen
uniformemente a lo largo de este, entonces se puede tomar la marca de clase o punto
medio ( ) del intervalo como adecuada representacin de los valores que conforman
el mencionado intervalo. Para calcular la media en estas condiciones se pueden
utilizar tres mtodos: El mtodo directo o largo y dos mtodos abreviados. En este
curso utilizaremos el primer mtodo.
X
&





Prof. Simn Cabrera pgina 18 de 32


ESTADISTICA DESCRIPTIVA
MTODO DIRECTO

Este mtodo se le conoce tambin como mtodo largo; el mismo resulta demasiado
engorroso cuando las magnitudes de los puntos medios o de las frecuencias de clase
son muy grandes, debido a que los clculos son demasiados extensos. Los pasos a
seguir para calcular la media con este mtodo son los siguientes:

1. Se agrupan los datos en clases y se llevan a una columna, se calculan los
puntos medios de cada clase y se colocan en sus respectivas columnas, se
determinan las frecuencias de cada clase y se ubican en sus respectivas
columnas.

2. Se multiplican los puntos medios de cada clase por sus respectivas frecuencias,
luego se obtiene la sumatoria de las frecuencias (f
i
) multiplicadas por el punto
medio ( X
&
) as: .
i i
X f
&


3. Luego se calcula la media aritmtica aplicando la formula:
n Donde
n
X f
n f
X f
X
i
i
i i
.. ...

=
=
=
& &
es igual al nmero total de datos.

Ejemplo:

Calcule la media de la siguiente distribucin de frecuencia correspondiente al peso en
Kg. de un grupo de obreros. Realice los clculos respectivos para completar el
siguiente cuadro.

CLASES
i
f
75-------79 20
80-------84 40
85-------89 60
90-------94 100
95 ------99 140

=
i
f n =360

Solucin:

PESOS
X
&

N DE OBREROS
X f
i
&

75-------79 77 20 1540
80-------84 82 40 3280
85-------89 87 60 5220
90-------94 92 100 9200
95 ------99 97 140 13580
n =360
=
i i
X f
&
32820

Aplicando la formula se tiene: Interpretacin:
. 17 . 91
360
32820
= = =

N
X f
X
i i
&

El peso promedio del grupo de
360 obreros es de 91.17 Kg.



Prof. Simn Cabrera pgina 19 de 32


ESTADISTICA DESCRIPTIVA
LA MEDIANA

La mediana es el valor que divide en dos partes iguales, al conjunto de observaciones
ordenadas respecto de sus magnitudes, de tal manera que el numero de datos por
encima de la mediana sea igual al numero de datos por debajo de la misma. Se
designa por las letras Me. Tal como sucede con la media, el mtodo de determinacin
depende de si los datos son agrupados o no.

CLCULO DE LA MEDIANA PARA DATOS NO AGRUPADOS (Discretos)

Para encontrar la mediana en una serie de datos no agrupados, lo primero que se
hace es ordenar los datos en una forma creciente o decreciente y luego se ubica la
posicin que esta ocupa en esa serie de datos; para ello hay que determinar si la serie
de datos es par o impar.

Si el nmero n es impar, entonces la posicin de la mediana se determina por la
formula:
)
2
1
(
+
=
n
X Me , luego el nmero que se obtiene indica el lugar o posicin que
ocupa la mediana en la serie de valores, luego la mediana ser el nmero que ocupe
el lugar de lo posicin encontrada.

Si n es par, se aplica la formula
2
) 2 / 2 ( ) 2 / ( +
+
=
n n
X X
Me El resultado obtenido, es la
posicin que ocupara la mediana, pero en este caso se ubica la posicin de la
mediana por ambos extremos de la serie de valores y los dos valores que se obtengan
se le saca la media y esta ser la mediana buscada, por lo tanto la mediana, en este
caso, es un nmero que no se encuentra dentro de la serie de datos dados.

Ejemplos:

Sean los siguientes datos, 5, 12, 7, 8, 10, 6, y 9, los aos de servicios de un grupo de
trabajadores. Determine la mediana.

Lo primero que se hace es ordenar los datos en forma creciente o decreciente; Los
datos ordenados quedaran as:

5, 6, 7, 8, 9, 10, 12.

Luego, como se trata de un numero impar de datos (n=7), se aplica la formula
) 4 (
)
2
1 7
( )
2
1
(
X X X Me
n
= = =
+ +
, para ubicar la posicin de la mediana. Esto indica que la
mediana ocupa la posicin 4, que en la serie de valores esa posicin corresponde al
nmero 8, entonces, Me = 8.

Tomemos ahora los datos: 5, 5, 7, 9, 11, 12, 15, 18.

Como se trata de un numero par de datos (n =8), la mediana esta dada por:

10
2
20
2
11 9
2 2
) 5 ( ) 4 ( ) 2 / 2 ( ) 2 / (
= =
+
=
+
=
+
=
+
X X X X
Me
n n




Prof. Simn Cabrera pgina 20 de 32


ESTADISTICA DESCRIPTIVA
Cuando los valores de un conjunto de datos se agrupan en una distribucin de
frecuencia de clase, cada valor pierde su identidad, por tal motivo la mediana obtenida
de una distribucin de frecuencia de datos puede no ser la misma que la mediana
obtenida de los datos sin arreglar en clases, pero el resultado ser una aproximacin.
Cuando se trata de datos agrupados, la mediana se obtiene mediante el mtodo de
interpolacin. La interpolacin parte del supuesto de que los datos de cada intervalo
de la distribucin estn igualmente distribuidos.

PASOS PARA DETERMINAR LA MEDIANA EN DATOS AGRUPADOS

1. Se elabora la tabla de frecuencia de datos con sus diferentes intervalos de clases,
se ubican las frecuencias fi y se calculan las frecuencias acumuladas Fi de esa
distribucin.

2. Se determina la ubicacin o posicin de la mediana en el intervalo de la
distribucin de frecuencia, mediante la formula
2
n
. El resultado obtenido
determinar la clase donde se encuentra ubicada la mediana, lo cual se
conseguir en la clase donde la frecuencia acumulada Fi sea igual o superior a
este resultado. Luego se aplica la formula: Ic
fi
F
n
Li Me
i


+ =
) 1 (
2

Donde,
2
n
= posicin de la mediana
Li = es el limite inferior de la clase donde se encuentra ubicada la mediana.
F
(i-1)
= es el valor de la frecuencia acumulada anterior a la clase mediana.
fi = es el valor de la frecuencia de clase donde se encuentra la mediana.
Ic = es el tamao del intervalo de clase.
n = es el nmero total de datos de la distribucin en estudio.

Ejemplo:

Dada la siguiente distribucin de frecuencia referida a las horas extras laboradas por
un grupo de obreros. Calcule la mediana. Realice los clculos respectivos para
completar el siguiente cuadro.

N de horas Extras Obreros
55------59 6
60------64 20
65------69 18
70------74 50
75------79 17
80------84 16
85------89 5
n = 132






Prof. Simn Cabrera pgina 21 de 32


ESTADISTICA DESCRIPTIVA
Solucin:

Cuadro con las frecuencias acumuladas:

N de horas Extras Obreros Fi
55------59 6 6
60------64 20 26
65------69 18 44
70------74 50 94
75------79 17 111
80------84 16 127
85------89 5 132
N = 132
Clase Mediana


, 66
2
132
2
= =
n
luego se busca en la frecuencia acumulada Fi, un valor que sea igual o
superior a 66, este se encuentra en la clase 70 -74, la cual llamaremos clase
mediana. Por lo tanto el limite inferior de esa clase es 70 = Li. La frecuencia absoluta
de esa clase es 50 = fi , F(i-1) = 44 y el Ic = 5. Aplicando la formula se tiene:

. 2 . 72 2 . 2 70 5 .
50
22
70 5
50
44 66
70 = + =

+ =


+ = Me

Luego la mediana de esa distribucin es 72.2. Esto quiere decir que un 50 % de los
obreros trabajaron horas extras por debajo de 72.2 horas y el otro 50 % trabajaron
horas extras por encima de 72.2 horas.

CARACTERSTICAS DE LA MEDIANA

La mediana no es afectada por los valores extremos de una serie de valores,
puesto que la misma no es calculada con todos los valores de la serie.

La mediana no esta definida algebraicamente, ya que para su clculo no
intervienen todos los valores de la serie.

La mediana en algunos casos no se puede calcular exactamente y esto ocurre
cuando en una serie de valores para datos no agrupados el nmero de datos
es par, en este caso la mediana se calcula aproximadamente.

La mediana se puede calcular en aquellas distribuciones de frecuencia de
clases abierta, siempre y cuando los elementos centrales puedan ser
determinados.

La suma de los valores absolutos de las desviaciones de los datos individuales
con respecto a la mediana siempre es mnima. (propiedad)







Prof. Simn Cabrera pgina 22 de 32


ESTADISTICA DESCRIPTIVA
LA MODA

La moda es la medida de posicin que indica la magnitud del valor que se presenta
con ms frecuencia en una serie de datos; es pues, el valor de la variable que ms se
repite en un conjunto de datos. De las medidas de posicin la moda es la que se
determina con mayor facilidad, ya que se puede obtener por una simple observacin
de los datos en estudio, puesto que es el dato que se observa con mayor frecuencia.
Se designa con las letras Mo.

En las representaciones grficas la moda es el punto ms alto de la grfica. La
obtencin de la moda para datos agrupados no es un valor exacto, ya que vara con
las diferentes formas de agrupar una distribucin de frecuencia.

En algunas distribuciones de frecuencias o serie de datos no agrupados o agrupados
se pueden presentar dos o ms modas, en estos casos se habla de serie de datos
bimodales o multimodales respectivamente. Estos tipos de distribuciones o series de
valores se deben a la falta de homogeneidad de los datos.

Cuando una serie de valores es simtrica, la media, la mediana y el modo coinciden, y
si el grado de asimetra de la serie es moderada, la mediana estar situada entre la
media y el modo con una separacin de un tercio entre ambas. Tomando en cuenta
esta relacin, cuando se tengan dos de esta medidas se puede determinar la tercera;
sin embargo es conveniente utilizar esta relacin para calcular solamente la moda ya
que para calcular la media y la mediana existen formulas matemticas que dan
resultados ms exactos; la formula matemtica para calcular la moda por medio de la
relacin antes mencionada es: ( ) Me X X Mo = 3 .

Cuando los datos se encuentran no agrupados la determinacin de la moda es sencilla
y exacta; pero para calcularla en datos agrupados existen varios mtodos; cada uno
de los cuales puede dar un valor diferente de la moda: En este curso se dar el
mtodo de la interpolacin por considerarse uno de los ms precisos en el clculo de
esta. Este mtodo puede expresarse mediante la siguiente formula:

Ic Li Mo .
2 1
1

+

+ =

Donde,

Li = es el limite inferior de la clase modal.
1
= es la diferencia entre la frecuencia absoluta de la clase modal y la frecuencia de
la clase anterior a la modal.
2
= es la diferencia entre la frecuencia absoluta de la clase modal y la frecuencia de
la clase siguiente a la modal.
Ic = es el tamao del intervalo de clase.









Prof. Simn Cabrera pgina 23 de 32


ESTADISTICA DESCRIPTIVA
Ejemplo:

Dada la siguiente distribucin de frecuencia correspondiente al peso en Kg. de un
grupo de trabajadores de una empresa, calcule la moda.

Peso (Kg) Trabajadores
30-----39 2
40-----49 2
50-----59 7
60-----69 11
70-----79 12
80-----89 16
90-----99 2
TOTAL
Clase modal

La clase que presenta mayor frecuencia absoluta es 80----89, entonces esta sera la
clase modal, donde Li = 80 10 ; 14 2 16 ; 4 12 16
2 1
= = = = = Ic
Aplicando la formula se tiene:

. 22 . 82 22 . 2 80
18
40
80 10 .
14 4
4
80
2 1
1
= + = + =

+
+ =

+

+ = Mo L Mo
i


Este resultado de la moda se interpreta as: La mayora de los trabajadores tiene un
peso aproximadamente de 82.22 Kg .

CARACTERSTICAS DE LA MODA

El valor de la moda puede ser afectado grandemente por el mtodo de
elaboracin de los intervalos de clases.

El valor de la moda no se halla afectado por la magnitud de los valores
extremos de una serie de valores, como sucede en la media aritmtica.

La moda se puede obtener en una forma aproximada muy fcilmente, puesto
que la obtencin exacta es algo complicado.

La moda tiene poca utilidad en una distribucin de frecuencia que no posea
suficientes datos y que no ofrezcan una marcada tendencia central.

No es susceptible de operaciones algebraicas posteriores.

La moda se utiliza cuando se trabaja con escalas nominales aunque se puede
utilizar con las otras escalas.

La moda es til cuando se esta interesado en tener una idea aproximada de la
mayor concentracin de una serie de datos.







Prof. Simn Cabrera pgina 24 de 32


ESTADISTICA DESCRIPTIVA
OTRAS MEDIDAS POSICINALES

Cuando se estudio la mediana se pudo detectar que esta divide la serie de valores en
dos partes iguales, una generalizacin de esta medida da origen a unas nuevas
medidas de posicin denominadas:

Cuartiles; Deciles y Percentiles. Estas nuevas medidas de posicin surgen por la
necesidad de requerir de otras medidas que expresen diferentes situaciones de
orden, aparte de las sealadas por la mediana. Por lo tanto es interesante ubicar otras
medidas que fraccionen una serie de datos en diferentes partes. Es bueno destacar
que los cuartiles, los Deciles y los Percentiles son unas variantes de la mediana: De la
misma forma los percentiles abarcan tanto a los cuartiles como a los Deciles.

LOS CUARTILES.- Son medidas posicinales que dividen la distribucin de frecuencia
en cuatro partes iguales. Se designa por el smbolo Q
c
en la que c corresponde a los
valores 1, 2 y 3. El Q
1
es el valor debajo del cual queda el 25 % de los datos; Q
3
deja
el 75 % de los datos y Q
2
divide la distribucin de frecuencia en dos partes iguales, un
50 % que esta por debajo de los valores de Q
2
y otro 50 % que esta por encima del
valor de Q
2
. El Q
2
es igual a la mediana.

CLCULO DE LOS CUARTILES.- Para datos no agrupados no tiene ninguna utilidad
practica calcular los cuartiles. Para el clculo de los cuartiles en datos agrupados en
una distribucin de frecuencia existe un mtodo por anlisis grfico y otro por
determinacin numrica, por fines prcticos en esta ctedra se utilizara l ltimo
mtodo. Para calcular los cuartiles por el mtodo numrico se procede de la siguiente
manera:

1. Se localiza la posicin del cuartil solicitado aplicando la formula de posicin:
4
cn
Q
c
= , en donde c viene a ser el nmero del cuartil solicitado, n corresponde al
nmero total de datos de la distribucin y 4 corresponde al nmero de cuartiles que
presenta una distribucin de frecuencia.
2. Se determina la posicin que ocupa el cuartil mediante la formula:
4
cn
Q
c
= , el
resultado obtenido determinara la clase donde se encuentra ubicado el cuartil, lo
cual se conseguir en la clase donde la frecuencia acumulada Fi que sea igual o
superior a este resultado. Luego se aplica la formula:

.
4
) 1 (
Ic
fi
F
cn
Li Q
i
c


+ =



Donde,
4
cn
= Posicin que ocupa el cuartil en la distribucin de frecuencia.
c = corresponde al nmero del cuartil solicitado: 1,2 3.
Li = Limite real inferior de la clase donde se encuentra ubicado el cuartil.
F
( i-1)
= Frecuencia acumulada anterior a la clase donde se encuentra el cuartil.
fi = Frecuencia absoluta de clase donde se encuentra el cuartil.


Prof. Simn Cabrera pgina 25 de 32


ESTADISTICA DESCRIPTIVA
LOS PERCENTILES Son medidas posesinales que dividen la distribucin de
frecuencia en 100 partes iguales. Con estos se puede calcular cualquier porcentaje de
datos de la distribucin de frecuencia. Los percentiles son las medidas ms utilizadas
para propsitos de ubicacin de valor de una serie de datos ubicados en una
distribucin de frecuencia. El nmero de percentiles de una distribucin de frecuencia
es de 99. El percentil 50 es igual a la mediana y al cuartil 2, es decir:
por encima y 50 % por debajo de los datos de la distribucin. % 50
50 2
= = = P Q Me

El clculo de los percentiles es similar al clculo de los cuartiles con una variante en
la posicin de ubicacin de estos, que viene expresada por la siguiente formula:

100
pn
P
P
= . Con esta posicin se aplica la formula: Ic
fi
F
pn
Li P
i
p


+ =
) 1 (
100
.

Ejemplo:

Dada la siguiente distribucin correspondiente al salario semanal en dlares de un
grupo de obreros de una empresa petrolera trasnacional. Calcule: a) Q
1
, b) Q
2
, c)
Compare los resultados con la mediana, d) P
25
, f) P
50
, g) P
70

SALARIO EN $ Obreros Fi
200-----299 85 85
300-----399 90 175
400-----499 120 295
500-----599 70 365
600-----699 62 427
700-----799 36 463
463
Clase cuartil
Clase mediana
Clase percentil


a) Para calcular Q
1
se determina primero la posicin as: . 75 . 115
4
463
4
463 1
1
= = =
x
Q

Q
1
= 115.75. Con ese valor de la posicin encontrado se busca en las frecuencias
acumuladas para ver cual de esas es mayor o igual a ese valor. Observando las
frecuencias acumuladas se puede detectar que la posicin 115.75 se encuentra
en la clase 300------399, por lo tanto el Li = 300, fi = 90, y la F(i-1) = 85 y Ic = 100,
aplicando la formula se tiene:

17 . 334 17 . 34 300
90
3075
300 100 .
90
85 75 . 115
300
1
= + = + =


+ = Q

Este valor de Q
1
indica que el 25 % de los obreros en estudio, devengan un salario
semanal por debajo de 334.17 $ y el 75 % restante gana un salario por encima de
334.17 $.






Prof. Simn Cabrera pgina 26 de 32


ESTADISTICA DESCRIPTIVA
b) Para calcular Q
2
=Me se determina primero la posicin de este as.
5 . 231
4
463 2
2
= =
x
Q , ahora se ubica esta posicin en las frecuencias acumuladas
para determinar la posicin de Q
2
, se puede observar en la distribucin que esta
posicin esta ubicada en la clase 400----499, entonces, Li = 400, fi = 120, F(i-1) = 175
y Ic = 100, aplicando la formula se tiene:

. 08 . 447 08 . 47 400
120
5650
400 100 .
120
175 5 . 231
400
2
= + + =


+ = Q

Este resultado de Q
2
establece que el 50 % de los obreros de este estudio,
devengan un salario semanal por debajo de 447.08 $ y el otro 50 % devenga un
sueldo por encima de 447.08 $. Calcule la mediana y comprela con este resultado.

c) Calcular, Q
2
= P
50
, adems P
25
= Q
1
, la comprobacin de estos resultados se le
deja como practica al estudiante.

g) Para calcular P
70
lo primero que se hace es determinar la posicin,
10 . 324
100
463 70
70
= =
x
P . Ahora se ubica este resultado en la columna de frecuencias
acumuladas para encontrar la posicin de P
70
en la distribucin de frecuencia. Como
se puede observar en la tabla de distribucin de frecuencia, P
70
se encuentra ubicado
en la clase 500-------599, entonces, Li = 500, fi = 70, F(i-1) = 295 y Ic = 100,
aplicando la formula se tiene:

. 57 . 541 57 . 41 500
70
2910
500 100 .
70
295 10 . 324
500
70
= + = + =


+ = P

Esto indica que el 70 % de los obreros devengan un sueldo semanal que esta por
debajo de 541.57 $ y que el 30% de los restantes obreros, ganan un salario por
encima de 541.57 $.






















Prof. Simn Cabrera pgina 27 de 32


ESTADISTICA DESCRIPTIVA
MEDIDAS DE DISPERSION

INTRODUCCIN

La utilizacin de una medida de posicin escogida para representar a los datos no
indica otras caractersticas que el conjunto de observaciones que posee. No todas las
observaciones son iguales a la medida de posicin tomada o seleccionada; en general
los datos difieren unos de otros, por lo tanto se hace necesario encontrar ciertos
ndices o medidas que indiquen la variabilidad o dispersin del conjunto de
observaciones que se estudian.

Una medida de variabilidad es un numero que nos indica el grado de dispersin en un
conjunto de datos. Si el valor es pequeo (respecto de la unidad de medida) entonces
hay una gran uniformidad entre los datos (homognea). Por el contrario, un gran valor
nos indica poca uniformidad (heterognea). Cuando es cero quiere decir que todos los
datos son iguales.

Las medidas de dispersin se clasifican en dos grupos:

Medidas de Dispersin Absoluta.

Son aquellas que vienen expresadas en las mismas unidades originales que
indican la serie de datos. Entre las medidas de dispersin absoluta se encuentran:
el rango, el rango intercuartilico, la desviacin media, la varianza y la desviacin
tpica.

Medidas de Dispersin Relativas.

Estas medidas vienen expresadas en valores abstractos o porcentajes; su principal
funcin es la de determinar entre varias distribuciones la de mayor o menor
dispersin. La medida de dispersin relativa de mayor importancia es el coeficiente
de variacin.


RANGO O RECORRIDO.

Es la medida de dispersin mas sencilla y se define como la diferencia entre el valor
mas alto menos el valor mas pequeo y se designa por R. Es decir, R = X
max
-X
min
para
datos no agrupados. Si los datos estn agrupados en K clases el rango ser la
diferencia entre el limite superior de la K-esima clase menos el limite inferior de la
primera clase.

El rango nos dar una primera idea sobre las dispersin de los datos ya que si su valor
es pequeo nos indicar una gran concentracin de los datos, y si por el contrario su
valor es grande nos puede indicar una gran variabilidad o dispersin de los datos.









Prof. Simn Cabrera pgina 28 de 32


ESTADISTICA DESCRIPTIVA
RANGOS ESPECIALES

El rango nos da una idea de la dispersin total de las observaciones, por lo tanto
puede estar afectada por valores extremos dando en consecuencia una idea de alta
dispersin. Por tal motivo, se han definido otros rangos que tratan de subsanar este
problema.

RANGO NTERCUARTILICO. Se define como la diferencia entre el cuartil tres(Q3) y
el cuartil uno(Q1) de una distribucin de frecuencia y se expresa as: RI = Q3 Q1.

RANGO SEMI-NTERCUARTILICA. Es la diferencia entre el Q3 y el Q1 dividido
entre dos:

2
1 3
Q Q
RSI

= .

Si los valores de la RI o RSI son pequeos indica una alta concentracin de los datos
de la distribucin en los valores centrales de la serie de datos. Estas medidas se
utilizan para comparar los grados de variacin de los valores centrales en diferentes
distribuciones de frecuencias. Los mismos no son afectados por los valores extremos,
no se adaptan a la manipulacin algebraica, por tal motivo son de poco utilidad.

DESVIACIN MEDIA. La desviacin media de un conjunto de n observaciones x
1
, x
2
,
x
3
,. . .x
n
, es el promedio de los valores absolutos de las desviaciones (di) con respecto
a la media aritmtica o la mediana. Si se denomina como DM a la desviacin media,
entonces su formula matemtica ser la siguiente:
N
d
N
X X
DM
N
i
i
N
i
i
= =
=

=
1 1

Esta formula es para datos no agrupados. Se toma el valor absoluto en la ecuacin,
debido a que la primera propiedad de la media aritmtica establece que los desvos
(di) de una serie con respecto a la media aritmtica siempre son iguales a cero, es
decir: di = 0.

Cuando los datos estn en una distribucin de clases o agrupados se aplica la
siguiente formula:
n
d f
n
f X X
DM
N
i
i i
n
i
i i
= =
=

=
1 1
&

En esta formula
X
&
es el punto medio de cada clase y fi es la frecuencia de cada
clase. La Desviacin Media a pesar de que para su clculo se toman todas las
observaciones de la serie, por el motivo de no tomar en cuenta los signos de las
desviaciones (di), es de difcil manejo algebraico. Su utilizacin en estadstica es muy
reducida o casi nula, su importancia es meramente histrica, ya que de esta formula
es la que da origen a la desviacin tpica o estndar.





Prof. Simn Cabrera pgina 29 de 32


ESTADISTICA DESCRIPTIVA
VARIANZA

Una manera de resolver el problema de los signos de las desviaciones respecto de la
media aritmtica es elevndolos al cuadrado y luego sumar todos los resultados
obtenidos. Esta suma se puede considerar como una medida de la dispersin total de
los valores. Aquellos que estn mas alejados de la media aritmtica tendrn un aporte
mayor a esta suma de cuadrados.

Su mayor utilidad se presenta en la estadstica inductiva y se puede interpretar como
una medida de variacin promedio (o el promedio de la suma de los cuadrados). Se
obtiene dividiendo la variacin total entre el numero de unidades o medidas. Se
designa por la letra S
2
su formula de calculo es al siguiente:
agrupados no datos para
n
X X
S
i
..,.
) (
2
2


=

agrupados datos para X
n
X f
n
X X f
S
i i i i
2
2 2
2
) (
=

=


DESVIACIN TIPICA

Como la varianza es el promedio de los desvos respecto de la media elevados al
cuadrado, viene entonces expresada en unidades cuadradas. Para obtener una
medida de dispersin en las unidades originales se le extrae la raz cuadrada (positiva)
a la varianza, obteniendo as otra medida de dispersin denominada desviacin tpica
o estndar, la cual se designara por S y ser igual a :

n
X X
S
i

=
2
) (
&
Para datos no agrupados


2
2 2
) (
X
n
f X
n
f X X
S
i i i i
=

=

&
Para datos agrupados

INTERPRETACIN DE LA DESVIACIN TPICA

La desviacin tpica como medida absoluta de dispersin, es la que mejor nos
proporciona la variacin de los datos con respecto a la media aritmtica, su valor se
encuentra en relacin directa con la dispersin de los datos, a mayor dispersin de
ellos, mayor desviacin tpica, y a menor dispersin, menor desviacin tpica.
Su mayor utilidad se presenta en una distribucin normal, ya que en dicha distribucin
en el intervalo determinado por
X
se encuentra el 68. 27% de los datos de la
serie; en el intervalo determinado por la
2 X
se encuentra el 95,45% de los datos
y entre la
3 X
se encuentra la casi totalidad de los datos, es decir, el 99,73% de
los datos; adems, existe una regla general de gran utilidad para la comprobacin de
los clculos que dice: una oscilacin igual a seis veces la

, centrada en la media
comprende aproximadamente el 99% de los datos.
Prof. Simn Cabrera pgina 30 de 32


ESTADISTICA DESCRIPTIVA
Ejemplo:

Los siguientes datos corresponden al nmero de panes consumidos por un grupo de
familias de una urbanizacin de la ciudad, durante una semana determinada.


Clases f
i

3032 10
3335 18
3638 60
3941 100
4244 80
4547 14
4850 6
288

Solucin:

Clases f
i


i
X
&

i i
X f
&

2
i i
X f
&
3032 10 31 310 9610
3335 18 34 612 20808
3638 60 37 2220 82140
3941 100 40 4000 160000
4244 80 43 3440 147920
4547 14 46 644 29624
4850 6 49 294 14404
288 11520 464508

. 0 . 40
288
11520
= = =

n
X f
X
i i
&


88 . 12
288
11520
288
464508
2
2
2
2
=

= =

X
n
X f
S
i i






Interpretacin.- El resultado obtenido indica que en promedio, el consumo de pan de
trigo del grupo de familias de esa urbanizacin se dispersa con respecto a su media
aritmtica en una cantidad igual a 3.59.

=

=

2
2
2
1
288
11520
288
464508
n
X f
n
X f
S
i i i
& &
. 59 . 3 88 . 12 1600 88 . 1612 = = =
Prof. Simn Cabrera pgina 31 de 32


ESTADISTICA DESCRIPTIVA
DISPERSIN RELATIVA

Las medidas de variabilidad, estudiadas hasta ahora, solo permitan medir las
dispersiones absolutas de los trminos de la muestra. Las medidas, tomadas en esas
condiciones, sern de utilidad, solo cuando se trata de analizar una sola muestra;
pero, cuando hay que establecer comparaciones entre distintas muestras, ser
necesario expresar tales medidas en valores relativos, que pueden ser proporciones o
porcentajes.

Las medidas de dispersin relativas permiten comparar grupos de series distintas en
cuanto a su variacin, independientemente de las unidades en que se midan las
diferentes caractersticas en consideracin. Generalmente las medidas de dispersin
relativas se expresan en porcentajes, facilitando as el estudio con medidas
procedentes de otras series de valores La dispersin relativa viene a ser igual a la
dispersin absoluta dividida entre el promedio.

Existen varias medidas de dispersin relativa, pero, la ms usada es el coeficiente de
variacin de Pearson, este es un ndice de variabilidad sin dimensiones, lo que permite
la comparacin entre diferentes distribuciones de frecuencias, medidas en diferentes
unidades. El coeficiente de variacin de Pearson se designa con las letras CV. La
formula matemtica es:
100 x
X
S
CV =

Una serie de valores ser ms dispersa que otra mientras su CV sea mayor.

Ejemplo:

La venta en el mercado de tres productos, varia de acuerdo al siguiente cuadro.
Determine el CV de cada uno y diga cul de ellos presenta mayor variacin y cul la
menor.


Producto

X

S Unidades CV
1 45 5 Bs. 11.11 %
2 450 40 Bs. 8.87 %
3 4500 350 Bs. 7.78 %

Para resolver el problema se calcula el CV de cada producto y luego s determina cul
presenta mayor o menor variacin

CV = Sx100/
X


CV
(1)
= 5x100/45 = 11.11 %.

CV
(2)
= 40x100/450 = 8.87 %.

CV
(3)
= 350x100/4500 = 7.78 %.

Se puede observar que la menor dispersin la presenta el producto 3, por lo tanto, de
los tres productos el que menos varia es ese; por otro lado el de mayor dispersin o
variabilidad es el producto 1.
Prof. Simn Cabrera pgina 32 de 32

Anda mungkin juga menyukai