Anda di halaman 1dari 0

UNIVERSIDAD TECNOLGICA DEL PER

Vicerrectorado de Investigacin








ESTADSTICA I

TINS Bsicos
CONTABILIDAD

TEXTOS DE INSTRUCCIN BSICOS (TINS) / UTP


Lima - Per


ESTADSTICA I

2












ESTADSTICA I
Desarrollo y Edicin : Vicerrectorado de Investigacin

Elaboracin del TINS : Ing. Jos Fernndez Chavesta
Ing. Tito Agero Arias
Diseo y Diagramacin : Julia Saldaa Balandra
Soporte acadmico : Instituto de Investigacin
Produccin : Imprenta Grupo IDAT

Queda prohibida cualquier forma de reproduccin, venta, comunicacin pblica y
transformacin de esta obra.

ESTADSTICA I
3














El presente material contiene una compilacin de obras de Estadstica
publicadas lcitamente, resmenes de los temas a cargo del profesor;
constituye un material auxiliar de enseanza para ser empleado en el
desarrollo de las clases en nuestra institucin.

ste material es de uso exclusivo de los alumnos y docentes de la
Universidad Tecnolgica del Per, preparado para fines didcticos en
aplicacin del Artculo 41 inc. C y el Art. 43 inc. A., del Decreto
Legislativo 822, Ley sobre Derechos de Autor.
ESTADSTICA I

4
ESTADSTICA I
5
Presentacin



La Matemtica, ciencia de la ms alta jerarqua, en el concierto de las Ciencias,
desde los albores de la civilizacin sigue siendo la base del desarrollo cientfico,
tecnolgico y humanstico de nuestro mundo.

La Estadstica como conjunto de conocimientos de la Matemtica, se erige en el
espacio del pensamiento probabilstico; permite la sistematizacin y anlisis de
datos, la sntesis de resultados en el tratamiento de datos, conduce a la
validacin de resultados y facilita la produccin de informes confiables; basado
en datos obtenidos en diferentes sucesos ocurridos en el acontecer de los actos
del hombre.

En cada espacio de la actividad del hombre y de la dinmica de la sociedad
organizada, los procesos de medicin, las tcnicas de evaluacin, los mtodos de
optimizacin, los mtodos de pronstico, las tcnicas de confiabilidad, la teora
de decisiones, etc., se valen de la Ciencia de la Estadstica; tanto en el gobierno
de un Estado, cuando en la gestin ptima y confiable de empresas, como
tambin en la direccin humanstica de las instituciones educativas, la validacin
de las investigaciones, etc.

De all que, en la formacin acadmica de profesionales, se debe conceder al
estudio de la Estadstica un espacio sustancial, en la conviccin de dotar a sus
estudiantes un instrumento matemtico analtico pertinente a la necesidad que
plantea un determinado ejercicio, problema o proyecto de orden macro o micro
econmico.

En este marco, se ha desarrollado el presente texto de instruccin, dirigido a
estudiantes de Contabilidad; basado en un acucioso trabajo de seleccin de
temas, contenidos en diferentes fuentes bibliogrficas, concordantes con el
sillabus de la Asignatura de Estadstica I.

El trabajo prolijo de recoleccin y seleccin ha sido posible gracias a la
denodada labor acadmica de los profesores Jos Fernndez Chavesta y Tito
Agero Arias, quienes han cristalizado su experiencia profesional y acadmica
en la preparacin del presente texto.

El texto en mencin plasma la preocupacin institucional de innovacin de la
enseanza-aprendizaje en educacin universitaria, que en acelerada continuidad
promueve la produccin de materiales educativos, actualizados en concordancia
ESTADSTICA I

6
a las exigencias de estos tiempos y ha sido estructurado segn los siguientes
captulos:

El captulo I comprende la parte introductoria al curso, el desarrollo de algunos
conceptos bsicos as como la importancia de la estadstica, mtodos estadsticos,
variables y su clasificacin, y la escala de medicin de las variables.

El captulo II comprende el estudio de la recoleccin y procesamiento de datos,
as como el diseo de cuestionarios.

El captulo III trata de la Organizacin y Distribucin de frecuencias.

El captulo IV trata sobre la Presentacin Tabular y la presentacin Grfica de
Datos.

El captulo V introduce las Medidas de tendencia Central (Media Aritmtica,
Geomtrica, Armnica), la Mediana y la Moda.

El captulo VI abarca el estudio de las Medidas de posicin (cuartiles, deciles,
percentiles).

El captulo VII nos introduce al tema de las Medidas de dispersin (rango,
desviacin media, desviacin estndar, varianza y coeficiente de variacin).

El captulo VIII trata de la Regresin y Correlacin lineal simple.

Al finalizar estas lneas, el reconocimiento institucional a los profesores Ing.
Jos Fernndez Chavesta e Ing. Tito Agero Arias, quienes habiendo trabajado
con denuedo han hecho posible ste texto de instruccin, como expresin de su
destacada labor profesional y acadmica.


VICERRECTORADO DE INVESTIGACIN
ESTADSTICA I
7

ndice






CAPTULO I
Introduccin: Conceptos Bsicos ............................................................. 11
1.1 Definicin ........................................................................................... 11
1.2 Importancia de la Estadstica .............................................................. 11
1.3 Por qu se aplica tan poco? .............................................................. 12
1.4 Mtodos Estadsticos .......................................................................... 13
1.5 Ramas de la Estadstica....................................................................... 14
1.6 Poblacin o Universo.......................................................................... 15
1.7 Muestra .............................................................................................. 15
1.8 Parmetro y Estadgrafo...................................................................... 15
1.9 Variables ............................................................................................. 15
1.10 Medicin de las variables.................................................................... 16
Ejercicios ..................................................................................................... 18

CAPTULO II
2.1 Recoleccin y Procesamiento de Datos .............................................. 21
2.2 Diseo de Cuestionarios ..................................................................... 22

CAPTULO III
3.1 Clasificacin de Datos ........................................................................ 31

CAPITULO IV
4.1 Representacin de Datos..................................................................... 43
4.2 Tablas o Cuadros Estadsticos ............................................................ 43
4.3 Grficos o Diagramas ......................................................................... 46
Ejercicios ..................................................................................................... 54

CAPTULO V
5.1 Medidas de Resumen.......................................................................... 61
5.2 Medidas de Tendencia Central............................................................ 61
5.3 Relacin entre la Media Aritmtica, Mediana y Moda....................... 72

ESTADSTICA I

8
CAPTULO VI
6.1 Medidas de Posicin ........................................................................... 79
6.2 Cuartiles para Datos no Agrupados .................................................... 79
6.3 Deciles para Datos no Agrupados....................................................... 81
6.4 Percentiles para Datos no Agrupados ................................................. 82
6.5 Cuartiles para Datos Agrupados ......................................................... 84
6.6 Deciles para Datos Agrupados............................................................ 85
6.7 Percentiles para Datos Agrupados ...................................................... 87

CAPTULO VII
7.1 Medidas de Dispersin........................................................................ 89
7.2 Caractersticas de las Medidas de Dispersin..................................... 96
Ejercicios ..................................................................................................... 96

CAPTULO VIII
8.1 Medidas de Forma .............................................................................. 103
8.2 Coeficiente de Asimetra .................................................................... 103
8.3 Coeficiente de Curtosis....................................................................... 105
Ejercicios ..................................................................................................... 107

CAPTULO IX
9.1 Distribuciones Bidimensionales.......................................................... 113
9.2 Coeficiente de Correlacin Lineal ...................................................... 114
9.3 Regresin Lineal ................................................................................. 117
Ejercicios ..................................................................................................... 120

Bibliografa................................................................................................. 131





ESTADSTICA I
9
Distribucin Temtica
CLASE TEMA SEMANA HORAS
1-2
Introduccin, Mtodos Estadsticos, Variables.
Manejo de variables
1 5
3-4
Recoleccin y procesamiento de datos
Diseo de cuestionarios
2 5

5-6

Organizacin y Distribucin de frecuencias
Presentacin Tabular y Grfica de Datos(Casos
prcticos)
3 5
7-8
Medidas de tendencia Central (Media
Aritmtica, Geomtrica, Armnica)
Prctica N 1
4 5
9-10
La Mediana: Concepto Aplicaciones
Calculo de la Mediana aplicacin en la
administracin
5 5
11-12
La Moda : Concepto Aplicaciones
Calculo de la moda (casos prcticos)
6 5
13-14
Relacin entre la Media aritmtica, Mediana y
Moda (Escogimiento para los casos prcticos)
Problemas de Aplicacin en la Administracin
7 5
15-16
Anlisis Unidimensional con las medidas de
posicin central
Prctica N 2
8 5
17-18
Repaso general
Problemas de Aplicacin
9 5
EXAMEN PARCIAL 10 2


19-20
Medidas de dispersin: Rango y Cuantiles,
Desviacin Cuantil y Desviacin Media
Calculo del Rango Desviacin Cuartel y
Desviacin media (Aplicaciones )
11 5
21-22
Concepto de los Sextiles, Deciles, Percentiles
Prctica N 3
12 5
23-24
La varianza con datos no agrupados y
agrupados.
Calculo de la Varianza(Problemas de
Aplicacin)
13 5

25-26
Desviacin standard: Caractersticas y
propiedades.
Prctica N 4
14 5
ESTADSTICA I

10

CLASE TEMA SEMANA HORAS
27-28
Coeficiente asimetra: coeficiente
intercuartilico.
Problemas de aplicacin con la desviacin
estndar y el coeficiente de Variacin
15 5
29-30
Coeficiente de kurtosis, coeficiente de sesgo,
coeficiente de variabilidad.
Resolucin de problemas sobre mediadas de
Asimetra y Curtosis y anlisis Unidimensional
16 5
31-32
Prctica N 5
Anlisis bidimensional, variables nominal,
ordinal, matriz 2 x 2 tablas de contingencia.
Casos Prcticos
17 5
33-34
Regresin simple nivel de medicin, intervalo y
razn. Regresin simple. Clculo e
interpretacin.
Problemas de pronosticacin y prediccin
aplicando Regresin y correlacin lineal simple
18 5
EXAMEN FINAL 19 2
EXAMEN SUSTITUTORIO 20 2
ESTADSTICA I
11
CAPTULO I
I ntroduccin: Conceptos Bsicos



1.1. DEFINICIN
La Estadstica es un conjunto de tcnicas utilizadas para recopilar,
organizar, presentar, analizar e interpretar datos, con el fin de obtener
conclusiones y tomar decisiones sobre determinados hechos o fenmenos
en estudio.

Desde un punto de vista Cientfico la estadstica es una ciencia que est
ligada a los mtodos cientficos en la toma, recopilacin, crtica,
clasificacin, presentacin y anlisis de la informacin.

En conclusin, la estadstica es el conjunto de procedimientos que nos
permiten analizar la muestra


1.2. IMPORTANCIA DE LA ESTADSTICA
La Estadstica es importante porque a travs de sus tcnicas se puede
reunir informacin para su respectivo anlisis y posterior toma de
decisiones.

Las estadsticas son fundamentales a los efectos de gestionar y mejorar
temas o actividades tales como:

El control de calidad.
El nivel de averas y sus frecuencias.
Los tiempos para cambios o preparacin de herramientas.
Los niveles de productividad de distintos procesos, actividades y
productos.
Los costos correspondientes a distintos tipos de conceptos y
actividades.
La gestin de crditos y cobranzas.
El seguimiento del flujo de fondos.
Los niveles de satisfaccin de los clientes y usuarios.
Los tipos de accidentes y sus frecuencias.
El anlisis paretiano de defectos, costos, rentabilidades, ventas.
ESTADSTICA I

12
Ventas por clientes, vendedores, zonas y productos.
Predicciones de ventas por zonas, productos, servicios o sucursales.
Capacidad de los procesos en cuanto a generacin de niveles de
costos, calidad y productividad.
Tiempos totales de ciclos productivos.
Tiempos de respuestas.
Gestin de inventarios.
Cumplimiento de aprovisionamiento por parte de los proveedores.
Prediccin de ventas por canales de comercializacin.
Proyectos de inversin.
Probabilidades para la construccin del "rbol para la Toma de
Decisiones".
Evolucin de los distintos ratios econmicos financieros y
patrimoniales a lo largo del tiempo.
Estudios e investigacin de mercado.
Tiempos de mquinas y personal por actividad.
Cantidad y representacin porcentual de distintos problemas y sus
efectos econmicos en la organizacin.
Tasa de polivalencia del personal.
Productos ms demandados, a nivel global, por zona y por canal de
comercializacin.
Porcentajes de actividades generadoras de valor agregado para los
clientes finales, de valor agregado para la empresa y carentes de valor
agregado.
Tiempos promedios, mximos y mnimos de reparaciones por tipo de
averas.
Clculos de costos y en especial para el Costeo Basado en
Actividades.
Para los clculos de productividades.
Coeficientes de correlacin.
Estadstica del personal (directivos y empleados)


1.3. POR QU SE APLICA TAN POCO?
En parte por una cuestin cultural de parte de los empresarios, pero en
mayor medida a la falta de preparacin de los profesionales, en materia
estadstica, sobre todo de aquellos que asesoran en cuanto a la gestin de
las empresas.

Lo antes descrito es menos frecuente en los pases anglosajones, los
cuales tienen una fuerte cultura e inclinacin por las estadsticas y las
probabilidades.
ESTADSTICA I
13

Otro tanto se da en Japn o Corea, pases que dan a la educacin de las
estadsticas y matemticas una fuerte preponderancia en sus planes de
estudios y luego en la aplicacin prctica.

Sin lugar a dudas la cuestin no es disponer de datos estadsticos, si los
mismos no son debidamente interpretados, o ni siquiera son tenidos en
consideracin. Por lo tanto es menester concientizar y formar a los
directivos y empleados acerca de la fundamental y trascendental
importancia de la informacin estadstica a la hora de planificar, dirigir y
controlar la marcha de la empresa.

Las estadsticas combinadas con el Control de Gestin y el Tablero de
Comando estn en condiciones de producir resultados verdaderamente
arrolladores. Si a ello se le suma las posibilidades para las grandes
empresas de disponer de sistemas de simulacin, las decisiones
estratgicas que se adopten tomarn nuevas formas y colores.


1.4. MTODOS ESTADSTICOS

1.4.1 Concepto
Son un conjunto de procedimientos que se aplican en una secuencia
lgica con el fin de recopilar, organizar, presentar, analizar e interpretar
datos de algunos hechos concretos.

1.4.2. Etapas
El estudio de los mtodos estadsticos comprende las siguientes etapas:
Etapa de planeamiento
Etapa de recoleccin de datos
Etapa de elaboracin de datos
Etapa de presentacin de datos
Etapa de anlisis e interpretacin de datos
Etapa de publicacin de datos

ESTADSTICA I

14
1.5. RAMAS DE LA ESTADSTICA

1.5.1. Estadstica Descriptiva
Es la parte de la estadstica que se encarga en la recoleccin, crtica,
clasificacin, simplificacin, presentacin y anlisis descriptivos de los
datos. A la estadstica descriptiva se le puede destacar mediante el
siguiente diagrama:



1.5.2. Estadstica Inferencial
Es la rama de la estadstica que se encarga de Inferir o estimar los
problemas de los parmetros de la poblacin a partir de las conclusiones
del anlisis de la muestra.





ESTADSTICA I
15

1.6. POBLACIN O UNIVERSO
Conjunto grande y completo de individuos, elementos o unidades que
presentan caractersticas comunes.


1.7. MUESTRA
Es un subconjunto de la poblacin.


1.8. PARMETRO Y ESTADIGRAFO

1.8.1. PARMETRO
Es una medida que se utiliza para describir las caractersticas de la
poblacin, para ello es necesario la informacin completa de la
poblacin, las conclusiones contienen una certidumbre total. Las ms
importantes son:

La media poblacional (Ux)
La varianza poblacional (
2
)
La proporcin poblacinal (P)

1.8.2. ESTADIGRAFO
Es una medida utilizada para describir las caractersticas de la muestra y
las conclusiones contienen un cierto grado de incertidumbre o de
probabilidad. Las mas usadas son:

La media muestral ( x )
La varianza muestral (s
2
)
La proporcion muestral (p)


1.9. VARIABLES
Son magnitudes que tienden a sufrir modificaciones o cambios de un
dominio determinado.

Estadsticamente es una caracterstica que posee una poblacin y puede
tomar diferentes valores.



ESTADSTICA I

16
1.9.1. CLASIFICACIN Y MANEJO DE VARIABLES

1.9.1.1.VARIABLES CUALITATIVAS
Su dominio de variacin es objeto de clasificacin. Ejemplos:
Lugar de nacimiento: Lima, Lambayeque, Trujillo.
Estado Civil: soltero, casado, viudo, divorciado, conviviente.

1.9.1.2.VARIABLES ORDINALES
Su dominio de variacin es objeto de clasificacin y orden.
Ejemplo:
Nivel de Instruccin : Analfabeto, primaria, secundaria, superior
tcnica, superior universitaria.
Nivel socioeconmico: alta, media, baja.

1.9.1.3.VARIABLES CUANTITATIVAS
Su dominio de variacin puede ser contado o medido. Se clasifica
en:

A) V. CUANTITATIVA DISCRETA
Cuando los valores del dominio de variacin son contados,
por lo tanto solo asumen valores enteros. Elemplos:
Nmero de nacidos vivos, Nmero de alumnos, Cantidad de
trabajadores.

B) V. CUANTITATIVA CONTINUA
Cuando los valores del dominio de variacin pueden ser
medidos; pueden asumir valores decimales. Ejemplos: Peso,
Temperatura, Talla, Sueldo, utilidades, costos de
produccion, etc.


1.10. MEDICIN DE LAS VARIABLES

A) Escala Nominal
Es el nivel mas simple de medicin donde la variable establece
categoras sin importar el orden. En este nivel de medicin las
categoras solo se nombran o se enumeran, pero no se comparan.
Ejemplo: estado civil, sexo.

ESTADSTICA I
17
B) Escala ordinal
Es el segundo nivel de medicin donde la variable establece
categoras jerarquizadas. Este nivel de medicin no mide las
magnitudes de las diferencias, pero si permite apreciar que los
valores asignados a los individuos caen ms altos o ms bajos que
otros. Ejemplo:

-Totalmente de acuerdo
-De acuerdo
-Neutral
-En desacuerdo
-Totalmente en desacuerdo.

C) Escala de Intervalo
Es el tercer nivel de medicin , entre cuyos diversos valores que
toma la variable existen a la vez, clasificacin, orden y grados de
distancia iguales entre las diferentes categoras, es decir, los
intervalos son considerados como equivalentes y con un origen
convencional( la unidad de medida no necesariamente tiene que
partir del valor cero; solo sirve como punto o valor de
comparacin). Ejemplo:

Temperatura: Una persona puede llegar a tener 39C de fiebre,
pero ello no significa que su grado de temperatura haya tenido
que partir de 0C.
Rendimiento acadmico
Indices de precios al consumidor


D) Escala de razn o proporcin
Es el nivel ms alto de medicin, y donde la variable supone o
comprende a la vez a todos los casos anteriores: clasificacin,
orden, distancia, y origen nico natural( la unidad de medida
necesariamente tiene que partir del valor cero). Ejemplo:

- Edad:un trabajador puede tener 30 aos de edad, pero para
llegar a esa edad, necesariamente ha tenido que partir de 0
aos
- Estatura
- Peso
- Sueldo

ESTADSTICA I

18
CLASIFICACIN DE LAS VARIABLES SEGN SU ESCALA DE
MEDICIN




















EJERCICIOS
1) Explique la diferencia entre una variable y una constante
2) Explique la diferencia entre datos cualitativos y cuantitativos
3) Indique si las siguientes variables son cualitativas, cuantitativas u
ordinales:
a) La vida til de un fluoresecente
b) La marca de un foco
c) La cotizacin de acciones
d) El nmero de accidentes por semana en una fbrica
e) Los tipos de accidentes que ocurren en una fbrica
f) El nmero de personas que asisten diariamente al trabajo, en una
fbrica.
g) Categora Docente
h) Lugar de nacimiento
i) Sueldo de los trabajadores
j) Nivel de inflacin mensual
4) Explique la diferencia entre una escala nominal y una ordinal
5) Explique la diferencia entre una escala ordinal una de intervalo
6) Explique la diferencia entre una escala de intervalo y una de razn
VARIABLES
-CUALITATIVAS
-ORDINALES
CUANTITATIVAS
-Discretas
-Continuas
NOMINAL
ORDINAL
INTERVALO
RAZN O
PROPORCIN
ESTADSTICA I
19
7) La siguiente informacin se incluye en el registro personal de Arturo
Fernndez:
a) Sexo: maculino
b) Estado civil: soltero
c) Escolaridad: Superior
d) Estatura: 1.63 m.
e) Peso: 56 kg.
f) Aos de experiencia: 5 aos
g) Labor: Asistente Administrativo
h) Sueldo: S/1600 mensual

Se pide clasificar cada elemento del registro personal segn el tipo de
dato y el mtodo de medida.
8) Cules son las ramas de la Estadstica? defina c/u de ellos con ejemplos.
9) Qu tipo de variables son las siguientes, segn su naturaleza:?
Ej.
9.1. Nmero de empresas: ...... Cuantitativas discretas...........................
9.2. Velocidad de los mviles:...................................................................
9.3. Regiones:............................................................................................
9.4. Volumen de ventas:.............................................................................
9.5. Accidentes de trabajo:.........................................................................
9.6. Estudio:................................................................................................
9.7. Utilidades de una empresa:.................................................................
9.8. Profesionales:......................................................................................
9.9. Clases sociales:....................................................................................
9.10. Partidos Polticos.................................................................................
10) Qu diferencia existe entre poblacin y una muestra?
11) Cul es la diferencia entre Parmetro y estadgrafo? Explique
detalladamente.
ESTADSTICA I

20
ESTADSTICA I
21
CAPTULO II

Recoleccin y Procesamiento de
Datos


2.1. RECOLECCIN Y PROCESAMIENTO DE DATOS
Antes de procesar un conjunto de datos para la toma de decisiones, el
analista debe encontrar los datos apropiados.

La recoleccin de datos consiste en la obtencin de la informacin. Se
realiza teniendo en cuenta lo siguiente:

A) FUENTES DE INFORMACIN
a) Fuente primaria
Cuando la informacin se obtiene directamente de la misma
persona o entidad, utilizando ciertas tcnicas(entrevistas,
cuestionarios,etc.)

b) Fuente Secundaria
Cuando la informacin a obtener, ya ha sido recopilada y
elaborada por otras personas o instituciones.

B) SISTEMAS DE RECOLECCIN DE DATOS
a) Registros
Ejemplos: Registro de Contribuyentes, Registro Electoral,
Registro Civil.

b) Encuestas
Censal. Ejemplo: Censo de poblacin y vivienda
Muestral.

C) TCNICAS DE RECOLECCIN DE DATOS
- Cuestionarios formularios.
- Observacin
- Entrevista
- Encuestas de puerta en puerta
- Telfono

ESTADSTICA I

22
2.2. DISEO DE CUESTIONARIOS
2.2.1. Introduccin
Los cuestionarios en el proceso de investigacin son una prctica comn
utilizada por los investigadores.

2.2.2. Supuestos
El uso de cuestionarios en investigacin supone que:
1. El investigador debe partir de objetivos de estudio perfectamente
definidos
2. Cada pregunta es de utilidad para el objetivo planteado por el
trabajo.
3. El investigador debe estructurar las preguntas teniendo en mente
siempre los objetivos del trabajo.
4. El que contesta est dispuesto y es capaz de proporcionar
respuestas fidedignas.

2.2.3. Confiabilidad
Una pregunta es confiable si significa lo mismo para todos los que
la van a responder. Se puede confiar en una escala cuando
produce constantemente los mismos resultados al aplicarla a
sujetos similares. La confiabilidad implica consistencia.
El investigador debe asegurarse que el tipo de persona a quien se
le van a hacer las preguntas tenga la informacin necesaria para
poder responder.

El asegurar la respuesta de los que se les aplique el cuestionario
redundar en resultados confiables. Para la confiabilidad de los
resultados hay que determinar por qu no todos respondieron el
cuestionario. Es necesario investigar con los no respondientes
para conocer las razones. Un cuestionario largo es demasiado
cansado y las preguntas finales se responden sin entusiasmo, lo
cual le resta confiabilidad.

2.2.4. Validez
Una pregunta es vlida si estimula informacin exacta y relevante.
La seleccin y la redaccin influyen en la validez de la pregunta.
Algunas preguntas que son vlidas para un grupo de personas,
pueden no serlo para otro grupo. Entre menos tenga que
reflexionar el sujeto, ms vlida ser la respuesta.
La validez implica congruencia en la manera de plantear las
preguntas.


ESTADSTICA I
23
2.2.5. Preguntas clave
1. De cunto tiempo disponen quienes respondern para
contestar el cuestionario?
2. Cunto tiempo tiene el investigador para editarlo,
presentarlo, aplicarlo, codificarlo, procesarlo y analizarlo?
3. Qu tan dispuestos estn para responder quienes van a
contestar?
4. Cunto costar su aplicacin?

2.2.6. Antes de disear el cuestionario
Es necesario determinar si el cuestionario tendr preguntas
abiertas o cerradas. Para el anlisis de las preguntas es mejor que
stas sean cerradas. Para cerrarlas, primero se deben hacer las
preguntas abiertas con una muestra de la poblacin. Con estas
respuestas, se pueden disear las preguntas cerradas.
Es necesario estar seguros de que los encuestados respondan. Por
eso es importante conocer las opiniones de los posibles sujetos
acerca del tema a investigar, antes de disearlo.
El contacto inicial es fundamental para lograr que los encuestados
respondan.

Hay que preparar una explicacin para los encuestados sobre la
importancia de su participacin y lo que se har con los resultados
de la investigacin. En esta explicacin se les debe asegurar el
anonimato de su participacin y ofrecerles una copia del resumen
del trabajo cuando ste est terminado (habr que cumplir esta
promesa).

El investigador tiene que pensar en cmo va a presentar los
resultados antes de elaborar el cuestionario. Hay que involucrar a
alguien que sea responsable de capturar la informacin de los
cuestionarios as como a una persona que haga el procesamiento
de los datos en la computadora. Ellos pueden ayudar a determinar
la mejor presentacin de cada una de las preguntas.

2.2.7. Diseo del cuestionario
El ttulo del trabajo debe estar al inicio del cuestionario.
Hay que incluir instrucciones breves, pero incluirlas. Es
conveniente usar una tipografa diferente a la de las preguntas.
Los puntos importantes deben ir cercanos al inicio del
cuestionario.
ESTADSTICA I

24
Hay que numerar las preguntas. Es importante agrupar las
preguntas en secciones lgicas. Debe haber una categora para
cada posible respuesta, pues si se omite una opcin, se forzar al
que responde a contestar de una manera que no refleje su
respuesta. Por eso en ocasiones se necesita abrir una opcin de
"otros" con un rengln amplio para dejar esa parte de la pregunta
abierta. Tambin, a veces, es necesario incluir una opcin de "no
s", pues si no existe sta, el sujeto puede seleccionar cualquier
respuesta simplemente para no dejarla en blanco.

Se debe asegurar que cada opcin que se presente sea excluyente.
Por ejemplo:

Qu carro tienes?
___ Camioneta
___ Wolkswagen
___ de cuatro puertas
___ de dos puertas.

Alguien puede responder Wolkswagen y de dos puertas. Para
evitar ese problema las opciones deben ser:
___ Camioneta
___ Carro de dos puertas
___ Carro de cuatro puertas
___ Wolkswagen de dos puertas
___ Wolkswagen de cuatro puertas.

Las preguntas se deben colocar verticalmente pues en ocasiones
es confuso si hay que marcar en las lneas antes o despus de la
opcin. Ejemplo:
____ Excelente ____Regular ____Bueno ____Malo ____Psimo

Es mejor:
___Excelente
___Regular
___Bueno
___Malo
___Psimo

Hacer preguntas para un grupo reducido de personas no es
aconsejable. Por ejemplo: En caso afirmativo contesta las
siguientes diez preguntas. Quien respondi negativamente a la
pregunta anterior pensar que el cuestionario no es para l.
ESTADSTICA I
25
Adems una pregunta de ese tipo puede formularse en forma
diferente. Por ejemplo:
Ests casado? ____s ____no.

En caso afirmativo trabaja tu cnyuge? ____s ____no.

Es mejor preguntar:
Trabaja tu cnyuge?
___s
___no
___no estoy casado.

Hay que evitar preguntas cuyas respuestas tengan que priorizarse.
Es difcil priorizar si las opciones son ms de tres. Hacerlo del 1
al 10 es imposible mentalmente. Adems eso implica que no hay
dos posibles respuestas con la misma prioridad y en ocasiones eso
no es cierto.

Antes de redactar una pregunta hay que pensar en las diversas
maneras que se puede presentar la respuesta y hay que seleccionar
la ms fcil tanto para el sujeto como para el anlisis de datos que
se tendr que hacer con las respuestas. Si se tiene que escoger
entre la facilidad de respuesta para la computadora y la
comodidad del que responde, siempre se debe seleccionar el
segundo. Un cuestionario bien construido satisface las
necesidades del encuestado as como de la computadora.
Las preguntas deben incluir un solo elemento. Hay que evitar
hacer dos preguntas en una. Esto es muy comn y confunde
mucho al lector. Por ejemplo: Puedes estudiar cuando hay un
radio o una televisin prendida en tu casa? Puede que con radio si
pueda estudiar la persona que responde, pero no con televisin.
Otro ejemplo La informacin es interesante e importante? Si
interesante e importante son sinnimos, entonces la pregunta es
redundante. Con un solo adjetivo es suficiente.
La pregunta debe ser corta; eso evita incluir ms informacin de
la que se debe preguntar

2.2.8. Consejos sobre la presentacin
La apariencia fsica de un cuestionario es la imagen del
investigador con el encuestado. Su misma forma motiva o impide
su lectura.

ESTADSTICA I

26
En cuestionarios largos, hay que identificar cada pgina con
alguna marca por si se separan las hojas. Lo mejor es no hacer
cuestionarios largos

Si hay preguntas por ambos lados de la pgina, al final de la
primera hoja se debe poner "vuelta"

La hoja no debe verse sobrecargada. Los espacios vacos son
agradables. Hay que dejar suficiente espacio entre cada una de las
preguntas.

2.2.9. Consejos sobre el lenguaje
Una redaccin pobre influye en el resultado y tambin en la
calidad de las respuestas obtenidas.

El sujeto no debe tener que adivinar lo que se quiso preguntar. La
pregunta debe estar escrita en lenguaje claro.
La palabra cuestionario asusta o intimida al que va a responder.
Encuesta es mejor. Las preguntas deben estar redactadas para no
ofender al sujeto. Hay que utilizar lenguaje comn y corriente. No
especializado.

No deben usarse palabras vagas ni palabras ambiguas o que
tengan varios significados. Las preguntas no deben estar en
negativo. No se debe abreviar. La formulacin correcta de una
pregunta es una tarea muy difcil, mucho ms de lo que una
persona que nunca ha diseado un cuestionario puede imaginarse.
Hay que hacerlo con cuidado.


2.2.10. Consejos generales
El contestar un cuestionario es una imposicin para quien lo
contesta. Hay que estar conscientes de ello. El uso de un
cuestionario es nicamente para hacer preguntas que no se pueden
obtener de ninguna otra manera. Lo que recuerda el sujeto no se
debe considerar como un hecho. Puede ser muy diferente el hecho
a lo que recuerda la persona que est respondiendo.
Todas las preguntas en el cuestionario tienen que ser analizadas.
Por eso hay que seleccionar nicamente reactivos indispensables
para obtener los objetivos del trabajo. Es indispensable pilotear el
cuestionario.

ESTADSTICA I
27
Se debe establecer el procedimiento de anlisis y evaluacin de
los resultados antes de llevar a cabo la encuesta. As se sabr
cmo analizar las respuestas. Vale la pena consultar a expertos en
estadstica y en procesamiento de datos antes de aplicar un
cuestionario.

Las posibles respuestas tienen que estar cerca de las preguntas.
Esto evita confusiones. El decidir utilizar un cuestionario obedece
a los indicadores que el autor determine en sus fundamentos
tericos. Analizar los indicadores puede ayudar al investigador a
determinar que el cuestionario no es el instrumento adecuado para
el estudio que desea realizar.

2.2.11. Anlisis de los resultados
Es necesario una revisin detallada de lo que se introduce a la
computadora para asegurar que la informacin que entre a ella sea
la que est plasmada en el cuestionario. Hay que revisar la
informacin capturada con cada cuestionario. No se debe esperar
hasta el final, pues pudiera suceder que es necesario hacer todo de
nuevo.

2.2.12. Algunos consejos para entrevistas
Si la entrevista es en una oficina, es necesario asegurarse que el
entrevistado estar disponible y que tiene el tiempo para
responder a las preguntas. El entrevistador tiene que ser muy
objetivo en sus presentaciones para que en todas se utilice el
mismo tono de voz, pronunciacin de los reactivos, modismos, el
lenguaje del cuerpo y vestimenta. Todo esto influye en las
respuestas y se trata de que todos los entrevistados entiendan lo
mismo y estn motivados de la misma manera.
El entrevistar en la casa del sujeto a veces resulta prctico para el
entrevistado. Quiz a travs de una llamada por telfono, se pueda
hacer una cita con l.

Hay tres factores importantes en una entrevista:
1) La calidad del entrevistador. Hay que aprender a establecer
un contacto positivo desde el primer momento. Hay cosas
impredecibles que afectarn sin que el entrevistador pueda
remediarlas: la edad, el sexo, su manera de vestir y su
personalidad. Ni modo. Por eso hay que cuidar todo lo
dems.

ESTADSTICA I

28
2) La introduccin que hace el entrevistador al entrevistado. Le
tiene que indicar el objetivo del estudio y debe convencerlo
de que vale la pena responder a sus preguntas.

3) La manera como est estructurada la entrevista. Hay que
iniciar con preguntas interesantes para "enganchar" al
entrevistado. Ejemplos:

Qu clientes les generan los mayores beneficios?
Qu zonas o regiones son las que generan mayores ventas
en unidades monetarias y volmenes? (en total y por
producto)
Cules son las reparaciones que ms se han producido en el
ltimo trimestre?
En que da de trabajo de cada mes logra llegar al punto de
equilibrio?
Qu tipo de reparaciones han generado mayores egresos?
Puede decirme cuales son la capacidad de los diferentes
procesos en materia de costos, productividad y calidad?
Cul es el nivel de rotacin o permanencia de clientes?
Sabe en que etapa del ciclo de vida se encuentra cada uno
de sus productos o servicios?
Cul es el nivel de satisfaccin de sus clientes?
Cules son las enfermedades que ms clientes reportan?
Cules son los problemas que ms consultas originan?
Si posee un restaurante cules son los platos ms pedidos
durante el ao y por temporada? Cules son los vinos ms
pedidos y cules los ms vendidos?
Si dirige una librera cules son los temas ms vendidos?
Cul es la rentabilidad que le aporta cada tema? Cmo
contribuye cada tema a lograr el punto de equilibrio?
Si dirige un hotel cul es el tiempo promedio de estada?
La cantidad de clientes por zona o regin? La cantidad de
tiempo por regin y su relacin con la cantidad de tiempo de
estada? La facturacin por profesin, zona, motivo de su
visita (turismo, negocios, salud, profesionales, capacitacin,
otros)?





ESTADSTICA I
29
2.2.13. Ejemplo de Cuestionario o Formulario

PERFIL SOCIOECONMICO Y ACADMICO DEL ESTUDIANTE DEL PRIMER
CICLO O INGRESADO A LA UNIVERSIDAD

Esta encuesta es ESTRICTAMENTE CONFIDENCIAL,tiene como finalidad
recolectar datos sobre aspecto socio-econmicos,familiares y acadmicos del
estudiante ingresado a la universidad,a fin de disponer de un marco de
referencia para orientar el proceso Enseanza-Aprendizaje y mejorar el
rendimiento acadmico del universitario.Por tanto,le agradecemos responder
con la mayor sinceridad,seriedad y objetividad.

CODIGO o MATRICULA:
ESPECIALIDAD
NOMBRE Y APELLIDO:
CICLO o SEMESTRE

1. DATOS GENERALES:
1.1. SEXO: Hombre( )
Mujer ( )
1.2. EDAD en aos:21
1.3. LUGAR DE NACIMIENTO
Provincia:________________
Departamento:______________
1.4. ESTADO CIVIL:
Soltero ( )1 Casado ( )2
Viudo ( )3 Divorciado ( )4
Conviviente ( )5 Separado ( )6
1.5. En que distrito vive reside actualmente?

1.6. Cuntos aos reside Ud. en lima?

2. ANTECEDENTES DE LA SECUNDARIA:
2.1. En qu colegios termin sus estudios
secundarios?
Estatal( )1 No estatal( )2

2.2. En qu provincia est ubicado su colegio
secundario?
2.3. Cundo(fecha)termin sus estudios
secundarios?
2.4. Qu ao repitio alguna vez?
1ro() 2do() 3ro() 4to() 5to()
2.5. Qu asignaturas le agradaban o tena ms
xito en secundaria?
1._______________________
2._______________________
3._______________________
4._______________________
2.6. En qu asignaturas desaprob alguna vez en la
secundaria?
1.________________________
2.________________________
3.________________________
4.________________________

3. ASPECTOS ACADMICOS UNIVERSITARIOS:
3.1. Cundo postul por primera vez, a la U.
Centro Sup. De estudios?
3.2. Cundo ingres a esta universidad?
3.3. En qu asignatura tienes dificultades ahora en la
universidad?
1._______________________
2._______________________
3._______________________
4._______________________
3.4. Al mes,cunto estima que gasta
1.Derechos de enseanza:________
2.Material de enseanza:_________
3.Pasajes,refrigerios,etc.:_________

Total:
3.5. Cmo calificara la calidad de las clases que
recibe ahora?
Muy buenas( ) Buenas( )
Regulares ( ) Malas ( )
3.6. Ha seguido otra profesin:
Si( ) Cul:_______________
3.7. Est Ud. siguiendo la Profesin que pens estudiar: Si ( ) No( )
Qu carrera preofesional le gustara seguir?____________________


ESTADSTICA I

30
4. ASPECTOS LABORALES, ECONOMICOS Y FAMILIARES:
4.1. Trabaja actualmente en algo?
Si( )Donde:___________________

4.2. Qu hace o que cargo desempea?
4.3. SI NO TRABAJA, DE QUIEN DEPENDE ECONMICAMENTE?
De los padres ( )1 De padres y hermanos ( )2 Slo del padre ( )3
Slo de la madre ( )4 Slo de hermanos ( )5 Otros ( )6
4.4. Nivel Educativo de sus pares:
Padre Madre
1 ( )Primaria Incompleta ( )
2 ( )Primaria Completa ( )
3 ( )Secundaria Incompleta ( )
4 ( )Secundaria Completa ( )
5 ( )Superior Incompleta ( )
6 ( )Superior Completa ( )

4.6. Carrera profesional de:
Padre:_______________________

Madre:______________________

4.5. Seale eb que intervalo se encuentran los
ingresos mensuales de:
Padre Madre
1) Menos de 50 ( ) ( )
2) De 50 a 70 ( ) ( )
3) De 71 a 100 ( ) ( )
4) De 101 a 150 ( ) ( )
5) De 151 a 200 ( ) ( )
6) De 201 a 250 ( ) ( )
7) De 251 a 300 ( ) ( )
8) De 301 a 400 ( ) ( )
9) Ms de 400 ( ) ( )

4.7. Si trabajan actualmente,que ocupacin o cargo
desempean:
1._______________________
2._______________________
3._______________________

4.8. Cuntos hermanos son Uds.?

4.9. Cuntos de Uds. Esrudian actualmente?


4.10. Qu profesiones tienen sus hermanos?
1.____________________
2.____________________
3.____________________

4.11. La vivienda de Uds. es propia?

4.12. Sus padres, tienen auto propio?
No( ) Si( )
4.13. Si ud. trabaja en algo, en cunto estima su ingreso mensual? (S/.)
1( )Menos de 50 2( )De 50 a 100 3( )De 101 a 150
4( )De 151 200 5( )De 201 a 300 6( )Ms de 300
4.14. Sus sugerencias para mejorar el Rendimiento Acadmico y la Formacin Profesional en su Especialidad:
1.______________________________________________________________________
2.______________________________________________________________________

Obsevaciones y comentarios:

Fecha Responsable:
Estudios y Datos R.A.



ESTADSTICA I
31
CAPTULO III

Clasificacin de Datos

3.1. CLASIFICACIN DE DATOS
La clasificacin tiene por finalidad organizar los datos en categoras, y
realizar una Distribucion de Frecuencias mediante una tabla

3.1.1. DISTRIBUCIN DE FRECUENCIAS DE LOS
DATOS CUALITATIVOS
Sean Ci : C1,C2,C3,.......................Cn, las categoras de la
muestra o poblacin, un cuadro o tabla que ordena los datos es:

CATEGORIAS No de Datos (fi)
C1
C2
C3
C4
.
.
.
.
Cn
f1
f2
f3
f4
.
.
.
.
fn

Ejemplo:
La compaa Multicomp solicit a varias personas que indicaran
sus colores favoritos. 15 personas indicaron que el color rojo era
su color favorito, 10 escogieron el verde, 5 eligieron el azul y 3 el
amarillo. Tabular los datos.

Solucin:

COLOR FRECUENCIA
Rojo
Verde
Azul
Amarillo
15
10
5
3
Total 33

ESTADSTICA I

32
3.1.2. DISTRIBUCIN DE FRECUENCIAS DE LOS
DATOS CUANTITATIVOS
Para su organizacin y posterior anlisis, es necesario agruparlos
en clases o intervalos. Esta forma de organizacin se conoce con
el nombre de Distribucin de Frecuencias.

3.1.2.1. ELABORACIN DE UNA TABLA DE
DISTRIBUCIN DE FRECUENCIAS
Clculo del rango o recorrido: (R)
Es la distancia entre el dato mayor y el dato menor. Se
halla restando el dato mximo y el dato mnimo.

Determinacin del nmero de clases: (K)
El nmero de clases es el nmero de categoras o
intervalos en el que se va a dividir la informacin.

Por lo general, el nmero de clases a elegir vara entre
5 y 15.

La siguiente tabla puede servir de gua para determinar
el nmero de clases:


Nmero de observaciones Nmero de clases
Menos de 30
De 30 hasta menos de 60
De 60 hasta menos de 130
De 130 hasta menos de 250
De 250 hasta menos de 500
De 500 hasta menos de 1000
De 100 hasta menos de 2000
De 2000 hasta menos de 4000
De 4000 hasta menos de 8000
De 8000 a ms
5
6
7
8
9
10
11
12
13
14

Sin embargo, existe tambin otra forma de determinar
el nmero de clases, mediante la Regla de Sturges:
K= 1 + 3,3 log N, N=nmero total de datos.

Tambin se puede aplicar la siguiente frmula: K=R/n,
n = nmero total de datos.

ESTADSTICA I
33
Amplitud del Intervalo: (C)
Llamado tambin ancho de clase, es la cantidad de
datos que estn comprendidos en un intervalo de clase.
Se forma por 2 lmites que van a definir una clase.

Lmites son los valores extremos de un intervalo :
lmite superior y lmite inferior.
C= (R+1) / K

El valor de C se redondea al entero solo si los datos
son enteros. Si son decimales, C se redondea al
nmero de decimales de la informacin. El tipo de
redondeo es por exceso.

Intervalos de clase: (I)
Representa los lmites inferior y superior de cada clase

Frecuencia absoluta simple: (f)
Es el nmero de veces que se repiten los valores dentro
de los diferentes intervalos en que se ha dividido la
informacin

Frecuencia absoluta acumulada: (F)
Se obtiene sumando y acumulando los valores
absolutos clase por clase en orden ascendente.

Frecuencia relativa simple: (h)
Resulta al dividir cada una de las frecuencias absolutas
simples entre la frecuencia total

Frecuencia relativa acumulada: (H)
Se obtiene sumando y acumulando los valores
relativos clase por clase en orden ascendente.

Por lo general, a las frecuencias relativas las
multiplicamos por 100, para obtener los valores
expresados en porcentaje.

Punto medio o marca de clase: (Xi)
Es la semisuma de los lmites inferior y superior de
cada intervalo de clase.
ESTADSTICA I

34
Ejemplo:
Se tiene el nmero de clientes por da en una
lavandera:

21 25 35 22 18
24 21 23 16 23
27 17 26 19 29
20 19 20 23 22

Se pide clasificar los datos en un cuadro de
frecuencias.
Solucin:
a) Clculo del rango o recorrido: ( R )
R= Xmax Xmin = 35 16 = 19

b) Determinacin del nmero de clases: ( K )
K=1 + 3,3 log n
K=1 + 3,3 log 20
K= 1 + 3,3 x 1,30
K=5,29 = 5
(se debe redondear siempre al entero ms
prximo)

c) Determinacin de la amplitud del
intervalo: ( C )
C= (R+1) / K = (19+1) / 5 = 4

d) Formacin de los intervalos de clase: ( Ii )
Dato mnimo=16( es el lmite inferior de la
primera clase).A este primer lmite se le suma la
amplitud del intervalo(C) y se obtiene el lmite
inferior de la segunda clase (20), y as
sucesivamente.

* Se recomienda que los intervalos formados
deben ser de tipo semi abiertos por ser stos mas
funcionables y de mayor operatividad a los
problemas de tipo cuantitativo.

Los lmites superiores se determinan por deduccin y
de la misma forma anterior:

ESTADSTICA I
35
Ki Ii
1
2
3
4
5
[16 20>
[20 24>
[24 28>
[28 32>
[32 36>


e) Frecuencia absoluta simple( fi )
Se contabiliza la cantidad de datos que hay en
cada intervalo de clase

Ki Ii Conteo fi

1
2
3
4
5

[16 20>
[20 24>
[24 28>
[28 32>
[32 36>


5
9
4
1
1
fi =20

La tabla completa de frecuencias quedara de la
siguiente forma:

Ki Ii fi Fi hi Hi hi(%) Hi(%)
1
2
3
4
5
[16 20>
[20 24>
[24 28>
[28 32>
[32 36>
5
9
4
1
1
5
14
18
19
20
0,25
0,45
0,20
0,05
0,05
0,25
0,70
0,90
0,95
1,00
25
45
20
5
5
25
70
90
95
100
fi =20 20 hi =1,00 100

ESTADSTICA I

36
3.1.2.2. PROPIEDADES Y RELACIONES DE
LAS FRECUENCIAS
1) Las frecuencias absolutas son cantidades enteras
positivas (o cero en algunos casos).
2) 0 = < h < =1 0% = < h < = 100%
3) La suma de las frecuencias absolutas de todas las
clases es igual al nmero total de datos.
4) La suma de las frecuencias relativas es igual a 1
100%.
5) La frecuencia absoluta acumulada de la ltima
clase es igual al nmero total de datos.
6) La frecuencia relativa acumulada de la ltima
clase es igual a 1 100


EJERCICIOS RESUELTOS

1) Al averiguar el grado de instruccin en una muestra de 120 trabajadores
de una Empresa, se obtuvieron los siguientes resultados:

Analfabetos 38, primaria 63, secundaria 16 y superior 3
Se pide:
a) Ordenar la informacin proporcionada en el cuadro de frecuencias
b) Interpretar algunos valores de las frecuencias relativas.

Solucin:
Variable: grado de instruccin, tipo ordinal.
Organizacin de datos:

GRADO DE
INSTRUCCIN
NMERO DE
TRABAJADORES
FRECUENCIA
RELATIVA(Hi)
FRECUENCIA
RELATIVA (%)
Analfabeta
Primaria
Secundaria
Superior
38
63
16
03
0,317
0,525
0,133
0,025
31,7
52,5
13,3
02,5
TOTAL 120 1,000 100,0
Recordar que hi = fi/n

b) Interpretacin:
h1 : el 31,7% de los trabajadores son analfabetos.
h2 : el 52,5% de los trabajadores tienen instruccin primaria.
h4 : el 2,5% de los trabajadores tienen instruccin superior.
ESTADSTICA I
37
2) Los siguientes datos son los pesos medidos en kg. de 30 productos
enlatados:
75,8 69,3 96,2 86,3 99,8
84,6 75,2 74,1 76,0 86,5
70,2 61,8 58,4 69,2 68,4
68,3 75,0 67,3 82,2 72,1
59,4 65,5 76,4 76,5 81,0
65,0 86,2 68,3 65,9 69,0

Se pide:
a) Organizar los datos en una tabla completa de distribucin de
frecuencias.
b) Interpretar el valor de algunas frecuencias.

Solucin:
a) Variable : peso, tipo cuantitativa continua.
Utilizaremos la regla de sturges :

Clculo del rango:
R = Xmax Xmin
R = 99,8 58,4 = 41,4

Nmero de clases:
K = 1+ 3,3 log N
K = 1+ 3,3 log(30)
K = 1+ 3,3(1,48)
K = 6

Amplitud del Intervalo: C = (R+1) /K = (41,4+1) /6 = 7,06 = 7,1(ya
que los datos aparecen con un decimal)

Luego, la tabla completa de frecuencias es:

Ki Ii fi Fi hi Hi hi(%) Hi(%)
1
2
3
4
5
6
[58,4 65,5>
[65,5 72,6>
[72,6 79,7>
[79,7 86,8>
[86,8 93,9>
[93,9 101.0>
4
12
6
6
0
2
4
16
22
28
28
30
0,133
0,400
0,200
0,200
0,000
0,067
0,133
0,533
0,733
0,933
0,933
1,000
13,3
40,0
20,0
20,0
00,0
06,7
13,3
53,3
73,3
93,3
93,3
100,0
Total 30 1,000 100,0


ESTADSTICA I

38
b) F3 : 22 productos tienen entre 58,4 y 79,6 kg de peso
h2 : el 40% de los productos pesan entre 65,5 y 72,5 kg
H4 : el 93,3% de los productos tienen como peso mximo 86,7 kg.

3) Los siguientes datos que se presentan en una tabla incompleta de
frecuencias, corresponden a las calificaciones de un grupo de estudiantes
del curso de estadstica:

Ki Ii Hi(%) fi hi(%)
1
2
3
4
5
[ - >
[05 - >
[09 - >
[ - >
[ - >
20
60
70
85
12

Si se sabe que la amplitud del intervalo es igual en todas las clases,
completar los datos que faltan en la tabla de frecuencias.


EJERCICIOS

1) Se tiene una distribucin de frecuencias con 4 intervalos de amplitud
constante para 50 datos:

Ki Ii fi hi Hi
1 [ - 4 > 0,08
2 [ - 6 > 0,40
3 [ > 12
4 [ - 10> 0,36

Se pide completar la tabla de frecuencias.

2) Hallar las frecuencias que faltan en el siguiente cuadro de frecuencias:

Ki Ii fi hi Hi
1 [ - 25> 0,15
2 [ - > 0,25
3 [ - 45> 0,90
4 [ 45 - >
60
ESTADSTICA I
39
3) Se presentan los siguientes datos correspondientes al nmero de caloras
que se debe dar en una dieta a un grupo de 50 trabajadores de una mina:

3250 2118 3520 2118 3448 1890 2735 4520 3210 2588
2150 3250 2455 1980 3525 2451 3767 4215 2966 4680
1520 3842 3000 2219 2641 4445 2788 1960 2322 4520
4238 4119 4590 2638 3792 3019 3209 4504 3722 4129
4239 4950 3920 2215 2330 1250 4670 4575 3432 2697

Se pide agrupar los datos en un cuadro de frecuencias.

4) Los siguientes datos corresponden a la Empresa Azucarera Tumn, sobre
la clasificacin del personal ocupado en el ao 2006.

Socios: 2800, no socios : 1100 ; eventuales: 2500.
a) Ordene los datos en una tabla de distribucin de frecuencias.
b) Analizar algunos datos de las frecuencias halladas.

5) En setiembre del 2006 el Dpto. de personal de una Empresa recolect los
siguientes datos, referentes al nmero de hijos por framilia, en una
muestra de 40 familias:
6 12 4 10 11 15 9 13 8 11
9 9 8 10 12 11 10 9 8 5
12 10 12 8 9 11 12 8 7 10
11 12 9 7 8 8 9 10 13 15

a) Ordenar los datos , agrupndolos en un cuadro de frecuencias.
b) Interpretar los valores de las frecuencias absolutas y relativas.

6) Un grupo de jvenes de la Universidad Tecnolgica del Per, de la Carrera
de Administracin, visitaron la Empresa Azucarera Tumn, en la Provincia
de Chiclayo, y se interesaron por el nivel de ingresos de sus trabajadores.
Una muestra de 35 trabajadores arroj los siguientes resultados en
soles(mensual):

1350 860 750 1160 1150 1320 920 700 850 1200
2150 1200 1300 960 760 1450 1090 890 760 1300
2000 1500 990 970 760 1450 1350 1600 980 1100
2100 900 800 700 1230

a) Ordenar la informacin agrupando los datos en un cuadro completo
de frecuencias.
b) Efectuar el anlisis del cuadro.
ESTADSTICA I

40

7) se tiene la siguiente informacin:

Li Ls Xi fi Fi hi
[ 6.5 - > 0,10
[ - 10,1 > 12,5
[ - > 22 0,25
[ - > 40 0,15
Completar los datos que faltan en la tabla.

8) Porqu se organizan los datos en distribuciones de frecuencias?

9) Antes de introducir una nueva llanta en el mercado, la Good Year realiza
pruebas de duracin de las estras de una llanta con una muestra aleatoria
de 150 llantas. La siguiente distribucin de frecuencias muestra los
resultados:

Numero de millas(miles) Frecuencia
De 20 a menos de 25
De 25 a menos de 30
De 30 a menos de 35
De 35 a menos de 40
De 40 a menos de 45
De 45 a menos de 50
De 50 a menos de 55
7
14
28
45
30
15
11
Total 150

a) Construya una distribucin de frecuencias relativas para este
conjunto de datos
b) Construya una distribucin acumulada de frecuencias relativas que
indique el porcentaje de llantas que dur ms de 40000 millas.

10) En qu consiste la tabulacin para datos agrupados?

11) Qu ventajas tiene las frecuencias relativas frente a las absolutas?

12) Qu quiere decir que los errores por agrupamiento se compensan?

13) A continuacin se transcribe las edades de 50 integrantes de un programa
de servicio social del gobierno.


ESTADSTICA I
41
81 53 67 60 80 64 56 54 91 61
66 88 67 65 52 72 74 65 73 69
43 54 76 70 97 68 82 75 79 60
39 87 76 97 86 45 60 45 65 76
92 72 82 80 70 65 50 58 70 56

a) Construir con estos datos un cuadro estadstico de distribucin de
frecuencias e interprete.
b) Halle el porcentaje de integrantes que tiene edades menor de 65
aos.
c) Hallar la edad mnima del 45% de los integrantes.








ESTADSTICA I

42
ESTADSTICA I
43
CAPTULO IV
Presentacin de Datos


4.1. PRESENTACIN DE DATOS
La presentacin de datos se hace principalmente a travs de 2 formas: a
travs de cuadros o tablas estadsticas , y a travs de grficos estadsticos.

4.2. TABLAS O CUADROS ESTADSTICOS
Consiste en la presentacin ordenada de los datos en filas y columnas con
el objeto de facilitar su lectura y posterior anlisis e interpretacin.

4.2.1. PARTES DE UNA TABLA ESTADSTICA

1) Ttulo
Expresa en forma resumida la informacin que contiene.
Debe ser breve, concreto y completo. Debe contener lo
siguiente:

La institucin o rea geogrfica al que pertenecen los
datos. Responde a la pregunta: a dnde pertenece la
informacin?. Ejemplo: Universidad de San Martn de
Porres.

La naturaleza de los datos. Responde a la pregunta: qu
contiene la tabla?. Ejemplo: Alumnos matriculados.

El criterio de la clasificacin de los datos. Responde a la
pregunta cmo se presenta el contenido e la tabla?.
Ejemplo: Por aos, segn sexo.

El perodo que abarca la informacin que se est
presentando. Responde a la pregunta: cundo?. Ejemplo:
perdo 2000 2002. Cuando es necesario, debajo del
ttulo, debe expresarse la unidad de medida de la variable.
Ejemplo: miles de soles, en %, etc.

2) Encabezado
Est formado por la primera fila superior y nos indica las
caractersticas(variables) del fenmeno en estudio.
ESTADSTICA I

44
3) Columna matriz
Est formado por la primera columna de la izquierda y nos
indica tambin las caractersticas (variables) del fenmeno
en estudio. Ejemplo: Aos

4) Cuerpo de la tabla
Es el contenido de la tabla, es decir, la informacin que se
presenta en filas y columnas.

5) Fuente
Nos indica el lugar de donde se obtuvieron los datos,
contenidos en la tabla. Ejemplo: Universidad de San
Martin de Porres, Dpto. de Estadstica.
Ejemplo:


Cuadro N 1
UNIVERSIDAD DE SAN MARTIN DE PORRES
Alumnos matriculados por aos, segn sexo
2000 2005

SEXO
AOS
Masculino Femenino
TOTAL
2000
2001
2002
2003
2004
2005
1200
1350
1680
4320
6900
8000
1450
1200
2000
3520
5800
7500
2650
2550
3680
7840
12700
15500

FUENTE: Universidad de San Martin de Porres, Dpto. de Estadstica.


4.2.2. TIPOS DE TABLAS ESTADSTICAS

1) Tablas de una sola entrada o entrada simple

Presentan una sola variable, anlisis o caracterstica y su
clasificacin va definida en columna matriz. Ejemplo:

ESTADSTICA I
45
Cuadro N 2
BASA S.A.
Nmero de trabajadores estables, por nivel de instruccin
Lima, Marzo 2006

NIVEL DE INSTRUCCIN CANTIDAD %
Analfabeta
Primaria
Secundaria
Superior
38
63
16
03
31,7
52,5
13,3
02,5
TOTAL 120 100,0
FUENTE: Basa S.A., Dpto. de Personal


2) Tablas de 2 entradas o entrada doble
Presentan simultneamente 2 variables, anlisis o
caractersticas relacionados, donde una va definida en
columna matriz (vertical) y la otra en encabezado
(horizontal). Ejemplo:


Cuadro N 3
BASA S.A.
Nmero de trabajadores estables, por nivel de instruccin, segn sexo
Marzo 2006

SEXO NIVEL DE
INSTRUCCIN
Masculino Femenino
TOTAL
Analfabeta
Primaria
Secundaria
Superior
28
32
09
01
10
31
07
02
38
63
16
03
TOTAL 70 50 120
FUENTE: Basa S.A., Dpto. de Personal


3) Tablas Complejas
Presentan en forma simultnea 3 ms variables. Ejemplo:

ESTADSTICA I

46
Cuadro N 4
BASA S.A.
Nmero de trabajadores estables, por nivel de instruccin,
segn estado civil y sexo
Marzo 2006

ESTADO CIVIL
SOLTERO CASADO
NIVEL DE
INSTRUCCIN
Masculino Femenino Masculino Femenino
TOTAL
Analfabeta
Primaria
Secundaria
Superior
06
09
03
-
04
06
02
-
22
23
06
01
06
25
05
02
38
63
16
03
TOTAL 18 12 52 38 120
FUENTE: Basa S.A., Dpto. de Personal


4.3. GRFICOS O DIAGRAMAS
Es la representacin en dibujo que permite destacar la magnitud o
modificacin de las caractersticas de una variable, o comparar las
diversas relaciones entre variables, ofreciendo una visin panormica y
rpida del fenmeno en estudio.

4.3.1. TIPOS DE GRFICOS
Entre los principales, tenemos:
-Grfico de columnas
-Grfico de barras
-Grfico de lneas
-Grfico circular
-Grfico xy (dispersin), etc.

4.3.2. IMPORTANCIA
Los grficos son importantes porque permiten observar en forma
instantnea el comportamiento de los datos de una variable
determinada, y adems nos permite formar una idea bastante
aproximada sobre las tendencias de las variables en el futuro.

Ejemplo:
Se tiene el siguiente cuadro:
ESTADSTICA I
47
N de cajas de gaseosas (en miles) consumidas en Lima, por aos
y segn Distrito:

DISTRITO AO 2003 AO 2004 AO 2005 AO 2006
Lima 250 180 300 500
Miraflores 300 320 400 450
Ate 180 230 350 600
Surquillo 220 240 340 560
Surco 198 190 420 540
Los Olivos 230 200 450 559
San Martn 150 120 400 700

Se pide construir los grficos que permitan representar lo
siguiente:
a) La venta de gaseosas de los 3 primeros Distritos y de los 2
primeros aos.
b) La venta de gaseosas de los 4 ltimos Distritos y de todos los
aos.
c) El nmero total de cajas consumidas por ao.

Solucin:

a)

CAJAS DE GASEOSAS CONSUMIDAS POR AOS
SEGUN DISTRITO (miles)
0
50
100
150
200
250
300
350
AO 2003 AO 2004
C
A
N
T
I
D
A
D

(
m
i
l
e
s
)
LIMA
MIRAFLORES



ESTADSTICA I

48
b)

0
100
200
300
400
500
600
700
CANTIDAD
(miles)
SURQUILLO LOS
OLIVOS
DISTRITO
CONSUMO DE GASEOSAS POR AOS SEGUN
DISTRITO
(miles)
AO 2003
AO 2004
AO 2005
AO 2006


c)

CONSUMO DE CAJAS DE GASEOSAS POR AOS
(miles)
0
500
1000
1500
2000
2500
3000
3500
4000
4500
AO 2003 AO 2004 AO 2005 AO 2006
C
A
N
T
I
D
A
D

(
m
i
l
e
s

d
e

c
a
j
a
s
)




ESTADSTICA I
49
CONSUMO DE CAJAS DE GASEOSAS POR
AOS
(miles)
AO 2006
4000
AO 2003
1800
AO 2004
1790
AO 2005
2690


4.3.3. HISTOGRAMA
Es un grfico que se utiliza para representar la distribucin
de frecuencias absolutas o relativas simples.

Consiste en un grupo de rectngulos adyacentes que tienen
sus bases en el eje de las abscisas (donde se representan
los intervalos de clase de la variable) y altura igual a las
frecuencias de cada clase.
Ejemplo:
Se tiene el siguiente cuadro:

Cuadro N5
ONDIVEL INTERNATIONAL SAC
NUMERO DE TRABAJADORES POR EDAD
Mayo 2006

EDAD (aos) CANTIDAD
[20 25>
[25 30>
[30 35>
[35 40>
[40 45>
[45 - 50>
25
20
32
30
14
12
TOTAL 133
Elaborar el Histograma.
ESTADSTICA I

50
Solucin:

CANTIDAD DE TRABAJADORES POR EDAD
(aos)
0
5
10
15
20
25
30
35
1
EDAD
N


D
E

T
R
A
B
A
J
A
D
O
R
E
S
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49


4.3.4. POLGONO DE FRECUENCIAS
Consiste en un grfico lineal que se obtiene uniendo los
puntos medios de la parte superior de los rectngulos, en
el Histograma. Se debe cerrar el polgono, es decir,
interceptarlo con el eje x.

Ejemplo: Con referencia al cuadro anterior grafique el
polgono de frecuencias
Solucin:

Se agrega una clase antes de la primera, y otra despus de
la ltima clase:

EDAD (aos) CANTIDAD
[15 - 20>
[20 25>
[25 30>
[30 35>
[35 40>
[40 45>
[45 50>
[50 - 55>
0
25
20
32
30
14
12
0
ESTADSTICA I
51

Luego, el grfico sera:

CANTIDAD DE TRABAJADORES POR EDAD
0
5
10
15
20
25
30
35
15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54
EDAD (aos)
N
U
M
E
R
O

D
E

T
R
A
B
A
J
A
D
O
R
E
S



4.3.5. OJIVAS
Son grficos que se utilizan para representar las frecuencias
acumuladas absolutas o relativas.

Son de 2 tipos: Ojivas menor que, y Ojivas o ms

Para su elaboracin se trabaja con los lmites inferiores de cada
intervalo de clase, y las frecuencias acumuladas
correspondientes.

Ejemplo: para el caso anterior:


ESTADSTICA I

52
Cuadro N6
ONDIVEL INTERNATIONAL SAC
NUMERO DE TRABAJADORES POR EDAD
Mayo 2006

EDAD (aos) CANTIDAD
[20 25>
[25 30>
[30 35>
[35 40>
[40 45>
[45 - 50>
25
20
32
30
14
12
TOTAL 133

a) Graficar la ojiva menor que

Solucin: Agregamos una clase anterior a la primera y posterior a
la ltima clase:

EDAD (aos)
Frecuencia Acumulada
menor que
Menor que 20
Menor que 25
Menor que 30
Menor que 35
Menor que 40
Menor que 45
Menor que 50
0
25
45
77
107
121
133

ESTADSTICA I
53
Ojiva menor que:
ONDIVEL INTERNATIONAL SAC -
DISTRIBUCION ACUMULADA "menor
que" DE TRABAJADORES POR EDAD
Mayo 2006
0
20
40
60
80
100
120
140
20-24 25-29 30-34 35-39 40-44 45-49 50-54
EDAD (aos)
N
U
M
E
R
O

D
E

T
R
A
B
A
J
A
D
O
R
E
S


b) Graficar la ojiva mas

Solucin: Agregamos una clase anterior a la primera y posterior a
la ltima clase:

EDAD (aos)
Frecuencia Acumulada
ms
20 ms
25 ms
30 ms
35 ms
40 ms
45 ms
50 ms
133
121
107
77
45
25
0


ESTADSTICA I

54
Ojiva ms:



EJERCICIOS

1) En el Casero Callanca (Dpto. de Lambayeque) se llev a cabo un estudio
para determinar el tipo de material utilizado en la construccin de sus
pequeos negocios: Los resultados fueron los siguientes: quincha: 120,
adobe: 480, madera: 80, ladrillo: 20, Otros: 100.
a) Elaborar una tabla estadstica y analizar los resultados.
b) Representar la informacin utilizando los grficos ms apropiados.

2) Se dispone de la siguiente informacin:

ONDIVEL INTERNATIONAL SAC - DISTRIBUCION
ACUMULADA "o ms" DE TRABAJADORES POR
EDAD - Mayo 2006
0
20
40
60
80
100
120
140
20-24 25-29 30-34 35-39 40-44 45-49 50-54
EDAD (aos)
N
U
M
E
R
O

D
E

T
R
A
B
A
J
A
D
O
R
E
S
ESTADSTICA I
55
DEPARTAMENTO DE LAMBAYEQUE
Nmero de trabajadores en un Programa ocupacional de emergencia
Agosto 2005 Noviembre 2006

MESES
NMERO DE
TRABAJADORES
Agosto 2004
Setiembre
Octubre
Noviembre
Diciembre
Enero 2005
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Setiembre
Octubre
Noviembre
2290
3030
5400
6340
9800
12460
15600
17000
20800
25340
20900
30200
35500
39580
42000
45000
FUENTE: Ministerio de Trabajo; Direccin general de Empleo.

Se pide representar la informacin utilizando el grfico ms apropiado.

3) Antes de introducir una nueva llanta en el mercado, la Good Year realiza
pruebas de duracin de las estras de una llanta con una muestra aleatoria
de 150 llantas. La siguiente distribucin de frecuencias muestra los
resultados:

Nmero de millas(miles) Frecuencia
De 20 a menos de 25
De 25 a menos de 30
De 30 a menos de 35
De 35 a menos de 40
De 40 a menos de 45
De 45 a menos de 50
De 50 a menos de 55
7
14
28
45
30
15
11
Total 150



ESTADSTICA I

56
a) Construya un histograma y el polgono de frecuencias
b) Construya una ojiva menor que para la distribucin acumulada de
frecuencias relativas
c) Qu porcentaje de llantas dur menos de 40000 millas?
d) Construya la ojiva o ms

4) El rea de proyectos de una Empresa constructora realiza un estudio de
factibilidad para determinar si debe construir un Complejo turstico. Para
ello analiza las siguientes series de datos sobre el nmero de visitantes en el
Centro de la Ciudad:

Ao Visitantes Ao Visitantes
1991 250265
1992 250929
1993 321333
1994 342269
1995 268528
1996 468136
1997 390139
1998 300140

1999 271140
2000 282742
2001 244006
2002 161524
2003 277134
2004 382343
2005 617737
2006 453881
a) Qu tipo de grfico se debe construir?
b) Construya la grfica apropiada para esta serie de datos

5) Los siguientes datos representan las 65 determinaciones de la emisin
diaria (en toneladas) de Oxido de Azufre de una planta industrial:

9 9,5 10 10 10 10,5 10,6
10,9 11 11 11 11 11,3 11,7
11,8 12 12 12 12 12 12
12 12 12,1 12,2 12,3 12,5 12,6
12,6 13 13 13 13 13 13
13 13 13,2 13,2 13,4 13,5 13,5
13,5 13,6 13,6 13,7 14 14 14
14 14 14,2 14,2 14,2 14,3 14,3
14,3 14,5 14,5 14,6 15 15 15
15,3 15,3

a) Construir una tabla de frecuencias completa
b) Construir el grfico ms apropiado
c) Elabore las ojivas.

ESTADSTICA I
57
6) El tiempo en horas de 120 familias que utilizan su computadora se
tabularon en una distribucin de frecuencias de 5 intervalos de amplitud
iguales a 4 siendo el tiempo mnimo de uso 2 horas la primera y segunda
frecuencias iguales al 10% y 15% del total de casos respectivamente. Si el
73.75% de las familias lo usaron menos de 17 horas y el 85% menos de 19
horas.

Determine las frecuencias y grafique el histograma y polgonos de
frecuencias.
Cul es el tiempo mnimo del 60 % de familias?
Cul es el mximo inferior del 88% de familias?

7) Despus del incremento de precios en los artculos de primera necesidad, se
decide hacer un estudio sobre el gasto que tiene cierto grupo de personas en
un mercado, obtenindose el siguiente resultado:

Los gastos van de $22 a 27$ diarios, el 20% de las personas gasta de $23.5
o menos y el 40% gasta ms de $24.75 en una distribucin simtrica con 5
intervalos de clase de amplitud igual a $ 1.02

Complete el cuadro de distribucin de frecuencias.
Hallar el mnimo superior del 55% de personas.
Grafique el histograma y ojivas.

8) La demanda diaria de azcar (decenas de kilos) recopilada durante 190 das
en el supermercado santa Isabel se tabula en una distribucin de frecuencia
simtrica de cinco intervalos de amplitud iguales a cuatro. Si la marca de
clase del intervalo central es igual a 12 y la curva de frecuencias absolutas
satisface la relacin:
f(x)=-(x-12)2 + 70

Complete el cuadro de distribucin de frecuencias.

Grafique el histograma y polgono de frecuencia acumulados (las dos
ojivas).

Halle la demanda diaria del 80% de menores gastos.

9) Las puntuaciones de un Test, aplicado a un grupo de estudiantes se
tabularon en una distribucin de frecuencias de seis intervalos de igual
amplitud de manera que la marca de clase del segundo intervalo es 25 y el
limite superior del quinto intervalo es 60; si las frecuencias en porcentajes
ESTADSTICA I

58
del primero al cuarto son respectivamente 15, 20, 35, y 14; y el 94% de las
puntuaciones son menores que 60.

Organice el cuadro de distribucin de frecuencias
Grafique el polgono e histograma de frecuencias
Qu porcentaje de estudiantes tienen a lo ms 53 puntos?
Qu porcentaje de estudiantes tiene al menos 38 puntos?
Hallar analtica y grficamente

10) Los ingresos familiares en decenas de dlares, se tabularon en una
distribucin de frecuencias Simtricas de seis intervalos, siendo las
frecuencias f3 =30, f2 = f1 + 5, y F6 = 150. Adems se ndica que el
lmite inferior del sexto intervalo es igual a 60 y el 75% de los ingresos son
mayores de 43.5

Completar el cuadro de distribucin de frecuencias
Calcular el ingreso mximo inferior del 60% de familias
Calcule el ingreso mnimo superior del 70% de las familias.

11) La inversin anual, en miles de dlares de una muestra de 50 pequeas
empresas fue:
37 17 27 28 10 34 25 6 24 20
36 19 29 37 33 27 27 24 26 31
15 39 18 30 41 26 12 46 18 23
28 33 28 22 23 31 29 35 21 25
46 25 25 18 24 18 42 38 39 14

Aplicando la regla general para la construccin de distribucin de
Frecuencia. Construya el cuadro de distribucin de frecuencias.

Grafique el histograma y polgono de frecuencias
Determine el % de empresas con una inversin entre 14 mil y 36 mil
dlares
Determine el nmero de empresas cuya inversin sea menos de 25 mil
dlares
Determine el % de empresas con una inversin de al menos 22 mil dlares.

12) Se tiene una distribucin de frecuencias absolutas y relativas de los
dividendos en % pagados por accin por 20 compaas elegidas al azar en
el mercado de Lima:



ESTADSTICA I
59
13) Se tiene:

%
INTERVALOS
N DE
EMPRESAS
FRECUENCIAS
RELATIVAS
[0.00 , 0.10> 1 0.05
[0.10 , 0.20> 0
[0.20 , 0.30> 1
[0.30 , 0.40>
[0.40 , 0.50> 0.15
[0.50 , 0.60> 0.20
[0.60 , 0.70> 2
[0.70 , 0.80> 0.00
[0.80 , 0.90> 3
[0.90 , 1.00> 0.00
TOTAL

Con esta informacin se pide:
a) Graficar el Histograma y el polgono de frecuencias
b) Hallar el % de dividendos pagados por Accin menor de 0.57%
analtico y grficamente.
c) Hallar la cantidad de empresas cuyos dividendos por Accin sean al
menos de 0.63% analtico y grficamente.
d) Hallar el dividendo en % pagados por accin mnima del 45% de las
empresas
ESTADSTICA I

60
ESTADSTICA I
61
CAPTULO V

Medidas de Resumen


5.1. MEDIDAS DE RESUMEN
Las medidas de resumen o estadgrafos ms importantes son:

De tendencia central: media aritmtica, mediana, moda, media
geomtrica,etc.

De posicin: deciles, cuartiles, percentiles

De dispersin: rango, desviacin media, desviacin estndar, varianza,
coeficiente de variacin.

5.2. MEDIDAS DE TENDENCIA CENTRAL
Son valores que sirven para describir las caractersticas de la poblacin o
muestra adems sirven para evaluar los valores anormalmente altos o
anormalmente bajos (Valores extremos)

Tambin son estadgrafos que permiten hallar un solo valor numrico e
indican el centro de un conjunto de datos.

5.2.1. Media o promedio aritmtico ( X)
Es la medida ms estable

A) Media aritmtica para datos no agrupados
a) Media aritmtica o promedio aritmtico simple
Se calcula sumando todos los valores de la distribucin y
dividiendo dicha suma entre el total de los datos.

xi
X
N
=

, N = nmero de datos.

Ejemplo:
Las notas de prctica de un alumno en el curso de Estadstica son:
15, 12, 13. 17 y 08. Si se elimina la nota ms baja, hallar el
promedio aritmtico de las prcticas.
Solucin:
ESTADSTICA I

62

xi
X ,
N
+ + +
= = = =

15 12 13 17
14 25 14
4


b) Media aritmtica o promedio ponderado
Se utiliza cuando prevalece cierto peso, importancia o
repeticin de los datos en el estudio.

xi.ni
X
ni
=



xi = cada uno de los datos
ni = peso, importancia o repeticin

Ejemplo:
Las notas de un alumno en el curso de estadstica fueron:
Promedio de prcticas = 12 (peso 1)
Examen parcial = 09 (peso 1)
Examen final = 14 (peso 2)
Hallar el promedio final del curso.

Solucin:
Los pesos de cada rubro son diferentes, luego:

xi.ni
( ) ( ) ( )
X ,
ni
+ + + +
= = = = = =
+ +

12 1 09 1 14 2 12 9 28 49
12 2 12
1 1 2 4 4


B) Media aritmtica para datos agrupados
a) Mtodo largo

xi.fi
X
fi
=


xi = punto medio o marca de clase
fi = frecuencia absoluta


Ejemplo:
El consumo semanal de carne vacuno en una muestra de 80
familias es:

ESTADSTICA I
63
Consumo(kg /sem) Nmero de familias
0 1,9
2 - 3,9
4 5,9
6 7,9
8 9,9
15
26
20
13
6

Hallar el consumo de carne promedio
Solucin:

Ii fi Xi Xi.fi
0 1,9
2 - 3,9
4 5,9
6 7,9
8 9,9
15
26
20
13
6
(0+1,9)/2 = 0,95
(2+3,9)/2 = 2,95
(2+5,9)/2 = 4,95
6,95
8,95
15x0,95 = 14,925
26x2,95 = 76,70
20x4,95 = 99,00
90,35
53,70
fi = 80 Xi.fi = 334,00

Por frmula:
xi.fi
X , kg
fi
= = =

334
4 2
80


Rpta.: El consumo promedio de carne de las 80 familias, es de 4,2
kg.

b) Mtodo clave
Se utiliza cuando las cantidades de los intervalos o frecuencias
son muy grandes.

Se le llama tambin tcnica de codificacin, y consiste en utilizar
cdigos en vez de marcas de clase. La codificacin consiste en
elegir un punto de partida al que se le asigna un cdigo cero(U =
0), el cual puede ser asignado a cualquier clase, pero se
recomienda hacerlo en la clase donde se ubica la mxima
frecuencia.

Luego se asignan para las clases inferiores, cdigos o valores de
U enterosnegativos en forma correlativa hasta llegar a la primera
clase(-1, -2, -3 ). Para las clases superiores se asignan cdigos o
valores de U enteros positivos, Tambin en forma correlativa
hasta llegar a la ltima clase.(1, 2, 3 .)

ESTADSTICA I

64
Para este mtodo se utiliza la siguiente frmula:
fi.U
X X .C
fi

= +


0


Xo = marca de clase en donde U = 0

Ejemplo:
El consumo semanal de carne vacuno en una muestra de 80
familias es:

Consumo(kg /sem) Nmero de familias
0 1,9
2 - 3,9
4 5,9
6 7,9
8 9,9
15
26
20
13
6

Hallar el consumo de carne promedio, utilizando el mtodo clave
Solucin:

Ii fi Xi U fi . U
0 1,9
2 - 3,9
4 5,9
6 7,9
8 9,9
15
26
20
13
6
(0+1,9)/2 = 0,95
(2+3,9)/2 = 2,95
(2+5,9)/2 = 4,95
6,95
8,95
-1
0
1
2
3
150x(-1)= -15
260x0 = 0
200x1 = 20
26
18
fi = 80 fi . U = 49

Por frmula:
fi.U
X X .C , . , kg
fi


= + = + =




0
49
2 95 2 4 2
80


Rpta.: El consumo promedio de carne de las 80 familias, es de 4,2
kg.

Observe el mismo resultado que el hallado por el mtodo largo.

ESTADSTICA I
65
5.2.2. MEDIA GEOMTRICA ( Xg )
Es un estadgrafo que permite promediar series de datos como
tipos de inters anual, proporciones o porcentajes, ndices y tasas
de crecimiento, inflacin, etc.

Se calcula de la siguiente forma:

a) Media geomtrica para datos no agrupados
Xg = (X1.X2.X3Xn)
1/n

Xn = valores de los datos
n = nmero de datos

Ejemplo:
El ndice de crecimiento de nios vacunados a travs de los
aos ha sido el siguiente:
2003: 100%, 2004: 186%, 2005: 230%. Hallar el ndice de
crecimiento promedio.
Solucin:
Xg = (100 x 86 x 230)
1/3

Xg = 162,3%
Rpta.: el ndice de crecimiento anual promedio de nios
vacunados es de 162,3%

b) Media geomtrica para datos agrupados
Xg = (X1
f1
.X2
f2
.X3
f3
Xi
fi
)
1/ fi

X1, X2, Xi = marcas de clase
F1, f2,.fi = frecuencias absolutas

Ejemplo:
La siguiente informacin corresponde a los casos de tifoidea
(en %), segn reporte de las postas mdicas donde fueron
atendidos:

Ki Casos de tifoidea Nmero de postas
1
2
3
4
5
0 19
20 39
40 59
60 79
80 99
10
14
17
8
6
TOTAL 55


ESTADSTICA I

66
Hallar el promedio de casos de tifoidea atendidos en las postas
mdicas.
Solucin:
Calculando las marcas de clase:

Ki Casos de tifoidea Xi Nmero de
postas(fi)
1
2
3
4
5
0 19
20 39
40 59
60 79
80 - 99
9,5
29,5
49,5
69,5
89,5
10
14
17
8
6
TOTAL 55

Aplicando la frmula:

Xg = (9,5
10
.29, 514

.49, 517

.69, 58

.89, 56)
1/55


Desarrollando directamente con calculadora o aplicando
logaritmos:
Xg = 36,3%
Rpta.: las 55 postas atendieron en promedio el 36,3 % de los
casos de tifoidea.

5.2.3. MEDIA ARMNICA (M
a
)
Es el reciproco de la suma de los valores inversos de la variable
estadstica divididos entre el nmero total de datos y se calcula
con la siguiente frmula

n
X X X
... Xi
Xa
N N
+ + +
= =

1 2
1 1 1


Se utiliza para promediar velocidades, tiempos, rendimiento, etc.
(cuando influyen los valores pequeos). Su problema: cuando
algn valor de la variable es cero prximo a cero no se puede
calcular.
ESTADSTICA I
67
Ejemplo:

Un automvil que hace viajes de ida y vuelta entre las ciudades A
y B, realiza el viaje entre A y B a razn de 80 Km por hora y el
viaje entre B y A a 120 Km por hora, La velocidad promedio del
viaje de ida y vuelta ser de

M
a
= (1/80+1/120)/2 = [(120+80)9600]/2 = 19200/200 = 96 km/h

5.2.4. LA MEDIANA (Me)
Es el estadgrafo que representa el punto medio de los datos, en el
cual cae el 50% de la informacin.

a) Mediana para datos no agrupados
Es el valor central cuando la serie es impar. Cuando la serie es
par la mediana es el promedio aritmtico de los 2 valores
centrales. Previo a su clculo la serie de datos tiene que
ordenarse de menor a mayor.

Ejemplo 1:
Hallar la mediana de las edades de 5 trabajadores: 20, 35, 19,
24, 31

Solucin: Ordenando los datos : 19, 20, 24, 31, 35.
Observamos que el dato que cae en el centro es 24, por lo
tanto la mediana es 24 aos.

Se puede interpretar como que el 50% de los trabajadores
tiene hasta 24 aos de edad.

Ejemplo 2:
Hallar la mediana de las edades de 6 trabajadores: 48, 52, 39,
25, 53, 21

Solucin: Ordenando los datos: 21, 25, 39, 48, 52, 53
Observamos que en el centro caen 2 valores: 39 y 48, por lo
tanto la mediana es el promedio aritmtico de los 2 valores:
(39+48) / 2 = 87/2 = 43,5 aos

ESTADSTICA I

68
b) Mediana para datos agrupados
Pasos:
1) Se determina la frecuencia acumulada(Fi)
2) Se ubica la clase mediana: la clase en la cual estar
incluida la mediana:
( fi)/2
La clase mediana ser aquella en donde la primera frecuencia
acumulada contenga el valor ( fi)/2.

3) Se aplica la frmula:
ME
fi
fi
Me Li .C
f


= +


1
2



Li = lmite inferior del intervalo de la clase mediana
( fi)
-1
= suma de las frecuencias absolutas anteriores a la
clase mediana
f
Me =
frecuencia de la clase mediana

Ejemplo:
El consumo semanal de carne vacuno en una muestra de 80
familias es:


Consumo(kg /sem) Nmero de familias
0 1,9
2 - 3,9
4 5,9
6 7,9
8 9,9
15
26
20
13
6


Hallar la mediana del consumo de carne.
Solucin:

ESTADSTICA I
69

Ki
Consumo(kg
/sem)
Nmero de familias Fi
1
2
3
4
5
0 1,9
2 - 3,9
4 5,9
6 7,9
8 9,9
15
26
20
13
6
15
41
61
74
80
fi = 80

( fi)/2 = 80/2 = 40
La primera frecuencia acumulada que contiene a 40 es 41(ver
cuadro), por lo tanto la clase mediana se encuentra en la
segunda clase.

Luego: Li = 2 ( fi)
-1
= 15 f
Me =
26
W = 2

Reemplazando valores:
( ) ( )
Me
fi / fi
Me Li .C
f

= +



2


( ) /
Me . , kg

= + =


80 2 15
2 2 3 9
26


Rpta. : El 50% de las familias consume hasta 3,9 kg/semana
de carne.

5.2.5. MODA (Mo)
Es un estadgrafo que nos proporciona el valor que se presenta
con mas frecuencia en una variable.

a) Moda para datos no agrupados
Es el valor que ms se repite en una serie de datos.

Ejemplo 1:
Calcular la moda de los siguientes sueldos de algunos
empleados:
S/ 1500, 1320, 1500, 1400, 1320, 1500, 1600, 1500
Solucin:
ESTADSTICA I

70
La moda de los sueldos es: S/ 1500, porque es el valor que
ms se repite de toda la serie.
Pueden existir 2 modas(bimodal) o ms de 3
modas(multimodal).

Ejemplo 2:
Calcular la moda de los siguientes sueldos de algunos
empleados:
S/ 1500, 1320, 1500, 1400, 1320, 1500, 1600, 1500, 1320

Solucin:
La moda de los sueldos es: S/ 1500 y S/ 1320(bimodal)porque
son los valores que ms se repite de toda la serie.
La moda es tambin til cuando la variable en estudio
pertenece a la escala nominal.

Ejemplo 3:
Hallar la moda para una muestra de consumidores segn
preferencias por marca de mantequilla:

MARCA DE MANTEQUILLA CONSUMIDORES
Astra
Dorina
Crema de oro
Laive
Ninguno
20
32
18
12
8
TOTAL 90

Solucin:
La marca de mantequilla de mayor preferencia (mayor nmero
de consumidores), segn el cuadro, es Dorina, por lo tanto
Mo=Dorina.

b) Moda para datos agrupados
d'.C
Mo Li
d' d''
= +
+


Li = lmite inferior de la clase modal
d = diferencia de la frecuencia de la clase modal y la frecuencia
de la clase anterior a ella
d = diferencia de la frecuencia de la clase modal y la frecuencia
de la clase siguiente

ESTADSTICA I
71

Ejemplo:
El consumo semanal de carne vacuno en una muestra de 80
familias es:

Consumo(kg
/sem)
Nmero de familias
0 1,9
2 - 3,9
4 5,9
6 7,9
8 9,9
15
26
20
13
6

Hallar la moda del consumo de carne.

Solucin:
Del cuadro anterior, observamos que la mayor frecuencia (26
familias) se ubica en la segunda clase, por lo tanto dicha clase
constituye la clase modal.

Luego: Li = 2
d = 26-15 = 11
d = 26-20 = 6
C = 2

Aplicando la frmula:

d'.C
Mo Li , kg
d' d''

= + = + =
+ +
11 2
2 3 29
11 6


Rpta.: las familias consumen con mayor frecuencia 3,29 kg/sem
de carne.

ESTADSTICA I

72
5.3. RELACIN ENTRE LA MEDIA ARITMTICA,
MEDIANA Y MODA

A) VENTAJAS DE LA MEDIA ARITMTICA
- Es til cuando los datos siguen aproximadamente una
progresin aritmtica o estn distribuidos en forma normal o
simtrica.
- Es un estadgrafo de gran estabilidad, porque toma en cuenta
todos los datos.
- Nos permite estimar y probar parmetros en estadstica
inferencial.
Lo ms positivo de la media es que en su clculo se utilizan todos
los valores de la serie, por lo que no se pierde ninguna
informacin.

B) DESVENTAJAS DE LA MEDIA ARITMTICA
- Como incluye todos los datos, puede ser afectado por valores
extremos, que se aparten en exceso del resto de la serie. Estos
valores anmalos podran condicionar en gran medida el valor
de la media, perdiendo sta representatividad.
- Cuando los datos agrupados tienen clases abiertas en los
extremos, no es recomendable su clculo.

C) VENTAJAS DE LA MEDIANA
- La mediana es un estadgrafo que no est afectada por valores
extremos, y por lo tanto puede ser en algunos casos mas
representativa que la media aritmtica.
- Es til cuando los datos agrupados tienen clases abiertas en
los extremos.
- Se aplica tambin a variables que pertenecen a la escala
ordinal.

D) VENTAJAS DE LA MODA
La moda se puede determinar en todos los tipos de mediciones
(nominal, ordinal, de intervalos, y relativa).

La moda tiene la ventaja de no ser afectada por valores extremos.
Al igual que la mediana, puede ser calculada en distribuciones
con intervalos abiertos.



ESTADSTICA I
73
E) DESVENTAJAS DE LA MODA
En muchas series de datos no hay moda porque ningn valor
aparece ms de una vez.

En algunas series de datos hay ms de una moda, en este caso uno
podra preguntarse cual es el valor representativo de la serie de
datos?




En distribuciones totalmente simtricas, la media, la mediana y la
moda coinciden, localizndose en un mismo valor. En cambio, en
distribuciones moderadamente asimtricas, la siguiente relacin
se mantiene aproximadamente:

Media Moda = 3(Media Mediana)

Posiciones relativas de la media, la mediana y la moda para
curvas de frecuencias asimtricas a la derecha e izquierda
respectivamente, para curvas simtricas los tres valores coinciden




ESTADSTICA I

74
EJERCICIOS

1) Qu medida de tendencia central es ms sensible a los valores extremos?
2) Cundo un conjunto de datos tiene valores extremos?Qu medida de
tendencia central debe usarse?
3) Qu medida de tendencia central sera una buena eleccin para obtener
el promedio de un conjunto que contiene muchos valores pequeos y uno
muy grande?
4) Los siguientes datos muestran una poblacin que consiste en el nmero
de barras de chocolate Winter compradas en una mquina expendedora
de una cafetera durante los primeros 10 das de operacin: 7, 3, 0, 5, 8, 6,
7, 10, 1, 3.
a) Calcule la media aritmtica, la mediana y la moda.
b) Qu medida de tendencia central usara para estimar las ventas
mensuales de chocolates en esta mquina?
5) Qu medida de tendencia central se usa para indicar el valor con la
mayor frecuencia?
6) Cuando un conjunto de datos tiene valores extremos, qu medida de
tendencia central debe usarse?
7) Si uno de los valores un poco ms grandes que la media de los datos se
sustituye por un valor muy grande, qu le pasa a la media: aumenta,
disminuye o se queda igual?. De qu manera afecta este reemplazo a la
mediana?
8) El dueo de una tienda investiga la cantidad promedio que gastan los
clientes en comestibles durante una semana. Los siguientes datos
representan las cantidades gastadas (en soles) la semana anterior por una
muestra aleatoria de 12 clientes:

185 210 248 459 700 258
240 438 195 420 280 400
a) Calcule la moda, mediana y media para este conjunto de datos.
b) Qu medida de tendencia central usara para indicar la cantidad
promedio que se gasta en comestibles?

9) Libreras Miguelito tiene una distribuidora en Chiclayo. La
Administradora en Chiclayo est preocupada por la cantidad de dinero
que se gasta al mandar paquetes de 1 a 2 kg. a la oficina principal. Las
siguientes cantidades indican los volmenes de los paquetes que se
mandaron con diferentes tarifas el ao pasado:

ESTADSTICA I
75

Tipo de envo postal Nmero de paquetes Tarifa
Cuarta clase
Tercera clase
Primera clase
Entrega inmediata
Certificado
1500
2400
3500
560
250
S/ 5,40
8,50
12,30
18,00
20,50

Cul fue el costo promedio de enviar los paquetes a la oficina principal
en ese ao?

10) La Compaa Good Year quiere determinar el millaje promedio de una
llanta especfica antes de que se gaste para poder establecer una pliza de
garanta. Se selecciona una muestra y se registran los siguientes
millajes(en miles):

33 41 55 47 38 45 47 46 48 39
40 40 41
42 38 48 50 49 36 44 44 45 42
35 46 47
47 48 47 50

a) Calcule la media, mediana y la moda para estos datos.
b) Qu medida de tendencia central usara para ayudar a determinar
la pliza de garanta?

11) El Gerente de Mercadotecnia de Supermercados Metro, quiere
determinar el promedio del precio de venta de los sobres de refresco que
se venden en otros supermercados de la gran Lima. Toma una muestra de
44 marcas y encuentra los siguientes precios(en soles):

0,55 0,60 0,70 0,55 0,90 0,60 0,47 0,55 0,60 0,60 0,50
0,50 0,70 0,65 0,59 0,70 0,60 0,55 0,55 0,65 0,60 0,50
0,50 0,65 0,60 0,60 0,70 0,50 0,49 0,70 0,65 0,50 0,55
0,50 0,70 0,65 0,59 0,70 0,60 0,55 0,55 0,65 0,60 0,50

a) Calcule la media, la mediana y la moda.
b) Qu medida de tendencia central debe usar el gerente si est
interesado en determinar el precio promedio de un sobre de
refresco?

ESTADSTICA I

76
12) Una granja ganadera registr durante febrero el nacimiento de 29
terneros, cuyos pesos al nacer (en kilogramos) fue el siguiente:

22 31 33 34 35 36 37 38 38 39
40 40 40 41 41 42 42 42 42 42
43 43 44 45 46 46 46 46 50

Los datos anteriores al ser dispuestos en una tabla de distribucin de
frecuencias se obtuvieron:

Clases f
i

21.5 26.5 1
26.5 31.5 1
31.5 36.5 4
36.5 41.5 9
41.5 46.5 13
46.5 51.5. 1
Total 29


Calcule en las dos variantes (datos no agrupados y datos agrupados) la
media aritmtica, la mediana y la moda.

13) En el 2006 se invirti un fondo de $30,000.00 y durante diez aos se
reinvirtieron todos los intereses y dividendos. Al final de los diez aos el
valor total del fondo era de $49,783.64 Cul fue la tasa de rendimiento
promedio, computada anualmente sobre la inversin inicial?

14) En una encuesta sobre la compra de losetas se elabor un cuadro de
distribucin de frecuencias. Las preguntas formuladas a los usuarios son
acerca de % de defectos por cada m2 de losetas.

Porcentaje de defectos N de Losetas M2
[6,10> 6
[10,14> 12
[14,18> 17
[18,22> 8
[22,26> 3
[26,30> 4
TOTAL

ESTADSTICA I
77
Se pide:
a) Hallar: x , Mg, Ma, Mc
b) La mediana, moda
c) Hallar el % mnimo del 45% de losetas M2 de mayores defectos
d) Halle el % mximo del 60% de losetas M2 de menores defectos

15) Una distribucin de frecuencias de 5 intervalos de clase de igual
amplitud, de ella se conoce los siguientes datos:
n= 110; f4 f5=10; f4-f3- f1 =0
f1=f5; f2=f4; Limite inferior de la primera clase:12.5
X4*f4=975; x4: Limite superior de la cuarta clase

Se pide:
a) Hallar la: x , Me, Mo
b) Halle el promedio o media aritmtica del 58% de observaciones de
menores valores: grafique y haga una nueva distribucin.

16) En una compaa el sueldo mnimo de 200 empleados es de $60. Si se
sabe que 20 empleados ganan por lo menos $60 pero menos de $70, 60
ganan menos de $80, 110 ganan menos de $90, 180 ganan menos de $100
y el 10% restante de empleados ganan a lo ms $110.
a. se pide reconstruir a lo ms la distribucin de frecuencias
b. Hallar el sueldo: promedio , mediano y modal
c. Si el gerente de la empresa incrementa el 15% a todos los empleados
mas una bonificacin de $5 por movilidad halle el nuevo promedio de
sueldos de la empresa y haga un comentario econmico

17) Los salarios que ofrece una empresa a sus practicantes varan entre $150
y $270. Si los salarios se agrupan en cuatro intervalos de clase de igual
amplitud de manera que el 40% de los practicantes tiene salarios menores
o iguales que $195, el 80% tiene salarios menores o iguales a $225 y
15% tiene salarios mayores que $232.5
a. Cuanto vale el salario medio que paga esta empresa a los practicantes.
b. Que porcentaje de practicantes corresponde un salario superior a
$185.
c. Halle el sueldo mnimo del 65% de practicantes.

18) Un estudio comparativo de porcentaje (%) de rendimiento de ciertos
bonos bancarios se elabor una distribucin de frecuencias de 5
intervalos de amplitud constante siendo las marcas de clase de la primera
ESTADSTICA I

78
y quinta clase de 15 y 55 respectivamente. Si el 65% de los bonos rinden
menos del 40% el 25% menos del 30%, el 90% menos del 50% y el 95%,
20% o ms. Calcule:
a. La media, mediana y moda
b. Cual es el porcentaje mnimo de 35% de bonos de mayores
rendimientos.
c. Halle el promedio de 45% de bonos bancarios de menores
rendimientos.

19) Una gran Empresa tiene 100 empleados. Para los nombrados el haber
mximo es de 450 dlares mensuales y el mnimo es de 60 dlares
mensuales. Hay un 5% de eventuales que trabajan Ad Honorem o
perciben compensaciones inferiores a 60 dlares: 15 empleados
nombrados perciben haberes inferiores a 250 dlares; el 85% de
trabajadores tienen haberes inferiores a 400 soles. Con esta informacin.
Calcule:
a) La media, mediana, moda
b) Cuantos empleados ganan ms de 200 dlares mensuales?
c) Hallar el sueldo mnimo de 25% de empleados
d) Halle el promedio del 85% de empleados de menores
remuneraciones

20) En una Empresa de 150 trabajadores el sueldo mnimo es de 150 dlares,
si se conoce adems que, 20 empleados ganan por lo menos $190 pero
menos de $200, 68 ganan por lo menos $180, 106 empleados ganan por
lo menos $170, 135 empleados ganan por lo menos $160. El 10%
restante de empleados ganan menos de $160. Con esta Informacin
Calcular:
a) La media aritmtica, Mg, Ma, Mc
b) Si se indexan los salarios en un 30% mas una bonificacin de $10
por movilidad Calcule la nueva Media Aritmtica

21) Se toma un examen de Mtodos cuantitativos a 50 alumnos de la facultad
de administracin y Negocios. Las calificaciones estn muy bien
representadas por la tabla de distribucin de frecuencias. Se sabe que el
nmero de alumnos del 2do y 4ta clase estn muy borrosas, pero el
profesor recuerda el nmero de alumnos de la 2da clase es el doble de la
4ta frecuencia absoluta. La nota mnima es 06 y C=2, f1=10; f3=8;
F5=50; f5=5
Se pide:
a) Hallar el promedio, Mediana y Moda
b) Hallar el rendimiento del 65% de alumnos de menores calificaciones
c) Hallar la nota mnima del 15% de alumnos.
ESTADSTICA I
79
CAPTULO VI
Medidas de Posicin



6.1. MEDIDAS DE POSICIN
Son estadgrafos que dividen a la informacin en cuatro (cuartiles), diez
(deciles), o cien (percentiles) partes iguales.


6.2. CUARTILES PARA DATOS NO AGRUPADOS
Los cuartiles dividen a la informacin en 4 partes iguales y cada uno de
ellos incluye el 25% de las observaciones.

La forma de calcular los cuartiles cuando los datos no estn agrupados se
da a travs del siguiente concepto:

Para un nmero de n observaciones en el que los datos no son
representados en clases, una vez ordenados los datos la posicin de los
cuartiles se pueden localizar de la siguiente forma:

Qi = i(n+1)/4 , donde i = 1(1er cuartil), 2(2do cuartil), .

Es importante considerar que si el clculo no corresponde con la posicin
exacta entonces se usa interpolacin lineal:

i(Ls Li)
Qi Li , i , ,

= + =1 2 3
4

Donde: Ls = lmite superior

Ejemplo. Consideremos la siguiente tabla de temperaturas reportadas en
un experimento:








25 C 28 C 25 C 26 C 28 C 28 C
35 C 32 C 31 C 31 C 32 C 27 C
25 C 29 C 26 C 28 C 27 C 28 C
30 C 30 C 31 C 31 C 30 C 31 C
ESTADSTICA I

80

Solucin:
Ordenando los datos tenemos: 25, 25, 25, 26, 26, 27, 27, 28, 28, 28, 28,
28, 29, 30, 30, 30, 31, 31, 31, 31, 31, 32, 32, 35

La posicin del primer cuartil es:

( )
.
+
= =
1 24 1 25
6 25
4 4


lo que significa que el primer cuartil se encuentra entre la posicin 6 y 7,
como en este caso el nmero es el mismo entonces
0 =
f i
L L
, por lo
que el primer cuartil es igual a
C Q = 27
1
.

Interpretacin:
El 25% de las observaciones reportadas tienen una temperatura mxima
de 27C

La posicin para el segundo cuartil es:

( )
.
+
= =
2 24 1 50
12 5
4 4


Como en este caso la posicin est entre 12 y 13, que corresponden a las
temperaturas 28C y 29C , entonces la interpolacin nos conduce a:

( )
Q .

= + =
2
2 29 28
28 28 5
4


Q2 = 28,5C

Interpretacin:
El 50% de las observaciones reportadas tienen una temperatura mxima
de 28,5C

La posicin del tercer cuartil se puede calcular como:


( )
.
+
=
3 24 1
18 75
4


ESTADSTICA I
81
Pero como la posicin 18 y 19 tienen la temperatura 30C, entonces, por
la misma razn que el primer cuartil, el tercer cuartil es igual a 30C.

Q3 = 30C

Interpretacin:
El 75% de las observaciones reportadas tienen una temperatura mxima
de 30C

6.3. DECILES PARA DATOS NO AGRUPADOS
Los deciles dividen a la informacin en 10 partes iguales y cada uno de
ellos incluye el 10% de las observaciones.

La forma de calcular los deciles cuando los datos no estn agrupados se
da a travs del siguiente concepto:

Para un nmero de n observaciones en el que los datos no son
representados en clases, una vez ordenados los datos la posicin de los
deciles se pueden localizar de la siguiente forma:

i(n+1)/10 , donde i = 1(1er decil), 2(2do decil), .

Es importante considerar que si el clculo no corresponde con la posicin
exacta entonces se usa interpolacin lineal:

i(Ls Li)
Di Li , i , , , , ,...

= + =1 2 3 4 5
10


Donde: Ls = lmite superior

Ejemplo. Consideremos la siguiente tabla de temperaturas reportadas en
un experimento:






Solucin:
Ordenando los datos tenemos: 25, 25, 25, 26, 26, 27, 27, 28, 28, 28, 28,
28, 29, 30, 30, 30, 31, 31, 31, 31, 31, 32, 32, 35


25 C 28 C 25 C 26 C 28 C 28 C
35 C 32 C 31 C 31 C 32 C 27 C
25 C 29 C 26 C 28 C 27 C 28 C
30 C 30 C 31 C 31 C 30 C 31 C
ESTADSTICA I

82
La posicin del primer decil es:
( )
,
+
= =
1 24 1 25
2 5
10 10


Lo que significa que el primer decil se encuentra entre la posicin 2 y 3,
como en este caso la temperatura es la misma, entonces
0 =
f i
L L
por
lo que el primer decil es igual a:
D1 = 25C

Interpretacin:
El 10% de las observaciones reportadas tienen una temperatura mxima
de 25C

La posicin para el segundo decil es:

( ) +
=
2 24 1
5
10


Como en este caso la posicin 5 la ocupa la temperatura 26C , entonces
Q2 = 26C

Interpretacin
El 20% de las observaciones reportadas tienen una temperatura mxima
de 26C

La posicin del quinto decil se puede calcular como:
( )
D ,
+
= = =
5 24 1
125
5 12 5
10 10


La posicin del quinto decil se encuentra entre 12 y 13, que corresponden
a las temperaturas 28 y 29C , entonces, aplicando interpolacin lineal:

( )
D ,

= + =
5 29 28
5 28 28 5
10
luego D5=28,5C
Interpretacin:
El 50% de las observaciones reportadas tienen una temperatura mxima
de 28,5C

6.4. PERCENTILES PARA DATOS NO AGRUPADOS
Los percentiles dividen a la informacin en 100 partes iguales y cada uno
de ellos incluye el 1% de las observaciones.

ESTADSTICA I
83
La forma de calcular los percentiles cuando los datos no estn agrupados
se da a travs del siguiente concepto:

Para un nmero de n observaciones en el que los datos no son
representados en clases, una vez ordenados los datos la posicin de los
percentiles se pueden localizar de la siguiente forma:

i(n+1)/100 , donde i = 1(1er percentil), 2(2do percentil), .

Es importante considerar que si el clculo no corresponde con la posicin
exacta entonces se usa interpolacin lineal:

i(Ls Li)
Pi Li ,

= +
100
i=1,2,3,4,5,

Donde: Ls = lmite superior

Ejemplo. Consideremos la siguiente tabla de temperaturas reportadas en
un experimento:







Solucin:
Ordenando los datos tenemos: 25, 25, 25, 26, 26, 27, 27, 28, 28, 28, 28,
28, 29, 30, 30, 30, 31, 31, 31, 31, 31, 32, 32, 35.

La posicin del percentil 35 es:
( )
,
+
= =
35 24 1 875
8 75
100 100


Lo que significa que el percentil 35 se encuentra entre la posicin 8 y 9,
como en este caso la temperatura es la misma (28C), entonces
0 =
f i
L L
, por lo que el percentil 35 es igual a 28C.
P35 = 28C

Interpretacin:
El 35% de las observaciones reportadas tienen una temperatura mxima
de 28C
25 C 28 C 25 C 26 C 28 C 28 C
35 C 32 C 31 C 31 C 32 C 27 C
25 C 29 C 26 C 28 C 27 C 28 C
30 C 30 C 31 C 31 C 30 C 31 C
ESTADSTICA I

84
La posicin para el percentil 80 es:

( ) +
= =
80 24 1 2000
20
100 100


Como en este caso la posicin 20 la ocupa la temperatura 31C, entonces
P80 = 31C

Interpretacin:
El 80% de las observaciones reportadas tienen una temperatura mxima
de 31C

6.5. CUARTILES PARA DATOS AGRUPADOS
Pasos:
1) Se determina la frecuencia acumulada(Fi)
2) Se ubica la clase cuartlica: la clase en la cual estar incluida el
cuartil:

i( fi)/4

La clase cuartlica ser aquella en donde la primera frecuencia
acumulada contenga dicho valor: i( fi)/4

3) Se aplica la frmula:

( ) ( )
Qi
i fi / fi
Qi Li .C
f


= +



4 1


Li = lmite inferior del intervalo de la clase cuartlica
( fi)
-1
= suma de las frecuencias absolutas anteriores a la clase cuartlica
f
Qi =
frecuencia de la clase cuartlica

Ejemplo:
El consumo semanal de carne vacuno en una muestra de 80 familias es:

Consumo(kg /sem) Nmero de familias
0 1,9
2 - 3,9
4 5,9
6 7,9
8 9,9
15
26
20
13
6
ESTADSTICA I
85
Hallar el cuartil 1

Solucin:

Ki
Consumo(kg
/sem)
Nmero de familias Fi
1
2
3
4
5
0 1,9
2 - 3,9
4 5,9
6 7,9
8 9,9
15
26
20
13
6
15
41
61
74
80
fi = 80

1( fi)/4 = 80/4 = 20

La primera frecuencia acumulada que contiene a 20 es 41(ver cuadro),
por lo tanto la clase cuartlica se encuentra en la segunda clase.

Luego: Li = 2 ( fi)
-1
= 15 f
Q1 =
26 C = 2

Reemplazando valores:

( ) ( )
Q
fi / fi
Q Li .C
f


= +



1
1 4 1
1
Q . , kg

= + =


20 15
1 2 2 4
26


Interpretacin : El 25% de las familias consume hasta 2,4 kg/semana de
carne. El 75% restante consume ms de 2,4 kg/semana.


6.6. DECILES PARA DATOS AGRUPADOS
Pasos:
1) Se determina la frecuencia acumulada(Fi)
2) Se ubica la clase declica: la clase en la cual estar incluida el decil:
i( fi)/10

La clase declica ser aquella en donde la primera frecuencia acumulada
contenga dicho valor: i( fi)/10


ESTADSTICA I

86
3) Se aplica la frmula:
( )
( )
Di
i fi
fi
Di Li .C
F



= +



1
10


Li = lmite inferior del intervalo de la clase declica
( fi)
-1
= suma de las frecuencias absolutas anteriores a la clase declica
f
Di =
frecuencia de la clase declica

Ejemplo:
El consumo semanal de carne vacuno en una muestra de 80 familias es:

Consumo(kg /sem) Nmero de familias
0 1,9
2 - 3,9
4 5,9
6 7,9
8 9,9
15
26
20
13
6
Hallar el 8 decil

Solucin:
Ki
Consumo(kg
/sem)
Nmero de familias Fi
1
2
3
4
5
0 1,9
2 - 3,9
4 5,9
6 7,9
8 9,9
15
26
20
13
6
15
41
61
74
80
fi = 80

8( fi)/10 = 640/10 = 64

La primera frecuencia acumulada que contiene a 64 es 74(ver cuadro),
por lo tanto la clase declica se encuentra en la cuarta clase.

Luego: Li = 6 ( fi)
-1
= 61 f
D8 =
13 C = 2

ESTADSTICA I
87
Reemplazando valores:
( )
D
fi
D Li .C
F

= +

1
8
64
8

D . , kg

= + =


64 61
8 2 2 6 5
13


Interpretacin : El 80% de las familias consume hasta 6,5 kg/semana de
carne. El 20% restante consume ms de 6,5 kg/semana.


6.7. PERCENTILES PARA DATOS AGRUPADOS
Pasos:
1) Se determina la frecuencia acumulada (Fi)
2) Se ubica la clase percentlica: la clase en la cual estar incluida el
percentil que se busca:
i( fi)/100

La clase percentlica ser aquella en donde la primera frecuencia
acumulada contenga dicho valor: i( fi)/100

3) Se aplica la frmula:

( ) ( )
Pi
i fi / fi
Pi Li .C
F

= +



1
100



Li = lmite inferior del intervalo de la clase percentlica
( fi)
-1
= suma de las frecuencias absolutas anteriores a la clase
percentlica
f
Pi =
frecuencia de la clase percentlica

ESTADSTICA I

88
Ejemplo:
El consumo semanal de carne vacuno en una muestra de 80 familias es:

Consumo(kg /sem) Nmero de familias
0 1,9
2 - 3,9
4 5,9
6 7,9
8 9,9
15
26
20
13
6

Hallar el percentil 60

Solucin:

Ki
Consumo
(kg /sem)
Nmero de familias Fi
1
2
3
4
5
0 1,9
2 - 3,9
4 5,9
6 7,9
8 9,9
15
26
20
13
6
15
41
61
74
80
fi = 80
60( fi)/100 = 4800/100 = 48

La primera frecuencia acumulada que contiene a 48 es 61(ver cuadro),
por lo tanto la clase cuartlica se encuentra en la tercera clase.

Luego: Li = 4 ( fi)
-1
= 41 f
P60 =
20 C = 2

Reemplazando valores:
P . , kg / sem

= + =


48 41
60 4 2 4 7
20


Interpretacin : El 60% de las familias consume hasta 4,7 kg/semana de
carne. El 40% restante consume ms de 4,7 kg/semana.

Es necesario tener en cuenta que se puede utilizar los percentiles para
calcular cualquier cuartil o decil, pues, segn lo que se ha analizado se
llega a las siguientes equivalencias:

Q1 = P25 Q2 = D5 = P50 = Me Q3 = P75 D1 = P10
D2 = P20 D9 = P90 , etc.
ESTADSTICA I
89
CAPTULO VII
Medidas de Dispersin


7.1. MEDIDAS DE DISPERSIN
Son estadgrafos que miden la dispersin o desviacin de los datos con
respecto al valor central.

Entre las principales medidas de dispersin tenemos:

A) Rango(R )
Es un estadgrafo de fcil clculo, pero de uso limitado, ya que no
considera a todas las observaciones, por lo que est fuertemente
influenciado por los datos extremos.

Se calcula de la siguiente forma:

a) Para datos no agrupados
R = Xmx Xmin, Xmx = dato mayor
Xmin = dato menor
Ejemplo:
El tiempo que utilizan 6 trabajadores para desarrollar una misma
actividad fue: 16, 12, 15, 18, 13, 14 minutos. Hallar el rango.

Solucin:
R = 18 12 = 6 min

b) Para datos agrupados
R = Lsup Linf , Lsup = lmite superior de la ltima clase
Linf = lmite inferior de la primera clase

Ejemplo:
Se tiene la siguiente informacin:

ESTADSTICA I

90
MULTICOMP SAC
Hijos de trabajadores por edad
Junio 2006

EDAD(aos) CANTIDAD DE HIJOS %
0 2
3 5
6 8
9 11
12 - 14
5
12
20
10
6
9,43
22,64
37,74
18,87
11,32
TOTAL 53 100,00

Calcular el rango.
Solucin:
R = 14 0 = 14 aos

B) Desviacin Media(DM)
Es un estadgrafo mejor que el rango, ya que toma en cuenta todos
los datos u observaciones.Se calcula e la siguiente forma:

a) Para datos no agrupados
Xi X
DM
N

=


Xi = cada uno de los datos
N = total de datos

Ejemplo:
El tiempo que utilizan 6 trabajadores en desarrollar una misma
actividad fue el siguiente: 16,12, 15, 18, 13, 14 minutos. Calcular
la desviacin media.
Solucin:
Calculando: X , min
+ + + + +
= =
16 12 15 18 13 14
14 7
6


Calculando la desviacin media:
, , , , ,
DM
+ + + +
=
16 14 7 12 14 7 15 14 7 18 14 7 14 14 7
6

DM=1,7 min

Interpretacin: el tiempo utilizado por los trabajadores se dispersa
en promedio 1,7 minutos con respecto al valor central.
ESTADSTICA I
91

b) Para datos agrupados
Xi X
DM .fi
fi

, Xi = marcas de clase

Ejemplo:
Se tiene la siguiente informacin:

MULTICOMP SAC
Hijos de trabajadores por edad
Junio 2006

EDAD(aos) CANTIDAD DE HIJOS %
0 2
3 5
6 8
9 11
12 - 14
5
12
20
10
6
9,43
22,64
37,74
18,87
11,32
TOTAL 53 100,00

Calcular la desviacin media.

Solucin:

La sgte. tabla ayuda a obtener los datos parciales:

Ii fi Xi Xi . fi Xi X Xi X. fi
0 2
3 5
6 8
9 11
12 - 14
5
12
20
10
6
1
4
7
10
13
1x5 = 5
4x12 = 48
7x20 = 140
10x10 = 100
13x6 = 78
1 7=6
4 7=3
7 7=0
10 7=3
13 7=6
6x5 =30
3x12 =36
0x20 = 0
3x10 =30
6x6 =36
fi = 53 Xi.fi = 371 Xi X. fi = 132

X = =
371
7
53

DM , min = =
132
2 5
53


ESTADSTICA I

92
Interpretacin: la edad de los hijos de los trabajadores se dispersa
en promedio 2,5 aos con respecto al valor central.

C) La desviacin estndar o desviacin tpica( )
Es el estadgrafo de dispersin ms importante y de mayor uso.
Un valor grande de significa que la generalidad de los datos
estn alejados de la media.Un valor pequeo de significa que la
mayora de los datos estn concentrados en la proximidad de la
media aritmtica.

Se calcula de la siguiente forma:

a) Para datos no agrupados
( )
/
Xi X
N

1 2
2

Xi = cada uno de los datos
N = total de datos

Ejemplo:
El tiempo que utilizan 6 trabajadores en desarrollar una misma
actividad fue el siguiente: 16,12, 15, 18, 13, 14 minutos. Calcular
la desviacin estndar.
Solucin:

Calculando: X , min
+ + + + +
= =
16 12 15 18 13 14
14 7
6


Calculando la desviacin estndar:
( ) ( ) ( ) ( ) ( )
/
, , , , ,

+ + + +
=


1 2
2 2 2 2 2
16 14 7 12 14 7 18 14 7 13 14 7 14 14 7
6

/
,
, min.

= = =


1 2
23 34
1 97 2
6



Interpretacin: el tiempo utilizado por los trabajadores se dispersa
en promedio 2 minutos con respecto al valor central.


ESTADSTICA I
93
b) Para datos agrupados

( )
/
Xi X .fi
fi

1 2
2
, Xi = marcas de clase


Ejemplo:
Se tiene la siguiente informacin:


MULTICOMP SAC
Hijos de trabajadores por edad
Junio 2006
EDAD(aos) CANTIDAD DE HIJOS %
0 2
3 5
6 8
9 11
12 - 14
5
12
20
10
6
9,43
22,64
37,74
18,87
11,32
TOTAL 53 100,00
Calcular la desviacin estndar.

Solucin:
La sgte. tabla ayuda a obtener los datos parciales:

Ii fi Xi Xi . fi (Xi X)
2
(Xi X)
2
. fi
0 2
3 5
6 8
9 11
12 - 14
5
12
20
10
6
1
4
7
10
13
1x5 = 5
4x12 = 48
7x20 = 140
10x10 = 100
13x6 = 78
(1 7)
2
=36
(4 7)
2
=9
(7 7)
2
=0
(10 7)
2
=9
(13 7)
2
=36
36x5 = 180
9x12 = 108
0x20 = 0
9x10 = 90.
36x6 = 216
fi = 53 Xi.fi = 371 (Xi X)
2
. fi = 594

ESTADSTICA I

94
X = =
371
7
53


/
, min.

= =


1 2
594
3 3
53



Interpretacin: la edad de los hijos de los trabajadores se dispersa
en promedio 3,3 aos con respecto al valor central.

D) Varianza( )
2
La Varianza es una medida de dispersion o de concentracion mas
importante de la etadistica, pues cuantifica las desviaciones o
diferencias entre los valores de la variable respecto a su media
elevado al cuadradoes decir mide la distancia existente entre los
valores de la serie y la media. Se determina elevando al cuadrado
la desviacin estndar.

La varianza siempre ser mayor que cero. Mientras ms se
aproxima a cero, ms concentrados estn los valores de la serie
alrededor de la media. Por el contrario, mientras mayor sea la
varianza, ms dispersos estn.

Ejemplo:
Se sabe que la desviacin estndar del tiempo que utilizan 6
trabajadores en desarrollar una misma actividad, es 2 minutos.
Hallar la varianza.

Solucin:
Si = 2 , entonces:
2
= (2 min)
2
= 4 min
2


Interpretacin:
El tiempo utilizado por los trabajadores se dispersa en promedio
en 4 minutos al cuadrado con respecto al valor central.

PROPIEDADES DE LA VARIANZA
i) V(x)0 ; La varianza siempre es no negativa , es decir es mayor que
cero; si es cero el valor de X= C, constante
ii) La varianza de una constante C es cero: V( C ) = 0
iii) Si a los valores de la variables se le suma o reata una constante C la
varianza no varia. En efecto

ESTADSTICA I
95
Si Y= X+-C ; V(Y)=V(X+-C) ; V(Y)=V(X)+-V(C) pero V(C)=0
Luego V(Y) = V( X )

iv) Si a los valores de la variable se el multiplica o divide una constante
C la varianza queda multiplicada o dividida por la constante C
elevado al cuadrado. En efecto
Si Y= CX ; V(Y) = V(CX); V(Y ) =C
2
V(X )
v) Si se tiene dos Variables ependientes X, Y entonces
V(X+Y)= V(X) +V(Y) - Cov(XY)

E) Coeficiente de Variacin(CV)
Es el cociente de la desviacin estndar y la media aritmtica, expresado
en porcentaje:
CV
X

= 100

El inters del coeficiente de variacin es que al ser un porcentaje permite
comparar el nivel de dispersin de dos muestras. Esto no ocurre con la
desviacin tpica, ya que viene expresada en las mismas unidas que los
datos de la serie.

Por ejemplo, para comparar el nivel de dispersin de una serie de datos
de la altura de los alumnos de una clase y otra serie con el peso de dichos
alumnos, no se puede utilizar las desviaciones tpicas (una viene vienes
expresada en cm y la otra en kg). En cambio, sus coeficientes de
variacin son ambos porcentajes, por lo que s se pueden comparar.

Ejemplo:
Se conocen la media y desviacin estndar del tiempo que utilizan 6
trabajadores en desarrollar una misma tarea:

X = 14,7 min , = 2 min . Hallar el coeficiente de variacin.
Solucin:

CV , %
, X
= = =

2
100 100 13 6
14 7


Interpretacin: el tiempo utilizado por los trabajadores se dispersa en
promedio 13,6% con respecto al valor central.


ESTADSTICA I

96
7.2. CARACTERSTICAS DE LAS MEDIDAS DE
DISPERSIN
A) Si se desea exactitud estadstica en un estudio, se debe aplicar los
estadgrafos de acuerdo al siguiente orden:
1 desviacin estndar
2 desviacin media
3 rango

B) Si se desea llevar a cabo un trabajo rpido sin que la exactitud
estadstica importe demasiado, se debe aplicar los estadgrafos
anteriores, pero en sentido contrario.

C) La desviacin estndar es el estadgrafo de dispersin ms
importante y de mayor uso. Un valor grande de , significa que la
generalidad de los datos estn alejados de la media. Un valor
pequeo de significa que la mayora de los datos estn
concentrados en la proximidad de la media aritmtica.

D) La varianza tiene gran aplicacin en el campo del muestreo y la
inferencia estadstica.


EJERCICIOS
1) Cul es la diferencia entre una medida de tendencia central y una de
dispersin o variabilidad

2) Cul es la diferencia entre la desviacin estndar y la varianza?

3) El Gerente de Servicios al cliente de Plaza Vea, reuni los siguientes
datos que representan el nmero de quejas recibidas por su departamento
en cada uno de los 10 das seleccionados al azar:
10, 15, 8, 12, 9, 15, 13, 12, 14, 23

a)Calcule el rango
b)Calcule la desviacin estndar
c)Clacule la varianza
d)Calcule el coeficiente de variacin
e)Interprete las medidas anteriores.

4) En el Casero Callanca (Dpto. de Lambayeque) se llev a cabo un estudio
para determinar el tipo de material utilizado en la construccin de sus
pequeos negocios: Los resultados fueron los siguientes: quincha: 120,
adobe: 480, madera: 80, ladrillo: 20, Otros: 100. Hallar la medida de
ESTADSTICA I
97
tendencia central ms representativa para determinar el tipo de material
promedio utilizado.

5) Los siguientes datos corresponden al peso en kg. de frascos de jarabe
para la tos:
40,8 52,5 49,2 40,8 62,2
52,5 58,0 60,0 40,8 52,5
Calcular:
a) Media aritmtica, mediana, moda. Interpretar los resultados.
b) Cul de los tres indicadores mide con mayor precisin el centro de
los datos?Porqu?
c) desviacin estndar, varianza, coeficiente de variacin. Interpretar.

6) El presupuesto anual para gastos en publicidad por parte de 10 Empresas,
en la ltima semana del mes de Julio, fue la siguiente:

Empresa 1 2 3 4 5 6 7 8 9 10
Presupuesto 500 700 550 3500 800 600 850 650 750 900

Calcular:
a) Media aritmtica, mediana, moda. Interpretar los resultados
b) Cul de los tres indicadores mide con mayor precisin el centro de
los datos? Porqu?
c) desviacin estndar, varianza, coeficiente de variacin. Interpretar los
resultados.

7) La media aritmtica y la varianza del peso de un grupo de personas es de
60 y 400 kg, respectivamente. Qu opina Ud. de la media aritmtica, es
o no representativa de los datos?

8) En el Instituto Idat, trabajan 10 profesores antiguos y 40 profesores
nuevos. El sueldo promedio por hora de los profesores antiguos es de S/
10/hr y de los profesores nuevos es de S/14.50/hr. Cul es el sueldo
promedio por hora de los 50 profesores?

9) Se sabe que en el examen parcial de Estadstica, la calificacin promedio
de los alumnos de Administracin y Contabilidad son 16 y 14 puntos,
respectivamente. Si la seccin de Administracin tiene 40 alumnos y la
de Contabilidad tiene 30, cul ser la calificacin promedio de los
alumnos en dicho curso?.

10) En el siguiente cuadro se presenta el ingreso, consumo y ahorro (en
soles), correspondiente al mes de Julio, por parte de 7 familias:
ESTADSTICA I

98

FAMILIAS 1 2 3 4 5 6 7
Ingreso
Consumo
Ahorro
500
400
100
800
850
50
500
600
100
650
650
0
800
500
300
600
400
200
450
350
100

a) Hallar la medida de centralizacin ms adecuada para las variables
ingreso, consumo y ahorro.
b) Cul de las tres variables presenta mayor variabilidad?

11) Qu opina Ud sobre la media aritmtica en las siguientes variables?:

Variable Media aritmtica
Desviacin
estndar
Varianza
Talla
Peso
Ingresos
Edad
1,65 m
56 kg
S/15000
5 aos

50 kg
S/20000

0,004 m2


6 meses2

12) Se presenta la siguiente informacin:

PIURA
Encuesta sobre la demanda del producto A segn esracin

ESTACION DEL AO DEMANDA PORCENTAJE
Verano
Otoo
Primavera
Invierno
30
35
76
38
16,8
19,5
42,5
21,2
TOTAL 179 100,0

Hallar la medida de tendencia central ms adecuada, y representar
grficamente la informacin.

13) Los precios de un mismo medicamento en 10 farmacias de un distrito
fueron los siguientes(en soles):
9 10 10 13 15 11 10 11 12 14

Hallar:
a) El precio promedio del medicamento utilizando la medida de
centralizacin ms apropiada.
b) Hallar todas las medidas de dispersin e interprete los resultados.
ESTADSTICA I
99
14) Calcular las medidas de centralizacin ms adecuadas para las siguientes
distribuciones de frecuencias:

INGRESO(miles de soles) FRECUENCIA
Menos de 20
[20 25>
[25 30>
[30 35>
[35 39>
ms de 39
10
18
32
270
110
115

EDAD(aos) NUMERO DE PERSONAS
Menor de 10
[10 -12>
[12 -14>
[14 16>
[16 - 17>
05
08
80
06
07


PESO(kg) NUMERO DE PERSONAS
[50 54>
[54 58>
[58 62>
[62 67>
67 y ms
5
10
12
25
120

15) Los siguientes datos se han obtenido de una encuesta llevada a cabo en el
Distrito de Jess Mara, sobre el precio del alquiler en una muestra de
800 viviendas(habitaciones):

ALQUILER MENSUAL
(en soles)
NUMERO DE VIVIENDAS
[50 100>
[100 150>
[150 200>
[200 250>
[250 300>
[300 350>
[350 400>
[400 - 450>
42
48
139
185
96
32
18
10

ESTADSTICA I

100
a) Calcular el alquiler mensual promedio, desviacin estndar y
coeficiente de variacin.Interprete los resultados.
b) Calcular el 7 decil.Interpretar.
c) Calcular el 92 percentil.Interpretar.
d) Hallar el 2 cuartil.Interpretar

16) En el distrito de Ate, una encuesta por muestreo de 178 amas de casa
determin las preferencias en el consumo de 5 marcas de detergente:

Detergente preferido Nmero de amas de casa
Ariel
Ace
apancha
Sapolio
Magia Blanca
30
50
45
25
28

Calcular la medida de tendencia central ms adecuada para medir las
preferencias en el consumo de los detergentes.

17) Los siguientes datos corresponden al consumo anual de pescado(en kg)
por parte de 5 ciudades del Per:

Ciudad Chachapoyas Lima Chiclayo Trujillo Chota
Consumo 5200 6800 5900 500 4900

a) Hallar la media aritmtica, mediana y moda.Interprete los
resultados.
b) Cul de los tres indicadores mide con mayor precisin el centro de
los datos?
c) Hallar la desviacin estndar y el coeficiente de variacin.
Interprete los resultados.
d) Calcular e interpretar el cuartil 2, el decil 6, y el percentil 72.

18) Los varones que entre los 20 y 54 aos contrajeron matrimonio durante el
2006 en la Municipalidad de Lima, presenta la siguiente distribucin de
frecuencias:

ESTADSTICA I
101

EDAD VARONES
[20- 25>
[25 30>
[30 35>
[35 40>
[40 45>
[45 50>
[50 55>
650
1250
950
720
350
212
110

a) Hallar la media aritmtica, mediana y moda de las edades.Interprete
los resultados.
b) Hallar la desviacin estndar, varianza y coeficiente de variacin de
las edades.Interprete los resultados.
c) Hallar la edad mxima del 45% de varones
d) Hallar la edad mxima del 45% de varones
e) Hallar la edad mxima del 60% de los varones.
f) Hallar la edad mnima del 90% de los varonesi

19) El INTI S.A emplea a 8 trabajadores.Los siguientes datos muestran los
aos de experiencia de cada trabajador: 1, 7, 9 , 15, 9, 1 ,7, 15. Considere
este conjunto de datos como una poblacin.
a) Calcule la desviacin estndar.
b) Si se contrata a un trabajador con 8 aos de experiencia, Cmo
afecta esto a la desviacin estndar?
c) Si un trabajador con 15 aos de experiencia sustituye a uno con 7
aos de experiencia,cmo afecta esto a la desviacin estandar?.

19) Una Empresa automovilstica est considerando 2 marcas de batera para
su ltimo modelo. La batera Telco tiene una vida media de 55 meses
con una desviacin estndar de 5 meses. La batera Larga vida tiene
una vida media de 45 meses con una desviacin estndar de 3 meses.
a) Si el criterio de decisin para elegir una marca de batera es
mxima vida, Qu marca debe elegirse?.
b) Qu marca ha de seleccionarse si el criterio de decisin es
consistencia en el servicio?

ESTADSTICA I

102

ESTADSTICA I
103
CAPTULO VIII
Medidas de Forma



8.1. MEDIDAS DE FORMA
Las medidas de forma permiten conocer que forma tiene la curva que
representa la serie de datos de la muestra. En concreto, podemos estudiar
las siguientes caractersticas de la curva:

8.1. Distribucin: mide si los valores de la variable estn ms o menos
repartidos a lo largo de la muestra.
8.2 Asimetra: mide si la curva tiene una forma simtrica, es decir, si
respecto al centro de la misma (centro de simetra) los segmentos de
curva que quedan a derecha e izquierda son similares.
8.3. Curtosis: mide si los valores de la distribucin estn ms o menos
concentrados de los valores medios de la muestra.

8.2. COEFICIENTE DE ASIMETRA
Hemos comentado que el concepto de asimetra se refiere a si la curva
que forman los valores de la serie presenta la misma forma a izquierda y
derecha de un valor central (media aritmtica)



Para medir el nivel de asimetra se utiliza el llamado Coeficiente de
Asimetra de Fisher, que viene definido:

( ) ( )
( )
( )
i i
/
i i
/ n x xm n
g
( / n) x xm n

=

3
1 3 2
2
1
1


ESTADSTICA I

104
Los resultados pueden ser los siguientes:
g1=0 (distribucin simtrica; existe la misma distribucin de valores a
la derecha y a la izquierda de la media)
g1>0 (distribucin asimtrica positiva; existe mayor distribucin de
valores a la derecha de la media que a su izquierda)
g1<0 (distribucin asimtrica negativa; existe mayor distribucin de
valores a la izquierda de la media que a su derecha)

Ejemplo: Vamos a calcular el Coeficiente de Asimetra de Fisher de la
serie de datos referidos a la estatura de un grupo de alumnos:

Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple Acumulada
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%

Recordemos que la media de esta muestra es 1,253
((xi x)^3)*ni ((xi x)^2)*ni
0,000110 0,030467

Luego:
( / ) ,
g ,
( / ) ( , ) ( / )

= =

1 30 0 000110
1 0 1586
1 30 0 030467 3 2


Por lo tanto el Coeficiente de Fisher de asimetra de esta muestra es
0,1586, lo que quiere decir que presenta una distribucin asimtrica
negativa (se concentran ms valores a la izquierda de la media que a su
derecha).



ESTADSTICA I
105
8.3. COEFICIENTE DE CURTOSIS
El Coeficiente de Curtosis analiza el grado de distribucin que presentan
los valores de la zona central de la distribucin.

Se definen 3 tipos de distribucin:
Distribucin mesocrtica: presenta un grado de distribucin medio de los
valores centrales de la variable (el mismo que presenta una distribucin
normal).

Distribucin leptocrtica: presenta un elevado grado de distribucin de
los valores centrales de la variable.

Distribucin platicrtica: presenta un reducido grado de distribucin de
los valores centrales de la variable.



El Coeficiente de Curtosis viene definido por la siguiente frmula:

( )
i i
i i
( / n) (x xm) n
g
( / n) (x xm) n

=

4
2
1
2 3
1


Los resultados pueden ser los siguientes:
g
2
= 0 (distribucin mesocrtica).
g
2
> 0 (distribucin leptocrtica).
g
2
< 0 (distribucin platicrtica).

Ejemplo: calcular el Coeficiente de Curtosis de la serie de datos referidos
a la estatura de un grupo de alumnos:

ESTADSTICA I

106

Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple Acumulada
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%


Recordemos que la media de esta muestra es 1,253

((xi xm)^4)*ni ((xi xm)^2)*ni
0,00004967 0,03046667

Luego:
( )
( / ) ,
g ,
( / ) ( , )

= =

1 30 0 00004967
2 3 1 39
1 30 0 03046667 2


Por lo tanto, el Coeficiente de Curtosis de esta muestra es 1,39, lo que
quiere decir que se trata de una distribucin platicrtica, es decir, con una
reducida distribucin de los valores centrales de la distribucin.


ESTADSTICA I
107
EJERCICIOS

1) Los salarios que ofrece una empresa a los practicantes estn entre 150 y
270 dlares. Si los salarios se agrupan en 5 intervalos de clase de TIC
constante de manera que el 40% de los practicantes tienen salarios
menores o iguales que $192, el 80% tienen salarios menores e iguales a
$225, el 18% tienen salarios mayores que $ 228 y el 35% de los
practicantes tienen salarios por lo manos de $ 198, pero menos de $ 222.
a) Cuanto vale el salario medio que paga esta empresa a sus
practicantes?
b) Halle el recorrido intercuartlico
c) Halle la varianza y C.V. e interprete.
d) Por encima de que salario esta el 15% de practicantes?

2) Los sueldos de los empleados de la empresa RST S.A varan entre 450
y 950 soles mensuales, si se conocen los siguientes datos, x = 660 soles
f1 = 15, f5 = 8
F1=50. Adems el nmero de empleados de la segunda y cuarta clase no
aparecen.
a) Halle la varianza y c.v. e interprete
b) Halle asimetra y curtosis, dibuje las curvas.
c) Por debajo de que sueldo se encuentra el 60% de los empleados?

Si la gerencia concede un incremento del 18 % a todos los trabajadores y
una bonificacin de 400 soles por gratificacin del mes de Diciembre
halle el nuevo c.v e interprete.

3) Una gran empresa tiene 2000 obreros y 1200 empleados .La alta
direccin de personal est estudiando en conceder un aumento a sus
trabajadores y encarga hacer un estudio de factibilidad. La comisin
encargada de este estudio toma una muestra de 150 obreros y 40
empleados y luego informa que los primeros ganan en promedio 480
soles y los segundos 560 soles.

Sobre la base de esta informacin la empresa decide aumentar a los
obreros 15% y a los empleados el 20%. Calcule ud. la cantidad de dinero
que debe disponer la empresa para hacer efectivo el aumento. Considera
ahora que por la navidad los trabajadores reclaman una gratificacin y
logran que la empresa le otorgue a cada uno 300 soles
a) A cuanto asciende el monto de la planilla del mes de diciembre?
b) Calcule la varianza total del mes de Diciembre.
c) Si la desviacin estndar de los obreros es 80 soles y de los
empleados 60 soles. Cul de ellas es ms homogneo?
ESTADSTICA I

108
4) Los alumnos de la promocin de Administracin del presente ao, han
llevado a cabo una actividad y realizaron un concierto de msica criolla
durante los 150 primeros das del ao ofreciendo una funcin por da.

El nmero de personas que asistieron diariamente al concierto se ha
tabulado en el siguiente informe:

PERSONAS QUE
ASISTEN DIARIAMENTE
# DE DIAS
2000 30
3000 75
4000 45
TOTAL

a) Hallar la varianza y c.v. de personas que diariamente asistieron a
una funcin
b) Si el costo total para montar una funcin es de 200 u.m. diarios y el
precio de la entrada de 1 u.m. por persona. Cul fue la ganancia
promedio?

5) Dado los sueldos de 80 personas que se clasifican en una tabla de
frecuencias con cinco intervalos con TIC, constante. Se pide hallar la
varianza, c.v, asimetra y curtosis sabiendo que la marca de clases del
tercer intervalo es 100 soles F2 =20, f1 =8, f3 =35, f5 =5, X=100.5

6) Se han elegido 150 productos (cominos) para analizar sus pesos en grs.
Segn la tabla:

peso en gramos # de bolsitas
[2.00,2.04> 12
[2.04,2.08> 20
[2.08,2.12> 38
[2.12.2.16> f4
[2.16,2.20> f5
[2.20,2.24> f6
[2.24,2.28> 9
[2.28,2.32> 8
TOTAL


ESTADSTICA I
109
Si se sabe que la media es de 2.14 gs y la Me = 2.128 gs
a) Calcular Sx y C.V.
b) Halle asimetra y curtosis
c) Halle el peso mnimo del 40% de los productos
d) Halle el peso mximo del 35 % de los productos

7) Una empresa contable toma un examen de conocimientos a 120
postulantes para cubrir las vacantes de Asistente Administrativo. El
resultado fue elaborado en un cuadro estadstico de distribucin de
frecuencias simtricas, agrupadas en 7 intervalos de Tic constante, donde
se conocen los siguientes datos:
f1 = 6, f3 = 18, *F3 =102, M4 =72
Mj =400, M4 =4ta marca de clase
j =3

*Frecuencia absoluta acumulada en forma descendente

Con esta informacin halle:
a) Varianza y C.V. e interprete
b) La nota desaprobatoria es 70 puntos. Cuntos postulantes no
obtuvieron el empleo?

8) A un estudiante de ingeniera se le da la informacin a cerca de la
distribucin de frecuencias sobre temperaturas de grados centgrados C,
son datos incluidos dejados por un operador anterior. Los datos dejados
son:
f1 =3, f2 =5, f3 =10, f5 = 2, n = 24 M3 =6, M3 = Marca de clase
del tercer intervalo. Hallar:
a) Desviacin estndar n C.V.
b) Asimetra y curtosis

9) La siguiente informacin corresponde al tiempo en horas que
permanecieron almacenados 50 cajas de filete de pescado en la cmara
frigorfica antes de su embarque en el puerto del Callao.

Se conocen los siguientes datos:
F5 =50 , M4= 90, F2 =17, f1 =5, f3 =25 , X =65.6 hrs. Me =66.4 hrs.

Con esta informacin Hallar:
a) Sx, C.V, asimetra y curtosis
b) Halle el promedio del 45% de cajas de menores horas de
almacenamiento.

ESTADSTICA I

110
10) Los ingresos por conceptos de ventas de un fabricante de calzado durante
una cierta cantidad de das se encuentra distribuida en una tabla, cuyos
datos se dan a continuacin:

La suma de las cuatro primeras frecuencias que estn en progresin
aritmtica es 48 y el producto de los extremos es al producto de los
medios como 27 es a 35 adems f5 =2f1, 5f6 =f2. El limite inferior del
primer intervalo es 14 el punto medio del tercer intervalo es 69

a) Halle Sx, y C.V.
b) Si se indexan los sueldos en un 12% mas una bonificacin de 30
soles por movilidad halle la nueva varianza y C.V. e interprete.

11) A continuacin se presenta una distribucin simtrica referente a los
ingresos diarios en soles de 100 trabajadores de una empresa y en la que
se conoce:
F6 F2 = 72 , F5 F3 =45 , F4 + F6 =157

X5 X2 = (k-4) c, X1= 12, Mo= 19 donde:
C = Tic

Xj: Limite superior del j-simo intervalo

Xj: Limite inferior del j-simo intervalo
a) Si la gerencia fija un sueldo mnimo de 15 soles diarios. Qu
porcentaje de trabajadores se benefician con esta medida?
b) Si el gerente de produccin aumenta el 15% a todos los trabajadores
ms una bonificacin de 20 soles por movilidad. Cul ser la
nueva varianza y C.V. interprete?

12) Se tiene una tabla de frecuencias de 5 intervalos de Tic constante donde
el valor mnimo es 40 y el mximo es 200. Si adems las frecuencias
absolutas simples forman una progresin geomtrica creciente, cuya
suma es 242 y la suma de sus inversas es 121/162 y la razn es la sexta
parte de la frecuencia absoluta simple de la tercera clase
a) Halle la varianza y C.V.
b) Calcule la asimetra y curtosis
c) Si los datos X se transforma en Y= 1.6X + 30 calcule la nueva
varianza y C.V.

ESTADSTICA I
111
13) Se tiene 40 valores de una variable estadstica donde X: X1, X2, X3,
..........., X40 que arrojan una media de 8 y desviacin tpica de 210, se
construye una nueva variable Y= (X1-2), (X2-2), (X3-2),
.............................., (X40-2)
a) Se pide hallar la media aritmtica de la variable Y
b) Si Y=0.5 X 40 halle C.V. (y)

ESTADSTICA I

112
ESTADSTICA I
113
CAPTULO IX
Distribuciones Bidimensionales



9.1. DISTRIBUCIONES BIDIMENSIONALES
Las distribuciones bidimensionales son aquellas en las que se estudian al
mismo tiempo dos variables de cada elemento de la poblacin: por
ejemplo: peso y altura de un grupo de estudiantes; superficie y precio de
las viviendas de una ciudad; potencia y velocidad de una gama de
automviles, etc.

Ejemplo: Al medir el peso y la estatura de los alumnos de una clase, se
obtienen los siguientes resultados:

Estatura Peso Estatura Peso Estatura Peso
Alumno
x y
Alumno
x y
Alumno
x y
Alumno
1
1,25 32
Alumno
11
1,25 31
Alumno
21
1,25 33
Alumno
2
1,28 33
Alumno
12
1,28 35
Alumno
22
1,28 32
Alumno
3
1,27 31
Alumno
13
1,27 34
Alumno
23
1,27 34
Alumno
4
1,21 34
Alumno
14
1,21 33
Alumno
24
1,21 34
Alumno
5
1,22 32
Alumno
15
1,22 33
Alumno
25
1,22 35
Alumno
6
1,29 31
Alumno
16
1,29 31
Alumno
26
1,29 31
Alumno
7
1,30 34
Alumno
17
1,30 35
Alumno
27
1,30 34
Alumno
8
1,24 32
Alumno
18
1,24 32
Alumno
28
1,24 33
Alumno
9
1,27 32
Alumno
19
1,27 31
Alumno
29
1,27 35
Alumno
10
1,29 35
Alumno
20
1,29 33
Alumno
30
1,29 34

Las "x" representan una de las variables, y las "y" la otra variable. En
cada interseccin de una valor de "x" y un valor de "y" se recoge el
ESTADSTICA I

114
nmero de veces que dicho par de valores se ha presentado
conjuntamente.

Esta informacin se puede representar de un modo ms organizado en la
siguiente tabla de correlacin:

Estatura / Peso 31 kg 32 kg 33 kg 34 kg 35 kg
1,21 cm 0 0 1 2 0
1,22 cm 0 1 1 0 1
1,23 cm 0 0 0 0 0
1,24 cm 0 2 1 0 0
1,25 cm 1 1 1 0 0
1,26 cm 0 0 0 0 0
1,27 cm 2 1 0 2 1
1,28 cm 0 1 1 0 1
1,29 cm 3 0 1 1 1
1,30 cm 0 0 0 2 1

Tal como se puede ver, en cada casilla se recoge el nmero de veces que
se presenta conjuntamente cada par de valores (x,y).

Tal como vimos en las distribuciones unidimensionales si una de las
variables (o las dos) presentan gran nmero de valores diferentes, y cada
uno de ellos se repite en muy pocas ocasiones, puede convenir agrupar
los valores de dicha variable (o de las dos) en tramos.


9.2. COEFICIENTE DE CORRELACIN LINEAL
En una distribucin bidimensional puede ocurrir que las dos variables
guarden algn tipo de relacin entre si.

Por ejemplo, si se analiza la estatura y el peso de los alumnos de una
clase es muy posible que exista relacin entre ambas variables: mientras
ms alto sea el alumno, mayor ser su peso.

El coeficiente de correlacin lineal mide el grado de intensidad de esta
posible relacin entre las variables. Este coeficiente se aplica cuando la
relacin que puede existir entre las variables es lineal (es decir, si
representramos en un grfico los pares de valores de las dos variables la
nube de puntos se aproximara a una recta).

ESTADSTICA I
115




No obstante, puede que exista una relacin que no sea lineal, sino
exponencial, parablica, etc. En estos casos, el coeficiente de correlacin
lineal medira mal la intensidad de la relacin las variables, por lo que
convendra utilizar otro tipo de coeficiente ms apropiado.

Para ver, por tanto, si se puede utilizar el coeficiente de correlacin
lineal, lo mejor es representar los pares de valores en un grfico y ver que
forma describen.

El coeficiente de correlacin lineal se calcula aplicando la siguiente
frmula:
( )
i i
/
i i
/ n (x xm) (y ym)
r
( / n (x xm) ) ( / n (y ym) )

=


1 2
2 2
1
1 1


Es decir:
El numerador: se denomina covarianza y se calcula de la siguiente
manera: en cada par de valores (x,y) se multiplica la "x" menos su media,
por la "y" menos su media. Se suma el resultado obtenido de todos los
pares de valores y este resultado se divide por el tamao de la muestra.

El denominador: se calcula el producto de las varianzas de "x" y de "y", y
a este producto se le calcula la raz cuadrada.




ESTADSTICA I

116
Los valores que puede tomar el coeficiente de correlacin "r" son:
-1 < r < 1

Si "r" > 0, la correlacin lineal es positiva (si sube el valor de una
variable sube el de la otra). La correlacin es tanto ms fuerte cuanto ms
se aproxime a 1.

Por ejemplo: altura y peso: los alumnos ms altos suelen pesar ms.

Si "r" < 0, la correlacin lineal es negativa (si sube el valor de una
variable disminuye el de la otra). La correlacin negativa es tanto ms
fuerte cuanto ms se aproxime a -1.

Por ejemplo: peso y velocidad: los alumnos ms gordos suelen correr
menos.

Si "r" = 0, no existe correlacin lineal entre las variables. Aunque podra
existir otro tipo de correlacin (parablica, exponencial, etc.)

De todos modos, aunque el valor de "r" fuera prximo a 1 o -1, tampoco
esto quiere decir obligatoriamente que existe una relacin de causa-efecto
entre las dos variables, ya que este resultado podra haberse debido al
puro azar.

Ejemplo: vamos a calcular el coeficiente de correlacin de la siguiente
serie de datos de altura y peso de los alumnos de una clase de estadstica:

Estatura Peso Estatura Peso Estatura Peso
Alumno
x y
Alumno
x y
Alumno
x y
Alumno
1
1,25 32 Alumno
11
1,25 33 Alumno
21
1,25 33
Alumno
2
1,28 33 Alumno
12
1,28 35 Alumno
22
1,28 34
Alumno
3
1,27 34 Alumno
13
1,27 34 Alumno
23
1,27 34
Alumno
4
1,21 30 Alumno
14
1,21 30 Alumno
24
1,21 31
Alumno
5
1,22 32 Alumno
15
1,22 33 Alumno
25
1,22 32
Alumno
6
1,29 35 Alumno
16
1,29 34 Alumno
26
1,29 34
ESTADSTICA I
117

Estatura Peso Estatura Peso Estatura Peso
Alumno
x y
Alumno
x y
Alumno
x y
Alumno
7
1,30 34 Alumno
17
1,30 35 Alumno
27
1,30 34
Alumno
8
1,24 32 Alumno
18
1,24 32 Alumno
28
1,24 31
Alumno
9
1,27 32 Alumno
19
1,27 33 Alumno
29
1,27 35
Alumno
10
1,29 35 Alumno
20
1,29 33 Alumno
30
1,29 34

Aplicamos la frmula:
( )
( / ) ( , )
r
(( / ) ( , )) (( / ( , ))) ( / )

=

1 30 0 826
1 30 0 02568 1 30 51 366 1 2


Luego, r = 0,719

Por lo tanto, la correlacin existente entre estas dos variables es elevada
(0,7) y de signo positivo.


9.3. REGRESIN LINEAL
Representemos en un grfico los pares de valores de una distribucin
bidimensional: la variable "x" en el eje horizontal o eje de abscisa, y la
variable "y" en el eje vertical, o eje de ordenada. Vemos que la nube de
puntos sigue una tendencia lineal:



El coeficiente de correlacin lineal nos permite determinar si,
efectivamente, existe relacin entre las dos variables. Una vez que se
concluye que s existe relacin, la regresin nos permite definir la recta
que mejor se ajusta a esta nube de puntos.

ESTADSTICA I

118


Una recta viene definida por la siguiente frmula:
y = a + bx

Donde "y" sera la variable dependiente, es decir, aquella que viene
definida a partir de la otra variable "x" (variable independiente). Para
definir la recta hay que determinar los valores de los parmetros "a" y
"b":

El parmetro "a" es el valor que toma la variable dependiente "y",
cuando la variable independiente "x" vale 0, y es el punto donde la recta
cruza el eje vertical.

El parmetro "b" determina la pendiente de la recta, su grado de
inclinacin.

La regresin lineal nos permite calcular el valor de estos dos parmetros,
definiendo la recta que mejor se ajusta a esta nube de puntos.


El parmetro "b" viene determinado por la siguiente frmula:

i i
i
/ n (x xm) (y ym)
b
/ n (x xm)

=

2
1
1


Es la covarianza de las dos variables, dividida por la varianza de la
variable "x".

ESTADSTICA I
119
El parmetro "a" viene determinado por:
a = y - (b * x)

Es la media de la variable "y", menos la media de la variable "x"
multiplicada por el parmetro "b" que hemos calculado.

Ejemplo: vamos a calcular la recta de regresin de la siguiente serie de
datos de altura y peso de los alumnos de una clase de estadstica. Vamos
a considerar que la altura es la variable independiente "x" y que el peso es
la variable dependiente "y" (podamos hacerlo tambin al contrario):


Alumno Estatura Peso Alumno Estatura Peso Alumno Estatura Peso
x x x x x x x x x
Alumno
1
1,25 32 Alumno
11
1,25 33 Alumno
21
1,25 33
Alumno
2
1,28 33 Alumno
12
1,28 35 Alumno
22
1,28 34
Alumno
3
1,27 34 Alumno
13
1,27 34 Alumno
23
1,27 34
Alumno
4
1,21 30 Alumno
14
1,21 30 Alumno
24
1,21 31
Alumno
5
1,22 32 Alumno
15
1,22 33 Alumno
25
1,22 32
Alumno
6
1,29 35 Alumno
16
1,29 34 Alumno
26
1,29 34
Alumno
7
1,30 34 Alumno
17
1,30 35 Alumno
27
1,30 34
Alumno
8
1,24 32 Alumno
18
1,24 32 Alumno
28
1,24 31
Alumno
9
1,27 32 Alumno
19
1,27 33 Alumno
29
1,27 35
Alumno
10
1,29 35 Alumno
20
1,29 33 Alumno
30
1,29 34

El parmetro "b" viene determinado por:
( / ) ,
b ,
( / ) ,

= =

1 30 1 034
40 265
1 30 0 00856


Y el parmetro "a" por:
a = 33,1 - (40,265 * 1,262) = -17,714

ESTADSTICA I

120
Por lo tanto, la recta que mejor se ajusta a esta serie de datos es:
y = -17,714 + (40,265 * x)

Esta recta define un valor de la variable dependiente (peso), para cada
valor de la variable independiente (estatura):

Estatura Peso
x x
1,20 30,6
1,21 31,0
1,22 31,4
1,23 31,8
1,24 32,2
1,25 32,6
1,26 33,0
1,27 33,4
1,28 33,8
1,29 34,2
1,30 34,6


EJERCICIOS
1) Qu es un diagrama de dispersin?

2) Porqu son importantes los diagramas de dispersin?

3) Interprete cada uno de los siguientes coeficientes de correlacin:
a) r = - 1.00
b) r = 0
c) r = 0.85
d) r = - 0.20

4) La Directora de Investigacin y Desarrollo de Vernica de France, debe
defender la peticin que hizo sobre un presupuesto necesario para
aumentar los fondos. Obtuvo una muestra de ocho compaas
farmaceticas y recogi los siguientes datos:

ESTADSTICA I
121

Compaa
Ganancia
anual(millones de
soles), y
Investigacin y
Desarrollo(millones
de soles), x
1
2
3
4
5
6
7
8
25
30
20
50
40
60
50
35
5
7
4
10
8
12
6
11

a) Bosqueje un diagrama de dispersin.
b) Qu tipo de relacin existe entre estas 2 variables?
c) Estime el coeficiente de correlacin
d) Calcule el coeficiente de correlacin

5) El Presidente de la compaa Brow Boveri, piensa que el tiempo de un
vendedor pasa con un cliente debe tener una relacin positiva con el
monto de lo que compra el cliente. Para ver si esta relacin existe, rene
los siguientes datos muestrales:

Cliente Monto de la cuenta, y Minutos que pasan, x
1
2
3
4
5
6
7
8
9
$ 1056
825
651
748
894
1242
1058
112
1259
108
132
64
95
59
132
85
77
124

a) Bosqueje un diagrama de dispersin
b) Qu tipo de relacin existe entre estas 2 variables?
c) Calcule el coeficiente de correlacin

6) El Supervisor de mantenimiento de trnsito de la Municipalidad de Lima,
debe determinar si existe una relacin positiva entre el costo anual de
mantenimiento de los autobuses urbanos y los aos que llevan en
operacin. Si existe tal relacin, James cree que puede hacer mejores
pronsticos de presupuesto.Para ello recoge los siguientes datos:
ESTADSTICA I

122
Autobs
Costo de Mantenimiento($),
y
Tiempo en operacin(aos),
x
1
2
3
4
5
6
7
8
9
857
680
475
700
1054
256
310
635
1038
8
6
4
8
12
3
2
7
11

a) Bosqueje un diagrama de dispersin.
b) Qu tipo de relacin existe entre estas 2 variables?
c) Calcule el coeficiente de correlacin.
d) Determine la ecuacin del anlisis de regresin muestral.
e) Calcule el costo de mantenimiento anual para un autobs con 5 aos
de operacin.

7) La Gerente de supermercados Metro desea pronosticar las ventas
semanales de los libros de bolsillo; para ello se basa en la cantidad de
espacio en las repisas(en metros) que se le proporciona. Ella rene una
muestra de 11 semanas:

Semana
Nmero de libros vendidos,
y
Metros de espacio en repisa,
x
1
2
3
4
5
6
7
8
9
10
11
278
140
160
195
210
165
240
290
130
268
220
6.2
3.4
4.2
4.3
4.7
3.8
4.9
7.5
3.2
3.8
3.1

a) Bosqueje un diagrama de dispersin.
b) Qu tipo de relacin existe entre estas 2 variables?
c) Calcule el coeficiente de correlacin.
d) Determine la ecuacin de regresin muestral.
ESTADSTICA I
123
e) Estime las ventas de libros de bolsillo para una semana en la que se
proporcionan 4 metros de espacio en las repisas.

8) Rosa Mara es propietaria de una cadena de tiendas de helados en
Chiclayo. Est tratando de encontrar alguna variable que tenga una
relacin positiva con las ventas diarias y decide investigar la temperatura
ambiental promedio. Para ello recoge datos para una muestra aleatoria de
10 das:

Da Ventas diarias(litros), y Temperatura promedio(F), x
1
2
3
4
5
6
7
8
9
10
110
125
135
150
91
185
206
194
138
169
72
78
86
90
68
96
102
100
84
90

a) Bosqueje un diagrama de dispersin.
b) Qu tipo de relacin existe entre estas 2 variables?
c) Calcule el coeficiente de correlacin.
d) Determine la ecuacin de regresin muestral.
e) Interprete la pendiente o coeficiente de regresin
f) Calcule el residual para el primer da.

9) Cul es la diferencia entre el anlisis de correlacin y el anlisis de
regresin?

10) Para el siguiente conjunto de datos:
y: 10 15 30 25 30 35 40
x: 6 8 10 12 14 16 18

a) Represente los datos en un diagrama de dispersin
b) Calcule el coeficiente de correlacin

11) Para el siguiente conjunto de datos:
y : 90 80 70 60 50 40 30
x : 20 24 28 32 36 40 44
a) Represente los datos en un diagrama de dispersin
b) Calcule la ecuacin de regresin muestral
ESTADSTICA I

124

12) Para el siguiente conjunto de datos:
y : 13 18 19 23 17 12 22 27
x : 5 8 8 10 7 7 11 13
a) Represente los datos en un diagrama de dispersin
b) Calcule la ecuacin de regresin muestral
c) Calcule una estimacin puntual para un valor de x de 11.

13) Se pidi a Jos Angel Gustavo, que determinara si existe una relacin
lineal entre el consumo de electricidad y el nmero de cuartos en una
vivienda unifamiliar. Como el consumo de electricidad vara de un mes a
otro, l decide estudiar el mes de Enero.Para ello recoge los siguientes
datos:

Casa Kilovatios-hora(miles), y Nmero de cuartos, x
1
2
3
4
5
6
7
8
9
10
11
12
8
7
9
5
7
5
8
9
4
6
8
8
14
11
16
8
9
6
7
9
5
7
15
6

Escriba un informe en el que analice la relacin entre estas variables.

14) Se desea analizar el comportamiento de las variables: Grado de
instruccin (x) y regin de procedencia (Y) de los empleados del
Ministerio de Agricultura. Los datos estn en la siguiente tala:

DISTRIBUCIN CONJUNTA DE LAS FRECUENCIAS DE LAS VARIABLES GRADO DE
INSTRUCCIN (X) Y REGIN DE PROCEDENCIA (Y)

Prim.Compl. Secund.Comp. Superior Total
Costa 40 30 20 90
Sierra 35 15 10 60
Selva 30 15 5 50
Total 105 60 35 200
Fuente: Datos hipotticos
ESTADSTICA I
125
Se pide;
a.- Interpretar los datos.
b.- Expresar en frecuencias relativas porcentuales respecto al total
c.- Expresar en frecuencias relativas porcentuales respecto al total de
las columnas
d.- Expresar en frecuencias relativas porcentuales respecto al total de
las filas.

15) En el departamento de ICA se observo el precio del vino y la cantidad de
produccin durante algunos aos obtenindose la siguiente tabla:

X 35 30 40 45 48 60 50 44 54 56 42 46
Y 100 150 120 200 160 200 150 200 120 150 100 120

Donde X el precio en S/. e Y es la cantidad en miles de litros.
Consideraremos la variable X agrupada en 5 intervalos de TIC constante.
Se pide
a.-Construir la tabla bidimensional
b.-Las distribuciones Marginales
C.-Medias y varianzas marginales
d.-La covarianza

16) Una Universidad investiga para verificar la tendencia de los alumnos en
continuar sus estudios, segn la clase social del encuestado, mostr el
siguiente:

Clase social
vs
Pretender continuar
sus estudios
ALTA MEDIA BAJA TOTAL
SI 200 220 380 800
NO 200 380 620 1200

a) De una medida cuantificadora de dependencia. Existe dependencia
entre las variables nominales Clase Social y Pretender continuar sus
estudios?
b) Si de los 400 alumnos de la clase Alta, 160 escogen continuar, y 240
no. Ud. cambiara sus conclusiones? Justifique su respuesta.

17) El ministerio de salud mando ha realizar una encuesta en la localidad del
Cercado de Lima a cerca de los costos y ventas en miles de soles.
Aleatoria mente escogi 12 farmacias de la jurisdiccin y se obtuvo los
siguientes datos:
ESTADSTICA I

126

COSTOS VENTAS
11 19
10 15
14 20
13 14
12 16
20 33
21 32
15 18
22 29
18 22
19 23
16 20

a) Construir el diagrama de dispersin y comentar
b) Hallar r y el coeficiente de determinacin defina e interprete c/u de
ellos
c) Graficar la recta de regresin mediante la ecuacin estimada.
d) Predecir las ventas para un costo de 30 mil soles

18) Una muestra de 5 varones adultos de quienes se observan las estaturas (X
en pies, pulgadas) y los pesos (Y en libras) ha dado los siguientes
resultados:

X 5 11 5 2 5 3 5 4 5 5
Y 125 130 140 145 160

a) Realice una regresin lineal y utilice los datos para verificar que la
varianza total de Y es igual a la varianza residual mas la varianza
explicada por la tarea de regresin.
b) Que peso tendr aquella persona que mide 1,70 mt.


ESTADSTICA I
127
19) Se tiene la siguiente informacin:

PERU: EXPORTACION: FOB SEGN TIPO DE PRODUCTO: 1990 -1998
(MILLONES DE US$ DOLARES)

TIPO DE
PRODUCTO

1990 1991 1992 1993 1994 1995 1996 1997 1998
MINEROS

1204 1041 1219 1205 1548 1446 1474 1649 1432
AGRICOLAS

206 336 177 167 239 175 210 115 77
PESQUEROS

118 206 223 357 410 336 468 440 542
NO
TRADICIONALES

714 645 709 747 979 966 951 1013 1130
TOTAL

2738 2531 2661 2691 3488 3231 3329 3484 3464
FUENTE: BANCO CENTRAL DE RESERVA

Hallar :
a) Grafique el diagrama de dispersin
b) La recta de regresin de cada uno de los tipos de producto,
incluyendo el total. Realice un anlisis y grafique.
c) Haga un pronostico por tipo de producto, inclusive el total para el ao
2005.

20) Los gastos publicitarios y volmenes de ventas de una compaa elegidas
al azar durante los 10 meses. Estn dados en los siguientes:


MES 1 2 3 4 5 6 7 8 9 10
GASTOS DE
PUBLICIDAD
x S/. 10000
1.2 08 1.0 1.3 07 08 1.0 06 09 1.10
VALOR DE
VENTAS
y S/. 10000
101 92 110 120 90 82 93 75 91 105



ESTADSTICA I

128
a) Hacer el diagrama de dispersin
b) Hallar la recta de regresin Y en X y grafique
c) Hallar r y r, interpretarlo.
d) Pronostique el volumen de ventas para s/. 2500
e) Halle el error estndar y grafique.


21) Se tiene la siguiente tabla:
a) Determine la recta de tendencia de la serie cronolgica del numero
de postulantes a las Universidades del Per durante el periodo 1988
2005
b) Grafique el diagrama de dispersin.
c) Graficar la recta obtenida y estimar mediante la unin el numero de
postulantes para el ao 2005.
d) Hallar el error estndar de estimacin. Elaborar un intervalo de
confianza para (y Syx) interprete?

AOS (X) 1998 1999 2000 2001 2002 2003 2004 2005 1996 1997 1998
PERSONAS
(Y)
79500 102540 124580 142950 140640 172070 172600 204890 227180 245740 266860
FUENTE: DIRECCION DE PLANIFICACION UNIVERSITARIA. DPTO DE ESTADISTICA E INFORMATICA.
NOV. 1997

22) El numero de artculos defectuosos producidos por unidad de tiempo (Y)
por cierta maquina. Se considera que vara directamente con la velocidad
de la maq. (X) medida en r.p.m. observaciones de 12 horas escogidas al
azar de un mes dan los siguientes resultados.

X 13.2 14.9 8.1 10.2 15.8 12.0 10.9 17.4 13.8 16.4 13.1 10.8
Y 9.4 12.2 6.0 7.0 9.0 7.0 5.7 12.3 9.2 11.4 9.6 7.5

a) Construya un diagrama de dispersin y sobre x
b) Verifique que este conjunto de datos da una estimacin de la ecuacin
de regresin:

= -0.59964 + 0.7245 Xi

c) De una interpretacin bo y b1 acabados de obtener e indique Si b es
de importancia practica aqu.
d) Interpreta r y r
e) Trace la grafica de la ecuacin estimada.

ESTADSTICA I
129
23) La siguiente muestra contiene el precio y la cantidad suministrada de un
artculo. Use la cantidad como la variable dependiente en este caso.

PRECIO (X) 25 20 35 40 60 55 45 15 20 30 40 50 70 45
CANTIDAD 60 85 110 95 140 160 80 40 55 90 115 120 180 95

a) Construya un diagrama de dispersin Y en Xi
b) Halle la ecuacin de regresin lineal
c) Interprete r y r
d) Halle la ecuacin X en Y

24) En un estudio de la relacin entre ingresos mensuales y gastos de una
educacin de las familias, una muestra proporciono un coeficiente de
determinacin de 90.25% Sus medidas respectivas de $420 y $ 120
SCX=100 SCY= 49 segn este estudio.
a) En cuanto se estima los gastos por educacin de una familia cuyo
ingreso mensual es de $500?
b) Si una familia estima un gasto por educacin en $370 Cunto
debera ser su ingreso mensual?

25) Suponga que de una muestra de 22 observaciones aleatorias de los
precios X e Y de dos artculos sustituidos se encuentran:

X = 15.4; Y =18.2; SCY = 50

^ ^
Y = 25.13 0.45 X ; X = 52.164 2.02 Y
a.-Hallar e interpretar el valor del coeficiente de determinacin.
b.-Halle e interprete el valor del coeficiente de correlacin
c.-Interpretar o.45 y 52.164.

26) Si para una muestra de 21 observaciones se obtiene:
^ ^
Y = 33.4 1.4X ; X =20.84375 0.546875Y ; XY =4123
Con estos datos hallar:
a.-Hallar el coeficiente de determinacin
b.-Hallar el promedio de las dos variables
c.-Hallar SCX y SCY


ESTADSTICA I

130
ESTADSTICA I
131
Bibliografa




1. AVILA ACOSTA, Roberto
Estadstica Elemental. Lima Per, 2000

2. AYONA LEON, Moiss
Lima, Editorial Bellavista, 1999

3. FERNANDEZ CHAVESTA, Jos y FERNANDEZ Juan
Estadstica Aplicada I-Tcnicas para la Investigacin
Editorial San Marcos EIRL. Lima, Per. 2007

4. GARCA OR, Celestino
Estadstica y Probabilidades (Parte I)
Lima-Per. Universidad Nacional de Ingeniera. 2000

5. HANK, Jhon E. y REITSCH Arthur G
Estadstica para Negocios. 2da Edicin
McGraw-Hill 1997.

6. LEVIN, RICHARD J.
Estadstica para Administradores. Mxico, Editorial Prentice may
Hispanoamericana S.A. 2001

7. MITAC MEZA MXIMO
1997 Estadstica y probabilidades Editorial San Marcos