Anda di halaman 1dari 152

UNIVERSIDAD PRIVADA TELESUP

ESTADSTICA
GENERAL

Pedro Echeverra Bardales Pgina 1


UNIVERSIDAD PRIVADA TELESUP
NDICE DE CONTENIDO
I. PREFACIO 3
II. DESARROLLO DE LOS CONTENIDOS 4-
UNIDAD DE APRENDIZAJE 1: INTRODUCCIN A LA ESTADSTICA 5-43
1. Introduccin 5
a. Presentacin y contextualizacin 5
b. Competencia (logro) 5
c. Capacidades 5
d. Actitudes 5
e. Ideas bsicas y contenido 5
2. Desarrollo de los temas 6-39
a. Tema 01: La Estadstica 7
b. Tema 02: Etapas del Mtodo Estadstico 13
c. Tema 03: Tabla de distribucin de frecuencias 20
d. Tema 04: Representacin Grfica 31
3. Lecturas recomendadas 40
4. Actividades y ejercicios 40
5. Autoevaluacin 41
6. Resumen 43
UNIDAD DE APRENDIZAJE 2: MEDIDAS DE TENDENCIA, DISPERSIN Y FORMA 44-76
1. Introduccin 45
a. Presentacin y contextualizacin 45
b. Competencia (logro) 45
c. Capacidades 45
d. Actitudes 45
e. Ideas bsicas y contenido 45
2. Desarrollo de los temas 46-72
a. Tema 01: Medidas de Tendencia Central 47
b. Tema 02: Percentiles 59
c. Tema 03: Medidas de Dispersin 64
d. Tema 04: Medidas de Formas 70
3. Lecturas recomendadas 73
4. Actividades y ejercicios 73
5. Autoevaluacin 74
6. Resumen 76
UNIDAD DE APRENDIZAJE 3: LA CORRELACIN Y LA REGRESIN 77-104
1. Introduccin 78
a. Presentacin y contextualizacin 78
b. Competencia (logro) 78
c. Capacidades 78
d. Actitudes 78
e. Ideas bsicas y contenido 78
2. Desarrollo de los temas 79-99
a. Tema 01: Tablas de doble entrada 80
b. Tema 02: Correlacin 85
c. Tema 03: Regresin lineal Ajuste Rectilineo 92
d. Tema 04: Regresin lineal Ajuste Parablico 97
3. Lecturas recomendadas 100
4. Actividades y ejercicios 100
5. Autoevaluacin 101
6. Resumen 104
UNIDAD DE APRENDIZAJE 4: NMEROS E NDICES Y SERIES DE TIEMPO 105-148
1. Introduccin 106
a. Presentacin y contextualizacin 106
b. Competencia 106
c. Capacidades 106
d. Actitudes 106
e. Ideas bsicas y contenido 106
2. Desarrollo de los temas 107-143
a. Tema 01: Tasas 108
b. Tema 02: ndices 112
c. Tema 03: Series 120
d. Tema 04: Manejo de componentes 127
3. Lecturas recomendadas 144
4. Actividades y ejercicios 144
5. Autoevaluacin 145
6. Resumen 148
III. GLOSARIO 149
IV. FUENTES DE INFORMACIN 151
V. SOLUCIONARIO 152

ESTADSTICA GENERAL Pgina 2


UNIVERSIDAD PRIVADA TELESUP
PREFACIO
Curso de formacin bsica de naturaleza terico-prctico, est diseado para
impartir conocimientos relacionados con los fundamentos de la estadstica y sus
aplicaciones en la solucin de problemas prcticos, as como con la utilizacin de
axiomas y teoremas en situaciones reales.
Los estudiantes que adquieran una base slida de estadstica, estarn en
condiciones de enfrentar en la prctica y en la investigacin, situaciones
relacionadas con la toma de decisiones oportunas, el desarrollo e implementacin
de cambios cuantitativos y cualitativos tendientes a mejorar el rendimiento, as
como brindar servicios de asesora, consultora informacin especializada .
Se exige al alumno el desarrollo de las actividades y ejercicios, adems de la
resolucin de la autoevaluacin.
Comprende cuatro unidades de aprendizaje: I Introduccin a la Estadstica. II
Medidas de Tendencia, Dispersin y Forma. III. La Correlacin y la
Regresin. IV. Nmeros e ndices y Series de Tiempo.

UNIDAD DE APRENDIZAJE I: INTRODUCCIN A LA ESTADSTICA

La Estadstica Etapas del Mtodo Tabla de distribucin Representacin


Estadstico de frecuencias Grfica

UNIDAD DE APRENDIZAJE II: MEDIDAS DE TENDENCIA, DISPERSIN


Y FORMA
Medidas de Medidas de
Percentiles Medidas de Formas
Tendencia Central Dispersin

UNIDAD DE APRENDIZA III: LA CORRELACIN Y LA REGRESIN


Tablas de doble Regresin lineal Regresin lineal
Correlacin
entrada Ajuste Rectilineo Ajuste Parablico

UNIDAD DE APRENDIZAJE IV: NMEROS E NDICES Y SERIES DE


TIEMPO
Manejo de
Tasas ndices Series
componentes

La competencia que como estudiante debes lograr al finalizar esta asignatura es:
Aplica e interpreta instrumentos estadsticos en la construccin de nuevos
conocimientos y toma de decisiones generando la construccin del
pensamiento crtico en el entendimiento del desarrollo de la sociedad, el
individuo y la naturaleza que lo rodea.

ESTADSTICA GENERAL Pgina 3


UNIVERSIDAD PRIVADA TELESUP
UNIDAD DE
APRENDIZAJE

INTRODUCCIN A LA ESTADSTICA

COMPETENCIA:

Al finalizar esta unidad usted ser capaz de


Comprender el marco conceptual de la estadstica
y sus aplicaciones en las ciencias sociales y
biolgicas mostrando adecuadamente los datos
ESTADSTICA GENERAL Pgina 4
mediante tablas y grficos.
.
UNIVERSIDAD PRIVADA TELESUP
1. INTRODUCCIN

a) Presentacin y contextualizacin

Cada cinco aos los peruanos padecen la ansiedad derivada de la eleccin


presidencial, con varios meses de anticipacin los medios de informacin
comunican a travs de cuadros y grficos las preferencias electorales que con
cierto margen de error nos permiten predecir los resultados finales, en esta
unidad entenderemos la razn de ser de esta ciencia denominada estadstica y
sus elementos bsicos de presentacin de datos, tablas y grficos,
b) Competencia.

Comprende el marco conceptual de la estadstica y sus aplicaciones en las


ciencias sociales y biolgicas mostrando adecuadamente los datos mediante
tablas y grficos.

c) Capacidades

1. Conceptualiza la estadstica con la lectura del tema y haciendo uso de sus


experiencias previas cercanas a esta ciencia
2. Identifica el mtodo cientfico y ubica la estadstica en el proceso de
construccin de nuevo conocimiento
3. Construye tablas de distribucin de frecuencia que permitan procesar
adecuadamente los datos.
4. Elabora grficos que presenten la informacin previamente procesadas en
las tablas de distribucin de frecuencias.
d) Actitudes

Valora la ciencia de la estadstica


Mejora la redaccin de documento cientficos
Muestra rigurosidad para representar relaciones, plantear argumentos y
comunicar resultados
e) Presentacin de ideas bsicas y contenido esenciales de la Unidad.

La Unidad de Aprendizaje 1 comprende el desarrollo de los siguientes


temas:
Tema01: La Estadstica.
Tema02: Etapas del Mtodo Estadstico.
Tema03: Tabla de Distribucin de Frecuencias.
Tema04: Representacin Grfica.

ESTADSTICA GENERAL Pgina 5


UNIVERSIDAD PRIVADA TELESUP

TEMA

La Estadstica

ESTADSTICA GENERAL
campus.utelesup.com Pgina 6
UNIVERSIDAD PRIVADA TELESUP
1. DESARROLLO DE CONTENIDOS

TEMA 01: LA ESTADSTICA


1. IMPORTANCIA

En las ltimas dcadas la estadstica ha


alcanzado un alto grado de desarrollo, hasta
el punto de incursionar en la totalidad de las
ciencias; inclusive, en la lingstica se
aplican tcnicas estadsticas para
esclarecer la paternidad de un escrito o los
caracteres ms relevantes de un idioma.

La estadstica es una ciencia auxiliar para todas las ramas del saber; su
utilidad se entiende mejor si tenemos en cuenta que los quehaceres y
decisiones diarias embargan cierto grado de incertidumbre... y la Estadstica
ayuda en la incertidumbre, trabaja con ella y nos orienta para tomar las
decisiones con un determinado grado de confianza.

Los crticos de la estadstica afirman que a travs de


ella es posible probar cualquier cosa, lo cual es un
concepto profano que se deriva de la ignorancia en
este campo y de lo polifactico de los mtodos
estadsticos. Sin embargo muchos "investigadores"
tendenciosos han cometido abusos con la
estadstica, elaborando "investigaciones" de
intencin, teniendo previamente los resultados que
les interesan mostrar a personas ingenuas y
desconocedoras de los hechos.

Otros, por ignorancia o negligencia, abusan de la


estadstica utilizando modelos inapropiados o
razonamientos ilgicos y errneos que conducen al
rotundo fracaso de sus investigaciones.

ESTADSTICA GENERAL Pgina 7


UNIVERSIDAD PRIVADA TELESUP
Lincoln L. Chao* hace referencia a uno de los ms
estruendosos fracasos, debido a los abusos en la
toma de una muestra: Se trata del error cometido por
la Literary Digest que, en sus pronsticos para las
elecciones presidenciales en EE.UU. para 1936, afirm
que Franklin D. Roosvelt obtendra 161 votos
electorales y Alfred Landon, 370. La realidad mostr a
Roosvelt con 523 votos y a Landon con 8 solamente.

El error se debi a que la muestra fue tomada


telefnicamente a partir de la lista de suscriptores de
la Digest y, en 1936, las personas que se daban el lujo
de tener telfonos y suscripciones a revistas no
configuraban una muestra representativa de los
votantes de EE.UU. y, por ende, no poda hacerse un
pronstico confiable con tan sesgada informacin.

1. DEFINICIN
Definir la estadstica es una tarea difcil porque tendramos que definir cada
una de las tcnicas que se emplean en los diferentes campos en los que
interviene. Sin embargo, diremos, en forma general, que la estadstica es un
conjunto de tcnicas que, partiendo de la observacin de fenmenos,
permiten al investigador obtener conclusiones tiles sobre ellos.

2. DIVISIN

La estadstica se divide en dos grandes ramas de


estudio que son: La estadstica descriptiva, la cual se
encarga de la recoleccin, clasificacin y descripcin de
datos mustrales o poblacionales, para su interpretacin
y anlisis, que es de la que nos ocuparemos en este
curso; y la estadstica matemtica o inferencial, que
desarrolla modelos tericos que se ajusten a una
determinada realidad con cierto grado de confianza.

ESTADSTICA GENERAL Pgina 8


UNIVERSIDAD PRIVADA TELESUP

Estas dos ramas no son independientes; por el contrario, son complementarias y


entre ambas dan la suficiente ilustracin sobre una posible realidad futura, con el
fin de que quien tenga poder de decisin, tome las medidas necesarias para
transformar ese futuro o para mantener las condiciones existentes.

3. ETAPAS DE DESARROLLO DE LA ESTADSTICA

La historia de la estadstica est resumida en tres grandes etapas o fases

A) LOS CENSOS:

Desde el momento en que se constituye una autoridad poltica, la idea de


inventariar de una forma ms o menos regular la poblacin y las riquezas
existentes en el territorio est ligada la conciencia de soberana y con los
primeros esfuerzos administrativos. Los comienzos de la estadstica
pueden ser hallados en el antiguo Egipto, cuyos faraones lograron
recopilar, hacia el ao 3050 antes de Cristo, prolijos datos relativos a la
poblacin y a la riqueza del pas. De acuerdo con el historiador griego
Herdoto, dicho registro de riqueza y de poblacin se hizo con el objetivo
de preparar la construccin de las pirmides. Pero fueron los romanos,
maestros de la organizacin poltica, quienes mejor supieron emplear los
recursos de la estadstica. Cada cinco aos realizaban
un censo de la poblacin y sus funcionarios pblicos
tenan la obligacin de anotar nacimientos,
defunciones y matrimonios, sin olvidar los recuentos
peridicos del ganado y de las riquezas contenidas en
las tierras conquistadas. Cuando naci Cristo suceda
uno de estos empadronamientos de la poblacin bajo
la autoridad del Imperio.

Durante los mil aos siguientes a la cada del Imperio romano, se realizaron muy
pocas operaciones Estadsticas y aunque Carlomagno, en Francia; y Guillermo,
el Conquistador, en Inglaterra, trataron de revivir la tcnica romana, los mtodos
estadsticos permanecieron casi olvidados durante la Edad Media.

ESTADSTICA GENERAL Pgina 9


UNIVERSIDAD PRIVADA TELESUP
B) DE LA DESCRIPCIN A LA ARITMTICA POLTICA:

Durante los siglos XV, XVI y XVII, hombres como Leonardo da Vine,
Nicols Coprnico, Galileo, Neper, William Harvey, Sir Francis Bacon y
Ren Descartes hicieron grandes aportes al mtodo cientfico, de tal forma
que cuando se crearon los Estados Nacionales y surgi como fuerza el
comercio internacional exista ya un mtodo capaz de aplicarse a los datos
econmicos.

Las ideas mercantilistas entraan una intensificacin de este tipo de investigacin.


Colbert multiplica las encuestas sobre artculos manufacturados, el comercio y la
poblacin. Vauban, quien hace la primera propuesta de un impuesto sobre los
ingresos, se seala como el verdadero precursor de los sondeos. La
escuela inglesa proporciona un nuevo progreso al superar la fase
puramente descriptiva. Uno de sus principales exponentes Petty es autor
de la famosa Aritmtica Poltica. Chaptal, ministro del interior francs,
publica, en 1801, el primer censo general de poblacin y desarrolla
estudios industriales, de las producciones y de los cambios, los cuales
se hicieron sistemticos durantes las dos terceras partes del siglo XIX.

C) ESTADSTICA Y CLCULO DE PROBABILIDADES:

Durante el siglo XVII y principios del XVIII, matemticos como Bernoulli,


Francis Maseres, Lagrange y Laplace desarrollaron la teora de
probabilidades. No obstante, durante cierto tiempo, la teora de las
probabilidades limit su aplicacin a los juegos de azar y hasta el siglo
XVIII no comenz a aplicarse a los grandes problemas cientficos.

El clculo de probabilidades se incorpora, rpidamente, como un instrumento


de anlisis extremadamente poderoso para el estudio de los fenmenos
econmicos y sociales y, en general, para el estudio de fenmenos "cuyas
causas son demasiado complejas para conocerlas totalmente y hacer posible
su anlisis".

ESTADSTICA GENERAL Pgina 10


UNIVERSIDAD PRIVADA TELESUP
Godofredo Achenwall, profesor de la Universidad de Gotinga, acu, en 1760, la
palabra estadstica, que extrajo del trmino italiano statista (estadista). Crea, y con
sobrada razn, que los datos de la nueva ciencia seran el aliado ms eficaz del
gobernante consciente.

D) POBLACIN, ELEMENTOS Y CARACTERES.

Es obvio que todo estudio estadstico ha de estar referido a un conjunto o


coleccin de personas o cosas. Este conjunto de personas o cosas es lo que
denominaremos poblacin.

Poblacin: conjunto de todos los individuos (personas, objetos, animales, etc.)


que porten informacin sobre el fenmeno que se estudia. Por ejemplo, si
estudiamos el precio de la vivienda en una ciudad, la poblacin ser el total de las
viviendas de dicha ciudad.

Individuo: Cualquier elemento que porte informacin sobre el fenmeno que se


estudia. As, si estudiamos la altura de los nios de una clase, cada alumno es un
individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo.

Las personas o cosas que forman parte de la poblacin se


denominan elementos. En sentido estadstico un elemento
puede ser algo con existencia real, como un automvil o
una casa, o algo ms abstracto como la temperatura, un
voto, o un intervalo de tiempo.

A su vez, cada elemento de la poblacin tiene una serie de caractersticas que


pueden ser objeto del estudio estadstico. As por ejemplo si consideramos como
elemento a una persona, podemos distinguir en ella los siguientes caracteres:

Sexo Peso
Edad Altura
Nivel de estudios Color de pelo, Etc.
Profesin

ESTADSTICA GENERAL Pgina 11


UNIVERSIDAD PRIVADA TELESUP

Luego por tanto de cada elemento de la poblacin podremos estudiar uno o


ms aspectos cualidades o caracteres.

La poblacin puede ser segn su tamao de dos tipos:

Poblacin finita: Cuando el nmero de elementos que la forman es finito, por


ejemplo el nmero de alumnos de un centro de enseanza, o grupo clase.

Poblacin infinita: Cuando el nmero de elementos que la forman es infinito, o


tan grande que pudiesen considerarse infinitos, como por ejemplo si se realizase
un estudio sobre los productos que hay en el mercado, hay tantos y de tantas
calidades que esta poblacin podra considerarse infinita.

Ahora bien, normalmente en un estudio estadstico,


no se puede trabajar con todos los elementos de la
poblacin sino que se realiza sobre un subconjunto
de la misma. Este subconjunto puede ser una
muestra, cuando se toman un determinado nmero
de elementos de la poblacin, sin que en principio
tengan nada en comn; o una subpoblacin, que es
el subconjunto de la poblacin
formado por los elementos de la
poblacin que comparten una
determinada caracterstica, por ejemplo de los alumnos del
centro educativo, la subpoblacin formada por los alumnos
de 3 secundaria, eso, o la sub poblacin de los varones.

Muestra: Subconjunto que seleccionamos de la poblacin. As, si se estudia el


precio de la vivienda de una ciudad, lo normal ser no recoger informacin sobre
todas las viviendas de la ciudad (sera una labor muy compleja), sino que se suele
seleccionar un subgrupo (muestra) que se entienda que es suficientemente
representativo.

Pedro Echeverra Bardales Pgina 12


UNIVERSIDAD PRIVADA TELESUP

TEMA

Etapas del
Mtodo
Estadstico

ESTADSTICA GENERAL Pgina 13


UNIVERSIDAD PRIVADA TELESUP

TEMA 02: ETAPAS DEL MTODO ESTADSTICO

1. IMPORTANCIA

El mtodo estadstico, parte de la observacin de un fenmeno, y como no puede


siempre mantener las mismas condiciones predeterminadas o a voluntad del
investigador, deja que acten libremente, pero se registran las diferentes
observaciones y se analizan sus variaciones.

Para el planeamiento de una investigacin, por norma general, se siguen las


siguientes etapas:

2. PLANTEAMIENTO DEL PROBLEMA

Al abordar una investigacin se debe tener bien definido qu se va a investigar y por


qu se pretende estudiar algo. Es decir, se debe establecer una delimitacin clara,
concreta e inteligible sobre el o los fenmenos que se pretenden estudiar, para lo cual
se deben tener en cuenta, entre otras cosas, la revisin bibliogrfica del tema, para ver
su accesibilidad y consultar los resultados obtenidos por investigaciones similares,
someter nuestras proposiciones bsicas a un anlisis lgico; es decir, se debe hacer
una ubicacin histrica y terica del problema.

3. FIJACIN DE LOS OBJETIVOS

Luego de tener claro lo que se pretende investigar, Debemos presupuestar hasta


dnde queremos llegar; en otras palabras, debemos fijar cuales son nuestras metas y
objetivos. Estos deben plantearse de tal forma que no haya lugar a confusiones o
ambigedades y debe, adems, establecerse diferenciacin entre lo de corto, mediano
y largo plazo, as como entre los objetivos generales y los especficos.

4. FORMULACIN DE LAS HIPTESIS

Una hiptesis es ante todo, una explicacin provisional de los hechos objeto de
estudio, y su formulacin depende del conocimiento que el investigador posea sobre la
poblacin investigada. Una hiptesis estadstica debe ser susceptible de docimar, esto
es, debe poderse probar para su aceptacin o rechazo.

ESTADSTICA GENERAL Pgina 14


UNIVERSIDAD PRIVADA TELESUP
Una hiptesis que se formula acerca de un parmetro (media, proporcin, varianza,
etc.), con el propsito de rechazarla, se llama Hiptesis de Nulidad y se representa por
Ho; a su hiptesis contraria se le llama Hiptesis Alternativa (H1).

5. DEFINICIN DE LA UNIDAD DE OBSERVACIN Y DE LA UNIDAD DE MEDIDA

La Unidad de Observacin, entendida como cada uno de los elementos constituyentes


de la poblacin estudiada, debe definirse previamente, resaltando todas sus
caractersticas; pues, al fin de cuentas, es a ellas a las que se les har la medicin.
La unidad de observacin puede estar constituida por uno o varios individuos u objetos
y denominarse respectivamente simple o compleja.

El criterio sobre la unidad de medicin debe


ser previamente definido y unificado por todo
el equipo de investigacin. Si se trata de
medidas de longitud, volumen, peso, etc.,
debe establecerse bajo qu unidad se
tomarn las observaciones ya sea en metros,
pulgadas, libras, kilogramos, etc.

Asociado a la unidad de medida, deben establecerse los criterios sobre las


condiciones en las cuales se ha de efectuar la toma de la informacin.

6. DETERMINACIN DE LA POBLACIN Y DE LA MUESTRA

Estadsticamente, la poblacin se define como un conjunto de individuos o de objetos


que poseen una o varias caractersticas comunes. No se refiere esta definicin
nicamente a los seres vivientes; una poblacin puede estar constituida por los
habitantes de un pas o por los peces de un estanque, as como por los
establecimientos comerciales de un barrio o las unidades de vivienda de una ciudad.

Existen desde el punto de vista de su


manejabilidad poblaciones finitas e infinitas. Aqu
el trmino infinito no est siendo tomado con el
rigor semntico de la palabra; por ejemplo, los
peces dentro de un estanque son un conjunto
finito; sin embargo, en trminos estadsticos,
puede ser considerado como infinito.

ESTADSTICA GENERAL Pgina 15


UNIVERSIDAD PRIVADA TELESUP
Muestra es un subconjunto de la poblacin a la cual se le efecta la medicin
con el fin de estudiar las propiedades del conjunto del cual es obtenida.

En la prctica, estudiar todos y cada uno de los elementos que conforman la poblacin
no es aconsejable, ya sea por la poca disponibilidad de recursos, por la homogeneidad
de sus elementos, porque a veces es necesario destruir lo que se est midiendo, por
ser demasiado grande el nmero de sus
componentes o no se pueden controlar; por eso se
recurre al anlisis de los elementos de una muestra
con el fin de hacer inferencias respecto al total de la
poblacin. Existen diversos mtodos para calcular el
tamao de la muestra y tambin para tomar los
elementos que la conforman, pero no es el objetivo
de este curso estudiarlos. Diremos solamente que la
muestra debe ser representativa de la poblacin y
sus elementos escogidos al azar para asegurar la
objetividad de la investigacin.

7. LA RECOLECCIN

Una de las etapas ms importantes de la investigacin es la recoleccin de la


informacin, la cual ha de partir, a menos que se tenga experiencia con muestras
anlogas, de una o varias muestras piloto en las cuales se pondrn a prueba los
cuestionarios y se obtendr una aproximacin de la variabilidad de la poblacin, con el
fin de calcular el tamao exacto de la muestra que conduzca a una estimacin de los
parmetros con la precisin establecida.

El establecimiento de las fuentes y cauces


de informacin, as como la cantidad y
complejidad de las preguntas, de acuerdo
con los objetivos de la investigacin son
decisiones que se han de tomar teniendo en
cuenta la disponibilidad de los recursos
financieros, humanos y de tiempo y las
limitaciones que se tengan en la zona
geogrfica, el grado de desarrollo, la
ausencia de tcnica, etc.

ESTADSTICA GENERAL Pgina 16


UNIVERSIDAD PRIVADA TELESUP
Es, entonces, descubrir dnde est la informacin y cmo y a qu "costo" se puede
conseguir; es determinar si la encuesta se debe aplicar por telfono, por correo, o si se
necesitan agentes directos que recojan la informacin; establecer su nmero ptimo y
preparar su entrenamiento adecuado.

8. CRTICA, CLASIFICACIN Y ORDENACIN

Despus de haber reunido toda la informacin pertinente, se necesita la depuracin de


los datos recogidos. Para hacer la crtica de una informacin, es fundamental el
conocimiento de la poblacin por parte de quien depura para poder detectar
falsedades en las respuestas, incomprensin a las preguntas, respuestas al margen,
amn de todas las posibles causas de nulidad de una pregunta o nulidad de todo un
cuestionario.

Separado el material de "desecho" con la informacin


depurada se procede a establecer las clasificaciones
respectivas y con la ayuda de hojas de trabajo, en las
que se establecen los cruces necesarios entre las
preguntas, se ordenan las respuestas y se preparan los
modelos de tabulacin de las diferentes variables que
intervienen en la investigacin.

El avance tecnolgico y la popularizacin de los computadores hacen que estas


tareas, manualmente dispendiosas, puedan ser realizadas en corto tiempo.

9. LA TABULACIN

Una tabla es un resumen de informacin respecto a una o ms variables, que ofrece


claridad al lector sobre lo que se pretende describir; para su fcil interpretacin una
tabla debe tener por lo menos: Un ttulo adecuado el cual debe ser claro y conciso. La
Tabla propiamente dicha con los correspondientes subttulos internos y la
cuantificacin de los diferentes tems de las variables, y las notas de pie de cuadro que
hagan claridad sobre situaciones especiales de la tabla, u otorguen los crditos a la
fuente de la informacin.

ESTADSTICA GENERAL Pgina 17


UNIVERSIDAD PRIVADA TELESUP
10. LA PRESENTACIN

Una informacin estadstica adquiere ms claridad cuando se presenta en la forma


adecuada. Los cuadros, tablas y grficos facilitan el anlisis, pero se debe tener
cuidado con las variables que se van a presentar y la forma de hacerlo. No es
aconsejable saturar un informe con tablas y grficos redundantes que, antes que
claridad, crean confusin. Adems la eleccin de determinada tabla o grfico para
mostrar los resultados, debe hacerse no slo en funcin de las variables que relaciona,
sino del lector a quien va dirigido el informe.

11. EL ANLISIS

La tcnica estadstica ofrece mtodos y procedimientos objetivos que


convierten las especulaciones de primera mano en aseveraciones cuya
confiabilidad puede ser evaluada y ofrecer una premisa medible en la toma de
una decisin.

Es el anlisis donde se cristaliza la


investigacin. Esta es la fase de la
determinacin de los parmetros y
estadsticos muestrales para las
estimaciones e inferencias respecto a la
poblacin, el ajuste de modelos y las
pruebas de las hiptesis planteadas, con el
fin de establecer y redactar las
conclusiones definitivas.

12. PUBLICACIN

Toda conclusin es digna de ser comunicada a un auditorio. Es ms, hay otros


estudiosos del mismo problema a quienes se les puede aportar informacin,
conocimientos y otros puntos de vista acerca de l.

ESTADSTICA GENERAL Pgina 18


UNIVERSIDAD PRIVADA TELESUP

TEMA

Tabla de
Distribucin de
Frecuencias

ESTADSTICA GENERAL Pgina 19


UNIVERSIDAD PRIVADA TELESUP

TEMA 03: DISTRIBUCIN DE FRECUENCIAS

Despus de recoger toda la informacin correspondiente a


la investigacin, es decir, al agotar todo el trabajo de campo,
nuestro escritorio se llena de un cmulo de datos y cifras
desordenadas los cuales, al ser tomados como
observaciones individuales, dicen muy poco sobre la
poblacin estudiada; es, entonces, tarea del investigador
hacer hablar las cifras, comenzando por la clasificacin y
ordenacin, consignando la informacin en tablas inteligibles
que denominamos distribuciones de frecuencias.

1. DISTRIBUCIN DE FRECUENCIAS SIMPLE

Para una mayor sencillez, en la exposicin del tema, nos valemos del siguiente
ejemplo: Supongamos que en la fbrica de confecciones La Hilacha, ha estallado un
conflicto laboral y sus cincuenta operarias solicitan un aumento en el salario diario de
lo contrario se paralizar la fbrica.

El Gerente-propietario recoge la informacin respecto al variable salario diario de sus


50 operarias y la relaciona en la tabla No 1.

Tabla No.1
Salario Diario de 50 Operarias en la Fbrica de Confecciones La Hilacha
(datos en nuevos soles)
Obrera Miles Obrera Miles Obrera Miles Obrera Miles Obrera Miles
N S/. da N S/. da N S/. da N S/. da N S/. da
1 52 11 54 21 55 31 56 41 52
2 54 12 51 22 55 32 53 42 57
3 55 13 54 23 52 33 57 43 56
4 54 14 55 24 55 34 54 44 51
5 53 15 54 25 53 35 53 45 58
6 56 16 56 26 57 36 50 46 55
7 54 17 52 27 54 37 55 47 53
8 58 18 54 28 55 38 52 48 54
9 51 19 53 29 53 39 53 49 53
10 54 20 55 30 55 40 54 50 56

ESTADSTICA GENERAL Pgina 20


UNIVERSIDAD PRIVADA TELESUP

Tabla No. 2
Salario Diario de 50 Operarias en la Fbrica de Confecciones
La Hilacha
(datos en nuevos soles)
Miles Miles Miles Miles Miles
S/. da S/. da S/. da S/. da S/. da
52 54 55 56 52
54 51 55 53 57
55 54 52 57 56
54 55 55 54 51
53 54 53 53 58
56 56 57 50 55
54 52 54 55 53
58 54 55 52 54
51 53 53 53 53
54 55 55 54 56

Tabla No. 3
Salario Diario de 50 Operarias en la Fbrica de Confecciones La Hilacha
(datos en nuevos soles)
S/. da S/. da S/. da S/. da S/. da
50 53 54 55 56
51 53 54 55 56
51 53 54 55 56
51 53 54 55 56
52 53 54 55 56
52 53 54 55 57
52 53 54 55 57
52 53 54 55 57
52 54 54 55 58
53 54 54 55 58

ESTADSTICA GENERAL Pgina 21


UNIVERSIDAD PRIVADA TELESUP

Tabla No. 4
Distribucin Miles /SA de Frecuencias del Salario de 50 personas operarias
Nuevo soles / da Conteo Repeticin
50 l 1
51 lll 3
52 lllll 5
53 lllllllll 9
54 llllllllllll 12
55 lllllllll 10
56 lllll 5
57 lll 3
58 ll 2
Como se puede observar, hay una gran diferencia entre los datos brutos de la tabla
No.1 y el ordenamiento y agrupamiento de la tabla No. 4.

Con el fin de obtener una mejor tabla interpretativa, introduciremos la siguiente


simbologa:

n: El tamao de la muestra, es el nmero de observaciones.

Xi: La variable; es cada uno de los diferentes valores que se


han observado. La variable xi, toma los x1, x2... xm valores.

fi: La frecuencia absoluta o simplemente frecuencia, es el


nmero de veces que se repite la variable X i; as f 1, es el
nmero de veces que se repite la observacin x 1, f2 el nmero
de veces que se repite la observacin x2 etc.

fa: La frecuencia acumulada, se obtiene acumulando la


frecuencia absoluta.

fr: Frecuencia relativa; es el resultado de dividir c/u de las


frecuencias absolutas por el tamao de la muestra.

fra: Frecuencia relativa acumulada; se obtiene dividiendo la


frecuencia acumulada entre el tamao de la muestra.

ESTADSTICA GENERAL Pgina 22


UNIVERSIDAD PRIVADA TELESUP
DISTRIBUCIN TERICA DE FRECUENCIAS DE N OBSERVACIONES

Variable Frecuencia Frecuencia Frecuencia Frecuencia relativa


Xi fi Acumulada fa relativa fr acumulada fra
x1 f1 f1/n f1/n f1/n
x2 f2 f1+f2 f2/n (f1 + f2)/n

xi fi f1+f2+... + fi fi/n (f1 + f2 +fi)/n

xm fm f1+f2+ + fm fm/n (f1 + f2 +fm)/n


n 1.00

Veamos el ejemplo que venimos trabajando:

Tabla No. 5
Distribucin de Frecuencias del Salario Diario de 50 Obreras
Salario S/. Frecuencia Frecuencia Frecuencia Frecuencia relativa
da acumulada relativa acumulada
xi fi fa fr fra
50 1 1 1/50=0.02 1/50=0.02
51 3 4 3/50=0.06 4/50=0.08
52 5 9 5/50=0.10 9/50=0.18
53 9 18 9/50=0.18 18/50=0.36
54 12 30 12/50=0.24 30/50=0.60
55 10 40 10/50=0.20 40/50=0.80
56 5 45 5/50=0.10 45/50=0.90
57 3 48 3/50=0.06 48/50=0.96
58 2 50 2/50=0.04 50/50=1.00
Sumas 50 1.00

En la prctica, cuando se tiene confianza en el ordenamiento, no


son necesarias tantas tablas; se puede pasar de la tabla No1
directamente a la tabla No 6.

ESTADSTICA GENERAL Pgina 23


UNIVERSIDAD PRIVADA TELESUP
Tabla No. 6
Salario Diario de 50 Operarias de La Fabrica de Confecciones La Hilacha(nuevos
soles)
S/. da xi fi fa fr fra
50 1 1 0.02 0.02
51 3 4 0.06 0.08
52 5 9 0.10 0.18
53 9 18 0.18 0.36
54 12 30 0.24 0.60
55 10 40 0.20 0.80
56 5 45 0.10 0.90
57 3 48 0.06 0.96
58 2 50 0.04 1.00
Sumas 50 1.00

Analizando las columnas porcentuales fr y fra se obtienen, entre otras las siguientes
conclusiones:

Slo el 4% de las obreras gana el mximo salario/da de


la fbrica, el cual corresponde a S/. 58
El salario diario mnimo (S/. 50) lo gana nicamente una
obrera, lo que constituye el 2% del personal asalariado.
El 62% de las operarias tiene un salario diario entre S/.
53 y S/.55
El 60% de las obreras tiene un salario/da de S/. 54 o
menos.
El 64% tiene un ingreso/da de S/. 54 o ms.

2. DISTRIBUCIN DE FRECUENCIAS POR INTERVALOS

Usualmente los valores de los datos no permiten un agrupamiento de ellos en una


tabla de frecuencias simple, debido a que se encuentran distribuidos a travs de
todo el recorrido y el nmero de veces que se repite cada observacin no es
significativo en todos los casos, y en la mayora de ellos su frecuencia es baja. Una
tabla de frecuencias construida en estas condiciones, no presenta ninguna utilidad.

ESTADSTICA GENERAL Pgina 24


UNIVERSIDAD PRIVADA TELESUP
Ilustraremos el caso a travs de un ejemplo, para ello,
supongamos que la fbrica de baldosas De las casas, con el
objeto de ofrecer una garanta de su producto, desea hacer un
estudio tcnico de su produccin, para lo cual extrae una
muestra de 100 baldosas, cada una de las cuales se somete a
una prueba de resistencia, destructiva cuyos datos expresados
en Kg/ Cm2, se relacionan a continuacin:

Tabla No. 7
Resistencia en Kg/Cm2 de 100 Baldosas de La Fbrica De Las Casas
478 458 683 780 736 448 591 555

339 694 478 498 310 537 592 549


666 239 398 720 648 533 586 321
313 644 495 422 521 368 531 472
415 291 621 253 763 746 323 575
210 480 223 433 444 437 360 559
425 459 418 351 361 183 383 259
419 655 487 135 370 345 282 578
425 436 634 450 223 479 161 337
420 422 282 439 449 321 452 444
391 569 460 308 477 463 367 251
487 610 470 469 392 517 359 527
540 504 542 369

La clasificacin en una distribucin de frecuencias simple dara como resultante un


ordenamiento de por lo menos 80 items; la mayora de ellos con frecuencia unitaria.

Se hace necesario el agrupamiento en intervalos o clases que haga ms


compacta, manejable y presentable la informacin.

El nmero de clases y la amplitud de los intervalos los fija el investigador de


acuerdo con el conocimiento que posea de la poblacin, la necesidad de hacer
comparacin con otras investigaciones y la presentacin de la informacin. Sin
embargo, se recomienda que la informacin no sea demasiado compacta, lo cual le
restara precisin, ni demasiado dispersa, ya que no se tendra claridad.

ESTADSTICA GENERAL Pgina 25


UNIVERSIDAD PRIVADA TELESUP

En trminos generales, es usual que el nmero de intervalos no sea inferior a 5 ni


superior a 15. Struges propone que el nmero de clases o intervalos sea
determinado por la expresin = 1 + 3.3log
()

La amplitud debe ser igual para todos los intervalos y, en lo posible, no se debe
trabajar con clases abiertas.

3. REGLAS EMPRICAS PARA LA CONSTRUCCIN DE INTERVALOS

Cuando no se tiene experiencia en el manejo de la informacin es aconsejable


seguir los pasos que se dan a continuacin:

1) Determinar los datos de mayor y menor valor , .


2) clase (A): = 1 + 3.3log
().Debe tenerse presente que m

es un nmero natural. Luego se busca la amplitud >

3) Calcular el rango ampliado: = .


4) Establecer la diferencia = es
decir la cantidad en que ha sido alterado
el recorrido, la cual no debe ser superior a
la amplitud.
5) (a) Tambin puede ser definida como la
cantidad positiva ms pequea que le
hace falta al rango o recorrido para ser
divisible exactamente por la amplitud
6) Distribuir adecuadamente la cantidad a
de la siguiente manera:

Al valor X min se le resta aproximadamente 2 y la parte restante se le


suma a X max, obteniendo el lmite inferior del primer intervalo y el lmite
superior del ltimo, respectivamente.

ESTADSTICA GENERAL Pgina 26


UNIVERSIDAD PRIVADA TELESUP

= ( )
2


+ = ( )
2

Construir los intervalos, calcular los puntos medios o marcas de clase y hacer el
agrupamiento de frecuencias.

DISTRIBUCIN TERICA DE FRECUENCIAS POR INTERVALOS DE N

Observaciones

Acumulada

Acumulada
Frecuencia

Frecuencia

Frecuencia

Frecuencia
Intervalos

Marca de

Relativa

Relativa
Clase

fra
fa

fr
X

fi

LIPI-LIPI+A X1 f1 f1 f1/n f1/n


LIPI+A-LIPI+2A X2 f2 f1+f2 f2n (f1+f2)/n

LIPI+(m-1)A-LSUI Xm fm n fm/n 1.00


Suma n 1.00

n: Nmero de observaciones
LIPI: Lmite inferior del primer intervalo
LSUI: Lmite superior del ltimo intervalo
Xi: Punto medio del intervalo, o marca de
clase

* Con el fin de prever dobles conteos, quien clasifica deber especificar si los
intervalos son abiertos a la derecha o abiertos a la izquierda, en estas notas,
trabajaremos con intervalos abiertos a la derecha; es decir, del tipo , <
donde el lmite superior no est incluido dentro de la clase.

ESTADSTICA GENERAL Pgina 27


UNIVERSIDAD PRIVADA TELESUP
Retomemos el ejercicio de la Tabla No. 7 y construyamos una distribucin de
frecuencia por intervalos.

=
<<

Rango
=
. = 780 122 = 658
.
Nmero de intervalos
= 1 + 3.3 log ,
= 1 + 3.3 log 100
= 1 + 3.3 2 = 7.6

No es lgico tener 7.6 intervalos, por lo tanto se procede a aproximar el nmero de


intervalos a un nmero natural cercano. Aproximemos, = 7, y busquemos la amplitud

658
> , > 7

Ya terminado el nmero de clases en m=7 encontramos que la amplitud debe ser


mayor que 94. Fijmosla, entonces, en A = 100, que hace ms manejable y
presentable la tabla con la informacin.

Rango ampliado = 7 100

Hemos alterado el rango original = 658, cambindolo por el rango ampliado


= 700. La diferencia est representada por = o sea = 700 658 =
42
Tenemos por tanto, que distribuir adecuadamente la diferencia entre los rangos


= ; 122 22 = 100 =
2

= ; 780 + 20 = 800 =
2

ESTADSTICA GENERAL Pgina 28


UNIVERSIDAD PRIVADA TELESUP
Como se dijo antes, no estamos hablando de restar o sumar estrictamente 2 sino
una cantidad aproximada que brinde una buena presentacin.

Tabla No. 8
Construccin de los Intervalos para la Resistencia de las Baldosas

Intervalos Marca de clase (X)


100-200 150
200-300 250
300-400 350
400-500 450
500-600 550
600-700 650
700-800 750

Se puede desde luego, proceder a agrupar la informacin en los respectivos


intervalos, haciendo la salvedad de que ninguno de los lmites superiores de clase son
considerados dentro de los intervalos.

Tabla No. 9
Distribucin de Frecuencias por Intervalos de la Resistencia de 100 Baldosas de la
Fbrica de las Casas.

Kg/Cm2 X f1 fa fr fra
100 Menos de 200 150 4 4 0.04 0.04
200 Menos de 300 250 10 14 0.10 0.14
300 Menos de 400 350 21 35 0.21 0.35
400 Menos de 500 450 33 68 0.33 0.68
5000 Menos de 600 550 18 86 0.18 0.86
6000 Menos de 700 650 9 95 0.09 0.95
700 Menos de 800 750 5 100 0.05 1.00
SUMAS 100 1.00

Conclusiones:
El 72% de las baldosas tiene una resistencia entre 300 y 600 Kg/Cm 2.
El 86% de las baldosas resiste menos de 600 Kg/Cm2.
Slo el 5% resiste 700 o ms Kg/Cm2.

ESTADSTICA GENERAL Pgina 29


UNIVERSIDAD PRIVADA TELESUP

TEMA

Representacin
Grfica

ESTADSTICA GENERAL Pgina 30


UNIVERSIDAD PRIVADA TELESUP

TEMA 04: REPRESENTACIN GRFICA

A pesar de la gran ayuda que prestan las tablas y


cuadros con informacin organizada, no todos los
pblicos alcanzan a comprenderla o no disponen del
tiempo suficiente para analizarla.

Es por ello que la mayora de los investigadores


acostumbran a reforzar la descripcin a travs de
dibujos, generalmente con formas geomtricas, que
ayudan a visualizar el comportamiento de las variables
tratadas.

1. DEFINICIN

Una grfica o diagrama es un dibujo complementario a una tabla o cuadro, que


permite observar las tendencias de un fenmeno en estudio y facilita el anlisis
estadstico de las variables all relacionadas.

2. COMPONENTES DE UNA GRFICA

Una grfica, al igual que un cuadro o una tabla, debe constar de:

1) Ttulo adecuado: El cual debe ser claro y conciso, que responda a las
preguntas: Qu relaciona, cundo y dnde se hicieron las observaciones.

2) El cuerpo: o grfico en s, cuya eleccin debe considerar el o los tipos variables


a relacionar, el pblico a quien va dirigido y el diseo artstico del grfico.

3) Notas de pie de grfico: Donde se presentan aclaraciones respecto al grfico,


las escalas de los ejes, o se otorgan los crditos a las fuentes respectivas.

Es de anotar que por medio de grficos tendenciosos se pueden deformar o


resaltar situaciones o estados, que presentados en un grfico apropiado,
mostraran un comportamiento normal.

Generalmente una informacin es distorsionada por algunas de las siguientes causas:

ESTADSTICA GENERAL Pgina 31


UNIVERSIDAD PRIVADA TELESUP
La relacin entre los ejes no es la mas apropiada ( ver grficos No.1 y No.2.
Grficos con escalas desproporcionadas, o mala eleccin del punto de origen (ver
grfico No.3).

Variacin de La Inflacin en el Per


1995-2000

1995 1996 1997 1998 1999 2000

19.46 21.63 17.68 16.7 9.23 7.81

Grfico N1
25

20

15

10

0
1995 1996 1997 1998 1999 2000

Grfico N2
25

20

15

10

0
1995 1996 1997 1998 1999 2000

ESTADSTICA GENERAL Pgina 32


UNIVERSIDAD PRIVADA TELESUP

Grfico N3
25

20

15

10

0
1995 1996 1997 1998 1999 2000

Como se puede observar, el grfico No.1 realza el decrecimiento de la variable


inflacin, mientras que el No.2 intenta mostrar una estabilizacin o decrecimiento
parsimonioso.

Los dos dibujos son incorrectos debido a que no conservan una proporcin
adecuada entre sus ejes. Sin embargo, el grfico No. 3 tiene una buena
proporcin entre los ejes. Pero, la distorsin se debe a la mala numeracin en el
eje Y pues, el punto de origen O ha sido eliminado y asignado un valor
arbitrario, la escala es inadecuada para resaltar el decrecimiento inflacionario de
los dos ltimos periodos.

Ambas situaciones son errneas o tendenciosas y se deben corregir asignando


escalas apropiadas a los ejes y utilizando la siguiente regla:


= =

Donde: Lx: Longitud del eje horizontal


Ly: Longitud del eje vertical

La longitud del eje vertical es igual a tres cuartos de la longitud del eje
horizontal.

ESTADSTICA GENERAL Pgina 33


UNIVERSIDAD PRIVADA TELESUP

3. PRINCIPALES TIPOS DE GRFICOS

Existe una gran cantidad de grficos para la representacin de datos estadsticos, ya


que de ellos depende el diseo artstico de quien los elabora, as como de su
imaginacin al combinar varios tipos de ellos, como forma de presentar una
informacin.

Entre los grficos ms comunes tenemos:

a) Grfico de Lneas: Usado bsicamente para mostrar el comportamiento de una


variable cuantitativa a travs del tiempo. El grfico de lneas consiste en
segmentos rectilneos unidos entre s, los cuales resaltan las variaciones de la
variable por unidad de tiempo. Para su construccin ha de procederse de la
siguiente manera: en el eje de las ordenadas se marcan los puntos de acuerdo
con la escala que se est utilizando. En el caso de una escala aritmtica,
distancias iguales en el eje, representan distancias iguales en la variable.

Variacin de la Inflacin en el Per


1995 -2000

Grfico N1
25

20

15

10

0
1995 1996 1997 1998 1999 2000

El eje de la variable X se divide en unidades de tiempo iguales, teniendo presente el


nmero de tems que ha de presentarse, as como la longitud del eje. Es de anotar
la conveniencia de mostrar la interrupcin y acercamiento del eje a su origen
cuando esto haya ocurrido.

ESTADSTICA GENERAL Pgina 34


UNIVERSIDAD PRIVADA TELESUP

b) Grfico de Lneas Compuesto: Cuando se tienen varias variables a representar,


con el fin de establecer comparaciones entre ellas (siempre que su unidad de
medida sea la misma); se utiliza plasmarlos en un slo grfico, el cual es el
resultado de representar varias variables en un mismo plano.

Variacin de la Inflacin y el Salario de la Hilacha

Ao 1995 1996 1997 1998 1999 2000


Inflacin 19.46 21.63 17.68 16.7 9.23 7.81
Salario 18.00 19.00 18.00 18.00 15.00 12.00

25

20

15
Inflacin

10 Salario

0
1995 1996 1997 1998 1999 2000

c) Grfico de Barras:

El grfico de barras, como su nombre lo


indica, est constituido por barras
rectangulares de igual ancho, conservando la
misma distancia de separacin entre s. Se
utiliza bsicamente para mostrar y comparar
frecuencias de variables cualitativas o
comportamientos en el tiempo, cuando el
nmero de tems es reducido.

ESTADSTICA GENERAL Pgina 35


UNIVERSIDAD PRIVADA TELESUP
Nmero de Hijos de 50 Obreras en "La Hilacha"

N de hijos 0 1 2 3 4
Frecuencia 11 12 17 8 2

Nmero de hijos
18
16
14
12
10
8
6
4
2
0
0 1 2 3 4

stos grficos suelen ser de barras verticales, aunque se


pueden utilizar de forma horizontal.

d) Grfico de Barras Compuesto

Preferencias de Partido segn Sexo

35

30

25

20
Hombres

15 Mujeres
Total
10

0
Apra PPC Accin Popular Izquierda Unida

ESTADSTICA GENERAL Pgina 36


UNIVERSIDAD PRIVADA TELESUP

e) Grfico de Sectores Circulares

Usualmente llamado grfico de pastel, debido a su forma caracterstica de una


circunferencia dividida en cascos, por medio de radios que dan la sensacin de un
pastel tajado en porciones.

Se usa para representar variables cualitativas en porcentajes o cifras absolutas


cuando el nmero de tems no es superior a 5 y se quiere resaltar uno de ellos.
Para su construccin se procede de la siguiente forma: La circunferencia tiene en
su interior 360 grados, los cuales hacemos corresponder al total de la informacin,
es decir al 100%; luego, para determinar el nmero de grados correspondiente a
cada componente se multiplica el porcentaje respectivo por 360 y se divide por
100, los cuales se miden con la ayuda de un transportador para formar los
casquetes de los diferentes tems.

Estado Civil
Estado Civil de 50
Operarias de "La Hilacha" 4%
8%

Casada
34%
Conviviente
Soltera
32% Viuda
Divorciada

22%

f) Histograma de Frecuencias:

Para la construccin de un histograma de frecuencias de fcil interpretacin y


que no falsee la informacin, debe disponerse de una distribucin de frecuencias
por intervalos con amplitud igual para cada clase o intervalo. En el eje de las
abscisas procedemos a representar los intervalos de la variable, y en el eje de
las ordenadas las frecuencias de cada clase.

El histograma se construye dibujando barras contiguas que tienen como base la


amplitud de cada intervalo y como alturas las frecuencias respectivas.

ESTADSTICA GENERAL Pgina 37


UNIVERSIDAD PRIVADA TELESUP
Histograma de Frecuencias de la Resistencia de 100 Baldosas

Histograma
25

20
Frecuencia

15

10

0
100 200 300 400 500 600 700 800 900
Resistencia Kg/cm2

g) Polgono de Frecuencias

Resistencia de 100 Baldosas

Polgono de frecuencia
25

20
Frecuencia

15

10

0
100 200 300 400 500 600 700 800 900

Resistencia Kg/cm2

Para la construccin de un polgono de frecuencias, se marcan los puntos


medios de cada uno los intervalos en la parte superior de cada barra del
histograma de frecuencias, los cuales se unen con segmentos de recta.

ESTADSTICA GENERAL Pgina 38


UNIVERSIDAD PRIVADA TELESUP

h) Histograma de Frecuencias Acumuladas:

El histograma de frecuencias acumuladas tambin es obtenido a partir de una


distribucin de frecuencias, tomando en el eje horizontal las clases de la
variable, y en el eje vertical las frecuencias acumuladas correspondientes a
cada intervalo.

Resistencia de 100 Baldosas

Histograma de frecuencia
acumulada
120
100
Frecuencia

80
60
40
20
0
100 200 300 400 500 600 700 800 900

Resistencia Kg/cm2

Ojiva
120

100

80
Frecuencia

60

40

20

0
100 200 300 400 500 600 700 800 900
Resistencia Kg/cm2

ESTADSTICA GENERAL Pgina 39


UNIVERSIDAD PRIVADA TELESUP
3. LECTURAS RECOMENDADAS
1. Comprensin y Aplicacin de la estadstica.

http://www.cortland.edu/flteach/stats/stat-sp.html

2. Introduccin al uso del paquete estadstico SPSS.

http://www.uam.es/personal_pdi/economicas/rmc/redes/pdf/intro2.pdf

4. ACTIVIDADES Y EJERCICIOS

1.- Ingresa a la actividad Introduccin a la Estadstica lee atentamente las instrucciones


para descargar el archivo, realizar la actividad y para enviarlo.

Responda el siguiente cuestionario


Por qu se considera importante la estadstica?
Enumere las etapas del mtodo estadstico.
Defina: Poblacin, Muestra, Censo y Muestreo.
Por qu usualmente se recurre al anlisis a travs de muestras y no
de poblaciones?.
Qu es frecuencia absoluta?
Cmo se obtiene la frecuencia relativa?

2.- Ingresa a la actividad: fbrica La hilacha lee atentamente las instrucciones para
descargar la tabla, realizar la actividad y para enviarlo.

La siguiente tabla relaciona las ausencias al trabajo de 50 obreras,


durante el mes de octubre, en la fabrica de confecciones "la hilacha".

1 0 2 1 3 1 4 3 2 5

3 2 4 2 0 3 1 2 0 2

1 1 0 1 0 0 1 2 1 3

4 0 2 3 2 0 0 2 5 2

2 4 2 1 3 1 2 1 0 2

a. Construir una distribucin de frecuencias simple.


b. Sacar 3 conclusiones.
c. Grafique mediante un polgono de frecuencias.
d. Elabore un grfico circular con porcentajes.

ESTADSTICA GENERAL Pgina 40


UNIVERSIDAD PRIVADA TELESUP
5. AUTOEVALUACIN

1. Qu es la unidad de observacin?
a) Es la definicin previa de los individuos agrupados en un criterio de
evaluacin.
b) Cada uno de los elementos constituyentes de la poblacin estudiada
c) Es la asociacin entre criterios de medicin
d) Es el criterio sobre la unidad de medicin
e) Es el anlisis mediante las herramientas de medicin

2. Para qu no se utiliza un muestreo piloto?


a) Porque la comunidad cientfica exige inferencias para las poblaciones a
partir de una muestra.
b) Por la poca disponibilidad de recursos
c) Por la constante homogeneidad de sus elementos
d) Por ser grande el nmero de sus componentes y no poder controlarse
e) Por que el resultado de la inferencia es heterognea.

3. A que llamamos Clculo de probabilidades?


a) Es un instrumento de anlisis para el estudio de los fenmenos econmicos
y sociales.
b) Es una teora matemtica basada en probabilidades estticas de muestreo.
c) Es el resultado al estudio de fenmenos cuyas causas son muy complejas.
d) Es el trmino para el estudio estadstico con relacin a la poblacin.
e) Es el nmero de elementos producto del estudio del mercado.

4. Identifica a las etapas del Mtodo Estadstico.


a) Planteamiento del problema, formulacin de la hiptesis, definicin de la
unidad de observacin y de la unidad de medida,
b) Determinacin de la poblacin y de la muestra y recoleccin.
c) Anlisis, presentacin y Determinacin de la varianza y recoleccin.
d) Publicacin. Tabulacin y fijacin de las metas.
e) Crtica, clasificacin y ordenacin; y muestreo poblacional.

5. Determine la descripcin correcta para la etapa Recoleccin:


a) Consiste en la presentacin adecuada de los valores.
b) Tcnica estadstica ofrece mtodos y procedimientos.
c) La comunicacin de las conclusiones al estudio de un problema.
d) Es un resumen respecto a una o muchas variables.
e) Es la recoleccin de informacin de una o varias muestras piloto.

6. La frecuencia acumulada?
a) La suma de todos los valores.
b) El total de datos
c) La suma de todas las frecuencias iguales y anteriores al valor analizado
d) El porcentaje de todas las frecuencias acumuladas

ESTADSTICA GENERAL Pgina 41


UNIVERSIDAD PRIVADA TELESUP

e) Es el porcentaje de todos los valores iguales.

7. La frecuencia relativa acumulada es?


a) El porcentaje de cierta frecuencia de cierto valor.
b) El 100% de los datos
c) Los porcentajes acumulados hasta el valor de estudio
d) Un porcentaje de anlisis total.
e) Es un porcentaje variante al 95% de los datos.

8. Qu porcentaje se entrega en 3 o menos semanas?

a) 50%
b) 70%
c) 60%
d) 80%
e) 75%

9. De la siguiente tabla de muestreo de registro de embarques de cierto da,


construya una tabla de distribucin de frecuencia con intervalos semanales
y responda
Tiempo entre la recepcin de una orden y su entrega (en das)
4 12 8 14 11 6 7 13 13 11
11 20 5 19 10 15 24 7 29 6

Cul es la frecuencia para productos cuyo tiempo de entrega se encuentra


entre 13 y 18 das?
a) 4
b) 5
c) 3
d) 8
e) 10

10. Cules son los componentes de una grfica?


a) Titulo adecuado, El grfico y las notas del pie del grfico.
b) Titulo adecuado, El esquema estadstico y las notas del pie del esquema.
c) Rtulo, El esquema estadstico y las notas del pie del esquema.
d) Rtulo, El grfico y las notas del pie del grfico.
e) Encabezado, El grfico y las notas del pie del grfico.

ESTADSTICA GENERAL Pgina 42


UNIVERSIDAD PRIVADA TELESUP

6. RESUMEN

La estadstica es una ciencia auxiliar para todas las ramas del saber. La
estadstica ayuda en la incertidumbre, trabaja con ella y nos orienta para tomar las
decisiones con un determinado grado de confianza. La estadstica parte de la
observacin de fenmenos, permitiendo al investigador obtener conclusiones
tiles sobre ellos. Se divide en: La estadstica Descriptiva y la estadstica
Matemtica e Inferencial. Estas dos ramas son complementarias, ambas dan la
suficiente ilustracin sobre una posible realidad futura, con el fin de que quien
tenga poder de decisin, tome las medidas necesarias para transformar ese
futuro.

Las etapas el mtodo estadstico son:


Planeamiento del problema, Fijacin de los objetivos, Formulacin de las
hiptesis, Definicin de la unidad de observacin y de la unidad de medida,
Determinacin de la poblacin y de la muestra, La recoleccin, crtica,
clasificacin y ordenacin, Tabulacin, Presentacin, el Anlisis y Publicacin.

Los datos recopilados en la muestra se pueden organizar en Tablas de


Frecuencias. Estas tablas muestran:
Frecuencia (f): Resulta de contar el nmero de observaciones que "entran"
en una clase.
Frecuencia Relativa (fr): Es la proporcin de observaciones que "entran" en
una clase.
Frecuencia Acumulada (fa): Es el nmero de observaciones acumuladas.
Frecuencia Relativa Acumulada (fra): es la proporcin de observaciones
acumuladas.

Las ms importantes grficas:

Sector.- Consiste en dividir un crculo en tantos sectores como valores de la


variable.
La amplitud de cada sector debe ser proporcional a la frecuencia del valor
correspondiente.

Histograma.- Es un caso particular del diagrama anterior en el caso de variables


continuas. Si los intervalos son correlativos, los rectngulos aparecen pegados en
la representacin grfica.
Barras.- Consiste en dos ejes perpendiculares y una barra o rectngulo para cada
valor de la variable. Se suele colocar en el eje horizontal los valores de la variable.

ESTADSTICA GENERAL Pgina 43


UNIVERSIDAD PRIVADA TELESUP

UNIDAD DE
APRENDIZAJE

MEDIDAS DE TENDENCIA, DISPERSIN Y


FORMA

COMPETENCIA:

Al finalizar esta unidad usted ser capaz de


Identificar y hacer uso de medidas estadsticas
para describir una realidad dentro del entorno de
las ciencias
ESTADSTICA GENERAL sociales y biolgicas. Pgina 44
UNIVERSIDAD PRIVADA TELESUP

1. INTRODUCCIN

a. Presentacin y contextualizacin
Los retratos resultantes de las distribuciones de frecuencia ilustran tendencias y
patrones de los datos, sin embargo tenemos necesidad de medidas exactas, en
esos casos los nmeros que constituyen las estadsticas sumarias para describir las
caractersticas del conjunto de datos.

b. Competencia
Identifica y hace uso de medidas estadsticas para describir una realidad dentro del
entorno de las ciencias sociales y biolgicas.

c. Capacidades
1. Utiliza la media, mediana y la moda para describir cmo se aglutinan los
datos
2. Utiliza los percentiles para entender la distribucin en proporcional de los
datos.
3. Utiliza el rango, la varianza y la desviacin estndar para describir cmo se
dispersan los datos.
4. Identifica la forma de distribucin de los datos a partir del uso de la asimetra
y la curtosis.

d. Actitudes
1. Valora la ciencia de la estadstica
2. Mejora la redaccin de documento cientficos
3. Muestra rigurosidad para representar relaciones, plantear argumentos y
comunicar resultados

e. Presentacin de ideas bsicas y contenido esenciales de la Unidad.


La Unidad de Aprendizaje 2 comprende el desarrollo de los siguientes
temas:

Tema 01: Medidas de Tendencia Central


Tema 02: Percentiles
Tema 03: Medidas de Dispersin
Tema 04: Medidas de Formas

ESTADSTICA GENERAL Pgina 45


UNIVERSIDAD PRIVADA TELESUP

TEMA

Medidas de
Tendencia Central

ESTADSTICA GENERAL Pgina 46


UNIVERSIDAD PRIVADA TELESUP
2. DESARROLLO DE CONTENIDOS
TEMA 01: MEDIDAS DE TENDENCIA CENTRAL

En los captulos anteriores, nos referimos a la clasificacin, ordenacin y presentacin


de datos estadsticos, limitando el anlisis de la informacin a la interpretacin
porcentual de las distribuciones de frecuencia.

El anlisis estadstico propiamente


dicho, parte de la bsqueda de
parmetros sobre los cuales pueda
recaer la representacin de toda la
informacin.

Las medidas de tendencia central, llamadas as porque tienden a localizarse


en el centro de la informacin, son de gran importancia en el manejo de las
tcnicas estadsticas, sin embargo, su interpretacin no debe hacerse
aisladamente de las medidas de dispersin, ya que la representatividad de
ellas est asociada con el grado de concentracin de la informacin.

Las principales medidas de tendencia central son:

Media aritmtica.
Mediana
Moda.

1. MEDIA ARITMTICA

Cotidiana e inconscientemente estamos utilizando la media aritmtica. Cuando por


ejemplo, decimos que un determinado fumador consume una cajetilla de cigarrillos
diaria, no aseguramos que diariamente deba consumir exactamente los 20
cigarrillos que contiene un paquete sino que es el resultado de la observacin, es
decir, dicho sujeto puede consumir 18, un da; 19 otro; 20, 21, 22; pero segn
nuestro criterio, el nmero de unidades estar alrededor de 20.

ESTADSTICA GENERAL Pgina 47


UNIVERSIDAD PRIVADA TELESUP
Matemticamente, la media aritmtica se define como la suma de los valores
observados dividida entre el nmero de observaciones.


1 + 2 +. + +. + 1
= =

: Media aritmtica de la variable X.

: Valores de la variable X.

: Nmero de observaciones.

: Signo de sumatoria, indica que se debe


sumar.

Lunes: 18
Martes: 21
Ejemplo:
Mircoles: 22
Cantidad de cigarrillos Jueves: 21
consumidos por un fumador en Viernes: 20
una semana. Sbado: 19
Domingo: 19
Entonces la media aritmtica es.


1 + 2 +. + +. + 1
= =

7
1
= 7

18 + 21 + 22 + 21 + 20 + 19 + 19
= = 20
7

El fumador consume en promedio 20 cigarrillos diarios.

ESTADSTICA GENERAL Pgina 48


UNIVERSIDAD PRIVADA TELESUP
Cuando la variable est agrupada en una distribucin de frecuencias, la media
aritmtica se calcula por la frmula:


1 1 + 2 2 +. + +. + 1
= =

Ejemplo:

Cantidad de Cigarrillos Consumidos por un Fumador en una Semana Dada:

Cantidad Frecuencia


1
=
Xi fi
18 1 18 1 + 19 2 + 20 1 + 21 2 + 22(2)
=
19 2 7
20 1 = 20
21 2
= 20 /
22 1
Sumas 7

Ejemplo:

Clculo de La Media Aritmtica. El Salario/da de 50 Operarias

Soles por da Xi fi Xifi


50 1 50
51 3 153 9
52 5 260 1
=
53 9 477 50
54 12 648
55 10 550
56 5 280
57 3 171 2705
58 2 116 = = 54.1
50
Sumas 50 2705

ESTADSTICA GENERAL Pgina 49


UNIVERSIDAD PRIVADA TELESUP

Si la informacin est relacionada en una distribucin de frecuencias por


intervalos, se toman como valores de la variable las marcas de clase de los
intervalos, entindase por marca de clase el punto medio entre los lmites de cada
clase o intervalo.

Ejemplo:

Clculo de La Media Aritmtica de la Resistencia de 100 Baldosas

Resistencia X fi Xifi
Kg/cm2

100 y menos de 200 150 4 600



200 y menos de 300 250 10 2500
= = =

300 y menos de 400 350 21 7350
400 y menos de 500 450 33 14850
500 y menos de 600 550 18 9900
600 y menos de 700 650 9 5850
700 y menos de 800 750 5 3750
Sumas 100 44800

La resistencia promedio de las 100 baldosas es de 448 Kg/Cm.

2. MEDIA ARITMTICA PONDERADA

Hemos visto que la Media Aritmtica se calcula con base a la magnitud de los
datos, otorgndole igual importancia a cada uno de ellos. Sin embargo en
muchas ocasiones la magnitud del dato esta ponderada con un determinado
peso que lo afecta relativamente.

La Media Aritmtica ponderada tiene en cuenta la importancia relativa de cada


uno de los datos, para lo cual la definimos con la siguiente expresin:
Pedro Echeverra Bardales Pgina 50
UNIVERSIDAD PRIVADA TELESUP

: Media aritmtica ponderada



= 1
Donde: : Valor de la variable X

1
: Ponderacin del tem xi

Ejemplo:

Las calificaciones de un estudiante estn conformadas por los siguientes factores:

Un examen cuyo valor es 40% en el cual obtuvo una nota de 4.5, un trabajo de
consulta con ponderacin del 10% y calificacin de 1.0, una exposicin
equivalente al 15% con nota de 2.0, y por ltimo una investigacin con valor del
35% calificada con 3.5.

. + . . + . . + . .
=
. + . + . + .

. + . + . + .
= = .
.

3. LA MEDIANA

Otra medida de tendencia central, utilizada principalmente en estadstica no


paramtrica, es la mediana, la cual no se basa en la magnitud de los datos, como
la media aritmtica, sino en la posicin central que ocupa en el orden de su
magnitud, dividiendo la informacin en dos partes iguales, dejando igual nmero
de datos por encima y por debajo de ella.

ESTADSTICA GENERAL Pgina 51


UNIVERSIDAD PRIVADA TELESUP

3.1 La Mediana cuando los datos no estn Agrupados en Intervalos.

Partiendo de la informacin bruta, ordenamos los


datos ascendente o descendentemente:

, , , , . Se define Mediana = = (+) , si n es impar



() +(+)
Mediana = =
, si n es par

= , = , = ,
= , = ,
En el ejercicio de los cigarrillos,
consumidos por un fumador = , =
tenemos lunes 18, martes 21,
n, es impar, entonces
mircoles 22, jueves 21, viernes 20,
sbado 19, y domingo 19. = (+) = (+) = =

Ordenando ascendentemente:
Veamos cuando n es par:

Consumo mensual de agua, en m3, por la fbrica de confecciones la hilacha.

Enero 10 Mayo 14 Septiembre 18


Febrero 12 Junio 19 Octubre 22
Marzo 15 Julio 17 Noviembre 15
Abril 18 Agosto 18 Diciembre 13

= , = , = , = , = , = ,

= , = , = , = , = , =

() + (+) () + (+) + +

= = = = =

ESTADSTICA GENERAL Pgina 52


UNIVERSIDAD PRIVADA TELESUP

Como se puede observar, en este caso la mediana no es un dato perteneciente


a la informacin, es un parmetro que divide la informacin dejando el 50% por
encima y el 50% por debajo de ella.

3.2 La Mediana Cuando la Informacin se encuentra Agrupada en Intervalos

Si la informacin esta agrupada en intervalos iguales, entonces la mediana se calcula


segn la siguiente expresin:

: Mediana

: Lmite inferior del intervalo


donde se encuentra la
mediana (intervalo mediano),
el cual se determina
()
= + observando en que clase se
encuentra la posicin n/2.)

: Nmero de observaciones
() : Frecuencia acumulada anterior
al intervalo mediano

: Frecuencia del intervalo


mediano

: Amplitud del intervalo


Ejemplo:

Resistencia de 100 Baldosas de la Fbrica De Las Casas

Resistencia X fi fa
Kg/cm2
100 y menos de 200 150 4 4
200 y menos de 300 250 10 14
300 y menos de 400 350 21 35
400 y menos de 500 450 33 68 Interv.
Mediano
500 y menos de 600 550 18 86
600 y menos de 700 650 9 95
700 y menos de 800 750 5 100
Sumas 100

100
= = 50
2 2

ESTADSTICA GENERAL Pgina 53


UNIVERSIDAD PRIVADA TELESUP
En la columna de frecuencia acumulada advertimos que la observacin nmero 50 se
halla en el cuarto intervalo 4.

100
(1) 35
2 2
= + = 400 + 100 = 445.45 /2
33

Se concluye que el 50% de las baldosas resiste menos de 445.45 Kg/Cm 2 y el 50%
resiste mas de 445.45 Kg/Cm2

4. LA MODA

La moda, como su nombre lo indica, es el valor ms comn (de mayor frecuencia


dentro de una distribucin). Una informacin puede tener una moda y se llama
unimodal, dos modas y se llama bimodal, o varias modas y llamarse multimodal.
Sin embargo puede ocurrir que la informacin no posea moda.

4.1 La Moda cuando los datos no estn Agrupados en Intervalos

Salario de 50 Operarias de la Fbrica de Confecciones "La Hilacha"

Soles por da
fi
(Xi)
50 1
51 3
52 5
53 9 El valor que ms veces se repite es 54
54 12
55 10 con una frecuencia de 12, entonces
56 5 decimos que la moda es Mo = 54 soles
57 3 diarios.
58 2

ESTADSTICA GENERAL Pgina 54


UNIVERSIDAD PRIVADA TELESUP

Cantidad Frecuencia

Xi fi
Cantidad de Cigarrillos Consumidos por 18 1
19 2
un Fumador en una semana Dada: 20 1
21 2
22 1
7

Los valores de mayor frecuencia corresponden a 19 y 21, por lo tanto se trata de una
distribucin bimodal con Mo1=19 y Mo2=21

4.2 Clculo de la Moda cuando la informacin est Agrupada en Intervalos

Cuando la informacin se encuentra agrupada en intervalos de igual tamao la moda


se calcula con la siguiente expresin.

Donde:

: Moda
: Lmite inferior del intervalo
() modal
= + : Frecuencia de la clase modal
() (+) ():Frecuencia de la clase
premodal
(+):Frecuencia de la clase
posmodal
: Amplitud de los intervalos

Ejemplo:

Resistencia de 100 Baldosas

Resistencia X fi
Kg/cm2

100 y menos de 200 150 4


200 y menos de 300 250 10
300 y menos de 400 350 21 Clase premodal
400 y menos de 500 450 33 Clase modal
500 y menos de 600 550 18 Clase posmodal
600 y menos de 700 650 9
700 y menos de 800 750 5

Pedro Echeverra Bardales Pgina 55


UNIVERSIDAD PRIVADA TELESUP
()
= +
() (+)


= + = . /

A pesar que el valor 444.44 no es un dato real de la informacin asumimos ese


parmetro como el de mayor ocurrencia.

5. MEDIA GEOMTRICA

La media geomtrica (MG), de un conjunto de nmeros positivos se define como la n-


del producto de los nmeros. Por tanto, la frmula para la media geomtrica es dada
por:


= 1 2 3 .

Existen dos usos principales de la media geomtrica:

1) Para promediar porcentajes, ndices y cifras relativas.


2) Para determinar el incremento porcentual promedio en ventas,
produccin u otras actividades o series econmicas de un periodo a
otro.

Ejemplo

Supngase que las utilidades obtenidas por una compaa constructora en


cuatro proyectos fueron de 3, 2, 4 y 6%, respectivamente. Cul es la media
geomtrica de las ganancias?

4
= 1 2 3 . = 3 2 4 6 = 3.4641

Y as la media geomtrica de las utilidades es el 3.46%.

La media aritmtica de los valores anteriores es 3.75%. Aunque el valor 6% no es


muy grande, hace que la media aritmtica se incline hacia valores elevados. La
media geomtrica no se ve tan afectada por valores extremos.

ESTADSTICA GENERAL Pgina 56


UNIVERSIDAD PRIVADA TELESUP

6. MEDIA ARMNICA

La media armnica se define como el recproco de la media aritmtica de los


recprocos:

1
= 1 1 1 1 1
( + + ++ )
1 2 3

Este valor se emplea para promediar variaciones con respecto al tiempo.

Observaciones sobre la media Geomtrica y la media Armnica

El empleo de la media geomtrica o de la armnica equivale a una transformacin


de la variable en 1/, respectivamente, y el clculo de la media aritmtica
de la nueva variable; por ejemplo, si la variable abarca un campo de variacin muy
grande, tal como el porcentaje de impureza de un producto qumico, por lo general
alrededor del 0.1%, pero que en ocasiones llega incluso al 1% o ms, puede ser
ventajoso el empleo de en lugar de para obtener una distribucin ms
simtrica y que se aproxime ms a una distribucin normal. La media aritmtica
de es el logaritmo de la media geomtrica de , de forma que la media
empleada es equivalente al empleo de la media geomtrica como valor medio de
.

Ejemplo

Supngase que una familia realiza un viaje en automvil a un ciudad y cubre los
primeros 100 km a 60 km/h, los siguientes 100 km a 70 km/h y los ltimos 100 km a
80 km/h. Calcular, en esas condiciones, la velocidad media realizada.

1
= 1 1 1 1 = 69.041
( + + )
3 60 70 80

ESTADSTICA GENERAL Pgina 57


UNIVERSIDAD PRIVADA TELESUP

TEMA

Percentiles

ESTADSTICA GENERAL Pgina 58


UNIVERSIDAD PRIVADA TELESUP
TEMA 02: PERCENTILES

En el Capitulo anterior, vimos lo referente a las


medidas de tendencia central, las cuales, a su vez,
son tambin medidas de posicin ya que, de todas
maneras ocupan un lugar dentro de la informacin.

Nos ocuparemos ahora de ciertos parmetros


posicionales muy tiles en la interpretacin
porcentual de la informacin.

1. CUARTILES

Las cuartillas o cuartiles son valores posicionales que dividen la informacin en


cuatro partes iguales, el primer cuartil deja el 25% de la informacin por debajo
de l, y el 75% por encima, el segundo cuartil, al igual que la mediana, divide la
informacin en dos partes iguales, y por ltimo el tercer cuartil deja el 75% por
debajo de s, y el 25% por encima.

Grficamente:

Q1 Q2 Q3

0% 25% 50% 75% 100%

Se necesita, entonces calcular tres cuartillas ya que la cuarta queda automticamente


determinada

: Orden del cuartil k = 1,2,3

: Lmite inferior del intervalo que


() contiene el cuartil
= +
Donde:

() : Frecuencia acumulada hasta el
intervalo anterior al que contiene
el cuartil

: Frecuencia del intervalo que


contiene el cuartil

: Nmero de observaciones

: Amplitud de los intervalos

ESTADSTICA GENERAL Pgina 59


UNIVERSIDAD PRIVADA TELESUP

Ejemplo:

Resistencia de 100 Baldosas de la Fbrica "De Las Casas"

Resistencia X fi fa
Kg/cm2
100 y menos de 200 150 4 4
200 y menos de 300 250 10 14
300 y menos de 400 350 21 35 Contiene a Q1
400 y menos de 500 450 33 68 Contiene a Q2
500 y menos de 600 550 18 86 Contiene a Q3
600 y menos de 700 650 9 95
700 y menos de 800 750 5 100
Sumas 100

1(100 )
Primer cuartil: = 1 = = 25
4 4

Posicin que debe ser ubicada en la frecuencia acumulada, para determinar que
clase contiene este cuartil.


(1) 25 14
4
= + 1 = 300 + 100 = 352.38 /2
21

El 25% de las baldosas resiste menos de 352.38 Kg/Cm2 y el 75% tiene una
resistencia superior.

Como el segundo cuartil es lo mismo que la mediana: Me=Q 2=445.45Kg/Cm2


Calculemos la tercera cuartilla k=3


(1) 75 68
4
= + 3 = 500 + 100 = 538.88 /2
18

El 75% de las baldosas tiene una resistencia inferior a 538..88 Kg/Cm2 y el 25%
una resistencia superior.

Pedro Echeverra Bardales Pgina 60


UNIVERSIDAD PRIVADA TELESUP

2. QUINTILES

Los quintiles o quintillas dividen la informacin en cinco partes iguales,


agrupndolas en porcentajes de 20, 40, 60, y 80 por ciento, en consecuencia
debemos calcular cuatro parmetros:

Grficamente:

Q Q Q Q
1 2 3 4
0 20 40 60 80 10
% % % % % 0%


(1)
= + 5
= 1, 2, 3, 4.

Calculemos por ejemplo la segunda quintilla para el ejercicio que traemos:

2(100 ) 4035
k=2; = = 40 2 = 400 + 100 = 415.15 /2
5 5 33

El 40% de las baldosas resiste menos de 415.15 kg/cm2 y el 60% resiste ms.

En el tema anterior, vimos lo referente a las medidas de tendencia central, las


cuales, a su vez, son tambin medidas de posicin ya que, de todas maneras
ocupan un lugar dentro de la informacin.

Nos ocuparemos ahora de ciertos parmetros posicionales muy tiles en la


interpretacin porcentual de la informacin.

3. DECILES

Similarmente, los deciles o decillas dividen la informacin en diez partes iguales, en


cantidades porcentuales de 10 en 10.

ESTADSTICA GENERAL Pgina 61


UNIVERSIDAD PRIVADA TELESUP


(1)
= + 10
= 1, 2, 3, 4 ,9.

Q1 Q2 Q3 Q4 Q5 Q6 Q7 Q8 Q9
0 10 20 30 40 50 60 70 80 90 100
% % % % % % % % % % %

4. CENTILES

Obviamente los centiles dividen la informacin en 100 partes, lo cual facilita la


interpretacin porcentual de una distribucin de frecuencias.


(1)
= + 100
= 1, 2, 3, 4 ,99.

ESTADSTICA GENERAL Pgina 62


UNIVERSIDAD PRIVADA TELESUP

TEMA

Medidas de
Dispersin

ESTADSTICA GENERAL Pgina 63


UNIVERSIDAD PRIVADA TELESUP
TEMA 03: MEDIDAS DE DISPERSIN

En el anlisis estadstico no basta el clculo e interpretacin de las medidas de


tendencia central o de posicin, ya que, por ejemplo, cuando pretendemos representar
toda una informacin con la media aritmtica, no estamos siendo absolutamente fieles
a la realidad, pues suelen existir datos extremos inferiores y superiores a la media
aritmtica, los cuales, en honor a la verdad, no estn siendo bien representados por
este parmetro.

En dos informaciones con igual media aritmtica, no


significa, que las distribuciones sean exactamente iguales,
por lo tanto, debemos analizar el grado de homogeneidad
entre sus datos. Por ejemplo, los valores 5, 50, 95 tiene igual
media aritmtica, y mediana que los valores 49, 50,51; sin
embargo, para la primera informacin la media aritmtica, se
encuentra muy alejada de los valores extremos 5 y 95, cosa
que no ocurre con la segunda informacin que posee igual
media aritmtica y mediana, vemos entonces que la primera
informacin es mas heterognea o dispersa que la segunda.

Para medir el grado de dispersin de una variable, se utilizan principalmente los


siguientes indicadores:

Rango o recorrido

Desviacin media

Varianza y desviacin tpica o estndar

Coeficiente de variabilidad.

1. RANGO O RECORRIDO

Es la medida de dispersin ms sencilla ya que solo considera los dos valores


extremos de una coleccin de datos, sin embargo, su mayor utilizacin est en el
campo de la estadstica no paramtrica.

, son el mximo y el mnimo valor de la variable X, respectivamente.

ESTADSTICA GENERAL Pgina 64


UNIVERSIDAD PRIVADA TELESUP
En el ejemplo introductorio, vemos que el rango para la primera informacin es
R1=95-5=90, mientras que R2=51-49=2, se hace pues manifiesta la gran
dispersin de la primera informacin contra la homogeneidad de la segunda.

2. DESVIACIN MEDIA

La desviacin media, mide la distancia absoluta promedio entre cada uno de los
datos, y el parmetro que caracteriza la informacin. Usualmente se considera la
desviacin media con respecto a la media aritmtica:

: Desviacin media
: Diferentes valores de la
variable X : Nmero de
veces que se repite la


observacin
=
Donde: : Media aritmtica de la

informacin
: Tamao de la muestra.
: Nmero de agrupamientos o
intervalos
Ejemplo:

Salario de 50 Operarias de la Fbrica de Confecciones La Hilacha

Soles por da Xi fi
50 1 4.1 4.1
51 3 3.1 9.3
52 5 2.1 10.5
53 9 1.1 9.9


54 12 0.1 1.2 = = = .
55 10 0.9 9.0
56 5 1.9 9.5
57 3 2.9 8.7
58 2 3.9 7.8
Sumas 50 70

1.4 soles es el error promedio que se comete al


remplazar los ingresos diarios de cada una de las 50
obreras por 54.1 soles.

ESTADSTICA GENERAL Pgina 65


UNIVERSIDAD PRIVADA TELESUP

3. VARIANZA

El problema de los signos en la desviacin media, es eludido tomando los valores


absolutos de las diferencias de los datos con respecto a la media aritmtica.
Ahora bien, la varianza obvia los signos elevando las diferencias al cuadrado, lo
cual resulta ser ms elegante, aparte de que es supremamente til en el ajuste de
modelos estadsticos que generalmente conllevan formas cuadrticas.

La varianza es uno de los parmetros ms importantes en estadstica


paramtrica, se puede decir que, teniendo conocimiento de la varianza de una
poblacin, se ha avanzado mucho en el conocimiento de la poblacin misma.

Numricamente definimos la varianza, como desviacin cuadrtica media de los datos


con respecto a la media aritmtica:

: Varianza
: Valor de la variable X
: Media aritmtica de la
informacin

( )
: Frecuencia absoluta de la
= Donde: observacin xi

: Tamao de la muestra.
: Nmero de agrupamientos o
intervalos

Salario/da de 50 Operarias en la Fbrica de Confecciones La Hilacha (soles)


Soles por da Xi fi
50 1 50 50-54.1=4.1 16.81 16.81
51 3 153 51-54.1=3.1 9.61 28.83
52 5 260 52-54.1=2.1 4.41 22.05
53 9 477 53-54.1=1.1 1.21 10.89
54 12 648 54-54.1=0.1 0.01 0.12
55 10 550 55-54.1=0.9 0.81 8.10
56 5 280 56-54.1=1.9 3.61 10.05
57 3 171 57-54.1=2.9 8.41 25.23
58 2 116 58-54.1=3.9 15.21 30.42
Sumas 50 160.50

ESTADSTICA GENERAL Pgina 66


UNIVERSIDAD PRIVADA TELESUP

Como los datos estn



( )2 160.50 expresados en soles y la
2 = = = 3.21
50 varianza se encuentra en forma
cuadrtica obtenemos una
varianza de 3.21 soles. Sin

( )2 embargo para una mejor
= 2 = = 3.21 = 1.791
comprensin debemos recurrir a
la desviacin tpica o estndar
definida como la raz cuadrada
de la varianza:
El error estndar es de 1.791 soles diarios.

En el ejemplo de las baldosas:

Resistencia de 100 Baldosas de La Fbrica De Las Casas


Resistencia X fi ( )
Kg/cm2

100 y menos de 200 150 4 600 -298 355216


200 y menos de 300 250 10 2500 -198 392040
300 y menos de 400 350 21 7350 -98 201684
400 y menos de 500 450 33 14850 2 132
500 y menos de 600 550 18 9900 102 187272
600 y menos de 700 650 9 5850 202 367236
700 y menos de 800 750 5 3750 302 456020
Sumas 100 44800 1959600


( )2
= 2 = = 19596 = 140 /2

4. COEFICIENTE DE VARIABILIDAD

Generalmente interesa establecer comparaciones de la dispersin, entre diferentes


muestras que posean distintas magnitudes o unidades de medida.

El coeficiente de variabilidad tiene en cuenta el valor de la media aritmtica, para


establecer un nmero relativo, que hace comparable el grado de dispersin entre
dos o ms variables, y se define como:

ESTADSTICA GENERAL Pgina 67


UNIVERSIDAD PRIVADA TELESUP

Comparemos la homogeneidad de las


dos informaciones anteriores, las
= 100
cuales tienen diferente unidad de
medida. Para el salario:

1.791
= 100 = = 0.033 = 3.3%
54.1

Para la resistencia

140 /2
= 100 = = 0.3125 = 31.25%
448 /2

Concluimos que es mucho ms dispersa la informacin correspondiente a la


resistencia de las baldosas.

Pedro Echeverra Bardales Pgina 68


UNIVERSIDAD PRIVADA TELESUP

TEMA

Medidas de
Formas

ESTADSTICA GENERAL Pgina 69


UNIVERSIDAD PRIVADA TELESUP
TEMA 04: MEDIDAS DE FORMAS

Son medidas que determinan numricamente algunas caractersticas de la forma en


que estn distribuidos los datos. Entre estas medidas se tiene: el coeficiente de
asimetra o coeficiente de sesgo y el coeficiente de curtosis.

1. COEFICIENTE DE ASIMETRA

Con frecuencia una distribucin no es simtrica alrededor


de ningn valor, pero en lugar de ello se tiene que los
datos estn ms aglomerados o distribuidos hacia los
extremos. Si hay pocos datos distribuidos hacia el
extremo derecho se dice que la distribucin es sesgada a
la derecha, mientras que si hay pocos datos distribuidos
hacia la izquierda, se dice que la distribucin es sesgada
hacia la izquierda. Las medidas que describen esta
asimetra se denominan coeficiente de sesgo, o
simplemente sesgo. Una de dichas medidas es

es un valor de la variable de estudio


es el valor de la media poblacional
de la variable de estudio.

( ) es el total de datos en la poblacional.
= =
Donde:
La medida ser positiva o negativa si
( )
( )
la distribucin es sesgada a la derecha o
a la izquierda, respectivamente. Para una
distribucin simtrica = .

ESTADSTICA GENERAL Pgina 70


UNIVERSIDAD PRIVADA TELESUP

2. COEFICIENTE DE CURTOSIS

En algunos casos unos datos pueden estar concentrados alrededor de la media,


de manera que la distribucin tiene un pico grande. En otros casos, la distribucin
puede ser relativamente plana. Las medidas que determinan que tan empinada se
encuentra una distribucin se denomina coeficientes de curtosis, o simplemente
curtosis. Una medida que se usa con frecuencia est dada por:

Cuando el valor de 4 = 3 se dice que los


datos se distribuyen forma normal, o de
1 4
4 ( ) campana o mesocrtica. Si 4 >
4 = 4 = 3entonces la distribucin es ms empinada
( )2 4
( ) que la curva normal y se dice que es

leptocrtica. Si 4 < 3 entonces la
distribucin es ms aplanada que la curva
normal y se llama platicrtica.

Observaciones:

Cuando se desea calcular el coeficiente de


sesgo o de curtosis en una muestra slo se
necesita reemplazar en la expresin anterior el
valor de la media poblacional por la media
muestral y el tamao de poblacin por el tamao
de la muestra.

Pedro Echeverra Bardales Pgina 71


UNIVERSIDAD PRIVADA TELESUP
Ejemplo: Clculo de la Curtosis

Calcular el coeficiente de asimetra a partir de los siguientes datos obtenidos de


una muestra.

5 3 3 3 3 3
3 4 3 2 3 3
1 4 3 4 3 2
5 5 2 4 4 2
4 4 1 3 2 2
3 2 3 3 4 3
1 5 5 3 4 1
3 1 2 3 2 3

SOLUCIN

PASO 1: Calculamos la desviacin estndar de muestra.

PASO 2: Calculamos la diferencia de cada valor con respecto


a la media, divido por la desviacin y luego elevado
a la 4.

PASO 3: Se calcula el indicador completo.

Este valor indica que la distribucin es de tipo


platicrtica.

NOTA:

Para calcular este indicador en MS Excel, introduciremos la funcin


llamada CURTOSIS.

ESTADSTICA GENERAL Pgina 72


UNIVERSIDAD PRIVADA TELESUP

3. LECTURAS RECOMENDADAS

Por qu estudiar estadstica?

http://www.cesma.usb.ve/~giselle/FC1621/guiateoricaestadisticaI.prn.pdf

Anlisis de datos con Excel.

http://optimierung.mathematik.uni-
kl.de/mamaeusch/veroeffentlichungen/ver_vortraege/tt_es_dec03_paula1.pdf

4. ACTIVIDADES Y EJERCICIOS

1.- Ingresa a la actividad Medidas de Tendencia, Dispersin y Forma lee atentamente las
instrucciones para descargar el archivo de Word, realizar la actividad y para enviarlo.

Responda las siguientes preguntas:

Qu es una medida de tendencia central?


Cules son las principales medidas de tendencia central?
Defina: media aritmtica mediana y moda.
Cundo se utiliza la media aritmtica ponderada?
Cul es la utilidad de las medidas de dispersin?
Cules son las principales medidas de dispersin?

2.- Ingresa a la actividad la tripulacin de un avin lee atentamente las instrucciones para
descargar el archivo de Word, realizar la actividad y para enviarlo.

La tripulacin de un avin, en su itinerario compra los siguientes galones


de gasolina:
Ciudad X 200 galones a 40 soles el galn
Ciudad Y 250 galones a 35 soles el galn
Ciudad Z 300 galones a 30 soles el galn
Cul es el costo promedio de la gasolina comprada?

ESTADSTICA GENERAL Pgina 73


UNIVERSIDAD PRIVADA TELESUP

5. AUTOEVALUACIN
De la siguiente tabla:

1. La media o promedio es:


a) 145.25
b) 158.69
c) 142.25
d) 120.23
e) 135.25

2. El intervalo mediana es:


a) 400 - 499.99
b) 300 - 349.99
c) 350 399.99
d) 100 149.99
e) 102 202.99

3. La mediana es:
a) 126.30
b)162.21
c) 182.60
d) 120.23
e) 110.23

4. Los quintiles se caracteriza por:


a) Dividen la informacin en cinco partes iguales, agrupndolas de 10 en 10.
b) Dividen la informacin en cuatro partes iguales.
c) Divide la informacin en cinco partes iguales, agrupndolas en porcentajes
de 20, 40, 60, y 80 por ciento 187
d) Dividen la informacin en cuatro partes agrupndolas en porcentajes de
25%, 55%, 10 % y 10%
e) Dividen la informacin en diez partes iguales, en cantidades porcentuales
de 10 en 10.

5. Qu simboliza () :
a) La Frecuencia acumulada hasta el intervalo anterior al que contiene el
quintil
b) Orden del cuartil k = 1,2,3Frecuencia del intervalo que contiene el cuartil
c) La Frecuencia acumulada hasta el intervalo anterior al que contiene el
cuartil.
d) Orden del cuartil k = 1,2,3Frecuencia del intervalo que contiene el quintil
e) Orden del cuartil k = 1,2 Frecuencia del intervalo que contiene el quintil

ESTADSTICA GENERAL Pgina 74


UNIVERSIDAD PRIVADA TELESUP

6. La varianza asciende a:
a) 8979.39
b) 7930.15
c) 7989.93
d) 9387.45
e) 7895.52

7. La desviacin estndar es igual a:


a) 38.89
b) 40.12
c) 55.56
d) 89.38
e) 78.23

8. El Coeficiente de Variacin es:


a) 063
b) 043
c) 073
d) 059
e) 065

9. El coeficiente Asimtrico se caracteriza por:


a) Los datos se distribuyen de forma normal.
b) La distribucin tiene pico grande
c) Con frecuencia una distribucin no es simtrica alrededor de ningn valor.
d) Por los datos que pueden estar concentrados alrededor de la medida
e) La distribucin puede ser relativamente plana

10. Cuales son los pasos para calcular la Curtosis?


a) Calculamos la desviacin estndar de la muestra, calculamos la diferencia
de cada valor con respecto a la media, divido por la desviacin y
luego elevado a la 4. Finalmente se calcula el indicador completo.
b) Calculamos la desviacin media de la muestra, calculamos la diferencia
de cada valor con respecto a la media, divido por la desviacin y
luego elevado a la 4. Finalmente se calcula el indicador completo.
c) Calculamos la desviacin estndar de la muestra, calculamos la diferencia
de cada valor con respecto a la media, divido por la desviacin y
luego elevado a la 4. Finalmente se calcula el indicador completo y
dividirlo entre 2.
d) Calculamos la desviacin estndar de la muestra, calculamos la diferencia
de cada valor con respecto a la media, divido por la desviacin y
luego elevado a la 5. Finalmente se calcula el indicador completo.
e) Calculamos la desviacin estndar de la muestra, calculamos la diferencia
de cada valor con respecto a la media, divido por la diferencia entre
la media y la desviacin y luego elevado a la 4. Finalmente se
calcula el indicador completo.

ESTADSTICA GENERAL Pgina 75


UNIVERSIDAD PRIVADA TELESUP

6. RESUMEN

Las principales medidas de tendencia son:

Media aritmtica.- Es el clculo del promedio de un conjunto de datos.

Moda.- indica el valor o la clase que posee mayor frecuencia.

Mediana.- Equivale al clculo del promedio simple de un conjunto de datos.

La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la
variable y la media aritmtica de la distribucin.

La desviacin tpica S: es la raz cuadrada de la varianza.

Los Percentiles
Son ciertos parmetros posicionales para la interpretacin porcentual de la informacin. Entre
ellos tenemos:

Cuartiles.- Son valores posicionales que dividen la informacin en cuatro partes


iguales.
Quintiles.- Dividen la informacin en cinco partes iguales, agrupndolas en porcentajes de
20, 40, 60, y 80 por ciento,
Deciles.- Dividen la informacin en diez partes iguales, en cantidades porcentuales de 10 en
10.
Centiles.- Dividen la informacin en 100 partes

Medida de Dispersin:
Se llaman medidas de dispersin aquellas que permiten retratar la distancia de los valores
de la variable a un cierto valor central, o que permiten identificar la concentracin de los
datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables
cuantitativas. Utilizando los siguientes indicadores: Rango o recorrido, Desviacin media,
Varianza y desviacin tpica o estandar, y Coeficiente de variabilidad.

Medidas de Forma:
Evala la forma que adopta la distribucin de frecuencias respecto al grado de distorsin
(inclinacin) que registra respecto a valor promedio tomado como centro de gravedad, el
grado de apuntamiento (elevamiento) de la distribucin de frecuencias. A mayor elevamiento
de la distribucin de frecuencia, a mayor concentracin de los datos en torno al promedio,
una menor dispersin de los datos. Estas son: Asimtrica o sesgo y Curtosis. La primera nos
permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central
(Media aritmtica). La asimetra presenta tres estados diferentes: Curva de Asimetra
Negativa, Curva Asimtrica y curva de Asimetra Positiva. La segunda, determina el grado de
concentracin que presentan los valores en la regin central de la distribucin. Determinando
una concentracin de valores (Leptocrtica), una concentracin normal (Mesocrtica) una
baja concentracin (Platicrtica).

ESTADSTICA GENERAL Pgina 76


UNIVERSIDAD PRIVADA TELESUP
UNIDAD DE
APRENDIZAJE

LA CORRELACIN Y LA REGRESIN

COMPETENCIA:

Al finalizar esta unidad usted ser capaz de


Predecir cunto el comportamiento de una variable
modifica el comportamiento de otra variable y
pronostica posibles futuros escenarios a partir de
ESTADSTICA GENERAL Pgina 77
datos pasados.
UNIVERSIDAD PRIVADA TELESUP

2. INTRODUCCIN

a. Presentacin y contextualizacin

Los anlisis de de regresin y correlacin nos mostrarn como determinar tanto


la naturaleza como la fuerza de una relacin entre dos variables, de esta forma
aprenderemos a pronosticar con cierta precisin el valor de una variable
desconocida basndonos en observaciones anteriores a esa y otras variables.

b. Competencia (Logro)

Predice cunto el comportamiento de una variable modifica el comportamiento


de otra variable y pronostica posibles futuros escenarios a partir de datos
pasados.

c. Capacidades

1. Construye tablas de doble entrada e interpreta los sesgos


2. Determina el coeficiente de correlacin de Pearson de dos variables.
3. Utiliza el anlisis de regresin para estimar la relacin entre dos variables,
haciendo uso del mtodo de mnimos cuadrados, predice el futuro
comportamiento con ajuste rectilneo.
4. Utiliza el anlisis de regresin para estimar la relacin entre dos variables,
haciendo uso del mtodo de mnimos cuadrados, predice el futuro
comportamiento con ajuste parablico.

d. Actitudes

Valora la ciencia de la estadstica


Mejora la redaccin de documento cientficos
Muestra rigurosidad para representar relaciones, plantear argumentos y
comunicar resultados

e. Presentacin de ideas bsicas y contenido esenciales de la Unidad.

La Unidad de Aprendizaje 3 comprende el desarrollo de los siguientes


temas:

Tema 01: Tablas de Doble Entrada


Tema 02: Correlacin
Tema 03: Regresin Lineal Con Ajuste Rectilneo
Tema 04: Regresin Lineal Con Ajuste Parablico

ESTADSTICA GENERAL Pgina 78


UNIVERSIDAD PRIVADA TELESUP

TEMA

Tablas de
Doble Entrada

ESTADSTICA GENERAL Pgina 79


UNIVERSIDAD PRIVADA TELESUP
3. DESARROLLO DE CONTENIDOS

Tema 01: TABLAS DE DOBLE ENTRADA

Hasta ahora hemos hecho la tabulacin y el anlisis para una sola variable.
Pero los investigadores, adems de analizar una informacin en forma
individual, generalmente se interesan en establecer cruces y buscar
relaciones entre diferentes variables.

1. TABLAS DE DOBLE ENTRADA

Para la presentacin bidimensional de las variables "X, Y" se procede de la


siguiente manera:

Se ordenan las variables "X, Y" respectivamente


Se tabulan los valores X horizontalmente, y los valores Y
verticalmente.
Se buscan las frecuencias para cada par ordenado (, , ).
Se suma horizontalmente para obtener las frecuencias de Y y
verticalmente para obtener las frecuencias de X , .

Algunos trminos:

, : Valores de la variable X, i=1,2,....m

: Valores de la variable Y, j=1,2,... k

, : Frecuencia de la observacin ,

, : Frecuencia de la observacin ,

: Frecuencia conjunta de los valores

(, , )

ESTADSTICA GENERAL Pgina 80


UNIVERSIDAD PRIVADA TELESUP
, Frecuencia acumulada de la variable X, en el item i

: Frecuencia acumulada de la variable Y, en el item j

, : Frecuencia relativa para la variable X, en el item i

: Frecuencia relativa para la variable Y, en el item j

,: Frecuencia relativa acumulada para la variable X

: Frecuencia relativa acumulada para la variable Y.

Tabla de Doble Entrada para la Representacin de dos Variables X, Y

X
X1 X2 xi xm fyj fayj fryj frayj
Y
Y1 F11 F21 fi1 fm1 Fy1 fay1 fry1 Fray1
Y2 F12 F22 fi2 fm2 Fy2 fay2 fry2 Fray2
: : : : : : : : : : :
yj F1j F2j fij fmj fyj fayj fryj frayj
: : : : : : : : : : :
yk f1k F2k fik fmk fyk n fryk 1.00
fxi Fx1 fx2 fxi fxm n 1.00
faxi fax1 fax2 faxi n
frxi Frx1 frx2 frxi frxm 1.00
fraxi frax1 frax2 fraxi 1.00

Como se puede advertir en la disposicin de las


frecuencias, la interpretacin de la variable Y, puede
hacerse analizando los relativos propios en forma
horizontal, en tanto que el anlisis de la variable X
se hace en forma vertical.

ESTADSTICA GENERAL Pgina 81


UNIVERSIDAD PRIVADA TELESUP
Ejemplo 1:

Experiencia laboral y salario Diario de 50 Obreras de la Fbrica de Confecciones La


Hilacha. X : Experiencia en Aos, Y: Salario en soles

X
2 3 4 5 6 7 8 9 fyj fayj fryj frayj
Y
50 1 1 1 0.02 0.02
51 3 3 4 0.06 0.08
52 5 5 9 0.10 0.18
53 8 1 9 18 0.18 0.36
54 2 9 1 12 30 0.24 0.60
55 3 7 10 40 0.20 0.80
56 3 2 5 45 0.10 0.90
57 2 1 3 48 0.06 0.96
58 1 1 2 50 0.04 1.00
fxi 1 3 5 10 13 11 5 2 50 1.00
faxi 1 4 9 19 32 43 48 50
frxi 0.02 0.06 0.10 0.20 0.26 0.22 0.10 0.04 1.00
fraxi 0.02 0.08 0.18 0.38 0.64 0.86 0.96 1.00

Analizando los relativos para cada una de las variables podemos sacar, entre otras,
las siguientes conclusiones:

El 64% tiene una experiencia igual o inferior a 6 aos.


El 68% tiene una experiencia entre 5 y 7 aos incluyendo sus extremos.
El 60% gana 54 soles diarios o menos.
El 62% gana entre 53 y 55 soles incluyendo sus extremos.

Las tablas de doble entrada


tambin pueden usarse para
variables cualitativas, o combinarse
variables cualitativas con
cuantitativas.

ESTADSTICA GENERAL Pgina 82


UNIVERSIDAD PRIVADA TELESUP
Ejemplo 2:

Estado Civil y Nmero de Hijos de 50 Obreras de la Fabrica La Hilacha"


X: Estado Civil, Y : Nmero De Hijos.

X
Casada Soltera Conviviente Viuda fi fa fr Fra
y
0 11 11 11 0.22 0.22

1 9 2 1 12 23 0.24 0.46

2 4 9 2 2 17 40 0.34 0.80

3 5 1 1 2 9 49 0.18 0.98

4 1 1 50 0.02 1.00

Total 10 30 5 5 50 1.00

% 0.20 0.60 0.10 0.10 1.00

ESTADSTICA GENERAL Pgina 83


UNIVERSIDAD PRIVADA TELESUP

TEMA

Correlacin

ESTADSTICA GENERAL Pgina 84


UNIVERSIDAD PRIVADA TELESUP
Tema 02: CORRELACIN

En el anlisis conjunto para dos o ms variables es


bsica la bsqueda del tipo y grado de la relacin
que pueda existir entre ellas, o si por el contrario, las
variables sean independientes entre s y la relacin
que puedan mostrar se debe nicamente al azar, o a
travs de terceras variables.

El sondeo del tipo y grado de la correlacin, parte desde la misma presuncin del
investigador, teniendo presente que la bsqueda de relaciones entre variables debe
ser lgica, es decir relacionar lo que sea razonable y no datos cuya asociacin sea
desde cualquier punto de vista absurda.

Veamos algunas variables susceptibles de relacionar:

El peso y estatura de un grupo de adultos.


Edad y peso de un grupo de nios.
Ingresos y gastos de arrendamiento de un grupo de familias.
Escolaridad e ingreso mensual de un grupo de empleados.
Ventas y utilidades de un almacn de variedades.

En el cuestionario aplicado a las obreras de la "Hilacha", parece que se indaga por


ciertas variables que puedan explicar el salario devengado por ellas; como podra
ser, los aos de experiencia, los aos de estudio, las ausencias al trabajo, la
evaluacin del desempeo por parte de su supervisor, amn de otras variables que
pueden tener influencia en la asignacin salarial.

Para fortalecer el indicio de correlacin inicial, se grafica cada uno de los


pares ordenados de las variables (xi , yj ) en un plano cartesiano, para
observar la nube de puntos o diagrama de dispersin, donde se advierte la
tendencia o no, de la informacin representada.

ESTADSTICA GENERAL Pgina 85


UNIVERSIDAD PRIVADA TELESUP

Escolaridad y Salario
A pesar de la ilustracin visual
Correlacin positiva
Salarioo en soles 60 que ofrecen las grficas, solo
50 podemos percibir la tendencia,
mas no el grado o fortaleza de la
40
relacin, entre la variable
30
independiente X y la variable
0 10 20
Aos de estudio dependiente Y.

Ausencias y Salario Ausencias y Salario


Sin correlacin Correlacin negativa
60 60

Salarioo en soles
Salarioo en soles

50 50
40 40
30 30
0 20 40 60 0 2 4 6
Ausencias Ausencias

,
Para cuantificar la calidad de la dependencia, entre las dos =
variables, el indicador ms acostumbrado es el Coeficiente de

correlacin, definido como:

Donde:

: Coeficiente de correlacin entre X y Y

: Desviacin tpica de X

: Desviacin tpica de Y

, : Covarianza entre X y Y

ESTADSTICA GENERAL Pgina 86


UNIVERSIDAD PRIVADA TELESUP

En la prctica, cuando no tenemos la informacin agrupada en una tabla de doble


entrada, asumimos que cada observacin bivariada tiene frecuencia unitaria,
entonces r se convierte en:


=
2 ( )2 2 ( )2

Tabla de Trabajo para el Clculo de L Coeficiente de Correlacin


1 1 1 12 12
2 2 2 22 22
. . . . .
. . . . .

2 2

El coeficiente de correlacin, es un indicador del grado


de la relacin entre las dos variables, el cual oscila en
el intervalo cerrado, es decir, 1 1.

Cuando r toma un valor extremo, ya sea r=1 r=-1 existe una


correlacin perfecta positiva o negativa segn el signo, como lo
podemos corroborar en el siguiente ejemplo:

Aspiracin Salarial, de acuerdo a la experiencia de las Obreras de la


Fbrica de Confecciones La Hilacha
Experiencia
0 1 2 3 4 5 6 7 8 9 10
/Aos

Soles /da 56 58 60 62 64 66 68 70 72 74 76

ESTADSTICA GENERAL Pgina 87


UNIVERSIDAD PRIVADA TELESUP
Detalle de resolucin:
Experiencia Soles
n
Aos (X) /da (Y)
1 0 56 0 0 3136
2 1 58 58 1 3364
3 2 60 120 4 3600
4 3 62 186 9 3844
5 4 64 256 16 4096
6 5 66 330 25 4356
7 6 68 408 36 4624
8 7 70 490 49 4900
9 8 72 576 64 5184
10 9 74 666 81 5476
11 10 76 760 100 5776
Sumas 55 726 3850 385 48356


=
2 ( )2 2 ( )2

11 3850 55(726)
=
11 385 55 2 11(48356) (726)2

2420 2420
= = = 1
1210(4840) 2420

Sin embargo, no todas las relaciones son tan ideales, en el comn de los casos
1< r <1. Empricamente se afirma que:

1. Si = 1Correlacin perfecta
2. 0.9 1 1 0.9
3. 0.8 0.9 0.9 0.8 .

ESTADSTICA GENERAL Pgina 88


UNIVERSIDAD PRIVADA TELESUP

4. 0.6 0.8 0.8 0.6


5. 0.3 0.6 0.6 0.3
6. 0.3 0.3

Salario actual y aos de experiencia de 50 Obreras de la Fbrica La Hilacha


Experie
Experien Soles
ncia Soles
cia Aos /da XiYi X2 Y2 XiYi X2 Y2
Aos /da (Y)
(X) (Y)
(X)
4 52 208 16 2704 8 57 456 64 3249
5 54 270 25 2916 6 54 324 36 2916
7 55 385 49 3025 6 55 330 36 3025
6 54 324 36 2916 5 53 265 25 2809
5 53 265 25 2809 7 55 385 49 3025
7 56 392 49 3136 8 56 448 64 3136
5 54 270 25 2916 5 53 265 25 2809
9 58 522 81 3364 9 57 513 81 3249
3 51 153 9 2601 6 54 324 36 2916
6 54 324 36 2916 5 53 265 25 2809
7 54 378 49 2916 2 50 100 4 2500
3 51 153 9 2601 6 55 330 36 3025
6 54 324 36 2916 4 52 208 16 2704
7 55 385 49 3025 5 53 265 25 2809
6 54 324 36 2916 6 54 324 36 2916
8 56 448 64 3136 4 52 208 16 2704
4 52 208 16 2704 8 57 456 64 3249
6 54 324 36 2916 7 56 392 49 3136
5 53 265 25 2809 3 51 153 9 2601
7 55 385 49 3025 8 58 464 64 3364
7 55 385 49 3025 6 55 330 36 3025
7 55 385 49 3025 5 53 265 25 2809
4 52 208 16 2704 6 54 324 36 2916
7 55 385 49 3025 6 53 318 36 2809
5 53 265 25 2809 7 56 392 49 3136
Total 294 2705 16039 1850 146501

ESTADSTICA GENERAL Pgina 89


UNIVERSIDAD PRIVADA TELESUP

Se vislumbra una relacin positiva, con coeficiente de correlacin:


=
2 ( )2 2 ( )2

50 16039 294(2705)
= = 0.957
50(1850 (294)2 50(146501) (2705)2

Entre la experiencia y el salario actual hay una excelente correlacin positiva.

ESTADSTICA GENERAL Pgina 90


UNIVERSIDAD PRIVADA TELESUP

TEMA

Regresin Lineal
con Ajuste
Rectilneo

ESTADSTICA GENERAL
campus.utelesup.com Pgina 91
UNIVERSIDAD PRIVADA TELESUP
Tema 03: REGRESIN LINEAL CON AJUSTE RECTILNEO

Teniendo ya conocimiento de la intensidad de la


correlacin entre las variables, manifestada a
travs del diagrama de dispersin, y el
coeficiente de correlacin, podemos ensayar el
ajuste de un modelo estadstico que se
adapte mejor a las n observaciones; lo que
lleva por nombre regresin.

Uno de los procedimientos muy comunes en el ajuste regresivo es el mtodo de los


mnimos cuadrados, que produce estimaciones con menor error cuadrtico promedio.

1. AJUSTE RECTILNEO (MTODO DE LOS MNIMOS CUADRADOS)


La forma general de una ecuacin de lnea recta es:

= +
Con:

X: Variable independiente

Y: Variable dependiente

a : Trmino independiente o intercepto

b : Coeficiente de X
Debemos establecer los parmetros a y b de la ecuacin para poder
expresar los valores de la variable Y en funcin de los valores de la variable
X, esto es:

1 = + 1 , 2 = + 2 , 3 = + 3 , = +

ESTADSTICA GENERAL Pgina 92


UNIVERSIDAD PRIVADA TELESUP
Multipliquemos cada una de estas ecuaciones por su respectivo valor de X

= + = +

= + = +
= + = +

= + = +
Sumas = + () = + ()

Las ecuaciones (1) y (2) son llamadas ecuaciones normales de la lnea


recta, de donde se pueden despejar los parmetros a, b en funcin de los
datos originales.

De (1) tenemos:


= (3)

Reemplazando (3) en (2) obtenemos


b:

=
2 ( )2

Las estimaciones para los parmetros son:


= , =
2 ( )2

El circunflejo ^ colocado sobre el parmetro indica estimaciones


fundamentadas, en los datos muestrales.

ESTADSTICA GENERAL Pgina 93


UNIVERSIDAD PRIVADA TELESUP

Para ajustar el modelo rectilneo a los ingresos diarios actuales


explicados por los aos de experiencia, en la Hilacha, aprovechamos
los totales ya calculados en el coeficiente de correlacin:

50 16039 294(2705)
= 2 2
= = 1.1
( ) 50 1850 (294)2

2705 1.1(294)
= =
50

= + = 47.63 + 1.1

Como quiera que los tems del


variable salario estn en = (47.63 + 1.1)
unidades de soles, la ecuacin
de pronstico definitiva es:

Experiencia aos Soles / da Soles / da Error Frecuen


(X) (Y) Real (Y) estimado Real - estimado cia
2 50 49.83 0.17 1
3 51 50.93 0.07 3
4 52 52.03 -0.03 5
5 53 53.13 -0.13 8
5 54 53.13 0.87 2
6 53 54.23 -1.23 1
6 54 54.23 -0.23 9
6 55 54.23 0.77 3
7 54 55.33 -1.33 1
7 55 55.33 -0.33 7
7 56 55.33 0.67 3
8 56 56.43 -0.43 2
8 57 56.43 0.57 2
8 58 56.43 1.57 1
9 57 57.53 -0.53 1
9 58 57.53 0.47 1

ESTADSTICA GENERAL Pgina 94


UNIVERSIDAD PRIVADA TELESUP

Salario Real y Estimado Vs. Experiencia


59
58
y = 47.63+11.x
57
56
soles / da

55
54
53
52
51
50
49
0 1 2 3 4 5 6 7 8 9 10
Experiencia en aos

De otro lado corrobora una correlacin positiva excelente r=0.957578 y un


coeficiente de determinacin R-cuadrado, de 91.6956% que indica el porcentaje de
la variable salario explicado por la variable experiencia.

El coeficiente de determinacin R2 viene expresado como:

2
2 = 1 , = , 2 = , 2 =
2

ESTADSTICA GENERAL Pgina 95


UNIVERSIDAD PRIVADA TELESUP

TEMA

Regresin Lineal
con Ajuste
Parablico

ESTADSTICA GENERAL Pgina 96


UNIVERSIDAD PRIVADA TELESUP
Tema 04: REGRESIN LINEAL CON AJUSTE PARABLICO

Suele suceder que al dibujar la nube de puntos correspondiente a n observaciones


bivariante, se observa una tendencia no rectilnea, pero a la cual se le puede ajustar
un modelo terico conocido.

Dentro de la familia de modelos, es de aplicacin comn el ajuste regresivo polinomial


de grado s " 2". Similarmente con el procedimiento seguido en el ajuste rectilneo,
vamos a encontrar las ecuaciones normales par una parbola, de forma general:

= + +

Es decir:

= + + , = + + , . . , = + +

Cada una de estas ecuaciones la multiplicamos por su respectivo valor de x, y


repetimos la accin tenemos:
= + + = + + = + +

= + + 2 2 = 2 + 22 + 23 22 2 = 22 + 23 + 24
. . .
. . .
. . .
= + + = + 2 + 3 2 = 2 + 3 + 4

Sumando se obtienen las siguientes ecuaciones normales:

= + + 2 (1)
De donde se pueden estimar los
= + 2 + 3 (2) parmetros de la parbola
", , .
2 2 3 4
= + + 3

ESTADSTICA GENERAL Pgina 97


UNIVERSIDAD PRIVADA TELESUP
Ejemplo 1:

En un experimento agropecuario, se toma una muestra de 15 unidades de una


variedad de rbol frutal, se observa el rendimiento en frutos de acuerdo con la
cantidad de fertilizante utilizado:

Gramos 1 1 2 2 3 3 4 5 5 6 7 8 9 9 10
Frutos 10 15 30 25 40 43 50 55 54 53 51 47 41 35 30

579 = 15 + 75 + 505

3164 = 75 + 505 + 3915

21088 = 505 + 3915 + 32617

Resolviendo se obtienen las siguientes estimaciones de los parmetros:

= 5.426 , = 20.26 , = 1.7


= 5.426 + 20.26 1.7 2

Parbola ajustada
60

50

40
Frutos

30

20
y = - 5.426+ 20.26x-1.7x2

10

0
0 2 4 6 8 10 12
Gramos

ESTADSTICA GENERAL Pgina 98


UNIVERSIDAD PRIVADA TELESUP
Ejemplo 2: Ajuste de una funcin parablica:

Aplicando el mtodo de los mnimos cuadrados (procedimiento del ajuste


rectilneo) se obtiene el siguiente sistema de ecuaciones:

Resolviendo este sistema se obtiene:

a = -0,47
b = 0,51
c = 1,14
Y*= - 0,47 + 0,51X + 1,14X2

El coeficiente de Determinacin:

ESTADSTICA GENERAL Pgina 99


UNIVERSIDAD PRIVADA TELESUP

3. LECTURAS RECOMENDADAS

Relacin entre variables:


http://www.fisterra.com/mbe/investiga/var_cuantitativas/var_cuantitativas.asp

Anlisis de Regresin con SPSS.


http://support.spss.com/ProductsExt/SPSS/Documentation/SPSSforWindows/S
panish/SPSS%20Regression%20Models%2012.0.pdf

4. ACTIVIDADES Y EJERCICIOS

1. Ingresa a la actividad LA CORRELACIN Y LA REGRESIN lee atentamente las


instrucciones. Descarga el archivo de Word, realiza la actividad y envalo.

Responda las siguientes preguntas:


1. Qu es un coeficiente de correlacin?
----------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------

2. Cuando hay correlacin:


Perfecta-----------------------------------------------------------------------------------------
Excelente----------------------------------------------------------------------------------------
Buena--------------------------------------------------------------------------------------------

3. Cules son las ecuaciones normales de la lnea recta?


----------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------

ESTADSTICA GENERAL Pgina 100


UNIVERSIDAD PRIVADA TELESUP

5. AUTOEVALUACIN
Se tiene informacin sobre nmero de operarios y el tiempo de produccin de
diferentes plantas de cierta empresa.

Gastos Generales 191 170 272 155 280 173 234 116 153 178
Unidades 40 37 30 48 39 56 35 53 42 40

1. La correlacin es:
a) Positiva
b) Negativa
c) Cero
d) Indeterminada
e) Nula

2. El coeficiente de correlacin asciende a:


a) 0.6962
b) -0.9835
c) 0.9835
d) -0.6962
e) 0.9835

3. El coeficiente de determinacin es:


a) 0.4846
b) 0.7296
c) 0.9672
d) 0.5846
e) 0.6945

4. La recta de prediccin de regresin lineal es:


a) y = 0.105x - 52.27
b) y = -0.105x + 62.27
c) y = -0.105x - 62.27
d) y = 0.105x + 52.27
e) y = -0.105x - 52.27

ESTADSTICA GENERAL Pgina 101


UNIVERSIDAD PRIVADA TELESUP

5. Si el nmero de operarios asciende a 320 a Cunto ascender el tiempo


de produccin?
a) -18.67
b) 28.67
c) -95.87
d) 85.87
e) 18.67

De la tabla de ingresos y gastos de alquiler de un grupo de familias:


Ing Gas Ing Gas Ing Gas Ing. Gas Ing. Gas Ing. Gas Ing. Gas
328 118 234 119 236 88 455 154 197 68 240 90 313 125
313 127 415 167 154 76 59 13 366 130 293 98 145 50
455 171 218 73 272 109 301 126 271 103 216 80 206 78
172 84 310 108 324 136 127 79 368 153 454 176 368 140
352 135 231 95 451 155 303 134 344 137 289 115 231 115
265 102 137 63 296 118 106 42 134 49 423 156 371 152
435 142 59 24 166 73 184 75 86 54 391 125 521 197
340 109 400 140 458 179 227 90 277 110 352 130 352 141
367 130 287 96 179 72 531 174 169 68 318 128 269 110
328 119 196 62 217 66 240 90 266 97 347 125 449 133
375 145 325 117 350 161 252 124 589 205 339 111 307 119
251 76 329 133 310 115 240 107 338 106 110 56 260 95
303 110 96 24 334 98 337 106 336 130 184 64 549 222
356 127 420 157 336 93 513 182 345 116 164 78 281 90
148 64 212 81 429 147 325 113 425 124 355 127 225 71
373 134 390 147 307 125 322 126 269 98 416 145 297 105
295 109 456 178 215 100 199 97 353 141 297 127 216 83
321 108 174 64 443 148 74 34 268 86 253 82 325 112
140 59 310 111 203 83 321 106 350 118 148 65 399 144
440 154 376 124 199 97 162 65 399 155 335 111 269 112
414 158 293 133 340 123 384 145 264 129 152 56 347 131
402 137 309 134 270 82 375 143 442 151 295 119 473 155
172 86 294 113 286 120 401 167 239 97 356 123 436 162
301 122 307 140 254 105 321 137 298 105 207 84 358 139
257 93 249 94 540 199 268 111 513 182 361 151 358 129
264 86 422 143 293 104 325 111 514 188 275 93 390 139
406 166 301 117 309 92 290 94 206 66 331 130 448 175
396 158 645 239 329 105 309 116 287 112 349 138 234 89
346 135 363 122 309 128 283 104

6. La correlacin es:
a) Positiva
b) Negativa
c) Cero
d) Indeterminada
e) Nula

ESTADSTICA GENERAL Pgina 102


UNIVERSIDAD PRIVADA TELESUP

7. El coeficiente de correlacin asciende a:


a) 0.9418
b) -0.8871
c) 0.7188
d) -0.4587
e) -0.9415

8. El coeficiente de determinacin es:


a) 0.7869
b) 0.2104
c) 0.5166
d) 0.8869
e) 0.8967

9. La recta de prediccin de regresin lineal es:


a) y = 0.635x + 11.16
b) y = 0.335x + 11.16
c) y = 0.335x + 12.16
d) y = 0.635x + 12.16
e) y = 0.635x - 12.16

10. Si el ingreso de una familia es de 270 unidades a cunto ascender el


gasto en alquiler?
a) 183.61
b) 102.61
c) 182.61
d) 101.61
e) 184.61

ESTADSTICA GENERAL Pgina 103


UNIVERSIDAD PRIVADA TELESUP

6. RESUMEN
UNIDAD DE APRENDIZAJE iii

Al cruzar informacin y buscar la relacin entre diferentes variables cualitativas o


cuantitativas, se utiliza la tabla de doble entrada para la representacin
bidimensional de variables X e Y lo cual ser posible siguiendo una serie de
pasos: ordenar las variables (x e Y), tabular los valores horizontal y verticalmente,
bsqueda de frecuencia por cada coordenada, la obtencin de frecuencias X
(vertical) y frecuencias Y (vertical) adems considerando que en las frecuencias la
interpretacin de la variable Y, puede hacerse analizando los relativos propios en
forma horizontal, en tanto que el anlisis de la variable X se hace en forma
vertical.

La correlacin permite la bsqueda de relaciones entre variables lgicas as como


las variables de peso y estatura de un grupo de ancianos, ingresos y egresos de
un supermercado, etc. El diagrama de dispersin que est conformado por los
pares ordenados permitir observar la tendencia que representa las variables
correlacionadas. Para cuantificar la dependencia se utiliza las formulas del
coeficiente de correlacin ya sea para datos agrupados o no agrupados
(observacin bivariada).

Se genera un modelo estadstico llamado regresin gracias al diagrama de


dispersin y al coeficiente de correlacin. Se utilizan mtodos como los mnimos
cuadrados para estimaciones con menor error, de tal manera se obtengan
ecuaciones normales de la lnea recta que permitan conocer las estimaciones de
los parmetros a y b. De la misma manera tambin se puede calcular el
coeficiente de determinacin con los valores de la varianza.

Si los puntos no muestran una grfica recta sino es bivariante se refiere a una
regresin lineal con ajuste parablico siendo las ecuaciones normales de grado 2,
de las cuales se obtiene las estimaciones de los parmetros de la parbola a, b, c.

ESTADSTICA GENERAL Pgina 104


UNIVERSIDAD PRIVADA TELESUP

UNIDAD DE
APRENDIZAJE

NMEROS E NDICES Y
SERIES DE TIEMPO

COMPETENCIA:
Al finalizar esta unidad usted ser capaz de
Reconocer y utilizar los nmeros ndices para
interpretar fenmenos administrativos y econmicos;
y a la vez analiza las series de tiempo con un manejo
cuantitativo para determinar patrones de los
ESTADSTICA GENERAL
datos
Pgina 105
recolectados a travs del tiempo.
UNIVERSIDAD PRIVADA TELESUP

1. INTRODUCCIN

a) Presentacin y contextualizacin
En algn momento, todo el mundo debe determinar qu tanto ha cambiado algo
en cierto periodo de tiempo, se necesita determinar y definir un grado de cambio,
por lo comn los nmeros ndices son los que nos permiten medir estas
diferencias.
Los pronsticos o predicciones son una herramienta esencial en cualquier proceso
de toma de decisiones, sus aplicaciones varan desde la determinacin de los
requerimientos de inventario hasta la estimacin de futuros comportamiento de
diversas variables.

b) Competencia (Logro)

Reconoce y utiliza los nmeros ndices para interpretar fenmenos administrativos


y econmicos; y a la vez analiza las series de tiempo con un manejo cuantitativo
para determinar patrones de los datos recolectados a travs del tiempo.

c) Capacidades

1. Determina el cociente tambin denominado tasa y realiza comparaciones.


2. Utiliza varios tipos de ndices para tomar decisiones.
3. Comprende el uso de las series de tiempo para la toma de decisiones.
4. Maneja simultneamente las cuatro componentes de una serie de tiempo y
utiliza el anlisis de series de tiempo para pronosticar

d) Actitudes

Valora el uso de las tasa e indicies y el uso de las series de tiempo para la
toma decisiones.
Mejora la redaccin de documento cientficos
Muestra rigurosidad para representar relaciones, plantear argumentos y
comunicar resultados

e) Ideas bsicas y contenido esencial de la Unidad:

La Unidad de Aprendizaje 4 comprende el desarrollo de los siguientes


temas:

Tema 01: Tasas


Tema 02: ndices
Tema 03: Series
Tema 04: Manejo de los componentes

ESTADSTICA GENERAL Pgina 106


UNIVERSIDAD PRIVADA TELESUP

TEMA

Tasas

ESTADSTICA GENERAL Pgina 107


UNIVERSIDAD PRIVADA TELESUP
4. DESARROLLO DE CONTENIDOS

Tema 1: TASAS

Como ya se dijo, el anlisis de un fenmeno basado en las cifras absolutas, ofrece


una idea general de su tendencia o comportamiento; pero para efectos de
establecer comparaciones adecuadas del mismo fenmeno con otra regin, o su
ocurrencia a travs del tiempo, se utilizan ciertos indicadores denominados tasas e
ndices.

1. TASA

Una tasa es la resultante de una fraccin, en donde el numerador est contenido


dentro del denominador.

Cmo se construye una tasa?

En el numerador se debe poner el nmero de individuos afectados por el hecho


en consideracin, a los que denominamos poblacin afectada.
En el denominador se debe poner el nmero total de individuos expuestos al
riesgo de que les ocurra el hecho que estamos considerando, a los que
denominaremos poblacin expuesta.
Asimismo siempre deber multiplicarse el resultado por un mltiplo de 10 (Ej.
1000, 10000, 100000, etc.).


Por lo tanto: =

Ejemplos:


= 1000
D: Tasa de desercin escolar.

R: Nmero de retiros durante el ao.

M: Nmero total de matriculados durante el ao.

ESTADSTICA GENERAL Pgina 108


UNIVERSIDAD PRIVADA TELESUP


= 1000 TE: Tasa de empleo.

PEAO: Poblacin econmicamente activa ocupada.

PEA: Poblacin econmicamente activa

Valga anotar que a las tasas se les debe multiplicar por una
constante k, la cual generalmente es 100, 1000 o mltiplos de
ellos, con el fin de convertirlos en porcentajes, por millares etc.

En demografa, las tasas son de uso frecuente, entre otras, mencionaremos las
siguientes:

Tasa de mortalidad: Indica el nmero de muertes por cada 1000 habitantes de la


poblacin en un ao o periodo determinado.

= 1000

Donde:
TM: Tasa de mortalidad.
D : Nmero de defunciones en un periodo y rea dada.
P : Poblacin total en esa rea a mitad del periodo.

Tasa de natalidad: Indica el nmero de nacimientos por cada 1000 habitantes de


la poblacin en un ao o periodo determinado.


= 1000

TN : Tasa de natalidad
N: Nmero de nacidos vivos ocurridos en un periodo y rea dada
P: Poblacin total del rea a mitad del periodo.

ESTADSTICA GENERAL Pgina 109


UNIVERSIDAD PRIVADA TELESUP

Tasa de nupcialidad: Indica el nmero de matrimonios por cada 1000 habitantes


de la poblacin en un ao o periodo determinado.


= 1000

Donde:

TC : Tasa de nupcialidad.
M : Nmero de matrimonios efectuados en un periodo y rea dada.

P : Total de la poblacin a mitad del periodo.

Tasa de crecimiento poblacional: Es la diferencia entre la tasa de natalidad y la


tasa de mortalidad o tambien la diferencia del nmero de nacimiento y de
defunciones por cada 1000 habitantes de la poblacin en un ao o periodo
determinado.


= 1000

Donde:
TC : Tasa de crecimiento poblacional
M : Nmero de matrimonios efectuados en un periodo y rea dada.

P : Total de la poblacin a mitad del periodo.

ESTADSTICA GENERAL Pgina 110


UNIVERSIDAD PRIVADA TELESUP

TEMA

ndices

ESTADSTICA GENERAL Pgina 111


UNIVERSIDAD PRIVADA TELESUP

Tema 2: NDICES

Un nmero ndice, como comnmente se le


llama, es un indicador de los cambios
relativos de una o ms variables a travs del
tiempo.

Entre las principales aplicaciones de los nmeros ndice, est la de establecer


comparaciones entre los indicadores de las diferentes zonas geogrficas,
profesiones, grupos tnicos etc.

Para la construccin de un nmero


ndice, se procede ante todo, a fijar el
periodo de referencia o "periodo base"
de la serie temporal, teniendo presente
que debe ser un periodo normal, esto
es, que no se hayan presentado
situaciones fortuitas (guerras,
terremotos, incendios u otro tipo de
imprevisto), que incidan en el valor de
la variable para ese periodo. Adems
debe considerarse un periodo reciente
que haga comparables los diferentes
valores de las variables consideradas.

1. NDICE SIMPLE
Un nmero ndice simple, es aquel que se
calcula para una sola variable, dividiendo
cada uno de los valores de la serie
cronolgica, por el valor correspondiente al
"periodo base" previamente definido.

ESTADSTICA GENERAL Pgina 112


UNIVERSIDAD PRIVADA TELESUP
2.1 NDICE DE BASE FIJA


= , si la variable se refiere a precios


= , si la variable se refiere a cantidades

: ndice de precios

: Precio del artculo en el periodo n


: Precio del artculo en el periodo base
: ndice de cantidades

: Cantidad del artculo en el periodo n


: Cantidad del artculo en el periodo base

Precio Promedio del Kilovatio/Hora 1995-2001


Pagado por la fbrica de Confecciones La Hilacha
Ao Precio ndice ndice
Kw/hora 1995 = 100% 1998 = 100%
1995 9 1 0.47
1996 12 1.33 0.63
1997 15 1.67 0.79
1998 19 2.11 1
1999 24 2.67 1.26
2000 30 3.33 1.58
2001 37 4.11 1.95

ESTADSTICA GENERAL Pgina 113


UNIVERSIDAD PRIVADA TELESUP
Consumo promedio de energa en la Fbrica de Confecciones La Hilacha

Ao Precio ndice ndice


Kw/hora 1995 = 100% 1998 = 100%
1995 3333.33 1.00 0.49
1996 6666.67 2.00 0.97
1997 4666.67 1.40 0.68
1998 6842.11 2.05 1.00
1999 5833.33 1.75 0.85
2000 4666.67 1.40 0.68
2001 4324.32 1.30 0.63

En la primera tabla hemos calculado los


ndices de precios simples, con base en 1995
y 1998 respectivamente, pero no se han
tenido en cuenta las cantidades, mientras que
en la segunda tabla se han calculado los
ndices de cantidades sin considerar los
precios.

Calculemos, ahora los ndices del


valor relativo, que considere tanto los

precios como las cantidades: =

Precio y consumo promedio de energa en la Fbrica de Confecciones La


Hilacha
Ao Precio Precio pq ndice ndice
Kw/hora Kw/hora 1995 = 100% 1998 = 100%
1995 9 3333.33 30000 1.00 0.23
1996 12 6666.67 80000 2.67 0.62
1997 15 4666.67 70000 2.33 0.54
1998 19 6842.11 130000 4.33 1.00
1999 24 5833.33 140000 4.67 1.08
2000 30 4666.67 140000 4.67 1.08
2001 37 4324.32 160000 5.33 1.23

ESTADSTICA GENERAL Pgina 114


UNIVERSIDAD PRIVADA TELESUP
2.2 NDICE DE BASE MVIL

Solo hemos considerado, los


ndices simples de base fija, esto
es, con un periodo base
determinado. Es comn que
interese comparar un ndice con el
ndice del periodo inmediatamente
anterior, en consecuencia se debe
fijar el periodo base en el periodo
anterior al referenciado, y as
sucesivamente hasta completar la
serie, al cual se le nombra ndice de
base mvil.

Variaciones del salario promedio diario en La Fbrica de Confecciones


La Hilacha
ndice ndice
Ao Soles / da Variacin
1995 = 100% 1998 = 100%
1995 18.70 1.00 - -
1996 23.80 1.27 1.27 0.273
1997 30.80 1.65 1.29 0.294
1998 38.50 2.06 1.25 0.250
1999 47.00 2.51 1.22 0.221
2000 50.20 2.68 1.07 0.068
2001 54.10 2.89 1.08 0.078

2. NDICES COMPUESTOS (GLOBALES)

Un nmero ndice compuesto, muestra los cambios de un conjunto de


variables, aunque sus unidades de medidas, cantidades y precios, en el
tiempo, sean diferentes entre s.

ESTADSTICA GENERAL Pgina 115


UNIVERSIDAD PRIVADA TELESUP

Cuando hablamos por ejemplo de los ndices indicadores del costo de la canasta
familiar, se toman en cuenta muchos artculos cuyos consumos inciden en el costo
de vida, con una ponderacin o importancia diferente en cada caso.
Colectivamente no es lo mismo un cambio en el precio de la carne, huevos o
leche, que un cambio en el precio de los perfumes, joyas o cualquier otro artculo
suntuoso.

3.1 NDICE DE LASPEYRES

Este ndice asume como ponderaciones, en el clculo del ndice global, las
cantidades de los artculos en el periodo base.

Donde:
=

: ndice de precios global (Laspeyres).

: Cantidad del periodo base.

: Precio del artculo en el periodo base

: Precio del artculo en el periodo n

Cant. Precios Valor de q0 a los precios de

q0 p0 p1 p2 p3 p0 p1 p2 p3
Art. Ao 1998 1998 1999 2000 2001 1998 1999 2000 2001

A 5 10 12 14 15 50 60 70 75
B 10 20 24 25 25 200 240 250 250

C 15 10 10 11 12 150 150 165 180

D 20 25 27 28 30 500 540 560 600


Sumas 900 990 1045 1105

ndice 1.00 1.10 1.16 1.23

ESTADSTICA GENERAL Pgina 116


UNIVERSIDAD PRIVADA TELESUP

3.2 NDICE DE PAASCHE

El estadstico Paasche, sugiere que las


ponderaciones sean las cantidades utilizadas en el =

periodo n. Se obtiene entonces el siguiente
indicador:

Este ndice, es poco utilizado debido al dinamismo de qn , necesitando


nuevas ponderaciones cada vez que se cambia de periodo.

3.3 NDICE IDEAL DE FISHER

Se propone el promedio geomtrico entre los dos ndices anteriores:


= =

Una de las principales aplicaciones de los


ndices de precios, es la de medir la deflacin e
inflacin, que es la variacin que existe en el
poder adquisitivo del dinero. Tambin podemos
utilizar, los ndices de precios al consumidor
para determinar el salario real de un grupo de
personas.

ESTADSTICA GENERAL Pgina 117


UNIVERSIDAD PRIVADA TELESUP

Salario promedio nominal y real en la Fbrica La Hilacha

ndice Variacin Soles / da Soles / da


Aos 1998 = 100% Anual nominal real
1994 50.10 22.59 18.7 37.32
1995 59.86 19.46 23.8 39.76
1996 72.81 21.63 30.8 42.30
1997 85.69 17.68 38.5 44.93
1998 100.00 16.70 47.0 47.00
1999 109.27 9.23 50.2 45.94
2000 118.79 7.81 54.1 45.54

Dado el deterioro del salario real en los dos ltimos aos debera
considerarse un generoso aumento.

ESTADSTICA GENERAL Pgina 118


UNIVERSIDAD PRIVADA TELESUP

TEMA

Series

ESTADSTICA GENERAL Pgina 119


UNIVERSIDAD PRIVADA TELESUP

Tema 3: SERIES

1. INTRODUCCIN:

Una de las motivaciones para el estudio del tema surge desde tiempos
remotos donde una de las principales inquietudes del hombre ha sido
estimar el futuro utilizando informacin del presente y del pasado. Esto se
llama predecir. Es evidente que las diversas instituciones requieren conocer
el comportamiento futuro de ciertos fenmenos con el fin de planificar,
proveer o prevenir.

La Estadstica ha desarrollado teora y


mtodos que apuntan a resolver el
problema de prediccin. Sin embargo, este
no puede ser resuelto por argumentos
puramente matemticos, debe ser el
resultado de una combinacin matemtico-
especialista. La prediccin es una Ciencia
y es un Arte, y la mayor dificultad es la mala
comunicacin entre los analistas de
informacin y de prediccin y los usuarios
de stas.

2. DEFINICIN BSICA DE SERIE DE TIEMPO

Una serie de tiempo es una coleccin o conjunto de mediciones de cierto


fenmeno o experimento registrados secuencialmente en el tiempo, en
forma equi-espaciada ( a intervalos de tiempo iguales) .

Las observaciones de una serie de tiempo sern denotadas por


Donde: ( ), es el valor tomado por el proceso en el instante ti.
( ), ( ), ( ), . ( ),

ESTADSTICA GENERAL Pgina 120


UNIVERSIDAD PRIVADA TELESUP

Ejemplos de series de tiempo:


1. Economa: Precios de un artculo, tasas de desempleo, tasa de
inflacin, ndice de precios, precio del dlar, precio del cobre, precios
de acciones, ingreso nacional bruto, etc.

2. Meteorologa: Cantidad de agua cada, temperatura mxima diaria,


Velocidad del viento (energa elica), energa solar, etc.

3. Geofsica: Series sismolgicas.

4. Qumica: Viscosidad de un proceso, temperatura de un proceso.

5. Demografa: Tasas de natalidad, tasas de mortalidad.

6. Medicina: Electrocardiograma, electroencefalograma.

7. Marketing: Series de demanda, gastos, utilidades,


ventas, ofertas.

8. Telecomunicaciones: Anlisis de seales.

9. Transporte: Series de trfico.

3. ANLISIS GRFICO DE UNA SERIE DE TIEMPO


Por muy simple que parezca, el paso ms importante en el anlisis de series
de tiempo consiste en graficar la serie.

14
12
10
8
6
4
2
0
1 2 3 4 5 6 7 8 9 10 11
Tiempo t

ESTADSTICA GENERAL Pgina 121


UNIVERSIDAD PRIVADA TELESUP

Esto debe hacerse siempre, independiente de cun simples o complejos sean


los procedimientos que se emplean posteriormente.

El grfico de la serie permitir detectar los siguientes elementos:

3.1 OUTLIERS:
Se refiere a puntos de la serie que se escapan de lo normal.
Si se sospecha que una observacin es un outliers, se
debe reunir informacin adicional sobre posibles factores
que afectaron el proceso.

Por ejemplo, en un estudio de la produccin diaria de cobre se present la siguiente


situacin:

12

10

4
outliers
2

0
1 2 3 4 5 6 7 8 9 10 11
Tiempo t

3.2 TENDENCIAS

La tendencia representa el comportamiento


predominante de la serie. Esta puede ser definida
vagamente como el cambio de la media a lo largo de
un extenso perodo de tiempo.

ESTADSTICA GENERAL Pgina 122


UNIVERSIDAD PRIVADA TELESUP

14
12
10
8
6
4
2
0
1 2 3 4 5 6 7 8 9 10 11
Tiempo t

3.3 VARIACIONES CCLICAS O ESTACIONALES

La variacin estacional representa un movimiento peridico de la serie de


tiempo. La duracin del perodo puede ser un ao, un trimestre, un mes, un da,
etc.

9
8
7
6
5
4
3
2
1
0
1 2 3 4 5 6 7 8 9 10 11
Tiempo t

Se suele hacer una distincin entre cclicas y estacionarias. Estas ltimas ocurren
con perodos identificables, como la estacionalidad del empleo, o de la venta
de ciertos productos, cuyo perodo es un ao.

ESTADSTICA GENERAL Pgina 123


UNIVERSIDAD PRIVADA TELESUP

El trmino variacin cclica se suele referir a ciclos grandes, cuyo perodo no es


atribuible a alguna causa. Por ejemplo, fenmenos climticos, que tienen ciclos
que duran varios aos.
Las tendencias y estacionalidades pueden darse simultneamente.

3.4 VARIACIONES ALEATORIAS


Los movimientos irregulares (al azar) representan todos los tipos de
movimientos de una serie de tiempo que no sea tendencia,
variaciones estacionales y fluctuaciones cclicas.

El anlisis grfico de los datos se acostumbra a resumir en una


tabla como la que siguiente:

Tabla de familiarizacin
Estacionalidad Tendencia Aleatoria
Alta
Media
Baja

Ejercicios:

1. Para cada una de las series graficadas a continuacin realizar al


anlisis grfico completando la tabla de familiarizacin.

ESTADSTICA GENERAL Pgina 124


UNIVERSIDAD PRIVADA TELESUP

2. Construya la grfica y la tabla de familiarizacin para la siguiente serie.


Planificacin de un casino
Objetivos: Planificacin de compra de alimentos y necesidades de servicio
para satisfacer la demanda de almuerzo en un gran casino.
Descripcin de la serie.

Serie: Nmero de almuerzos servidos por mes en el casino II de la Universidad


de Campinas-Brasil para el perodo de enero 1977 a marzo de 1980, de acuerdo
a la administracin general del restaurante.

t Xt t Xt
1 20636 21 52232
2 18708 22 58232
3 62944 23 45726
4 50272 24 24550
5 69375 25 30954
6 50056 26 34295
7 20604 27 63167
8 54947 28 42520
9 50576 29 50572
10 50425 30 53875
11 44202 31 27233
12 27604 32 57942
13 28791 33 47610
14 28183 34 61738
15 56632 35 51168
16 56641 36 26370
17 56555 37 42964
18 57185 38 42748
19 33906 39 62390
20 67261

ESTADSTICA GENERAL Pgina 125


UNIVERSIDAD PRIVADA TELESUP

TEMA

Manejo de los
Componentes

ESTADSTICA GENERAL Pgina 126


UNIVERSIDAD PRIVADA TELESUP
Tema 4: MANEJO DE LOS COMPONENTES

Un modelo clsico de manejo de componentes de series de tiempo, supone que la


serie x(1), ...,x(n) puede ser expresada como suma o producto de tres componentes:
tendencia, componente estacional y un trmino de error aleatorio:

() = () + () + ()

() = () () ()

Donde:
T: Tendencia de la serie.
E: Variacin Estacional.
A: Variaciones aleatorias.

El grfico siguiente muestra la serie y sus componentes, para el caso aditivo


El problema que se presenta es modelar adecuadamente las componentes de la serie.

ESTADSTICA GENERAL Pgina 127


UNIVERSIDAD PRIVADA TELESUP
1. ESTIMACIN DE LA TENDENCIA

Hay varios mtodos para estimar la tendencia T(t), uno de ellos es utilizar un
modelo de regresin lineal. Se pueden utilizar otros tipos de regresiones, como
regresin cuadrtica, logstica, exponencial, entre otros.

EJEMPLO 1: La tabla presenta parte de los datos de una serie de energa


elctrica. Son 24 datos referentes a los aos 2007 a 2008.

Consumo de Energa Elctrica


t X(t) t X(t)
1 84.6 13 110.3
2 89.9 14 118.1
3 81.9 15 116.5
4 95.4 16 134.2
5 91.2 17 134.7
6 89.8 18 144.8
7 89.7 19 144.4
8 97.9 20 159.2
9 103.4 21 168.2
10 107.6 22 175.2
11 120.4 23 174.5
12 109.6 24 173.7

200

150
Consumo

100

50
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Ao

ESTADSTICA GENERAL Pgina 128


UNIVERSIDAD PRIVADA TELESUP
El modelo de tendencia propuesto es un modelo de regresin lineal:

= + . + ()

Por mnimos cuadrados se obtiene:

= . + .

La obtencin se realiza tomando en cuenta el cambio de codificacin de aos:

t Tiempo t Tiempo
1 -23 13 1
2 -21 14 3
3 -19 15 5
4 -17 16 7
5 -15 17 9
6 -13 18 11
7 -11 19 13
8 -9 20 15
9 -7 21 17
10 -5 22 19
11 -3 23 21
12 -1 24 23

Ordenada y la pendiente la hallamos as:



= ,
2
t Tiempo (x) X(t) xY X2
1 -23 84.6 -1945.8 529
2 -21 89.9 -1887.9 441
3 -19 81.9 -1556.1 361
4 -17 95.4 -1621.8 289
5 -15 91.2 -1368 225
6 -13 89.8 -1167.4 169
7 -11 89.7 -986.7 121
8 -9 97.9 -881.1 81
9 -7 103.4 -723.8 49
10 -5 107.6 -538 25
11 -3 120.4 -361.2 9
t Tiempo (x) X(t) xY X2

ESTADSTICA GENERAL Pgina 129


UNIVERSIDAD PRIVADA TELESUP
12 -1 109.6 -109.6 1
13 1 110.3 110.3 1
14 3 118.1 354.3 9
15 5 116.5 582.5 25
16 7 134.2 939.4 49
17 9 134.7 1212.3 81
18 11 144.8 1592.8 121
19 13 144.4 1877.2 169
20 15 159.2 2388 225
21 17 168.2 2859.4 289
22 19 175.2 3328.8 361
23 21 174.5 3664.5 441
24 23 173.7 3995.1 529


= = 121.46 = 9757.2

2 = 4600

9757.2
= 121.46 = = = 2.12
2 4600

= 121.46 + 2.12

Se observa un ciclo
La serie con tendencia se de la siguiente manera:
que dura casi todo el
perodo observado, de
200
24 aos.

150
Consumo

100

50
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Ao

ESTADSTICA GENERAL Pgina 130


UNIVERSIDAD PRIVADA TELESUP
2. ESTIMACIN DE LA COMPONENTE ESTACIONAL

Para estimarla, se debe conocer el perodo, y se deben tener datos de varios


perodos consecutivos. Por ejemplo, datos mensuales, estacionalidad de un ao.

EJEMPLO 2: ndice de Produccin mensual de una minera peruana.


Corresponde al nuevo ndice de produccin de una minera peruana,
estructurado a base de la matriz de produccin del 2003. La cobertura de este
indicador comprende casi la totalidad de los productos minerales de la referida
empresa.

2003 2004 2005 2006 2007 2008 2009 2010


Enero 99.6 105 110.8 109.2 112.6 116.4 119.7 122.6
Febrero 94.9 98.6 104.3 103.7 107.6 111.8 113 118.3
Marzo 105.4 109.1 117.5 116.4 121.2 124.3 124.4 128.8

Abril 103.4 108.1 116.1 108 113.8 118 122 125.3


Mayo 104.2 109.2 114.4 111.2 117.9 121.7 123 126.1
Junio 101.3 106.5 111.9 110 113.1 119.1 120.1
Julio 98.7 107.1 110.9 106.4 112.3 116 118.9

Agosto 98.7 105.6 109 108.1 113.4 116.9 119.1


Septiembre 94.8 103.8 105.4 105.7 108.6 111.4 114.6
Octubre 102 110.9 107.7 109.2 115.4 118.4 121.7

Noviembre 98 106.8 106.1 110.7 114.9 117.3 119.9

Diciembre 99.2 108.4 106.5 111.9 114.4 115.7 120.9

ESTADSTICA GENERAL Pgina 131


UNIVERSIDAD PRIVADA TELESUP

Indicador Mensual
140
130
120
110
100
90
80
may-03

may-04

may-05

may-06

may-07

may-08

may-09

may-10
sep-03

sep-04

sep-05

sep-06

sep-07

sep-08

sep-09
ene-03

ene-06

ene-09
ene-04

ene-05

ene-07

ene-08

ene-10
Se estima la tendencia por
regresin lineal = + +

Dando el siguiente resultado:

Intercepto a = 100.3 . Corresponde al valor de partida.


Pendiente b = 0.253 . Corresponde al aumento medio mensual.
Coeficiente de determinacin R2 = 0.74, que indica un ajuste moderadamente
bueno.
El error estndar de los errores se estim en 3.98.

La recta de regresin correspondiente a la tendencia se muestra en el siguiente


grfico:

Indicador Mensual
140

130

120

110

100

90

80
ene-03

sep-03
ene-04

sep-04
ene-05

sep-05
ene-06

sep-06
ene-07

sep-07
ene-08

sep-08
ene-09

sep-09
ene-10
may-07
may-03

may-04

may-05

may-06

may-08

may-09

may-10

ESTADSTICA GENERAL Pgina 132


UNIVERSIDAD PRIVADA TELESUP

Asumiremos un modelo clsico aditivo. Mes Prom.


Entonces para obtener una estimacin de Enero 0.8
la estacionalidad, restamos los valores
Febrero -4.9
ajustados de la tendencia a los
Marzo 6.7
datos, obteniendo una serie sin
Abril 2.4
tendencia. Luego
Mayo 3.8
promediamos todos los valores
Junio 0.8
de enero, los de febrero, los de
Julio -1.2
marzo, etc., obteniendo doce
Agosto -1.3
valores mensuales promedio:
Septiembre -5.4
Octubre 0.2
Noviembre -1.7
Diciembre -1.5

Y se muestran en el siguiente grfico:

Componente Cclico del Indicador Mensual


10
8
6
4
2
0
-2
-4
-6
-8
-10
ene-06

ene-10
ene-03

ene-04

ene-05

ene-07

ene-08

ene-09
may-03

may-07
may-04

may-05

may-06

may-08

may-09

may-10
sep-04

sep-08
sep-03

sep-05

sep-06

sep-07

sep-09

Se observan valores altos a


partir de marzo, y bajos en
torno a septiembre.

ESTADSTICA GENERAL Pgina 133


UNIVERSIDAD PRIVADA TELESUP
3. SUAVIZAMIENTO DE SERIES DE TIEMPO

Una forma de visualizar la tendencia, es mediante suavizamiento de la


serie. La idea central es definir a partir de la serie observada una nueva
serie que filtra o suaviza los efectos ajenos a la tendencia
(estacionalidad, efectos aleatorios), de manera que podamos visualizar
la tendencia

3.1 PROMEDIO MVIL:

Este mtodo de suavizamiento es uno de los ms usados para describir la


tendencia. Consiste en fijar un nmero k, preferentemente impar, como 3, 5, 7,
etc., y calcular los promedios de todos los grupos de k trminos consecutivos
de la serie. Se obtiene una nueva serie suavizada por promedios mviles de
orden k. De este modo se tienden a anular las variaciones aleatorias.

Por ejemplo, consideremos una () ()


serie de seis observaciones y
(1) -
fijemos el orden k=3. Entonces
(2) 1 + 2 + (3)
los trminos de la serie 2 =
3
suavizada son: (3) 2 + 3 + (4)
3 =
3
(4) 3 + 4 + (5)
Ntese que Z(1) y Z(6) no 4 =
3
se pueden calcular. En (5) 4 + 5 + (6)
5 =
general, se pierden k/2 3
(6) -
trminos en cada extremo.

ESTADSTICA GENERAL Pgina 134


UNIVERSIDAD PRIVADA TELESUP
EJEMPLO:
Cantidad de minerales producidos, das mircoles, enero a junio ao 2003 de
cierta minera en el Per.

En las columnas 3 a 6, se
entregan los promedios
mviles de orden 3, 5, 7 y
9, respectivamente.

Mes Cantidad K=3 K=5 K=7 K=9


Ene 713.4
712.6 717.5
726.6 725.4 725.7
737.1 734.2 729.3 728.6
Feb 738.9 735.7 734.8 734.5 734.2
731.1 736.7 740.5 740.3 738.8
740.2 742.2 743.7 744.3 741.5
755.3 749.4 746.8 744.2 741.7
Mar 752.8 754.3 747.9 742.7 740.9
754.8 748.0 745.5 742.5 738.8
736.5 739.9 740.4 739.6 737.4
728.3 731.5 733.9 734.4 734.7
Abr 729.8 726.0 726.7 729.2 729.2
720.0 722.8 722.7 722.2 723.5
718.7 718.4 718.1 717.2 716.8
716.5 713.6 712.4 712.3 714.2
May 705.7 707.8 707.3 710.0 712.4
701.2 700.4 706.3 708.9 710.6
694.2 703.0 705.4 708.1 710.3
713.7 706.7 706.9 708.2 708.9
Jun 712.2 713.0 710.1 708.2 707.4
713.0 714.2 712.5 708.5
717.4 712.1 710.3
706.0 708.8
Jul 703.1

ESTADSTICA GENERAL Pgina 135


UNIVERSIDAD PRIVADA TELESUP
La serie original aparece graficada a continuacin:

Cantidad de Produccin
760.0
750.0
740.0
730.0
720.0
710.0
700.0
690.0
680.0
670.0
660.0
Ene

Feb

May
Mar

Jun
Abr

Jul
Los grficos siguientes corresponden a las medias mviles. Se observa cmo a
medida que aumenta el orden, el efecto del suavizado es mayor. Pero tambin se
pierden ms datos en los extremos.

Cantidad de Produccin k=3


760
750
740
730
720
710
700
690
680
670
M
Ene

Feb

Mar

Jun
Abr

Jul

ESTADSTICA GENERAL Pgina 136


UNIVERSIDAD PRIVADA TELESUP

Cantidad de Produccin k=5


760
750
740
730
720
710
700
690
680

May
Mar
Ene

Abr

Jun

Jul
Feb

Cantidad de Produccin k=7


750
740
730
720
710
700
690
680
May
Mar

Jun
Abr
Ene

Jul
Feb

Cantidad de Produccin k=9


750

740

730

720

710

700

690
May
Mar

Abr

Jun
Ene

Jul
Feb

ESTADSTICA GENERAL Pgina 137


UNIVERSIDAD PRIVADA TELESUP

El suavizamiento de media mvil es muy fcil de


aplicar, permite visualizar la tendencia de la serie.
Pero tiene dos inconvenientes: No es posible obtener
estimaciones de la tendencia en extremos y no
entrega un medio para hacer predicciones.

Si la serie presenta un efecto estacional de perodo k, es conveniente aplicar


un suavizamiento de media mvil de orden k. En tal caso se elimina el efecto
estacional, junto con la variacin aleatoria, observndose solamente la
tendencia.

3.2. SUAVIZAMIENTO EXPONENCIAL

Este modelo se basa en que una observacin suavizada, en tiempo t, es un


promedio ponderado entre el valor actual de la serie original y el valor de la
serie suavizada, en el tiempo inmediatamente anterior. Si X(t) representa la
serie de tiempo original, y Z(t) la serie de tiempo suavizada, entonces lo
anterior se puede escribir:

= + . ( )

En que a es un nmero entre 0 y 1.

Si a es cercano a 1, la serie suavizada pondera ms fuertemente el valor


original, luego ambas se parecen, y en consecuencia, el
suavizamiento es poco.
Si a e acerca a 1/2, se ponderan moderadamente la serie
original y la suavizada, por lo que el suavizamiento es
moderado.
Si a es cercano a cero, (1-a) es cercano a 1, y la serie suavizada pondera
ms fuertemente el valor suavizado inmediatamente anterior, por lo
que el suavizado es importante.

ESTADSTICA GENERAL Pgina 138


UNIVERSIDAD PRIVADA TELESUP

Consecuencia de la frmula anterior es que la serie suavizada se puede


expresar como:

= . + . 1 . 1 + . 1 2 . 2 +. 1 3 . 3 +

Es decir, cada trmino suavizado es un promedio ponderado de todos los


trminos histricos de la serie original, con ponderaciones:

, . 1 , . 1 2 , . 1 3 , . 1 4 ,

Como a est entre 0 y 1, estos nmeros se van


achicando a medida que avanzan. Eso significa que a
medida que nos alejamos hacia el pasado, los
trminos van influyendo cada vez menos en el trmino
presente. La rapidez con que disminuye la influencia
es mayor mientras ms grande (cercano a 1) es a.

Los grficos siguientes muestran las ponderaciones de los trminos hacia el


pasado, cuando a =0.3 y cuando a = 0.7.

Criterio para elegir a: Si la serie vara lentamente, se eligen valores de a cercanos


a 0. (Valor tpico a = 0.3). En cambio, si vara bruscamente, se eligen valores de a
cercanos a 1 (valor tpico a = 0.7).

ESTADSTICA GENERAL Pgina 139


UNIVERSIDAD PRIVADA TELESUP

El mtodo de suavizamiento exponencial sirve para hacer predicciones, pero slo


de un valor, siguiente al ltimo valor observado. Si se tienen observaciones X(t),
X(t-1), X(t-2), ... X(t-k), la prediccin para X(t+1) se hace utilizando la frmula
original del suavizamiento exponencial modificada de la siguiente forma:

+ = . + . . ()

Si se intentara hacer ms de una prediccin, dara el mismo valor, por eso que slo se
usa para predecir un valor a la vez. Sin embargo, en la prctica, cada vez que aparece
una nueva observacin real, se actualiza la frmula anterior, pera predecir la siguiente.

As, cada vez que el tiempo avanza en una unidad, se


predice un nuevo valor a futuro.
El valor de a se que sirve mejor se suele buscar por un sistema de
prueba y error, hasta encontrar el que permite predecir mejor.

EJEMPLO
En el cuadro siguiente se muestra la produccin de minerales de una conocida
empresa peruana.

Ao Trim Produccin 0.3 0.5 0.7

2003 I 7804934 7804934 7804934 7804934


II 8038772 7875085 7921853 7968621
III 7604665 7793959 7763259 7713852
IV 7788918 7792447 7776089 7766398
2004 I 8141434 7897143 7958761 8028923
II 8431424 8057427 8195093 8310674
III 8238641 8111791 8216867 8260251
IV 8489194 8225012 8353030 8420511
2005 I 8658075 8354931 8505553 8586806
II 8910964 8521741 8708258 8813717
III 8468861 8505877 8588560 8572318
IV 8338698 8455723 8463629 8408784
2006 I 8572437 8490737 8518033 8523341

ESTADSTICA GENERAL Pgina 140


UNIVERSIDAD PRIVADA TELESUP
II 8571428 8514945 8544730 8557002
III 8334807 8460903 8439769 8401465
IV 8636370 8513543 8538069 8565899
2007 I 8887713 8625794 8712891 8791169
II 8972978 8729949 8842935 8918435
III 8704303 8722255 8773619 8768543
IV 8971751 8797104 8872685 8910788
2008 I 9175377 8910586 9024031 9096000
II 9342846 9040264 9183438 9268792
III 8960882 9016449 9072160 9053255
IV 9146981 9055609 9109571 9118863
2009 I 9292810 9126769 9201190 9240626
II 9503990 9239935 9352590 9424981
III 9179436 9221786 9266013 9253099
IV 9435570 9285921 9350792 9380829
2010 I 9621810 9386688 9486301 9549516

Junto a los datos se muestran tres suavizamientos exponenciales con a=0.3, a=0.5 y
a=0.7. Como no hay datos indefinidamente hacia el pasado, los primeros trminos de
la serie suavizada salen algo distorsionados, pues no consideran suficientes trminos
hacia atrs. La forma de calcular es la siguiente, partiendo del primer trimestre 1996,
que llamaremos t=1:

1 = 1

2 = . 2 + 1 . (1)

3 = . 3 + 1 . (2)

Como se ve, Z(1) no contiene toda la historia hacia atrs, Z(2) slo un trmino hacia el
pasado, Z(3) slo 2, etc.

ESTADSTICA GENERAL Pgina 141


UNIVERSIDAD PRIVADA TELESUP
Los grficos de la serie y los tres suavizamientos se muestran a continuacin.

En los grficos se puede apreciar que


cuando la constante a es pequea, cercana
a cero, el suavizamiento es significativo. A
medida que aumenta a acercndose a 1, el
suavizamiento es menos y la serie
suavizada se parece ms a la serie
original.
Se dispone de 29 datos. Es posible hacer
una prediccin del trmino de orden 30,
= . + . ()
que corresponde al segundo trimestre de
2010, mediante la frmula:

En el caso de a=0.3,
= . + . =
se tiene:

En el caso a=0.5, la prediccin da 9486301. Y en el caso a=0.7, se obtiene el valor


9549516. Cul de las tres predicciones parece ser mejor?

Produccin real
10000000

9500000

9000000

8500000

8000000

7500000

7000000
2009
2003

2004

2005

2006

2007

2008

2010

ESTADSTICA GENERAL Pgina 142


UNIVERSIDAD PRIVADA TELESUP

Produccin suavizada (a=0.3)


10000000

9500000

9000000

8500000

8000000

7500000

7000000
2003 2004 2005 2006 2007 2008 2009 2010

Produccin suavizada (a=0.5)


10000000

9500000

9000000

8500000

8000000

7500000

7000000
2003 2004 2005 2006 2007 2008 2009 2010

Produccin suavizada (a=0.7)


10000000

9500000

9000000

8500000

8000000

7500000

7000000
2003 2004 2005 2006 2007 2008 2009 2010

ESTADSTICA GENERAL Pgina 143


UNIVERSIDAD PRIVADA TELESUP

3. LECTURAS RECOMENDADAS

LA TEORA DE LOS NDICES DE PRECIOS.


http://revistas.ucm.es/emp/11316985/articulos/CESE9797110071A.PDF
ANLISIS CLSICO DE SERIES TEMPORALES.
http://www.ciberconta.unizar.es/LECCION/seriest/100.HTM

4. ACTIVIDADES

1.- Ingresa a la actividad Nmeros e ndices y series de tiempo lee atentamente


las instrucciones. Descarga el archivo de Word, realiza la actividad y envalo.

Responda el siguiente cuestionario:

a. Qu es una tasa?

-----------------------------------------------------------------------------------------------------

b. Qu es un ndice?

-----------------------------------------------------------------------------------------------------

c. Para qu se utilizan los nmeros ndices?

-----------------------------------------------------------------------------------------------------

-------------------------------------------------------------------------------------------

d. Cmo se construye un nmero ndice simple?

-----------------------------------------------------------------------------------------------------

-------------------------------------------------------------------------------------------

e. Cmo se construye un nmero ndice compuesto?

-----------------------------------------------------------------------------------------------------

--------------------------------------------------------------------------------------------

f. Qu es una serie de tiempo?

---------------------------------------------------------------------------------------------

g. Cmo defines los outliers?

--------------------------------------------------------------------------------------------

h. Conceptualice las variaciones aleatorias.

--------------------------------------------------------------------------------------------

ESTADSTICA GENERAL Pgina 144


UNIVERSIDAD PRIVADA TELESUP

5. AUTOEVALUACIN
Parte 1: Se examina la tasa de crecimiento de ventas de cierta marca de cerveza,
para lo cual se tienen los siguientes datos, Considerando a 1993 como periodo base,
determine:

Zona 2006 2007 2008


Lima Norte 38750 43500 46700
Lima Sur 36300 45400 39900
Lima Este 33850 38300 50200
Lima Metropolitana 48500 55100 62800
Lima Provincia 41900 46200 60150

1. Cul es el ndice de crecimiento en la Zona Lima Norte del 2006 al 2007?


a) 89.1%
b) 23.8%
c) 112.3%
d) 12.3%
e) 12.6%

2. Cul es el ndice de crecimiento de las zonas Lima Este y Lima Sur del
ao 2006 al 2008?
a) 28.4%
b) 128.4%
c) 77.9%
d) 50.6%
e) 52.3%

3. Qu porcentaje ha crecido el consumo en Lima Sur desde el 2007 hasta el


2008?
a) 101.7%
b) 87.9%
c) -12.1%
d) 113.8%
e) -87.9%

ESTADSTICA GENERAL Pgina 145


UNIVERSIDAD PRIVADA TELESUP
4. Cul es el porcentaje de crecimiento de consumo para el departamento de
Lima para el ao 2007?
a) 14.7%
b) 87.2%
c) 28.5%
d) 114.7%
e) 50%

5. Cul es el porcentaje de crecimiento de consumo para el departamento de


Lima para el ao 2008?
a) 130.3%
b) 30.3%
c) 90.7%
d) 9.3%
e) 15.5%

Parte II: Se presenta la serie de tiempo para el nmero de buques cargados en el


Puerto del Callao.
Ao Cantidad
1988 98
1989 105
1990 116
1991 119
1992 135
1993 156
1994 177
1995 208

6. La ordenada es igual a:
a) 29876
b) 139.25
c) -139.25
d) -29876
e) 139.76

ESTADSTICA GENERAL Pgina 146


UNIVERSIDAD PRIVADA TELESUP

7. La pendiente es igual a:
a) 15.07
b) -15.07
c) 7.536
d) -7.536
e) -7.15

8. La ecuacin de la recta es:


a) Y=-29876+15.07x
b) Y=139.25-7.536x
c) Y=29876+7.536x
d) Y=139.25+7.536x
e) Y=7.536x- 139.25

9. Para el ao 2000 la cantidad de nmeros de buques cargados:


a) 216
b) 267
c) 264
d) 180
e) 196

10. Para el ao 2010 la cantidad de nmeros de buques cargados:


a) 418
b) 415
c) 435
d) 398
e) 485

ESTADSTICA GENERAL Pgina 147


UNIVERSIDAD PRIVADA TELESUP

6. RESUMEN

UNIDAD DE APRENDIZAJE IV

Las tasas e ndices nos permiten establecer comparaciones de un fenmeno a


travs del tiempo. La tasa es el resultado de una fraccin, as tenemos como
ejemplo la tasa de empleo, la tasa de mortalidad, la tasa de natalidad y otros.

El ndice es un indicador que muestra los cambios relativos de una o ms


variable a travs del tiempo. Adems nos permite establecer comparaciones
entre indicadores de diferentes zonas o campos. Consta de 3 tipos como el
ndice simple que es calculada para una sola variable, adems maneja otras
clases de ndice como ndice de base fija, de base mvil. Tambin est el
ndice compuesto que muestra los cambios de un conjunto de variables y
dentro de este tipo est el ndice de Laspeyres, Passche, Fisher.

Las series de tiempo es un conjunto de mediciones de un especfico fenmeno


registrados en el tiempo secuencialmente, es as que encontramos ejemplo en
la economa (precios de un artculo, tasa de inflacin, etc), geofsicas (series
sismolgicas),etc. Tambin las series a travs de las grficas ayudan a
detectar elementos como outliers (Puntos de la serie fuera de lo normal),
tendencias que muestra el comportamiento de la serie a lo largo del tiempo,
variaciones cclicas que representa el movimiento peridico de la serie de
tiempo, variaciones aleatorias muestra los movimientos irregulares
representando todos los tipos de movimiento.

El modelo de componentes est conformado por la suma o producto de tres


componentes: tendencia, componente estacional y un trmino de error
aleatorio. Tambin se debe manejar la estimacin de tendencia utilizando
mtodos como el del modelo regresin lineal, as mismo la estimacin del
componente estacional, el suavizamiento de series de tiempo y dentro de ello
el promedio mvil y por ltimo el suavizamiento exponencial donde tiempo es
un promedio ponderado.

ESTADSTICA GENERAL Pgina 148


UNIVERSIDAD PRIVADA TELESUP

III. GLOSARIO

ALEATORIO
Son todos aquellos eventos fortuitos o productos de la suerte.

ALEATORIAMENTE
Actividades o mtodos producidos o llevados a cabo simulando un comportamiento al
azar.

CORRELACIN:
Cuando dos fenmenos sociales, fsicos o biolgicos crecen o decrecen de forma
simultnea y proporcional debido a factores externos, se dice que los fenmenos estn
positivamente correlacionados. Si uno crece en la misma proporcin que el otro
decrece, los dos fenmenos estn negativamente correlacionados. El grado de
correlacin se calcula aplicando un coeficiente de correlacin a los datos de ambos
fenmenos.

COEFICIENTE DE CORRELACIN
Raz cuadrada del coeficiente de determinacin. Su signo indica la direccin de la
relacin entre dos variables, directa o inversa.

DATOS:
Son los valores cualitativos o cuantitativos mediante los cuales se miden las
caractersticas de los objetos, sucesos o fenmenos a estudiar.

DISTRIBUCIN DE FRECUENCIAS:
Distribucin matemtica cuyo objetivo es obtener un conteo del nmero de
respuestas asociadas con los distintos valores de una variable y expresar estos conteos
en trminos de porcentajes.

DISTRIBUCIN DE JI CUADRADA:
Distribucin asimtrica cuya forma depende nicamente del nmero de grados de
libertad. Conforme se incrementa el nmero de grados de libertad, la distribucin de ji
cuadrada se hace ms simtrica.

FRECUENCIA:
Nmero de veces en que se repite un dato.

FRECUENCIA ACUMULADA:
Es el nmero de estudiantes con calificaciones iguales o menores que el rango de cada
intervalo sucesivo.

FRECUENCIA RELATIVA:

ESTADSTICA GENERAL Pgina 149


UNIVERSIDAD PRIVADA TELESUP
Es la proporcin entre la frecuencia de un intervalo y el nmero total de datos.

GRFICA LINEAL:
Presentacin grfica de magnitud en el conjunto de datos mostrado por la pendiente
de una lnea (o lneas) que ha sido situada con respecto a una escala horizontal o
vertical.

GRFICO CIRCULAR:
Crculo que divide en secciones de tal manera que el tamao de cada una de stas
corresponde a una proporcin del total.

GRFICO DE BARRAS:
Presentacin grfica de magnitud en el conjunto de datos, representada por la
longitud de diferentes barras trazadas con referencia a una escala horizontal o vertical.

MEDIDAS DE TENDENCIA.
Estadstica que describe una ubicacin dentro de un conjunto de datos. Las medidas
de la tendencia describen el centro de la distribucin.

POBLACIN:
Conjunto de todos los elementos que comparten un grupo comn de caractersticas, y
forman el universo para el propsito del problema de investigacin. Esta debe
definirse en trminos de: el contenido, las unidades, la extensin y el tiempo.

TENDENCIA:
Es el componente de largo plazo que representa el crecimiento o declinacin de la
serie de tiempo en un periodo amplio.

TEOREMA BAYES:
Frmula para el clculo de la probabilidad condicional bajo condiciones de
dependencia estadstica.

VARIANZA:
Desviacin cuadrada media de todos los valores de la media.

ESTADSTICA GENERAL Pgina 150


UNIVERSIDAD PRIVADA TELESUP

IV. FUENTES DE INFORMACIN

1. BIBLIOGRFICAS

MANUEL CRDOVA ZAMORA - Estadstica Descriptiva e Inferencial -


Quinta Edicin - 2008 Editorial MOSHERA

CARLOS VELIZ CAPUAY - Estadstica Aplicaciones -


Editorial SCG

WILLIAM J. STEVENSON - Estadstica Para Administracin y Economa -


Editorial HARLA

JORGE DAZ PORTOCARRERO - Estadstica Aplicada - Editorial MEGABYTE


- 2006

LIND MARCHAL MASON - Estadstica Para Administracin y Economa -


11 Edicin - Editorial ALFAOMEGA.

MXIMO MITACC - Tpicos de Estadsticas Descriptiva y Probabilidad -


Editorial San Marcos.

2. ELECTRNICAS:

LA TEORA DE LOS NDICES DE PRECIOS.


http://revistas.ucm.es/emp/11316985/articulos/CESE9797110071A.PDF

ANLISIS CLSICO DE SERIES TEMPORALES.


http://www.ciberconta.unizar.es/LECCION/seriest/100.HTM

RELACIN ENTRE VARIABLES:


http://www.fisterra.com/mbe/investiga/var_cuantitativas/var_cuantitativas.asp

ANLISIS DE REGRESIN CON SPSS.


http://support.spss.com/ProductsExt/SPSS/Documentation/SPSSforWindows/S
panish/SPSS%20Regression%20Models%2012.0.pdf

ESTADSTICA GENERAL Pgina 151


UNIVERSIDAD PRIVADA TELESUP

V. SOLUCIONARIO

1. b) 1. c)
2. a) 2. d)
3. a) 3. a)
4. a) 4. c)
5. d) 5. c)
6. c) 6. c)
7. c) 7. c)
8. d) 8. a)
9. a) 9. c)
10. a)) 10. a)

1. b) 1. c)
2. d) 2. b)
3. a) 3. b)
4. b) 4. d)
5. b) 5. a)
6. a) 6. b)
7. a) 7. c)
8. d) 8. d)
9. c) 9. b)
10. b) 10. a)

ESTADSTICA GENERAL Pgina 152

Anda mungkin juga menyukai