Anda di halaman 1dari 25

Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:49:24.
ESTADÍSTICA
Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:49:41.
Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:49:59.
Estadística

Dra. Gilda Melva Franco Espejel * UPIICSA - IPN,


Academias de Matemáticas

Lie. Martha Leticia Hernández * UPIICSA- IPN,


Academias de Matemáticas

Lie. Ernesto García García *


UPIICSA- IPN, Academias de Matemáticas

Ing. Rodolfo Matus Quiroz *


UPIICSA - IPN, Academias de Matemáticas
Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

* Becario del Sistema de Becas por exclusividad, COFAA - IPN


* Participantes del Programa de Estímulo al Desempeño Docente - IPN

Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:50:21.
ESTADÍSTICA
Primera edición: 2003
Primera reimpresión: 2006

© DR 2003. INSTITUTO POLITÉCNICO NACIONAL


Unidad Profesional ínterdisciplinaria de
Ciencias Sociales y Administrativas

Queda prohibida la reproducción total o parcial de esta obra


por cualquier medio o procedimiento, sin la autorización
escrita del editor

ISBN 970-92240-5-0

Impreso en México / Printed in México


Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:50:38.
PRÓLOGO

La Unidad Profesional Interdiscipiinaria de Ingeniería y Ciencias Sociales y Administrativas


(UPHCSA) del Instituto Politécnico Nacional promueve entre su personal académico el diseño
y la elaboración de material didáctico para ofrecer a los estudiantes de las diversas
licenciaturas que se imparten libros de texto acordes al contenido y enfoque de cada
asignatura a precios accesibles en comparación con los disponibles en el mercado.
Con base en lo anterior, y atendiendo a esta iniciativa, nos hemos sumado a este
esfuerzo dando como resultado esta obra denominada "Estadística11, producto derivado del
proyecto de investigación "Material Didáctico para la Enseñanza del Cálculo Integral y la
Estadística", con número de registro CGPI 20031888. Esta obra está dirigida a estudiantes de
nivel licenciatura de las ramas de ingeniería, ciencias médico-biológicas y ciencias sociales y
administrativas que desean una buena base de conceptos y técnicas estadísticas de manera
sencilla y accesible para su comprensión y dominio que les permita aplicarlos a problemas
propios de su actividad profesional para facilitarles la toma de decisiones
En términos generales, cuando se habla de estadística con el común de las personas,
de inmediato se relaciona con porcentajes, promedios y gráficas. Para los más estudiosos,
estadística es una disciplina basada en conceptos, reglas, técnicas y métodos para manejo de
información.
De igual manera, la información estadística que nos llega cotidianamente a través de
Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

los medios masivos de comunicación (prensa, radio, televisión, etc.) influye en nuestra
comprensión de las cosas y, en consecuencia, en tomar decisiones que pudieran afectar
nuestra forma de vida. De manera similar ocurre con las empresas que, para subsistir,
continuamente toman decisiones con base en la información estadística disponible, tanto la
obtenida en un contexto político, económico y social nacional e internacional, como la que se
genera de manera interna por la propia empresa.

Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:51:10.
De aquí, la importancia de estudiar formalmente la estadística y sus técnicas para
entender y comprender mejor el mundo que nos rodea que nos permita la racional toma de
decisiones.
El contenido de este texto requiere, para su estudio, de un amplio conocimiento y
pleno dominio del Cálculo Diferencial e Integral y un curso introductorio de Probabilidad.
Esta obra está estructurada en dos grandes apartados: Estadística Descriptiva y
Estadística Inferencia!. El contenido temático comienza por las Distribuciones Frecuenciales y
las Distribuciones Muéstrales para continuar con los conceptos de Estimación de Intervalos de
Confianza; posteriormente, se plantean las Pruebas de Hipótesis y los Análisis de Regresión y
Correlación.
Los temas son presentados con la base teórica necesaria, sacrificando muchas veces
el rigor matemático en aras de una mejor comprensión y dominio operativo de las técnicas
estadísticas básicas, a través una serie de ejemplos ilustrativos resueltos.
Asimismo, con el propósito de evaluar el aprendizaje, se presenta al final de cada
capítulo una serie de ejercicios propuestos, con su correspondiente solución, para que el
estudiante resuelva y verifique los resultados obtenidos.
Se agradecerá al lector cualquier comentario o sugerencia que contribuya a mejorar el
contenido y alcances de esta obra.
Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

Los Autores

Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:51:10.
______________________________________________________________________________ Contenido

CONTENIDO

CAP. Pág.

I Distribuciones frecuencíales 1
1.1 Distribuciones frecuencia les de datos no agrupados 2
1.1.1 Medidas de tendencia central 2
1.1.2 Medidas de dispersión 4
1.2 Distribuciones frecuenciales de datos agrupados 5
1.2.1 Medidas de tendencia central 6
1.2.2 Medidas de dispersión 8

1.3 Gráficas 8
1.4 Ejemplos resueltos 9
1.5 Problemas propuestos 15

II Distribuciones muéstrales 27
11.1 Distribución muestral de medias 27
11.2 Teorema del limite central 28
11.3 Distribución muestral de diferencia de medias 29
11.4 Distribución muestral de proporciones 29
11.5 Ejemplos resueltos 31
11.6 Problemas propuestos 36
Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

III Estimación e intervalos de confianza 43


II 1.1 Estimación 43
III.2 Intervalos de confianza 45

111.2.1 Intervalos de confianza para conocida 45

III,2.2 Intervalos de confianza para desconocida 46

III.2.3 Intervalos de confianza para

conocidos 46
III

Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:51:10.
Contenido

111.2.4 Intervalos de confianza para


desconocidos 47
111.2.5 Intervalos de confianza de muestra grande para p 47
111.2.6 Intervalos de confianza para 48

111.2.7 Intervalos de confianza para 48

111.2.8 Intervalos de confianza para 49

111.3 Tamaño de muestra y error de estimación 49


111.4 Ejemplos resueltos 50
111.5 Problemas propuestos 57

IV Pruebas de hipótesis 65
IV.1 Tipos de hipótesis 65
IV.2 Tabla de errores tipo I y II 66
IV.3 Hipótesis de una cola y de dos colas 66
IV.4 Procedimiento para resolver una prueba de hipótesis 67
IV.5 Pruebas relativas a medias
(grandes muestras y pequeñas muestras) 67
IV.6 Pruebas relativas a diferencia entre medias
(grandes muestras y pequeñas muestras) 69
Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

1V.6.1 Teorema del limite central 70


IV.7 Pruebas para proporciones en la población 71
IV.8 Pruebas relativas a varianzas 72
IV.9 Hipótesis relativas a dos variancias 73
IV.10 Ejemplos resueltos 75
IV.11 Problemas propuestos 85

IV

Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:51:10.
Contenido

V. Análisis de regresión y correlación 95


V.1 Introducción 95
V.2 Método de mínimos cuadrados 97
V.3 Calculo de un estimador de 98

V.4 Inferencias relativas a la pendiente ib de una recta. 98


V.4.1 Método para desarrollar una prueba de hipótesis 99
V.5 Intervalo de confianza par la pendiente b 100
V.6 Análisis de correlación 100
V.7 Ejemplos resueltos 102
V.8 Problemas propuestos 109

Bibliografía
Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:51:10.
Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:51:10.
____________________________________________________ DISTRIBUCIONES FRECUENCIALES

CAPITULO I

Distribuciones frecuenciaies

El campo de la estadística trata de la recolección, presentación, procesamiento, análisis y


uso de datos para tornar decisiones, solucionar problemas y diseñar productos y procesos.

La estadística se divide en dos grandes ramas: La estadística descriptiva y la estadística


inferencial.

La estadística descriptiva traía de la descripción de una serie de datos y la estadística


inferencial estudia el análisis e interpretación de los datos para obtener conclusiones (o
inferencias).

Los métodos estadísticos se utilizan como ayuda para describir y entender la variabilidad.
Por variabilidad se entiende a las observaciones sucesivas de un sistema o fenómeno que no
producen el mismo resultado.

Por ejemplo: considérese el rendimiento del tanque de gasolina de un automóvil: ¿se


Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

recorrerá siempre el mismo kilometraje con cada tanque de combustible? Por supuesto que
no, en ocasiones el kilometraje variará considerablemente, ya que dependerá de muchos
factores, como son: los cambios en el estado del vehículo como la presión de las llantas, la
compresión del motor, el desgaste de las válvulas; las condiciones de manejo (si es en ciudad
o en carretera), el tipo de octanaje de la gasolina utilizada, de las condiciones meteorológicas,
etc. Estos factores representan fuentes de variabilidad. Considérese la siguiente figura:

Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:51:10.
CAPÍTULO I _____________________________________________________________________

Frecuencia Datos u observaciones

Figura 1

Esta gráfica permite ver dos características de los datos; la localización o tendencia central y
la dispersión o variabilidad.

La localización o tendencia central, puede caracterizarse con el promedio o media.

La variabilidad o dispersión de los datos, puede describirse con la varianza o la desviación


estándar.

1.1 Distribuciones frecuenciales de datos no agrupados

Cuando la población es finita y se consideran todos !os elementos de ella (a tratar, uno a uno),
se trabaja lo que se dice una distribución de datos no agrupados.
Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

1.1.1 Medidas de tendencia central de datos no agrupados

Son aquellas que determinan los valores centrales de los datos de un experimento. Existen
varios tipos de medidas de tendencia central, aquí estudiaremos la media, la mediana y la
moda.

Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:51:10.
_____________________________________________________ DISTRIBUCIONES FRECUENCIALES

Para una serie de datos, sean:


los elementos diferentes, desde

la frecuencia con que se presentan los elementos diferentes,

desde

Se tiene que:

La media es:

La mediana que previo orden, se define según el tamaño del experimento, sea par o
impar.

¡Previo ORDEN!

Si n es impar: Si n es par:
= elemento = media aritmética de
central los elementos
centrales
Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

La moda que será el elemento de mayor frecuencia.

elemento de mayor frecuencia

3
Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:51:10.
CAPÍTULO I ____________________________________________________________________

1.1.2 Medidas de dispersión de datos no agrupados

Son aquellas que indican el grado de dispersión o variabilidad de los datos con respecto a una
medida de tendencia central.

Como medidas de dispersión, se tienen:

El rango R es la diferencia del valor máximo menos el mínimo de los datos. Esto es,

es una sucesión de n observaciones, entonces la


varianza, esta dada por:

Nota: Si se está trabajando con una muestra, el denominador será


Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

En donde la desviación estándar, que es otra medida de dispersión, quedará representada


por:

4
Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:51:10.
____________________________________________________ DISTRIBUCIONES FRECUENCIALES

1.2 Distribuciones frecuenciales de datos agrupados

Cuando se tiene una serie de datos de tal manera que se agrupa en clases, para resolver con
mayor facilidad de tiempo, espacio y/o dinero, se está trabajando con una distribución
frecuencial de datos agrupados.

Para un experimento formado por un número finito n de elementos con k clases de la


misma longitud, donde es decir, número de clases menor o igual que tamaño del
experimento.

Cada clase, estará formada por un limite inferior (U) y un límite superior (LS), ejemplo:

Intervalos de clase
Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

Se hace necesario construir los límites reales. Es decir, límite real inferior (IR//) del intervalo /-
ésimo, es igual a:

y el límite real superior (LRS¡) del intervalo /-ésimo, es igual a:

Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:51:10.
CAPÍTULO I _____________________________________________________________________

tal que, el ejemplo queda:

LRI LI LS LRS
0.5 1 5 5.5
5.5 6 10 10.5
10.5 11 15 15.5
15.5 16 20 20.5
20.5 21 25 25.5

Sea x¡ que denota la marca de clase del intervalo /-ésimo, y que es el punto medio del

intervalo de clase, de tal forma que se calcula de la siguiente manera:

1.2.1 Medidas de tendencia central para datos agrupados

Las medidas de tendencia central para el caso de datos agrupados, se calcularán de la


Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

siguiente manera:

Media aritmética:
marca de clase del intervalo í - ésimo
frecuencia de clase del intervalo i - ésimo

Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:51:10.
___________________________________________________ DISTRIBUCIONES FRECUENCIALES

Para calcular la mediana, se hace necesario primero ordenar los datos, después calcular cuál
es ia posición n/2. Es necesario ubicar en qué intervalo se encuentra dicha posición para

saber cuál es el limite real inferior de la clase mediana Hay que calcular las

frecuencias acumuladas hasta el intervalo de clase anterior a la clase mediana

es igual a la suma de las frecuencias absolutas de los

intervalos de clase anteriores hasta el intervalo / - ésimo). Después ubicar la frecuencia de


clase mediana. y finalmente calcular la longitud del intervalo de la clase mediana

Mediana:

Para la moda se elige el intervalo de mayor frecuencia y se ubica cuál es el limite real inferior

de la clase modal Se hace necesario encontrar que está definido como: la

diferencia de frecuencia de la clase modal con ei intervalo de clase anterior a la clase modal

como la diferencia de frecuencia de la clase modal con el intervalo de clase posterior a


Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

la clase modal. Así como también calcular la longitud del intervalo de clase modal De tal

forma que queda:

Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:51:10.
CAPÍTULO I________________________________________________________________________

1.2-2 Medidas dt dispersión para datos agrupados

Las medidas de dispersión para el caso de datos agrupados, quedan definidas de la manera
siguiente:

Varianza =

es la marca del intervalo i - ésimo


frecuencia de clase del intervalo i - ésimo
tamaño del experimento

La desviación estándar, que se calcula como la raíz cuadrada de la vananza, es decir

Desviación estándar
Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

1.3 Gráficas

Histogramas. Es una representación gráfica. En el eje de las abscisas los limites reales, tal
que, tos puntos medios de cada intervalo serán las marcas de clase y en el eje de las
ordenadas, las frecuencias de clase; de tal manera que quedan rectángulos.

Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:51:10.
_____________________________________________________ DISTRIBUCIONES FRECUENCIALES

Polígonos de frecuencia. Es la unión de las marcas de clase en los techos de los rectángulos
en el histograma. El polígono de frecuencia debe quedar cerrado al principio y al final de la
gráfica, a través del hecho de aumentar un intervalo de clase de la misma longitud y con
frecuencia cero (esto quedará sobre el eje de las abscisas, y se unirá en la marca de clase
respectiva.)

1.4 Ejemplos resueltos

Ejemplo núm. 1

Considerar la siguiente serie de datos: 8,7,6,5,9,15,14,13,11,7,12 calcular


a) la media aritmética,
b) la mediana,
c) la moda,
d) la varíanza y la desviación estándar
e) graficar.
Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

Solución

a) Ordenando los datos:

Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:51:10.
CAPÍTULO I _____________________________________________________________________

xt f(x¡)

5 1
6 1
7 2
8 1
9 1
11 1
12 .1
13 1
14 1
15 1

Justificación teórica

b) Ordenando los datos


Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

elemento central
Mediana = 9
c) Moda, elemento de mayor frecuencia.
Moda = 7

d) La varianza está dada por:

10

Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:51:10.
_____________________________________________________ DISTRIBUCIONES FRECUENCIALES

e)
Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

Gráfica

11
Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:51:10.
CAPÍTULO I _____________________________________________________________________

Ejemplo núm. 2

Calcular la mediana de la siguiente serie de datos;


2, 3, 9, 21, 18, 12, 4, 4, 15, 17

Solución

¡Ordenando los datos!


2, 3, 4, 4 F 9, 12, 15, 17, 18, 21

Los elementos centrales son el 9 y el 12, por lo que:

Mediana =

Ejemplo núm. 3

Sea la siguiente sene de datos agrupados:


Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

a) Calcular la media aritmética


b) Calcular la mediana
c) Calcular la moda
d) Calcular la varíanza y la desviación estándar
e) Graficar histograma y polígono de frecuencia

12
Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:51:10.
______________________________________________________DISTRIBUCIONES FRECUENCIALES

Solución

a) Calculemos las marcas de clase:


Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

13

Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:51:10.
CAPÍTULO I _____________________________________________________________________

POLÍGONO DE FRECUENCIAS
Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

14
Matus, R., et al. Estadística, Instituto Politécnico Nacional, 2010. ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/unadsp/detail.action?docID=3187261.
Created from unadsp on 2019-01-31 17:51:10.