Estadistica para Administradores

Universidad Nacional
Federico Villarreal
GUA ACADMICA
ESTADISTICA PARA ADMINISTRADORES
ADMINISTRACIN V CICLO
Euded
Escuela Universitaria
Educacin a distancia
NDICE
1. PRESENTACIN
2. INTRODUCCIN A LA ASIGNATURA
3. ORIENTACIONES GENERALES DE ESTUDIO
4. TUTORAS
5. CRONOGRAMA
6. EVALUACIN
7. MEDIOS Y RECURSOS DIDCTICOS
8. OBJETIVOS GENERALES
9. MEDIOS Y RECURSOS DIDACTICOS
10. PRIMERA UNIDAD
11. SEGUNDA UNIDAD
12. TERCERA UNIDAD
13. CUARTA UNIDAD
BIBLIOGRAFA
PRESENTACIN
La presente Gua Acadmica de Estadstica para Administradores, fue desarrollado para los
estudiantes de la carrera profesional de Administracin de Empresas.
El propsito de esta gua acadmica de Estadstica para Administradores es capacitar al

estudiante en herramientas estadsticas para el anlisis de la informacin administrativa para que
el futuro profesional de Administracin de Empresas analice los diferentes entornos
empresariales, usando mtodos y tcnicas de la inferencia estadstica para la adecuada toma de
decisiones gerenciales. Este en la capacidad de disear y aplicar modelos estadsticos, que
respondan a los diferentes procesos empresariales y financieros existentes, para describir
situaciones concretas que permitan una adecuada toma de decisiones en la gestin empresarial
demostrando la capacidad de ser actor del cambio participando en forma democrtica y
responsable en los procesos de transformacin del pas y utilice los diferentes mtodos de
muestreo demostrando actitud crtica
Esta gua contiene cuatro unidades distribuidos metodolgicamente, estructurado mediante el

desarrollo de cada unidad con sus respectivos objetivos, actividades, y preguntas de
autoevaluacin.
Se espera que la presente gua constituya una gua efectiva y motive a la vez al estudio y la
dedicacin adecuada que permita el logro de los objetivos. Es claro que el estudio serio y
consciente de ninguna manera se cie a una gua, por el contrario consiste en la profundizacin
o ampliacin de los temas contenidos en esta, considerando que los conocimientos son muy
extensos. Slo a travs de la investigacin Ud. podr encontrar nuevos enfoque ms
actualizados acordes con la realidad actual.
INTRODUCCIN A LA ASIGNATURA
La asignatura de Estadstica para Administradores es un curso de formacin tecnolgica bsica

profesional para todos los estudiantes de la carrera profesional de Administracin de Empresas
que ofrece la Escuela Superior de Educacin a Distancia de la Universidad Nacional Federico
Villarreal.
Esta materia, que se estudia en el quinto ciclo de la carrera, es muy importante porque el
mundo de hoy requiere de profesionales que conozcan las herramientas estadsticas para el
anlisis de la informacin administrativa tiene como objetivo principal analizar los diferentes
entornos empresariales, usando mtodos y tcnicas de la inferencia estadstica para la adecuada
toma de decisiones gerenciales.
La presente Gua Acadmica del Participante de Estadstica para Administradores est

dividida en cuatro unidades. Cada una de ellas tiene cuatro temas, actividades y preguntas de
autoevaluacin que le permitirn poner en prctica lo aprendido. Para desarrollar eficazmente
las unidades, usted deber consultar los textos recomendados y los enlaces correspondientes
que figuran al finalizar cada tema.
En la primera unidad se presentan algunos conceptos y elementos relacionados a la

Estadstica, teora del muestreo y Distribuciones mustrale. En la segunda unidad se analiza la
informacin a travs de estimacin de parmetros, prueba de hiptesis, pruebas
paramtricas y no paramtricas. La tercera unidad trata sobre el Anlisis de regresin Lineal.
Finalmente, en la cuarta unidad vemos la importancia de la aplicacin de mtodos para calcular
los nmeros ndices.
La evaluacin tiene como propsito determinar si los participantes alcanzan los objetivos
propuestos. Para ello, se considera los siguientes criterios: interaccin a travs del chat,
participacin en los foros, presentacin de las tareas encomendadas y las evaluaciones
programadas por la Coordinacin Acadmica de la Escuela Universitaria de Educacin a
Distancia.
Esperamos que esta Gua del Participante les resulte til para lograr los objetivos planteados
en el curso de Estadstica para Administradores.
Recuerde siempre lo siguiente:
Para ser exitoso no tienes que hacer cosas extraordinarias. Haz cosas ordinarias,
extraordinariamente bien. Jim Rohn
ORIENTACIONES GENERALES DE ESTUDIO
Estimados participantes:
La razn de ser de los cursos virtuales es facilitar el acceso a los programas educativos de
aquellos estudiantes cuyos horarios o situacin geogrfica no son compatibles con la formacin
presencial, sin embargo, su objetivo es muy claro: ofrecer una calidad acadmica igual o
superior a la que se brinda en los programas presenciales. Por ello, los programas virtuales se
apoyan en la ms moderna tecnologa informtica y de comunicaciones (aulas virtuales) que
permiten un alto grado de interaccin y orientacin del profesor y una elevada interrelacin
entre los estudiantes.
En las aulas virtuales de la Escuela Universitaria de Educacin a Distancia, nuestros

estudiantes encontrarn, adems de la informacin detallada del programa, los materiales de
estudio, la agenda de actividades propuestas por los profesores y todas las herramientas de
comunicacin que permitirn el desarrollo dinmico del curso. Para comprender y asimilar
adecuadamente el material didctico del curso, se recomienda lo siguiente:
Leer, estudiar y trabajar el material didctico diariamente. Es preferible una hora diaria durante
siete das consecutivos, que 10 horas en un solo da. Las claves del xito son continuidad y
constancia.
Organizar el tiempo de estudio segn las propias condiciones, dificultades y necesidades de

trabajo; en caso contrario el plan de estudios no se cumplir.
Leer varias veces el material y despus comenzar con el resaltado de las ideas principales
para organizar el material de estudio (resmenes, cuadros sinpticos, etc.)
Estudiar en un lugar donde se sienta cmodo para realizar las lecturas y hacer sus tareas.
En lo posible un lugar con claridad y libre de ruido.
TUTORAS
Las tutoras sern desarrolladas mediante la programacin de un calendario de tutoras. stas
sern presenciales y virtuales.
CRONOGRAMA
Cantidad de horas acadmicas
Tutoras presenciales y virtuales Horas de video
Horas presenciales Horas virtuales conferencia
Semana 1 2 2.5 3
UNIDAD I
Semana 2 2 2.5 3
Semana 3 2 2.5 3
UNIDAD II
Semana 4 2 2.5 3
Evaluacin parcial virtual Unidades I II
Semana 5 2 2.5 3
UNIDAD III
Semana 6 2 2.5 3
Semana 7 2 2.5 3
UNIDAD IV
Semana 8 2 2.5 3
Evaluacin final Unidades III IV
16 20 24
TOTAL
60 horas acadmicas
EVALUACIN
El promedio final de la asignatura en la Modalidad Presencial Virtual se obtiene aplicando los
siguientes pasos porcentuales:
Evaluacin de trabajos interactivos (TI): (40%)

Evaluacin parcial (IV): (20%).
Evaluacin final (EF): (40%).
PF = TI (0,4) + IV (0,2) + EF (0,4)
El estudiante que abandona la asignatura tendr promedio 00 (cero) en el acta final, debiendo
registrar nuevamente su matrcula.
MEDIOS Y RECURSOS DIDCTICOS
(Unidad I) Consultar los siguientes textos y enlaces:
Berenson, Mark L. /Levine David (2001). Estadstico para administracin. Mxico, DF:
Pearson Educacin, 2001/734p.
Crdova Zamora, Manuel. (2003). "Estadstica descriptiva e inferencial". Lima:
Moshera, 2003/495p
Leonard J. Kasmier/ Arrioja Juarez. Estadstico aplicada a la administracin y a la
economa. Mxico: Edit. McGraw- Hill. Interamericana, 2006/406p.
Lind, Douglas A./ Mason Robert D. / Marchal, William G. (2001). Estadstica para
administracin y Economa. Mxico DF: McGraw Hill, 2001
Vnculo:
En: https://www.youtube.com/watch?v=Sb3J3Eu7Jmo
https://www.youtube.com/watch?v=zGtk_Ii9VBs
http://jaguar.cgr.go.cr/content/dav/jaguar/Documentos/cgr/centro_conoc/pdfs/economia_estadistic
a/estadistica-adm.pdf
Consultar los siguientes textos y enlaces:
(Unidad II,III)
Leer de :
Moshera, 2003/495p
administracin y Economa. Mxico DF: McGraw.
Thomson Espaa 2006)
Vnculo:
https://www.youtube.com/watch?v=DPpSrsndLJQ
https://www.youtube.com/watch?v=AJcy4eZMwWM
https://www.youtube.com/watch?v=AJcy4eZMwWM
https://www.youtube.com/watch?v=hJysxbj8CHI
Unidad IV Consultar los siguientes textos y enlaces:
Moshera, 2003/495p
administracin y Economa. Mxico DF: McGraw.
Vnculo:
https://www.youtube.com/watch?v=EBKnkb26AM4
Plataforma virtual Herramientas a emplearse en plataforma virtual:
Foros,tareas, chat
Enlaces, videos, examen, pginas entre otros
OBJETIVOS
GENERALES
Analizar los diferentes entornos empresariales, usando mtodos y tcnicas de la inferencia

estadstica para la adecuada toma de decisiones gerenciales.
Disear y aplicar modelos estadsticos, que respondan a los diferentes procesos empresariales
y financieros existentes, para describir situaciones concretas que permitan una adecuada toma
de decisiones en la gestin empresarial demostrando la capacidad de ser actor del cambio
participando en forma democrtica y responsable en los procesos de transformacin del pas.
Analizar los diferentes mtodos de muestreo demostrando actitud crtica.
ESPECIFICOS
Conocer las tcnicas de distribuciones muestrales y sus aplicaciones en el mundo empresarial.
Mejorar la toma de decisiones a travs del planteamiento de hiptesis y el contraste estadstico

utilizando muestras.
Conocer las nociones de las pruebas de hiptesis, y las tcnicas de regresin para resolver
problemas relacionados con los negocios.
Conocer los mtodos de elaboracin de nmeros ndices y su aplicacin a los problemas de

carcter econmico.
PRIMERA UNIDAD
DISTRIBUCIONES MUESTRALES
Estimado participante:
En esta primera unidad estudiaremos sobre las distribuciones muestrales que comprende
conceptos bsicos sobre la teora del muestreo y aplicaciones en base a distribuciones
muestrales.
OBJETIVOS ESPECFICOS
1. Utilizar las tcnicas muestreo para el diseo de muestras.

2. Manejar conceptos y aplicaciones de las distribuciones muestrales.
3. Conocer los requerimientos necesarios para generalizar los resultados obtenidos a partir de
una muestra.
CONTENIDO TEMTICO
1. Teora del muestreo.

2. Tipos de muestreo y seleccin de unidades muestrales
3. Distribuciones de la media muestral con varianza conocida.
4. Distribucin de T-Student, Ji_cuadrado, F de Fisher.
.
TEMA 1 : TEORIA DEL MUESTREO
DEFINICIONES BASICAS
1.1. Poblacin. Se define tradicionalmente la poblacin como el conjunto de todos los

individuos (objetos, personas, eventos, etc.) en los que se desea estudiar el fenmeno.
stos deben reunir las caractersticas de lo que es objeto de estudio. (Latorre, Rincn y
Arnal, 2003). Segn el nmero de elementos, la poblacin puede ser finita o infinita. Cuando
el nmero de elementos que integra la poblacin es muy grande, se puede considerar a esta
como una poblacin infinita.
1.2. Censo. Es el recuento que se hace de una poblacin finita; es decir, debe ser numerable y
contable. Es claro que si la poblacin es grande, los costos y el tiempo sern mucho
mayores que cuando se utiliza muestreo, no obstante, dado la naturaleza de la variable en
estudio y de los objetivos de la investigacin, es posible que en algunos casos se
recomiende ste procedimiento.
1.3. Muestra El Diccionario de la Lengua Espaola (RAE, 2001) define la muestra, como "parte o
porcin extrada de la poblacin por mtodos que permiten considerarla como representativa
de la poblacin
1.4. Muestra Representativa. Es aquella que representa adecuadamente la composicin de la
poblacin, es decir, que las diferentes categoras claves del estudio estn representadas en
la muestra.
1.5. Muestreo. Es el mtodo estadstico por medio del cual se definen los criterios y tcnicas que
deben orientar el proceso de recoleccin u obtencin de informacin. Es claro que el
procedimiento de seleccin y el tamao est cruzado por los objetivos de la investigacin,
las poblaciones son en lo general diferentes y por lo tanto, debern utilizarse criterios
distintos para seleccionar las unidades bajo estudi
1.6. Marco Muestral. Es un conjunto de listas de todas las unidades de muestreo, estas listas,
tambin pueden ser mapas u otras formas que sirvan de base para determinar las unidades
de muestreo.
1.7. Unidad de observacin. Es el objeto sobre el cual se realiza una medicin. Esta es la
unidad bsica de la observacin, a veces llamada elemento.
1.8. Unidad de Muestreo. Es la unidad en la que realizamos la muestra. Por ejemplo,
podramos querer estudiara las personas, pero no tenemos una lista de todos los individuos
que pertenecen a la poblacin. En vez de esto, las familias sirven como las unidades de
muestreo y las unidades de observacin son los individuos que viven en una familia.
1.9. Ventajas y Desventajas del Muestreo
Hay muchas razones por las que el estudio de una muestra es preferible al de la totalidad de la
poblacin.
VENTAJAS DESVENTAJAS
Proporciona informacin confiable con Siempre conlleva a un margen de error
costos mucho menores que las de un de muestreo. Por el hecho de partir de la
censo observacin de solo una parte de la poblacin
Los datos se pueden reunir ms Hacer conclusiones hacia una poblacin

rpido, de modo que las estimaciones se mucho ms grande de la que originalmente
pueden publicar de manera se tom la muestra.
programada
Las estimaciones con frecuencia son Otros errores que no son de muestreo son
mucho ms precisas que las basadas la sub- cobertura, la carencia de respuesta
en un censo y los descuidos en la recoleccin de datos
Permiten inferir la realidad sin

necesidad de estar examinando a toda
la poblacin
TEMA 2 : TIPOS DE MUESTREO Y SELECCIN DE UNIDADES MUESTRALES
2.1. Tipos de Muestreo Existen dos grandes categoras de muestreo:

. MUESTREO NO PROBABILSTICO MUESTREO PROBABILSTICO
Concepto: Entran en esta categora Concepto: Son aquellos en los que cada
todas aquellas muestras en las que individuo de la poblacin tiene una
los individuos se escogen en base a probabilidad perfectamente conocida de
la opinin personal. ser incluida en la muestra.
Tipos de muestreo no probabilstico:
Muestreo por cuotas: Presupone Tipos de muestreo probabilstico:
un buen conocimiento de los estratos
de la poblacin y se selecciona a . Muestreo aleatorio simple
los elementos ms representativos.
Muestreo intencional o de . Muestreo sistemtico
conveniencia: Cuando . Muestreo estratificado
deliberadamente se obtienen . Muestreo por conglomerados
muestras de grupos supuestamente . Muestreo por etapas
tpicos.
Bola de nieve: Se localiza a algunos
individuos, los cuales conducen a
otros, y as hasta conseguir una
muestra suficiente.
Muestreo discrecional: A criterio
del investigador los elementos son
elegidos sobre lo que l cree que
puede aportar al estudio.
2.2. Diseos Muestrales De Uso Frecuente

2.2.1. Muestreo Aleatorio Simple (m.a.s) Es cuando todos los elementos de la poblacin tienen la
misma posibilidad de ser elegidos en la muestra. Este tipo de muestreo es ms
recomendable, pero resulta mucho ms costoso.
Clculo del tamao de la muestra.- Para disear una muestra aleatoria simple se deber
tomar en cuenta varios aspectos relacionados con el parmetro y estimador, el error
muestral, el nivel de confianza y la varianza poblacional:
Parmetro: Se refiere a la caracterstica de la poblacin que es objeto de estudio.
Estimador: Se refiere a la caracterstica de la muestra que es objeto de estudio.
Error muestral: Siempre se comete porque existe una prdida de la representatividad al
momento de escoger los elementos de la muestra.
Nivel de confianza: Es la probabilidad de que la estimacin efectuada se ajuste a la
realidad; es decir, que caiga dentro de un intervalo determinado basado en el estimador y
que capte el valor verdadero del parmetro a medir.
Nivel de confianza 99.73% 99% 98% 96% 95.45% 95% 90% 80% 68.27%
Valores de Z 3.00 2.58 2.33 2.05 2.00 1.96 1.645 1.28 1.00
Para determinar el tamao de la muestra depende de los parmetros que se desean

estimar, es decir que podemos estar interesados en conocer una media aritmtica (), una
proporcin poblacional (p) , diferencias de medias (1- 2) o una diferencia de proporciones
(p1-p2). Para cada uno de los casos mencionados anteriormente existe una determinada
frmula para determinar el tamao de la muestra.
A continuacin presentaremos frmulas para determinar tamao de muestra para estimar
media aritmtica () o proporcin poblacional (p) considerando muestra aleatoria simple o
sistemtica.
Frmula para calcular el tamao de muestra para calcular :

El tamao de muestra cuando no se El tamao de muestra cuando se
conoce la poblacin (Poblacin conoce la poblacin
infinita) (Poblacin finita)
En donde:
Z : Nivel de confianza.
: Desviacin estndar
E : Error mximo.
N : Tamao de la poblacin.
Ejemplo 1: Se quiere estimar las ventas promedio que las Empresas del Rubro de Textilera a
nivel Nacional realizan en un mes . Un estudio anterior de 10 empresas mostr que la desviacin
estndar de sus ventas es de 150 millones de soles Qu tan grande debe ser una muestra para
que la consultora tenga el 95% de confianza de que el error de estimacin es a lo ms de 40
millones de soles?
Solucin:
Entonces se necesita aproximadamente una muestra de 54 empresas para estimar las ventas
promedio con una confianza del 95% y un error mximo de 40 millones de soles
Ejemplo 2: Para el ejemplo anterior. Cunto sera el tamao de muestra si se conoce que el
total de empresas en es de 200 empresas?
Solucin:
Para ello se utilizar la frmula de tamao de muestra cuando se conoce la poblacin,
reemplazando sera:
Por lo tanto, se necesita aproximadamente una muestra de 42 empresas para estimar las ventas
promedio con una confianza del 95% y un error mximo de 40 millones de soles
Frmula para calcular el tamao de muestra para estimar p:
El tamao de muestra cuando no El tamao de muestra cuando se

se conoce la poblacin conoce la poblacin
(Poblacin infinita) (Poblacin finita)
Z: Nivel de confianza elegido.

P: Proporcin.
e: Error mximo.
N: Tamao de la poblacin.
Ejemplo 1: A cuntas familias tendramos que estudiar para conocer la preferencia del
mercado en cuanto a las marcas de shampoo para beb, si se desconoce la poblacin total?
Asumamos los siguientes datos nivel de confianza 95%, una precisin (error muestral) del 3% y la
proporcin esperada de 5%.
Solucin:
Z: 1.96 (95% de confianza)
p: 0.05 (en este caso 5%) q=1-
p=1-0.05=0.95
e: 0.03 (3% error mximo)
Se requerir entrevistar a no menos de 203 familias para poder tener la seguridad del 95%.
Ejemplo 2: Cmo hubiera cambiado el ejemplo 1 anterior, si se desconoce la proporcin

esperada?
Solucin:
Cuando se desconoce la proporcin esperada, se tiene que utilizar el criterio
conservador (p=q=0.5=50%) Z: 1.96 (95% de confianza)
p: 0.5 (en este caso 50%) q=1-
p=1-0.5=0.50
e: 0.03 (3% error mximo)
Se requerir entrevistar a no menos de 1,067 familias para poder tener la seguridad del 95%.
2.2.2. Proceso de seleccin del muestreo aleatorio simple

Para seleccionar una muestra de este tipo: Enumere las unidades de la poblacin, desde 1 hasta
N. Usando la tabla de nmeros aleatorios seleccione la primera unidad para la muestra.
Continuar la seleccin excluyendo las que se repiten. En la actualidad, la generacin de nmeros

aleatorios se realiza de forma automtica a travs del software Excel: Se utiliza la siguiente
funcin= Aleatorio.entre (inferior, superior).
a. Tabla de nmeros aleatorios
La extraccin de una muestra aleatoria simple se efecta seleccionando una a una las n
unidades. La utilizacin de una tabla de nmeros aleatorios implica un mecanismo de
probabilidad muy bien diseado, de manera que garantiza estadsticamente la aleatoriedad de
sus elementos.
Supongamos que deseamos elegir dos nmeros aleatorios entre 1 y 50. Para ello podemos
utilizar pares de nmeros en la tabla y estos pueden ser adyacentes. Iniciemos en la fila 1,
columna 5: nmeros (99) y avancemos a la derecha (67), (16), (41),. El (99) y el (57) no estn
comprendidos entre 1 y 50, de manera que se descarta, el (16) y el (41) s se eligen por estar
comprendidos entre 1 y 50. Por lo tanto, los elementos elegidos seran: el 16 y el 41.
2.2.3. Muestreo Aleatorio Sistemtico
Este muestreo exige que los elementos componentes de la poblacin tengan un orden de posicin
Para obtener una muestra sistemtica se elige una muestra de tamao n y sea K el siguiente
entero despus de dividir N/n (intervalo muestral). Luego, determinamos un nmero aleatorio R
entre 1 y k, el cual determina que la muestra est formada por las unidades numeradas R, R
+ k, R+2k,....., R+ (n-1)k.
Ejemplo de aplicacin 1. Por ejemplo, para elegir una muestra de 45 estudiantes de una lista de
45,000 que estudian en la universidad, el intervalo de muestreo k es 1,000. Supongamos que el
entero aleatorio elegido sea R=597. Entonces los estudiantes numerados como 597, 1597, 2597,.,
44597 estaran en la muestra.
Ejemplo 2. A partir de una lista de 100 establecimientos de comestibles, deseamos seleccionar

una muestra probabilstica de 20 tiendas. La forma de elegir sera:
Dividir 100 entre 20, k=5.

Extraer un nmero aleatorio entre 1 y 5, supongamos R=2, el cual corresponde al primer elemento
seleccionado. Se incluye en la muestra de establecimientos numerados: 2, 7, 12, 17, 22,., 97.
2.2.4. Muestreo Aleatorio Estratificado
Si la variable que nos interesa asume distintos valores promedios en diferentes subpoblaciones.
Podramos obtener estimaciones ms precisas de las cantidades de la poblacin al tomar una
muestra aleatoria estratificada. En el siguiente grfico se puede observar el muestreo aleatorio
estratificado. Asignacin de las observaciones en los estratos:
Asignacin simple. A cada estrato le corresponde igual nmero de elementos.

Asignacin proporcional. Es cuando la integracin de la muestra se hace en base al peso o
tamao de la poblacin en cada estrato.
Asignacin ptima. De poca aplicacin, cuando se toma en cuenta la proporcin de cada estrato
y se conoce la dispersin previsible de los resultados a travs de la desviacin estndar.
Extraemos una muestra independiente en cada estrato ya sea por muestreo aleatorios simple o
sistemtico, posteriormente, reunimos la informacin para obtener las estimaciones globales de la
poblacin.
Ejemplo de aplicacin 1. Seleccin aleatoria en estratos de diferente tamao de acuerdo a su

peso relativo. Ejemplo: Se desea asistir a una visita en una empresa y que se beneficien los
alumnos de todas las escuelas de la UNFV. Por especialidad, el nmero de alumnos difieren entre
ellos, por lo tanto, debo tomar una muestra que refleje el peso relativo de cada especialidad.
2.2.5. Muestreo Aleatorio por Conglomerado
Las unidades que se presentan agrupadas pueden ser consideradas como conglomerados y
pueden servir como base para un procedimiento de muestreo.
Diferencia fundamental entre M.A. Estratificado y M.A. por conglomerado:
En el muestreo estratificado se trata de que cada estrato sea lo ms homogneo posible.

En cambio, en el muestreo por conglomerados el ideal consiste en que contenga elementos de
todas las variedades (heterogneos) que estn mezcladas como se pueda.
El muestreo se realiza seleccionando en forma aleatoria o al azar o en forma sistemtica algunos
conglomerados dentro del conjunto total y procediendo a analizar a la poblacin a travs de
aquellos elementos seleccionados.
Ejemplo de aplicacin . Las unidades hospitalarias, las iglesias, los departamentos acadmicos
en una universidad, una caja de determinado producto, etc., son conglomerados naturales.
Tambin existen los conglomerados no naturales, como por ejemplo, las urnas electorales.
Cuando los conglomerados son reas geogrficas suele hablarse de muestreo de reas.
Ejemplo de aplicacin . Un diseo muestral probabilstico estratificado y por conglomerados. En

una ciudad hay N=5,000 manzanas, las manzanas se utilizan como conglomerados, es decir son
unidades muestrales de las que obtendremos en ltima instancia a nuestros sujetos-adultos.
Primero se determin n=909 manzanas a muestrear.
Cmo distribuiremos las 909 manzanas segn los L=4 estratos socioeconmicos, aplicando
asignacin igual y proporcional?
Solucin:
En el cuadro se muestra que, segn la asignacin, igual tamao muestral de conglomerados
es igual a 227 a cada estrato socioeconmico.
Segn la asignacin proporcional, el tamao muestral a cada estrato vara y se distribuye de la
siguiente manera: 49 conglomerados para el estrato muy alto, 353 para el alto, 364 para el
estrato medio y para el estrato bajo 144 conglomerados.
N Manzanas Asignacin Igual Asignacin Proporcional

Estrato Ni n/L n/N Ni*n/N
Muy Alto 270 227 0,182 49
Alto 1940 227 0,182 353
Medio 2000 227 0,182 364
Bajo 790 227 0,182 144
Total 5000 909
TEMA 3 : DISTRIBUCIONES DE LA MEDIA MUESTRAL CON VARIANZA CONOCIDA
3.1. Distribucin muestral
Una estadstica muestral proveniente de una muestra aleatoria simple tiene un patrn de
comportamiento (predecible) en repetidas muestras. Este patrn es llamado la distribucin
muestral de la estadstica.
Si conocemos la distribucin muestral podemos hacer inferencia.
Distribucin muestral, es un conjunto de todos los valores posibles para un estadstico y la

probabilidad relacionada con cada valor.
Media muestral Xi P(cada. Xi)
150 1/6
200 1/6
250 2/6
300 1/6
350 1/6 Tomando K=6 muestras de
1.0 tamao n cada una
Media de las medias muestrales o gran media o media de medias:
X Xi
K
150 200 250 250 300 350
X 250
6
Varianza De La Distribucin Mustral de las Medias Muestrales
X2 ( X )
( X X )2 2

K K
Del ejemplo anterior:
(150 250 ) 2 (200 250 ) 2 ... (350 250 ) 2

X2 4.167
6
Error Estndar de La Distribucin Muestral de las Medias Muestrales
X X2
En el caso anterior vale 64.55

X
n
Si el muestreo se realiza sin reemplazo y si el tamao de muestra es ms del 5% de la poblacin

(n > 0.05N) debe aplicarse el factor de correccin para poblaciones finitas (FPC) al error estndar.
N n
X
n N 1
3.2. Teorema del lmite central:
El teorema del lmite central es de importancia fundamental para la estadstica porque justifica el
uso de mtodos de curva normal en una gran variedad de problemas; se aplica a poblaciones
infinitas y tambin a poblaciones finitas cuando n, a pesar de ser grande, no constituye ms que
una pequea porcin de la poblacin.
Es difcil sealar con precisin qu tan grande debe ser n de modo que se pueda aplicar el
teorema del lmite central, pero a menos de que la distribucin de la poblacin tenga una forma
muy inusual, por lo regular se considera que n = 30 es lo suficientemente alto. Ntese que cuando
en realidad estamos tomando una muestra de una poblacin, la distribucin del muestreo de la
media es una distribucin normal, no obstante el tamao de n.
F(X)
Distribucin de las medias muestrales
Distribucin de valores individuales
X
sX
n
Distribucin muestral de la media
X 1 , X 2 ,..., X A
n
medida que n se vuelve ms grande, la distribucin de las medias muestrales se
aproximar a una distribucin normal con una media X X / n
Si n( , 2 )
X 1 , X 2 ,..., X n es una muestra aleatoria de una Poblacion (X) con distribucin normal
.Entonces X se distribuye normalmente con media , y varianza 2 /n
Por ejemplo, para los siguientes datos de la poblacin:

DATOS DE LA POBLACIN PARA MOSTRAR EL TEOREMA DEL LMITE CENTRAL
PROMEDIO
2 7 5 5 2 4.2
1 7 7 9 4 5.6
5 8 1 1 5 4.0
7 1 4 1 4 3.4
7 6 9 8 5 7.0
1 6 4 7 9 5.4
7 3 1 7 3 4.2
6 7 9 4 3 5.8
9 7 7 6 1 6.0
8 3 4 4 7 5.2
5 3 3 4 2 3.4
5 9 9 1 9 6.6
5 5 3 9 5 5.4
3 1 9 1 5 3.8
4 3 9 5 5 5.2
9 1 7 7 8 6.4
2 1 7 8 6 4.8
7 7 9 8 3 6.8
3 4 5 6 8 5.2
4 8 3 4 5 4.8
5 3 2 2 6 3.6
8 1 5 5 9 5.6
7 5 9 6 8 7.0
2 2 7 2 1 2.8
3 1 4 1 7 3.2
9 3 2 3 8 5.0
6 2 7 4 4 4.6
5 2 6 8 6 5.4
9 6 2 9 4 6.0
2 6 3 5 5 4.2
9 2 2 3 6 4.4
2 6 6 8 3 5.0
5 4 2 1 9 4.2
4 2 9 4 2 4.2
8 1 2 1 4 3.2
3 2 8 5 4 4.4
5 8 9 6 2 6.0
7 9 3 8 5 6.4
5 6 8 7 5 6.2
9 6 4 8 7 6.8
7 9 9 8 3 7.2
5 5 1 4 6 4.2
8 4 7 8 7 6.8
8 7 7 1 8 6.2
5 5 1 7 5 4.6
7 7 2 9 8 6.6
9 5 2 5 9 6.0
2 5 3 5 8 4.6
4 5 8 4 2 4.6
9 2 6 6 1 4.8
1 7 7 3 4 4.4
7 7 2 8 7 6.2
8 1 1 7 6 4.6
2 2 1 4 9 3.6
9 4 3 7 3 5.2
7 8 4 3 2 4.8
1 2 9 3 8 4.6
2 4 6 2 8 4.4
2 9 3 3 1 3.6
2 6 7 8 7 6.0
El histograma de los datos de la poblacin, es el siguiente:
Histogram of Poblacion
40
30
Frequency
20
10
0
2 4 6 8
Poblacion
Al hacer una prueba de normalidad de Anderson Darling en los datos se tiene:
Como el P value es menor a 0.05 los datos no siguen una distribucin normal.
El histograma de los promedios muestrales (subgrupos de 5 datos) se muestra a continuacin:

Al hacer una prueba de normalidad de Anderson Darling se tiene:
Probability Plot of Muestra

Normal
99.9
Mean 5.073
StDev 1.118
99 N 60
AD 0.527
95 P-Value 0.172
90
80
70
Percent
60
50
40
30
20
10
5
0.1
1 2 3 4 5 6 7 8 9
Muestra
Como el P value es mayor a 0.05 incluso mayor a 0.10, las medias siguen una distribucin normal.
Tomando un tamao de subgrupo de n = 10 se tiene:
PROM.
N=10
4.9 4.7
3.7 4.2
6.2 3.8
5.0 6.2
5.6 6.5
5.0 5.7
4.6 6.5
5.8 5.6
5.8 5.3
5.0 4.7
4.6 5.3
4.9 4.1
4.1 5.0
5.0 4.5
5.1 4.8
Histogram of PROM. N=10
6
Frequency
0
3.5 4.0 4.5 5.0 5.5 6.0 6.5
PROM. N=10
Por lo que con un tamao de muestra de n = 5 es suficiente para mostrar normalidad.

3.3. Aplicacin de las Distribuciones Muestrales
Muchas decisiones en los negocios dependen de una muestra completa no tanto de una
observacin, por tanto se trabaja con la distribucin muestral de las medias o de las proporciones,
para el caso de las medias se tiene:
X X
Z Con este valor se determina P(Z <= z)
X / n
Donde n es el tamao de la muestra y si no se conoce sigma, se estima con el valor de S.

Ejemplo:
Una empresa de constestacin de llamadas telefnicas, est interesada en conocer la
probabilidad de que la media de n llamadas dure un cierto periodo de tiempo, no le interesa una
llamada individual, ya que no le permitira determinar la cantidad de personas que requiere:
Las llamadas durante un mes promediaron 150 seg. Con una desviacin estndar de 15 seg.a.
Cul es la probabilidad de que una llamada en particular dure entre 150 y 155 segundos?
X
Z

155 150 150 150
Z 155 0.33 ; Z 150 0.0
15 15
En tablas P(Z <= 0.33) = 0.6293 ; P(Z<=0) = 0.500
Por tanto P( 0 <= Z <= 0.33) = 0.1293 o 12.93%
TEMA 4 : DISTRIBUCION DE T-STUDENT, JI_CUADRADO, F DE FISHER
4.1. Distribuciones muestrales derivadas de la normal: Chi 2, t y F
Muestra
Aparecen distribuciones muestrales:

Normal, Chi-cuadrada, t-student, F
Poblacin
4.1.1. Distribucin Chi Cuadrada
Esta distribucin se forma al sumar los cuadrados de las variables aleatorias normales estndar.
Si Z es una variable aleatoria normal, entonces el estadstico Y siguiente es una variable aleatoria
Chi cuadrada con n grados de libertad.
y z12 z22 z32 .... zn2

Media y varianza de una ji-cuadrada.
E(X)=k
V(X)=2k
Calculo de puntos crticos usando las tablas de ji-cuadrada
P( X ,k )
2
Grficas de la distribucin ji-cuadrada
K=1 K=5
K=50
K=25
Con k grande ji-cuadrada se hace normal
Ejemplo: Calcule el valor critico que satisface
P( X 0.05, 20 ) .05
2
De tablas de ji-cuadrada con alfa=.05 y k=20
0.05, 202 31.41

Si X 1 , X 2 ,..., X n es una muestra aleatoria de una Poblacion (X) con distribucin normal
.Entonces sendistribuye (n 1k=
( , 2 ) ji-cuadrada con ) n-1
2 grados de libertad.
S
Donde S cuadrada es la varianza muestral. 2
(n 1)
S 2 n21
2
4.1.2. Distribucin t-student
Si X , X ,..., X es una muestra aleatoria de una poblacin (X) con distribucin no rmal
1 2 n
. Entonces n( , se
2 distribuye
) ( X ) (s / n)
t-student con n-1 grados de libertad
( X ) (s / n) tn1
Funcin de Distribucin t-student
[(k 1) / 2]
f ( x)
k [k / 2][ x 2 / 2 1]( k 1) / 2
x (, )
K=1
K=10
K=100
La media y la varianza de la distribucin t son:
0
k
; k 3
k 2
De una muestra aleatoria de n artculos, la probabilidad de que
x
t
s/ n
Caiga entre dos valores especificados es igual al rea bajo la distribucin de probabilidad t de
Student con los valores correspondientes en el eje X, con n-1 grados de libertad
Ejemplo:
La resistencia de 15 sellos seleccionados aleatoriamente son: 480, 489, 491, 508, 501, 500, 486,
499, 479, 496, 499, 504, 501, 496, 498
Cul es la probabilidad de que la resistencia promedio de los sellos sea mayor a 500?. La media
es 495.13 y la desviacin estndar es de 8.467.
t = -2.227 y el rea es 0.0214
495.13 500
t 2.227
8.467 / 15
4.1.3. Distribucin F
Surge de dividir dos ji-cuadradas independientes
F=(W/u)/(Y/v)
W se distribuye ji-cuadrada con u g.l.

Y se distribuye ji-cuadrada con v g.l.
El uso de esta distribucin es para comparar varianzas

Recuerde el anlisis de varianza)
Distribucin F.
[(u v) / 2]u / v 2 x ( u / 2 ) 1
u
f ( x)
u
(u / 2)[v / 2][ x 1]( k v ) / 2
v
x (0, )
u=10 u=20
v=5 v=20
Para determinar la otra cola de la distribucin F se determina con la expresin.
Falfa, k1, k2 = 1 / F(1-alfa), k2, k1
Dado K1 = 8 y K2 = 10, F0.05 = 3.07, encontrar el valor de F0.05 con K1 = 10 y K2 = 8
F0.05,10,8 = 1/ F0.95,8,10 = 1/ 3.07 = 0.326
.
ACTIVIDADES RECOMENDADAS
La actividad es la esencia de la felicidad del hombre Johan W. Goethe
Una vez finalizado el estudio de la primera unidad, es importante que repase los conceptos
y practique adecuadamente los ejercicios de la Gua Acadmica del Participante
INTERACTIVIDAD A TRAVS DE LA PLATAFORMA VIRTUAL
Ingrese peridicamente al campus virtual que se encuentra en la siguiente direccin

http://euded.unfv.edu.pe/para obtener mayor informacin sobre el tema (documentos en
digital, artculos, etc.), conocer los anuncios que se escriben semanalmente y participar en los
chats y foros; adems puede conocer a sus compaeros e intercambiar conocimientos y
experiencias de estudio.
SEGUNDA UNIDAD
ESTIMACION DE PARAMETROS, PRUEBA DE HIPOTESIS, PRUEBAS NO

PARAMETRICAS Y NO PARAMETRICAS
En esta segunda unidad estudiaremos Estimacin de parmetros y prueba de hiptesis, pruebas
no paramtricas y no paramtricas.
1. Identificar y aplicar los diferentes modelos de estimacin de parmetro puntual y por

intervalos.
2. Conocer y aplicar las pruebas de hiptesis en problemas especficos.
3. Conocer la principales pruebas paramtricas y no paramtricas
CONTENIDO TEMTICO
1. Introduccin a la Estadstica Inferencial, estimacin puntual e intervalo de confianza.

2. Prueba de hiptesis para la media, varianza, proporcin poblacional. Prueba de Hiptesis para
la diferencia de dos medias
3. Prueba de Chi cuadrado, Prueba de bondad de ajuste, Tablas de contingencia, prueba de
contingencia, prueba de homogeneidad, pruebas de hiptesis de Wilconson
TEMA 1 : INTRODUCCIN A LA ESTADSTICA INFERENCIAL, ESTIMACIN PUNTUAL E
INTERVALO DE CONFIANZA.
Se puede definir a la Inferencia Estadstica como el conjunto de mtodos estadsticos que

permiten deducir (inferir) como se distribuye la poblacin en estudio a partir de la informacin que
proporciona una muestra.
1.1. ESTIMACIN DE PARMETROS
Las razones para efectuar una estimacin en una poblacin, en lugar de estudiarla directamente,
pueden ser: que el tamao de la poblacin sea infinito, que la poblacin sea finita pero demasiado
grande, y otras razones como costo o tiempo. Por ello parece ms prctico tomar muestras. Hay
dos maneras bsicas de hacer estimaciones:
Estimacin puntual: Estadstico calculado a partir de la informacin obtenida de la muestra y que

se usa para estimar parmetro poblacional con un solo valor.
Estimacin por intervalos de confianza: Se estima el parmetro desconocido con un intervalo, que
tiene asociado cierta probabilidad de ocurrencia.
1.1.1. ESTIMACIN PUNTUAL
Es un valor numrico que proporciona sus respectivos estimadores de punto que se calcula
considerando los datos muestrales, es decir, se usan las medidas de la muestra para calcular un
nico valor numrico que es la estimacin del parmetro poblacional.
La media muestral, es una estimacin puntual de la media poblacional, p, una proporcin

muestral, es una estimacin puntual de la proporcin poblacional; y s, la desviacin estndar
muestral, es una estimacin puntual de la desviacin estndar poblacional.
Sin embargo, es necesario que cada estimador de punto cumpla con algunos requisitos
deseables como ser:
Insesgado: Es decir, la media aritmtica de todas las posibles estimaciones puntuales del
estimador del parmetro que puedan obtenerse debe ser igual al parmetro de la poblacin.
Consistente: Nos indica que conforme se incrementa el tamao de la muestra la estimacin

puntual del estimador se acerca cada vez ms al parmetro de la poblacin.
Eficiente: El estimador debe tener varianza mnima.

Suficiente: El estimador debe contener toda la informacin de la muestra.
Ejemplo:
Se tiene inters en estimar el gasto promedio mensual en movilidad del personal profesional de
Administracin de la UNFV. Para el efecto, se recurre a una muestra aleatoria de 25 profesionales
de Administracin y se obtiene los siguientes resultados: x= S/ 160.00 y s =S/ 32.00.
El gasto promedio mensual en movilidad de todas las auxiliares de enfermera est representado
por (que es el parmetro poblacional) y la estimacin por punto de este parmetro sera: =
S/ 160.00
Sin embargo, este valor no se considera estable porque si repetimos la experiencia con diferentes
muestras del mismo tamao se van a obtener resultados distintos. Por consiguiente, la alternativa
es construir un intervalo de tal manera que el valor del parmetro se encuentre dentro de dicho
intervalo con un cierto grado de seguridad.
1.1.2. ESTIMACIN POR INTERVALOS DE CONFIANZA
Consiste en encontrar dos valores numricos LI y LS que definen un intervalo y se espera con
cierto grado de seguridad que dicho intervalo contenga el parmetro poblacional. Un problema
habitual es el de estimar parmetros que ayuden a caracterizar una variable. Por ejemplo1 el
porcentaje de individuos que mejora ante un cierto tratamiento o el tiempo que tarda un anestsico
en hacer efecto.
Podramos decir, que tras realizar un estudio, el 75% de los pacientes tratados experiment una
mejora. Una respuesta ms sofisticada usando intervalos de confianza podra ser: nuestro estudio
muestra que el 75% de los casos experimenta una mejora siendo el margen de error del 6%. El
nivel de confianza es de 95%.
El clculo de intervalos de confianza para la estimacin de parmetros son tcnicas que nos
permiten hacer declaraciones sobre qu valores podemos esperar para un parmetro. El intervalo
calculado depender de:
Lo estimado en una muestra (porcentaje, media, etc.). El intervalo de confianza est formado
por valores ligeramente menores y mayores que la aproximacin ofrecida por la muestra.
El tamao muestral. Cuantos ms datos hayan participado en el clculo, ms pequeo

esperamos que sea la diferencia entre el valor estimado y el valor real desconocido.
La probabilidad (nivel de confianza) con la que el mtodo dar una respuesta correcta. Niveles
de confianza habituales para los intervalos de confianza son el 95% y el 99%.
ESTIMACIN POR INTERVALO PARA LA MEDIA
El clculo de un intervalo de confianza para la media aritmtica poblacional est dado por:
tn-1 = Es el coeficiente de confianza y cuyo valor depende del grado de confianza que se establece
Ejemplo:
Se quiere estimar un intervalo de confianza al nivel de significacin a = 0, 05 para la altura media
de los individuos de una ciudad. En principio solo sabemos que la distribucin de las alturas
es normal. Para ello se toma una muestra de n = 25 personas y se obtiene:
= 170 cm S = 10 cm
Solucin:
ERROR DE CONTRASTE
Al tomar una decisin en una prueba de hiptesis, hay cuatro posibles resultados que pueden
ocurrir; como se ilustra en el siguiente diagrama:
SITUACIN VERDADERA
DECISIN
LA HIPTESIS Ho ES VERDADERA LA HIPTESIS Ho ES FALSA
NO EXISTE ERROR
NO RECHAZAR LA ERROR DEL TIPO II
PROB= 1- a
HIPTESIS Ho PROB=
Confianza de la prueba
ERROR DEL TIPO I NO EXISTE ERROR
RECHAZAR LA
PROB= a PROB=1-
HIPTESIS Ho
Nivel de significancia Potencia de la prueba
TEMA 2 : PRUEBA DE HIPOTESIS PARA LA MEDIA, VARIANZA, PROPORCIN
POBLACIONAL. PRUEBA DE HIPTESIS PARA LA DIFERENCIA DE DOS MEDIAS.
2.1-PRUEBA DE HIPTESIS SOBRE LA MEDIA POBLACIONAL Y LA PROPORCIN

POBLACIONAL
2.1.1. Hiptesis estadstica

Definicin: Se denomina hiptesis estadstica, a cualquier afirmacin, supuesto o conjetura que
se hace acerca de la distribucin de una o ms poblaciones.
En trmino sencillo, las hiptesis estadsticas consisten en suponer que los parmetros, que
definen a la poblacin, toman determinados valores numricos.
Ejemplo 1:
Una hiptesis podra ser que la comisin media de vendedores de computadoras en la ciudad
de Lima es S/. 1,000. No es posible entrevistar a todos los agentes para determinar si la media
en realidad es S/. 1,000. El costo de localizar e interrogar a cada vendedor de computadoras
en la ciudad de Lima sera exorbitante. Para probar la validez de la afirmacin ( =S/1000 ),
debe seleccionarse una muestra de la poblacin formado por vendedores de computadoras,
calcular valores estadsticos muestrales y, con base a determinadas reglas de decisin, aceptar o
rechazar la hiptesis.
Ejemplo 2:
Son hiptesis estadsticas:
La longitud media de un tipo de objetos es 10 centmetros.

La proporcin de objetos defectuosos producidos por cierto proceso nunca es superior al 8%.
La varianza de la longitud de cierto tipo de objetos es 0.25 cm2.
Son iguales las medias de dos tipos de mediciones independientes X e Y que se
distribuyen normalmente con varianza comn o2
El anlisis estadstico de los datos servir para determinar si se rechaza o no se rechaza la

hiptesis nula. Cuando se rechaza la hiptesis nula, significa que el factor estudiado ha influido
significativamente en los resultados y es informacin relevante para apoyar la hiptesis de
investigacin planteada. Es muy importante tener presente que la hiptesis de investigacin
debe coincidir con la hiptesis alterna. Plantear hiptesis de investigacin que coincidan con la
hiptesis nula supondra una aplicacin incorrecta del razonamiento estadstico.
2.1.2. Hiptesis nula y alternativa

Definicin: Se denomina hiptesis nula y se representa por H0 a la hiptesis que es aceptada
provisionalmente como verdadera y cuya validez ser sometida a comprobacin experimental.
Los resultados experimentales nos permitirn seguir aceptndola como verdadera o si, por el
contrario, debemos rechazarla como tal. Toda hiptesis nula va acompaada de otra hiptesis
alternativa.
Se denomina hiptesis alterna y se representa por H1 o por Ha a la hiptesis que se acepta en
caso de que la hiptesis nula H0 sea rechazada. La hiptesis alternativa Ha, es, pues, una
suposicin contraria a la hiptesis nula. La hiptesis nula (Ho) y alterna (Ha) o de investigacin
son mutuamente excluyentes.
2.1.3. Tipos de pruebas de hiptesis
El tipo de prueba depende bsicamente de la hiptesis alternativa Ha.
Se denomina prueba de una cola a toda prueba de hiptesis donde la alternativa Ha es

unilateral. Si la alternativa es bilateral, la prueba se denomina prueba de dos colas; luego, para
un parmetro = X se tiene que:
1. La prueba de hiptesis Ho: = 0 contra H1: se denomina PRUEBA BILATERAL O

DE DOS COLAS.
Ejemplo:
En base a una muestra de piezas en un embarque que se acaba de recibir, un inspector de
control de calidad debe decidir entre aceptar todo el embarque o regresarlo al proveedor, porque
no cumple con las especificaciones.
Supongamos que las especificaciones de determinada pieza dicen que la longitud promedio debe
ser de dos centmetros para cada pieza. Si la longitud promedio de las partes es mayor o menor
que la norma de dos pulgadas, las partes causarn problemas de calidad en la operacin de
ensamblaje. En este caso, se formularn como sigue las hiptesis:
Ho: = 2
Ha: <>2
Si los resultados de la muestra indican que no se puede rechazar Ho, el inspector de control de
calidad no tendr razn para dudar que el embarque cumpla con las especificaciones y lo
aceptar. Sin embargo, si los datos de la muestra indican que se debe rechazar Ho, la conclusin
ser que las piezas no cumplen con las especificaciones. En este caso, el inspector tendr las
pruebas suficientes para regresar el embarque al proveedor.
2. La prueba de hiptesis Ho: = 0 contra HI: > 0 se DENOMINA PRUEBA

UNILATERAL DE COLA A LA DERECHA.
Supongamos que determinado modelo de automvil actualmente funciona con un rendimiento
promedio de 12 kilmetros por litro. Un grupo de investigacin de producto ha inventado un
nuevo carburador, diseado para aumentar el rendimiento. Para evaluar el nuevo carburador
se fabricarn varios de ellos, se instalarn en automviles y se sometern a pruebas de manejo
controladas. Observe que el grupo de investigacin de producto busca pruebas para decir que el
nuevo carburador aumenta el rendimiento de los kilmetros por litro. En este caso, la hiptesis
de investigacin es que el nuevo carburador proporcionar una media del rendimiento mayor a
los 12 kilmetros por litro, es decir que >12. Como lineamiento general, una hiptesis de
investigacin como esta debe formularse y proponerse como hiptesis alternativa. Por
consiguiente:
Ho: <=12
Ha: > 12
3. La prueba de hiptesis Ho: = 0 contra H1: < 0 se denomina PRUEBA UNILATERAL

DE COLA A LA IZQUIERDA.
Regin crtica y regla de decisin

La regla de decisin implica la divisin de la distribucin muestral del estadstico CD de la
prueba en dos partes mutuamente excluyentes: la regin de rechazo o regin crtica (RC) de Ho, y la
regin de aceptacin (RA) o no rechazo de H0. Esta decisin depende de la hiptesis alternativa
Ha, del nivel de significacin a y de la distribucin muestral del estadstico.
2.1.4. Procedimiento de la prueba de hiptesis

Previamente debe formularse el problema estadstico, determinar la variable en estudio y el
mtodo estadstico adecuado para la solucin del problema. El procedimiento general de la
prueba de una hiptesis de parmetro se resume en los siguientes pasos:
1. Plantear la hiptesis nula y la hiptesis alterna: El primer paso es plantear la hiptesis

que ha de ser probada. A esta hiptesis se le denomina hiptesis nula, se designa
mediante H0, y se lee "H subndice cero. La letra H significa hiptesis y el subndice cero
indica "no hay diferencia". Por lo general, hay un "no" en la hiptesis nula, que indica "no
hay cambio". En trminos generales, lahiptesis nula se plantea con el objetivo de realizar
una prueba. Podemos rechazarla o aceptarla. La hiptesis nula es una afirmacin que no se
rechaza a menos que los datos muestrales proporcionen evidencia convincente de que es
falsa. La hiptesis alternativa describe lo que se concluir si se rechaza la hiptesis nula.
Se designa por Ha y se lee "H subndice a". Se le conoce tambin como hiptesis de
investigacin. La hiptesis alterna se acepta si los datos mustrales proporcionan
suficiente evidencia estadstica de que la hiptesis nula es falsa.
Es importante recordar que sin importar cmo se haya planteado el problema, la hiptesis
nula siempre incluir el signo "igual". El signo "igual" (=) nunca aparecer en la hiptesis
alternativa.
Por qu? Porque la hiptesis nula es la afirmacin a probar y al realizar los
clculos se requiere de un valor especfico. Se recurre a la hiptesis alterna solo
si se prueba que la hiptesis nula es falsa.
a.
b.
c.
2. Seleccionar el nivel de significancia: Despus de establecer la hiptesis y la hiptesis
alterna, el siguiente paso es determinar el nivel de significancia, que es la probabilidad de
rechazar la hiptesis nula cuando es verdadera. El nivel de significancia se denota mediante a,
la letra griega alfa. Algunas veces tambin se le denomina nivel de riesgo. Este ltimo es un
trmino ms adecuado, ya que es el riesgo que se corre de rechazar la hiptesis nula cuando
esta es verdadera. No hay un nivel de significancia que se aplique a toda las pruebas. Se usa
el nivel 0.05 (que con frecuencia se enuncia con nivel de 5%), el nivel 0.01, 0.1 o cualquier
otro nivel entre 0 y 1. Tradicionalmente se selecciona el nivel 0.05 para proyectos de
investigacin sobre consumo, el nivel 0.01 para el aseguramiento de calidad y el 0.1 para
encuestas polticas. El investigador debe decidir qu nivel de significancia usar antes de
formular una regla de decisin y recopilar los datos muestrales.
3. Seleccionar la estadstica de prueba
Estadstico para la media:
Estadstico para la proporcin:
4. Establecer la regla de decisin, determinando la regin crtica de la prueba.

a.
b.
c.
5. Calcular el valor del estadstico de la prueba y tomar decisin: Valor determinado a
partir de la informacin muestral, que se utiliza para determinar si se rechaza la hiptesis
nula. Se rechaza la hiptesis nula si el valor del estadstico cae dentro de la regin crtica.
6. Conclusin:
TEMA 3: PRUEBA DE CHI CUADRADO, PRUEBA DE BONDAD DE AJUSTE, TABLAS DE
CONTINGENCIA, PRUEBA DE CONTINGENCIA, PRUEBA DE HOMOGENEIDAD, PRUEBAS
DE HIPTESIS DE WILCONSON
3.1 TABLAS DE CONTINGENCIA
En los diferentes campos de la investigacin es muy frecuente encontrarse con variables

cualitativas nominales u ordinales: nivel de instruccin, sexo, calificacin de un servicio, lugar
de procedencia, categora laboral, etc. Las tablas de contingencia resuelven el problema del
estudio de la asociacin existente entre dos variables de tipo cualitativo. O tambin si la
proporcin de casos para cada categora de una de las variables es independiente del valor que
toma la otra variable.
Desde el punto de vista inferencial, la hiptesis nula tratara la independencia de estas

variables. (Hiptesis nula) H0: Las variables son independientes.
(Hiptesis alternativa) H1: Las variables no son independientes.
Existen ocasiones en que el inters es determinar las diferencias en la frecuencia de sucesos,
como por ejemplo: dada una muestra de 140 estudiantes de distintas escuelas, la investigacin
podra consistir en determinar si hay o no asociacin entre la nota que el alumno obtuvo en
Estadstica (alta, media o baja) y la que este obtuvo en Matemticas (alta, media o baja). Lo que
se busca es determinar si existe una asociacin (contingencia o correlacin) entre los dos
factores de inters.
NOTA EN EL CURSO DE ESTADSTICA

NOTA EN EL CURSO DE
MATEMTICAS Alta Media Baj
a Total
(columna (columna
Alta 1) 2) (columna
13 19 11
3) 53
(fila 1)
Media
18 12 8 38
(fila 2)
Baja 30
9 20 59
(fila 3) (celda
3;2)
Total 40 61 39 140
El cruce entre filas (i) y columnas (j) de una tabla cruzada o de doble entrada constituyen las
celdas, las cuales contienen informacin referente a las variables consideradas en la tabla y
pueden constituir las frecuencias o porcentajes.
El razonamiento para contrastar si existe o no asociacin entre dos variables cualitativas se

basa en calcular cules seran los valores de frecuencia esperados para cada una de las celdas
en el caso de que efectivamente las variables fuesen independientes, y compararlos con los
valores realmente observados. Si no existe mucha diferencia entre ambos, no hay razones
para dudar de que las variables sean independientes.
El contraste estadstico ms utilizado para evaluar si las diferencias entre las frecuencias
observadas y las esperadas pueden atribuirse al azar, bajo la hiptesis de independencia, es el
denominado chi-cuadrado de Pearson
I: Representa el nmero de filas.

J: Representa el nmero de columnas.
i: Representa la posicin de la fila.
j: Representa la posicin de la columna.
Eij: Representa la frecuencia esperada para la celda situada en la fila i columna j.
Oij : Representa la frecuencia efectivamente observada para esa celda.
til para la conclusin:
Si el estadstico de prueba X 2 calculado de acuerdo a los datos es mayor que el valor de la X 2 de la
tabla:
Entonces rechazaremos la hiptesis nula y concluimos que ambas variables son dependientes o
estn relacionadas. De lo contrario, estas seran independientes, es decir no estn
relacionadas.
Realicemos un ejemplo para poder aplicar:
Se realiza un estudio para investigar la asociacin entre la recuperacin de una enfermedad y el

uso de vitaminas. Se seleccionan 100 pacientes aleatoriamente y se recogen los datos que se
muestran en la tabla adjunta:
Tabla N. 1: Distribucin de pacientes segn uso de vitaminas y recuperacin de una

enfermedad - Hospital Dos de Mayo - Lima 2010.
(Frecuencias observadas)
Recuperacin de la enfermedad
Uso de
vitaminas Se recupera No se Total
recupera
S 36 34 70
No 24 6 30
Total 60 40 100
Solucin:
Primero: Planteamos nuestras hiptesis de acuerdo al enunciado.
H0: La recuperacin de una enfermedad y el uso de vitaminas son independientes. H1: La
recuperacin de una enfermedad y el uso de vitaminas son dependientes.
Segundo: Calculamos las frecuencias esperadas:
Uso
de No se
vitamin Se recupera recupera Tota
as l
S O11=36 O12=34 70
No O21=24 O22 30
Tota 60 =6
40 100
l
De acuerdo a la Tabla N 1, se calcula la probabilidad de que un paciente use vitaminas se

puede estimar en la muestra como 70/100.
Ahora se esperara que de este 70% de la poblacin de pacientes que toma vitaminas sean los que
se recupere de la Enfermedad:
70
* 60 =42 pacientes)
100
y el 70% de la poblacin de pacientes que no se recupera de la enfermedad (40 pacientes) usar

vitaminas.
70
* 40=28 pacientes)
100
Se repite el mismo procedimiento para los que no usan vitaminas. Por ltimo, completar la tabla
Tabla N 2 Distribucin de frecuencias esperadas
Uso de
vitaminas Se No se Tota
recupera recupera
l
S E11=42 E12=28 70
No E21 E22 30
Tota =
60 =
40 100
l
Tercero: Calculamos el estadstico de prueba, para lo cual usaremos las frecuencias
observadas (nuestros datos reales Tabla 1) y las frecuencias esperadas (la nueva Tabla 2):
Usando la frmula del contraste estadstico de la X 2:
Cuarto: Observamos la cantidad de filas y columnas en nuestra tabla (2 filas y 2 columnas),

luego buscamos en la tabla el valor de la X2 segn sus grados de libertad que se halla as:
(i-1)*(j-1), para este caso corresponde
con: (2-1)*(2-1)= 1 grados de libertad.
Para una significancia a = 0.05. Encontramos que esta es aproximadamente 3.84.
Quinto: Comparamos los valores de la X 2, en este caso result:
X 2 (calculado) =7.143 > X 2 (tabla)=3.84, por lo tanto, rechazamos la hiptesis nula y concluimos que
a un nivel de significancia del 5%, existe asociacin entre las variables analizadas, es decir que la
recuperacin de la enfermedad depende del uso de vitaminas
3.2. Prueba de bondad de ajuste. En las aplicaciones de una sola muestra( una sola
variable), la prueba de se conoce como la tcnica de bondad de ajuste y est orientada a
probar la concordancia o no entre una distribucin muestral u observada y una distribucin
hipottica o esperada. De ah el nombre de bondad de ajuste de las frecuencias observadas
y las esperadas. , en este caso, se usa con l finalidad de contrastar si una distribucin
muestral se ajusta o no a una distribucin terica o hipottica.
Lo que se requiere, entonces, es una hiptesis(nula) o teora postulada, denotada por H 0 que
nos permita calcular las frecuencias esperadas en cada categora y posteriormente probar H 0
con la ecuacin.
La X2 para el caso de una sola muestra, resuelve problemas cuyos datos pueden presentarse
segn el siguiente esquema.
___________________________
Variable OI Ei
__________________________
A1.. E1
A2.. E2
.
.
.
Ak...........................................E k
________________________________________
Total n...n
Puede notar en la ecuacin que si existe una semejanza grande entre las O i y las EI, el valor
de X2 resultante ser pequeo lo que llevar al no rechazo de la H 0. A medida que aumentan
las discrepancias (Oi-Ei) el valor de X2 aumenta. Cuanto mayor sea el valor de X 2 mayores
probabilidades tendremos de rechazar H0.
Ejemplo1:
En Lima Metropolitana se investig la preferencia de una muestra aleatoria de 55 estudiantes

de quinto de secundaria hacia 5 profesiones. Se obtuvieron los siguientes resultados:
Profesin Oi
A 12
B 15
C 07
D 11
E 10
Total 55
Puede concluirse que las 5 profesiones son igualmente preferidas?
a) Hiptesis:
Ho: Las profesiones son igualmente preferidas (p=1/5)
H1: Las profesiones no son igualmente preferidas (p<>1/5)
b) Nivel de significacin:
Calculo de las Ei
Sobre la base de Ho, las Ei=np=55*1/5=11
Luego:
Profesin Oi Ei
A 12 11
B 15 11
C 07 11
D 11 11
E 10 11
Total 55 11
c) Estadstica de prueba
Usando la ecuacin tenemos:
d) Decisin
En este caso el nmero de categoras es 5. K=5 LUEGO gl=K-1; gl.=4.
Para tomar la decisin estadstica respecto a la H o, se tomar en cuenta la probabilidad de
cometer el error tipo I representado por p=P(Rechazar H0/Ho es verdadera. El valor de p
puede ser obtenido en forma exacta a travs del uso de algn paquete estadstico, o de la
tabla X2, en forma aproximada
Luego la regla de decisin ser:
Si p>= no se rechaza la Ho
Si p< se rechaza la Ho
Atendiendo a la regla de decisin no se rechaza H o, ya que para X2 c=3,09 El valor de p que
corresponde es : 0,50 <p< 0,70
e) Conclusin:
Se concluye que las 5 profesiones son igualmente preferidas
3.3. Prueba de Independencia de criterio.

Supongamos que de n elementos de una poblacin se han observado dos caractersticas X e
Y, obtenindose una muestra aleatoria simple bidimensional (X1,Y1),(X2,Y2),...,(Xn,Yn). Sobre
la base de dichas observaciones se desea contrastar si las caractersticas poblacionales X e Y
son independientes o no. Para ello se dividir el conjunto de posibles valores de X en k
conjuntos disjuntos A1,A2,...,Ak; mientras que el conjunto de posibles valores Y ser
descompuesto en r conjuntos disjuntos: B1,B2,...,Br. Al clasificar os elementos de la muestra,
aparecer un cierto nmero de ellos, ij n , en cada una de las k r clases as constituidas,
dando lugar a una tabla de contingencia de la forma:
Caractersticas
Muestra 1 2 . . c Total
1 n11 n11 . . n1c n1.
2 n21 n22 . . n2c n2.
. . . . . .
. . . . . .
. . . . . .
r nr1 nr2 . . nrc nr.
Total n1 n2 . . nc n..
Ejemplo:
Para estudiar la dependencia entre la prctica de algn deporte y la depresin, se seleccion

una muestra aleatoria simple de 100 jvenes, con los siguientes resultados:
Determinar si existe independencia entre la actividad del sujeto y su estado de nimo. Nivel de
significacin (5%)
SOLUCIN:
Debemos primero calcular las frecuencias esperadas bajo el supuesto de independencia. La
tabla de frecuencias esperadas sera:
Este valor debemos compararlo con el percentil de la distribucin X2 con (2-1)(2-1)=1 grado de
libertad. X2 0.95 (1) =3.84
Por lo tanto como el valor del estadstico es superior al valor crtico, concluimos que debemos
rechazar la hiptesis de independencia y por lo tanto asumir que existe relacin entre la
depresin y los hbitos deportistas del individuo.
3.4. Prueba de Homogeneidad de poblaciones Esta es una de las aplicaciones ms

recuentes de Ji-cuadrado. En este caso se tiene dos o ms poblaciones independientes las
que se desean comparar respecto de una variable categrica. En otros trminos, se trata de
determinar si dos o ms poblaciones son homogneas respecto de una variable categrica. El
esquema de datos sera
Caractersticas
Muestra 1 2 . . c Total
1 n11 n11 . . n1c n1.
2 n21 n22 . . n2c n2.
. . . . . .
. . . . . .
. . . . . .
r nr1 nr2 . . nrc nr.
Total n1 n2 . . nc n..
Ejemplo:
Estamos interesados en estudiar la fiabilidad de cierto componente informtico con relacin al
distribuidor que nos lo suministra. Para realizar esto, tomamos una muestra de 100
componentes de cada uno de los 3 distribuidores que nos sirven el producto comprobando el
nmero de defectuosos en cada lote. La siguiente tabla muestra el nmero de defectuosos en
para cada uno de los distribuidores.
SOLUCIN:
Debemos realizar un contraste de homogeneidad para concluir si entre los distribuidores
existen diferencias de fiabilidad referente al mismo componente.
Las frecuencias esperadas bajo homogeneidad son las representadas entre parntesis.
El estadstico del contraste ser:
Este valor del estadstico Ji-cuadrado es mayor que el valor para el nivel de significacin del
5%, por lo tanto debemos concluir que no existe homogeneidad y por lo tanto que hay
diferencias entre los tres distribuidores. X20.05 (2) 5.99.
3.5. Prueba de Signos-Rango de Wilconxon. Hemos viso que la prueba de los signos utiliza,
simplemente informacin concerniente a la direccin de la diferencia entre pares. Una de las
desventajas de la prueba de los signos es que elimina completamente cualquier informacin
cuantitativa que puede proporcionar un par de datos. Por ejemplo, trata como si 7-8 fuera igual
que 11-19, etc, la prueba de los signos trata todas las diferencias de ms coo si fueran las
mismas y todas las diferencias de menos como si fueran las mismas.
En cambio, la prueba de Wilconson considera la magnitud as como la direccin de las
diferencias, por lo que constituye una prueba mas poderosa que la de los signos, ya que da
mayor peso al par que exhibe una diferencia grande que al par que muestra una diferencia
pequea.
Por lo que acabamos de manifestar, la prueba de Wilconson es la mejor alternativa no-
paramtrica de la prueba de t de Student para dos muestras relacionadas. Es decir, si la
informacin muestral no cumple con las condiciones eigidas por la prueba de t podr usarse
la prueba de wilconson para comparar estadsticamente dos muestras relacionadas.
Ejemplo.
Se formaron 8 pares de estudiantes de primaria en base de C.I. grado de instruccin, ect. De

cada par se asign, al azar, un sujeto para uno de los siguientes sistemas de enseanza:
Sistema de instruccin Personalizado, (SIP), y Sistema Convencional de Enseanza(SCE). Al
final de la enseanza obtuvieron las siguientes puntuaciones.
Par SIP(x) SCE(y)

1 40 32
2 38 31
3 45 36
4 43 44
5 37 40
6 43 38
7 46 42
8 47 47
Existe diferencia significativa entre los dos sistemas de enseanza?

Solucin:
a) Hiptesis
Planteemos las hiptesis de la siguiente manera:
Ho=SIP=SCE
Ho=SIP<>SCE
b) Nivel de significancia : =0,05

c) Estadstica de prueba
Para obtener la suma de rangos positivos y negativos procedemos de la siguiente manera:
Calculamos las diferencias y ponemos las respuestas con sus propios signos
A cada diferencia, en valor absoluto, le asignamos un rango o puesto de tal manera
que a la diferencia ms baja, en valor absoluto, se le asigna el puesto 1 y as
sucesivamente. Si hubieran diferencias en valor absoluto iguales en magnitud se les
asignar la media aritmtica de los puestos correspondientes
Luego a cada puesto le asignamos el signo correspondiente a las diferencias.
Se suman los rangos con signo positivo y los de signo negativo, que sern T(+) y T(-),
respectivamente. Veamos:
Rangos segn el signo de

las diferencias
Dif Rangos D (+) (-)
+8 6 6
+7 5 5
+9 7 7
-1 1 1
-3 2 2
+5 4 4
+4 3 3
0 - -
Suma 25 3
d) Decisin y conclusin
Si Ho fuera verdadera podramos esperar que la suma de rangos positivos y negativos se
anularan entre s Mientras ms preponderantemente positiva o negativa sea la suma de
rangos, la posibilidad de rechazar la Ho ser mayor.
El Estadstico T es la suma de rangos que tiene la suma ms pequea En nuestro caso T
calculado ser igual a 3. Este valor con n=7, lo ubicamos n la taba de valores crticos de
T en la prueba de Wilconxon, Tabla G, que se adjunta. Al valor de T calculado en un
contraste bilateral le corresponde una p>0,05. Luego, no se puede rechazar la H o. Por
consiguiente, los dos sistemas de enseanza producen efectos que difieren
significativamente.
Toda la actividad humana est motivada por el deseo o el impulso.Russell

Bertrand
Una vez finalizado el estudio de la segunda unidad, es importante que repase los conceptos
y practique adecuadamente los ejercicios de la Gua Acadmica del Participante

TERCERA UNIDAD
ANALISIS DE REGRESION LINEAL
En esta tercera unidad estudiaremos el Anlisis de Regresin Lineal
1. Aplicar el anlisis de regresin, analizando la relacin entre dos variables.

2. Elaborar modelos para predecir una variable en funcin de otra variable y medir la relacin
entre dos variables.
3. Conocer los mtodos para realizar el anlisis de la regresin lineal y la correlacin aplicadas a
modelos longitudinales y transversales.
CONTENIDO TEMTICO
1. Regresin simple y mltiple.

2. Mtodos de mnimos cuadrados.
3. Anlisis de varianza, intervalos de confianza.
4. Correlacin Simple y mltiple
TEMA 1: REGRESIN SIMPLE Y MLTIPLE.
1.1. Nocin e Importancia
El estudio estadstico de las relaciones, entre dos variables de intervalo, presenta los aspectos
fundamentales siguientes:
1. Existencia de asociacin entre las dos variables
2. Direccin de la asociacin
3. Grado de Asociacin
4. Naturaleza forma de la asociacin
Los dos primeros aspectos quedan determinados, cuando se halla el coeficiente de correlacin
r de pearson. Este coeficiente indica:
a) La existencia o no covaiacin o variacin conjunta entr dos variables, segn sea o no

distinto de cero.
b) La direccin de la asociacin, por su sgno positivo o negativo
c) El grado de la covariacin, segn el mayor o menor valor que alcance entre 0, y ms o
menos uno.
En cuanto al cuarto aspecto, naturaleza y forma de relacin, se estudia y resuelve mediante el
anlisis de regresin. Este anlisis es el que sirve para establecer la funcin matemtica y la
forma geomtrica que representen lo ms exactamente posible la variacin conjunta de ambas
variables. De ah que pueda decirse propiamente que sirve para estudiar la naturaleza y la forma
de asociacin entre dos variables de intervalo.
1.2. Elementos y tipos de anlisis de Regresin
Los elementos fundamentales del anlisis de la regresin son las variables y la ecuacin de
regresin.
Las variables pueden ser dos o ms. Una de ellas es la variable dependiente y las restantes son
las variables independientes.
En cuanto a los tipos, se tiene una regresin simple y regresin mltiple. La primera se refiere a la
naturaleza y forma de covariacin entre dos variables nicamente, y la segunda entre ms de dos
variables.
A su vez, ambos tipos de regresin pueden ser lineales y no lineales. Cuando la ecuacin, que es
expresin matemtica de la relacin entre las variables, es una ecuacin lineal cuya
representacin grfica da lugar a una lnea recta, se est en el caso de la regresin lineal, y de la
no lineal, en el caso contrario.
1.3. Anlisis de Regresin Lineal Simple
Sirve para estudiar la naturaleza y forma de la asociacin entre dos variables, siempre que dicha
relacin pueda ser expresada matemticamente por la ecuacin de la lnea recta
Supongamos que tenemos los datos empricos que representan para cada uno de los sujetos de
un grupo los valores de dos variables, por ejemplo, la edad y la estatura. Entonces llevando en un
espacio de coordenadas cartesianas los valores de la edad al eje de las y los de la estatura al eje
de las Y, obtendramos una serie de puntos. Esta serie suele recibir el nombre de la nube de
puntos y constituye la representacin grfica de a posicin en el espacio cartesiano de cada sujeto
del grupo, respecto a las variables en cuestin.
1.4. Modelo Lineal y su interpretacin
Relacin de dos variables a las cuales se ajusta a una lnea recta.
y=f(x) y=0+ 1X
Entonces el modelo de regresin simple que sirva para predecir el comportamiento de Y usando x
ser de la forma:
y=0+ 1X +e
Donde y=variable dependiente

x=variable independiente
0=Constante o parmetro de posicin. Es el valor promedio de la variable de respuesta Y cuando

X es cero. Si se tiene certeza de que la variable predictora X no puede asumir el valor 0, entonces
la interpretacin no tiene sentido.
1=Coeficiente de regresin. Es el cambio (incremento o disminucin segn el signo de 1)
promedio en la variable de respuesta Y cuando X se incrementa en una unidad.
Las unidades de 1 son las mismas unidades de la variable dependiente Y.

NOTA: Los coeficientes de regresin 1 y el coeficiente de correlacin lineal simple r deben de
tener el mismo signo
TEMA 2: MTODOS DE MNIMOS CUADRADOS.
2.1. Estimacin de parmetros de la regresin
Para que dicha ecuacin est definida es necesario que se conozca 0 y 1. Dichos parmetros
se calculan utilizando el mtodo de mnimos cuadrados.
El mtodo de mnimos cuadrados busca o fija los datos de la muestra o poblacin a una lnea
recta de modo que las diferencias de cada observacin a la lnea de regresin sea lo menos
posible
0= Intercepto de la ecuacin de regresin con el eje Y.

1 = Coeficiente de regresin.
Xi = Valores de la variable independiente.
Yi = Valores de la variable dependiente
Promedio de los valores de la valores de la variables independiente
Promedio de los valores de la valores de la variables dependiente
2.2. El coeficiente de determinacin R2
Es una medida de la bondad de ajuste del modelo de regresin hallado. Indica qu porcentaje de la
variabilidad de la variable de respuesta "Y" es explicada por su relacin lineal con "X".
El valor estadstico de R2 vara de 0 a 1.
2.3. Grafico de la Ecuacin
Para trazar la ecuacin o lnea de regresin, recordemos que matemticamente la ecuacin Y = a +

b X tiene como grfica una lnea recta, por lo tanto bastar con delimitar dos puntos para tener
identificada la lnea.
Entonces para determinar estos dos puntos (pares ordenados) se calcula dos valores de Y para
dos valores de X. Por conveniencia tomaremos los valores extremos de X, pero puede ser
cualquiera de los otros valores
TEMA 3: ANLISIS DE VARIANZA, INTERVALOS DE CONFIANZA
3.1. Concepto.
El anlisis de la varianza permite contrastar la hiptesis nula de que las medias de K poblaciones
(K >2) son iguales, frente a la hiptesis alternativa de que por lo menos una de las poblaciones
difiere de las dems en cuanto a su valor esperado. Este contraste es fundamental en el anlisis
de resultados experimentales, en los que interesa comparar los resultados de K 'tratamientos' o
'factores' con respecto a la variable dependiente o de inters.
El concepto bsico de anlisis de varianza fue desarrollado por R.A. Fisher y la distribucin F se
ha denominado en honor suyo. El razonamiento conceptual es el siguiente:
1. Se calcula la media para cada grupo de la muestra y despus se determina el error estndar
de la media S, con base solo en las diversas medias muestrales.
2. Dada la frmula S_=S/ , tenemos que S= ,Sx y que S2=nSx Esta estimacin resultante de
la varianza de la poblacin se llama la media cuadrtica, entre los grupos (MCE).
3. Se calcula la varianza dentro de cada grupo muestral y con respecto a cada media de grupo.
Luego se combinan estos valores de la varianza ponderndolos de acuerdo a n-1 para cada
muestra. La estimacin resultante de la varianza de la poblacin se llama media cuadrtica, de
los grupos (MCD).
4. Si la hiptesis nula m1=m2=m3=..mk es verdadera, entonces tenemos que las dos medias
cuadrticas obtenidas en (2) y (3) no estn sesgadas y son estimadores independientes de la
misma varianza de la poblacin, . Si la hiptesis nula es falsa, entonces el valor esperado de
la MCE es mayor que el de la MCD. Esencialmente, todas las diferencias entre las medias de
la poblacin inflarn la MCE, mientras que no afectarn la MCD.
5. Con base al numeral (4) se involucra una prueba de una cola, y la frmula general de la
prueba F en el anlisis de la varianza es:
F =MCD
MCE
Si la relacin F est en la regin de rechazo para el nivel de significacin especificado, entonces

se rechaza la hiptesis de que las diversas medias muestrales se obtuvieron de la misma
poblacin.
Para simplificar este procedimiento con diseos en trminos del modelo lineal que identifica los
componentes influyendo sobre la variable aleatoria y se presenta en una tabla estndar de anlisis
de varianza mostrando los clculos necesarios de la media cuadrtica para cada tipo de diseo
experimental.
3.2. Anlisis de varianza de una va
El modelo del anlisis de varianza de una va se relaciona con la prueba de la diferencia entre k
medias muestrales, cuando los sujetos se asignan aleatoriamente a cada uno de los diversos
grupos de tratamiento.
La ecuacin lineal que representa el modelo del anlisis de varianza de una va es:
Xik=+k+ik
Donde:
= media global de todos los k grupos de tratamiento
=efecto del tratamiento en el grupo especfico k, del cual se muestra el valor
ik =error aleatorio relacionado con el proceso de muestreo
La tabla siguiente es un resumen del anlisis de varianza de una va en la cual MCD pasa
a ser la media cuadrtica entre los grupos A grupos de tratamiento (MCA) y (MCE) es
llamada media cuadrtica del error. N asigna el tamao del total de la muestra para todos
los grupos de tratamiento combinados, antes que el tamao de la poblacin T k representa
la suma(total) de los valores muestreados en todos los grupos combinados.
La hiptesis nula y alternativa son:
Ho=k==0 para todos los niveles de tratamiento

H1=k==0 para todos los niveles de tratamiento
Si la hiptesis nula es verdadera, entonces tenemos que:

1= 2 =3 =.=k
Fuente de Suma de los Grados de Media Relacin
variacin cuadrados SC libertad gl cuadrtica MC F
Entre grupos de SCA= k-1 MCA= Fo=
tratamiento A
Error de SCE=STC-SCA n-k MCE=
muestreo, E
Total, T STC= N-1
Ejemplo:
Quince personas que se capacitan en un programa tcnico son asignadas, en forma

aleatoria, a tres tipos diferentes de enfoques de instruccin. Los puntajes de las pruebas
de rendimiento, al concluir la especializacin, se presentan en la tabla siguiente. Use el
procedimiento de anlisis de varianza para probar la hiptesis nula de que las tres medias
muestrales son iguales, aun nivel de significacin del 5%.
Mtodo de Puntaje de la prueba Tk
Instruccin Total
A1 86 79 81 70 84 400
A2 90 76 88 82 89 425
A3 82 68 73 71 81 375
Total 1200
Solucin
Suma de cuadrados de tratamiento
SCA=
Suma de cuadrados del total

STC=
Suma de cuadrados del error= SCE=STC-SCA
=698-250=448
Fuente de Suma de los Grados de Media Relacin
variacin cuadrados SC libertad gl cuadrtica MC F
Entre grupos de SCA=250 k-1=2 MCA=125 Fo=3,35
tratamiento A
Error de SCE=448 n-k=12 MCE=37,33 Ft=3,89
muestreo, E
Total, T STC=698 N-1=14
Ft=F(1-,glA,glE)=F(0,95,2,12)=3,89
Ho=1= 2= 3=0
Ha= a algun 1 0
=0,05
f.p. Ft=3,35
Decisin: Como FO RA=> se acepta Ho

Conclusin : No hay efecto asociado a los niveles del mtodo de instruccin, por lo tanto,
las diferencias de mtodos no son significativos, con un 5% de significacin de prueba.
TEMA 4: CORRELACIN SIMPLE Y MLTIPLE
4.1. Concepto
El anlisis de correlacin tiene como objetivo medir la fuerza de una relacin entre variables
cuantitativas y/o cualitativas, esta es medida a travs del coeficiente de correlacin, para
variables cuantitativas que tienen distribucin normal se utilizar la correlacin momento-
producto de Pearson y para variables que no tienen distribucin normal o cualitativas la
correlacin de rango de Tau de Kendall o Spearman.
Esta relacin que es analizada puede estar dada de una manera lineal, la cual nos dice que
los datos se ajustaran a una lnea recta o tambin estara de una forma no lineal en este caso
los datos se ajustaran ms a una curva. Es decir, dos variables pueden estar perfectamente
relacionadas, pero si la relacin no es lineal, el coeficiente de correlacin de Pearson o de
Spearman no ser un estadstico adecuado para medir su asociacin.
Si la relacin que se busca es solamente entre dos variables, recibe el nombre de correlacin
simple o bivariada.
Si el nmero de variables se incrementa, se le conoce como "correlacin mltiple".

Otras tcnicas que pueden estudiar la relacin estadstica entre dos variables son la prueba t de
dos grupos, el anlisis chi-cuadrado o tablas de contingencia. Estas dos tcnicas se introdujeron
en los captulos 12 y 13, respectivamente.
Ejemplo:
Nmero de horas de estudio y rendimiento acadmico.
Gastos en publicidad e ingreso total.
Precio de un producto y cantidad demandada del mismo.
Hay supuestos que constituyen un modelo de poblacin por correlacin lineal bivariable, para lo
cual se calcula o se estima r, los cuales son:
1. Y e X son variables aleatorias, y como tal no debe ser designada como dependiente e
independiente. Cualquier designacin dar el mismo resultado, pues ello no interviene en la
estimacin del r.
2. La poblacin bivariable es normal, o sea Y e X estn normalmente distribuidas.
4.2. Coeficiente De Correlacin Lineal Simple
Se presenta correlacin lineal cuando la relacin entre dos variables se manifiesta a travs de
una lnea recta y es simple porque solo intervienen dos variables.
Esta correlacin o asociacin, se mide a travs del coeficiente de correlacin lineal simple (p
r), definido como:
POBLACIN:
MUESTRA:
El rango (intervalo de variacin) de p r, es: -1 < p < 1
-1 0 1
Correlacin lineal No hay relacin Correlacin

negativa lineal positiva
lineal
Recuerda que:
El signo del coeficiente de correlacin es el mismo que el de
la covarianza. Si la covarianza es positiva, la correlacin es
directa.
Si la covarianza es negativa, la correlacin
es inversa. Si la covarianza es nula, no
existe correlacin.
Recuerda que:
El signo del coeficiente de correlacin es el mismo que el de
la covarianza. Si la covarianza es positiva, la correlacin es
directa.
Si la covarianza es negativa, la correlacin
es inversa. Si la covarianza es nula, no
existe correlacin.
El coeficiente de correlacin lineal es un nmero real comprendido entre -1 y 1.

-1 r 1
Si el coeficiente de correlacin lineal toma valores cercanos a -1 la correlacin es fuerte e
inversa, y ser tanto ms fuerte cuanto ms se aproxime r a -1.
Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte y
directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.
Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin es dbil.
Si r = 1 o -1, los puntos de la nube estn sobre la recta creciente o decreciente. Entre
ambas variables hay dependencia funcional.
El coeficiente de correlacin lineal es un nmero real comprendido entre -1 y 1.
Observacin:
El coeficiente de correlacin de clculo "r" es un estimador muestral del coeficiente poblacional
Rho
Cuando el valor de p r sale ms cerca de "1", mayor ser la correlacin lineal positiva o
sea la relacin entre las variables X e Y es directa, es decir si X aumenta, Y tambin
aumenta; y si X disminuye, Y tambin disminuye.
Cuando el valor de p r, sale ms cera a "-1", mayor ser la correlacin lineal negativa o sea
la relacin entre las variables X e Y es inversa, es decir si X aumenta, Y disminuye; y si X
disminuye, Y aumenta.
Si Cov(Y, X) = 0 ; entonces p r = 0 , luego la correlacin es nula entre las dos variables,
es decir las variables son independientes.
La siguiente es una tabla segn, M. Reyes, para deducir el grado de correlacin lineal simple
entre dos variables: Si, p r se encuentra en:
1.00 CORRELACIN PERFECTA Y POSITIVA
0.90 - 0.99 CORRELACIN MUY ALTA
0.70 - 0.89 CORRELACIN ALTA
0.40 - 0.69 CORRELACIN MODERADA
0.20 - 0.39 CORRELACIN BAJA
0.01 - 0.19 CORRELACIN MUY BAJA
0 No existe correlacin
-1 CORRELACIN PERFECTA Y NEGATIVA
Ejemplo:
En la empresa "PAVIRICOS S.R.L." dedicada a la comercializacin agrcola, se desea estudiar
el efecto del nmero de horas por semana (X), en el sueldo de los trabajadores obreros (Y)
para 2007. La informacin de los 10 trabajadores obreros da los siguientes resultados:
N de N de horas/semana (horas) Salario trabajadores obreros (S/.)

observacin
1 (X) 84 (Y) 134.
2 76 77.6
4
3 72 112.
4 49 6
80.2
5 71 110.
6 63 6
98.8
7 64 100.
8 84 4
134.
9 47 4
77.6
10 67 105.
8
Fuente: Empresa "Paviricos S.R.L". 2007
b Realice el diagrama de dispersin e interpretar.

c Averige si existe relacin entre las dos variables mencionadas.
Solucin:
a) Diagrama de dispersin.
b) Averiguar si existe relacin entre dos variables, se calcula el coeficiente de correlacin

lineal simple, y se procede de la siguiente manera:
lnterpretacin:

Bertrand
Una vez finalizado el estudio de la tercera unidad, es importante que repase los conceptos y
practique adecuadamente los ejercicios de la Gua Acadmica del Participante

CUARTA UNIDAD
NMEROS NDICE
En esta cuarta unidad estudiaremos los nmeros ndices
1. Elaborar modelos para predecir una variable de serie de tiempo y mostrar mtodos para
calcular los nmeros ndice.
2. Manejar conceptos bsicos de nmero ndice y sus relaciones.
3. Aplicar los mtodos para calcular nmeros ndices
CONTENIDO TEMTICO
1. Definicin de nmero ndice.

2. ndice de precios agregado.
3. Mtodos de promedio de relativos
TEMA 1: DEFINICIN DE NMERO NDICE.
1.1. Concepto y Tipologa
Un nmero ndice es una medida estadstica que expresa la variacin relativa experimentada, en
el tiempo o en el espacio, por una magnitud en dos situaciones diferentes, una tomada como
referencia denominada situacin base, la otra recibe el nombre de situacin actual.
Es una medida estadstica diseada para poner en relieve cambios en una variable o en un grupo
de variables relacionadas con respecto al tiempo, situacin geogrfica, ingresos o cualquier otra
caracterstica.
Series de ndices: Es una coleccin de nmeros ndices para diferentes aos, lugares, etc.
"Un nmero ndice es un valor relativo expresado como porcentaje o cociente, que mide un
periodo dado contra un periodo base determinado." Leonard Kasmier
"Un nmero ndice es una medida estadstica diseada para poner de relieve cambios en un
variable o en un grupo de variables relacionadas con respecto al tiempo, situacin geogrfica,
ingresos, o cualquier otra caracterstica." Spiegel Murray
Segn Richard Levin "un numero ndice mide cuanto cambia una variable con el tiempo."
Segn Enrique Cansado "no puede entenderse que los nmeros ndices, puedan "medir", ya que
la medicin arroja datos precisos, y un nmero ndice solo indica la manera de evolucionar de una
serie cronolgica pluridimensional. No mide, describe simplemente. Es un indicadoren realidad
se trata solamente de un estadgrafo que no son medidas sino caractersticas (numricas)
descriptivas de la distribucin que se estudia."
"Los nmeros ndices son indicadores de varios aspectos de la industria y el comerciotales

nmeros variaran con la fecha y tambin con el rea del pas a la que se refieran. Los nmeros
ndices normalmente comienzan con una base de 100 en un tiempo en particular para el pas."
Taro Yamane
Segn Rosembaum y Highland "un nmero ndice es una forma especial de razn utilizada para
mostrar cambios durante el periodo. Se compara una cantidad (venta, precio, produccin, etc.)
con el valor correspondiente en algn periodo anterior al que se le conoce como la base."
1.2. Aplicacin de los nmeros Indices
Sirven para hacer comparaciones como:

Costos de alimentacin durante un ao con los de ao anterior(economa)
Produccin de acero de un ao en una zona del pas con otro(industria)
Inteligencia relativa de estudiantes en diferentes sitios o aos(educacin)
Los nmeros ndices se elaboran con el propsito de predecir condiciones

econmicas o industriales tales como: ndices de paro, de produccin, de salarios y
otros. El ms conocido es el ndice de precios al consumo que prepara el INEI, este
produce aumentos salariales automticos correspondientes a los aumentos del
ndice de precios al consumo.
1.3. Relacin de precios
Es el cociente entre el precio de un artculo en un periodo dado y su precio en otro perodo,

conocido como periodo base o de referencia. Se supondr que los precios en cada periodo son
constantes, adems se tomar un promedio adecuado para el periodo, de modo que la suposicin
sea esencialmente vlida.
Donde Pn: precio de un artculo durante el periodo dado
Po: precio de un artculo durante el periodo base
Debemos definir:
Periodo dado es aquel periodo que puede ser el actual, o uno diferente en estudio
Periodo base es aquel que se toma como referencia, para todos los estudios, y es el que
se compara con el periodo dado
El resultado habitualmente se expresa en porcentaje

Notacin
A la relacin de precios de un periodo dado y un periodo base se denota por:
Po/n=
En general: si Pa y Pb son precios de un artculo durante los perodos a y b respectivamente.
Pa/b=
Ejemplo
Suponga que el precio al consumo de un litro de leche en los aos 1990 y 1998 era de
S/0,85 y S/. 1,50 respectivamente. Tomando como ao base 1990 y luego 1998, hallar la
relacin de precios.
Solucin:
TEMA 2: NDICE DE PRECIOS AGREGADO.

2.1. Nmero ndice compuesto
"sucede cuando un solo ndice pude reflejar un conjunto o grupo de variables cambiantes" Richard
Levin.
2.1.1. ndices agregados
ndice no ponderado de agregados
"los precios de varios artculos o mercancas sencillamente podran sumarse tanto para el caso
del periodo dado como para el del periodo base, respectivamente, y despus compararse"
Leonard Kasmier
"La forma ms sencilla de un ndice compuesto es el ndice no ponderado de agregados. No
ponderado significa que todos los valores incluidos al calcular el ndice tienen igual importancia.
Agregado significa que sumamos todos los valores. La principal ventaja de este ndice es su
simplicidad.
El ndice no ponderado de agregados se obtiene sumando todos los elementos del compuesto
durante cierto periodo y dividiendo despus el resultado entre la suma de los mismos elementos
durante el periodo base." Richard Kasmier
La ecuacin es:
ndice no ponderado de cantidad de agregados= x 100

Donde:
= cantidad de cada elemento en el grupo durante el ao dado

= cantidad de cada elemento en el grupo durante el ao base
Desventajas del ndice no ponderado de agregados
"No tiene en cuenta la importancia relativa de los diversos artculos. As pues, asigna igual peso a
la leche que a la crema de afeitar a la hora de calcular el ndice de precios al consumo
Las unidades escogidas al anotar los precios (galones, libras, kilo, etc.) "Spiegel Murray
ndice de agregados ponderados
"Con el fin de evitar las desventajas del ndice no ponderado de agregados, asignamos un peso al
precio de cada articulo, en general la cantidad (o volumen) vendida durante el ao base, durante
el ao dado." Spiegel Murray
"A menudo debemos atribuir mayor importancia a los cambios de algunas variables que a los de
otras al calcular un ndice. Esta ponderacin nos permite incluir ms informacin que el mero
cambio de precios a travs del tiempo. Adems nos permite mejorar la precisin de la estimacin
general del nivel de precios, basada en la muestra.
ndice de precio de agregados ponderados= x 100

Donde:
= precio de cada elemento del grupo en el ao actual
= precio de cada elemento del grupo en el ao base

Q= factor seleccionado de ponderacin de cantidad
Existen 3 mtodos de ponderar un ndice
2.1. 2. Mtodo de Laspeyres
Este mtodo se sirve de las cantidades consumidas durante el periodo base, es la tcnica de
mayor uso por requerir medidas de cantidades durante un solo periodo. Como cada nmero ndice
se funda en el mismo precio y cantidad base, los gerentes pueden comparar el ndice de un
periodo con el de otro
Se calcula as:
ndice de Laspeyres= X 100

Donde:
= precios en el ao actual
= cantidades vendidas en el ao base
= precio en el ao base
Ejemplo calcular el ndice agregado de precios de Laspeyres para el ao 2000 de las tres
mercancas tabla 1, usando como base el ao 1995.
Mercanca
Leche 19.35 ($) 14.85($)
Pan 4.56 4.18
Huevos 1.20 0.80
total 25.11($) 19.83
I= x 100= 126.7
Ventajas del Mtodo de Laspeyres
La comparabilidad de un ndice con otro
El utilizar la misma cantidad del periodo base nos permite realizar una comparacin directa.
Desventajas del Mtodo de Laspeyres

No toma en cuenta los cambios que se producen en los patrones de consumo.
2.1.3. Mtodo de Paasche

Se diferencia del primero, porque se sirve de medidas de cantidad en el periodo actual.
Se calcula as:
ndice de Paasche= x 100
Donde:
= precios en el periodo actual
=cantidades en el periodo actual
=precios en el periodo base

Ejemplo calcule el ndice agregado de precios paasche par el ao 2000 de las tres mercancas de
la tabla 1, usando como base el ao 1995.
Mercanca
Leche 23.22 ($) 17.82($)
Pan 4.44 4.07
Huevos 1.44 0.96
total 29.10($) 22.85($)
I= x 100= 127.4
Ventajas del Mtodo de Paasche

Es de gran utilidad por combinar los efectos de los cambios en los patrones de precio y consumo,
es un mejor indicador de los cambios generales de la economa
Desventajas del Mtodo de Paasche
Las medidas de cantidad en un periodo ndice suelen ser diferentes de las de otro periodo ndice,
por lo cual es imposible atribuir exclusivamente a los cambios de precio la diferencia existente
entre 2 ndices, es difcil comparar los ndices de los diferentes periodos determinados por este
mtodo.
2.1. 4. Mtodo de agregados de peso fijo
Se diferencia de los dems, por que usa los pesos provenientes de un periodo representativo, a
los cuales se le denominan pesos fijos
Se calcula:
ndice de precios agregados de peso fijo= x 100

Donde:
= precios del periodo actual
= precios del periodo base
=pesos fijos
Ventajas del Mtodo de agregados de peso fijo
La flexibilidad en la seleccin del precio base y del peso (cantidad) fijo." Richard Levin
2.1.5. ndice ideal de Fisher
Es la media geomtrica de los nmeros ndices de Laspeyres y de Paasche.
ndice ideal de Fisher=

Ejemplo tomando como base los resultados anteriores
ndice de Laypeyres = 1.267
ndice de Paasche = 1.274
ndice ideal de Fisher= = 1.270
TEMA 3: MTODOS DE PROMEDIO DE RELATIVOS
3.1. Promedio de mtodos de relativos

"Supongamos que se dispone de las series de precios, durante cierto nmero de ao, y se
disponga de este para clculos posteriores, debemos considerar la naturaleza y las variaciones de
dichos precios, ya que primero se deben homogenizar los datos que son heterogneos, (precios
por kilos, por galn, por litros, etc.), por esto en vez de precios absolutos, es natural el empleo de
los precios relativos obtenidos al comparar, por cociente, los precios de cada ao con los
correspondientes a otro que servir de base. La idea del ao base, o en general periodo base,
parte de la necesidad de un punto de comparacin temporal." Enrique Cansado
3.2. Promedio no ponderado del mtodo de relativos
"Como alternativa antes los mtodos de agregados, es posible aplicar el promedio de un mtodo
de relativos para construir un ndice.
Para calcularlo, con ms de un producto, primero se obtiene la razn del precio actual con el
precio base de cada producto y se multiplica cada razn por 100. Entonces se suman los relativos
porcentuales resultantes y se divide el total entre el numero de productos, as:" Richard Levin
Promedio no ponderado del ndice de relativos=

Donde:
=Precios del periodo actual
=Precios del periodo base
=Numero de elementos(o Producidos) del grupo

3.3. Promedio ponderado del mtodo de relativos
"El ndice es un promedio de precios relativos, por citar un ejemplo, pero aqu surge aun una
dificultad adicional: los artculos de este grupo no tienen todos igual importancia desde el punto de
vista de un productor, o de un consumidor, o del gobierno, o de una ama de casa. Pues bien,
antes de calcular el promedio de dichos precios relativos, debemos establecer cuales la
importancia o "ponderacin" relativa que tiene cada articulo en relacin con algo, tal como un
programa de exportacin, un presupuesto familiar, una balanza de pago, etc. debe considerarse
que si se trata de artculos de consumo familiar, por ejemplo, la ponderacin no puede ser igual
para todas las familias, por que cada articulo tiene importancia relativa diferente segn su nivel
econmico de la familia."
3.4. Promedio ponderado del mtodo de relativos
"Es una alternativa a la ponderacin agregada de precios, donde el ndice simple de precios de
cada mercanca en lo individual se pondera con una cifra de valor pq. Los valores usados pueden
corresponder al ao base, o al ao dado, . Habitualmente, los valores del ao
base se emplean como ponderaciones, lo que resulta en la siguiente formula:" Leonard Kasmier
Promedio ponderado del ndice de precios de relativo=

Ejemplo calcular el ndice de precios de las tres mercancas de la tabla 1, aplicando el mtodo de
promedio ponderado de relativos de precios y usando 1995 como ao base
Mercanca Relativos de precios Ponderacin del valor Relativo ponderado
Leche 130.30 14.85($) 1934.96
Pan 109.09 4.18 456.00
Huevos 150.00 0.80 120.00
total 19.83($) 2510.96
I= =126.6
3.5. Relativos eslabonados
"Son ndices cuya base es siempre periodo anterior. En consecuencia, respecto de un conjunto de
relativos eslabonados de valores anuales de ventas, cada numero ndice representa una
comparacin porcentual con el ao anterior. Estos relativos son tiles para destacar
comparaciones entre un ao y otro, pero resultan inconvenientes como base de comparaciones a
largo plazo" Leonard Kasmier
3.6. Cambio del periodo de base
"La base de una serie establecida de nmeros ndices suele cambiarse a un ao mas reciente
para que las comparaciones actuales sean mas significativas. Partiendo del supuesto de que no
se dispone de las cantidades originales en las que se apoya la serie de nmeros ndices, el
periodo base de un numero ndice puede cambiarse dividiendo cada ndice (original) entre el
ndice del ao base recin determinado y multiplicando el resultado por 100:" Leonard Kasmier
x100
3.7. Fusin de dos series de nmeros ndices
"Es frecuente que un numero ndice sufra cambios a causa de la adiccin de ciertos productos
nuevos o de la exclusin de ciertos productos antiguos, as como de cambios en el ao base. Sin
embargo, para efectos de continuidad histrica es deseable contar con una serie uniforme de
nmeros ndices. Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una
serie continua de nmeros ndices, debe haber un ao de empalme de las dos series en relacin
con el cual se hayan calculado ambos nmeros ndices. Generalmente el ao de empalme es
tambin la nueva base, por que es el ao en que se ha aadido y/o eliminado productos del ndice
agregado. Los nmeros ndices que deben modificarse en el proceso de fusin son los ndices de
la antigua serie. Este cambio se realiza dividiendo el nuevo numero ndice del ao de empalme,
entre el antiguo ndice de ese ao y multiplicando despus por este cociente cada uno de los
nmeros ndices de la antigua serie de los nmeros ndices." Leonard Kasmier

Bertrand
Una vez finalizado el estudio de la cuarta unidad, es importante que repase los conceptos y
practique adecuadamente los ejercicios de la Gua Acadmica del Participante

BIBLIOGRAFIA
1. Berenson, Mark L. /Levine David (2001). Estadstico para administracin. Mxico,
DF: Pearson Educacin, 2001/734p.
2. Crdova Zamora, Manuel. (2003). "Estadstica descriptiva e inferencial". Lima:
Moshera, 2003/495p
3. Leonard J. Kasmier/ Arrioja Juarez. Estadstico aplicada a la administracin y a la
4. Lind, Douglas A./ Mason Robert D. / Marchal, William G. (2001). Estadstica para
administracin y Economa. Mxico DF: McGraw Hill, 2001.

Estadistica para Administradores

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Estadistica para Administradores

Diunggah oleh

Hak Cipta:

Format Tersedia

Universidad Nacional

ESTADISTICA PARA ADMINISTRADORES

El propsito de esta gua acadmica de Estadstica para Administradores es capacitar al

Esta gua contiene cuatro unidades distribuidos metodolgicamente, estructurado mediante el

La asignatura de Estadstica para Administradores es un curso de formacin tecnolgica bsica

La presente Gua Acadmica del Participante de Estadstica para Administradores est

En la primera unidad se presentan algunos conceptos y elementos relacionados a la

Recuerde siempre lo siguiente:

En las aulas virtuales de la Escuela Universitaria de Educacin a Distancia, nuestros

Organizar el tiempo de estudio segn las propias condiciones, dificultades y necesidades de

Evaluacin de trabajos interactivos (TI): (40%)

PF = TI (0,4) + IV (0,2) + EF (0,4)

(Unidad I) Consultar los siguientes textos y enlaces:

Analizar los diferentes entornos empresariales, usando mtodos y tcnicas de la inferencia

Analizar los diferentes mtodos de muestreo demostrando actitud crtica.

Conocer las tcnicas de distribuciones muestrales y sus aplicaciones en el mundo empresarial.

Mejorar la toma de decisiones a travs del planteamiento de hiptesis y el contraste estadstico

Conocer los mtodos de elaboracin de nmeros ndices y su aplicacin a los problemas de

1. Utilizar las tcnicas muestreo para el diseo de muestras.

1. Teora del muestreo.

1.1. Poblacin. Se define tradicionalmente la poblacin como el conjunto de todos los

Los datos se pueden reunir ms Hacer conclusiones hacia una poblacin

Permiten inferir la realidad sin

2.1. Tipos de Muestreo Existen dos grandes categoras de muestreo:

2.2. Diseos Muestrales De Uso Frecuente

Para determinar el tamao de la muestra depende de los parmetros que se desean

Frmula para calcular el tamao de muestra para calcular :

Frmula para calcular el tamao de muestra para estimar p:

El tamao de muestra cuando no El tamao de muestra cuando se

Z: Nivel de confianza elegido.

Ejemplo 2: Cmo hubiera cambiado el ejemplo 1 anterior, si se desconoce la proporcin

2.2.2. Proceso de seleccin del muestreo aleatorio simple

Continuar la seleccin excluyendo las que se repiten. En la actualidad, la generacin de nmeros

a. Tabla de nmeros aleatorios

2.2.3. Muestreo Aleatorio Sistemtico

Ejemplo 2. A partir de una lista de 100 establecimientos de comestibles, deseamos seleccionar

Dividir 100 entre 20, k=5.

2.2.4. Muestreo Aleatorio Estratificado

Asignacin simple. A cada estrato le corresponde igual nmero de elementos.

Ejemplo de aplicacin 1. Seleccin aleatoria en estratos de diferente tamao de acuerdo a su

2.2.5. Muestreo Aleatorio por Conglomerado

Diferencia fundamental entre M.A. Estratificado y M.A. por conglomerado:

En el muestreo estratificado se trata de que cada estrato sea lo ms homogneo posible.

Ejemplo de aplicacin . Un diseo muestral probabilstico estratificado y por conglomerados. En

N Manzanas Asignacin Igual Asignacin Proporcional

TEMA 3 : DISTRIBUCIONES DE LA MEDIA MUESTRAL CON VARIANZA CONOCIDA

3.1. Distribucin muestral

Si conocemos la distribucin muestral podemos hacer inferencia.

Distribucin muestral, es un conjunto de todos los valores posibles para un estadstico y la

Media de las medias muestrales o gran media o media de medias:

Varianza De La Distribucin Mustral de las Medias Muestrales

Del ejemplo anterior:

(150 250 ) 2 (200 250 ) 2 ... (350 250 ) 2

Error Estndar de La Distribucin Muestral de las Medias Muestrales

En el caso anterior vale 64.55

Si el muestreo se realiza sin reemplazo y si el tamao de muestra es ms del 5% de la poblacin

Distribucin muestral de la media

aproximar a una distribucin normal con una media X X / n

Por ejemplo, para los siguientes datos de la poblacin:

El histograma de los datos de la poblacin, es el siguiente:

Al hacer una prueba de normalidad de Anderson Darling en los datos se tiene:

El histograma de los promedios muestrales (subgrupos de 5 datos) se muestra a continuacin:

Probability Plot of Muestra