Federico Villarreal
GUA ACADMICA
ADMINISTRACIN V CICLO
Euded
Escuela Universitaria
Educacin a distancia
NDICE
1. PRESENTACIN
2. INTRODUCCIN A LA ASIGNATURA
3. ORIENTACIONES GENERALES DE ESTUDIO
4. TUTORAS
5. CRONOGRAMA
6. EVALUACIN
7. MEDIOS Y RECURSOS DIDCTICOS
8. OBJETIVOS GENERALES
9. MEDIOS Y RECURSOS DIDACTICOS
10. PRIMERA UNIDAD
11. SEGUNDA UNIDAD
12. TERCERA UNIDAD
13. CUARTA UNIDAD
BIBLIOGRAFA
PRESENTACIN
La presente Gua Acadmica de Estadstica para Administradores, fue desarrollado para los
estudiantes de la carrera profesional de Administracin de Empresas.
Se espera que la presente gua constituya una gua efectiva y motive a la vez al estudio y la
dedicacin adecuada que permita el logro de los objetivos. Es claro que el estudio serio y
consciente de ninguna manera se cie a una gua, por el contrario consiste en la profundizacin
o ampliacin de los temas contenidos en esta, considerando que los conocimientos son muy
extensos. Slo a travs de la investigacin Ud. podr encontrar nuevos enfoque ms
actualizados acordes con la realidad actual.
INTRODUCCIN A LA ASIGNATURA
Esta materia, que se estudia en el quinto ciclo de la carrera, es muy importante porque el
mundo de hoy requiere de profesionales que conozcan las herramientas estadsticas para el
anlisis de la informacin administrativa tiene como objetivo principal analizar los diferentes
entornos empresariales, usando mtodos y tcnicas de la inferencia estadstica para la adecuada
toma de decisiones gerenciales.
La evaluacin tiene como propsito determinar si los participantes alcanzan los objetivos
propuestos. Para ello, se considera los siguientes criterios: interaccin a travs del chat,
participacin en los foros, presentacin de las tareas encomendadas y las evaluaciones
programadas por la Coordinacin Acadmica de la Escuela Universitaria de Educacin a
Distancia.
Esperamos que esta Gua del Participante les resulte til para lograr los objetivos planteados
en el curso de Estadstica para Administradores.
Para ser exitoso no tienes que hacer cosas extraordinarias. Haz cosas ordinarias,
extraordinariamente bien. Jim Rohn
ORIENTACIONES GENERALES DE ESTUDIO
Estimados participantes:
La razn de ser de los cursos virtuales es facilitar el acceso a los programas educativos de
aquellos estudiantes cuyos horarios o situacin geogrfica no son compatibles con la formacin
presencial, sin embargo, su objetivo es muy claro: ofrecer una calidad acadmica igual o
superior a la que se brinda en los programas presenciales. Por ello, los programas virtuales se
apoyan en la ms moderna tecnologa informtica y de comunicaciones (aulas virtuales) que
permiten un alto grado de interaccin y orientacin del profesor y una elevada interrelacin
entre los estudiantes.
Leer varias veces el material y despus comenzar con el resaltado de las ideas principales
para organizar el material de estudio (resmenes, cuadros sinpticos, etc.)
Estudiar en un lugar donde se sienta cmodo para realizar las lecturas y hacer sus tareas.
En lo posible un lugar con claridad y libre de ruido.
TUTORAS
Las tutoras sern desarrolladas mediante la programacin de un calendario de tutoras. stas
sern presenciales y virtuales.
CRONOGRAMA
Cantidad de horas acadmicas
Tutoras presenciales y virtuales Horas de video
Horas presenciales Horas virtuales conferencia
Semana 1 2 2.5 3
UNIDAD I
Semana 2 2 2.5 3
Semana 3 2 2.5 3
UNIDAD II
Semana 4 2 2.5 3
Evaluacin parcial virtual Unidades I II
Semana 5 2 2.5 3
UNIDAD III
Semana 6 2 2.5 3
Semana 7 2 2.5 3
UNIDAD IV
Semana 8 2 2.5 3
Evaluacin final Unidades III IV
16 20 24
TOTAL
60 horas acadmicas
EVALUACIN
El promedio final de la asignatura en la Modalidad Presencial Virtual se obtiene aplicando los
siguientes pasos porcentuales:
El estudiante que abandona la asignatura tendr promedio 00 (cero) en el acta final, debiendo
registrar nuevamente su matrcula.
MEDIOS Y RECURSOS DIDCTICOS
Berenson, Mark L. /Levine David (2001). Estadstico para administracin. Mxico, DF:
Pearson Educacin, 2001/734p.
Crdova Zamora, Manuel. (2003). "Estadstica descriptiva e inferencial". Lima:
Moshera, 2003/495p
Leonard J. Kasmier/ Arrioja Juarez. Estadstico aplicada a la administracin y a la
economa. Mxico: Edit. McGraw- Hill. Interamericana, 2006/406p.
Lind, Douglas A./ Mason Robert D. / Marchal, William G. (2001). Estadstica para
administracin y Economa. Mxico DF: McGraw Hill, 2001
Vnculo:
En: https://www.youtube.com/watch?v=Sb3J3Eu7Jmo
https://www.youtube.com/watch?v=zGtk_Ii9VBs
http://jaguar.cgr.go.cr/content/dav/jaguar/Documentos/cgr/centro_conoc/pdfs/economia_estadistic
a/estadistica-adm.pdf
Consultar los siguientes textos y enlaces:
(Unidad II,III)
Leer de :
Berenson, Mark L. /Levine David (2001). Estadstico para administracin. Mxico, DF:
Pearson Educacin, 2001/734p.
Crdova Zamora, Manuel. (2003). "Estadstica descriptiva e inferencial". Lima:
Moshera, 2003/495p
Leonard J. Kasmier/ Arrioja Juarez. Estadstico aplicada a la administracin y a la
economa. Mxico: Edit. McGraw- Hill. Interamericana, 2006/406p.
Lind, Douglas A./ Mason Robert D. / Marchal, William G. (2001). Estadstica para
administracin y Economa. Mxico DF: McGraw.
Thomson Espaa 2006)
Vnculo:
https://www.youtube.com/watch?v=DPpSrsndLJQ
https://www.youtube.com/watch?v=AJcy4eZMwWM
https://www.youtube.com/watch?v=AJcy4eZMwWM
https://www.youtube.com/watch?v=hJysxbj8CHI
http://jaguar.cgr.go.cr/content/dav/jaguar/Documentos/cgr/centro_conoc/pdfs/economia_estadistic
a/estadistica-adm.pdf
Unidad IV Consultar los siguientes textos y enlaces:
Berenson, Mark L. /Levine David (2001). Estadstico para administracin. Mxico, DF:
Pearson Educacin, 2001/734p.
Crdova Zamora, Manuel. (2003). "Estadstica descriptiva e inferencial". Lima:
Moshera, 2003/495p
Leonard J. Kasmier/ Arrioja Juarez. Estadstico aplicada a la administracin y a la
economa. Mxico: Edit. McGraw- Hill. Interamericana, 2006/406p.
Lind, Douglas A./ Mason Robert D. / Marchal, William G. (2001). Estadstica para
administracin y Economa. Mxico DF: McGraw.
Vnculo:
https://www.youtube.com/watch?v=EBKnkb26AM4
http://jaguar.cgr.go.cr/content/dav/jaguar/Documentos/cgr/centro_conoc/pdfs/economia_estadistic
a/estadistica-adm.pdf
Plataforma virtual Herramientas a emplearse en plataforma virtual:
Foros,tareas, chat
Enlaces, videos, examen, pginas entre otros
OBJETIVOS
GENERALES
Disear y aplicar modelos estadsticos, que respondan a los diferentes procesos empresariales
y financieros existentes, para describir situaciones concretas que permitan una adecuada toma
de decisiones en la gestin empresarial demostrando la capacidad de ser actor del cambio
participando en forma democrtica y responsable en los procesos de transformacin del pas.
ESPECIFICOS
Conocer las nociones de las pruebas de hiptesis, y las tcnicas de regresin para resolver
problemas relacionados con los negocios.
DISTRIBUCIONES MUESTRALES
Estimado participante:
En esta primera unidad estudiaremos sobre las distribuciones muestrales que comprende
conceptos bsicos sobre la teora del muestreo y aplicaciones en base a distribuciones
muestrales.
OBJETIVOS ESPECFICOS
CONTENIDO TEMTICO
DEFINICIONES BASICAS
Nivel de confianza 99.73% 99% 98% 96% 95.45% 95% 90% 80% 68.27%
Valores de Z 3.00 2.58 2.33 2.05 2.00 1.96 1.645 1.28 1.00
En donde:
Z : Nivel de confianza.
: Desviacin estndar
E : Error mximo.
N : Tamao de la poblacin.
Ejemplo 1: Se quiere estimar las ventas promedio que las Empresas del Rubro de Textilera a
nivel Nacional realizan en un mes . Un estudio anterior de 10 empresas mostr que la desviacin
estndar de sus ventas es de 150 millones de soles Qu tan grande debe ser una muestra para
que la consultora tenga el 95% de confianza de que el error de estimacin es a lo ms de 40
millones de soles?
Solucin:
Entonces se necesita aproximadamente una muestra de 54 empresas para estimar las ventas
promedio con una confianza del 95% y un error mximo de 40 millones de soles
Ejemplo 2: Para el ejemplo anterior. Cunto sera el tamao de muestra si se conoce que el
total de empresas en es de 200 empresas?
Solucin:
Para ello se utilizar la frmula de tamao de muestra cuando se conoce la poblacin,
reemplazando sera:
Por lo tanto, se necesita aproximadamente una muestra de 42 empresas para estimar las ventas
promedio con una confianza del 95% y un error mximo de 40 millones de soles
Se requerir entrevistar a no menos de 203 familias para poder tener la seguridad del 95%.
Solucin:
Cuando se desconoce la proporcin esperada, se tiene que utilizar el criterio
conservador (p=q=0.5=50%) Z: 1.96 (95% de confianza)
p: 0.5 (en este caso 50%) q=1-
p=1-0.5=0.50
e: 0.03 (3% error mximo)
Se requerir entrevistar a no menos de 1,067 familias para poder tener la seguridad del 95%.
La extraccin de una muestra aleatoria simple se efecta seleccionando una a una las n
unidades. La utilizacin de una tabla de nmeros aleatorios implica un mecanismo de
probabilidad muy bien diseado, de manera que garantiza estadsticamente la aleatoriedad de
sus elementos.
Supongamos que deseamos elegir dos nmeros aleatorios entre 1 y 50. Para ello podemos
utilizar pares de nmeros en la tabla y estos pueden ser adyacentes. Iniciemos en la fila 1,
columna 5: nmeros (99) y avancemos a la derecha (67), (16), (41),. El (99) y el (57) no estn
comprendidos entre 1 y 50, de manera que se descarta, el (16) y el (41) s se eligen por estar
comprendidos entre 1 y 50. Por lo tanto, los elementos elegidos seran: el 16 y el 41.
Este muestreo exige que los elementos componentes de la poblacin tengan un orden de posicin
Para obtener una muestra sistemtica se elige una muestra de tamao n y sea K el siguiente
entero despus de dividir N/n (intervalo muestral). Luego, determinamos un nmero aleatorio R
entre 1 y k, el cual determina que la muestra est formada por las unidades numeradas R, R
+ k, R+2k,....., R+ (n-1)k.
Ejemplo de aplicacin 1. Por ejemplo, para elegir una muestra de 45 estudiantes de una lista de
45,000 que estudian en la universidad, el intervalo de muestreo k es 1,000. Supongamos que el
entero aleatorio elegido sea R=597. Entonces los estudiantes numerados como 597, 1597, 2597,.,
44597 estaran en la muestra.
Si la variable que nos interesa asume distintos valores promedios en diferentes subpoblaciones.
Podramos obtener estimaciones ms precisas de las cantidades de la poblacin al tomar una
muestra aleatoria estratificada. En el siguiente grfico se puede observar el muestreo aleatorio
estratificado. Asignacin de las observaciones en los estratos:
Extraemos una muestra independiente en cada estrato ya sea por muestreo aleatorios simple o
sistemtico, posteriormente, reunimos la informacin para obtener las estimaciones globales de la
poblacin.
Las unidades que se presentan agrupadas pueden ser consideradas como conglomerados y
pueden servir como base para un procedimiento de muestreo.
Ejemplo de aplicacin . Las unidades hospitalarias, las iglesias, los departamentos acadmicos
en una universidad, una caja de determinado producto, etc., son conglomerados naturales.
Tambin existen los conglomerados no naturales, como por ejemplo, las urnas electorales.
Cuando los conglomerados son reas geogrficas suele hablarse de muestreo de reas.
Solucin:
En el cuadro se muestra que, segn la asignacin, igual tamao muestral de conglomerados
es igual a 227 a cada estrato socioeconmico.
Segn la asignacin proporcional, el tamao muestral a cada estrato vara y se distribuye de la
siguiente manera: 49 conglomerados para el estrato muy alto, 353 para el alto, 364 para el
estrato medio y para el estrato bajo 144 conglomerados.
Una estadstica muestral proveniente de una muestra aleatoria simple tiene un patrn de
comportamiento (predecible) en repetidas muestras. Este patrn es llamado la distribucin
muestral de la estadstica.
X Xi
K
150 200 250 250 300 350
X 250
6
X2 ( X )
( X X )2 2
K K
X X2
X
n
N n
X
n N 1
3.2. Teorema del lmite central:
El teorema del lmite central es de importancia fundamental para la estadstica porque justifica el
uso de mtodos de curva normal en una gran variedad de problemas; se aplica a poblaciones
infinitas y tambin a poblaciones finitas cuando n, a pesar de ser grande, no constituye ms que
una pequea porcin de la poblacin.
Es difcil sealar con precisin qu tan grande debe ser n de modo que se pueda aplicar el
teorema del lmite central, pero a menos de que la distribucin de la poblacin tenga una forma
muy inusual, por lo regular se considera que n = 30 es lo suficientemente alto. Ntese que cuando
en realidad estamos tomando una muestra de una poblacin, la distribucin del muestreo de la
media es una distribucin normal, no obstante el tamao de n.
F(X)
Distribucin de las medias muestrales
Distribucin de valores individuales
X
sX
n
X 1 , X 2 ,..., X A
n
medida que n se vuelve ms grande, la distribucin de las medias muestrales se
Si n( , 2 )
X 1 , X 2 ,..., X n es una muestra aleatoria de una Poblacion (X) con distribucin normal
.Entonces X se distribuye normalmente con media , y varianza 2 /n
Histogram of Poblacion
40
30
Frequency
20
10
0
2 4 6 8
Poblacion
Como el P value es menor a 0.05 los datos no siguen una distribucin normal.
60
50
40
30
20
10
5
0.1
1 2 3 4 5 6 7 8 9
Muestra
Como el P value es mayor a 0.05 incluso mayor a 0.10, las medias siguen una distribucin normal.
Tomando un tamao de subgrupo de n = 10 se tiene:
PROM.
N=10
4.9 4.7
3.7 4.2
6.2 3.8
5.0 6.2
5.6 6.5
5.0 5.7
4.6 6.5
5.8 5.6
5.8 5.3
5.0 4.7
4.6 5.3
4.9 4.1
4.1 5.0
5.0 4.5
5.1 4.8
Histogram of PROM. N=10
6
Frequency
0
3.5 4.0 4.5 5.0 5.5 6.0 6.5
PROM. N=10
X X
Z Con este valor se determina P(Z <= z)
X / n
Las llamadas durante un mes promediaron 150 seg. Con una desviacin estndar de 15 seg.a.
Cul es la probabilidad de que una llamada en particular dure entre 150 y 155 segundos?
X
Z
155 150 150 150
Z 155 0.33 ; Z 150 0.0
15 15
En tablas P(Z <= 0.33) = 0.6293 ; P(Z<=0) = 0.500
Por tanto P( 0 <= Z <= 0.33) = 0.1293 o 12.93%
TEMA 4 : DISTRIBUCION DE T-STUDENT, JI_CUADRADO, F DE FISHER
Muestra
Esta distribucin se forma al sumar los cuadrados de las variables aleatorias normales estndar.
Si Z es una variable aleatoria normal, entonces el estadstico Y siguiente es una variable aleatoria
Chi cuadrada con n grados de libertad.
E(X)=k
V(X)=2k
P( X ,k )
2
Grficas de la distribucin ji-cuadrada
K=1 K=5
K=50
K=25
P( X 0.05, 20 ) .05
2
( X ) (s / n) tn1
Funcin de Distribucin t-student
[(k 1) / 2]
f ( x)
k [k / 2][ x 2 / 2 1]( k 1) / 2
x (, )
K=1
K=10
K=100
0
k
; k 3
k 2
De una muestra aleatoria de n artculos, la probabilidad de que
x
t
s/ n
Caiga entre dos valores especificados es igual al rea bajo la distribucin de probabilidad t de
Student con los valores correspondientes en el eje X, con n-1 grados de libertad
Ejemplo:
La resistencia de 15 sellos seleccionados aleatoriamente son: 480, 489, 491, 508, 501, 500, 486,
499, 479, 496, 499, 504, 501, 496, 498
Cul es la probabilidad de que la resistencia promedio de los sellos sea mayor a 500?. La media
es 495.13 y la desviacin estndar es de 8.467.
t = -2.227 y el rea es 0.0214
495.13 500
t 2.227
8.467 / 15
4.1.3. Distribucin F
Surge de dividir dos ji-cuadradas independientes
F=(W/u)/(Y/v)
Distribucin F.
[(u v) / 2]u / v 2 x ( u / 2 ) 1
u
f ( x)
u
(u / 2)[v / 2][ x 1]( k v ) / 2
v
x (0, )
u=10 u=20
v=5 v=20
.
ACTIVIDADES RECOMENDADAS
Una vez finalizado el estudio de la primera unidad, es importante que repase los conceptos
y practique adecuadamente los ejercicios de la Gua Acadmica del Participante
Estimado participante:
En esta segunda unidad estudiaremos Estimacin de parmetros y prueba de hiptesis, pruebas
no paramtricas y no paramtricas.
OBJETIVOS ESPECFICOS
CONTENIDO TEMTICO
Las razones para efectuar una estimacin en una poblacin, en lugar de estudiarla directamente,
pueden ser: que el tamao de la poblacin sea infinito, que la poblacin sea finita pero demasiado
grande, y otras razones como costo o tiempo. Por ello parece ms prctico tomar muestras. Hay
dos maneras bsicas de hacer estimaciones:
Estimacin por intervalos de confianza: Se estima el parmetro desconocido con un intervalo, que
tiene asociado cierta probabilidad de ocurrencia.
Es un valor numrico que proporciona sus respectivos estimadores de punto que se calcula
considerando los datos muestrales, es decir, se usan las medidas de la muestra para calcular un
nico valor numrico que es la estimacin del parmetro poblacional.
Sin embargo, es necesario que cada estimador de punto cumpla con algunos requisitos
deseables como ser:
Insesgado: Es decir, la media aritmtica de todas las posibles estimaciones puntuales del
estimador del parmetro que puedan obtenerse debe ser igual al parmetro de la poblacin.
Ejemplo:
Se tiene inters en estimar el gasto promedio mensual en movilidad del personal profesional de
Administracin de la UNFV. Para el efecto, se recurre a una muestra aleatoria de 25 profesionales
de Administracin y se obtiene los siguientes resultados: x= S/ 160.00 y s =S/ 32.00.
El gasto promedio mensual en movilidad de todas las auxiliares de enfermera est representado
por (que es el parmetro poblacional) y la estimacin por punto de este parmetro sera: =
S/ 160.00
Sin embargo, este valor no se considera estable porque si repetimos la experiencia con diferentes
muestras del mismo tamao se van a obtener resultados distintos. Por consiguiente, la alternativa
es construir un intervalo de tal manera que el valor del parmetro se encuentre dentro de dicho
intervalo con un cierto grado de seguridad.
1.1.2. ESTIMACIN POR INTERVALOS DE CONFIANZA
Consiste en encontrar dos valores numricos LI y LS que definen un intervalo y se espera con
cierto grado de seguridad que dicho intervalo contenga el parmetro poblacional. Un problema
habitual es el de estimar parmetros que ayuden a caracterizar una variable. Por ejemplo1 el
porcentaje de individuos que mejora ante un cierto tratamiento o el tiempo que tarda un anestsico
en hacer efecto.
Podramos decir, que tras realizar un estudio, el 75% de los pacientes tratados experiment una
mejora. Una respuesta ms sofisticada usando intervalos de confianza podra ser: nuestro estudio
muestra que el 75% de los casos experimenta una mejora siendo el margen de error del 6%. El
nivel de confianza es de 95%.
El clculo de intervalos de confianza para la estimacin de parmetros son tcnicas que nos
permiten hacer declaraciones sobre qu valores podemos esperar para un parmetro. El intervalo
calculado depender de:
Lo estimado en una muestra (porcentaje, media, etc.). El intervalo de confianza est formado
por valores ligeramente menores y mayores que la aproximacin ofrecida por la muestra.
La probabilidad (nivel de confianza) con la que el mtodo dar una respuesta correcta. Niveles
de confianza habituales para los intervalos de confianza son el 95% y el 99%.
El clculo de un intervalo de confianza para la media aritmtica poblacional est dado por:
tn-1 = Es el coeficiente de confianza y cuyo valor depende del grado de confianza que se establece
Ejemplo:
Se quiere estimar un intervalo de confianza al nivel de significacin a = 0, 05 para la altura media
de los individuos de una ciudad. En principio solo sabemos que la distribucin de las alturas
es normal. Para ello se toma una muestra de n = 25 personas y se obtiene:
= 170 cm S = 10 cm
Solucin:
ERROR DE CONTRASTE
Al tomar una decisin en una prueba de hiptesis, hay cuatro posibles resultados que pueden
ocurrir; como se ilustra en el siguiente diagrama:
SITUACIN VERDADERA
DECISIN
LA HIPTESIS Ho ES VERDADERA LA HIPTESIS Ho ES FALSA
NO EXISTE ERROR
NO RECHAZAR LA ERROR DEL TIPO II
PROB= 1- a
HIPTESIS Ho PROB=
Confianza de la prueba
ERROR DEL TIPO I NO EXISTE ERROR
RECHAZAR LA
PROB= a PROB=1-
HIPTESIS Ho
Nivel de significancia Potencia de la prueba
TEMA 2 : PRUEBA DE HIPOTESIS PARA LA MEDIA, VARIANZA, PROPORCIN
POBLACIONAL. PRUEBA DE HIPTESIS PARA LA DIFERENCIA DE DOS MEDIAS.
En trmino sencillo, las hiptesis estadsticas consisten en suponer que los parmetros, que
definen a la poblacin, toman determinados valores numricos.
Ejemplo 1:
Una hiptesis podra ser que la comisin media de vendedores de computadoras en la ciudad
de Lima es S/. 1,000. No es posible entrevistar a todos los agentes para determinar si la media
en realidad es S/. 1,000. El costo de localizar e interrogar a cada vendedor de computadoras
en la ciudad de Lima sera exorbitante. Para probar la validez de la afirmacin ( =S/1000 ),
debe seleccionarse una muestra de la poblacin formado por vendedores de computadoras,
calcular valores estadsticos muestrales y, con base a determinadas reglas de decisin, aceptar o
rechazar la hiptesis.
Ejemplo 2:
Ejemplo:
En base a una muestra de piezas en un embarque que se acaba de recibir, un inspector de
control de calidad debe decidir entre aceptar todo el embarque o regresarlo al proveedor, porque
no cumple con las especificaciones.
Supongamos que las especificaciones de determinada pieza dicen que la longitud promedio debe
ser de dos centmetros para cada pieza. Si la longitud promedio de las partes es mayor o menor
que la norma de dos pulgadas, las partes causarn problemas de calidad en la operacin de
ensamblaje. En este caso, se formularn como sigue las hiptesis:
Ho: = 2
Ha: <>2
Si los resultados de la muestra indican que no se puede rechazar Ho, el inspector de control de
calidad no tendr razn para dudar que el embarque cumpla con las especificaciones y lo
aceptar. Sin embargo, si los datos de la muestra indican que se debe rechazar Ho, la conclusin
ser que las piezas no cumplen con las especificaciones. En este caso, el inspector tendr las
pruebas suficientes para regresar el embarque al proveedor.
Ho: <=12
Ha: > 12
c.
5. Calcular el valor del estadstico de la prueba y tomar decisin: Valor determinado a
partir de la informacin muestral, que se utiliza para determinar si se rechaza la hiptesis
nula. Se rechaza la hiptesis nula si el valor del estadstico cae dentro de la regin crtica.
6. Conclusin:
TEMA 3: PRUEBA DE CHI CUADRADO, PRUEBA DE BONDAD DE AJUSTE, TABLAS DE
CONTINGENCIA, PRUEBA DE CONTINGENCIA, PRUEBA DE HOMOGENEIDAD, PRUEBAS
DE HIPTESIS DE WILCONSON
Total 40 61 39 140
El cruce entre filas (i) y columnas (j) de una tabla cruzada o de doble entrada constituyen las
celdas, las cuales contienen informacin referente a las variables consideradas en la tabla y
pueden constituir las frecuencias o porcentajes.
El contraste estadstico ms utilizado para evaluar si las diferencias entre las frecuencias
observadas y las esperadas pueden atribuirse al azar, bajo la hiptesis de independencia, es el
denominado chi-cuadrado de Pearson
Entonces rechazaremos la hiptesis nula y concluimos que ambas variables son dependientes o
estn relacionadas. De lo contrario, estas seran independientes, es decir no estn
relacionadas.
No 24 6 30
Total 60 40 100
Solucin:
Primero: Planteamos nuestras hiptesis de acuerdo al enunciado.
H0: La recuperacin de una enfermedad y el uso de vitaminas son independientes. H1: La
recuperacin de una enfermedad y el uso de vitaminas son dependientes.
Segundo: Calculamos las frecuencias esperadas:
Recuperacin de la enfermedad
Uso
de No se
vitamin Se recupera recupera Tota
as l
S O11=36 O12=34 70
No O21=24 O22 30
Tota 60 =6
40 100
l
X 2 (calculado) =7.143 > X 2 (tabla)=3.84, por lo tanto, rechazamos la hiptesis nula y concluimos que
a un nivel de significancia del 5%, existe asociacin entre las variables analizadas, es decir que la
recuperacin de la enfermedad depende del uso de vitaminas
3.2. Prueba de bondad de ajuste. En las aplicaciones de una sola muestra( una sola
variable), la prueba de se conoce como la tcnica de bondad de ajuste y est orientada a
probar la concordancia o no entre una distribucin muestral u observada y una distribucin
hipottica o esperada. De ah el nombre de bondad de ajuste de las frecuencias observadas
y las esperadas. , en este caso, se usa con l finalidad de contrastar si una distribucin
muestral se ajusta o no a una distribucin terica o hipottica.
Lo que se requiere, entonces, es una hiptesis(nula) o teora postulada, denotada por H 0 que
nos permita calcular las frecuencias esperadas en cada categora y posteriormente probar H 0
con la ecuacin.
La X2 para el caso de una sola muestra, resuelve problemas cuyos datos pueden presentarse
segn el siguiente esquema.
___________________________
Variable OI Ei
__________________________
A1.. E1
A2.. E2
.
.
.
Ak...........................................E k
________________________________________
Total n...n
Puede notar en la ecuacin que si existe una semejanza grande entre las O i y las EI, el valor
de X2 resultante ser pequeo lo que llevar al no rechazo de la H 0. A medida que aumentan
las discrepancias (Oi-Ei) el valor de X2 aumenta. Cuanto mayor sea el valor de X 2 mayores
probabilidades tendremos de rechazar H0.
Ejemplo1:
Profesin Oi
A 12
B 15
C 07
D 11
E 10
Total 55
a) Hiptesis:
Ho: Las profesiones son igualmente preferidas (p=1/5)
H1: Las profesiones no son igualmente preferidas (p<>1/5)
b) Nivel de significacin:
Calculo de las Ei
Sobre la base de Ho, las Ei=np=55*1/5=11
Luego:
Profesin Oi Ei
A 12 11
B 15 11
C 07 11
D 11 11
E 10 11
Total 55 11
c) Estadstica de prueba
Usando la ecuacin tenemos:
d) Decisin
En este caso el nmero de categoras es 5. K=5 LUEGO gl=K-1; gl.=4.
Para tomar la decisin estadstica respecto a la H o, se tomar en cuenta la probabilidad de
cometer el error tipo I representado por p=P(Rechazar H0/Ho es verdadera. El valor de p
puede ser obtenido en forma exacta a travs del uso de algn paquete estadstico, o de la
tabla X2, en forma aproximada
Si p>= no se rechaza la Ho
Si p< se rechaza la Ho
Atendiendo a la regla de decisin no se rechaza H o, ya que para X2 c=3,09 El valor de p que
corresponde es : 0,50 <p< 0,70
e) Conclusin:
Se concluye que las 5 profesiones son igualmente preferidas
Caractersticas
Muestra 1 2 . . c Total
1 n11 n11 . . n1c n1.
2 n21 n22 . . n2c n2.
. . . . . .
. . . . . .
. . . . . .
r nr1 nr2 . . nrc nr.
Total n1 n2 . . nc n..
Ejemplo:
Determinar si existe independencia entre la actividad del sujeto y su estado de nimo. Nivel de
significacin (5%)
SOLUCIN:
Debemos primero calcular las frecuencias esperadas bajo el supuesto de independencia. La
tabla de frecuencias esperadas sera:
Este valor debemos compararlo con el percentil de la distribucin X2 con (2-1)(2-1)=1 grado de
libertad. X2 0.95 (1) =3.84
Por lo tanto como el valor del estadstico es superior al valor crtico, concluimos que debemos
rechazar la hiptesis de independencia y por lo tanto asumir que existe relacin entre la
depresin y los hbitos deportistas del individuo.
Caractersticas
Muestra 1 2 . . c Total
1 n11 n11 . . n1c n1.
2 n21 n22 . . n2c n2.
. . . . . .
. . . . . .
. . . . . .
r nr1 nr2 . . nrc nr.
Total n1 n2 . . nc n..
Ejemplo:
Estamos interesados en estudiar la fiabilidad de cierto componente informtico con relacin al
distribuidor que nos lo suministra. Para realizar esto, tomamos una muestra de 100
componentes de cada uno de los 3 distribuidores que nos sirven el producto comprobando el
nmero de defectuosos en cada lote. La siguiente tabla muestra el nmero de defectuosos en
para cada uno de los distribuidores.
SOLUCIN:
Debemos realizar un contraste de homogeneidad para concluir si entre los distribuidores
existen diferencias de fiabilidad referente al mismo componente.
Las frecuencias esperadas bajo homogeneidad son las representadas entre parntesis.
El estadstico del contraste ser:
Este valor del estadstico Ji-cuadrado es mayor que el valor para el nivel de significacin del
5%, por lo tanto debemos concluir que no existe homogeneidad y por lo tanto que hay
diferencias entre los tres distribuidores. X20.05 (2) 5.99.
3.5. Prueba de Signos-Rango de Wilconxon. Hemos viso que la prueba de los signos utiliza,
simplemente informacin concerniente a la direccin de la diferencia entre pares. Una de las
desventajas de la prueba de los signos es que elimina completamente cualquier informacin
cuantitativa que puede proporcionar un par de datos. Por ejemplo, trata como si 7-8 fuera igual
que 11-19, etc, la prueba de los signos trata todas las diferencias de ms coo si fueran las
mismas y todas las diferencias de menos como si fueran las mismas.
En cambio, la prueba de Wilconson considera la magnitud as como la direccin de las
diferencias, por lo que constituye una prueba mas poderosa que la de los signos, ya que da
mayor peso al par que exhibe una diferencia grande que al par que muestra una diferencia
pequea.
Por lo que acabamos de manifestar, la prueba de Wilconson es la mejor alternativa no-
paramtrica de la prueba de t de Student para dos muestras relacionadas. Es decir, si la
informacin muestral no cumple con las condiciones eigidas por la prueba de t podr usarse
la prueba de wilconson para comparar estadsticamente dos muestras relacionadas.
Ejemplo.
d) Decisin y conclusin
Si Ho fuera verdadera podramos esperar que la suma de rangos positivos y negativos se
anularan entre s Mientras ms preponderantemente positiva o negativa sea la suma de
rangos, la posibilidad de rechazar la Ho ser mayor.
El Estadstico T es la suma de rangos que tiene la suma ms pequea En nuestro caso T
calculado ser igual a 3. Este valor con n=7, lo ubicamos n la taba de valores crticos de
T en la prueba de Wilconxon, Tabla G, que se adjunta. Al valor de T calculado en un
contraste bilateral le corresponde una p>0,05. Luego, no se puede rechazar la H o. Por
consiguiente, los dos sistemas de enseanza producen efectos que difieren
significativamente.
ACTIVIDADES RECOMENDADAS
Una vez finalizado el estudio de la segunda unidad, es importante que repase los conceptos
y practique adecuadamente los ejercicios de la Gua Acadmica del Participante
TERCERA UNIDAD
Estimado participante:
En esta tercera unidad estudiaremos el Anlisis de Regresin Lineal
OBJETIVOS ESPECFICOS
CONTENIDO TEMTICO
El estudio estadstico de las relaciones, entre dos variables de intervalo, presenta los aspectos
fundamentales siguientes:
1. Existencia de asociacin entre las dos variables
2. Direccin de la asociacin
3. Grado de Asociacin
4. Naturaleza forma de la asociacin
Los dos primeros aspectos quedan determinados, cuando se halla el coeficiente de correlacin
r de pearson. Este coeficiente indica:
Los elementos fundamentales del anlisis de la regresin son las variables y la ecuacin de
regresin.
Las variables pueden ser dos o ms. Una de ellas es la variable dependiente y las restantes son
las variables independientes.
En cuanto a los tipos, se tiene una regresin simple y regresin mltiple. La primera se refiere a la
naturaleza y forma de covariacin entre dos variables nicamente, y la segunda entre ms de dos
variables.
A su vez, ambos tipos de regresin pueden ser lineales y no lineales. Cuando la ecuacin, que es
expresin matemtica de la relacin entre las variables, es una ecuacin lineal cuya
representacin grfica da lugar a una lnea recta, se est en el caso de la regresin lineal, y de la
no lineal, en el caso contrario.
Sirve para estudiar la naturaleza y forma de la asociacin entre dos variables, siempre que dicha
relacin pueda ser expresada matemticamente por la ecuacin de la lnea recta
Supongamos que tenemos los datos empricos que representan para cada uno de los sujetos de
un grupo los valores de dos variables, por ejemplo, la edad y la estatura. Entonces llevando en un
espacio de coordenadas cartesianas los valores de la edad al eje de las y los de la estatura al eje
de las Y, obtendramos una serie de puntos. Esta serie suele recibir el nombre de la nube de
puntos y constituye la representacin grfica de a posicin en el espacio cartesiano de cada sujeto
del grupo, respecto a las variables en cuestin.
y=f(x) y=0+ 1X
Entonces el modelo de regresin simple que sirva para predecir el comportamiento de Y usando x
ser de la forma:
y=0+ 1X +e
Para que dicha ecuacin est definida es necesario que se conozca 0 y 1. Dichos parmetros
se calculan utilizando el mtodo de mnimos cuadrados.
El mtodo de mnimos cuadrados busca o fija los datos de la muestra o poblacin a una lnea
recta de modo que las diferencias de cada observacin a la lnea de regresin sea lo menos
posible
Es una medida de la bondad de ajuste del modelo de regresin hallado. Indica qu porcentaje de la
variabilidad de la variable de respuesta "Y" es explicada por su relacin lineal con "X".
El valor estadstico de R2 vara de 0 a 1.
2.3. Grafico de la Ecuacin
Entonces para determinar estos dos puntos (pares ordenados) se calcula dos valores de Y para
dos valores de X. Por conveniencia tomaremos los valores extremos de X, pero puede ser
cualquiera de los otros valores
3.1. Concepto.
El anlisis de la varianza permite contrastar la hiptesis nula de que las medias de K poblaciones
(K >2) son iguales, frente a la hiptesis alternativa de que por lo menos una de las poblaciones
difiere de las dems en cuanto a su valor esperado. Este contraste es fundamental en el anlisis
de resultados experimentales, en los que interesa comparar los resultados de K 'tratamientos' o
'factores' con respecto a la variable dependiente o de inters.
El concepto bsico de anlisis de varianza fue desarrollado por R.A. Fisher y la distribucin F se
ha denominado en honor suyo. El razonamiento conceptual es el siguiente:
1. Se calcula la media para cada grupo de la muestra y despus se determina el error estndar
de la media S, con base solo en las diversas medias muestrales.
2. Dada la frmula S_=S/ , tenemos que S= ,Sx y que S2=nSx Esta estimacin resultante de
la varianza de la poblacin se llama la media cuadrtica, entre los grupos (MCE).
3. Se calcula la varianza dentro de cada grupo muestral y con respecto a cada media de grupo.
Luego se combinan estos valores de la varianza ponderndolos de acuerdo a n-1 para cada
muestra. La estimacin resultante de la varianza de la poblacin se llama media cuadrtica, de
los grupos (MCD).
4. Si la hiptesis nula m1=m2=m3=..mk es verdadera, entonces tenemos que las dos medias
cuadrticas obtenidas en (2) y (3) no estn sesgadas y son estimadores independientes de la
misma varianza de la poblacin, . Si la hiptesis nula es falsa, entonces el valor esperado de
la MCE es mayor que el de la MCD. Esencialmente, todas las diferencias entre las medias de
la poblacin inflarn la MCE, mientras que no afectarn la MCD.
5. Con base al numeral (4) se involucra una prueba de una cola, y la frmula general de la
prueba F en el anlisis de la varianza es:
F =MCD
MCE
Para simplificar este procedimiento con diseos en trminos del modelo lineal que identifica los
componentes influyendo sobre la variable aleatoria y se presenta en una tabla estndar de anlisis
de varianza mostrando los clculos necesarios de la media cuadrtica para cada tipo de diseo
experimental.
El modelo del anlisis de varianza de una va se relaciona con la prueba de la diferencia entre k
medias muestrales, cuando los sujetos se asignan aleatoriamente a cada uno de los diversos
grupos de tratamiento.
La ecuacin lineal que representa el modelo del anlisis de varianza de una va es:
Xik=+k+ik
Donde:
= media global de todos los k grupos de tratamiento
=efecto del tratamiento en el grupo especfico k, del cual se muestra el valor
ik =error aleatorio relacionado con el proceso de muestreo
La tabla siguiente es un resumen del anlisis de varianza de una va en la cual MCD pasa
a ser la media cuadrtica entre los grupos A grupos de tratamiento (MCA) y (MCE) es
llamada media cuadrtica del error. N asigna el tamao del total de la muestra para todos
los grupos de tratamiento combinados, antes que el tamao de la poblacin T k representa
la suma(total) de los valores muestreados en todos los grupos combinados.
Ejemplo:
Solucin
Suma de cuadrados de tratamiento
SCA=
=698-250=448
Fuente de Suma de los Grados de Media Relacin
variacin cuadrados SC libertad gl cuadrtica MC F
Entre grupos de SCA=250 k-1=2 MCA=125 Fo=3,35
tratamiento A
Error de SCE=448 n-k=12 MCE=37,33 Ft=3,89
muestreo, E
Total, T STC=698 N-1=14
Ft=F(1-,glA,glE)=F(0,95,2,12)=3,89
Ho=1= 2= 3=0
Ha= a algun 1 0
=0,05
f.p. Ft=3,35
4.1. Concepto
El anlisis de correlacin tiene como objetivo medir la fuerza de una relacin entre variables
cuantitativas y/o cualitativas, esta es medida a travs del coeficiente de correlacin, para
variables cuantitativas que tienen distribucin normal se utilizar la correlacin momento-
producto de Pearson y para variables que no tienen distribucin normal o cualitativas la
correlacin de rango de Tau de Kendall o Spearman.
Esta relacin que es analizada puede estar dada de una manera lineal, la cual nos dice que
los datos se ajustaran a una lnea recta o tambin estara de una forma no lineal en este caso
los datos se ajustaran ms a una curva. Es decir, dos variables pueden estar perfectamente
relacionadas, pero si la relacin no es lineal, el coeficiente de correlacin de Pearson o de
Spearman no ser un estadstico adecuado para medir su asociacin.
Si la relacin que se busca es solamente entre dos variables, recibe el nombre de correlacin
simple o bivariada.
Hay supuestos que constituyen un modelo de poblacin por correlacin lineal bivariable, para lo
cual se calcula o se estima r, los cuales son:
1. Y e X son variables aleatorias, y como tal no debe ser designada como dependiente e
independiente. Cualquier designacin dar el mismo resultado, pues ello no interviene en la
estimacin del r.
2. La poblacin bivariable es normal, o sea Y e X estn normalmente distribuidas.
Se presenta correlacin lineal cuando la relacin entre dos variables se manifiesta a travs de
una lnea recta y es simple porque solo intervienen dos variables.
Esta correlacin o asociacin, se mide a travs del coeficiente de correlacin lineal simple (p
r), definido como:
POBLACIN:
MUESTRA:
-1 0 1
Recuerda que:
El signo del coeficiente de correlacin es el mismo que el de
la covarianza. Si la covarianza es positiva, la correlacin es
directa.
Si la covarianza es negativa, la correlacin
es inversa. Si la covarianza es nula, no
existe correlacin.
Recuerda que:
El signo del coeficiente de correlacin es el mismo que el de
la covarianza. Si la covarianza es positiva, la correlacin es
directa.
Si la covarianza es negativa, la correlacin
es inversa. Si la covarianza es nula, no
existe correlacin.
Observacin:
El coeficiente de correlacin de clculo "r" es un estimador muestral del coeficiente poblacional
Rho
Cuando el valor de p r sale ms cerca de "1", mayor ser la correlacin lineal positiva o
sea la relacin entre las variables X e Y es directa, es decir si X aumenta, Y tambin
aumenta; y si X disminuye, Y tambin disminuye.
Cuando el valor de p r, sale ms cera a "-1", mayor ser la correlacin lineal negativa o sea
la relacin entre las variables X e Y es inversa, es decir si X aumenta, Y disminuye; y si X
disminuye, Y aumenta.
Si Cov(Y, X) = 0 ; entonces p r = 0 , luego la correlacin es nula entre las dos variables,
es decir las variables son independientes.
La siguiente es una tabla segn, M. Reyes, para deducir el grado de correlacin lineal simple
entre dos variables: Si, p r se encuentra en:
1.00 CORRELACIN PERFECTA Y POSITIVA
0.90 - 0.99 CORRELACIN MUY ALTA
0.70 - 0.89 CORRELACIN ALTA
0.40 - 0.69 CORRELACIN MODERADA
0.20 - 0.39 CORRELACIN BAJA
0.01 - 0.19 CORRELACIN MUY BAJA
0 No existe correlacin
-1 CORRELACIN PERFECTA Y NEGATIVA
Ejemplo:
En la empresa "PAVIRICOS S.R.L." dedicada a la comercializacin agrcola, se desea estudiar
el efecto del nmero de horas por semana (X), en el sueldo de los trabajadores obreros (Y)
para 2007. La informacin de los 10 trabajadores obreros da los siguientes resultados:
Solucin:
a) Diagrama de dispersin.
Una vez finalizado el estudio de la tercera unidad, es importante que repase los conceptos y
practique adecuadamente los ejercicios de la Gua Acadmica del Participante
NMEROS NDICE
Estimado participante:
En esta cuarta unidad estudiaremos los nmeros ndices
OBJETIVOS ESPECFICOS
1. Elaborar modelos para predecir una variable de serie de tiempo y mostrar mtodos para
calcular los nmeros ndice.
2. Manejar conceptos bsicos de nmero ndice y sus relaciones.
3. Aplicar los mtodos para calcular nmeros ndices
CONTENIDO TEMTICO
Un nmero ndice es una medida estadstica que expresa la variacin relativa experimentada, en
el tiempo o en el espacio, por una magnitud en dos situaciones diferentes, una tomada como
referencia denominada situacin base, la otra recibe el nombre de situacin actual.
Es una medida estadstica diseada para poner en relieve cambios en una variable o en un grupo
de variables relacionadas con respecto al tiempo, situacin geogrfica, ingresos o cualquier otra
caracterstica.
Series de ndices: Es una coleccin de nmeros ndices para diferentes aos, lugares, etc.
"Un nmero ndice es un valor relativo expresado como porcentaje o cociente, que mide un
periodo dado contra un periodo base determinado." Leonard Kasmier
"Un nmero ndice es una medida estadstica diseada para poner de relieve cambios en un
variable o en un grupo de variables relacionadas con respecto al tiempo, situacin geogrfica,
ingresos, o cualquier otra caracterstica." Spiegel Murray
Segn Richard Levin "un numero ndice mide cuanto cambia una variable con el tiempo."
Segn Enrique Cansado "no puede entenderse que los nmeros ndices, puedan "medir", ya que
la medicin arroja datos precisos, y un nmero ndice solo indica la manera de evolucionar de una
serie cronolgica pluridimensional. No mide, describe simplemente. Es un indicadoren realidad
se trata solamente de un estadgrafo que no son medidas sino caractersticas (numricas)
descriptivas de la distribucin que se estudia."
Debemos definir:
Periodo dado es aquel periodo que puede ser el actual, o uno diferente en estudio
Periodo base es aquel que se toma como referencia, para todos los estudios, y es el que
se compara con el periodo dado
Po/n=
En general: si Pa y Pb son precios de un artculo durante los perodos a y b respectivamente.
Pa/b=
Ejemplo
Suponga que el precio al consumo de un litro de leche en los aos 1990 y 1998 era de
S/0,85 y S/. 1,50 respectivamente. Tomando como ao base 1990 y luego 1998, hallar la
relacin de precios.
Solucin:
Este mtodo se sirve de las cantidades consumidas durante el periodo base, es la tcnica de
mayor uso por requerir medidas de cantidades durante un solo periodo. Como cada nmero ndice
se funda en el mismo precio y cantidad base, los gerentes pueden comparar el ndice de un
periodo con el de otro
Se calcula as:
= precios en el ao actual
= precio en el ao base
Ejemplo calcular el ndice agregado de precios de Laspeyres para el ao 2000 de las tres
mercancas tabla 1, usando como base el ao 1995.
Mercanca
I= x 100= 126.7
Ventajas del Mtodo de Laspeyres
El utilizar la misma cantidad del periodo base nos permite realizar una comparacin directa.
Donde:
Mercanca
I= x 100= 127.4
=pesos fijos
Ventajas del Mtodo de agregados de peso fijo
La flexibilidad en la seleccin del precio base y del peso (cantidad) fijo." Richard Levin
2.1.5. ndice ideal de Fisher
Es la media geomtrica de los nmeros ndices de Laspeyres y de Paasche.
I= =126.6
3.5. Relativos eslabonados
"Son ndices cuya base es siempre periodo anterior. En consecuencia, respecto de un conjunto de
relativos eslabonados de valores anuales de ventas, cada numero ndice representa una
comparacin porcentual con el ao anterior. Estos relativos son tiles para destacar
comparaciones entre un ao y otro, pero resultan inconvenientes como base de comparaciones a
largo plazo" Leonard Kasmier
3.6. Cambio del periodo de base
"La base de una serie establecida de nmeros ndices suele cambiarse a un ao mas reciente
para que las comparaciones actuales sean mas significativas. Partiendo del supuesto de que no
se dispone de las cantidades originales en las que se apoya la serie de nmeros ndices, el
periodo base de un numero ndice puede cambiarse dividiendo cada ndice (original) entre el
ndice del ao base recin determinado y multiplicando el resultado por 100:" Leonard Kasmier
x100
3.7. Fusin de dos series de nmeros ndices
"Es frecuente que un numero ndice sufra cambios a causa de la adiccin de ciertos productos
nuevos o de la exclusin de ciertos productos antiguos, as como de cambios en el ao base. Sin
embargo, para efectos de continuidad histrica es deseable contar con una serie uniforme de
nmeros ndices. Para fusionar dos diferentes series de tiempo de esta clase a fin de tomar una
serie continua de nmeros ndices, debe haber un ao de empalme de las dos series en relacin
con el cual se hayan calculado ambos nmeros ndices. Generalmente el ao de empalme es
tambin la nueva base, por que es el ao en que se ha aadido y/o eliminado productos del ndice
agregado. Los nmeros ndices que deben modificarse en el proceso de fusin son los ndices de
la antigua serie. Este cambio se realiza dividiendo el nuevo numero ndice del ao de empalme,
entre el antiguo ndice de ese ao y multiplicando despus por este cociente cada uno de los
nmeros ndices de la antigua serie de los nmeros ndices." Leonard Kasmier
ACTIVIDADES RECOMENDADAS
Una vez finalizado el estudio de la cuarta unidad, es importante que repase los conceptos y
practique adecuadamente los ejercicios de la Gua Acadmica del Participante
Moshera, 2003/495p
4. Lind, Douglas A./ Mason Robert D. / Marchal, William G. (2001). Estadstica para