ES TAD S TIC A I I
C a r a ca s, a g o st o 2 0 0 6
1
R ep b l i ca Bo l i v ari an a d e Ven ez u el a
M i n i s t e r i o d e E d u c a c i n S u p e r i o r
F u n d a c i n M i s i n S u c re
M i n i s t r o d e Ed u c a c i n S up e r i o r
V i c e mi n i s t r a d e Po l t i c a s A c a d mi c a s
D i s e a d o ra In s tru cc i o n a l
P r o f . Lu i s a M r q u e z
2
UNIDADES CURRICULARES ESPECIALIZADAS
E S T AD S TI CA II
horas
Trabajo Acompaado 3
Trabajo Independiente 3
Horas por semana 6
Total horas por trimestre 42
3
Puntual
Hiptesis
UNIDAD
3. Prueba de
2. Estimacin
TEMTICA
Correlacin
4. Regresin y
1. Probabilidad
Grales. del
proceso
administrativo
Elaboracin de
normas o
procedimientos
Marco Legal y
fiscal para la
administracin
Tcnicas y
principios de
mercadeo
Conocimientos
Desarrollo
econmico y
social
Tcnicas y
procedimientos
contables
Identificar
problemas o
necesidades
Elab informes.
Administ
Competencias a desarrollar
COMPETENCIAS
Elab edos
financ.
Formular
proyectos
Habilidades y Destrezas
Elaborar
normas y
procedmientos
Relaciones
asertiva.s
Compromiso
social
Participacin en
desarrollo
Actitudes y valores
endgeno
4
T
Taabbllaa ddee C
Coonntteenniiddooss
Pg.
Programa instruccional 4
Introduccin 6
Contenidos de Repaso. Teora de conjuntos 7
UNIDAD 1 PROBABILIDAD 13
Experimento, Resultado y Evento 16
Distribuciones de probabilidad 18
o Probabilidad binomial 19
o Probabilidad normal 23
o Aproximacin de la distribucin normal a la binomial 29
UNIDAD 2 ESTIMACIN PUNTUAL 30
Poblacin y muestra 32
Mtodos de muestreo 32
Teorema del lmite central 34
Estimadores 35
o Estimador puntual 35
o Intervalos de confianza 36
o Determinacin de parmetros para la media y la proporcin 37
o Caractersticas de un buen estimador 39
Clculo del tamao de la muestra 41
UNIDAD 3 PRUEBA DE HIPTESIS 44
Qu es una hiptesis? 46
Qu es una prueba de hiptesis? 46
Procedimiento para probar una hiptesis 46
Prueba para una o dos colas 50
Pruebas para media y proporcin 51
UNIDAD 4 REGRESIN Y CORRELACIN 59
Variable dependiente e independiente 61
Diagrama de dispersin 62
Coeficiente de correlacin 62
Respuestas
Bibliografa
Anexos
PPR
ROOG
GRRA
AMMA
A IIN
NSST
TRRU
UCCC
CIIO
ONNA
ALL
Objetivo General:
Analizar situaciones organizacionales a travs de estadsticos idneos que permitan
considerar el efecto y la interaccin entre los diferentes factores que intervienen en la
toma de decisiones administrativas.
Sinopsis de Contenidos:
UNIDAD 1. PROBABILIDAD
Objetivo: Aplicar los conceptos de probabilidad que permitan reducir los riesgos en la
toma de decisiones
Conceptos bsicos:
Probabilidad
Experimento, resultado y evento
Espacio muestral
Punto muestral
Sucesos y sus probabilidades
Distribuciones de probabilidad
Variable aleatoria
Valor esperado
Probabilidad binomial
Probabilidad normal
Concepto, propiedades e importancia
Funcin de probabilidad
reas bajo la curva
Tablas
Ajuste de la distribucin normal a la distribucin experimental y a
la binomial
6
UNIDAD 3. PRUEBA DE HIPTESIS
7
IIN
NTTR
ROOD
DUUC
CCCII
NN
8
C
Coonntteenniiddooss ddee R
Reeppaassoo
A
Todos los B
estudiantes la Todos los
clase especialistas en
economa
A B) A interseccin de B
Especialistas en economa en la clase
Notacin
Por lo regular se usan letras maysculas para representar a los conjuntos, y letras
minsculas para representar a los elementos de un conjunto dado. Si es un conjunto,
y todos sus elementos, es comn escribir:
para definir a tal conjunto . La notacin empleada para definir al conjunto se llama
notacin por extensin. Para representar que un elemento pertenece a un conjunto
, escribimos (lase en ). La negacin de se escribe .
9
donde el smbolo se lee "tal que", y puede ser remplazado por una barra . Por
ejemplo, el conjunto puede definirse por
Complemento de un conjunto
Igualdad de conjuntos
Subconjuntos y Superconjuntos
Un conjunto se dice subconjunto de otro , si todo elemento de es tambin
elemento de , es decir, cuando se verifique
y tambin
,
significando que es superconjunto propio de .
10
Por el principio de identidad, es siempre cierto , para todo
elemento , por lo que todo conjunto es subconjunto (y tambin superconjunto) de s
mismo.
Vemos que es una relacin de orden sobre un conjunto de conjuntos, pues
para todo ,y es reflexiva.
,y es antisimtrica
,y es transitiva
Interseccin
Los elementos comunes entre y forman un conjunto denominado interseccin de
y , representado por :
Entonces:
Diferencia
Vemos que
,
de manera que
11
. Pero tambin
,
de modo que
Diferencia simtrica
Cuantificadores
Los cuantificadores sirven para indicar cuantos elementos de un conjunto dado cumplen
con cierta propiedad. Tales cuantificadores son:
Se definen
Aplicaciones
Sean y dos conjuntos. Un subconjunto , se dice aplicacin de en
, lo que se representa por
siempre que se verifiquen
12
Si , el elemento se dice imagen de por , y el elemento se llama
antecedente de por .
Sea una aplicacin . Se emplea la notacin para representar a la
imagen de por , y por tanto .
Sean las aplicaciones y . Se define
13
Unidad I
Probabilidad
Objetivo:
Conocer los conceptos de probabilidad a fin de establecer las posibles relaciones entre
eventos que permitirn reducir riesgos en a toma de decisiones en a practica
profesional
Contenidos:
Probabilidad normal
Conceptos Bsicos
Probabilidades
Experimentos, resultados y evento
Espacio muestral
Punto muestral
Sucesos y sus probabilidades
Distribuciones de probabilidad
Variable aleatoria
Valor esperado
Probabilidad binomial
Probabilidad normal
14
No s cuando
podr realizarse el
sueo de Bolvar
pero nosotros
iremos poniendo las
piedras
Augusto
Sandino
Probabilidad
Probabilidad es un concepto que en administracin nos permite trabajar en funcin de
nuestras expectativas con la ocurrencia algn resultado, esto significa que hacemos
proyecciones sobre la posibilidad de xito o fracaso de un suceso, lo que a su vez
genera una reduccin de riesgos y de incertidumbre en la toma de decisiones.
El propsito de esta unidad es ofrecer en una primera parte los conceptos bsicos
sobre probabilidad y luego la aplicacin de dichos conceptos en la construccin de las
distribuciones de probabilidad, que es una lista que contiene todos los resultados de un
experimento y la probabilidad de ocurrencia de cada uno de ellos.
15
UNIDAD I. PROBABILIDAD
Probabilidad
Es la posibilidad de que algo va a ocurrir, es medida entre 1 y 0. Mientras mayor sea la
probabilidad de que el evento ocurra, la probabilidad asignada estar ms cerca de
uno, si hay certeza del que el evento va a ocurrir la probabilidad es de 1, y por el
contrario la posibilidad de que no ocurra es de 0.
Si por ejemplo durante el ao pasado hubo 200 nacimientos en un hospital local, de los
cuales 122 fueron varones el modelo de frecuencia relativa revela que la probabilidad
de que el prximo nacimiento o un nacimiento seleccionado al azar sea una nia se
obtiene dividiendo el nmero de nias que naci el ao anterior dividido entre le nmero
total de nacimientos:
78
P(nia ) 0,39
200
P(cara)= Nmero de formas en las que el evento puede ocurrir / Nmero total de
posibles resultados
1
P(cara) 0,5
2
En este ejemplo slo hay una posibilidad de que salga cara, y dos posibles resultados,
que salga cara o que salga sello. Segn el resultado de la ecuacin existen iguales
posibilidades de que salga cara o sello, pues la probabilidad se halla en medio de 0 y 1.
Aun sin conocer a fondo la probabilidad clsica, se puede estar consciente de que la
probabilidad de obtener una cara en el lanzamiento de una moneda es de la mitad.
Tipos de
Probabilidad
Probabilidad Probabilidad
Objetiva
Experimento
Seguramente asocias la palabra experimento a las ciencias fsicas donde nos
imaginamos a alguien mezclando qumicos y manipulando tubos de ensayos, sin
embargo, en administracin se realizan experimentos para conocer los posibles
resultados de una accin. Se dice que experimento es toda accin definida que conlleva
a un resultado nico bien definido que tiene dos o ms posibles resultados y no se sabe
cul va a ocurrir.
Resultado
Una consecuencia particular de un experimento.
Evento
Una coleccin de uno o ms resultados. De acuerdo a como se relacionan los eventos
de un experimento se pueden clasificar en: mutuamente excluyentes, colectivamente
exhaustivos, independientes o complementarios.
Mutuamente excluyente: la ocurrencia de cualquiera de los eventos implica que
ninguno de los otros eventos puede ocurrir al mismo tiempo. Como ejemplo tenemos el
lanzamiento de una moneda en la cual si sale cara garantiza que no puede salir sello.
17
Colectivamente exhaustivo: por lo menos uno de los eventos tiene que ocurrir, un
ejemplo es el lanzamiento de un dado, los resultados posibles son 1,2,3,4,5 y 6 y existe
la certeza que uno de ellos va a ocurrir.
Independientes: son eventos en los que la ocurrencia de uno no tiene nada que ver con
la ocurrencia del otro, por ejemplo lanzar un dado y una moneda a la vez, el resultado
del lanzamiento del dado no afecta al de la moneda.
Complementarios: son los eventos en los que si un evento no ocurre debe ocurrir el
otro. Una buena representacin de estos eventos la podemos apreciar al lanzar un dado
podemos decir que un evento A es sacar un nmero par, pero si esto no ocurre, el
complemento es sacar un nmero impar. En estos casos los eventos se denominan A
y no A.
Existe una ltima categora que son los eventos compuestos consiste en la co-
ocurrencia de dos o ms eventos aislados. Las operaciones de conjuntos de
interseccin y unin implican eventos compuestos. De esta manera si se lanza una
moneda y un dado a la vez el resultado es un evento compuesto y se puede calcular la
probabilidad de tal evento. Los eventos compuestos son ms interesantes e incluso
ms tiles en la administracin ya que por medio de ellos pueden estudiarse las
relaciones entre dos sucesos que ocurren de forma paralela.
En el experimento del lanzamiento de un dado hay seis posibles resultados, pero hay
muchos eventos posibles.
Ejercicio 1:
Clasifica los siguientes eventos:
18
Espacio de Muestras y Eventos
Los elementos de bsicos de la teora de probabilidades son los resultados del proceso
o fenmenos bajo estudio. Cada tipo posible de ocurrencia se denomina un evento. Un
evento simple puede describirse mediante una caracterstica sencilla. La complicacin
de todos los eventos posibles se llama espacio muestral. Un evento conjunto es un
evento que tiene dos o ms caractersticas.
Cada
elemento 1 2 El conjunto de los
dentro del 3 nmeros del 1 al 6, es el
conjunto es 4 espacio muestral
un punto 5 6 U = {1,2,3,4,5,6}
muestral
Distribuciones de Probabilidad
Una distribucin de probabilidad aporta el rango completo de valores susceptibles de
ocurrir con base en un experimento. Una distribucin de probabilidad es similar a una
distribucin de frecuencia, con la diferencia que no describe el pasado sino muestra que
tan probable es que ocurra un evento. Dado que esta clase de distribuciones se ocupan
de las expectativas son modelos de gran utilidad para hacer inferencias y tomar
decisiones en condiciones de incertidumbre.
Variable Aleatoria.
Una variable aleatoria es aquella que asume diferentes valores, a consecuencia de los
resultados de un experimento aleatorio, cada uno de los cuales tiene una determinada
probabilidad. Por ejemplo si contamos la cantidad de alumnos inasistentes a las clases
de estadstica II durante un mes, el nmero de ausencias es la variable aleatoria. Si esa
variable toma slo valores enteros, se dice que es de tipo discreto, tal es el caso del
ejemplo anterior, sera imposible decir que faltaron 3,5 estudiantes. Pero si por el
19
contrario la variable puede tomar valores fraccionarios se dice que es de tipo continuo.
Un ejemplo de una variable aleatoria discreta es el peso de los perros que recibe un
veterinario en su consulta, 50.5 Kg, 25.6 Kg, etc.
Supongamos que tenemos una variable aleatoria x, y que esta puede tomar los valores
x1, x2 , x3 ...xn que pueden ser discretos o continuos; cada uno de estos valores tiene
cierta probabilidad que en la prctica se desconoce; sin embargo, a travs de
planteamientos tericos podemos obtener dichas probabilidades, a las cuales
designamos por f(x); al desarrollo que toman estos valores de f(x), es lo que se llama
distribuciones de probabilidad de la variable aleatoria x. Estas distribuciones de
probabilidad toman diferentes formas o tipos, sin embargo, las ms importantes son la
distribucin binomial y la distribucin normal.
Valor Esperado.
Probabilidad Binomial
1. Slo debe haber dos resultados posibles. Uno se identifica como xito y el otro como
fracaso, pero este resultado no trae una connotacin de bueno o malo, es decir, un
xito no significa que el resultado sea deseable.
2. La probabilidad de que una observacin se clasifique como xito, p, es constante de
observacin a observacin. Por tanto, la probabilidad de que una observacin se
clasifique como fracaso, q= 1-p, es constante sobre todas las observaciones.
3. Cada observacin puede clasificarse en una o dos categoras mutuamente
excluyentes y colectivamente exhaustivas. El resultado de cualquier observacin es
independiente del resultado de cualquier observacin.
4. El experimento puede repetirse muchas veces, pues un experimento no afecta al
otro.
20
Como ya se mencion el smbolo p representa la probabilidad de un xito y el smbolo
q ( 1- p ) representa la probabilidad de un fracaso. Para representar cierto nmero de
xitos, utilizaremos el smbolo r y para simbolizar el nmero total de ensayos
emplearemos el smbolo n.
P Probabilidad de xito.
Q Probabilidad de fracaso.
r Nmero de xitos deseados.
n Nmero de ensayos efectuados.
21
Ejemplo:
La Lnea rea Conviasa tiene 5 vuelos diarios a Barquisimeto. Supongamos que la
probabilidad de que alguno de los vuelos salga retrasado es de 0.20 Cul es la
probabilidad de que ninguno de los vuelos hoy salga retrasado?
n!
Utilicemos la frmula P p r q n r , considerando que n=5 vuelos, y p=0,20
r!(n r )!
n! 5! 120
P p r q nr 0,2010,80 4 0,2(0,4096) 5(0,08) 0,4096
r!(n r )! 1!(5 1)! 1(24)
n! 5! 120
P p r q nr 0,20 5 0,80 0 0,0032(1) 1(0,0032) 0,0032
r!(n r )! 5!(5 5)! 120(1)
Ejercicio 2:
Ahora realiza t la ecuacin sustituyendo r por los valores 2, 3 y 4. En la tabla de la
Distribucin Binomial, que se te presenta a continuacin, se muestran los resultados
para que verifiques tu ejercicio:
22
La distribucin binomial tambin se puede expresar de forma grfica
0,45 0,4096
Recuerdas los grficos de
0,4
0,3277 barras estudiados en
0,35
Estadstica I, ahora tambin
Probabilidad
0,3
los puedes utilizar para
0,25 0,2048
graficar la Distribucin de
0,2
Probabilidad Binomial.
0,15
0,1 0,0512
0,05 0,0064 0,0003
0
Vuelos retrasados
Ejercicio 3:
Imaginemos una escuela primaria donde los alumnos llegan tarde a menudo. Cinco
alumnos estn en el jardn de nios. La directora lleva tiempo estudiando el problema,
habiendo llegado a la conclusin de que hay una probabilidad de 0.4 de que un alumno
llegue tarde y de que los alumnos lleguen independientemente uno de otro Cmo
trazamos una distribucin binomial de probabilidad que ilustre las probabilidades de que
0,1,2,3,4 5 estudiantes lleguen tarde simultneamente?
=np
donde :
n= nmero de ensayos.
p= probabilidad de xitos.
Recuerda que la Desviacin
Y la desviacin estndar de la siguiente forma: Estandar se determina
n. p.q
calculndole la raz cuadrada
donde :
n= nmero de ensayos. de la Varianza( 2 ), por lo que
p= probabilidad de xito.
inferimos que 2 (npq)
q= probabilidad de fracaso.
23
Ejemplo:
Una mquina empaquetadora que produce 20% de paquetes defectuosos. Si se extrae
una muestra aleatoria de 10 paquetes, podremos calcular la media y la desviacin
estndar de la distribucin binomial de ese proceso en la forma que sigue:
= np = 10*0.2 = 2 Media.
Probabilidad normal
Leptocrtica
Ambas mitades de la
campana son idnticas
Mesocrtica
Platicrtica
La distribucin normal tiene varias propiedades tericas importantes, entre las cuales
estn:
1. Tiene forma de campana, es simtrica en apariencia y posee un solo pico en el
centro de la distribucin.
2. Sus mediciones de tendencia central (media, mediana, moda) son iguales y se
ubican en el pico.
3. Su dispersin media es igual a 1.33 desviaciones estndar. El valor de su alcance
intercuartil puede diferir ligeramente de 1.33 desviaciones estndar.
4. La curva normal desciende suavemente en ambas direcciones a partir del valor
central. Es asinttica, lo que significa que la curva se acerca cada vez ms al eje de
las X pero jams llega a tocarlo. Es decir, las colas de la curva se extienden de
manera indefinida en ambas direcciones.
Para saber si una distribucin es simtrica, hay que precisar con respecto a qu. Un
buen candidato es la mediana, ya que para variables continuas, divide al histograma de
frecuencias en dos partes de igual rea. Podemos basarnos en ella para, de forma
natural, decir que una distribucin es simtrica si el lado derecho de la grfica (a
partir de la mediana) es la imagen por un espejo del lado izquierdo
25
Si la variable es continua simtrica y unimodal, coinciden la media, la mediana y la
moda.
Dentro de los tipos de asimetra posible, vamos a destacar los dos fundamentales
Asimetra positiva:
Si las frecuencias ms altas se encuentran en el lado izquierdo de la media, mientras
que en derecho hay frecuencias ms pequeas (cola).
Asimetra negativa:
Cuando la cola est en el lado izquierdo.
26
Cmo se construye una Distribucin de Probabilidad Normal
Construir una distribucin de probabilidad, tal y como lo hicimos con la binomial sera
imposible debido a que la probabilidad normal est determinada por la media ( ) y la
desviacin estndar ( ). Lo bueno es que podemos utilizar un solo dato de la familia de
distribuciones normales para dar respuestas a todos los problemas que decidamos
resolver con este tipo de distribucin. La que tiene una media de 0 y una desviacin
estndar de 1 se le conoce como distribucin normal estndar. Todas las distribuciones
normales pueden convertirse a distribucin normal estndar restando la media de cada
observacin y dividiendo por la desviacin estndar, utilizando un valor z.
Valor Z:
La distancia entre un valor seleccionado, designado X, y la media ,
dividida por la desviacin estndar.
X
Z
Donde:
X: es el valor de cualquier observacin o medicin especfica.
: es la media de la distribucin.
: es la desviacin estndar de la distribucin
Las tablas estadsticas indican porciones del rea bajo la curva normal que estn
contenidas dentro de cualquier nmero de desviaciones estndar (ms, menos) a partir
de la media.
No es posible ni necesario tener una tabla distinta para cada curva normal posible. En
lugar de ello, podemos utilizar una distribucin de probabilidad normal estndar para
encontrar reas bajo cualquier curva normal. Con esta tabla podemos determinar el
rea o la probabilidad de que la variable aleatoria distribuida normalmente est dentro
27
de ciertas distancias a partir de la media. Estas distancias estn definidas en trminos
de desviaciones estndar.
Para cualquier distribucin normal de probabilidad, todos los intervalos que contienen el
mismo nmero de desviaciones estndar a partir de la media contendrn la misma
fraccin del rea total bajo la curva para cualquier distribucin de probabilidad normal.
Datos:
n = 30 x =10.547 = 0.718
X 11
Media 10.55 0
Z 0.64
28
De estos datos podemos hacer la siguiente tabla de distribuciones
X f(X) Z f(Z)
Interpretacin:
La probabilidad de que el valor de hemoglobina en una gestante adolescente que curse
el tercer trimestre del embarazo sea menor a 11 mg/dl es de 0.64. Es decir, el 64% de
las gestantes adolescentes que acuden a maternidad de Lima sufren de anemia
asociada a la gestacin.
Ejercicio 4:
El costo de una chupetas de diferentes marcas tiene una distribucin aproximadamente
normal con una media de 500 y una desviacin estndar de 10Cul es el valor z para
un valor x de 520 y otro de 490?
z = (x - m ) / s
29
en la que:
Los extremos de la distribucin normal se acercan al eje horizontal, pero nunca llegan a
tocarlo. Esto implica que existe algo de probabilidad (aunque puede ser muy pequea)
de que la variable aleatoria pueda tomar valores demasiado grandes. No perderemos
mucha precisin al ignorar valores tan alejados de la media. Pero a cambio de la
conveniencia del uso de este modelo terico, debemos aceptar el hecho de que puede
asignar valores empricos imposibles.
Aunque la distribucin normal es continua, resulta interesante hacer notar que algunas
veces puede utilizarse para aproximar a distribuciones discretas, debido a que generar
una distribucin binomial para muestras grandes puede llevar mucho tiempo es ms
eficiente hacer una aproximacin de la distribucin normal a la binomial
Una distribucin binomial B(n,p) se puede aproximar por una distribucin normal,
siempre que n sea grande y p no est muy prxima a 0 o a 1. La aproximacin consiste
en utilizar una distribucin normal con la misma media y desviacin tpica que la
distribucin binomial. En la prctica se utiliza la aproximacin cuando:
En cuyo caso:
30
Unidad II
Estimacin Puntual
Objetivo:
Calcular los intervalos de confianza de los estimadores para la toma de decisin.
Contenidos:
Poblacin y muestra
Mtodos de muestreo
Muestro aleatorio simple
Muestreo aleatorio sistemtico
Muestreo aleatorio estratificado
Muestreo por conglomerados
Estimadores
Intervalos de confianza para la media y la proporcin
Determinacin del tamao de la muestra
31
Vive como si
fueras a morir
maana.
Aprende como si
fueras a vivir
siempre.
Mohandas Gandhi
Estimacin Puntual
En administracin es usual realizar estudios en los que se aborden diversas
poblaciones, sin embargo acceder a cada miembro de esas poblaciones es un trabajo
imposible de realizar, por ello se seleccionan muestras que nos den una evidencia de lo
que gusta, opina, etc. una poblacin, no obstante el hecho de no poseer los datos
reales nos obliga a estimarlos, para ello existen los estimadores. En esta unidad
encontrars algunos aspectos relacionados con los estimadores puntuales y sus
intervalos de confianza.
32
UNIDAD II. ESTIMACIN PUNTUAL
Poblacin y Muestra
Mtodos de Muestreo
El muestreo es una herramienta para inferir algo respecto a una poblacin mediante la
seleccin de una muestra de esa poblacin. En muchas oportunidades el muestreo es
la nica herramienta para determinar algo con respecto a la poblacin por:
1. Es costoso abordar a todos los integrantes de la poblacin
2. La idoneidad de los resultados de la muestra, es decir, para muchos estudios no
es esencial indagar sobre la totalidad de la poblacin pues con una muestra se
obtiene los datos necesarios sin afectar significativamente los resultados
3. Es dificultoso poner se en contacto con todos los miembros de una poblacin.
4. La naturaleza destructivas de ciertas pruebas, como lo es el caso de las pruebas
de control de calidad, si se toma un objeto para determinar su punto mximo de
flexin, el cual al pasarlo se rompe, si tomamos a toda una poblacin (produccin
e un da, por ejemplo) eliminaramos por completo todos los elementos de la
poblacin.
Qu es una muestra probabilstica: Muestra seleccionada de tal forma que cada artculo
o persona de la poblacin tienen la misma probabilidad de ser incluida en la muestra. Si
por el contrario se utilizan mtodos no probabilsticas no todos los artculos tienen la
33
misma probabilidad de ser incluidos por lo tanto se corre el riesgo de que los resultados
estn sesgados, lo que significa que los resultados no sean representativos a la
poblacin.
Muestreo Sistemtico
Muestreo Estratificado
El muestreo por conglomerados ofrece ciertas ventajas sobre otros mtodos. Consiste
en dividir toda la poblacin en conglomerados o grupos y luego seleccionar una muestra
de estos conglomerados. Todas las observaciones en estos conglomerados
seleccionados estn incluidas en la muestra. Este procedimiento con frecuencia es
34
ms fcil y rpido que el muestreo aleatorio simple o estratificado. Tambin es posible
combinar el muestreo estratificado con el muestreo por conglomerados.
El Teorema del Lmite Central dice que si tenemos un grupo numeroso de variables
independientes y todas ellas siguen el mismo modelo de distribucin (cualquiera que
ste sea), la suma de ellas se distribuye segn una distribucin normal. Por ejemplo:
la variable "tirar una moneda al aire" sigue la distribucin de Binomial. Si lanzamos la
moneda al aire 50 veces, la suma de estas 50 variables (cada una independiente entre
si) se distribuye segn una distribucin normal. Este teorema se aplica tanto a suma de
variables discretas como de variables continuas.
35
X x 60 50
Z 2
x 5
(*) 5 es la raz cuadrada de 25, o sea la desviacin tpica de esta distribucin
Por lo tanto:
P (X > 60) = P (Y > 2,0) = 1- P (Y < 2,0) = 1 - 0,9772 = 0,0228
Es decir, la probabilidad de que al tirar 100 veces la moneda salga ms de 60 caras es
tan slo del 2,28%.
Ejercicio 5
En una asignatura del colegio la probabilidad de que te saquen a la pizarra en cada
clase es del 10%. A lo largo del ao tienes 100 clases de esa asignatura. Cul es la
probabilidad de tener que salir a la pizarra ms de 15 veces?
Estimadores
Estimador puntual:
36
est prximo al parmetro de la poblacin, se deseara expresar que tan cerca est,
para ello sirve el intervalo de confianza.
Estimacin por Intervalos, un intervalo es un rango de valores dentro del cual se estima
est el parmetro de la poblacin.
Intervalo de Confianza:
37
s
Intervalo de confianza de 95 % para una media x 1,96
n
s
Intervalo de confieanza de 99 % para una media x 2,58
n
X
P (X xitos)= , donde:
n
X= nmero de xitos
N= tamao de la muestra
Cmo se calcula el intervalo de confianza para proporcin de la poblacin
P z p
Donde p es el error estndar estimado de la proporcin
38
c) Una idea del valor aproximado del parmetro que queremos medir (en este caso una
proporcin). Esta idea se puede obtener revisando la literatura, por estudio pilotos
previos. En caso de no tener dicha informacin utilizaremos el valor p = 0.5 (50%).
Ejemplo: A cuantas personas tendramos que estudiar para conocer la prevalencia de
diabetes?
Seguridad = 95%; Precisin = 3%: Proporcin esperada = asumamos que puede ser
prxima al 5%; si no tuvisemos ninguna idea de dicha proporcin utilizaramos el valor
p = 0,5 (50%) que maximiza el tamao muestral:
donde:
Za 2 = 1.962 (ya que la seguridad es del 95%)
p = proporcin esperada (en este caso 5% = 0.05)
q = 1 p (en este caso 1 0.05 = 0.95)
d = precisin (en este caso deseamos un 3%)
donde:
N = Total de la poblacin
Za2 = 1.962 (si la seguridad es del 95%)
p = proporcin esperada (en este caso 5% = 0.05)
q = 1 p (en este caso 1-0.05 = 0.95)
d = precisin (en este caso deseamos un 3%).
A cuntas personas tendra que estudiar de una poblacin de 15.000 habitantes para
conocer la prevalencia de diabetes?
Seguridad = 95%; Precisin = 3%; proporcin esperada = asumamos que puede ser
prxima al 5% ; si no tuviese ninguna idea de dicha proporcin utilizaramos el valor p =
0.5 (50%) que maximiza el tamao muestral.
(Tomado de http://www.fisterra.com/material/investiga/8muestras/8muestras.htm)
Cuando se tiene una frmula para estimar y se aplica a una muestra aleatoria, el
resultado es aleatorio, es decir los estimadores son variables aleatorias.
40
estar listos para usarse
defectuosos.
Podemos seleccionar al azar algunos de ellos para darnos una idea de la proporcin de
defectuosos en el embarque. El parmetro de inters es la proporcin de defectuosos
en toda la poblacin, pero lo que observamos es la proporcin de defectuosos en la
muestra. El valor de la proporcin en la muestra es una variable aleatoria cuya
distribucin est emparentada directamente con la binomial (si se tratara del nmero de
defectuosos, sera binomial).
Distribucin de probabilidad.
Valor esperado.
El valor esperado de un estimador nos da un valor alrededor del cual es muy probable
que se encuentre el valor del estimador. Para poner un ejemplo, si supiramos que el
valor esperado de una estadstica es 4, esto significara que al tomar una muestra:
Ya que es muy probable que el valor del estimador est cerca de su valor esperado,
una propiedad muy deseable es que ese valor esperado del estimador coincida con el
del parmetro que se pretende estimar. Al menos, quisiramos que el valor esperado no
difiera mucho del parmetro estimado. Por esa razn es importante la cantidad que,
tcnicamente llamamos sesgo. El sesgo es la diferencia entre el valor esperado del
estimador y el parmetro que estima.
Varianza de un estimador
41
Entre menor sea la desviacin estndar (o la varianza) de un estimador, ser ms
probable que su valor en una muestra especfica se encuentre mas cerca del valor
esperado. Para aclarar esto, considere dos estimadores T1 y T2, suponga que ambos
son instigados y suponga que la varianza de T1 es menor que la de T2 Qu quiere
decir esto? Simplemente que en un entorno fijo del valor del parmetro, los valores de
T1 son ms probables que los de T2. O sea que vamos a encontrar a T1 ms cerca del
valor del parmetro que a T2. Esto hace que nuestras preferencias estn con T1.
Cuando un estimador tiene una varianza menor que otro decimos que el estimador es
ms eficiente.
No debe tener sesgo: cuando el valor esperado del estadstico usado como
estimador es igual al parmetro de la poblacin que se desea estimar, se dice
que ese estimador es insesgado.
Eficiencia: la eficiencia tiene relacin directa con el dato obtenido del error, a
menor error mayor es la eficiencia del estimador. Si las distribuciones de
muestreo de dos estadsticos tienen la misma media(o esperanza), el de
menor varianza se llama un estimador eficiente de la media, mientras que el
otro se llama un estimador ineficiente, respectivamente. De tal forma que si
podemos hallar un estimador con una varianza que resulte menor que la
varianza de cualquier otro estimador, tomaremos aquel como base para una
medida de eficiencia y diremos que ese es un estimador eficiente.
Consistencia: Un estimador tiene consistencia en la medida en que el tamao
de la muestra aumenta, ello nos acerca al parmetro de la poblacin.
Suficiencia: Si un estimador utiliza toda la informacin contenida en la
muestra acerca del parmetro que va a estimar, se dice que es un estimador
suficiente.
Para la Media
42
z 2 2
Para una poblacin infinita n
e2
Z 2 2
Para una poblacin finita n0
e2
Para la Proporcin
ps p e z 2 pq
z . Se llega a: n
pq pq e2
n n
Z 2 pq
Para poblacin finita hay que tomar en cuenta el factor de correccin, n0
e2
En resumen:
Estadstico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto una
estimacin de los parmetros.
44
Unidad III
Prueba de Hiptesis
Objetivo:
Aplicar con propiedad y de forma pertinente a situaciones administrativas la
prueba de hiptesis
Contenidos:
Qu es una hiptesis
Qu es una prueba de hiptesis
Contraste de hiptesis
Paramtricas (Media aritmtica y proporcin)
Para una poblacin
Para dos poblaciones
45
El que aprende y aprende y
no practica lo que aprende es
como el que ara y ara y nunca
siembra.
Platn
Prueba de Hiptesis
Siempre las personas, en diversas oportunidades y circunstancias, hemos realizado
afirmaciones considerando experiencias previas, conocimientos superficiales de algo,
etc. Esas afirmaciones las llamamos hiptesis, y esas hiptesis pueden ser aceptadas o
rechazadas; sin embargo en estadstica para poder aceptar o rechazar una hiptesis se
deben realizar una serie de clculos que sustenten la veracidad o no de ese supuesto,
para ello existe la prueba de hiptesis.
46
UNIDAD III. PRUEBA DE HIPTESIS
Qu es una hiptesis?
Hiptesis estadstica
Asuncin relativa a una o varias poblaciones, que puede ser cierta o no.
Prueba de Hiptesis:
Existen cinco pasos que sistematiza una prueba de hiptesis, y cuando se llega al paso
5 se est listo para rechazar o aceptar la hiptesis. Veamos los pasos representados en
el siguiente diagrama:
47
Paso 1 Paso 2 Paso 3 Paso 4
Establecer las Seleccionar un Identificar la Formular la regla
hiptesis nula y nivel de estadstica de de decisin
alternativa significancia prueba
hiptesis nula y
alternativa
No rechazar H0
Paso 5
Tomar una
muestra, llegar a
Rechazar H0 y una decisin
Aceptar H1
Se debe recalcar adems que si no se rechaza la hiptesis nula, con base en los datos
de la muestra, no es posible decir que la hiptesis nula sea cierta. En otras palabras, la
imposibilidad de rechazar la hiptesis nula no demuestra que H 0 sea verdadera;
significa que no fue posible de rechazar H0. Para demostrar la hiptesis nula sera
necesario conocer el parmetro de la poblacin y recabar los datos con la poblacin en
pleno; como eso es prcticamente imposible, la nica alternativa es tomar una muestra
de la poblacin.
Hiptesis nula
Una afirmacin respecto del valor de un parmetro de la poblacin
Hiptesis alternativa
Una afirmacin que se acepta si los datos de la muestra
evidencian suficientemente que la hiptesis nula es falsa.
48
Paso 2: Seleccionar el nivel de significancia
El nivel de significancia es designado con la letra alfa ( ) del alfabeto griego, tambin
se le conoce como nivel de riesgo, y ste quizs sea un termina ms apropiado, pues
es este nivel es el riesgo que se asume al rechazar la hiptesis nula cuando de hecho
es verdadera. No hay un nivel de significancia que se aplique a todas las pruebas, el
investigador toma la decisin de utilizar cualquier valor entre 1 y 0, es decir, entre 0 y
10 por ciento.
Por que se coment al inicio que el nivel de significancia se poda llamar tambin de
riesgo, porque de acuerdo al nivel de significancia que se establezca se puede cometer
el error de rechazar una hiptesis verdadera, observemos este ejemplo planteado por
Lind, Mason y Marchal (2003):
H0 H0
Accin
Es verdadera Es falsa
Acepto Decisin Error tipo II
H0 correcta
Rechazo Decisin
Error tipo I
H0 correcta
49
Error tipo I: Rechazar una hiptesis verdadera.
Error tipo II: No rechazar una hiptesis nula que es falsa
Una regla de decisin es una afirmacin de las condiciones bajos las que se rechaza la
hiptesis la y bajo las que no se rechaza. El rea de rechazo define la ubicacin de
todos aquellos valores que son tan grandes o tan pequeos que la probabilidad de que
ocurran bajo una hiptesis nula verdadera es bastante remota. En el grfico que se
muestra a continuacin el valor crtico es 1,65 es divide la zona de rechazo o
aceptacin de la hiptesis
Regin de rechazo
Valor Crtico
Punto de divisin entre la regin en que se rechaza la hiptesis nula
50
y la regin en la que no se rechaza
Los valores crticos determinan la zona de rechazo. Para hallarlos se divide entre dos
el 95%. En la tabla z (revisar anexos), el rea de 0,95/2=0,4750 lo que indica un valor
de 1.96. El 5% restante est distribuido entre las dos colas, son 2,5% en cada zona de
rechazo. Es posible encontrar los valores crticos al otro lado de la cola:
Una prueba es de una cola cuando la hiptesis alterna, H1, establece una direccin,
como:
H0 : el ingreso medio de las mujeres es menor o igual al ingreso medio de los hombres.
H1 : el ingreso medio de las mujeres es mayor que el de los hombres.
Distribucin de muestreo para el valor estadstico z, prueba de una cola, nivel de
significancia de .05
51
Una prueba es de dos colas cuando no se establece una direccin especfica de la
hiptesis alterna H1, como:
H0: el ingreso medio de las mujeres es igual al ingreso medio de los hombres.
H1: el ingreso medio de las mujeres no es igual al ingreso medio de los hombres.
Distribucin de muestreo para el valor estadstico z, prueba de dos colas, nivel de
significancia de 0.05
Cuando se hace una prueba para la media poblacional de una muestra grande y se
conoce la desviacin estndar, el estadstico de prueba est dado por:
X
Z
n
Ejemplo:
Una cooperativa fabricante de salsa de tomate indican en su etiqueta que el contenido
de la botella es de 16 onzas. Cada hora se toma una muestra de 36 botellas y se pesa
el contenido. La muestra de la ltima hora tiene un peso medio de 16.12 onzas con una
desviacin estndar de .5 onzas. Est el proceso fuera de control para un nivel de
significancia de .05?
Paso 3: calcule el valor del estadstico de prueba: H0 se rechaza si z <- 1.96 o z > 1.96
Paso 4: decisin sobre H0: no se rechaza H0 porque 1.44 es menor que el valor crtico
1.96
52
Si se desconoce la desviacin estndar de la poblacin y el tamao de la muestra es
n 30
X
Z
n
Datos:
Da Usuarios Da Usuarios Da Usuario
1 356 11 305 21 429
2 427 12 413 22 376
3 387 13 391 23 328
4 510 14 380 24 411
5 288 15 382 25 397
6 290 16 389 26 365
7 320 17 405 27 405
8 350 18 293 28 369
9 403 19 276 29 429
53
x
Z
s
n
54
iguales. Para este caso se siguen igualmente los cinco pasos planteados pero habr
una diferencia en la frmula para la estadstica z:
X1 X 2
Z
s12 s 22
n1 n2
GRUPO
A 3 4 3 4 4 4 5
GRUPO
B 4 1 2 3 1 3 2 3
Proporcionan los datos evidencias suficientes que indique que la efectividad de los dos
tratamientos no es la misma? Utilice un nivel de significacin de 0.05.
Solucin:
1. Planteamiento de hiptesis:
Ho: 1 = 2
H1: 1 2
3. Prueba estadstica:
X X2 3,85 2,71 1,14 1,14 1,14
Z 1 0,38
s12 s 22 2,85 2 7,42 2 1,16 7,86 9,02 3
n1 n2 7 7
55
Criterios de decisin:
Como lo hemos venido trabajando para probar una hiptesis calculamos un valor z y lo
comparamos con un valor crtico de Z con base al nivel de significancia seleccionado. El
valor p para probar hiptesis es un mtodo alternativo en caso de variables discretas. El
valor p tambin es aplicado a hiptesis de una cola o de dos colas.
Un ejemplo de las hiptesis que podemos manejar con la prueba de proporcin son:
Estas preguntas abarcan los datos de una escala nominal de mediacin, si recordamos
Estadstica I esta escala se caracteriza por tener categoras sin un orden valor de
jerarquizacin, por ejemplo la raza, la religin, etc.
Proporcin (p)
Una fraccin, relacin o porcentaje que indica la parte de la
poblacin o muestra que tiene una caracterstica de inters
particular.
56
Un ejemplo de proporcin es que 87 personas de 100 afirmaron tener mascotas en su
casa. La proporcin de la muestra es 87/100=0,87 o 87%. Para probar una hiptesis
sobre una proporcin de una poblacin se elige una muestra aleatoria de la poblacin
que cumpla con las suposiciones binomiales explicadas. Esta prueba es apropiada
cuando tanto np como n(1-p) son al menos de 5.n (n=tamao de la muestra,
p=proporcin de la poblacin)
pP
Prueba de hiptesis para una proporcin z
p(1 P)
n
Por ltimo se toma la decisin.
Ejemplo:
Una encuesta aplicada en Caracas a 2.000 personas revel que 1550 de ellas realizas
compras en los megamercados realizados quincenalmente a la Av. Bolvar. La
proporcin de 0,775 (1550/2000=0.775) est bastante cerca de 0,80 para llegar a la
conclusin de la mayora de la poblacin de Caracas compra sus alimentos en los
megamercados con regularidad.
Z es una estadstica de prueba normalmente distribuida cuando la hiptesis es verdad y
las dems suposiciones tambin son verdaderas.
1550
0,80
pP 2000
z 2,80
p(1 P) 0,80(1 0,80)
n 2000
El valor z -2,80 est en la zona de rechazo, de modo que la hiptesis nula queda
rechazada en el nivel 0,05.
57
Ejercicio:
Se dan las siguientes hiptesis
H0= p 0.70
H1=p>0.70
En este tipo de pruebas interesa saber si dos proporciones de la poblacin son iguales.
A continuacin se presentan algunos ejemplos:
Una cooperativa de ropa casual elabor un nuevo diseo de camisas para
caballeros, el nuevo modelo se le mostr a un grupo de posibles compradores
menores de 30 aos y a otros mayores de 60 aos. La cooperativa desea saber si
existe diferencia en la proporcin de personas de ambos grupos a quienes les gusta
el nuevo diseo.
Una aerolnea est investigando sobre el miedo a volar entre adultos, de forma
especfica quieren saber si existe alguna diferencia significativa entre la proporcin
de hombres y de mujeres.
p1 p 2
Prueba de proporciones de dos muestras z
pc (1 pc pc (1 pc )
n1 n2
Donde:
n1 es el nmero en la primera muestra
n2 es el nmero en la segunda muestra
p1 es la proporcin en la primera muestra que posee la caracterstica
p2 es la proporcin en la segunda muestra que posee la caracterstica
pc es la proporcin conjunta que posee la caracterstica en la muestra combinada, se
calcula con la siguiente frmula:
Nmero _ total _ de _ xitos X X2
Proporcin conjunta pc 1
Nmero _ total _ de _ las _ muestras n1 n2
Donde:
X1 es el nmero que posee la caracterstica en la primera muestra
X2 es el nmero que posee la caracterstica en la segunda muestra
Ejemplo
Una fbrica de perfumes desarrollo una nueva fragancia llamada Rojo. Varias pruebas
indican que tiene una muy buena aceptacin en el mercado, sin embargo interesa saber
si el perfume lo prefieren mujeres jvenes o maduras. Se tomar una muestra aleatoria
de mujeres jvenes y maduras y se les realizar una prueba dndoles a oler varios
perfumes entre ellos Rojo y se les piden que indiquen el que ms les guste.
H0 no hay diferencia entre la proporcin de mujeres jvenes y maduras que prefieren
Rojo. La hiptesis alterna es que ambas proporciones no son iguales.
58
Ho: p1 p2
H1: p1 p2
X1 20 X 2 100
p1 0.20 p2 0.50
n1 100 n2 200
Observemos que la proporcin conjunta de 0.40 est ms cerca de 0.50 que de 0.20.
Esto se debe a que el muestreo incluy ms mujeres maduras.
p1 p 2 0.20 0.50 0.3
z 5.0
pc (1 pc pc (1 pc ) 0.4(1 0.4) 0.40(1 0.4) 0.06
n1 n2 100 200
El valor z calculado de -5 est en el rea de rechazo, es decir, que la hiptesis de que
es igual la proporcin de mujeres jvenes y maduras que prefieren Rojo se rechaza, por
lo que se acepta la hiptesis alternativa.
1. De 150 adultos que probaron unos caramelos nuevos de sabor a durazno, 87 les
parecieron muy buenos. De 200 nios a 123 les gustaron muchsimo. Utilizando un
nivel de significancia de 0.10 se puede concluir que existe una diferencia
significativa en la proporcin de adultos contra la de nios que consideran el nuevo
sabor como excelente.
a. Cul es la hiptesis nula y la alternativa
b. Cual es la probabilidad de un error tipo I
c. Es una prueba de una o dos colas, por qu
d. Cual es el valor crtico
e. Debera rechazarse la hiptesis nula
59
Unidad IV
Regresin y
Correlacin
Objetivo:
Interpretar el coeficiente de correlacin y determinacin con el propsito de
obtener la relacin o variacin entre dos variables.
Contenidos:
Variables dependiente e independientes
Grfico de dispersin
Coeficiente de correlacin
Correlacin lineal
Coeficiente de determinacin
Modelo de anlisis de regresin lineal
Recta de mnimos cuadrados
Error estndar de estimacin
60
Lo maravilloso de
aprender algo es que nadie
puede arrebatrnoslo.
B.B.King
Regresin y Correlacin
La regresin y la correlacin son las dos herramientas estadsticas ms eficaces que se
pueden utilizar para solucionar problemas comunes en la administracin por el hecho
de que se emplean para identificar y cuantificar la relacin entre dos o ms variables.
61
UNIDAD IV. REGRESIN Y CORRELACIN
Ejercicio:
A continuacin escribe cuatro casos en los cuales reflejes las variables dependiente e
independiente:
Variable Variable
Caso
dependiente independiente
62
La variable dependiente o tambin llamada variable
de respuesta es aquella que se va a predecir.
Diagrama de Dispersin
Para recordar
Correlacin Lineal
En ocasiones nos puede interesar estudiar si existe o no algn tipo de relacin entre
dos variables aleatorias. Por ejemplo, podemos preguntarnos si hay alguna relacin
entre las notas de la asignatura Estadstica I y las de Matemticas I. Una primera
aproximacin al problema consistira en dibujar en el plano un punto por cada alumno:
la primera coordenada de cada punto sera su nota en estadstica, mientras que la
segunda sera su nota en matemticas. As, obtendramos una nube de puntos la cual
podra indicarnos visualmente la existencia o no de algn tipo de relacin (lineal,
parablica, exponencial, etc.) entre ambas notas.
Correlacin de Pearson
Definicin. Creado por Kart Pearson en el siglo XIX, es una tcnica estadstica que
permite evaluar el grado o nivel de relacin entre dos variables, en otras palabras, es
una herramienta que permite evaluar en que medida el comportamiento de una variable
dependiente se ve afectada por la accin directa de una variable independiente. Por
ejemplo, si queremos establecer la razn del incremento de las ventas al detal en el
mes de diciembre (variable dependiente), es muy probable que encontremos una
correlacin elevada si la cruzamos con la variable independiente ingreso familiar. La
correlacin lineal adquiere valores entre -1 y 1.
0= correlacin nula.
+1= Correlacin directamente proporcional perfecta
-1= Correlacin inversamente proporcional perfecta
64
Variables extraas o correlaciones espurias. Cuando se
estudia la correlacin entre dos variables hay que tener
presente la influencia de muchas otras variables conocidas y
desconocidas y controlables o no controlables, llamadas
variables extraas; por ejemplo, una variable dependiente
como las reservas internacionales de un pas puede verse
afectada en gran parte por el control de las divisas que un
estado ejecuta; sin embargo hay otras variables como el
gasto pblico, las tragedias naturales, el nivel de
inflacin, etc., que tambin pueden incidir en mayor o menor
medida sobre dicha variable dependiente.
La CIP indica, que a medida que el valor de una variable aumente, el valor de la otra
disminuye, un ejemplo de esto lo encontramos si correlacionamos las variables altitud y
concentracin de oxigeno, vemos as como a medida que aumenta la altitud, disminuye
la concentracin de oxigeno en el aire, de all por ejemplo la dificultad con la que se
respira en el pico Bolvar. Se habla de una correlacin inversamente proporcional
perfecta cuando la formula de producto momento de Pearson da un resultado de -1,
esto en la realidad nunca ocurre, (ver correlaciones espurias y variables extraas), ya
que como en el caso de la correlacin directamente proporcional perfecta es muy difcil
que una variable se vea nicamente influenciada por otra.
Interpretacin de la Correlacin
Coeficiente de Correlacin
66
Para determinar el valor numrico del coeficiente de correlacin usamos la frmula
siguiente
n( XY ) ( X )( Y )
r
n( X 2
) ( X ) 2 n( Y 2 ) ( Y ) 2
Donde:
n: es el nmero de pares de observaciones
X : es la suma de las variables X
Y : es la suma de las variables Y
( X ): es la suma de los cuadrados de la variable X
2
r n2
t con n-2 grados de libertad
1 r2
-2,306 0 +2,306
67
El Coeficiente de Determinacin
Anlisis de Regresin
Es un modelo matemtico para expresar la relacin entre dos variables y estima el valor
de la variable dependiente Y basndonos en el valor de la variable independiente X.
Anlisis de Regresin
Es una ecuacin que define la relacin entre dos variables.
Y ' a bX
Donde:
n( XY ) ( X )( Y )
Pendiente de la lnea de regresin b
n( X 2 ) ( X ) 2
68
Interseccin con el eje Y a
Y b X
n n
Donde:
Es una medida que describe que tan precisa es la prediccin de Y con la base en X o,
inversamente, que tan inexacta puede ser la estimacin. El error estndar de estimacin
se denota con la letra sx.y. La desviacin estndar mide la dispersin alrededor de la
media; el error estndar de estimacin mide dispersin alrededor de la lnea de
regresin.
n2
O tambin podemos emplear la siguiente frmula:
S x. y
Y 2
a( Y ) b( XY
n2
a. Para cada valor X hay un grupo de valores Y, y estos valores Y estn distribuidos
normalmente.
b. Todas las medias de estas distribuciones normales de Y estn sobre la lnea de
regresin.
c. Las desviaciones estndar de estas distribuciones normales son iguales.
69
d. Los valores de Y son estadsticamente independientes. Este significa que al
seleccionar una muestra, el valor Y escogido para una X determinada no
depende del valor de Y para ningn otra X.
70
Respuestas
Ejercicio 1:
Clasifica los siguientes eventos:
Ejercicio 2
n! 5! 120
P p r q nr 0,20 2 0,80 3 0,04(0,512) 10(0,0204) 0,2048
r!(n r )! 2!(5 2)! 2(6)
n! 5! 120
P p r q nr 0,20 3 0,80 2 0,008(0,64) 10(0,0051) 0,0512
r!(n r )! 3!(5 3)! 6(2)
n! 5! 120
P p r q nr 0,20 4 0,801 0,0016(080) 5(0,0012) 0,0064
r!(n r )! 4!(5 4)! 24(1)
Ejercicio 3
P= 0.4
Q= 0.6
N= 5
Para R= 0 obtenemos que: P(0) = 5!/ 0!(5-0)! (0.4 )0 (0.6)5, P(0) = 0.07776
Para R= 1 obtenemos que: P(1) = 5!/ 1!(5-1)! (0.4 )1 (0.6)4, P(1) = 0.2592
Para R=2 obtenemos que: P(2) = 5!/ 2!(5-2)! (0.4 )2 (0.6)3, P(2) = 0.3456
Para R= 3 obtenemos que: P(3) = 5!/ 3!(5-3)! (0.4 )3 (0.6)2 P(3) = 0.2304
Para R= 4 obtenemos que: P(4) = 5!/ 4!(5-4)! (0.4 )4 (0.6)1 P(4) = 0.0768
Para R= 5 obtenemos que: P(5) = 5!/ 5!(5-5)! (0.4 )5 (0.6)0, P(5) = 0.01024
71
Ejercicio 4:
X 510 500
Z 1
10
X 490 500
Z 1
10
Ejercicio 5
"Salir a la pizarra", le damos el valor 1 y tiene una probabilidad del 0,10
"No salir a la pizarra", le damos el valor 0 y tiene una probabilidad del 0,9
La media y la varianza de cada variable independiente es:
m = 0,10
s2 = 0,10 * 0,90 = 0,09
Por tanto, la suma de las 100 variables se distribuye segn una normal cuya media y
varianza son:
Media : n * m = 100 * 0,10 = 10
Varianza : n * s2 = 100 * 0,09 = 9
Para calcular la probabilidad de salir a la pizarra ms de 15 veces, calculamos el valor
equivalente de la variable normal tipificada:
Luego:
P (X > 15) = P (Y > 1,67) = 1 - P (Y < 1,67) = 1 - 0,9525 = 0,0475
Es decir, la probabilidad de tener que salir ms de 15 veces a la pizarra a lo largo del
curso es tan slo del 4,75%.
72
Bibliografa
73
ANEXOS
74
TABLA DE DISTRIBUCIN NORMAL TIPIFICADA N(0,1)
75
Manejo de Tablas. Casos Ms Frecuentes (Zonas de aceptacin o rechazo)
76
Distribucin t de Student
77