Anda di halaman 1dari 45

INTRODUCCION A LAS PROBABILIDADES ORIGEN DE LAS PROBABILIDADES Se remonta al siglo XVIII cuando Antoine Gombauld conocido como el caballero

de Mer quien crey haber descubierto una tcnica infalible para jugar a los dados, con muy buenos resultados al comienzo, luego empez a perder, situacin que le oblig a consultar a Blas Pascal y Pierre de Fernat, inicindose as los fundamentos de esta ciencia.

PROBABILIDAD La probabilidad es una medida numrica de la certidumbre de que suceder determinado evento. Los valores de probabilidad siempre se asignan en una escala de valores entre 0 y 1. Una probabilidad cercana a cero indica que es difcil que el evento ocurra, una probabilidad cercana a uno indica que es casi seguro que suceder. Las probabilidades entre 0 y 1 indican los grados de certeza de que el evento ocurra.

Probabilidad creciente de ocurrencia.

0.5

La ocurrencia del evento Es igualmente probable o Improbable EXPERIMENTO Cualquier proceso que genere resultados bien definidos. Proceso que conduce a que ocurra una y solamente una de varias observaciones posibles EXPERIMENTO Lanzar una moneda Seleccionar una pieza para inspeccin Visita de ventas Tirar un dado RESULTADO EXPERIMENTAL cara - sello defectuosa no defectuosa venta no venta 123456

Nota: El concepto de experimento estadstico es diferente al usado en las ciencias de laboratorio, en las que el investigador supone que cada vez que un experimento se repite exactamente de la misma manera ocurrir el mismo resultado. En probabilidad el resultado queda determinado por la casualidad, y aunque el experimento se repita de la misma manera puede ocurrir un resultado distinto.

ESPACIO MUESTRAL Es el conjunto de todos los resultados posibles de un experimento PUNTO MUESTRAL Cualquier resultado en particular de un experimento. Los elementos del espacio muestral se llaman puntos muestrales.

S=

cara, sello

S=

defectuoso, no defectuoso

S=

1, 2, 3, 4, 5,6

ASIGNACION DE PROBABILIDADES A RESULTADOS EXPERIMENTALES REQUISITOS BASICOS DE PROBABILIDADES. 1) P(Ei) es la probabilidad del resultado experimental 0 P(Ei) 1 para todas i

2) La sumatoria de todas las probabilidades de los resultados experimentales debe ser igual a 1 P(E1) + P(E2) + + P(En) = 1 Es aceptable para asignar valores probabilsticos para resultados experimentales que satisfaga ambos requerimientos y resulte en medidas numricas razonables de la posibilidad de los resultados. La asignacin de probabilidades se puede realizar con base en los siguientes mtodos:

METODO CLASICO Si un experimento tiene n resultados posibles, el mtodo clsico asignar una probabilidad de a cada resultado experimental (en el caso del lanzamiento de una moneda ser entonces correspondiente la probabilidad de obtener el resultado cara o sello en un intento) METODO DE FRECUENCIA RELATIVA Su clculo tiene normalmente un antecedente histrico basado en el nmero de repeticiones de un suceso similar. (por ejemplo un vendedor que ha visitado 40 clientes y en esas visitas realiz ventas en 10 de ellas; con base en este mtodo la probabilidad para su siguiente visita de ventas ser METODO SUBJETIVO Es una asignacin de probabilidad realizada por una persona basndose en cualquier informacin que est disponible, o en su criterio. En este mtodo predomina la experiencia subjetiva de la persona que toma la decisin. EVENTO Conjunto de uno o ms resultados de un experimento. Ejemplo: El evento de obtener un nmero par al lanzar un dado: A=* + para una venta y para una no venta).

PROBABILIDAD DE UN EVENTO La probabilidad de un evento es igual a la suma de las probabilidades de los puntos muestrales del evento. Para el ejemplo anterior la probabilidad de obtener un nmero par al lanzar un dado es igual a la probabilidad de obtener un 2 ms la probabilidad de obtener un 4 ms la probabilidad de obtener un 6.

A={

ALGUNAS RELACIONES BASICAS DE PROBABILIDAD Espacio muestral

AC

COMPLEMENTO DE UN EVENTO Para un evento A, el complemento de A es aquel evento que contiene todos los puntos muestrales no existentes en A. P(A) + P(AC) = 1 EVENTOS MUTUAMENTE EXCLUYENTES Se dice que dos o ms eventos son mutuamente excluyentes cuando la ocurrencia de un evento implica que ninguno de los otros puede ocurrir al mismo tiempo. LEY ADITIVA Para dos eventos A y B la unin de los eventos A y B es aquel evento que contiene todos los puntos muestrales contenidos en A y B.

A
P(AUB) = P(A) + P(B). INTERSECCION DE EVENTOS

Para dos eventos A Y B la interseccin de los eventos A y B es aquel evento que tiene todos los puntos muestrales existentes tanto en A como en B.

LEY ADITIVA PARA INTERSECCION P(AUB) = P(A) + P(B) P(AnB)

EJEMPLO 1: A=* + B=* +

P(AUB) = P(1,2,3) + P(3,4,5) P(3) = P(1,2,3,4,5) EJEMPLO 2: De 200 estudiantes de estadstica, 160 pasaron el examen parcial y 140 pasaron el examen final; y 124 estudiantes pasaron ambos. Consideremos: A = evento de pasar el examen parcial B = evento de pasar el examen final

P(A) =

= 0,8

P(B) =

0,7

P(AnB) =

= 0,62

Despus de revisar las notas, el profesor decidi aprobar a cualquier estudiante que hubiera pasado por lo menos alguno de los dos exmenes. Cul es la probabilidad de que un estudiante reciba nota de aprobado en el curso? P(AUB) = 0,8 + 0,7 0,62 = 0,88

REGLA DE LA MULTIPLICACION La regla especial de la multiplicacin requiere que dos eventos A y B sean independientes; dos eventos son independientes si la ocurrencia de uno no altera la probabilidad de que suceda el otro. Si dos eventos A y B son independientes la probabilidad de que ocurran A y B se obtiene multiplicando las dos probabilidades. P(A y B) = P(A)* P(B)

Si P1, P2, P3Pn son todas las distintas probabilidades de presentacin de n sucesos independientes, la probabilidad (p) de que ocurran todos estos sucesos en un solo ensayo, estar dada por el producto de cada suceso. P = P1*P2*P3.*Pn

DIFERENCIA ENTRE SUCESOS MUTUAMENTE EXCLUYENTES Y SUCESOS INDEPENDIENTES a) En el primero se tiene un solo dado, una baraja; en el segundo son dos o mas dados o barajas b) En el primero se extrae una sola carta o se obtiene una sola cara, es decir se espera la presentacin de un suceso, en el segundo espera la presentacin de dos o ms sucesos. c) En el primero utilizamos la conjuncin o y en el segundo la conjuncin y. SUCESOS DEPENDIENTES Se dice que dos sucesos son dependientes si la ocurrencia o no ocurrencia de un evento en cualquier prueba afecta la probabilidad de otros eventos en otras pruebas, es decir que la probabilidad del segundo suceso depende del primer suceso, la del tercero de lo que haya sucedido en el primero y segundo y as sucesivamente. PROBABILIDAD CONDICIONAL Es la probabilidad de que ocurra un evento determinado dado que otro evento ya haya sucedido. Regla general de la multiplicacin: Ejemplo: Suponga que hay 10 rollos de pelcula fotogrfica en una caja, y se sabe que tres estn defectuosos; se selecciona uno La probabilidad de escoger uno defectuoso es de bueno es de . y la probabilidad de escoger uno P(AyB) = P(A)*P(BA)

Despus se elige un segundo rollo de la caja sin devolver el primero; la probabilidad de que sea defectuoso depende de si el primer rollo seleccionado no fue aceptable. La probabilidad de que tambin el segundo rollo tenga defectos es: Si el primer rollo seleccionado fue defectuoso Si el primer rollo seleccionado fue bueno

A la fraccin

( o bien

) se le denomina probabilidad condicional, porque su valor

est condicionado por ( o depende ) el primer rollo que se sac de la caja que haya sido defectuoso o no. Cul es la probabilidad de escoger un rollo defectuoso, seguido de otro tambin defectuoso?

P(A) =

; El segundo rollo seleccionado es el evento B; por tanto: P(BA) =

porque despus de que el primer rollo seleccionado fue defectuoso solo quedaron 2 en la caja que contena 9. La probabilidad de dos rollos defectuosos es:

P(AyB) = P(A)*P(BA) =

= 0,066.

EJEMPLO: Una encuesta a ejecutivos se enfoc en su lealtad a la empresa; una de las preguntas planteadas fue; si otra compaa le hiciera una oferta igual o ligeramente mejor que la de su puesto actual, permanecera con la empresa, o tomara el otro empleo? Las respuestas de los 200 ejecutivos se clasificaron en forma cruzada con su tiempo de servicio en la compaa en la siguiente tabla de contingencias: TIEMPO DE SERVICIO LEALTAD si permanecera No permanecera Menos de 1 ao 10 25 35 1 a 5 aos 30 15 45 6 a 10 aos 5 10 15 Ms de 10 aos 75 30 105 TOTAL 120 80 200

Cul es la probabilidad de seleccionar al azar un ejecutivo que sea leal a la empresa (si permanecera) y que tenga ms de 10 aos de servicio? Evento A permanencia

P(A) =

= 0.6

Evento B ejecutivo con ms de 10 aos en la empresa y que se queda

P(BA) =

La probabilidad de que un ejecutivo seleccionado al azar sea uno de los que se quedaran en la compaa y de los que tienen ms de 10 aos de servicio se determina utilizando la regla general de multiplicacin

P(AyB) = P(A) * P(BA) =(

)(

)=

= 0.375

ESPERANZA Si P es la probabilidad de xito de un suceso en un solo ensayo, el nmero esperado de sucesos o la esperanza de ese suceso en n ensayos, estar dado por el producto de n y la probabilidad de xito

E = np

MEDIA o VALOR ESPERADO Es el promedio ponderado de los valores posibles de la variable aleatoria para el cual la funcin de probabilidad proporciona las ponderaciones.

E(x) = = x*P(x)
VARIANZA La varianza representa el grado de dispersin o de variabilidad de los datos con respecto a la media.

2 = (x-)2*P(x)
DESVIACION ESTANDAR La desviacin estndar se determina tomando la raz cuadrada de la varianza, es decir

DISTRIBUCIONES DE PROBABILIDAD

Una distribucin de probabilidad indica toda la gama de valores que pueden presentarse como resultado de un experimento. Una distribucin de probabilidad es semejante a una distribucin de frecuencias relativas. Sin embargo en vez de describir el pasado, describe que tan probable es un evento futuro. Por ejemplo un fabricante de medicamentos afirma que un tratamiento causar la prdida de peso en 80% de la poblacin. Una agencia de proteccin al consumidor puede probar este medicamento en una muestra de seis personas. Si la declaracin del fabricante es verdadera es casi imposible tener un resultado en el que ninguna de las personas de la muestra pierda peso, y es muy probable que 5 de las seis pierdan peso. La distribucin de probabilidad muestra todos los resultados posibles de un experimento y la probabilidad de cada resultado

Cmo se puede generar una distribucin de probabilidad?

Ejemplo: Suponga que se quiere saber el nmero de caras que se obtienen al lanzar tres veces una moneda. Este es el experimento. Los posibles resultados son cero, uno, dos y tres caras Cul es la distribucin de probabilidad del nmero de caras? Hay ocho posibles resultados. En el primer lanzamiento puede caer sello, otro sello en el segundo y otro en el tercero. O puede caer sello, sello y cara en ese orden. A continuacin se indica todos los resultados posibles.

Lanzamientos de moneda Resultado posible 1 2 3 4 5 6 7 8 Primero SELLO SELLO SELLO SELLO CARA CARA CARA CARA Segundo SELLO SELLO CARA CARA SELLO SELLO CARA CARA Tercero SELLO CARA SELLO CARA SELLO CARA SELLO CARA Numero caras 0 1 1 2 1 2 2 3 de

Observe que el resultado cero caras se obtuvo solo una vez, una cara apareci tres veces, dos caras tres veces y el resultado tres caras solo una vez. Es decir cero caras ocurri en una de ocho veces. De modo que la probabilidad de cero caras es un octavo (1/8); la de una cara es tres octavos (3/8), y as sucesivamente. La distribucin de probabilidad se muestra en la siguiente tabla.

probabilidad del resultado


0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 1 2 3 4 probabilidad del resultado

En el grafico anterior el valor uno (1) corresponde a cero (0) nmero de caras, el valor dos (2) a un (1) nmero de caras y as de manera sucesiva el valor cuatro a tres caras.

Conviene recordar algunas definiciones que vamos a trabajar de manera reiterada en estos temas:

Distribucin de probabilidad: son todos los posibles valores que resultan de un experimento aleatorio, junto con la probabilidad asociada a cada valor.

Variable aleatoria: Corresponde a una caracterizacin cuantitativa de los resultados que constituyen un espacio muestral. Cada cantidad o valor es el resultado de un experimento aleatorio y como tal puede tomar distintos valores.

Variable aleatoria discreta: Se considera as cuando los valores que asume se pueden contar, y si estos pueden organizarse en una secuencia al igual que los nmeros enteros positivos. Solo puede asumir un nmero finito de valores.

Variable aleatoria continua. Se da, cuando puede asumir cualquier valor dentro de un intervalo o en una unin de intervalos. Como ejemplo se podra considerar cualquier resultado de medicin del ancho, longitud de una cosa, as como el tiempo de realizacin de una tarea; en estos casos las variables admiten fracciones.

DISTRIBUCION DE PROBABILIDAD BINOMIAL

Es una distribucin de probabilidad discreta. Una caracterstica de dicha distribucin es que solo hay dos resultados posibles en cada ensayo de un experimento. Por ejemplo el enunciado de una pregunta del tipo verdadero/falso. Los resultados son mutuamente excluyentes, lo cual significa, que la respuesta a una pregunta no puede ser verdadera y falsa al mismo tiempo. Otros ejemplos son: un departamento de control de calidad clasifica un producto como aceptable o no aceptable, un trabajador es clasificado como empleado o desempleado y una llamada de venta hace que el cliente compre el producto o no lo compre. Frecuentemente se clasifican los resultados posibles como

xito o fracaso. Sin embargo esta clasificacin no implica que un resultado sea buena y el otro malo. Otra caracterstica de la distribucin binomial es que la variable aleatoria es el resultado de conteos. Esto es, se cuenta el nmero de xitos en la totalidad de ensayos. Por ejemplo se lanza cinco veces una moneda y se cuentan el nmero de caras que resultan, se seleccionan 10 trabajadores y se evala el nmero de ellos que tienen ms de 50 aos de edad o bien se escogen 20 cajas de cereal y se cuentan las que pesaron ms de lo que dice en la etiqueta. Otra caracterstica de esta distribucin es que la probabilidad de un xito sigue siendo la misma de un ensayo a otro. Ejemplo: La probabilidad de que se adivine correctamente (xito) la primera pregunta de la prueba de verdadero/falso es igual a , este es el primer ensayo. La probabilidad en forma correcta la segunda pregunta (el segundo ensayo) tambin es ; la probabilidad de tener xito en el tercer ensayo es y as sucesivamente.

La ltima caracterstica de la distribucin de probabilidad binomial es que cada ensayo es independiente de cualquier otro. Esto significa que los resultados no siguen ningn patrn. Por ejemplo las respuestas de la prueba de verdadero/falso no figuran como V,V,V,F,F,F,V,V,V etc.

En resumen la distribucin binomial tiene las siguientes caractersticas:

1. El resultado de cada ensayo de un experimento se clasifica en una de dos categoras mutuamente excluyentes a saber xito o fracaso. 2. La variable aleatoria cuenta el nmero de xitos en una cantidad fija de ensayos 3. La probabilidad de un xito permanece igual en todos los ensayos. Lo mismo sucede con la probabilidad de un fracaso 4. Los ensayos son independientes, lo cual significa que el resultado de un ensayo no afecta el resultado de algn otro.

COMO SE CALCULA?

Para elaborar una distribucin de probabilidad binomial se necesita: (1) el nmero de ensayos y (2) la probabilidad de xito en cada ensayo. Por ejemplo si un examen al trmino de un seminario de administracin contiene 20 preguntas de opcin mltiple el nmero de ensayos es 20. Si cada pregunta tiene cinco opciones y solo una es correcta la probabilidad de xito en cada ensayo que tiene una persona que desconoce la materia es de 0.20. de este modo la probabilidad de que una persona sin conocimiento del tema adivine la respuesta correcta a una pregunta tiene un valor de 0.20. Por tanto se satisfacen las condiciones descritas para una distribucin binomial.

En los casos en los que es aplicable la distribucin binomial, la formula matemtica para calcular la probabilidad de cualquier valor de una variable aleatoria, es la funcin de probabilidad:

( )

Dnde: n = nmero de intentos p = probabilidad de acierto de un intento x = nmero de aciertos en n intentos f(x) = probabilidad de x aciertos en n intentos.

Ejemplo: Elaboremos una distribucin de probabilidad con el experimento consistente en el lanzamiento de cuatro monedas, para el cual la variable aleatoria discreta est dada por la obtencin de exactamente cero, una, dos, tres y cuatro caras (x = 0, 1, 2, 3, 4)

x 0 1 2 3 4

fraccin 1/16 4/16 6/16 4/16 1/16 16/16

decimal 0.0625 0.2500 0.3750 0.2500 0.0625 1.0000

0.4000 0.3500 0.3000 0.2500 0.2000 0.1500 0.1000 0.0500 0.0000 1/16 0 4/16 1 6/16 2 4/16 3 1/16 4

Para encontrar en forma rpida, sin necesidad de hacer clculos engorrosos al aplicar la frmula:

( )

Podemos hacer uso de la tabla de distribucin binomial como se presenta a continuacin para n = 8 y p de 0,05 0,10 0,20 0,25 0,30 0,35 0,40 0,45 0,50

Distribucin binomial clculo de la probabilidad para x p n x 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5

8 0 .6634 .4305 .2725 .1678 .1001 .0576 .0319 .0168 .0084 .0039 1 .2793 .3825 .3847 .3355 .2670 .1977 .1373 .0896 .0548 .0312 2 .0515 .1488 .2376 .2936 .3115 .2965 .2587 .2000 .1569 .1094 3 .0054 .0331 .0839 .1468 .2076 .2541 .2786 .2787 .2568 .2188 4 .0004 .0046 .0185 .0459 .0865 .1361 .1875 .2322 .2627 .2734 5 .0000 .0004 .0026 .0092 .0231 .0467 .0808 .1239 .1719 .2188 6 .0000 .0000 .0002 .0011 .0038 .0100 .0217 .0413 .0703 .1094 7 .0000 .0000 .0000 .0001 .0004 .0012 .0033 .0079 .0164 .0312 8 .0000 .0000 .0000 .0000 .0000 .0001 .0002 .0007 .0017 .0039

Media de la distribucin Binomial: El valor esperado o esperanza matemtica de la variable aleatoria est dada por:

Varianza de la distribucin binomial: La varianza de la variable aleatoria es:

DISTRIBUCION DE PROBABILIDAD DE POISSON

La distribucin de probabilidad de poisson describe la cantidad de veces que ocurre un evento en un intervalo determinado. El intervalo puede ser de tiempo, distancia, rea o volumen. La distribucin se basa en dos supuestos. El primero, es que la probabilidad es proporcional a la extensin del intervalo. El segundo supuesto es que los intervalos son independientes. Dicho de otra manera, cuanto mayor sea la magnitud o extensin del intervalo tanto mayor ser la probabilidad, y el nmero de ocurrencias en un intervalo no afecta a los otros intervalos. Esta distribucin tambin es una forma lmite de la distribucin binomial, cuando la probabilidad de xito es muy pequea y n es grande. La distribucin de probabilidad de poisson es una distribucin de probabilidad discreta puesto que se forma por conteo. Esta distribucin tiene muchas aplicaciones. Se utiliza como modelo para describir la distribucin de errores en la captura de datos; en el nmero de imperfecciones en piezas de fabricacin; en la cantidad de partes defectuosas en embarques de salida; en el nmero de clientes que esperan servicio en un restaurante, o en la cantidad de clientes que hacen fila para entrar a una de las atracciones en un parque de diversiones y tambin en el nmero de accidentes en una carretera durante un periodo de tres meses.

La distribucin de poisson puede describirse matemticamente utilizando la siguiente formula:

( )

para = 0, 1, 2, .

Dnde:

Numero promedio de ocurrencias de un intervalo (np) e = 2.71828 x = nmero de ocurrencias dentro de un intervalo ( nmero de casos favorables) f(x) = probabilidad de x ocurrencias en el intervalo

La varianza de la distribucin de poisson tambin es igual a su media. Si por ejemplo la probabilidad de que sea devuelto un cheque emitido por un banco es 0.0003 y si se cambian 10.000 cheques el nmero medio de cheques devueltos es 3 que se obtiene por = np = 10.000(0.0003) = 3

Ejemplo:

Suponga que estamos interesados en el nmero de llegadas a un cajero automtico en un periodo de 15 minutos en las maanas. Si suponemos que la probabilidad de que llegue una persona es la misma para cualesquiera de 2 periodos de tiempo de igual duracin, y que la llegada o no llegada de una persona en cualquier periodo de tiempo es independiente de la llegada o no llegada en cualquier otro periodo de tiempo, es aplicable la funcin de probabilidad de poisson. Entonces si suponemos que un anlisis de los datos histricos muestra que el numero promedio de de personas que llegan durante un intervalo de 15 minutos es de 10 es aplicable la funcin de distribucin de probabilidad de poisson con = 10

( )

Si deseamos saber cul es la probabilidad de 5 llegadas en 15 minutos hacemos x = 5 y obtendremos:

( )

Aunque determinamos esta probabilidad evaluando la funcin de probabilidad mediante la aplicacin de la formula a menudo resulta ms sencillo usar las tablas de distribucin de probabilidad de poisson. Estas tablas proporcionan probabilidades para valores especficos de x y de .

DISTRIBUCION DE PROBABILIDAD NORMAL

Quiz la distribucin de probabilidad ms importante utilizada para describir una variable aleatoria continua es la distribucin de probabilidad normal; es aplicable a gran cantidad de situaciones de problemas prcticos. Su funcin de densidad de probabilidad tiene la forma de una curva en forma de campana. La forma matemtica de la funcin de probabilidad de la distribucin normal es:

( )

Para < x <

= valor medio o esperado de la variable aleatoria x. Varianza de la variable aleatoria x = desviacin estndar de la variable aleatoria x = 3.14159 e = 2.71828

Caractersticas:

1. La curva normal es acampanada y presenta un solo pico en el centro de la distribucin. La media aritmtica, la mediana y la moda de la distribucin son

iguales y estn localizadas en el pico. De esta forma la mitad del rea bajo la curva se encuentra por arriba de este punto central, y la otra mitad por abajo. 2. La distribucin de probabilidad normal es simtrica con respecto a su media. Si se corta la curva normal verticalmente en este valor central, ambas mitades sern como imgenes en el espejo. 3. La curva normal decrece uniformemente en ambas direcciones a partir del valor central. Es asinttica, esto significa que la curva se acerca cada vez ms al eje X, pero en realidad nunca llega a tocarlo. Esto es, los puntos extremos de la curva se extienden indefinidamente en ambas direcciones. No existe solo una distribucin de probabilidad normal, sino que hay una familia de ellas. Existe una distribucin de probabilidad normal para los aos de servicio en una empresa, en la que la media es 20 aos y la desviacin es 3.1 aos. Existe otra distribucin de probabilidad normal de los aos de servicio de otra empresa en la cual =20 y =3.9.

DISTRIBUCION DE PROBABILIDAD NORMAL ESTANDAR

Hay una familia de distribuciones normales. Cada distribucin puede tener una media () o desviacin estndar () diferentes. Por tanto el nmero de distribuciones normales es ilimitado. Sera imposible proporcionar una tabla de probabilidades (como para las distribuciones binomial y poisson) para cada combinacin de y . Por fortuna se puede utilizar, en todos los casos en los que la distribucin normal es aplicable, un miembro de la familia de distribuciones normales que tiene una media 0 y una desviacin estndar 1 denominado distribucin normal estndar. Cualquier distribucin normal puede convertirse en una distribucin normal estndar restando a la media de cada observacin, y dividiendo entre la desviacin estndar. Primero se convierte o se estandariza, la distribucin que se tiene, en la distribucin normal estndar utilizando el valor z (tambin denominado puntuacin z, valor estadstico, desviacin normal estndar o simplemente desviacin normal).

Valor z diferencia entre un valor elegido, denotado por X, y la media , dividida entre la desviacin estndar, .

Por tanto un valor z es la distancia a la media, medida en unidades de la desviacin estndar.

Expresado en una frmula:

Valor normal estndar

Dnde: x es el valor de cualquier medida u observacin especifica es la media de la distribucin es la desviacin estndar de la distribucin.

Como se observa en la definicin anterior un valor z mide la distancia entre un valor especfico x y la media aritmtica en unidades de desviacin estndar. Al determinar el valor z mediante la frmula se puede obtener el rea o la probabilidad bajo cualquier curva normal recurriendo a las tablas diseadas para el efecto.

Para explicar lo anterior suponga que el valor calculado para z es 1.91 Cul es el rea bajo la curva normal entre la media y X ? En la tabla siguiente se reproduce una parte de la tabla para una distribucin de probabilidad normal que ilustra el ejemplo.

La columna izquierda de la tabla encabezada por la letra z se recorre hacia abajo hasta encontrar el 1.9. Despus se desplaza horizontalmente hacia la derecha se lee la probabilidad bajo la columna encabezada con 0.01. La probabilidad es de 0.4719. Esto significa que 47.19% del rea bajo la curva normal estndar se encuentra entre la media y el valor X de 1.91 desviaciones estndar despus de la media. Esta es la probabilidad de que una observacin se encuentre entre 0 y 1.91 desviaciones estndar despus de la media.

0.00

0.01

0.02

0.03

0.04

0.05

1.5 1.6 1.7 1.8 1.9

0.4332 0.4452 0.4554 0.4641 0.4713

0.4345 0.4357 0.4370 0.4382 0.4394 0.4463 0.4474 0.4484 0.4495 0.4505 0.4564 0.4573 0.4582 0.4591 0.4599 0.4649 0.4656 0.4664 0.4671 0.4678 0.4719 0.4726 0.4732 0.4738 0.4744

reas bajo la curva normal

Se consideran tres reas bajo la curva normal que sern muy utilizadas:

1. Aproximadamente 68% del rea bajo la curva normal esta entre la media ms una y menos una desviaciones estndar se expresa 1 2. Alrededor de 95% del rea bajo la curva normal est entre la media ms dos y menos de dos desviaciones estndar lo que se expresa 2 3. Prcticamente toda el rea bajo la curva normal est entre la media y tres desviaciones estndar (a uno y otro lados del centro) es decir 3 Ejemplo: Una prueba del tiempo de vida til de bateras alcalinas tipo D revelo que su tiempo medio de vida es de 19 horas (h). La distribucin de los tiempos de vida se aproxima a una distribucin normal. La desviacin estndar de la distribucin es 1.2 h.

1. Entre que par de valores falla alrededor de 68% de las bateras? 2. Entre que par de valores falla aproximadamente 95% de las bateras? 3. Entre que par de valores fallan prcticamente todas las bateras?

Para responder a estas preguntas se pueden utilizar los resultados de la regla emprica.

1. Aproximadamente 68% de las bateras falla entre 17.8 y 20.2 horas, valores obtenidos de 19.0 1(1.2)h 2. Alrededor de 95% de las bateras falla entre 16.6 y 21.4 horas que se obtiene de 19.0 2(1.2)h 3. Prcticamente todas las bateras fallan entre 15.4 y 22.6 horas que se obtiene de 19.0 3(1.2)h.

NOCIONES DE MUESTREO

El muestreo es un mtodo cientfico que utiliza principios matemticos y estadsticos para la adecuada seleccin de una muestra y manejo de la informacin obtenida a partir de ella, para as tener estimaciones confiables. El muestreo consiste en la seleccin de una parte de la poblacin, de tal manera que sta parte represente adecuadamente la poblacin. CONCEPTOS GENERALES Muestra. Es un subconjunto de una poblacin. Este subconjunto debe ser representativo de la poblacin que se seleccion. Para que una muestra sea aceptable es necesario que sea representativa de la poblacin, que tenga una confiabilidad susceptible de medicin y que responda a un plan prctico y eficaz. Para que la muestra represente apropiadamente a la poblacin, se debe atribuir a cada unidad una probabilidad conocida de ser elegida, la que debe ser siempre distinta de cero.

Poblacin. Cualquier conjunto de unidades o elementos claramente definido para el que se obtienen las estimaciones. Cuando se va a hacer una investigacin se debe tener muy claro cul es su cobertura o alcance para as mismo definir la poblacin. Unidad de anlisis o elemento de muestreo es el objeto en el cual se toman las mediciones. Estas unidades pueden ser personas, familias, fincas, empresas, tarjetas, etc. Unidades de muestreo "son colecciones no traslapadas de elementos de la poblacin que cubren la poblacin completa" 1 es decir que no debe haber interseccin entre una unidad y otra, por lo tanto, cada elemento de muestreo puede pertenecer a slo una

unidad de muestreo. Estas unidades pueden ser manzanas de barrios, barrios, familias, fincas, parcelas, sectores, etc.. Si cada unidad de muestreo contiene un solo elemento, entonces la unidad de muestreo y el elemento de muestreo son iguales. Marco de muestreo es un listado o mapa que contiene todas las unidades de muestreo y por consiguiente cubre a toda la poblacin. Error de muestreo Un error en estadstica es la diferencia entre el valor de un estimador y el del parmetro correspondiente. Existen varias causas para producir estos errores. Segn la causa son clasificados en errores de muestreo y de no muestreo. El error de no muestreo puede ocurrir en cualquier encuesta, sea un censo o una muestra. Estos errores comprenden errores sistemticos y equivocaciones. Los factores que causan error sistemtico son: falta de definicin clara de la poblacin, inadecuada elaboracin del marco de muestreo, falta de definicin del cuestionario, vaga concepcin de la informacin deseada, mtodos imprecisos de entrevistas. Surgen errores por equivocacin cuando las respuestas son anotadas en lugares equivocados, cuando los entrevistados no responden, dan respuestas incorrectas o inapropiadas y cuando se hacen clculos y anotaciones incorrectas al procesar los datos. "Los errores de no muestreo pueden ser controlados mediante una atencin cuidadosa en la construccin de los cuestionarios y en los detalles del trabajo de campo"1. Estos errores en las encuestas pueden ser minimizados as: la no respuesta con un plan para hacer reentrevistas a los elementos muestreados, con recompensas e incentivos para quien responde y entrevistadores adiestrados; la respuesta incorrecta se puede corregir si los cuestionarios despus de diligenciados son revisados por alguien diferente al encuestador. Los errores de muestreo son resultado de la eleccin casual de unidades de muestreo. Este tipo de error ocurre porque solo se observa una parte de la poblacin; as que si se hace un censo, puede esperarse que desaparezca el error de muestreo. Ventajas del muestreo. Hay dos formas de estudiar las poblaciones: por censo o por muestreo. En el censo se analizan todos y cada una uno de los elementos de una poblacin y en el muestreo se analiza una parte de la poblacin. Las principales ventajas del muestreo comparadas con el censo son: a. Costo reducido. Si la informacin se obtienen nicamente para una parte de la poblacin, los gastos son menores que los se tendran si se realiza un censo. b. Mayor rapidez. La informacin puede ser recolectada y procesada ms rpidamente cuando se selecciona una muestra que cuando se realiza un censo.

c. Mayor exactitud. Cuando los errores ajenos al muestreo son necesariamente grandes, una muestra puede dar mejores resultados que un censo, ya que esos errores se controlan con ms facilidad si la operacin es de pequea escala. Como el volumen de trabajo se reduce, se puede emplear personal calificado y realizar una supervisin cuidadosa del trabajo de campo y del procesamiento de la informacin, reduciendo as los errores de no muestreo. d. Posibilidad de hacerse. En la industria algunas pruebas son destructivas, por lo tanto, ciertas investigaciones slo pueden realizarse con una muestra de productos. Por ejemplo, un estudio sobre la duracin de los bombillos o la resistencia de cualquier material. Muestreo Aleatorio Simple. (M.A.S) Si de una poblacin de tamao N se selecciona una muestra de tamao n, de tal manera que cada muestra posible de tamao n tenga la misma probabilidad de ser seleccionada, el tipo de muestreo utilizado se llama Muestreo Aleatorio Simple. En la prctica, una muestra aleatoria simple es seleccionada unidad por unidad. Las unidades de muestreo son numeradas de 1 a N, a continuacin se seleccionan n nmeros entre 1 y N, ya sea utilizando una tabla de nmeros aleatorios o colocando los N nmeros en una urna y las unidades de muestreo que lleven los nmeros seleccionados constituirn la muestra. La muestra se selecciona sin repeticin o sin sustitucin, es decir, que cada unidad de muestreo solo puede aparecer una sola vez en una muestra determinada. Este tipo de muestreo se utiliza cuando: la poblacin es ms o menos homognea con respecto a las caractersticas que se desean estudiar; cuando los elementos de la poblacin no se pueden enumerar fcilmente; cuando las estimaciones que se deben obtener se refieren a todo el conjunto y no a subgrupos de la poblacin. Cuando se selecciona una muestra el objetivo es tener estimaciones para los parmetros a travs de la informacin suministrada por la muestra. Muestreo Aleatorio Estratificado. (MAE) El muestreo aleatorio estratificado (MAE) consiste en clasificar primero los elementos de la poblacin en grupos que no presenten traslapes o intersecciones, y de estos grupos o estratos seleccionar una muestra irrestricta aleatoria, tomando al menos un elemento de cada grupo o estrato. El proceso que se sigue para establecer los grupos se conoce como estratificacin. Al formar los estratos se debe buscar que los elementos de cada estrato sean lo ms homogneos entre s y que haya marcadas diferencias entre un estrato y otro. Estos estratos pueden reflejar regiones geogrficas de un pas, clases sociales dentro de una ciudad, etc.

Cuando se utiliza el muestreo aleatorio estratificado las probabilidades de seleccin de un grupo al otro pueden ser iguales o diferentes, aunque se debe conocer la probabilidad de seleccin que corresponde a cada uno. Las muestras se seleccionan separadamente para cada estrato y las estimaciones se realizan separadamente para cada estrato y se ponderan para obtener una estimacin combinada para la poblacin. El utilizar muestreo estratificado tiene sus ventajas como son: aumento en la exactitud de los resultados, reduciendo el error de muestreo y permite obtener estimaciones para cada estrato. A cambio de lo anterior, se necesita ms informacin que en MAS. para definir los estratos y el clculo de los errores es ms complejo que en MAS.

CONSIDERACIONES PARA LA SELECCIN DE UNA MUESTRA. 1. Se debe seguir un diseo estadstico (Muestreo Aleatorio Simple, Muestreo Aleatorio Estratificado). El mejor es el que muestra la precisin necesaria en trminos de un limite en cuanto al error de estimacin a un menor costo. 2. La seleccin de los elementos al azar para luego recolectar la informacin por cualquiera de los mtodos: (Entrevista, Correo, Observacion directa, telfono etc) 3. El error muestral. Es decir la diferencia entre el resultado obtenido mediante la muestra y el obtenido mediante la investigacin total o censo. Parametro: Son las medidas descriptivas numricas aplicadas a las caractersticas de la poblacin ( valores estadsticos de la poblacin. Estimador puntual: son las medidas descriptivas numricas aplicadas a las caractersticas de las unidades de muestra Estimador por intervalos: Es la estimacin del parmetro mediante la especificacin de un intervalo de valores determinado por un limite inferior y otro superior (limites de confianza) dentro del cual estar el parmetro poblacional. Intervalo de confianza: corresponde a un intervalo de valores dentro de los cuales se espera que este el parmetro, con cierto grado de confianza o con riesgo de error conocido. DISTRIBUCION DE LAS MEDIAS MUESTRALES Las estimaciones que tienen la propiedad de que sus valores esperados sean iguales a los valores poblacionales se denominan estimaciones insesgadas. En el Muestreo Aleatorio Simple (MAS) la media muestral es una estimacin insesgada del promedio poblacional.

Las muestras tienden a dar estimaciones relativamente ms confiables, es decir se aproximan ms al valor verdadero, a medida que aumenta el tamao de la muestra. La concentracin cada vez mayor de las estimaciones muestrales alrededor del valor verdadero a medida que aumenta el tamao de la muestra, es lo que se conoce como la consistencia del estimador. Supongamos una poblacin N=5 o sea de 5 elementos cuyos elementos (valores) son: 7, 3, 5, 8, 2, Calculamos
2 =

=
)

=5

= 5.2

=2.28

El nmero de muestras posibles de tamao 2 seleccionadas sin reposicion corresponde a 10 muestras. Los valores de las medias aritmticas de cada una de ls muestras encontradas son los siguientes:

Al calcular la media aritmtica del total de las medias muestrales el resultado obtenido es el valor de la media de la poblacin, con lo cual podemos afirmar lo siguiente:

TEOREMA DEL LIMITE CENTRAL. Si de una poblacin, se extraen muestras aleatorias de tamao constante n la distribucin de las medias muestrales es una distribucin normal; la media aritmtica de la distribucin es igual a la media de la poblacin, y la varianza de las muestras ser igual a LEY DE LOS GRANDES NUMEROS Si se extraen de cualquier poblacin muestras aleatorias de tamao constante n, a medida que n aumenta, la distribucin de las medias de las muestras se aproxima cada vez mas a una distribucin normal, la media de las distribucin de las medias es igual a la media de la poblacin y la varianza de las medias ser igual a En conclusin: La distribucin de las medias tiende a ser normal La media de las muestras es igual a la media de la poblacin Si la estimacin del valor de la media se basa en una sola muestra de tamao n, la aproximacin ser tanto mas cercana, cuanto mayor sea el valor de n. El error estndar = que es el valor de la desviacin estndar de las medias de las muestras. Cuanto mas pequeo sea el error estndar mas representativa es la media muestral. En general, el error estndar es utilizado principalmente para cuantificar la dispersin del estimador obtenido. El intervalo de confianza para la media es:

p(-zs<<+zs) = 1

Si la muestra es grande (n> 30), Z pertenece a una distribucin normal y si la muestra es pequea (n < 30), Z pertenece a una distribucin t con n-1 grados de libertad.

EJEMPLO Se desea estimar el promedio de hectreas destinadas al cultivo de caf; para ello se toma una muestra aleatoria de 15 fincas de un total de 750 en el departamento de Caldas, obtenindose los siguientes resultados en hectreas sembradas en caf:

FINCA Has. CAF FINCA Has. CAF FINCA Has. CAF

12

10

11

15

15

12

12

25

11

13

10

30

24

14

19

22

10

18

15

22

Una vez estimado el promedio obtenga un intervalo de confianza para el promedio. Solucin: El promedio se obtiene:

La desviacin estndar para el promedio se obtiene con la frmula, pero para aplicarla se necesita la varianza corregida.

Los anteriores resultados quieren decir que en el departamento de Caldas el promedio de hectreas sembradas en caf por finca es de 16,73 con un margen de error de 1,74 hectreas. El intervalo de confianza para el promedio se obtiene teniendo en cuenta que la muestra es pequea, el valor de Z se halla en una tabla de la distribucin t con 14 grados de libertad, que para una confiabilidad del 95 por ciento es de 2,145.

Esto quiere decir que con una confiabilidad del 95 por ciento, el promedio de hectreas cultivadas en caf por finca en el departamento de Caldas, est entre 13 y 20,47.

DETERMINACION DEL TAMAO DE LA MUESTRA Cuando deseamos estimar el tamao de la muestra se deben tener en cuenta que los objetivos de la encuesta suelen requerir varias estadsticas y que al considerar cada una de ellas pueden llevar a un diseo diferente, por lo tanto, para determinar el tamao de la muestra se debe elegir el principal objetivo y calcular el tamao de muestra necesario para cumplir dicho objetivo. En caso de ser varios los objetivos principales se determina un tamao de muestra para cumplir cada objetivo y entre todos ellos, se elige el mayor. El tamao de la muestra depende bsicamente del tamao de la poblacin, del nivel de confianza o confiabilidad de las estimaciones, del grado de variacin o dispersin de la variable a estudiar y del error de estimacin. El nivel de confianza o confiabilidad lo fija arbitrariamente quien est calculando el tamao de la muestra, teniendo en cuenta que dicha confiabilidad debe estar entre el noventa y el noventa y nueve por ciento. A mayor confiabilidad mayor tamao de muestra. El grado de variacin o dispersin de la variable se mide a travs de la desviacin estndar, la cual puede ser estimada a partir de una muestra piloto o a partir de la informacin recopilada en una investigacin similar, realizada anteriormente. El error de estimacin es la mxima diferencia en valor absoluto, que se est dispuesto a aceptar, entre el valor del estimador y el valor del parmetro, a ste error de estimacin se le nota como E. El valor del error de estimacin depende del estimador que se desee obtener y de la magnitud de la variable. Por ejemplo si se va a estimar la proporcin de desempleados, un error de estimacin lgico puede ser del 3 por ciento; pero si se va a estimar el peso promedio de un grupo de estudiantes, un error de estimacin lgico puede ser de 7 kilos. A mayor error de estimacin menor tamao de muestra.

Dependiendo del tipo de estimador que se desee obtener, se debe utilizar una frmula diferente para calcular el tamao de la muestra. Tamao de la muestra para la media poblacional para poblaciones infinitas:

n=

E = es el margen de error que se puede aceptar al nivel de confianza dado. Z = es el nivel de confianza que se usa = desviacin estndar de la poblacin (una estimacin) Cuando no se conoce la desviacin estndar de la poblacin es necesario buscar un valor preliminar o un valor de planeacin. Se puede optar en la practica por: Usar una desviacin estndar muestral de muestras previas. Usar un estudio piloto para seleccionar una muestra preliminar de unidades Usar el juicio o una mejor estimacin

Tamao de la muestra para la media poblacional para poblaciones finitas:

n=

DISTRIBUCION MUESTRAL DE LA PROPORCION En el anlisis de una caracterstica cualitativa o atributo se emplea la proporcin de xitos y no el numero de xitos como en la distribucin binomial.

Antes

p=

Ahora en vez de expresar la variable en trminos de xitos nos referiremos al numero de atributos en la muestra (a) y lo dividimos por el tamao de la muestra (n).

P=
Si lo trasladamos a la poblacion

a = ai = np

P=

A= Ai = NP

P es la proporcin de elementos que presenta la caracterstica en la poblacin; (1 P) es la proporcin de elementos que no presenta la caracterstica en la poblacin. p = varianza de la proporcin de la poblacin p = P(1 P) = desviacin estndar =

P = (

TAMAO DE LA MUESTRA Para determinar el tamao de la muestra es necesario identificar los siguientes componentes: La varianza (x) que corresponde al grado de variabilidad que presentan las unidades de la poblacin. Mientras mas grande sea x mayor ser el tamao de la muestra. El valor de x supuestamente es conocido, de lo contrario se debe estimar a travs de una investigacin preliminar. En el caso de p = P(1 P) sucede algo similar pero se tiene la costumbre de tomar P = 0,50 con lo cual se obtiene el mximo valor posible de n. Nivel de confianza. Tiene relacin directa con el tamao de la muestra, por lo tanto se dir que a mayor nivel de confianza, mas grande debe ser el tamao de la muestra. Los valores de Z se obtienen mediante el uso de tablas. El nivel es fijado por el investigador con base en su experiencia. Precisin de la estimacin: corresponde al margen de error que el investigador fija de acuerdo al conocimiento que tenga acerca del parmetro que piensa estimar. Se le conoce como error de muestreo (E) siendo:

E=Z

E=Z

Tamao de la muestra para la proporcin poblacional para poblaciones infinitas:

n =

E = error muestral Z = el nivel de confianza P = el valor de la proporcin de la poblacin El valor de planeacin de la proporcin de la poblacin se puede elegir mediante: Usar una proporcin muestral de una muestra anterior Llevar a cabo un estudio piloto Usar el juicio o un estimado mejor del valor de P Usar P = 0.50 Tamao de la muestra para la proporcin poblacional para poblaciones infinitas:

) ( )

n=

PRUEBAS DE HIPOTESIS

Una hiptesis estadstica es un supuesto acerca del valor de un parmetro de una poblacin determinada. Este supuesto debe comprobarse con la informacin suministrada por una muestra aleatoria obtenida de dicha poblacin. Cuando se realiza una prueba de hiptesis, se plantean dos hiptesis que deben ser mutuamente excluyentes; una es la hiptesis nula que se nota como H0 y la otra es la hiptesis alternativa que se nota como H1 . Se debe establecer un criterio o regla de decisin segn la cual no se rechace la hiptesis nula o se rechace. Si se rechaza la hiptesis nula (H0 ) se acepta hiptesis alternativa (H1 ). Para establecer esta regla de decisin la distribucin de probabilidad se divide en dos

categoras mutuamente excluyentes: la que lleva al rechazo de H0 , es decir est en la zona de rechazo y la que lleva al no rechazo de H0 , es decir, est en la zona de no rechazo. Debido a que se est trabajando con una muestra aleatoria, cuando se realiza una prueba de hiptesis se pueden cometer dos tipos de errores. La hiptesis nula (H0 ) es en realidad verdadera, pero debido a que los datos muestrales parecen ser inconsistentes con ella, se la rechaza (ERROR TIPO I) y la probabilidad de cometer un error tipo I se llama nivel de significancia ( ). Puesto que cuando se comete un error tipo I, seguiramos una accin errnea, se puede definir el nivel de significancia como la probabilidad de decidirnos por H1 dado que H0 es verdadera. Por otro lado, podemos no rechazar H0 siendo en realidad falsa, a este error se le llama ERROR TIPO II.

FORMULACION DE HIPOTESIS El primer paso en la prueba de hiptesis es el planteamiento de las hiptesis, lo que en algunos casos no es una tarea fcil. Hay tres tipos de hiptesis, a saber: - Prueba de hiptesis a dos colas H0: = k H1: k

- Prueba de hiptesis a una cola superior H0 : = k H1 : > k H0: k

H1 : > k

- Prueba de hiptesis a una cola inferior H0 : = k H1 : < k H0 : k

H1 : < k

Ntese que las hiptesis siempre se plantean para un parmetro .

Una vez establecidas las hiptesis, se selecciona el nivel de significancia o mrgen de error ( ) el que generalmente se fija entre el uno y el diez por ciento. El tercer paso es la estadstica a probar o estadstica de trabajo, la cual depende de la distribucin en el muestreo del estimador con el que se est trabajando y de los supuestos correspondientes a la poblacin y al tamao de la muestra. Cuando se realizan los clculos siempre se supone que la hiptesis nula (H0) es cierta. El cuarto paso es establecer la regla de decisin, la cual depende de la distribucin de probabilidad de la estadstica a probar, del nivel de significancia ( ) y de la hiptesis alternativa (H1). Finalmente se toma la decisin de no rechazar la hiptesis nula o rechazarla.

PRUEBA DE HIPOTESIS PARA LA MEDIA


El promedio aritmtico poblacional es un indicador muy importante, por lo tanto, frecuentemente se desea probar si dicho promedio ha permanecido igual, ha aumentado o ha disminudo. A travs de la prueba de hiptesis se determina si la media poblacional es significativamente mayor o menor que algn valor supuesto.

Hiptesis Se puede plantear uno de los siguientes tres tipos de hiptesis: - Prueba de hiptesis a dos colas H0 : = k H1 : k

- Prueba de hiptesis a una cola superior H0 : = k H1 : >k H0 : k

H1 : > k

- Prueba de hiptesis a una cola inferior H0 : = k H1 : < k H0 : k

H1 : < k

En las distribuciones en el muestreo se vio que para el caso de la media, hay tres situaciones, por consiguiente la estadstica de trabajo a utilizar depende de los supuestos de la poblacin y del tamao de la muestra. Prueba de hiptesis para la media si la poblacin de donde se obtiene la muestra tiene distribucin normal con conocida.

La estadstica de trabajo a usar corresponde a la expresin

Dnde:

es el valor que se est suponiendo en la hiptesis nula (H0).

REGLA DE DECISION - Si se ha planteado la hiptesis alternativa como: H1 : k se tiene una prueba de hiptesis a dos colas, por lo tanto, el nivel de significancia ( ) se divide en dos partes iguales, quedando estos valores en los extremos de la distribucin como se aprecia en la figura

Regla de decisin para una prueba de hiptesis a dos colas. y pertenecen a una distribucin normal estndar. Si el valor de la estadstica de trabajo (Zx) est entre y no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1. Es decir:

- Si se ha planteado la hiptesis alternativa como: H1 : > k, se tiene una prueba de hiptesis a una cola superior, quedando el nivel de significancia ( ) en la parte superior de la distribucin, como se aprecia en la figura

Regla de decisin para una prueba de hiptesis a una cola superior. pertenece a una distribucin normal estndar. Si el valor de la estadstica de trabajo (Zx) es menor que no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1. Es decir,

Si se ha planteado la hiptesis alternativa como: H1 : < k, se tiene una prueba de hiptesis a una cola inferior, quedando el nivel de significancia ( ) en la parte inferior de la distribucin, como se aprecia en la figura

Regla de decisin para una prueba de hiptesis a una cola inferior. Z pertenece a una distribucin normal estndar. Si el valor de la estadstica de trabajo (Zx) es mayor que Z no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1. Es decir,

EJEMPLO Un proceso manufacturero usado por una fbrica durante los ltimos aos da una produccin media de 100 unidades por hora con una desviacin estndar de 8 unidades. Se acaba de introducir en el mercado una nueva mquina para realizar ese tipo de producto. Aunque es muy cara comparada con la que est ahora en uso, si la media de produccin de la nueva mquina es de ms de 150 unidades por hora, su adopcin dara bastantes beneficios. Para decidir si se debiera comprar la nueva mquina, a la gerencia de la fbrica se le permite hacer un ensayo durante 35 horas, hallndose un promedio de 160 unidades por hora. Con sta informacin qu decisin se debe tomar si se asume un nivel de confianza del 99 por ciento.

Solucin. Segn el enunciado, solo se compra la mquina si la produccin es de mas de 150 unidades por hora, por lo tanto las hiptesis son: H0 : = 150 H1 : > 150 Para elegir la estadstica de trabajo se tiene en cuenta que se conoce la varianza poblacional, por lo tanto se usa la expresin:

por el planteamiento de la hiptesis alternativa se trabaja a una cola superior. En la distribucin normal, con una confiabilidad del 99 por ciento el valor de Z es 2,33. como puede observarse en la figura, la estadstica de trabajo est en la zona de rechazo de la

hiptesis nula, por lo tanto, se acepta que la produccin promedio por hora es superior a las 150 unidades y asumiendo un riesgo del 1 por ciento se puede comprar la nueva mquina.

Regla de decisin para una prueba de hiptesis a una cola inferior.

Prueba de hiptesis para la media si se selecciona una muestra aleatoria de tamao n 30 de una poblacin con cualquier distribucin. La estadstica de trabajo a usar es la expresin:

REGLA DE DECISION Es la misma que en el caso anterior y depende en todo caso de la hiptesis alternativa. EJEMPLO La duracin promedio de las llantas producidas por una fbrica de llantas, segn experiencias registradas es de 46.050 kms. Se desea probar si el promedio poblacional ha cambiado; para tal efecto se toma una muestra aleatoria de 60 llantas y se obtiene una duracin promedio de 45.050 kms. con una desviacin estndar de 3.070 kms. Solucin

H 0 : = 46.050 H1 : 46.050

Teniendo en cuenta que el tamao de la muestra es grande, como estadstica de trabajo se utiliza la expresin 3.2

Por la hiptesis alternativa, la regla de decisin es a dos colas. La tabla a utilizar es la de la distribucin normal. Asumiendo un nivel de confianza del 95 por ciento, los correspondientes valores de Z son -1,96 y 1,96. Como puede observarse en la figura el valor de la estadstica de trabajo est en la zona de rechazo de la hiptesis nula, por consiguiente, con una confiabilidad del 95 por ciento se acepta que la duracin promedio de las llantas ha cambiado.

Regla de decisin para una prueba de hiptesis a dos colas

Prueba de hiptesis para la media si se selecciona una muestra aleatoria de tamao n<30 . En este caso se tienen dos situaciones, dependiendo de si se utiliza la varianza muestral sin corregir o corregida. Si se utiliza la varianza sin corregir ( ) la estadstica de trabajo es la expresin:

Si se utiliza la varianza corregida la estadstica de trabajo es la expresin:

EJEMPLO En su calidad de comprador comercial para un supermercado, se toma una muestra aleatoria de doce (12) sobres de caf de una empacadora. Se encuentra que el peso promedio del contenido de caf de cada sobre es 15,97 grs. con una desviacin estndar de 0,15. La compaa empacadora afirma que el peso promedio mnimo del caf es de 16 grs. por sobre. Puede aceptarse sta afirmacin si se asume un nivel de confianza del 90 por ciento? Solucin Se desea probar si el peso mnimo es de 16 grs., es decir mayor o igual a 16 grs., as que las hiiptesis adecuadas son: H0 : 16

H1 : < 16 Teniendo en cuenta que el tamao de la muestra es pequeo, como estadstica de trabajo se utiliza la expresin:

Como lo indica la hiptesis alternativa, se trabaja a una cola inferior en la tabla de la distribucin t con 11 grados de libertad y una confiabilidad del 90 por ciento, el valor de Z es - 1,363 Como puede observarse, la estadstica de trabajo (-0,663) est ubicada en la zona de no rechazo de la hiptesis nula, por lo tanto, con un nivel de confianza del 90 por ciento no

se rechaza que los empacadores de caf tienen la razn, por lo tanto se concluye que el peso promedio de los sobres de caf es mayor o igual a 16 grs.

Regla de decisin para una prueba de hiptesis a una cola inferior

PRUEBA DE HIPOTESIS PARA LA PROPORCION Frecuentemente se desea estimar la proporcin de elementos que tienen una caracterstica determinada, en tal caso, las observaciones son de naturaleza cualitativa. Cuando se analiza informacin cualitativa y se est interesado en verificar un supuesto acerca de la proporcin poblacional de elementos que tienen determinada caracterstica, es til trabajar con la prueba de hiptesis para la proporcin. HIPTESIS Como en el caso de la media, se puede plantear uno de los siguientes tres tipos de hiptesis: - Prueba de hiptesis a dos colas H0 : = k H1 : k

- Prueba de hiptesis a una cola superior H0 : = k H0 : k

H1 : > k

H1 : > k

- Prueba de hiptesis a una cola inferior H0 : = k H1: < k H0 : k

H1 : < k

Cuando se va a estimar una proporcin el tamao de la muestra (n) siempre debe ser mayor a 30, por lo tanto se tiene un solo caso. La estadstica de trabajo a utilizar es la expresin:

REGLA DE DECISION Si se ha planteado la hiptesis alternativa como: H1: k se tiene una prueba de hiptesis a dos colas, por lo tanto, el nivel de significancia ( ) se divide en dos partes iguales, quedando estos valores en los extremos de la distribucin y pertenecen a una distribucin normal estndar. Si el valor de la estadstica de trabajo (Zp) est entre y no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si < Zp < no se rechaza H0 . - Si se ha planteado la hiptesis alternativa como: H1 : > k, se tiene una prueba de hiptesis a una cola superior, quedando el nivel de significancia ( ) en la parte superior de la distribucin pertenece a una distribucin normal estndar. Si el valor de la estadstica de trabajo (Zp ) es menor que no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si Zp < no se rechaza H0 . - Si se ha planteado la hiptesis alternativa como: H1 : < k, se tiene una prueba de hiptesis a una cola inferior, quedando el nivel de significancia ( ) en la parte inferior de la distribucin

Z pertenece a una distribucin normal estndar. Si el valor de la estadstica de trabajo (Zp ) es mayor que Z no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si Zp > Z no se rechaza H0 . EJEMPLO Un fabricante afirma que por lo menos el 90 por ciento de las piezas de una maquinaria que suministra a una fbrica guardan las formas especificadas. Un exmen de 200 de esas piezas revel que 160 de ellas no eran defectuosas. Pruebe si lo que afirma el fabricante es cierto. Solucin H0 : 0,9

H1 : < 0,9 Para realizar una prueba de hiptesis para la proporcin se utiliza la expresin:

Asumiendo una confiabilidad del 95 por ciento, el valor correspondiente a Z en la distribucin normal es -1,64

Como puede observarse en la figura, el valor de la estadstica de trabajo se encuentra en la zona de rechazo de la hiptesis nula, por consiguiente, con una confiabilidad del 95 por ciento se concluye que la afirmacin del fabricante no es cierta.

Regla de decisin para una prueba de hiptesis a una cola inferior

BIBLIOGRAFIA

BERENSON, Mark L. y LEVINE , David M. Estadstica bsica en administracin, conceptos y aplicaciones. Mxico: Prentice-Hall Hispanoamericana S.A. 1992. 946 p. GUJARATI Damodar . ECONOMETRIA, tercera edicin. Ed. Mc Graww Hill. ABAD, Adela y SERVIN, Luis A. Introduccin al muestreo, segunda edicin. Mxico D.F: Ed. Limusa, 1984. 216 p. MENDENHALL, William y REINMUTH, James E. Estadstica para administracin y economa. California: Ed. Wadsworth Internacional/Iberoamrica, 1982. 707 p. LARSON, Harold J. Introduccin a la teora de probabilidades e inferencia estadstica. Mxico D.F: Limusa, 1978. 466 p ANDERSON David, SWEENEY Dennis J, WILLIAMS Thomas, Estadistica para Administracin y Economia sptima edicin ed: Thomson Internacional SCHEAFFER, Richard L.; MENDENHALL, William y OTT, Lyman. Elementos de muestreo. Mxico D.F: Grupo editorial iberoamrica, 1986. 321 p.

MARTINEZ Bencardino Ciro, Estadistica y muestreo Onceava edicin ed: Ecoe ediciones LIND Douglas A, MARCHAL William, MASON Robert, Estadistica para Administracion y Economia Undecima edicion ed: Alfaomega STEVENSON, William J. Estadstica para administracin y economa, conceptos y aplicaciones. Mxico D.F.: Harla, 1981. 585 p. Universidad Nacional www.virtual.unal.edu.co de Colombia Curso de estadistica II

Anda mungkin juga menyukai