Anda di halaman 1dari 64

I.E.S. Fco. Figueras Pacheco C.E.E.D.

Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -1-

Bloque III: PROBABILIDAD Y ESTADSTICA


El humorista Forges public hace tiempo un chiste en un diario, en el que dos personas mantienen el siguiente dilogo: Si las estadsticas no mienten Mienten! Bueno, nada Mienten las estadsticas? Dicho de otra forma, nos pueden engaar a partir de estudios estadsticos correctos?.

En cursos anteriores ya has tenido ocasin de trabajar con fenmenos aleatorios, as como con elaboracin e interpretacin de estudios estadsticos. Pero quiz, aunque ya eres consciente de que estos fenmenos debidos al azar mantienen un orden y pueden ser estudiados matemticamente, te has planteado algunas preguntas que estn sin resolver: Siempre me han dicho que Estadstica y Probabilidad estn estrechamente relacionadas, pero no llego a ver esa relacin. S que es difcil que, al lanzar una moneda al aire 100 veces, salgan 80 caras, pero puedo asegurar que la moneda est trucada? Estoy cansad@ de ver sondeos electorales, pero ni s qu quiere decir la Ficha tcnica ni s si me puedo fiar de los resultados que pronostican. Tambin lo estoy de encontrar en los medios de comunicacin conclusiones a partir de estudios estadsticos. Me puedo fiar de ellas?

Al final de este tema esperamos que domines el clculo de probabilidades, que veas clara la relacin entre Probabilidad y Estadstica y que tengas argumentos para saber interpretar estudios estadsticos y cmo y con qu fiabilidad se pueden deducir conclusiones a partir de ellos. En definitiva, que puedas apreciar el inters de una rama de las Matemticas con importantes implicaciones en nuestra sociedad. 1

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -2-

NDICE
1 UN PROBLEMA PARA EMPEZAR (Y PARA RECORDAR).................................................................4 EL AZAR. SUCESOS ALEATORIOS. ........................................................................ 6 2 LAS LEYES DEL AZAR ................................................................................................................6 2.1 Probabilidad de Laplace...................................................................................................6 2.2 Frecuencia y probabilidad................................................................................................6 3 SUCESOS ALEATORIOS ...............................................................................................................8 3.1 Definiciones .....................................................................................................................8 3.2 Operaciones y propiedades ..............................................................................................9 PROBABILIDAD CONDICIONADA. PROBABILIDAD TOTAL. ....................... 10 4 PROBABILIDAD DE UN SUCESO. PROBABILIDAD CONDICIONADA. ............................................10 4.1 Definicin axiomtica de probabilidad de un suceso.....................................................10 4.2 Propiedades ....................................................................................................................10 4.3 Probabilidad condicionada.............................................................................................11 5 UTILIZAMOS EL SUCESO CONTRARIO .......................................................................................13 5.1 Tenemos dos experimentos............................................................................................13 5.2 Tenemos tres experimentos............................................................................................13 6 DEL DIAGRAMA EN RBOL A LA PROBABILIDAD TOTAL...........................................................15 6.1 El diagrama en rbol ......................................................................................................15 6.2 Teorema de la probabilidad total ...................................................................................16 6.3 Teorema de Bayes ..........................................................................................................18 7 UNA ACTIVIDAD RESUMEN .....................................................................................................21 1 UNA ACTIVIDAD PARA TODO EL TEMA.....................................................................................23 2 MUESTREO ..............................................................................................................................26 2.1 Trminos habituales en el muestreo...............................................................................26 2.2 Mtodos de muestreo .....................................................................................................27 3 DISTRIBUCIN DE PROBABILIDAD DE LA MEDIA MUESTRAL ....................................................30 3.1 Repaso de la distribucin normal (lectura comprensiva)...............................................30 3.2 Clculo de probabilidades en una distribucin normal. Manejo de tablas.....................32 3.3 Distribucin de la media muestral .................................................................................36 3.4 Teorema central del lmite .............................................................................................37 4 INTERVALO DE PROBABILIDAD PARA LA MEDIA MUESTRAL.....................................................40 1 ESTIMACIN A PARTIR DE UNA MUESTRA ................................................................................45 1.1 Estimacin puntual.........................................................................................................46 1.2 Estimacin por intervalo ................................................................................................46 2 INTERVALO DE CONFIANZA PARA LA MEDIA ............................................................................47 2.1 La desviacin tpica es conocida ................................................................................47 2.2 La desviacin tpica es desconocida ...........................................................................50 3 ERROR ADMITIDO Y TAMAO DE LA MUESTRA ........................................................................52 3.1 Error admitido ................................................................................................................52 3.2 Tamao muestral............................................................................................................53 4 CONTRASTE DE HIPTESIS .......................................................................................................55 4.1 Un problema tpico.........................................................................................................55 4.2 Hiptesis nula e hiptesis alternativa. Estadstico del contraste. ...................................56 2

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -3-

4.3 Contraste unilateral y bilateral .......................................................................................56 4.4 Regin crtica (o de rechazo) y regin de aceptacin ....................................................56 4.5 Contraste de hiptesis sobre la media poblacional ........................................................57 4.6 Resumen.........................................................................................................................58 5 ANALOGA ENTRE EL CONTRASTE DE HIPTESIS Y EL INTERVALO DE CONFIANZA ...................61

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -4-

TEMA 9:

PROBABILIDAD

El azar es el origen y fundamento de los juegos, especialmente de los llamados de mesa y, tambin, de las loteras, apuestas y quinielas (aunque en estas ltimas el azar queda mediatizado por los millonarios presupuestos de los clubes que contra. tan jugadores superestrellas para asegurar el triunfo); y el juego, precisamente, es el origen del estudio de la probabilidad cuando, all por el siglo XVII, Pascal, en su correspondencia con Fermat, comentando las aparentes paradojas que le formulaba su amigo el Caballero de Mer, empedernido jugador de dados, formul los fundamentos de esa medida de la incertidumbre. En esta unidad repasaremos esos fundamentos, el escenario terico en el que se desarrolla la probabilidad y su clculo, persiguiendo el objetivo de dominar sus entresijos y poder, en las prximas unidades, entender los principios bsicos de la inferencia estadstica y apreciar y medir el riesgo inherente a la toma de decisiones basadas en la informacin contenida en una pequea muestra. Se termina la unidad con una referencia al teorema de Bayes, lo que nos permitir apreciar la influencia que ejerce la experimentacin en la probabilidad de un suceso y, por tanto, ajustar su valor con ms elementos de juicio. Esa situacin se pone especialmente de manifiesto cuando los hechos obligan a rectificar asignaciones a prior de probabilidades que resultan inaceptables.

UN PROBLEMA PARA EMPEZAR (Y PARA RECORDAR)

En una Universidad en la que slo hay estudiantes de Arquitectura, Ciencias y Letras, terminan la carrera el 5% de Arquitectura, el 10% de Ciencias y el 20% de Letras. Se sabe que el 20% estudia Arquitectura, el 30% Ciencias y el 50% Letras. Elegimos un estudiante al azar. a) Cul es la probabilidad de que sea de Arquitectura y haya terminado la carrera? b) Cul es la probabilidad de que haya terminado la carrera? c) Nos dice que ha terminado la carrera. Cul es la probabilidad de que sea Arquitectura? Resolucin Empleemos la estrategia que empleemos, codificamos los sucesos: A: Estudian Arquitectura C: Estudian Ciencias L: Estudian Letras T. Termina la carrera T: No termina la carrera Estrategia 1: Mediante una tabla de contingencia A T T Total a) P(A T) =
b) P(T) = 1 = 001 = 1 % 100

C 1 19 20 3 27 30

L 10 40 50

Total 14 86 100

14 = 014 = 14 % 100

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -5-

c) P(A/T) =

1 007 = 7 % 14

Estrategia 2: Mediante los teoremas de la probabilidad


Tenemos las siguientes probabilidades:

P(A) = 020, P(T/A) = 005,

P(C) = 030, P(T/C) = 010,

P(L) = 050 P(T/L) = 020

a) P(A T) = P(A) P(T/A) = 020 005 = 001 b) P(T) = P(A) P(T/A) + + P(C) P(T/C) + P(L) P(T/L) = 020 005 + 030 010 + 050 020 = 001 + 003 + 01 = 014 = 14 % c) P(A/T) =

P(A T ) 0'01 1 = = 007 = 7 % P (T ) 0'14 14

Comentarios
Es posible que ya hayas, en cursos anteriores, trabajado con problemas como el anterior; por tanto, conocers diferentes estrategias de resolucin de ese tipo de problemas. De hecho, puede ser conveniente que completes el desarrollo de la 2 estrategia con la construccin de un diagrama de probabilidad. Los cambios que en este curso se proponen no afectan tanto al mtodo de resolucin como a la forma; es decir, haremos sobre todo hincapi en una mayor formalizacin que afectar tanto a la codificacin de los sucesos como a la aplicacin de diferentes frmulas.

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -6-

EL AZAR. SUCESOS ALEATORIOS. 2 LAS LEYES DEL AZAR

Se llaman fenmenos aleatorios (o debidos al azar) aqullos que, aunque se repitan en las mismas condiciones, producen un resultado que no tiene por qu ser el mismo, o sea, es imprevisible. Entonces, cmo vamos a estudiar reglas que rijan lo imprevisible?. Estamos acostumbrados a or frases como sta: En el prximo puente se esperan diez millones de desplazamientos en coche. Y los responsables de trfico son capaces de predecir el flujo de vehculos en la salida de las ciudades e incluso los muertos que habr por accidentes de trfico. Las molculas de un gas se mueven a gran velocidad y rebotan contra las paredes del recipiente que las contiene. Pero la presin que ejerce el gas sobre dichas paredes es la misma en todos los puntos. Isaac Asimov, en su triloga de novelas El ciclo de Trentor (Fundacin, Fundacin e Imperio y Segunda Fundacin) describe la existencia de una ciencia la Psicohistoria que es capaz de describir el comportamiento futuro de la Humanidad. Tiene algn viso de realidad? Hay muchos ejemplos sobre regularidades en situaciones totalmente aleatorias. Se te ocurren algunos? Fjate en que siempre hay un elemento en comn: el gran nmero de individuos que componen la poblacin sobre la que se realiza la previsin. Las reglas que vamos a estudiar sobre fenmenos aleatorios se van a referir no a lo que pueda suceder en un caso aislado, sino a una gran cantidad de elementos de una poblacin. As, al lanzar una vez una moneda bien construida no seremos capaces de prever el resultado, pero s sabemos que al lanzarla muchas veces, aproximadamente en la mitad de las ocasiones obtendremos cara. 2.1 Probabilidad de Laplace

La probabilidad de un suceso aleatorio es igual al cociente del nmero de casos que le son favorables entre el nmero de casos posibles del experimento. (Siempre que todos los casos tengan la misma posibilidad de ocurrir). Si A es un suceso aleatorio: P( A) = Observa que: P(A) es el cociente de dos nmeros positivos. Por lo tanto se cumple que P(A) 0. El nmero de casos favorables a A nunca puede ser mayor que el nmero de casos posibles. Por lo tanto P(A) 1. 0 P(A) 1 2.2 Frecuencia y probabilidad casos favorables casos posibles

Hemos visto que hay dos formas de asignar la probabilidad a un suceso: Suponiendo que todos los resultados elementales tienen la misma posibilidad de realizarse (son equiprobables). Esta probabilidad (de Laplace) se puede conocer de antemano, sin necesidad de realizar el experimento, por eso la denominaremos probabilidad a priori. Utilizando la frecuencia relativa del suceso en un nmero elevado de experiencias. Esta probabilidad requiere la realizacin del experimento. La denominaremos probabilidad a posteriori. 6

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -7-

Cuanto mayor es el nmero de experiencias, ms se acerca la frecuencia relativa a la probabilidad terica (ley de los grandes nmeros) Actividad resuelta Se extrae una carta de una baraja espaola (40 cartas). Calcula la probabilidad de que salga: a) Un tres. Resolucin Como hay 40 cartas, 4 treses, 10 oros y slo 1 tres de oros, tendremos: 4 1 10 1 = = 010 = 10 % P(oro) = = =025 = 25 % P(tres) = 40 10 40 4 1 P(tres de oros) = = 0025 = 25 % 40 Actividad propuesta
1. En un centro escolar hay 1000 alumnos repartidos as:

b) Un oro.

c) Un tres de oros.

Chicos Estudian Francs Estudian Ingls


Se elige al azar uno de ellos. a) Cul es la probabilidad de que sea chico? b) Cul es la probabilidad de que estudie francs?

Chicas 60 630

40 270

c) Cul es la probabilidad de que sea una chica y estudie ingls?

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -8-

3
3.1

SUCESOS ALEATORIOS
Definiciones

En el estudio de un cierto fenmeno aleatorio, llamaremos Espacio muestral: conjunto de todos los casos posibles: Suceso elemental: todo elemento del espacio muestral: Experimento: procedimiento por el que se selecciona un suceso elemental Suceso: todo subconjunto del espacio muestral: A Dos sucesos algo especiales: Suceso seguro: Suceso imposible:

Dado un suceso A, diremos que se ha verificado si, tras la realizacin del experimento, se obtiene un suceso elemental que pertenece a A. A implica B si al verificarse A tambin lo hace B: A B o AB A=B AB y BA Dos sucesos A y B que no tienen sucesos elementales en comn se llaman incompatibles. Es decir, dos sucesos tales que AB=

Actividad resuelta Halla los espacios muestrales de los siguientes experimentos: a) Tirar dos monedas y apuntar sus resultados. b) Tirar tres monedas y apuntar sus resultados. Resolucin a) Al tirar dos monedas pueden obtenerse dos caras, suceso cc; una cruz y una cara, suceso +c; una cara y una cruz, suceso c+ o dos cruces, suceso ++. El espacio muestral ser: E = {cc, c+, +c, ++} b) En este caso, para obtener todo los resultados, conviene utilizar un diagrama en rbol: 1 moneda 2 monedas
cc cc+ c c+c c+ c++ +cc +c +c+ + ++c ++ +++

3 monedas
ccc

El espacio muestral ser: E = {ccc, cc+, c+c, c++, +cc, +c+, ++c, +++}

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -9-

3.2

Operaciones y propiedades
Suceso Definicin Suceso que se verifica si lo hacen A o B o los dos Suceso que se verifica si lo hacen a la vez A y B Suceso que se verifica cuando no lo hace A Notacin A o B , AB A y B , AB no A, Ac, A , A

Suma o unin Producto o interseccin Suceso contrario de A

Propiedades 1. A (BC) = (AB) C 2. AB = BA 3. A = 5. A A =


6. Leyes de Morgan
AB= AB AB= AB AB=A B

A (BC) = (AB) C AB = BA A =
A A =

4. A (BC) = (AB) (AC) A (BC) = (AB) (AC)

7. Resta de sucesos:

Actividad resuelta Sean los sucesos: A = {ser oyente de RNE}, B = {ser oyente de la SER} y C = {ser oyente de M80}. Expresa mediante las operaciones de sucesos: a) Ser oyente de, al menos, una emisora. b) Ser oyente de RNE, pero no de la SER ni de M80. c) Or slo dos emisoras. d) No or ninguna emisora. Resolucin:
a) Es equivalente a ser oyente de alguna de las tres emisoras, o sea: A B C. b) A B' C' = A (B C) c) (A B C') (A B' C) (A' B C) d) A' B' C' = (ABC)

Actividades propuestas
2. En el experimento aleatorio Lanzamiento de un dado, escribe los sucesos: a) Salir par. b) Salir un mltiplo de 3. c) Salir par o mltiplo de 3. 3. En una ciudad hay dos peridicos A y B. Describe, mediante las operaciones con sucesos, las siguientes situaciones: a) b) c) d) Ser lector de algn peridico. Leer slo uno de ellos. Leer los dos. No leer ninguno.

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -10-

PROBABILIDAD CONDICIONADA. PROBABILIDAD TOTAL. 4


4.1

PROBABILIDAD DE UN SUCESO. PROBABILIDAD CONDICIONADA.


Definicin axiomtica de probabilidad de un suceso

La definicin de probabilidad de Laplace tiene dos pegas: el no ser vlida como tal si el espacio muestral es infinito y no ser una definicin autosuficiente, puesto que se supone la equiprobabilidad de los sucesos elementales para luego definir probabilidad. Dada una familia S de sucesos, se llama medida de probabilidad definida sobre S a toda aplicacin P: S R que cumpla los siguientes axiomas: A1.- P(A) 0 A2.- P() = 1 A3.- Si AB = P(AB) = P(A) + P(B) La frecuencia relativa, es una medida de probabilidad? 4.2 Propiedades 1. P( A ) = 1 P(A)
2. P() = 0 3. Si AB P(A) P(B)

4. 0 P(A) 1 A S
5. P(AB) = P(A) + P(B) P(AB) A,B S Todas estas propiedades se pueden demostrar fcilmente a partir de los axiomas que definen la probabilidad. Intntalo. Es posible que te puedan ayudar estos dibujos:

Actividad resuelta En un banco hay dos alarmas, A y B. En caso de atraco, la probabilidad de que se activen A, B o ambas a la vez es: P(A) = 075, P(B) = 085, P(AB) = 065 a) Calcula la probabilidad de que se active alguna de las dos. b) Calcula la probabilidad de que no se active ninguna. Resolucin
a) P(AB) = P(A) + P(B) P(AB) = 075 + 085 065 = 095 b) P( A B ) = P A B = 1 P(AB) = 1 095 = 005

10

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -11-

Actividades propuestas 4. En una ciudad hay dos peridicos A y B. Se sabe que los porcentajes de ciudadanos que leen A, B o los dos son, 50 %, 45 % y 20 %. a) b) c) d) Halla la probabilidad de ser lector de algn peridico. Halla la probabilidad de leer slo uno de ellos. Halla la probabilidad de leer los dos. Halla la probabilidad de no leer ninguno. 60 son hombres, de los que 5 son viudos. Hay 52 mujeres casadas. En total, 69 personas son solteras y 16 viudas

5. En una empresa hay 150 trabajadores. Se sabe que:

Designa con su inicial cada suceso. Con estos datos, a) Confecciona una tabla de doble entrada Se elige una persona al azar en la empresa. a) b) c) d) e) 4.3 Calcula P(H), P(M), P(S), P(C), P(V) Calcula la probabilidad de que sea una mujer casada. Calcula la probabilidad de que sea una mujer o que sea una persona casada. Sabemos que la persona elegida es mujer. Cul es la probabilidad de que est casada?. La persona elegida est casada. Cul es la probabilidad de que se trate de una mujer?. Probabilidad condicionada

Al contestar a las preguntas d) y e) de la actividad anterior, nos encontramos con que se nos da una condicin previa que ya se cumple; estamos hablando de probabilidad condicionada, ya que la probabilidad de que la persona est casada no es la misma sin poner ninguna condicin (tenemos 150 posibilidades), que imponiendo la condicin de que sea mujer (hay 90 mujeres). El nmero que asignamos como probabilidad a un suceso vara segn de la informacin que tenemos sobre l. En el momento en que tenemos ms informacin, el nmero de casos posibles es ms reducido y la probabilidad aumenta. Dados dos sucesos A y B, llamamos suceso A condicionado al suceso B a aquel suceso que se verifica cuando se verifique A sabiendo que ya se ha verificado B. Se escribe A/B.

Tienes que distinguir claramente cundo se est hablando de AB de cundo se habla de A/B: la diferencia fundamental consiste en que: si se considera AB, los casos posibles son todos los del espacio muestral si se trata de A/B, sabemos que se ha verificado ya el suceso B, luego los casos posibles son slo los de B. 11

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -12-

Se llama probabilidad del suceso A condicionada al suceso B a:


P ( A / B) = P ( A B) P ( B)

Se trata de una medida de probabilidad, pues cumple los tres axiomas citados (comprubalo!). Consecuencia: Puesto que tambin es P(B / A) = P(B A) P( A)

y AB = BA, se deduce que P(AB) = P(A/B) P(B) = P(B/A) P(A) Dos sucesos A y B se llaman independientes si P(A/B)=P(A), P(B/A)=P(B) Luego A y B son independientes si y slo si P(AB) = P(A) P(B)

Nota importante: Has de tener en cuenta que hablaremos de probabilidad condicionada cuando se realice ms de un experimento aleatorio. Actividades resueltas Un escritor presenta un libro a dos editores distintos. La probabilidad de que se lo acepte cada uno de ellos es, respectivamente, 05 y 04. Calcula la probabilidad de que: a) Lo acepten los dos. Resolucin
Si llamo: A: "Un editor lo acepta" y B: "El otro editor lo acepta", estos sucesos son independientes entre s. Adems s: P(A) = 05, P(A') = 05 P(B) = 04, P(B') = 06 a) Me piden P(A y B) = P(A) P(B) = 05 04 = 02 b) Me piden P(A' y B') = P(A') P(B') = 05 06 = 03 c) Me piden P(A o B) = P(A) + P(B) P(A y B) = 05 + 04 02 = 07. Tambin puede ser: P(A o B) = 1 P(A' y B') = 1 03 = 07

b) Lo rechacen los dos.

c) Al menos uno lo acepte.

Actividades propuestas
6. Las academias A y B preparan a los opositores para la Polica Local. De 120 aspirantes preparados por la academia A, aprobaron 90. El total de suspensos fue de 100 de los 400 presentados entre ambas academias. Estudia la posible dependencia o independencia de los sucesos aprobar y suspender respecto a estudiar en cada una de las dos academias. 7. Tres mquinas A, B y C producen el 50%, 30% y 20% respectivamente de un tipo determinado de artculo. Los porcentajes de artculos defectuosos fabricados por cada una de las mquinas son respectivamente el 3%, 4% y 5%. Toda la produccin se mezcla al final del da. Cul es la probabilidad de que, al seleccionar un artculo al azar, sea defectuoso? 8. En una universidad en que la poblacin estudiantil es muy numerosa, y basndose sobre la experiencia de aos anteriores, se admite que el 25% de los estudiantes son vegetarianos; entre los vegetarianos, el 58% llevan gafas; entre los no vegetarianos, el 62% llevan gafas. Calcular el porcentaje de estudiantes con gafas en esta universidad.

12

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -13-

5
5.1

UTILIZAMOS EL SUCESO CONTRARIO


Tenemos dos experimentos

Lucas es un hipocondraco que considera que tiene todas las enfermedades. Cuando cumpli los 40 aos, recopil informacin en la que se deca que el 10 % de los mayores de 40 aos tena la enfermedad A y que el 15 % la enfermedad B. a) Cul es la probabilidad que tena Lucas de padecer ambas enfermedades? b) Y la de no padecer ninguna? c) Qu probabilidad tena de padecer alguna? Resolucin El espacio muestral (que podra obtenerse mediante un diagrama en rbol) es: E = {AB, AB, AB, AB} Los sucesos A y B son independientes entre s, ya que tener una enfermedad no depende de la otra. a) Nos piden P(AB) = P(A) P(B) = 010 015 = 0015 = 15 % b) Nos piden P(AB) = P(A) P(B) = 090 085 = 0765 = 765 % c) Nos piden P(AB) El suceso AB = (AB) (AB) (AB) P(AB) = P(AB) + P(AB) + P(AB) Pero tambin AB = A 'B' P(AB) = 1 P(AB)
Por tanto, es ms cmodo utilizar la 2 opcin, mediante la probabilidad del suceso contrario. P(AB) = 1 P(AB) = 1 0765 = 0235 = 235 %

5.2

Tenemos tres experimentos

Cuando Lucas cumpli los 50, se volvi ms raro an y se enter de que el 30 % de los mayores de 50 aos padecan la enfermedad A, el 25 % la enfermedad B y el 20 % la enfermedad C. a) Cul es la probabilidad que tena Lucas de no padecer ninguna enfermedad? b) Qu probabilidad tena de padecer alguna? Resolucin
En este caso el espacio muestral es: E = {ABC, ABC, ABC, ABC, ABC, ABC, ABC, ABC} a) Nos piden P(ABC) = P(A) P(B) P(C) = 070 075 080 = 042 = 42 % b) Nos piden P(ABC) En este caso, el suceso ABC = (ABC) (ABC) (ABC) ..... ; es decir, est formado por 7 sucesos; por tanto, es ms sencillo volver a utilizar el suceso contrario ya que: ABC = A'B'C' P(ABC) = 1 P(ABC = 1 042 = 068 = 68 %

Resumen
Si en algn problema te encuentras con la frase alguna, suele ser ms conveniente utilizar la probabilidad del suceso contrario, ninguna. En cualquier caso, puede ser conveniente construir previamente el diagrama de rbol para obtener todos los sucesos.

13

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -14-

Actividad resuelta Las probabilidades de que un esposo y una esposa estn vivos dentro de 20 aos estn dadas por 08 y 0 9 respectivamente. Hallar la probabilidad de que en 20 aos a) Ambos vivan b) Ninguno de ellos viva c) Al menos viva uno Resolucin Tenemos dos sucesos independientes entre s: H: El esposo vive ..., P(H) = 08; M: La esposa vive ..., P(M) = 09 a) P(H M) = P(H) P(M) = 08 09 = 072 b) P(H M) = P(H) P(M) = 02 01 = 002 c) P(H M) = P(H) + P(M) P(H M) = 08 + 09 072 = 098, o tambin: P(H M) = 1 P(H M) = 1 002 = 098 Para poder contestar a las preguntas anteriores, puede ser interesante construir un diagrama en rbol: Suceso M 09 H 08 01 M M 02 H 01 M Actividades propuestas 9. Un ordenador personal est infectado por un virus y tiene cargados dos programas antivirus que actan independientemente el uno del otro. El programa P1 detecta la presencia del virus con una probabilidad del 90% y el programa P2 lo detecta con una probabilidad de 08. Cul es la probabilidad de que el virus sea detectado? 10. Se reparten, al azar, cinco premios entre cuatro mujeres y. seis hombres. Calcula la probabilidad de que: a) Las cuatro mujeres resulten premiadas. b) Se premie a alguna mujer. H M NOTA: Si en vez de dos sucesos fueran tres o ms, el proceso es idntico. 09 H M H M HM

14

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -15-

DEL DIAGRAMA EN RBOL A LA PROBABILIDAD TOTAL

Antes de que leas el desarrollo de este punto, has de tener en cuenta que, como sucede en muchas ocasiones, se te ofrecen diferentes estrategias de resolucin de problemas relacionados con la probabilidad condicionada. Tu tarea ser tomar la decisin que creas ms adecuada: diagrama, tabla de contingencia, aplicacin de frmulas, .. 6.1 El diagrama en rbol V = {alumno vegetariano} P(G/V) = 058 P(G/no V) = 062 G 058 V 025 042 No G G 075 No V 038 No G Observa que si hubieras querido poner en la 1 columna la caracterstica G, no hubieras podido completar la probabilidad correspondiente porque no se da en los datos del problema. Este detalle es muy importante para situaciones futuras en las que debas decidir como construir el diagrama. Como lo que se quiere calcular es P(G), a partir del diagrama se deduce que: P(G) = 025 058 + 075 062 = 061 O, lo que es lo mismo, que P(G) = P(V) P(G/V) + P(no V) P(G/no V) Lo cual es totalmente lgico, pues estamos diciendo que P(G) = P(GV) + P(GnoV) 062 G={alumno con gafas}

Veamos qu ocurre en la actividad propuesta n 8: Llamamos: P(V) = 025 P(no V) = 075 Tendremos las siguientes probabilidades:

El diagrama de rbol que habrs construido es el siguiente:

15

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -16-

Lo que hemos hecho ha sido aplicar el Teorema de la probabilidad total. 6.2 Teorema de la probabilidad total

Se dice que {A1,A2,...An} es una particin del conjunto A si


n

A
i =1

=A

Ai Aj = ij

Si {Hi}i=1,...,n es una particin de P ( A ) =

P( A / H ) P( H )
i i i =1

Puedes intentar demostrarlo a partir de los axiomas y propiedades ya demostradas (fjate que los conjuntos AHi no tienen elementos en comn).

Actividad resuelta En una universidad existen tres facultades. En la Facultad A, el nmero de alumnos matriculados es de 400; en la B, 600; y en la C, 1000. Se sabe que el porcentaje de alumnos que suspenden en la Facultad A es del 25%; en la B, el 20% y en la C del 30%. Se elige al azar un alumno de esa universidad y se pide: a) Cul es la probabilidad de suspender? b) Cul es la probabilidad de aprobar? Resolucin
Tenemos los siguientes sucesos: A: El alumno es de la universidad A, B: El alumno es .. B, S: El alumno suspende, S: El alumno aprueba C: El alumno es ... C

Tambin conocemos estas probabilidades: P(A) =


400 1 600 3 = , P(B) = = , 2000 5 2000 10 P(S/B) = 020, P(C) = 1000 1 = (Ten en cuenta que el total son 2000) 2000 2

P(S/A) = 025,

P(S/C) = 030 1 3 1 025 + 020 + 030 = 5 10 2

a) Nos estn pidiendo P(S). Podemos aplicar el Teorema de la probabilidad total: P(S) = P(A) P(S/A) + P(B) P(S/B) + P(C) P(S/C) = = 005 + 006 + 015 = 036 = 36 % b) Nos estn pidiendo P(S). P(S) = 1 P(S) = 1 036 = 064= 64%.

16

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -17-

17

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -18-

Resolucin alternativa Con los datos del problema, construimos una tabla de contingencia: A S S Total 100 300 400 B 120 480 600 C 300 700 1000 Total 520 1480 2000

Y ahora podemos aplicar la definicin de probabilidad: P(S) = Actividades propuestas


11. El equipo directivo de cierta empresa del sector de la hostelera est constituido por 25 personas, de las que un 60% son mujeres. El gerente tiene que seleccionar a una persona de dicho equipo, para que represente a la empresa en un certamen internacional. Decide lanzar una moneda: si sale cara, selecciona a una mujer y si sale cruz, a un hombre. Sabiendo que 5 mujeres y 3 hombres del equipo directivo no hablan ingls, determina, justificando la respuesta, la probabilidad de que la persona seleccionada hable ingls. 12. Nuestro ordenador est infectado por un virus y tiene cargados tres programas antivirus que actan independientemente cada uno de los otros. El programa P1 detecta la presencia del virus con una probabilidad del 90%, el programa P2 lo detecta con una probabilidad de 08 y la probabilidad de que lo detecte el programa P3 es 3/4. Cul es la probabilidad de que el virus no sea detectado? Nmero de alumnos suspensos 520 = = 036 = 36 % Nmero total de alumnos 2000

6.3

Teorema de Bayes

Vamos a retomar la actividad propuesta 8:

En una universidad en que la poblacin estudiantil es muy numerosa, y basndose sobre la experiencia de aos anteriores, se admite que el 25% de los estudiantes son vegetarianos; entre los vegetarianos, el 58% llevan gafas; entre los no vegetarianos, el 62% llevan gafas.
Nos podemos plantear esta pregunta:

Un estudiante de la Universidad de la que ya conocemos el estudio lleva gafas. Cul es la probabilidad de que sea vegetariano? Resolucin 1
En el problema se nos pide calcular P(V/G). Construimos esta tabla de contingencia en la que suponemos que el nmero de estudiantes es 1000. V G G 145 105 V 465 285 Total 610 390

Total 250 750 1000 Tendremos: P(V G ) Nmero de vegetarianos con gafas 145 P(V/G) = = = 024 = 24 % P (G ) Nmero de alumnos con gafas 610

18

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -19-

Resolucin 2 Se nos pide que calculemos una probabilidad condicionada, P(V/G), pero conocemos las probabilidades con las condiciones inversas a las pedidas. Si construyes la tabla de contingencia asociada al diagrama de rbol que ya hemos visto: G V No V Total 025 058 075 062 061 No G 025 042 075 038 039 Total 025 075 1

La probabilidad de que sea vegetariano sabiendo que lleva gafas es:


P(V / G ) = 0'250'58 0'145 = 024 = 24 % 0'61 0'61

es decir, los casos posibles son los de G y los favorables, los de GV, con lo que podemos escribir P( V / G ) = P( V G ) P( V)P(G / V) = P(G ) P( V)P(G / V) + P( noV)P(G / noV)

Has utilizado, sin saberlo, el Teorema de Bayes: Si {Hi}i=1,...,n es una particin de , se verifica que

P( H i / A) =

P( A / H i ) P( H i ) = P( A)

P(A / H i ) P(H i )

P( A / H ) P( H )
k k k =1

Se puede demostrar a partir de los axiomas y propiedades de la probabilidad, as como el teorema de la probabilidad total. Para ello, recuerda que: P(AB) = P(A/B) P(B) P(BA) = P(B/A) P(A) AB = BA Este teorema pone de manifiesto la relacin entre las probabilidades P(Ai), llamadas a priori por conocerse antes de la ocurrencia del suceso B y las probabilidades P(Ai/B), obtenidas a posteriori, pues su clculo se realiza despus de contar con una informacin adicional suministrada por aquel suceso. Afortunadamente, hay muy pocas situaciones en las que la nica estrategia posible de resolucin sea la aplicacin del Teorema de Bayes.

Ejemplo Disponemos de tres urnas. La urna A contiene 6 bolas rojas y 4 negras, la B 3 rojas y 7 negras y la C, respectivamente 8 y 2. Elegimos una urna al azar y extraemos al azar una bola, que resulta ser roja. Cul es la probabilidad de que hayamos elegido la urna B? Resolucin mediante el teorema de Bayes
Tenemos este esquema:

Urna A
6r 4n

Urna B
3r 7n

Urna C
8r 2n

19

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -20-

Nos piden que hallemos P(B/r), ya que la bola ha salido roja. Sabemos las siguientes probabilidades: P(A) = P(B) = P(C) =
1 , 3 P(r/A) = 6 3 8 , P(r/B) = , P(r/C) = 10 10 10

Si aplicamos el teorema de Bayes, tendremos: P(B/r) =

P(r / B) P(B) P(r / B) P(B) = = P( r ) P(A) P(r/A) + P(B) P(r/B) + P(C) P(r/C) 3 1 3 3 10 3 = = 30 = 1 6 1 3 1 8 17 17 + + 30 3 10 3 10 3 10
NOTA: Recuerda que, como se mencion anteriormente, no es la nica estrategia de resolucin del problema.

Actividades propuestas
13. En una empresa hay 150 trabajadores. Conocemos los siguientes datos: 60 personas fuman 80 trabajadores son varones hay 30 mujeres fumadoras a) Cul es la probabilidad de que una persona elegida al azar sea una mujer fumadora? b) Y de que sea mujer? c) Se elige una persona al azar y es mujer. Cul es la probabilidad de que fume? d) Se elige una persona al azar. Cul es la probabilidad de que fume? 14. Suponiendo que la riqueza es independiente del sexo, calcular: a) Las probabilidades que faltan en la tabla Rico/a Europa Africa Total 008 040 Pobre Total 061 039

b) La probabilidad de que sabiendo que una persona no es pobre sea africana. c) La probabilidad de que una persona sea rica o europea. 15. De los crditos concedidos por un banco, un 42 % lo son para clientes nacionales, un 33 % para clientes de la Unin Europea y un 25 % para individuos del resto del mundo. De esos crditos, son destinados a vivienda un 30 %, un 24 % y un 14 % segn sean nacionales, de la UE o del resto del mundo. Elegido un cliente al azar, qu probabilidad hay de que el crdito concedido no sea para vivienda? 16. Un joyero compra los relojes a dos proveedores distintos. El primero le sirve el 60% de los relojes, de los cuales el 0,4% son defectuosos. El segundo le proporciona le resto, siendo defectuosos el 1,5%. Un da el joyero, al vender el reloj, observa que ste no funciona. Hallar la probabilidad de que el reloj provenga del primer proveedor.

20

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -21-

UNA ACTIVIDAD RESUMEN

En un pueblo de la montaa hay 1000 habitantes con las siguientes caractersticas: 600 hombres y 400 mujeres De los hombres usan Internet 150 y de las mujeres 300.

Un programa de TV escoge el citado pueblo para un concurso en el que se sortea un premio al azar. a) Qu probabilidad hay de que sea un hombre? b) Que probabilidad hay de que use Internet? c)Qu probabilidad hay de que sea un hombre internauta? d) Qu probabilidad hay de que sea un hombre o de que use Internet? e) Slo se sortea entre los que usan Internet. Qu probabilidad hay de que sea un hombre? Se sortean dos premios iguales entre todos los habitantes del pueblo. f) Qu probabilidad hay de que sean dos hombres? Resolucin Codificamos los sucesos: H: ser hombre, M: Ser mujer, I: Usa Internet,
150 = 025 = 25 %, 600 300 = 075 = 75 %, 400

I. No usa Internet

Escribimos las probabilidades que conocemos: P(H) =


600 = 060 = 60 %, 1000 P(I/H) = P(I/M) =

P(M) = 040 = 40 %,

Construimos una tabla de contingencia: I H M Total a) Nos piden P(H) = 60 % b) Nos piden P(I) = 450 = 045 = 45 % 1000 150 c) Nos piden P(HI) = = 015 = 15 % 1000 150 300 450 I 450 100 550 Total 600 400 1000

En las cinco primeras preguntas tenemos un solo experimento aleatorio: Se sortea un premio (Se nos da en la informacin inicial)

d) Nos piden P(HI) = P(H) + P(I) P(HI) = e) Nos piden P(H/I) =

P(H I) 0'15 15 = = = 0333.. = 3333 % P ( I) 0'45 45 Para la ltima pregunta tenemos dos experimentos aleatorios dependientes:

600 450 150 900 + = = 090 = 90 % 1000 1000 1000 1000

21

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -22-

f) Nos piden P(H1H2) = P(H1) P(H2/H1) =

600 599 036 = 36 % 1000 999

22

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -23-

TEMA 10: MUESTREO


El empleo de encuestas es uno de los mtodos de investigacin ms utilizados en la actualidad. La realidad es difcilmente abarcable en su totalidad; por ello, se hace necesario seleccionar una parte lo ms pequea posible, pero representativa, del total, en la que sea posible medir las caractersticas deseadas. El muestreo estadstico es el instrumento que la Matemtica ha generado para tal fin. La muestra de estudio ha de ser lo ms pequea posible por el tiempo y costes; adems, el aumento de datos no siempre acarrea una certeza considerablemente mayor, pues es ms importante que los datos sean representativos de la poblacin que se desea estudiar. Por ejemplo, si se desea estimar la altura media de los hombres de 20 aos, no es lgico preguntar exclusivamente, a los individuos que salen de presenciar un partido de baloncesto, pues, aunque no es necesario ser alto para que guste el baloncesto, es ms probable que el baloncesto guste a los altos. Esta consideracin pone de manifiesto la necesidad de estudiar cmo hay que seleccionar una muestra para que sea representativa. Parece que el azar debe jugar un papel importante en la eleccin. Adems de algunos conocimientos estadsticos, necesitamos conocer herramientas imprescindibles en la toma de decisiones relativas a determinadas poblaciones basndose en la informacin obtenida por una muestra. A esta cuestin dedicaremos este tema y el siguiente y que se basa en una rama de la Estadstica llamada Estadstica inferencial, a establecer conclusiones sobre determinados parmetros poblaciones utilizando la informacin obtenida por una muestra representativa.

UNA ACTIVIDAD PARA TODO EL TEMA

En segundo de Bachillerato hay 80 alumnos que provienen de cuatro zonas prximas al centro escolar. Las zonas y el nmero de alumnos de cada una de ellas se representan en la siguiente tabla: Zona B Zona A 36 alumnos 8 alumnos

Zona C 24 alumnos

Zona D 12 alumnos Como trabajo de clase, nos proponemos hacer un estudio estadstico con el fin de determinar algunas caractersticas socioeconmicas de las familias de todo segundo. Para ello decidimos obtener datos de una muestra de 20 alumnos, a los que haremos las siguientes preguntas: a) Hay vdeo en tu casa? b) Tenis ordenador? c) Qu nota sacaste en Matemticas?

23

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -24-

Comentarios Si bien para poder contestar a preguntas como las anteriores basta con conocer los conceptos estadsticos ms bsicos, para poder extraer conclusiones harn falta conceptos y estrategias un poco ms complejas para las que necesitaremos recordar los contenidos sobre la distribucin normal. Los dos tipos de problemas que resuelven las tcnicas estadsticas son: estimacin y contraste de hiptesis. En ambos casos se trata de generalizar la informacin obtenida en una muestra a una poblacin. Estas tcnicas exigen que la muestra sea aleatoria. En la prctica rara vez se dispone de muestras aleatorias, por la tanto la situacin habitual es la que se esquematiza en la figura:

Entre la muestra con la que se trabaja y la poblacin de inters, o poblacin diana, aparece la denominada poblacin de muestreo: poblacin (la mayor parte de las veces no definida con precisin) de la cual nuestra muestra es una muestra aleatoria. En consecuencia la generalizacin est amenazada por dos posibles tipos de errores: error aleatorio que es el que las tcnicas estadsticas permiten cuantificar y crticamente dependiente del tamao muestral, pero tambin de la variabilidad de la variable a estudiar y el error sistemtico que tiene que ver con la diferencia entre la poblacin de muestreo y la poblacin diana y que slo puede ser controlado por el diseo del estudio.

24

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -25-

Datos reales de las 80 familias


V O N
1 2

V O N
45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80

1 1 0 1 1 1 1 1 0 1 1 0 1 1 1 1 0 0 1 1 1 1 0 1 1 1 1

0 0 0 1 0 0 0 0 0 1 0 0 0 0 1 0 0 0 1 0 1 1 1 0 0 1 0 1 0 0 0 1 0 0 0 0 1 0 1 1 0 0 0

6 5 3 5 2 1 5 2 8 5 4 6 4 5 4 5 6 6 9 6 4 8 4 6 9 5 6 9 4 6 5 6 6 2 7 6 5 6 7 4 8 6 5

1 1 1 1 0 1 0 1 1 0 1 1 1 0 1 1 1 0 1 0 1 1 0 0 0 1 1 0 1 1 1 0 1 1 0 1

1 0 0 0 0 0 1 0 1 0 0 1 1 1 0 1 0 0 0 1 0 0 0 0 1 0 1 0 1 0 0 1 0 0 1 0

5 4 6 8 7 5 2 9 10 3 6 4 5 3 5 4 6 2 7 6 4 5 9 10 5 4 9 7 6 3 6 5 7 5 1 7

Seguimos los siguientes criterios: V: Poseen vdeo O: Tienen ordenador N: Nota de Matemticas 1: S 0: NO

3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44

Porcentajes de la poblacin: Vdeos (V): 56/80 = 70 %

Ordenadores (O): 26/80 = 325 % Media y desviacin tpica de las notas: Notas (N): = 55, = 204

ZONA A

1 1 0 1 0 1 1 1 1 0 1 1 0 0 1

25

ZONA B

ZONA D

1 29 0

ZONA C

0 10

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -26-

MUESTREO

Suponiendo que una empresa quiere lanzar al mercado un nuevo telfono mvil y que desea saber la aceptacin que tendr, realiza un estudio sobre la opinin de todos los posibles compradores. Ahora bien, conocer estos datos es prcticamente imposible adems de econmicamente muy costoso. Por ello, bastar contactar con un pequeo grupo de la poblacin llamada muestra, de tal forma que, a partir de la informacin que se obtenga de ella, se extraern consecuencias para toda la poblacin. La estadstica inferencial se encarga de extraer conclusiones acerca de la poblacin a partir de los resultados obtenidos de una muestra. A partir de la informacin obtenida de la muestra, se deben obtener las conclusiones acerca de la poblacin de la forma ms coherente posible y, adems, con cierto grado de confianza. Por ejemplo, si en la muestra el 80 % de los preguntados estn dispuestos a comprar el nuevo telfono, se puede deducir que el 80 % de los posibles compradores se decidirn a hacer lo mismo? Obviamente no, puesto que depende de las caractersticas de la muestra, es decir, de cmo se haya elegido la muestra y el grado de confianza que manifieste. Por tanto, es muy importante que la muestra sea representativa de la poblacin. Por ejemplo si el nuevo telfono mvil que la empresa pretende lanzar al mercado tiene un precio en torno a los 600 , y en la muestra seleccionada la mayora de los encuestados son jvenes entre 12 y 18 aos, no parece muy razonable que se decidan a comprarlo. Las conclusiones que se puedan deducir de esa informacin muestral no tendrn mucho valor y seguramente sern errneas. Para evitar este tipo de inconvenientes y que las conclusiones sobre la poblacin sean fiables, es fundamental que el proceso de seleccin de la muestra sea el adecuado. Es decir, que la muestra sea representativa y aleatoria. Si la muestra elegida no es representativa de la poblacin se dice que tiene sesgo porque est desviado de nuestro objetivo. El sesgo proviene de favorece la eleccin de unos elementos de la muestra en detrimento de otros. A continuacin se van a describir los distintos tipos de muestreos, con sus ventajas e inconvenientes, utilizando los datos del problema inicial. 2.1 Trminos habituales en el muestreo

Poblacin. Es el conjunto total de individuos susceptibles de poseer la informacin buscada. Aunque se utilicen las palabras poblacin e individuo, no se refiere exclusivamente a personas: por ejemplo, la poblacin puede estar formada por todos los rboles de un bosque. Muestra. Es la parte de la poblacin en la que se miden las caractersticas estudiadas. El nmero de individuos de la muestra se llama tamao. Muestreo. Es el proceso seguido para la extraccin de una muestra. El muestreo puede ser probabilstico o no. Nosotros nos referiremos siempre al probabilstico, que es aquel en el que la muestra se elige por mtodos aleatorios; adems, permite acotar el posible error y fijar la fiabilidad del trabajo. Encuesta. Es el proceso de obtener la informacin buscada entre los elementos de la muestra. Parmetro. Es la caracterstica que se estudia de la poblacin. En este curso, normalmente, estudiaremos la media. La informacin que contiene la muestra sobre el parmetro se obtiene construyendo un estimador del parmetro, que depender de la muestra elegida.

26

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -27-

2.2

Mtodos de muestreo

En el mundo probabilstico no se emplea el azar, sino el criterio del investigador. Este tipo de muestreo se utiliza con frecuencia en el mundo periodstico para conocer la opinin de los oyentes o lectores sobre una cuestin de actualidad. Suele presentar grandes sesgos y es poco fiable. El muestreo probabilstco puede hacerse de diversas maneras: Aleatorio simple. Sistemtico. Estratificado

En este tema trabajaremos con el muestreo aleatorio simple. Siguiendo con nuestra idea inicial de realizar una encuesta a 20 de los 80 alumnos de Bachillerato, veamos cmo podemos elegir la muestra. Lo ideal es obtenerla por procedimientos aleatorios; no vale hacerlo a ojo, ni preguntar a los 20 primeros que lleguen a clase, ni a los 20 ms altos, ni a 20 chicas, etc. El mtodo aleatorio empleado puede ser: Muestreo aleatorio simple Esquemticamente se realiza de la siguiente manera: se escriben los nombres de los 80 alumnos en 80 papeletas; se doblan dichas papeletas; se meten en una urna; una persona toma, una a una, 20 papeletas. Preguntaremos a los 20 alumnos correspondientes. (El mtodo sera el mismo si en vez de nombres asignamos a cada alumno un nmero del 1 al 80) Este mtodo de muestreo debe satisfacer dos criterios: 1. Cada individuo debe tener la misma probabilidad de ser elegido para la muestra. Esto es, la probabilidad de cualquier alumno debe ser 1/80. 2. La seleccin de un individuo no debe afectar a la probabilidad de que sea seleccionado otro cualquiera. Esto implica que la eleccin debera hacerse con reemplazamiento; aunque ello comporte que algn alumno pueda ser elegido ms de una vez. Nota: Si la eleccin se hace sin reemplazamiento, la probabilidad de eleccin del primer alumno es 1/80; la del segundo, 1/79; la del vigsimo 1/61. Obviamente, las probabilidades son distintas; as, el proceso deja de ser aleatorio simple. Muestreo sistemtico Para realizar el muestreo sistemtico se ordenan previamente los individuos de la poblacin; despus se elige uno de ellos al azar; a continuacin, a intervalos constantes, se eligen todos los dems hasta completar la muestra. En nuestro caso, hay que elegir uno de cada 4 (80:20 = 4); podemos, pues, sortear un nmero del 1 al 4. En el supuesto de que saliera el 3, la muestra elegida estara formada por los individuos 3, 7, 11 .... 75, 79, que hacen un total de 20. Anlogo resultado se obtendra si sorteramos el primer nmero entre los 80. Si, por ejemplo, saliese el 29, la muestra sera 29, 33, 37 ..., 77, 1, 5 .... 25. Nota: Este mtodo vulnera los criterios de aleatoriedad, pues una vez elegido el primer individuo, los dems tienen la probabilidad 1 o 0 de salir. Adems, si la poblacin de partida presenta algn tipo de regularidad, la muestra puede no ser representativa de ella.

27

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -28-

Muestreo estratificado (proporcional) Este tipo de muestreo divide la poblacin total en clases homogneas, llamadas estratos; por ejemplo, por grupos de edades, por sexo, por nmero de habitantes de las distintas poblaciones. Hecho esto, la muestra se escoge aleatoriamente en nmero proporcional al de los componentes de cada clase o estrato. En nuestro ejemplo, elegimos los alumnos proporcionalmente a sus zonas de procedencia: 9 de A, 2 de B, 6 de C y 3 de D. Nota: La mayora de las encuestas a personas se hacen por este tipo de muestreo estratificado: con proporcin de sexos, de edad, de municipios, etc. Seleccionada la muestra ya estamos en condiciones de comenzar el estudio con los datos reales de los 80 alumnos de la tabla del problema inicial. (Inicialmente, estos datos seran desconocidos.) Actividad resuelta a) Utiliza el mtodo aleatorio simple para obtener una muestra de 20 alumnos entre los 80 que se dan en la tabla de los datos reales. b) Para la muestra hallada, calcula el porcentaje de poseedores de vdeo y de ordenador, y su nota media en Matemticas. Compara tus resultados con los totales de la poblacin. Resolucin Aqu daremos una solucin particular; a ti te saldr otra muestra absolutamente distinta. (Aconsejamos que lo hagas con tus datos y que contrastes tus resultados con el nuestro.) Para elegir la muestra vamos a utilizar la calculadora. (La mayora de ellas dispone de una funcin que proporciona nmeros aleatorios.) Las teclas SHIFT y generan nmeros entre 0,000 y 0,999. Tomando las tres ltimas cifras, se tendran entre 000 y 999; si adems ignoramos los que salgan mayores de 80 podremos, con paciencia, obtener una muestra aleatoria. As, hemos obtenidos los siguientes nmeros: 43, 32, 44, 62, 47, 20, 20, 41, 17, 23, 78, 24, 36, 61, 63, 24, 27, 66, 22, 37 Notas Observa que algunos individuos han salido repetidos; por ejemplo, el 20, y el 24. En este caso sera ms representativo sustituir los elementos repetidos por otros, pero se vulnerara el mtodo aleatorio simple. En las encuestas profesionales, la poblacin est formada por muchos elementos, por tanto, la probabilidad de repeticin de individuos es prcticamente 0. Para todos y cada uno de los individuos seleccionados miramos en la tabla sus respuestas a las tres preguntas. Si alguno est repetido se contabiliza tantas veces como est; as, las respuestas de los nmeros 20 y 24 se cuentan dos veces cada una. Sumados los datos, se tiene que: Poseen vdeo (V): Poseen ordenador (O): Notas (N): 15/20 75 % 8/20 40 % x = 5,64 (s 1,71)

Curiosamente, todos los resultados han salido un poco ms altos que los reales.

28

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -29-

Actividades propuestas 1. Para el total de los 80 alumnos de la tabla de la actividad inicial, cmo elegiras una muestra de 16 alumnos por el mtodo de muestreo sistemtico? 2. En una ciudad se quiere hacer una encuesta para conocer el porcentaje de ciudadanos que aprueban la gestin del Ayuntamiento en cuestiones medioambientales (limpieza de calles, contaminacin, cuidado de parques, etc.). Se pretende que la muestra sea representativa por sexo y edad; para la edad se establecen tres estratos: 10 a 25 aos (jvenes), 25 a 60 aos (adultos) y mayores de 60. El nmero de personas de cada grupo es: 10 - 25, 3.000; 25 - 60, 8.500; mayores de 60, 2.500. Por sexo, la distribucin es: 6.800 hombres y 7.200 mujeres, que se suponen proporcionales a cada grupo de edad. Si el tamao de la muestra es de 500 personas, determina, redondeando si es necesario, el tamao muestral correspondiente a cada estrato.

29

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -30-

DISTRIBUCIN DE PROBABILIDAD DE LA MEDIA MUESTRAL

El resultado de la actividad resuelta anterior nos debe llevar a desconfiar (moderadamente) de las conclusiones obtenidas a partir de una muestra. Fjate que si nos atenemos al resultado hallado, el 75 % de los alumnos tiene vdeo de una familia con tres o ms hermanos: la muestra ha dado un 5 % ms que el valor real. Podramos haber obtenido otros resultados. De hecho, por azar, podramos haber seleccionado una muestra de 20 individuos sin vdeo (aunque la probabilidad de que tal suceso se de sea prcticamente cero). As pues, nunca podemos tener la seguridad de que la muestra elegida sea realmente representativa. Adems, piensa que en la prctica no podemos comparar el resultado con el real, por la sencilla razn de que, si conocieras el dato autntico, sera absurdo hacer una encuesta. No obstante, las medias muestrales se comportan estadsticamente bien, y siguen leyes perfectamente previsibles. Esto nos permitir hacer inferencias precisas a partir de ellas; incluso determinar el riesgo que asumimos al hacerlas. La idea de inferencia es la de deduccin arriesgada. Estas inferencias se hacen a partir de los parmetros muestrales (estos parmetros suelen llamarse estimadores). Los estimadores ms utilizados son la media muestral (la que utilizaremos normalmente), o la proporcin muestral. Ejemplo Se quiere conocer el tiempo de conexin a Internet de los usuarios que utilizan un mismo servidor. Para obtener informacin sobre el tiempo medio, m, de conexin se pregunta a 50 personas sobre su tiempo de conexin y se calcula la media x de las respuestas. Coinciden ambos valores? Si se pregunta a otras 50 personas, coincidir la nueva media con la antigua? Ambas preguntas, y otras relacionadas con ellas, pueden contestarse utilizando la idea de distribucin muestral que refleja el comportamiento del estimador (en este caso la media), al tomar distintas muestras. La distribucin de un estimador al tomar muestras de tamao n en una poblacin se llama distribucin muestral. Estas distribuciones se comportan de forma muy semejante a una distribucin que ya debes conocer: la distribucin normal. Antes de comenzar con la distribucin muestral vamos a recordar el trabajo con la normal. 3.1 Repaso de la distribucin normal (lectura comprensiva)

La mayor parte de las variables aleatorias continuas, tienen una distribucin de probabilidad que acumula muchos individuos en los valores centrales, pero el nmero de stos va decreciendo segn se aleja la variable en cualquiera de los dos sentidos. Lo normal es que haya pocos individuos con valores extremos, ya sea por debajo o por encima de la media, y multitud de individuos que tomen valores intermedios, prximos a la media. La apariencia grfica de estas distribuciones es una curva, ms o menos simtrica, en forma de campana. Mientras Karl Friedrich Gauss estudiaba los errores que se producen al medir una determinada magnitud, comprob que stos se distribuyen segn una determinada funcin, de la cual dedujo la frmula y cuya grfica tiene forma de campana. Por esto se conoce con el nombre de campana de Gauss. 30

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -31-

Si la grfica de la funcin de densidad de una variable aleatoria continua se ajusta a una campana de Gauss, se dice que la variable presenta una distribucin normal. Las caractersticas esenciales de una distribucin normal son la media y la desviacin tpica, de modo que las variables que presentan una distribucin normal de media y desviacin tpica , se representan por N(,). La campana de Gauss o curva normal es una curva simtrica con un mximo en x=, puntos de inflexin en x = y una asntota horizontal en y = 0, es decir, el eje de abscisas.

Para cada par (,) existe una campana de Gauss distinta, pero todas ellas verifican: El rea bajo la curva entre dos abscisas cualesquiera representa la probabilidad de que la variable tome algn valor entre esas dos abscisas. Para obtener la probabilidad sera necesario conocer el rea correspondiente. Para ello es necesario recurrir a tablas ya construidas mediante tcnicas numricas, pero no es posible tener una tabla para cada uno de los posibles valores de y . Al final del tema dispones de la tabla correspondiente a una distribucin normal N(0,1). Por ser una distribucin normal, el rea bajo una curva normal cualquiera es 100. Esta rea se distribuye, expresando la probabilidad en tantos por ciento, del siguiente modo:

El rea bajo la curva entre los dos puntos de inflexin vale 06826, es decir, que el 6826% de los individuos toma valores centrales en una distribucin normal. Actividad resuelta

El rea bajo la curva entre 2 y + 2 es 09545, esto es, slo el 5 % de los individuos presenta un valor de la variable que difiere de la media dos veces ms que la desviacin tpica.

El rea bajo la curva entre 3 y + 3 es 09973 o, lo que es lo mismo, que prcticamente la totalidad de los individuos tiene un valor de la variable que difiere de la media, de tres veces la desviacin tpica.

El cociente intelectual de los 5600 alumnos de 1 de Bachillerato de una provincia se distribuye segn una distribucin normal N(112,6). Calcula aproximadamente cuntos de ellos tienen: a) ms de 112; Resolucin Si recordamos los porcentajes correspondiente a una curva normal en este caso tendramos: b) entre 106 y 118; c) menos de 100

31

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -32-

a) P(x > 112) = 50 %, ya que la media es 112. Habr unos 2800 alumnos que cumplan esta condicin. b) P(106 < x < 118) = 6826 %. Habr 06826 5600 3823 alumnos c) P(x < 100) = 100 % ( 50 + 3413 + 1359) = 228 %. Habr 00228 5600 128 alumnos. 3.2 Clculo de probabilidades en una distribucin normal. Manejo de tablas.

Clculo de probabilidades en una distribucin normal N(0,1) Sea Z una variable que sigue una distribucin normal N(0, l). Veamos con ejemplos, y en orden creciente de dificultad, los casos ms frecuentes que se suelen presentar. (Utilizar la Tabla del final del tema con los valores de (z) (Z) para 0 z 3'49) 1. p(Z 135) La probabilidad pedida es igual al rea sombreada (figura de la izquierda), y se encuentra directamente en la tabla solo con buscar 13 en la columna y 5 en la fila; su interseccin nos da la probabilidad p(Z 135) = 09115 Esto quiere decir que el 9115 % de las observaciones se distribuye entre y 135. 2. p(Z 135) La probabilidad pedida es igual al rea sombreada de la figura de la izquierda. La tabla solo proporciona probabilidades para valores de Z positivos. Pero teniendo en cuenta la simetra de la funcin de densidad, y que el rea encerrada por toda la curva es igual a la unidad, resulta: p(Z135) = p(Z>135) = 1 p(Z 135) = 1 09115 = 00885 3. p(05 Z 15) La probabilidad pedida es el rea sombreada de la figura de la izquierda. Su clculo lo realizaremos restando al rea mayor la menor: p(05 Z15) = p(Z 15) p(Z 05) = 09332 06915 = 02417

32

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -33-

4. p(18 Z 03) La probabilidad pedida es igual al rea sombreada de la figura de la izquierda, y como consecuencia de la simetra de la funcin de densidad se tiene: p(18 Z 03) = p(03 Z 18) = p(Z 18) p(Z 03) = 09641 06179 = 03462 5. p(03 Z 135) La probabilidad pedida es igual al rea sombreada de la figura de la izquierda: p(03 Z 135) = p(Z 135) p(Z 03) = p(Z 135) p(Z > 03) = p(Z 135) [1 p(Z 03)] = 09115 (1 06179) = 09115 03821 = 05284 Lo que quiere decir que el 5284 % de las observaciones se encuentran entre 03 y 135. Cualquier otro caso que se pueda presentar cabe reducirlo, adecuadamente, a los que acabamos de exponer. Clculo de probabilidades en una distribucin normal N(,) Para calcular probabilidades en una distribucin normal cualquiera no podemos utilizar directamente las tablas. Ahora bien, si X es una variable aleatoria de parmetros y , podemos realizar las siguientes transformaciones: X+ X 1 Resultando que la nueva variable aleatoria Z=

X 1 X

tiene media 0 y desviacin tpica 1, y se llama variable aleatoria tipificada. Tenemos una N(0,1). NOTA: Si en una distribucin continua, nos piden, por ejemplo, la probabilidad de que una persona mida exactamente 170 cm, la respuesta estricta sera ninguna. Interpretaremos, por tanto que medir 170 cm significa medir entre 1695 cm y 1705 cm. Es decir: P(X = 170) = P(1695 X 1705) Actividades resueltas 1. En una N(6,4), calcula las probabilidades: a) P(X 12) Resolucin
12 6 a) P(X 12) = P Z = P(Z 15) = (15) = 09332 4

b) P(X 3)

c) P(5 X 8)

33

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -34-

3 6 b) P(X 3) = P Z = P(Z 075) = P(Z 075) = (075) = 07734 4 8 6 5 6 c) P(5 X 8) = P Z = P(025 Z 05) = p(Z 05) p(Z 025) = 4 4 p(Z 05) p(Z > 025) = p(Z 05) [1 p(Z 025)] = 06915 (1 05987) = 02902

2. El nmero de visitantes que diariamente acude a una atraccin se distribuye segn una normal N(2000,250). a) Halla la probabilidad de que un da determinado el nmero de visitantes no supere los 2100. b) Calcula la probabilidad de que un da cualquiera el nmero de visitantes sean ms de 1500
c) En un mes de 30 das, en cuntos das cabe esperar que el nmero de visitantes supere los 2210?

Resolucin
2100 2000 a) P(x 2100) = P z = P(z 04) = (04) = 06554 250 b) P(x > 1500) = P(z > 2) = P(z < 2) = (2) = 09772 2210 2000 c) P(x > 2210) = P z > = P(z > 084) = 1 (084) = 1 07995 = 02005 250 En un mes: 30 02005 = 6015 (6 das por mes)

3. Se ha aplicado a 300 alumnos de 1 ESO un test de agresividad y se ha observado que se distribuyen normalmente con media 30 y desviacin tpica 12. Se pide: a) Qu proporcin de alumnos tendr una puntuacin en dicho test entre 20 y 35? b) Cuntos alumnos tendrn una puntuacin superior a 42? Resolucin
Se trata de una distribucin N(30, 12). Calculemos las probabilidades pedidas: a) p(20 < X 35) = p( 083 < Z 042) = p(Z 042) [1 p(Z 083) = 06628 (1 07967) = 04595 Es decir, aproximadamente el 46 % de los alumnos tiene una puntuacin entre 20 y 35. b) p(X > 42) = 1 p(X 42) = 1 p(Z 1) = 1 08413 = 01587 Es decir, el 1587 % de los individuos tiene puntuaciones superiores a 42. El nmero de individuos se obtendr multiplicando el total de alumnos por la proporcin; es decir: 300 01587 = 48 alumnos.

34

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -35-

TABLA: FUNCIN DE DISTRIBUCIN DE LA NORMAL TIPIFICADA

z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 3.1 3.2 3.3 3.4

0 5000 5398 5793 6179 6554 6915 7257 7580 7881 8159 8413 8643 8849 9032 9192 9332 9452 9554 9641 9713 9772 9821 9861 9893 9918 9938 9953 9965 9974 9981 9987 9990 9993 9995 9997

1 5040 5438 5832 6217 6591 6950 7291 7611 7910 8186 8438 8665 8869 9049 9207 9345 9463 9564 9649 9719 9778 9826 9864 9896 9920 9940 9955 9966 9975 9982 9987 9991 9993 9995 9997

2 5080 5478 5871 6255 6628 6985 7324 7642 7939 8212 8461 8686 8888 9066 9222 9357 9474 9573 9656 9726 9783 9830 9868 9898 9922 9941 9956 9967 9976 9982 9987 9991 9994 9996 9997

3 5120 5517 5910 6293 6664 7019 7357 7673 7967 8238 8485 8708 8907 9082 9236 9370 9484 9582 9664 9732 9788 9834 9871 9901 9925 9943 9957 9968 9977 9983 9988 9991 9994 9996 9997

4 5160 5557 5948 6331 6700 7054 7389 7703 7995 8264 8508 8729 8925 9099 9251 9382 9495 9591 9671 9738 9793 9838 9875 9904 9927 9945 9959 9969 9977 9984 9988 9992 9994 9996 9997

5 5199 5596 5987 6368 6736 7088 7422 7734 8023 8289 8531 8749 8944 9115 9265 9394 9505 9599 9678 9744 9798 9842 9878 9906 9929 9946 9960 9970 9978 9984 9989 9992 9994 9996 9997

6 5239 5636 6026 6406 6772 7123 7454 7764 8051 8315 8554 8770 8962 9131 9279 9406 9515 9608 9686 9750 9803 9846 9881 9909 9931 9948 9961 9971 9979 9985 9989 9992 9994 9996 9997

7 5279 5675 6064 6443 6808 7157 7486 7794 8078 8340 8577 8790 8980 9147 9292 9418 9525 9616 9693 9756 9808 9850 9884 9911 9932 9949 9962 9972 9979 9985 9989 9992 9995 9996 9997

8 5319 5714 6103 6480 6844 7190 7517 7823 8106 8365 8599 8810 8997 9162 9306 9429 9535 9625 9699 9761 9812 9854 9887 9913 9934 9951 9963 9973 9980 9986 9990 9993 9995 9996 9997

9 5359 5753 6141 6517 6879 7224 7549 7852 8133 8389 8621 8830 9015 9177 9319 9441 9545 9633 9706 9767 9817 9857 9890 9916 9936 9952 9964 9974 9981 9986 9990 9993 9995 9997 9998

35

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -36-

3.3

Distribucin de la media muestral

Tenemos una muestra aleatoria de tamao n procedente de una poblacin normal con media y desviacin tpica . Elegida una muestra, hallaremos en ella la media x y la desviacin tpica s. Pero, hasta qu punto esas x y s sern representativas de la media y la desviacin tpica de la poblacin? Una muestra es representativa cuando describe acertadamente las caractersticas de la poblacin original: sus parmetros sern aproximadamente iguales a los de la poblacin. Pero cada muestra tendr una media y desviacin tpica que pueden ser diferentes a las de otra muestra; as pues, nunca podremos estar seguros de que los parmetros obtenidos en la muestra elegida sean buenos estimadores de los parmetros poblacionales; no obstante, siempre se cumplen dos caractersticas: 1. La media de las medias muestrales es igual a la media real de la poblacin; esto es, si en una poblacin de N elementos tomamos todas las muestras (Mi) de tamao n, y si x 1 es la media de la muestra M1, x 2 es la media de la muestra M2 ...., x i es la media de la muestra Mi .., entonces,
X= x 1 + x 2 + ... + x i + ... = n de muestras posibles

siendo X la media de las medias muestrales y la media de la poblacin.


2. La desviacin tpica de las medias muestrales vale

X =

Como consecuencia tenemos un resultado muy importante: La distribucin de las medias muestrales de tamao n, extradas de una poblacin normal N(,), se ajusta a una normal: N , n Estos resultados nos permiten cuantificar el valor de una media muestral con ayuda de la tabla normal. As, por ejemplo:

El 50 % de las medias muestrales ser inferior a la media de la poblacin.

El 6826 % de las muestras tendr una media perteneciente al intervalo , + n n

La interpretacin grfica de este hecho es

36

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -37-

Actividades resueltas El tiempo que tardan los clientes en ser atendidos en un banco sigue una distribucin normal de media 6 minutos y desviacin tpica de 2 minutos. Si se observa una muestra aleatoria de 20 clientes, cul es la probabilidad de que el tiempo medio que estn en el banco supere los 7 minutos? Resolucin El tiempo medio de permanencia en el banco, X , seguir una distribucin normal de media = 6 2 minutos y desviacin tpica X = = 0'45 minutos. n 20 X N(6,045) La probabilidad pedida es:
7 6 P (x > 7 ) = P Z > = P(Z > 222) = 1 P(Z 222) = 1 09868 = 00132 0'45 La probabilidad que nos piden es de un 132 %.

Actividades propuestas
3. Una muestra de 64 empleados de una empresa refleja que tienen una antigedad media de 14 aos con una desviacin tpica de 2 aos. Cul es la desviacin tpica de la distribucin de la media muestral? 4. Los ingresos mensuales de los becarios de una empresa siguen una distribucin normal con media 400 y desviacin tpica de 100 . En una muestra de 36 becarios, cul es la probabilidad de que los ingresos medios estn entre 370 y 410 ?

3.4

Teorema central del lmite

La distribucin de las medias muestrales es normal incluso en el caso de que stas procedan de poblaciones no normales, siempre que el tamao de la muestra sea suficientemente grande (n 30)

Esto podra demostrarse mediante el Teorema central del lmite. Si una muestra aleatoria de tamao n procede de una poblacin con media y desviacin tpica , en el caso de que el tamao de la muestra sea lo suficientemente grande (n > 30), la media muestral X se ajusta aproximadamente a una distribucin normal de media y desviacin tpica : n

X N , n

37

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -38-

Ejemplo La media y desviacin tpica poblacional de las notas de los 80 alumnos dados en la tabla inicial son: = 55, = 204. Entonces, las medias muestrales de tamao n = 30 se ajustan a la normal: 2'04 = N(55, 037) N 5'5, 30 As como la N(,) de la variable de partida, se tipifica mediante el cambio
Z= X

La N , , de las medias muestrales de tamao n, se tipificar haciendo n


Z= xi / n

Veremos la distincin en la actividad resuelta siguiente.

Actividades resueltas 1. En el ltimo ao, el peso de los recin nacidos en una maternidad se ha distribuido segn una normal de media = 3100 gramos y desviacin tpica = 150 gramos. a) Cul es la probabilidad de que un recin nacido pese ms de 3130 gramos? b) Qu distribucin seguirn las muestras de tamao 100 de recin nacidos? c) Cul ser la probabilidad de que la media de una muestra de 100 recin nacidos sea superior a 3130 gramos? Resolucin
Los pesos se ajustan a la normal N(3100,150). Si X es la variable peso, se tipifica por el cambio: X 3100 Z= 150 3130 3100 a) P(x > 3130) = P Z > = P(Z > 02) = 1 P(Z < 02) = 1 05793 = 04207 150 Esto es, ms de un 42 % de los bebs pesa ms de 3130 gramos. b) La media muestral ser x = 3100 gramos. La desviacin tpica de las medias muestrales de tamao 100, vale: X = 150 100 = 150 = 15 10

As pues, la distribucin muestral ser una normal N(3100,15) c) La normal N(3100,15) se tipifica haciendo: Z= X 3100 150

3130 3100 P( x > 3130) = P Z > = P(Z > 2) = 1 P(Z < 2) = 1 09772 = 00228 15 Por tanto, slo el 228 % de las muestras tendr una media por encima de 3130 gramos.

38

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -39-

2. El nmero de das de estancia de los enfermos de un hospital sigue una distribucin normal de media 81 das y desviacin tpica 9 das. Se selecciona una muestra al azar de 100 enfermos. a) Razona cul es la distribucin de la media muestral. b) Cul es la probabilidad de que la media muestral est comprendida entre 8 y 10 das? Resolucin 9 a) Como la muestra es de 100 individuos, la media muestral se ajusta a N 8'1, = N(81,3). 100 10 8'1 8 8'1 b) P(8 < x < 10) = P( x < 10) P( x < 8) = P Z < = PZ < 3 3 P(Z < 063) P(Z < 003) = 07357 P(Z > 003) =
07357 (1 P(Z < 003) = 07357 1 + 05120 = 02477.

3. La emisin de xido de nitrgeno de los vehculos de cierta marca sigue una distribucin normal con media m = 12 y desviacin tpica 04. Si tomamos una muestra de tamao 16 de las emisiones,cul ser la distribucin en el muestreo de la media muestral? Si se toma una nueva muestra de tamao 100, en qu caso ser ms precisa la media muestral? Resolucin
Como la distribucin de la poblacin X es N(12,04), la distribucin de la media muestral X tambin ser normal: 0'4 0'4 0'4 0'4 = N1'2, = = = 0'1 ; N , = N1'2, = N (1'2,0'1) 4 4 n 16 n 16
Si ahora se toma una muestra de tamao 100, la desviacin tpica de la nueva media muestral ser:

0'4 100

0 '4 = 0'04 10

As, el estimador construido con ms observaciones tiene una desviacin tpica menor y, por tanto, es ms preciso.

Actividades propuestas
5. Supongamos que la estatura media de las alumnas de segundo de Bachillerato es de 165 cm, con desviacin tpica 8 cm. a) Halla los parmetros de las medias muestrales de tamao n = 36 y n = 64. b) Cul es la probabilidad de que una muestra de 36 alumnas tenga una media de 167 o ms cm? Y de que una muestra de 64 alumnas supere esa misma medida? c) Tiene algo de extrao que una muestra de tamao 36 d una media de 170 cm? 6. La duracin (en aos) de un dispositivo electrnico sigue una distribucin normal de parmetros = 10 y = 2. Calcula la probabilidad de que un dispositivo electrnico dure ms de 12 aos.

39

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -40-

INTERVALO DE PROBABILIDAD PARA LA MEDIA MUESTRAL

La media muestral siempre se estudia como una variable continua; por tanto, la probabilidad de que una media muestral tome un valor concreto, por ejemplo x = 583333, vale cero. En consecuencia, slo podemos dar respuesta a preguntas del tipo: a) Cul es la probabilidad de que la media muestral sea menor o mayor que un valor dado? b) Cul es la probabilidad de que la media muestral est entre dos valores dados, esto es, que pertenezcan a un intervalo prefijado? Los valores de tales probabilidades dan la medida de la confianza que podemos tener en la obtencin de determinados resultados. Si bien nos dedicaremos al intervalo de confianza con ms detenimiento en el tema siguiente, en este tema vamos a hacer una pequea incursin. Al intervalo simtrico respecto de la media poblacional lo llamaremos intervalo de probabilidad. Como la distribucin de medias muestrales es normal de media X = y desviacin tpica , se tendr, por ejemplo, que X = ; esto es, N , n n P X+ = 06826 n n P 2 X+2 = 09545 n n P 3 X+3 = 09973 n n
probabilidades correspondientes a intervalos de radio una, dos o tres desviaciones tpicas. El resto de las muestras, esto es, el 3174 %, el 455 % o el 027 %, tendrn una media menor o mayor que los extremos de los intervalos indicados, respectivamente. (Lo puedes ver de forma grfica en el repaso sobre la distribucin normal) En general, el 100 (1 ) % de las muestras de tamao n tendr una media comprendida entre

Z / 2

y + Z / 2

siendo /2 el valor de probabilidad que queda a cada lado del intervalo. O lo que es lo mismo, la probabilidad de que la media muestral est entre esos dos valores es 1 :

P Z / 2 = 1 X + Z / 2 n n

40

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -41-

Al intervalo Z / 2 se le llama , + Z / 2 n n intervalo de probabilidad para la media.

El valor es una medida del riesgo que asumimos, y 1 es el nivel de confianza que tenemos de que la media muestras pertenezca al intervalo dado. As, si = 005, el 95 % de las muestras tendrn una media comprendida entre Z 0'025 pues /2 = 0025. n y + Z 0'025 n

El 5 % restante tendr una media menor o mayor que esos valores (un 25 %, menor; otro 25 %, mayor). Esto significa que el 975 % (25 + 95 = 975) de las muestras tendr una media inferior a + Z 0'025 n Este ltimo dato es el que nos permite determinar que Z0025 = 196, pues se es el valor de Z que cumple que P(Z < Z0025) = 0975 como puedes comprobar en la tabla normal tipificada. En general, el valor de Z/2 es aquel que deja por debajo de l una probabilidad de 1 valores se determinan con ayuda de la tabla normal tipificada. Niveles de confianza usuales
Porcentaje Z/2 6826 1 90 1645 95 196 9544 2 99 2575 9974 3 . Estos 2

Ejemplo
La media y desviacin tpica de las notas del ltimo examen de los 80 alumnos considerados de la tabla inicial son = 55 y = 204; entonces, el 6826 % de las muestras de tamao 20, extradas de esa poblacin, tendrn una media perteneciente al intervalo

2'04 2'04 5'5 = (513,587) ,5'5 + 20 20


Esto es, la probabilidad de que la media de la muestra, x , est entre 513 y 587 es 06826:

41

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -42-

P(513 < x <587) = 06826 Anlogamente, el 9544 % de las muestras de tamao 36, extradas de esa poblacin, tendrn una media perteneciente al intervalo 2'04 2'04 5'5 2 = (482,618) ,5'5 + 2 30 30 Esto es, para cualquier muestra de tamao 36, su media, x , estar entre 482 y 618, con una probabilidad del 9544 %: P(482 < x < 618) = 09544

42

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -43-

Actividad resuelta Halla los intervalos de probabilidad con una confianza de 09, 095 y 099, para el peso medio de una muestra de 100 recin nacidos, sabiendo que la poblacin sigue una distribucin normal de media = 3100 gramos y desviacin tpica = 150. Interpreta el resultado. Solucin: Si 1 = 09 = 01 y /2 = 005 Habr que determinar el valor de Z correspondiente a una probabilidad de 095. Es Z/2 = 1645, valor intermedio de 164 y 165: P(Z 1,645) = 095 (ver tabla normal) El intervalo correspondiente es 150 150 3100 1'645 = (3075235,3124675) ,3100 + 1'645 100 100 Para 1 = 095, Z/2 = Z0025 = 196, cuyo intervalo es 150 150 3100 1'96 = (30706,31294) ,3100 + 1'96 100 100 Si 1 = 099, Z/2 = Z0005 = 2575, pues P(Z 2575) = 09950 Su intervalo de probabilidad es 150 150 3100 2'575 = (3061375,3138625) ,3100 + 2'575 100 100 Estos resultados nos dicen que el 90 % de las muestras de tamao 100 tendrn una media entre 3075235 y 3124675 gramos, el 95 % entre 30706 y 312943 y el 99 % entre 3061375,3138625 gramos. Observa que para disminuir el riesgo, debemos aumentar los intervalos. Actividades propuestas 7. Si la estatura de las alumnas de segundo de Bachillerato se ajusta a la normal N(165, 8), en cm, halla, para las muestras de tamao 64: a) El porcentaje de ellas que dar una media entre 163 y 167. b) El intervalo de probabilidad con un nivel de confianza del 80 %. 8. El nivel medio de colesterol (en mg/dl), en individuos sanos, depende de la edad y el sexo; para los hombres con menos de 21 aos su distribucin es normal con media = 160 y desviacin tpica = 10. Un nivel fuera de 2 resulta extrao: indica que puede haber alguna anomala. Lo mismo cabe decir de las muestras: un nivel muestral fuera de 2 X resulta extrao.
a) Cul es el intervalo de probabilidad admisible (no extrao) para las muestras de tamao i) 1 ii) 9 iii) 100 b) Qu porcentaje de individuos o muestras se encuentra en los intervalos hallados?

43

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -44-

44

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -45-

TEMA 11: ESTIMACIN ESTADSTICA


En Espaa hay algo ms de 30 millones de votantes. Una encuesta a 5.000 de ellos predecira con bastante exactitud el resultado de unas elecciones generales; de hecho, este tipo de encuestas suele realizarse sobre una muestra inferior. Parece misterioso que la opinin de 1 de cada 6.000 votantes, que supone elegir a 5.000 entre 30 millones, refleje con precisin la intencin de todos. Slo se necesita que la muestra est bien seleccionada. Pero no siempre se hacen las encuestas bien. En 1936, la prestigiosa revista The Literary Digest hizo una estimacin de las elecciones presidenciales norteamericanas; tras enviar unos 10 millones de tarjetas a suscriptores de su revista, propietarios de coche y de telfono, se recibieron 2.376.523 respuestas, otorgando a Landon un porcentaje de voto del 57 %, frente a un 43 % dado a Roosevelt. Celebradas las elecciones, Roosevelt gan con el 62,5 % de los votos. El porqu de este enorme error parece muy claro: los suscriptores de la revista, los propietarios de coches y de telfono, formaban, en 1936, un estrato socioeconmico no representativo del total de la sociedad norteamericana. La muestra, a pesar de su gran tamao, estaba sesgada. Por tal motivo, hay que recurrir a muestras aleatorias, que garanticen una adecuada descripcin de la poblacin de partida. No obstante, a pesar de todas las precauciones nunca estaremos seguros de que nuestro resultado sea correcto: la posibilidad de error es evidente. Por eso, las conclusiones debern matizarse, indicando la confianza y el error asumido. En la teora del muestreo, que hemos visto en el tema anterior obtenamos informacin acerca de las muestras que extraamos al azar de poblaciones conocidas. Ahora bien, desde el punto de vista prctico es mucho ms interesante inferir informacin sobre una poblacin basndonos en la informacin contenida en una muestra. Para realizar este tipo de inferencia, utilizaremos dos mtodos: La estimacin de parmetros. El contraste de hiptesis.

En este tema, y de forma excepcional, no comenzaremos con una actividad, ya que los conceptos que necesitaremos para resolver situaciones de estimacin estadstica requieren conceptos especficos del tema que an no conocemos. De hecho, iremos intercalando diferentes ejemplos que nos deben de servir de ayuda para una mejor comprensin.

ESTIMACIN A PARTIR DE UNA MUESTRA

El objetivo fundamental de la inferencia estadstica es hacer inferencias o extraer conclusiones sobre algn parmetro de la poblacin basndose en los datos obtenidos en una muestra aleatoria. Los parmetros de la poblacin que ms interesan son la media y la proporcin (nosotros nos dedicaremos slo a la media). Asimismo, el objetivo principal de muchos estudios estadsticos es analizar el valor de parmetros que no se conocen. La forma ms elemental y directa de utilizar una muestra para obtener informacin sobre un parmetro desconocido de la poblacin es construir un estimador, que es una funcin de los valores de la muestra y proporciona un valor numrico que constituye la estimacin del parmetro. Por ejemplo, un comerciante podra estar interesado en conocer el gasto medio diario de sus clientes. Para ello, puede recurrir a una muestra representativa de la poblacin de clientes y, a partir de esos datos, podra estimar la media de la poblacin.

45

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -46-

1.1

Estimacin puntual

La estimacin puntual utiliza un solo valor obtenido a partir de la muestra para estimar un parmetro de la poblacin. Dada una muestra aleatoria simple de tamao n procedente de una poblacin con media , se puede utilizar el valor de la media muestral, x , para estimar la media de la poblacin, ; es la llamada estimacin puntual de la media. Ejemplo Supongamos que un comerciante decide anotar el gasto de los diez primeros clientes que entran en su tienda un da determinado y resultan los siguientes valores, redondeados, en euros: 5, 23, 7, 13, 18, 6, 4, 3, 11, 5 El gasto medio de esta muestra es 95 ; se dice este valor que es una estimacin puntual de la media poblacional y, por tanto, se puede estimar que el gasto medio diario de los clientes de 95 . 1.2 Estimacin por intervalo

Si el comerciante estima que el gasto medio diario de sus clientes se encuentra entre 8 y 10 , entonces la estimacin realizada es mediante el intervalo (8, 10). La estimacin por intervalo de un parmetro poblacional consiste en determinar, basndose en la informacin de la muestra, un intervalo en el cual probablemente se encuentre dicho parmetro. Este intervalo suele ir acompaado de una medida que refleja la confianza que se tiene acerca del que el valor del parmetro se encuentra en dicho intervalo, y se llama nivel de confianza. Por ejemplo, si el intervalo (8, 10) est dado con un nivel de confianza del 90 %, se expresa que el comerciante confa en un 90% de que el gasto medio de sus clientes se encuentre entre 8 y 10 . El nivel de confianza expresado en tanto por uno, se designa por 1 , e indica la confianza que se tiene acerca de que el verdadero valor del parmetro se encuentra en dicho intervalo. Un intervalo de confianza tiene un lmite inferior y un lmite superior. Ahora bien, estos lmites inferior y superior variarn dependiendo de la muestra elegida. De hecho, es muy probable que con otras muestras se obtuvieran intervalos como (820, 990) o (790, 930), por ejemplo. Actividad resuelta Si la renta per cpita de los habitantes de una regin es 12000 con desviacin tpica de 7000 ,a qu intervalo pertenecer la renta per cpita de una muestra de 400 individuos, elegidos al azar, en esa regin con una probabilidad del 0'9544? Resolucin Recuerda que si bien la renta per cpita no se distribuye normalmente, s lo hacen las medias muestrales ya que n 30. Teniendo en cuenta que para una probabilidad de 0'9544, Z/2 = 2 (recuerda los niveles de confianza usuales), el intervalo ser: 7000 7000 12000 2 = (11300, 12700) ,12000 + 2 400 400 Esto es, el 95'44 % de las muestras de tamao n = 400 tendrn una renta media comprendida entre 11300 y 12700 .

46

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -47-

INTERVALO DE CONFIANZA PARA LA MEDIA

El mtodo de estimacin permite expresar mediante un nmero la informacin disponible en la muestra sobre el parmetro; ese nmero es el valor en la muestra del estimador elegido. Se trata de una cantidad habitualmente cercana al valor desconocido del parmetro. Sin embargo, los estimadores no aportan informacin sobre la precisin con que se realiza la estimacin. Por ello es conveniente construir, no solo una estimacin numrica, sino tambin un intervalo que contenga el verdadero valor del parmetro con gran probabilidad. Un intervalo as recibe el nombre de intervalo de confianza y la probabilidad 1 de que el parmetro se encuentre en l se llama coeficiente de confianza. Un intervalo de confianza con coeficiente de confianza 1 es un intervalo que contiene el verdadero valor del parmetro con probabilidad 1 . Si la confianza es 1 , suele decirse que el nivel de significacin es . Ten en cuenta que si Z es una distribucin N(0,1), un intervalo de probabilidad 1 se obtiene dejando una probabilidad igual a a ambos lados como puedes ver en la figura:

NOTA: Los intervalos de confianza se basan en la misma idea que los intervalos de probabilidad. 2.1 La desviacin tpica es conocida

Sea una poblacin normal que sigue una distribucin N(,) con desviacin tpica conocida. Queremos estimar la media mediante un intervalo de confianza. Pare ello, se toma una muestra aleatoria de tamao n y se obtiene una media muestral x . Debes recordar que la distribucin en el muestreo de la variable aleatoria es una normal. N , n Tambin debes recordar que la media muestral x , obtenida a partir de una muestra de tamao n, pertenece al intervalo , + Z / 2 Z / 2 n n con una probabilidad 1 ; esto es: Z / 2 X + Z / 2 n n

Si se hacen transformaciones en las desigualdades anteriores, llegaramos al siguiente resultado: X Z / 2 n X + Z / 2 n (tambin con una probabilidad 1 )

, X + Z / 2 Al intervalo X Z / 2 se le llama intervalo de confianza para la media n n poblacional de una poblacin N(,) con un nivel de confianza 1 . 47

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -48-

Niveles usuales de significacin y de confianza. Valor crtico. Los niveles de confianza habituales son del 090 o 095 (en porcentajes, 90 y 95 %). Una confianza del 95 % comporta un riesgo del 5 %. Esto significa que en 100 muestreos, cabe esperar que cinco de ellos den resultados errneos. Nota: Observa que la confianza va creciendo en la medida en que aumenta el radio del intervalo haciendo mayor Z/2, como puede verse en la tabla siguiente. Nive1 de confianza 1 080 090 095 098 099 Nive1 de significacin 020 010 005 002 001 Valor crtico Z/2 = Zc 128 1645 196 233 2575

Los valores de Z/2 se obtiene en la tabla de la distribucin normal. Recuerda que una variante de esta tabla la dbamos al trabajar con el muestreo. Conocer los valores de la tabla no es obligatorio, pero has de tener en cuenta que los valores que estn en negrita son los ms habituales, por lo que es conveniente que los recuerdes sin necesidad de buscar en la tabla de la distribucin normal. Actividades resueltas 1. Para una muestra de 400 personas elegidas al azar se obtiene una renta per cpita media de 12150 . Si la desviacin tpica de la renta per cpita para la poblacin es de 7000 , da: a) El intervalo de confianza, con un nivel de significacin de 01. b) El intervalo de confianza para un nivel de significacin de 005. Resolucin En este caso tenemos: n = 400, x = 12150, = 7000 a) Para un nivel de significacin de 01, Z/2 = 1645. El intervalo de confianza ser: 7000 7000 ,12150 + 1'645 12150 1'645 = (1157425,1272575) 400 400 Esto significa que la renta per cpita del total de la poblacin estar entre esas dos cantidades, con una probabilidad de 09. b) Para un nivel de significacin de 005, Z/2 = 196. El intervalo de confianza ser: 7000 7000 ,12150 + 1'96 12150 1'96 = (11464, 12836) 400 400 Luego, la renta per cpita de la poblacin estar entre esas dos cantidades, con una probabilidad de 095. Observa que al aumentar la confianza lo hace tambin el intervalo: se est ms seguro de un resultado en la medida que se amplan los mrgenes de ste. 48

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -49-

2. Una mquina se encarga de llenar cajas de cereales de 500 g. El peso de estas cajas sigue una distribucin normal con desviacin tpica de 4 g. En una muestra aleatoria simple de 50 cajas se obtuvo un peso medio de 498 g. Hallar un intervalo de confianza del 95% para el peso medio de todas las cajas llenadas por esa mquina. Resolucin La poblacin sigue una distribucin N(,4), y la muestra de tamao n = 50 tiene una media muestral x = 498 g. Si el nivel de confianza es 095, entonces: 1 = 095 = 005 P(Z < Z/2) = 1
= 0025 2

= 0'975 . Consultando la tabla N(0,1) se obtiene Z/2 = 196 (valor conocido). 2

El intervalo para la media poblacional con un nivel de confianza del 95 % es el siguiente: , X + Z / 2 X Z / 2 = n n

4 4 498 1'96 = (49689, 49911) ,498 1'96 50 50

Se tiene el 95 % de confianza de que el peso medio de las cajas de cereales se encuentre entre 49689 y 49911 gramos.

3. Se desea estudiar el gasto anual de fotocopias, en euros, de los estudiantes de una universidad. Para ello, se ha elegido una muestra aleatoria de 9 de estos estudiantes, resultando los valores siguientes para estos gastos: 100, 150, 90, 70, 75, 105, 200, 120, 80 Se supone que la variable aleatoria objeto de estudio sigue una distribucin normal de media desconocida y de desviacin tpica igual a 12. Determina un intervalo de confianza del 95% para la media del gasto semanal en fotocopias. Resolucin
En este caso, no se nos da la media, pero podemos hallarla, 110. Por tanto, la media muestral se 12 ajusta a una N110, = N(110,4). 9 Una confianza del 95% implica un valor crtico zc = 1'96 (P(z zc) = 0'975 zc = 1'96) El intervalo de confianza para la media ser: (110 1'96 4, 110 + 1'96 4) = (102'16, 117'84)

LA POBLACIN NO SIGUE UNA DISTRIBUCIN NORMAL (n > 30)


Si la poblacin no sigue una distribucin normal, al tomar una muestra aleatoria de tamao n suficientemente grande (n > 30) y con una media muestral x , procedente de una poblacin con media y desviacin tpica conocida, segn el teorema central del lmite, se tiene:

Z=

x N(0,1)

n El intervalo aproximado para la media poblacional a un nivel de confianza 1 es el mismo que para una poblacin normal. Esto es: X Z / 2 , X + Z / 2 n n

49

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -50-

Actividad resuelta Una muestra de 49 coches de una empresa de alquiler dio como resultado que por trmino medio recorren 140 km a la semana. Por experiencia se sabe que el nmero de kilmetros semanales recorridos por toda la flota de coches tiene una desviacin tpica de 30 km. Determina un intervalo con un nivel de confianza del 95 % para la media poblacional. Resolucin En este caso, no tenemos una poblacin normal, pero n = 49 > 30. De la muestra conocemos: x = 140, = 30 Si el nivel de confianza es 095, entonces: 1 = 095 = 005 P(Z < Z/2) = 1
= 0025 2

= 0'975 . Consultando la tabla N(0,1) se obtiene Z/2 = 196. 2 El intervalo de confianza al 95 % ser:

X Z / 2 , X + Z / 2 = n n 2.2

30 30 140 1'96 = (1316, 1484) ,140 + 1'96 49 49

La desviacin tpica es desconocida

Suele suceder que la desviacin tpica de la poblacin de partida tambin sea desconocida (resultara extrao que se conozca y no la media ). En este caso no tendramos ms remedio que sustituir por la desviacin tpica muestral, s. Consideramos una muestra de tamao n (n > 30) procedente de una poblacin normal o no, con media y desviacin tpica desconocida ; obtendremos a partir de dicha muestra la media muestral x y desviacin tpica muestral, s. El intervalo de confianza para la media poblacional con un nivel de confianza 1 , sera

s s X Z / 2 , X + Z / 2 n n
Por necesidades estadsticas, ser la desviacin tpica poblacional, s, la que se use para determinar los extremos del intervalo. Sustituir por s introduce cierta inexactitud, aunque no es grave cuando n es grande. s A se le llama error tpico o error estndar de la media; este valor aproxima bien la desviacin n tpica, , de la distribucin de medias muestrales. n Actividades resueltas 1. Para una muestra de 30 alumnos se obtuvo una nota media en el ltimo examen de matemticas de x = 583, con una desviacin tpica s = 192. Determina el intervalo de confianza al 80 %.

Resolucin
Una confianza del 80 % indica que 1 = 08, luego Z/2 = Z01 128, pues P(Z < 128) = 08997 090

= 01. 2

Como se desconoce la desviacin tpica poblacional, utilizamos el intervalo de confianza:

50

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -51-

s s X Z / 2 = , X + Z / 2 n n

1'92 1'92 5'83 1'28 = (538,628) ,5'83 + 1'28 30 30

2. Para estimar el tiempo medio de atencin de los estudiantes en un centro universitario, se eligi al azar una muestra de 100 estudiantes y se obtuvo un tiempo medio de 2'6 minutos y una desviacin tpica de 0'3 minutos. Obtener un intervalo de confianza del 95% para el tiempo medio de atencin a los estudiantes en dicho centro. Resolucin La poblacin no sigue una distribucin normal y, adems, la desviacin tpica es desconocida. La muestra es de tamao n = 100, la media muestral es x = 2'6 minutos y la desviacin tpica muestral es s = 0'3 minutos. Si 1 = 095 = 005 Como P(Z < Z/2) = 1
= 0025 2

= 0'975 , se obtiene, consultando la tabla N(0,1), Z/2 = 196. 2

Un intervalo aproximado para la media poblacional con un nivel de confianza del 95 % es:

s s X Z / 2 , X + Z / 2 = n n Actividades propuestas

0'3 0'3 2'6 1'96 = (2'54,2'66) ,2'6 + 1'96 100 100

1. La vida media de una muestra escogida al azar de 121 bombillas es de 3.000 horas y la desviacin tpica es de 220 horas. Calcula el intervalo de confianza aproximado para la media poblacional con un nivel de confianza del 99 %. 2. Una investigacin examina los gastos de consumo de una muestra de 64 familias espaolas elegidas al azar. La media muestral es de 6000 y la desviacin tpica s = 600 . Construir un intervalo de confianza al 95 % para todas las familias espaolas. 3. En una gran ciudad, la altura media de sus habitantes tiene una desviacin tpica de 8 cm. a) Si la altura media de dichos habitantes fuera de 175 cm, cul sera la probabilidad de que la altura media de una muestra de 100 individuos fuera superior a 176 cm? b) Si se considera una muestra aleatoria de 100 individuos de esta ciudad, se obtiene una altura media de 178 cm. Determina un intervalo de confianza del 95 % para la altura media de los habitantes de esta ciudad. 4. En una oposicin en la que participaron miles de candidatos se hizo un examen de tipo test. La desviacin tpica de las calificaciones fue = 10. a) Si se elige una muestra de tamao 100, con media muestral de 71 puntos, cul ser el intervalo de confianza para la media poblacional con una probabilidad del 90 %? b) dem, si n = 40, = 74 y = 005.

51

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -52-

3
3.1

ERROR ADMITIDO Y TAMAO DE LA MUESTRA


Error admitido X Z / 2 , X + Z / 2 n n

Cuando decimos que la media poblacional pertenece al intervalo:

con un nivel de confianza de 1 , estamos admitiendo un error mximo de E = Z/2 n

Esto es, afirmamos que la diferencia entre la estimacin para la media, X y su valor real, , es menor que el valor de E.
O tambin que

=1 P X < Z / 2 n
El error puede controlarse variando Z/2 y n.

Actividad resuelta Para una muestra de 400 personas elegidas al azar se obtiene una renta per cpita de 12150 con una desviacin tpica de 7000 , da: a) El error cometido al dar el intervalo de confianza, con un nivel de significacin de 01. b) El error cometido al dar el intervalo de confianza, con un nivel de significacin de 005. Resolucin
Ya vimos (actividad resuelta 1 del apartado 2.1.) que a partir de una muestra de 400 personas, se estimaba la renta per cpita mediante el intervalo de confianza: (12150 57575, 12150 + 57575) = (1157425, 1272575) El error mximo cometido es: 1'645 con una confianza del 90 %. En la misma actividad, para un nivel de significacin de 005 (confianza del 95 %), la estimacin de la media se poda dar el intervalo de confianza con un error mximo de 1'96 7000 400 En este caso, el intervalo de confianza era (11464,12836). = 686 7000 400 = 57575

52

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -53-

3.2

Tamao muestral

Ya debemos saber que un procedimiento para aumentar la confianza puede ser aumentar el tamao de la muestra. Entonces lo razonable ser preguntarnos: Cmo deber ser de grande la muestra para tener una confianza, por ejemplo, del 99 %? El tamao muestral mnimo de una encuesta depende de la confianza que se desee para los resultados y del error mximo que se est dispuesto a asumir. El tamao mnimo n de la muestra se deduce de las expresiones de las cotas de error. E = Z/2 n
n = Z / 2 n = Z / 2 E E
2

Para tamaos de muestra mayores que n el error ser an menor que E. NOTA: No es necesario aprenderse de memoria el valor de n, pero s que es conveniente conocer la expresin que nos da el error.

Actividades resueltas 1. La media de edad de los alumnos que se presentan a las PAU es 181 aos y la desviacin tpica 06 aos. a) De los alumnos anteriores se escoge, al azar, una muestra de 100. Cul es la probabilidad de que la edad media de la muestra est comprendida entre 179 y 182 aos? b) Qu tamao debe tener una muestra de dicha poblacin para que su media est comprendida entre 179 y 183 aos con una confianza del 995 %?
Esta actividad es bastante dura, pero puede ser interesante que veas el desarrollo matemtico.

Resolucin
La variable edad de los alumnos sigue una normal N(181, 06) La distribucin de las medias muestrales es normal de media 181 y de desviacin tpica 0'6 = = 0'06 ; es decir, tenemos una N(181, 006). n 100
18'2 18'1 17'9 18'1 a) P(179 < x <182) = P <Z< = P(333 < Z < 167) = 0'06 0'06 P(Z < 167) P(Z 333) = P(Z < 167) 1 + P(Z 333) = 09525 1+ 09996 = 09521

17'9 18'1 18'3 18'1 b) P(179 < x <183) = P <Z< = 0995 0'6 0'6 n n
0'2 n 0 '2 n 0'2 n 0'2 n = 0995 P Z < 1 + P Z = 0995 P <Z< 0'6 0'6 0'6 0'6 0 '2 n 0'2 n = 1995 P Z < = 09975 2P Z < 0'6 0'6 Si buscamos en las tablas de la normal, para esa probabilidad debe 0'2 n = 281 n = 711 La muestra ha detener, al menos, 72 alumnos. 0'6

ser:

53

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -54-

2. Se desea realizar una investigacin para estimar el peso medio de los hijos recin nacidos de madres fumadoras. Se admite un error mximo de 50 gramos, con una confianza del 95 %. Si por estudios anteriores se sabe que la desviacin media del peso medio de tales recin nacidos es de 400 gramos, qu tamao mnimo de muestra se necesita en la investigacin? Resolucin Para una confianza del 95 %, 1 = 005 Z/2 = 196 Como E = Z/2 196 400 n n y se desea que E < 50, se tendr
n > 1'96 400 50

< 50

n > 1568 n > 24586

El tamao mnimo de la muestra debe ser n = 246.

Actividades propuestas
5. En una encuesta se pregunta a 10.000 estudiantes de Bachillerato sobre su consumo de refrescos semanal, encontrndose una media de 5 botes, con una desviacin tpica de 2 . a) Halla los intervalos de confianza para la media al 80 % y al 95 % de probabilidad. b) Si aceptamos un error de 025 botes para la media poblacional, con un nivel de confianza del 80 %, a cuntas personas es necesario entrevistar? Y si queremos un nivel de confianza del 95 %? 6. Se sabe que el contenido de fructosa de cierto alimento sigue una distribucin normal cuya varianza es 025. Se desea estimar el valor de la media poblacional mediante el valor de la media de la muestra, admitindose un error mximo de 02 con una confianza del 95 %. Cul ha de ser el tamao de la muestra? 7. Se ha tomado una muestra aleatoria de 100 personas a los que se ha medido el nivel de glucosa en sangre, y se ha obtenido una media muestral de 110 mg/cc con una desviacin tpica de 20 mg/cc. a) Obtn un intervalo de confianza, al 90 %, para el nivel de glucosa en sangre de la poblacin. b) Qu error mximo se comete con la estimacin anterior?

54

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -55-

CONTRASTE DE HIPTESIS

Habrs observado a lo largo de este bloque, que la media muestral suele ser diferente de la media poblacional. Lo normal es que esas diferencias sean pequeas, y estn justificadas por el azar; pero, podra suceder que no fuesen debidas al azar? 1. Hace algunos aos, la media de estatura de los espaoles adultos era de 170 cm, con = 9 cm. Pasado el tiempo, un muestreo realizado una media de 172 cm. Puede afirmarse que esa diferencia de 2 cm es debida al azar? No es posible que la estatura media haya aumentado? 2. Supongamos que, respecto a una determinada ley, el 52 % de los ciudadanos est en contra. Pasado el tiempo, una encuesta realizada a 400 personas indica que los ciudadanos en contra han descendido hasta el 49 %. Ha cambiado realmente la opinin pblica, o tal resultado es debido al azar? 3. El porcentaje de aprobados en las PAU en un determinado distrito universitario ha sido del 82%. En una ciudad de ese distrito, el porcentaje de aprobados fue del 86 %. Puede afirmarse con un nivel del 90 % que los resultados de esa ciudad son superiores a la media? El contraste de hiptesis es el instrumento que permite decidir si esas diferencias pueden interpretarse como simples fluctuaciones debidas al azar, o bien, son de tal importancia que requieren una explicacin distinta. Ambas opciones se estiman con tcnicas similares a las de intervalo de confianza. Como all, las conclusiones se formularn en trminos de probabilidad, pues hay riesgo de error. Esto es, puede decidirse que no hay diferencias, habindoles, o, por el contrario, asegurar que las hay, sin haberlas. Dado que ambos errores pueden considerarse graves, estadsticamente hay que estar muy seguros de la afirmacin que se hace. Por ello, la probabilidad con la que se opte por una u otra hiptesis debe ser grande, generalmente superior a 09. (Por ejemplo, para concluir que un medicamento es ms eficaz que otro hay que estar, estadsticamente, muy seguros.) 4.1 Un problema tpico

En un estudio se afirma que el sueldo medio mensual en una Comunidad Autnoma es de 1250 con una desviacin tpica de 50 . Esta hiptesis estadstica se denominar hiptesis nula, H0: = 1250. Frente a la hiptesis nula, existe una hiptesis contraria, la hiptesis alternativa, H1: 1250.

Par poder contrastar la hiptesis nula (H0 : = 1250), se elige una muestra aleatoria formada, por ejemplo, por 100 personas, y se obtiene la media muestral, por ejemplo x = 1200 . Para contrastar la media poblacional = 1250 tomaremos la media muestral x , que llamaremos estadstico del contraste. Este estadstico es una variable aleatoria que tiene por distribucin en el . En nuestro ejemplo sera N(1250,5). muestreo una normal N , n La diferencia 1250 1200 puede ser debida al azar, en cuyo caso se dice que no es significativa, o puede ser debida a otras causas, en cuyo caso diremos que es significativa. Para saber cuando es significativa o no, fijaremos un nivel de confianza, por ejemplo, 1 = 090, y entonces aceptaremos la hiptesis nula si la media muestral, una vez tipificada cae dentro del intervalo (z/2, z/2); en nuestro caso, (196,196), que llamaremos regin de aceptacin: en caso contrario, rechazaremos la hiptesis nula, ya que una vez tipificado, el estadstico de contraste caer en la regin contraria, que llamaremos regin crtica o regin de rechazo. A continuacin desarrollaremos los conceptos que se han mencionado en este problema. 55

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -56-

4.2

Hiptesis nula e hiptesis alternativa. Estadstico del contraste.

Una hiptesis estadstica es una afirmacin sobre el valor de algn parmetro de la distribucin de la poblacin. Conviene destacar que la hiptesis se formula sobre algn parmetro de la poblacin y las conclusiones sobre la validez de la hiptesis se basan en la informacin muestral. En un contraste de hiptesis se presentan dos opciones contrapuestas que se denominan hiptesis nula H0 e hiptesis alternativa H1. La hiptesis nula, H0, es aquella que se considera verdadera y que se quiere contrastar. La hiptesis alternativa, H1, es la hiptesis contraria a la nula.

El contraste de hiptesis es un procedimiento para decidir cul de las dos hiptesis es la verdadera. El estadstico del contraste es una funcin de los valores muestrales. Es una variable aleatoria que sigue una distribucin en el muestreo y que toma un valor para cada muestra. En nuestro caso, ser generalmente, la media muestral. 4.3 Contraste unilateral y bilateral

Las hiptesis estadsticas pueden ser de dos tipos: hiptesis simples e hiptesis compuestas. En las hiptesis simples se indica un nico valor del parmetro poblacional, mientras que en las hiptesis compuestas se especifica un intervalo de valores. As, la hiptesis 1250 es compuesta; sin embargo, = 1250 sera una hiptesis simple (nosotros trabajaremos con hiptesis simples). Sea una media y la hiptesis nula simple, por ejemplo, H0: =0, frente a una alternativa compuesta de la forma H1: <0, o bien H1: >0. Las hiptesis alternativas de este tipo se llaman hiptesis alternativas unilaterales, y el contraste correspondiente es de una cola o unilateral. Otra posibilidad es que a la hiptesis nula simple, por ejemplo, H0: =0, se enfrente la hiptesis alternativa compuesta, H1: 0. En este caso, la hiptesis alternativa se dice que una hiptesis alternativa bilateral, y el contraste a llevar a cabo es de dos colas o bilateral (este contraste es al que nos dedicaremos en este curso). Ejemplo Si el peso medio anunciado por un fabricante de paquetes de azcar de una determinada marca es de 1 kg, entonces la hiptesis nula es que efectivamente el peso medio es de 1 kg, es decir: H0 : = 1 La alternativa es que el peso medio no es de 1 kg, o sea: H1 : 1 El contraste es de dos colas o bilateral ya que la hiptesis alternativa se puede escribir como: H1 : < 1 o > 1 4.4 Regin crtica (o de rechazo) y regin de aceptacin La regin crtica o, regin de rechazo est formada por el conjunto de muestras para las cuales se rechaza la hiptesis nula H0. Por su parte, la regin de aceptacin est constituida por el conjunto de muestras para las cules se acepta la hiptesis nula H0. El valor o valores que separa la regin crtica de la regin de aceptacin recibe el nombre de valor o valores crticos. En el contraste bilateral, la situacin se refleja en el grfico siguiente:

56

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -57-

Regin crtica 4.5

Regin de aceptacin

Regin crtica

Contraste de hiptesis sobre la media poblacional

Habitualmente tendremos una poblacin que sigue una distribucin de media y desviacin tpica conocida, sea o no una distribucin normal. Hiptesis nula H0: = 0 frente a hiptesis alternativa H1: 0 Se considera un test de hiptesis o contraste de hiptesis en el cual la hiptesis nula es que la media poblacional toma un valor concreto; es decir: H0: = 0 Para ello se observa una muestra aleatoria simple de tamao n y se calcula su media muestral x , que nos servir para estimar . Si se supone que la hiptesis alternativa es que la media poblacional toma un valor menor o mayor que el valor, en todo caso distinto, se puede expresar por: H1: 0 Se trata, pues, de un contraste bilateral en el que se utiliza la media muestral para favorecer la decisin de si la hiptesis nula es o no cierta. Una vez fijadas las hiptesis, es necesario indicar el nivel de significacin o, lo que es equivalente, una regla de decisin tal que la probabilidad de rechazar la hiptesis nula, cuando es cierta, sea . El contraste se basa en que la variable aleatoria: z=
x N(0,1) n Se rechazar la hiptesis nula si la media muestral es mucho menor o mucho mayor que el valor especificado no. Es decir, si z < z/2, o z > z/2:

Contraste de hiptesis para la media de una poblacin cuando la desviacin tpica es desconocida (tamaos muestrales grandes n > 30)
Para tamaos muestrales grandes (n > 30), procedentes de una poblacin, sea o no normal, de media y desviacin tpica desconocida, se pueden utilizar los mismos procedimientos de contraste desarrollados para los casos en los cuales la desviacin tpica es conocida, basta sustituir por la desviacin tpica muestral s.

57

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -58-

4.6

Resumen

En general, los pasos que daremos para realizar un contraste de hiptesis sern los siguientes: 1. Seleccionar la caracterstica de la poblacin sobre la que se quiere contrastar la hiptesis. 2. Definir la hiptesis nula y la hiptesis alternativa. 3. Determinar el nivel de significacin. 4. Hallar la regin de aceptacin y de rechazo. 5. Describir la regla de decisin e interpretarla; es decir, rechazar la hiptesis nula H0 si el valor del parmetro que especifica no pertenece al intervalo de confianza . Actividades resueltas 1. El consumo diario en carne por persona en una determinada ciudad sigue una distribucin normal con desviacin tpica de 80 g. Por otra parte, los carniceros de un mercado central afirman que el consumo medio diario de carne por persona es de 1134 g. Para contrastar esta hiptesis, a un nivel de significacin de 005, se elige una muestra al azar de 4096 personas y se obtiene que consumen por trmino medio al da 116 g. Se pide: a) Determinar la hiptesis nula y la hiptesis alternativa. b) Hallar la regin de aceptacin y de rechazo, as como los valores crticos. c) Describir la regla de decisin. Resolucin Se trata de contrastar la media poblacional de una poblacin normal con desviacin tpica conocida. En concreto, se contrastar la hiptesis nula formulada por los carniceros del mercado central al afirmar que el consumo medio diario en carne por persona es de = 1134 g, frente a la hiptesis alternativa de que no es ese valor, es decir, 1134 g. a) Hiptesis nula H0: Hiptesis alternativa H1: = 1134 1134
= 0025 2

b) El nivel de significacin es = 005 y, por tanto, Como P(z < z/2) = 0975 z/2 = 196, la regin de aceptacin estar comprendida ente los valores crticos z/2 = 196 y z/2 = 196, siendo la regin de rechazo la comprendida para valores inferiores a z/2 = 196 y superiores a z/2 = 196.

c) En la poblacin se conoce = 80 g, y en la muestra n = 4096 y x = 116 g. Por tanto: z =

x 116 113'4 = = 2'08 80

n 4096 Como z = 208, est en la regin de rechazo, ya que 208 > 196, se rechaza la hiptesis nula. Esto es, se rechaza la afirmacin realizada por los carniceros del mercado central de que el consumo diario por persona en esta ciudad es de 1134 g.

58

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -59-

2. El presidente de un grupo de agencias de viaje asegura que durante el ltimo mes obtuvieron unas ventas medias de 3 millones de euros. Con el fin de contrastar este dato, se toma una muestra al azar de 100 sucursales y se obtienen unas ventas medias de 29 millones de euros y una desviacin tpica de 035 millones de euros. Se acepta a un nivel de significacin del 10% la afirmacin del presidente del grupo? Resolucin En este caso, tenemos una poblacin con desviacin tpica desconocida y tamao muestral grande. Se consideran las siguientes hiptesis: Hiptesis nula H0: Hiptesis alternativa H1: =3 3

= 005 y z/2 = 1645. 2 x 2'9 3 El estadstico de contraste es: z = = = 2'86 s 0'35

A un nivel de significacin = 010, entonces

100

Por tanto, como 286 se localiza en la regin crtica, se rechaza la afirmacin del presidente sobre las ventas medias mensuales del grupo, a un nivel de significacin del 10 %.

3. Hace algunos aos, la meda de estatura de los espaoles adultos (varones) era de 170 cm, con = 9 cm. Pasado el tiempo, un muestreo realizado a 36 adultos da una media de 172 cm. a) Podemos afirmar, con una confianza del 90 %, que esa diferencia de 2 cm es debida al azar? b) No es posible que la estatura media haya aumentado? c) Cambiaran las conclusiones si esa media de 172 cm se hubiese obtenido tras un muestreo de tamao n = 900? Solucin
No es el tpico problema de contraste de hiptesis, pero puede ser conveniente que veas un enfoque diferente del contraste. a) El intervalo de confianza para la media poblacional, para 1 = 09, es

9 9 172 1'645 = (1695,1745) ,172 + 1'645 36 36


El 90 % de las medias quedan entre 169,5 y 174,5 cm. Como 170 cm se encuentra en ese intervalo, no puede descartarse que esa muestra proceda de una poblacin de media = 170 cm.

59

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -60-

b) A pesar de lo dicho, es posible que la media haya aumentado. De hecho, para X =172 y = 9, la probabilidad de que una media poblacional i est por encima de 170 cm es: 170 172 = P(Z > 133) = 09082 (Casi del 91 %) P(i > 170) = P 9 / 36
Para n = 900, el intervalo de confianza al 90 % es

9 9 172 1'645 = (1715,1725) ,172 + 1'645 900 900


El valor = 170 queda claramente fuera del intervalo. Prcticamente es seguro que la poblacin ha aumentado su estatura media. De hecho, la probabilidad de que una media poblacional i est por encima de 170 cm es

170 172 = P(Z > 667) = 1 P(i > 170) = P 9 / 900


El 100 % de las medias muestrales es mayor que 170 cm. Este resultado es seguro, salvo catstrofe a la hora de muestrear.

Actividades propuestas
8. En una determinada poblacin juvenil, el peso, en kg, sigue una distribucin normal, N(50, 10). Si se extrae una muestra aleatoria de 25 jvenes y para un nivel de significacin del 5 %, en qu condiciones se rechazara la hiptesis de que la media de la poblacin es de 50 kg? 9. Se sabe que la renta anual de los individuos de una localidad sigue una distribucin normal de media desconocida y de desviacin tpica 2400 euros. Se ha observado la renta anual de 16 individuos de esa localidad escogidos al azar, y se ha obtenido un valor medio de16000 euros. Contrasta, a un nivel de significacin del 5%, si la media de la distribucin es de 14500 euros. a) Cules son las hiptesis nula y alternativa del contraste? b) Determina la forma de la regin crtica. c) Se acepta la hiptesis nula con el nivel de significacin indicado?

60

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -61-

ANALOGA ENTRE EL CONTRASTE DE HIPTESIS Y EL INTERVALO DE CONFIANZA

Supongamos que el gremio de restaurantes de Madrid afirma que el precio medio del men del da es 8 y queremos contrastar esta hiptesis. Para ello haremos: Hiptesis nula H0: Hiptesis alternativa H1: =8 8
x , y sigue una N(0,1). s n Se determina la regin de aceptacin (z/2, z/2), que para = 005 resulta (196,196). Elegimos una muestra aleatoria de 40 restaurantes y hallamos el precio medio de la muestra y la desviacin tpica muestral; sean, por ejemplo: x = 825 , s = 080 Efectuamos los clculos para el valor particular de x = 825: x 8'25 8 = = 1'976 0'80 s n 40 Como 1976 (1,96,196), rechazamos por muy poco la hiptesis nula, y decimos que al nivel de significacin del 5 % existe evidencia suficiente de que el precio medio del men del da es distinto de 8 . Hallamos ahora un intervalo de confianza para la media poblacional al nivel del 5 % para el enunciado anterior:

Fijamos un nivel de significacin, = 005, de donde 1 = 095. El estadstico del contraste es

s s X Z / 2 , X + Z / 2 = n n

0'80 0'80 8'25 1'96 = (8'002,8'498) ,8'25 1'96 40 40

Por tanto, para esta muestra el intervalo de confianza no cubre por muy poco el valor medio poblacional = 8 al nivel de significacin del 5 %. Acabamos de ver que existe una gran relacin entre el intervalo de confianza para el parmetro de una distribucin y un contraste de hiptesis relativo al mismo. As, por ejemplo, si formulamos la hiptesis de que la media de una distribucin toma un determinado valor 0, obteniendo un intervalo de confianza para una muestra particular, cuando dicho intervalo no contenga el valor 0 equivaldr a rechazar la hiptesis nula = 0.

NOTA: Los intervalos de confianza se utilizan para estimar parmetros poblacin, mientras que los contrastes de hiptesis se usan para tomar decisiones acerca de dichos parmetros.

61

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -62-

62

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -63-

ANEXO III: ACTIVIDADES DE PROBABILIDAD Y ESTADSTICA


1. Una urna contiene dos bolas blancas y dos rojas. Se hacen cuatro extracciones con reemplazamiento. Encuentra: a) Los sucesos A: slo ha salido una bola negra; B: la segunda extraccin es bola negra. b) P(A), P(B), P(A B), P(A B), P(A B) 2. En una clase infantil hay 6 nias y 10 nios. Si se escoge a 3 alumnos al azar, halla la probabilidad de: a) Seleccionar 3 nios. b) Seleccionar 2 nios y una nia. c) Seleccionar, al menos, un nio. 3. En cierta poblacin laboral, un 80 % son peones sin cualificar (suceso P) y un 50 % son mujeres (suceso M). Se sabe, adems, que el 40 % son peones femeninos y que un 45 % de los trabajadores cuyos padres tienen estudios (suceso PE), son mujeres. Di si son independientes los sucesos: a) P y M b) PE y M c) P y M'. 4. En un IES hay organizadas actividades extraescolares de carcter deportivo. De los alumnos de 2 de Bachillerato, participan en esas actividades 25 chicas y 20 chicos. En ese curso hay un total de 60 chicos y 40 chicas. Si se escoge un alumno al azar, calcula la probabilidad de que: a) Sea chico. b) Sea chico y no participe en dichas actividades. c) Participe en las actividades. d) Participe en las actividades sabiendo que es chica. e) Sea chica, sabiendo que participa. 5. Un experimento consiste en lanzar un dado y extraer una bola de una urna que contiene una bola blanca, dos rojas, una verde y una azul. Construya un espacio muestral apropiado a dicha experiencia para calcular la probabilidad de obtener un nmero mayor que tres y una bola roja. Obtenga dicha probabilidad. 6. Con motivo del centenario de una localidad, se han programado conciertos el 80% de los sbados. Del total de conciertos, un 25% son de piano, un 60% de orquesta y el 15% restante de rock. Un individuo, que desconoce el programa de conciertos, acude a la ciudad un sbado cualquiera. Cual es la probabilidad de que pueda asistir a un concierto de piano? 7. Los paquetes recibidos en un almacn tienen un peso medio de 300 kg y una desviacin tpica de 50 kg. Cul es la probabilidad de que 25 de esos paquetes, elegidos al azar, excedan el lmite de carga del montacargas donde se van a meter, que es de 8200 kg? 8. El cociente intelectual de unos universitarios se distribuye normalmente con media 100 y desviacin tpica 11. a) Se elige una persona al azar. Hallar la probabilidad de que su CI est entre 100 y 103. b) Se elige al azar una muestra de 25 personas. Encontrar la probabilidad de que la media de sus cocientes intelectuales est entre 100 y 103. 63

I.E.S. Fco. Figueras Pacheco C.E.E.D. Profesor: Luis Milln Bloque III: PROBABILIDAD Y ESTADSTICA

Matemticas A.C.S. II Probabilidad -64-

9. El permetro torcico de los individuos adultos (hombres) en una poblacin se distribuye segn la ley normal N(90, 6) cm. a) Cmo se distribuyen las medias de las muestras de tamao 81 extradas de esa poblacin? b) Cul es la probabilidad de que una de esas medias sea menor de 87 cm? Y de que sea mayor de 91 cm? 10. Suponemos que la altura de los alumnos de segundo de bachillerato de una ciudad determinada sigue una distribucin normal de 165 cm de media y desviacin tpica de 11 cm. Se toma una muestra al azar de 121 de estos alumnos y se calcula su media. Cul es la probabilidad de que esta media sea menor de 164 cm? 11. Un estudio de mercado ha determinado que el precio de los libros cientficos sigue una distribucin normal de desviacin tpica 95 euros. Se desea estimar el precio medio de los libros cientficos; para ello se elige una muestra aleatoria formada por 34 libros y se determina que la media muestral es x = 2205 euros. Hallar el intervalo de confianza para el precio medio de los libros cientficos al nivel del 99 %. 12. Supongamos una poblacin N(,8). Se extrae de ella una muestra aleatoria simple. Si se sabe que la probabilidad de cometer un error de 392 o ms al estimar la media mediante la media muestral es de 005, qu tamao ha de tener la muestra? 13. El nivel medio de protombina de una poblacin normal es de 20 mg/100 ml de plasma con una desviacin tpica de 4 mg/100 ml. Se toma una muestra de 40 individuos en los que la media es 185 mg/100 ml. Es la muestra comparable con la poblacin, con un nivel de confianza del 95 %? 14. Se cree que el tiempo medio de ocio que dedican al da los estudiantes de Bachillerato sigue una distribucin normal de media 350 minutos y desviacin tpica poblacional de 60 minutos. Para contrastar esta hiptesis, se toma una muestra aleatoria formada por 100 alumnos, y se observa que el tiempo medio es 320 minutos. Qu se puede decir de esta afirmacin al nivel del 10 %? 15. Un socilogo est estudiando la duracin del noviazgo en una extensa rea rural. Se tom una muestra aleatoria formada por 56 familias y se obtuvo que La duracin media de su noviazgo fue 34 aos, con una desviacin tpica de 12 aos. a) Hallar un intervalo de confianza para la duracin media del noviazgo para la poblacin de familias en dicha rea al nivel de confianza del 85 %. b) Repetir el apartado a) para niveles del 95 % y 99 %. c) Comparar las longitudes de los intervalos obtenidos en a) y b) e interpretar segn los distintos valores del nivel de confianza. d) Cul debera ser el tamao de la muestra para estar seguro al nivel del 90 % de que el error mximo cometido es del 5 % 16. La altura de un grupo de jvenes se distribuye segn una normal de media desconocida y varianza 25 cm2. Se selecciona una muestra aleatoria y con una confianza del 95% se ha construido un intervalo para la media poblacional cuya amplitud es de 2'45 cm. a) Cul es sido el tamao de la muestra seleccionada? b) Determina el lmite superior y el inferior del intervalo de confianza si la muestra escogida da una altura media de 170 cm.

64

Anda mungkin juga menyukai