Anda di halaman 1dari 19

UNIVERSIDAD MARIANO GLVEZ DE GUATEMALA

CENTRO UNIVERSITARIO DE PETN


CARRERA DE INGENIERA EN SISTEMAS
CURSO DE PREPRIVADO

PROBABILIDAD Y ESTADSTICA
INTRODUCCIN
El campo de la estadstica trata de la recoleccin, presentacin, anlisis y uso de los datos para
tomar decisiones, solucionar problemas y disear productos y procesos. La estadstica se divide en
dos grandes ramas, la estadstica descriptiva y la estadstica inferencial. La estadstica descriptiva
analiza un conjunto de datos de una poblacin y las conclusiones que se obtienen son propias de
dicha poblacin. La inferencial tambin estudia a una poblacin pero con base en un subconjunto
de valores, llamado muestra y las conclusiones sobre sta se extrapolan a toda la poblacin.

Los datos obtenidos a travs de encuestas, experimentos o cualquier otro conjunto de medidas,
suelen ser tan numerosos que resultan prcticamente intiles si no son resumidos en forma
adecuada. Por ello la estadstica utiliza tanto tcnicas grficas como numricas, algunas de las
cuales son descritos ms adelante.

TIPOS DE DATOS

Los datos pueden ser de dos tipos: cuantitativos o cualitativos. Los datos cuantitativos son los que
representan una cantidad reflejados en una escala numrica. Estos a su vez pueden clasificarse
como cuantitativos discretos si se refieren al conteo de alguna caracterstica o datos cuantitativos
continuos si se refieren a una medida. La variable espesor pertenece a este ltimo tipo.

Los datos cualitativos o categricos se refieren a caractersticas de la poblacin que no pueden


asociarse a cantidades con significado numrico, sino a caractersticas que solo pueden
clasificarse. Clasificar a un grupo de conectores de acuerdo a que si cumplen o no con las
especificaciones del fabricante es un ejemplo.

METODOS GRFICOS Y NUMERICOS PARA DESCRIBIR DATOS CUALITATIVOS


La forma ms sencilla de describir de forma numrica una variable cualitativa es determinar su
distribucin de frecuencias. Supongamos que tenemos una variable cualitativa que toma una serie
de posibles valores (categoras). El nmero de veces que se da cada valor es la distribucin de
frecuencias de la variable. Si en vez de dar el nmero de veces nos fijamos en la proporcin de
veces, tenemos la distribucin de frecuencias relativas.

Los diagramas de barras son una representacin de cada una de las categoras de la variable
mediante una barra colocada sobre el eje X y cuya altura sea la frecuencia o la frecuencia relativa
de dichas categoras. Los diagramas de sectores son crculos divididos en tantos sectores como
categoras, sectores cuyo ngulo debe ser proporcional a la frecuencia de cada categora.
METODOS GRAFICOS PARA DESCRIBIR DATOS CUANTITATIVOS

Si tenemos una variable cuantitativa discreta y sta toma pocos valores, podemos tratarla como si
fuera una variable cualitativa, calcular su distribucin de frecuencias y dibujar un diagrama de
barras.

Ejemplo. En una empresa con cadena de montaje donde se empaquetan piezas en cajas se realiza
un estudio sobre la calidad de produccin. Los datos siguientes informan sobre el nmero de
piezas defectuosas encontradas en una muestra de cajas examinadas:

000000111111111222222222233333334444444555566666777889

Los mismos datos en una distribucin de


frecuencias


0 6
1 9
2 10
3 7
4 7
5 4
6 5
7 3
8 2
9 1

A la derecha el grfico de diagrama de barras, una grfica para datos cuantitativos discretos

Sin embargo, la mayora de variables cuantitativas son de tipo continuo, de manera que toman
demasiados valores como para que la representacin de su distribucin de frecuencias sea til. Por
ello el mtodo grfico ms comn y tradicional para datos cuantitativos es el histograma. El
histograma es una variante del diagrama de barras donde se agrupan los valores de la variable en
intervalos para que estos intervalos tengan frecuencias mayores que uno.

METODOS NUMERICOS PARA DESCRIBIR DATOS CUANTITATIVOS


Es cierto que un diagrama de barras o un histograma nos ayudan a tener una imagen de cmo son
los datos, pero normalmente es necesario complementar esa imagen mediante medidas que, de
forma objetiva, describan las caractersticas generales del conjunto de datos. Estas medidas
responden a las siguientes preguntas: qu datos estn al centro de la distribucin (medidas de
tendencia central), por donde estn los datos (medidas de posicin), que tan agrupados estn los
datos (medidas de dispersin) y qu forma tienen los datos (medias de forma).

MEDIDAS DE TENDENCIA CENTRAL


Las medidas de tendencia central son medidas de posicin que tratan de establecer un valor que
pueda considerarse el centro de los datos en algn sentido.

MEDIA: Esta medida es la ms comn dentro de las de tendencia central y corresponde al centro
de gravedad de los datos. Se calcula sumando todos los datos y dividiendo entre el nmero total
de datos. Sea la media poblacional,

En la mayora de los problemas de estadstica es imposible o poco prctico observar la poblacin


completa, por lo que en gran medida se puede considerar conceptual. De ah que es importante
utilizar la media muestral.

=

Cuando los datos ya estn agrupados en frecuencias utilizar

La desventaja de la media es que es muy sensible al cambio de uno de sus valores o los valores
demasiado grandes o pequeos. De todos modos, es muy usada y muy til porque su ecuacin se
presta para el manejo algebraico

MEDIANA: Es el valor de la variable que deja el mismo nmero de datos antes y despus que l,
una vez ordenados stos. La mediana es el dato que est en el centro de la serie. El clculo de la
mediana depender de si el nmero de datos, n, es par o impar.

+1
La frmula para la determinar la posicin de la mediana es:
2
Si N es impar, la mediana coincide con el dato que se encuentra en la posicin obtenida en la
frmula. Por ejemplo, sean los siguientes 7, 8, 8, 9, 10, 15, 15, 17, 20, 21, 25. La mediana ocupa la
posicin:

(+1) +1 11+1
= = 6. La mediana es el dato que ocupa la posicin 6.
2 2 2

= 15.
Si N es par, se aplica la misma frmula. Utilizando los mismos datos pero eliminando el ltimo para
que n= 10.

(+1) 10+1
= = 5.5. La mediana ocupa la posicin 5 ms el 50% de la diferencia entre el sexto y
2 2
el quinto. Entonces:

= 10 + .5(15-10) = 12.5

De otra manera, se promedian los dos datos del centro, el quinto y el sexto
+
( )
2
( +1)
2 10+15
= = = 12.5.
2 2

La mediana corresponde exactamente con la idea de valor central de los datos. De hecho, puede
ser un valor ms representativo que la media, ya que es ms robusta que la media. Con un
ejemplo se ilustra esto.

Consideremos los datos siguientes: 0 0 1 2 3 4 5


0+0 1+2+3+4+5
Su media es = 2.1 y su mediana es 2.
7
Pero imaginemos que por error o por casualidad obtenemos un nuevo dato enormemente grande
0+0+1+2+3+4+5+80
en relacin al resto de datos, 80. En ese caso, la media sera = 11.9
8
y la mediana 2.5. Es decir, un solo dato puede desplazar enormemente la media, hasta convertirla
en una medida poco representativa, pero slo desplazar ligeramente la mediana. Ese es el motivo
por el que se dice que la mediana es una medida robusta.

MODA O INTERVALO MODAL: En principio la moda se define como el valor ms frecuente de los
datos. Lo que ocurre es que si stos son datos de una variable continua o discreta con muchos
valores, puede que los datos apenas se repitan. En ese caso, en el que, como vimos en las
representaciones grficas, se debe agrupar por intervalos, no debe darse un valor como moda,
sino un intervalo modal, aqul con mayor frecuencia asociada.

MEDIDAS DE POSICIN
Tratan de valorar de manera relativa cmo es un dato respecto del conjunto global de todos los
datos. Si, por ejemplo, un nio de 4 aos pesa 13 kilos, est desnutrido? est sano? La respuesta
debe ser que depende. Dnde vive el nio? Es importante porque, por ejemplo, en Estados
Unidos los nios son en general ms grandes que, por ejemplo, en Japn.

Considerar los datos correspondientes al tiempo de procesado de 25 tareas en un CPU

0.02 0.75 1.17 1.61 2.59


0.15 0.82 1.23 1.94 3.07
0.19 0.92 1.38 2.01 3.53
0.47 0.96 1.40 2.16 3.76
0.71 1.16 1.59 2.41 4.75

CUARTILES: Cuando un conjunto ordenado de datos se divide en cuatro partes iguales, los puntos
de divisin se denominan Cuartiles.

1 = (n + 1)/4 = 6.5, dato del puesto 6: 0.75 + 0.5(0.82 0.75) = 0.785

2 = 2(n + 1)/4 = 13, dato del puesto 13: 1.38 (no hay necesidad de interpolar)

3 = 3(n + 1)/4 = 19.5, dato del puesto 19: 2.16 + 0.5(2.41 2.16) = 2.285

Obsrvese que por los decimales debe efectuarse la interpolacin correspondiente


DECILES: Cuando un conjunto ordenado de datos se divide en 10 partes iguales, los puntos de
divisin se denominan Deciles.

3 = 3(n + 1)/10 = 3(25 + 1)/10 = 7.8, dato del puesto 7: 0.82 + .8(0.92 0.82) = 0.9

5 = 5(25 + 1)/10 = 13, dato del puesto 13: 1.38 Observe que = 2 = 5

CENTILES O PERCENTILES: La serie ordenada de datos se divide en 100 partes iguales y cada punto
de divisin se llaman Percentiles.

25 = 25(n + 1)/100 = 25(25 + 1)/100 = 6.5, dato del puesto 6: 0.75 + 0.5(0.82 0.75) = 0.785

En estadstica, un valor atpico es un dato que es considerablemente diferente a los otros datos de
la muestra. Con frecuencia, los valores atpicos en un conjunto de datos pueden alertar a los
estadsticos sobre las anormalidades experimentales o los errores en las mediciones tomadas, y
debido a esto puede que los descarten del conjunto de datos.

Con el rango intercuartil (RIC), que es la diferencia entre el 3 y el 1 , se pueden determinar los
datos atpicos de una serie. Al 3 se le suma 1.5RIC y al 1 se le resta 1.5RIC. Los valores se la serie
que queden fuera de ese rango se dice que son datos atpicos. Para eliminar un dato atpico debe
evaluarse si es probable que sea real o es una lectura anmala.

MEDIDAS DE DISPERSIN
Aun cuando la media es til, no comunica toda la informacin a cerca la serie de datos. Con las
medidas de dispersin se cuantifica la diversidad o concentracin de los mismos. La variabilidad o
dispersin de los datos puede describirse con la varianza o la desviacin estndar.

VARIANZA: Es un promedio de las desviaciones de cada uno de los datos con respecto a la media
elevados al cuadrado. As la varianza de la poblacin es

2 (=1 )

=1( ) =1
2 = =

En caso que estuviramos trabajando con muestras el divisor de la frmula sera n-1

2 (=1 )

=1( ) =1
2 = =
1 1

La segunda frmula es recomendable por ser ms fcil el clculo de las sumatorias. Se le conoce
como el mtodo corto. Los siguientes datos son la fuerza de desconexin en libras-pie:

12.6, 12.9, 13.4, 12.3, 13.6, 13.5, 12.6, 13.1,


104
8=1 = 104 8=1 2 = 1353.6 =
= 8
= 13.0

(104)
1353.6
2 8
= = 0.2 (libras-pie)
8
DESVIACIN ESTNDAR: Un problema de la varianza es su unidad de medida. En el ejemplo, la
variable est definida en libras-pie, la media en libras-pie pero la varianza se expresa en (libras-
pie). De esa cuenta es que se define la desviacin estndar como la raz cuadrada de la varianza.

= = 0.2 = 0.45 libras-pie


Con lo que concluiramos que la fuerza de desconexin promedio es de 13 libras-pie, con una
tendencia a variar por debajo o por encima de dicha fuerza en 0.45 libras-pie. Esta informacin le
permite al investigador determinar cunto es el promedio y cuanto vara en promedio.

Si la fuerza de desconexin sigue una distribucin normal, aproximadamente:

68% de los datos estarn dentro del intervalo 1 (13.0 1(0.45)), 12.55 ------13.0------13.45

95% de los datos estarn dentro del intervalo 2 (13.0 2(0.45)), 12.10 ------13.0------13.90

COEFICIENTE DE VARIACIN: Expresa la desviacin estndar como porcentaje de la media


aritmtica, mostrando una mejor interpretacin porcentual del grado de variabilidad que la
desviacin estndar. A mayor valor del coeficiente de variacin mayor heterogeneidad de los
valores de la variable; y a menor, mayor homogeneidad en los valores de la variable. Suele
representarse por medio de las siglas CV.

CV = X 100

El coeficiente de variacin permite comparar el nivel de variabilidad entre diferentes grupos ya


que es adimensional. Con la desviacin estndar no es posible comparar porque se ve afectada
por la dimensin de la variable. Por ejemplo, puede utilizarse el CV para comparar la variabilidad
de los pesos cuyos pesos se expresan en libras y otra cuyos pesos se expresan en kilogramos. A
menudo se utiliza el coeficiente de variacin para estimar la representatividad de la media, es
decir, si la media es un buen parmetro para describir un conjunto de datos. Un CV mayor a 20%
indicara que los datos no soy muy homogneos y en consecuencia, una media no muy
representativa.

MEDIDAS DE FORMA
Las medidas de forma tratan de la forma en que se distribuyen los datos con respecto a la media.
Si estn ms distribuidos a la izquierda o a la derecha o si estn ms concentrados o menos
concentrados.

COEFICIENTE DE ASIMETRA
Una situacin ideal es que los datos se repartan en igual medida a la izquierda y a la derecha de la
media. Esa situacin en la que los datos estn repartidos de igual forma a uno y otro lado de la
media se conoce como simetra, y se dice en ese caso que la distribucin de los datos es simtrica.
En ese caso, adems, su mediana, su moda y su
media coinciden. En la grfica del salario actual,
qu nos dice la forma de distribucin de la
variable salario actual que se muestra en el
histograma.

El coeficiente de asimetra es:


( )
As =
()

Un As menor que cero indica asimetra negativa


o un sesgo hacia la derecha, si As mayor que
cero indica asimetra positiva y hay ms valores
o frecuencias debajo de la media (sesgo hacia la
izquierda). Un As igual o prximo a cero indica
simetra. En la grfica de los salarios, se
observa un sesgo hacia la izquierda, asimetra positiva, la mayora de los datos se distribuyen a la
izquierda de la media, es decir, menores a la media.

COEFICIENTE DE CURTOSIS

El coeficiente de curtosis permite determinar el nivel de concentracin de los datos con respecto a
la media. Si la concentracin tiene a ser una distribucin normal se dice que es mesocrtica. Una
alta concentracin de datos es leptocrtica y baja concentracin es platicrtica. La frmula del
coeficiente de curtosis es
( )
K= -3
()
Un valor de este coeficiente igual a cero significa un nivel de apuntamiento como el de una
distribucin normal (mesocrtica). Valores mayores que 0, expresan que la distribucin es
leptocrtica, mientras que si son menores que 0 ponen de manifiesto que la distribucin es
platicrtica.

Los coeficientes de asimetra y de curtosis se han usado como indicadores de la normalidad de


los datos. Un As de 0.5 y un K de 0.5 indican que la curva es normal. Este criterio es de suma
importancia ya que para la mayora de los procedimientos de la estadstica inferencial se requiere
que los datos se distribuyan normalmente.

La principal ventaja de la distribucin normal radica en el supuesto que el 95% de los valores se
encuentra dentro de una distancia de dos desviaciones estndar de la media aritmtica; es decir, si
tomamos la media y le sumamos y le restamos dos veces la desviacin estndar, el 95% de los
casos se encontrara dentro del rango que compongan estos valores.
La distribucin de frecuencias que se muestra a continuacin corresponde a las puntuaciones en
un test de habilidades sociales aplicado a una muestra de 86 sujetos tras la tercera de seis
sesiones que recibieron a fin de mejorar este tipo habilidades

Xi ni (Xi -) ni(Xi - ) ni(Xi - ) ni(Xi - )

0 1 -5 25 -125 625
1 2 -4 32 -128 512
2 4 -3 36 -108 324
3 11 -2 44 - 88 176
4 16 -1 16 -16 16
5 20 0 0 0 0
6 15 1 15 15 15
7 8 2 32 64 128
8 5 3 45 135 405
9 3 4 48 192 768
10 1 5 25 125 625


=1 ( ) 318
S = = = 3.698, S = 3.698 =
86
1.923
( ) 66
As = = = 0.108
() 86(1.923)

( ) 3594
K= -3= - 3 = -0.056
() 86(1.923)

De acuerdo con los coeficientes de As y K que estn dentro del rango sealado, hay normalidad de
los datos.

PROBABILIDAD
EXPERIMENTOS ALEATORIOS

Cuando se mide la corriente elctrica de un alambre de cobre se est realizando un experimento.


Sin embargo, los resultados de la medicin da con da pueden diferir un tanto debido a ligeras
variaciones en las variables del experimento que no estn sujetas a control, como la temperatura
ambiente, variaciones en la fuente de corriente, algunas impurezas del alambre si se seleccionan
lugares diferentes. Por consiguiente, este experimento (as como muchos de los que realizamos)
tiene un componente aleatorio. Debido a que no se conoce de antemano el resultado particular del
experimento, tampoco se conoce el valor de la variable. Por esa razn el nmero que se asocia con
el resultado de un experimento aleatorio de llama variable aleatoria.
Sin importar que tan cuidadosamente se disee y se conduzca un experimento, es frecuente que
ocurran variaciones. De esa cuenta la meta debe ser comprender, cuantificar y hacer un modelo del
tipo de variacin que se encuentra con frecuencia.

Por ejemplo, en la medicin de la corriente elctrica en un alambre de cobre, el modelo del sistema
podra ser simplemente la ley de Ohm. Debido a las entradas no controladas es de esperarse
variaciones en las mediciones de la corriente. Con suficientes mediciones es posible llegar a una
conclusin de la magnitud de la variacin. En ese sentido es importante incluir ese componente en
el anlisis.

ESPACIOS MUESTRALES Y EVENTOS

Un experimento aleatorio es aquel que puede producir resultados diferentes, aun cuando se
repita siempre de la misma manera. Por ejemplo, la energa consumida en una reaccin qumica
puede variar cuando se repita en tiempos diferentes. Se trata de un experimento aleatorio con
varios resultados. En un da de produccin de componentes electrnicos se seleccionan dos al azar
y se observan si cumplen con las especificaciones de regulacin del encendido. Los resultados
dependen de las piezas que se hayan elegido por lo que es tambin un experimento aleatorio,
impredecible de antemano.

Al conjunto de todos los resultados posibles de un experimento aleatorio se le llama espacio


muestral (se denota por S). Un espacio muestral se define de acuerdo con los objetivos del
anlisis. Por ejemplo, se selecciona un conector y se mide su espesor. Si el nico objetivo es
considerar si la pieza cumple o no con las especificaciones de fabricacin, el espacio muestral
seran nicamente dos resultados; S = {si, no}. Ahora, si seleccin dos conectores, el espacio
muestral es S = {ss, sn, ns, nn}. De este ltimo experimento, si slo interesa el nmero de
conectores que cumplen con las especificaciones, S = {0, 1, 2}.

EVENTOS

Un evento es un subconjunto del espacio muestral de un experimento aleatorio. Con el


experimento de seleccionar dos conectores, podemos definir un evento, es decir, un subconjunto
E1 de S: al menos un conector cumple con las especificaciones, E1= {ss, sn, ns}. Dado que los
eventos son subconjuntos, es posible usar las operaciones bsicas de los conjuntos como

Unin de dos eventos es el evento que consta de todos los resultados que estn contenidos en
cualquiera de los dos eventos

Interseccin de dos eventos es el evento que consta de todos los resultados que estn contenidos
en los dos eventos

Complemento de un evento en un espacio muestral es el conjunto de resultados en el espacio


muestral que no estn en el evento.

Volviendo al ejemplo de los dos conectores, definamos otros eventos.

Ninguna de las dos piezas cumple con las especificaciones, E2 = {nn}

Por lo menos una no cumple con las especificaciones, E3 = {sn, ns, nn}
E3= {ss} E2 = {ss, sn, ns}

INTERPRETACIN DE LA PROBABILIDAD

Con frecuencia resulta conveniente cuantificar la veracidad o posibilidad de que ocurrir un


resultado de un experimento aleatorio. La probabilidad de un resultado se interpreta como la
proporcin de veces que ocurre el resultado en n repeticiones. Por ejemplo si se asigna una
probabilidad de 0.2 de que hay una pulsacin viciada en una seal digital significara que si se
analizan muchas pulsaciones, aproximadamente el 20% de las mismas estn viciadas. Este ejemplo
proporciona una interpretacin de la probabilidad a travs de la frecuencia relativa.

Tambin suele interpretarse la probabilidad mediante la asignacin de las probabilidades en el


concepto simple de resultados igualmente factibles. Siempre que un espacio muestral conste de N
resultados posibles que son igualmente factibles, la probabilidad de cada resultado es 1/N. Por
ejemplo si selecciona al azar un diodo lser de un conjunto de 100 diodos, cada uno de los diodos
tienen la posibilidad igual de ser seleccionado. En este caso la probabilidad de cada diodo de ser
seleccionado es 0.01 y, adems, al sumar todas las probabilidades la sumatoria ser igual a 1.

Un experimento aleatorio puede producir los siguientes resultados {a, b, c, d} con las
probabilidades 0.1, 0.3, 0.5 y 0.1, respectivamente. Sea A el evento {a,b}; B el evento {b, c, d} y C el
evento {d}. Entonces

P(A) = 0.1 + 0.3 = 0.4


P(B) = 0.3 + 0.5 + 0.1 = 0.9
P(A) = 0.6
P(AB) = 0.3
P(AUB) = 0,1 + 0.3 + 0.5 + 0.1 = 1

REGLA DE LA ADICIN, PROBABILIDAD CONDICIONAL Y REGLA DE LA MULTIPLICACIN

Tres reglas fundamentales para resolver problemas en donde se desea determinar la probabilidad
de un evento si se conocen las probabilidades de otros eventos que estn relacionados con l.

La regla de la adicin expresa la probabilidad de que ocurran dos o ms eventos a la vez. Las
operaciones bsicas con conjuntos resultan tiles para determinar la probabilidad de un evento
conjunto. Para eventos mutuamente excluyentes (no tienen elementos en comn), simplemente
se suman ambas probabilidades

P(AUB) = P(A) + P(B)


A U A = S
A A =
P(AUA) = 1 = P(A) + P(A)

Para eventos con interseccin, es decir, eventos traslapados (tienen elementos en comn),
sumamos la probabilidad de A con la probabilidad de B y restamos la interseccin porque no se
pueden sumar dos veces.
P(AUB) = P(A) + P(B) P(AB)

Si E = (AUB) entonces P(E) = 1 P(AUB)

En la rifa de su pueblo usted compra un nmero de los 100 que se emiten. El evento de ganar el
premio lo designaremos como A, por lo que P(A) = 1/100. Al da siguiente de celebrarse el sorteo
alguien le informa que el nmero premiado termina en 5. Ahora, la nueva probabilidad de ganar el
premio ha aumentado, P(A) = 1/10 porque solo hay 10 nmeros terminados en 5.

Supongamos que originalmente su nmero es 35. Repasemos los elementos que han intervenido
en la nueva situacin. El evento original A = {ganar el premio con el nmero 35} pero ahora
tenemos un nuevo evento, B = {el nmero premiado termina en 5}, de cuya ocurrencia se nos
informa a priori. Observamos que AB = {el nmero 35} y que la nueva probabilidad de A
condicionada por la ocurrencia del evento B, denominada probabilidad condicional, es:

P(AB) = P(AB)/P(B), donde P(AB)= probabilidad de A y probabilidad de B = P(A) X P(B)

Veamos este ejemplo de probabilidad condicional. En un proceso de fabricacin, 10% de las piezas
presentan imperfecciones superficiales visibles y 25% de las piezas con imperfecciones
superficiales son funcionalmente defectuosas. Sin embargo, solo 5% de las piezas sin
imperfecciones superficiales son funcionalmente defectuosas. Sea D el evento de que una pieza es
funcionalmente defectuosa y sea F el evento de que una pieza tiene una imperfeccin superficial.

Se selecciona una pieza, cul es la probabilidad de que sea funcionalmente defectuosa (P(D))
dado que la pieza tiene una imperfeccin superficial (P(DF)?

P(DF) = P(DF)/P(F) = (0.25)(0.10)/(0.10) = 0.25

Un lote de 100 chips semiconductores contiene 20 que estn defectuosos. Se seleccionan dos
chips al azar, sin reemplazo.

a) Cul es la probabilidad de que el primero que se seleccione est defectuoso? R. 20/100


b) Cul es la probabilidad de que el segundo que se seleccione est defectuoso, dado que el
primero estuvo defectuoso? A: el primero es defectuoso, B: el segundo es defectuoso
P(BA) = P(AB)/P(A) = (20/100) X (19/99)/ (20/100) = 19/99
c) Cmo cambia la respuesta del inciso b) si los chips seleccionados se reemplazaron antes
de la siguiente seleccin? Si se reemplaza, P(B) = P(A)

En algunos casos la probabilidad condicional P(BA) podra ser igual a P(B). Esta situacin se debe
a que el resultado del evento A no afecta a la probabilidad del evento B, tal como sucedi en el
inciso c) del ejemplo anterior. Hay independencia entre un evento y otro.

Suponga que la produccin de un da de 850 partes manufacturadas contiene 50 que no cumplen


con los requisitos del cliente. Se seleccionan dos partes pero la primera se reemplaza antes de
extraer la segunda. Sea que B denote que la segunda parte seleccionada es defectuosa y A de que
la primera parte es defectuosa. Cules son las probabilidades de cada evento?

P(A) = 50/850 P(BA) = 50/850 La probabilidad es la misma porque son independientes.


Bajo la misma condicin de reemplazo, cul es la probabilidad de que la primera P(A) y la
segunda P(B) sean defectuosas?

P(AB) = P(A)P(B) = 50/850 X 50/850 = 0.0035

Cuando se consideran ms eventos es posible ampliar la definicin de independencia. Por


ejemplo, si hubiesen sido tres piezas las extradas con reemplazo, cul es la probabilidad de A, B y
C?

P(ABC) = P(A) X P(B) X P(C)

En la siguiente ilustracin cada dispositivo falla independientemente y la probabilidad de cada uno


funcione se indica en la ilustracin. La probabilidad de que el componente C1 funcione es o.95,
igual que C3 Cul es la probabilidad de que el circuito opere de A a B?

P(circuito opere) = P(C1 funcione o C3 funcione) = P(C1 o C3)

P(C1 o C3) = 1 - P[(C1 o C3)] = 1 - P(C1 y C3) = 1 P(C1)P(C3) =


1- (0.05)(0.05) = 0.9975

Si el circuito tuviera un solo dispositivo, la probabilidad del que


opere es de 0.95. Al ser dos dispositivos obviamente la
probabilidad que funcione aumenta (0.9975).

De los elementos presentados se deduce que el circuito en


paralelo la probabilidad de que funcione aumenta y en serie, la
probabilidad de que funcione, disminuye.

La regla de la multiplicacin consiste en reescribir la definicin de la probabilidad condicional para


proporcionar una expresin de la probabilidad de la interseccin de dos eventos. Expresa la
probabilidad de que suceda el evento A y el evento B simultneamente.

P(AB) = P(AB)P(B) =P(BA)P(A)

La probabilidad de que un conector elctrico que se mantenga seco falle durante el periodo de
garanta de una computadora porttil es 1% y la probabilidad de que un conector se mantenga
seco es del 90%. Sea A el evento de que el conector falle y B el evento de que se mantenga seco.
Entonces la probabilidad de que un conector elctrico durante el periodo de garanta se mantenga
seco y que tambin falle:

P(AB) = P(AB)P(B)= 0.01 X 0.9 = 0.009

Al problema anterior se le puede aadir ms informacin. Si el conector elctrico se mantiene


hmedo la probabilidad de que la computadora en el periodo de garanta falle es del 5%. Por
diferencia la probabilidad de que se mantenga hmero es 10%. Ahora la posibilidad de que falle
puede provenir de dos ambientes, seco y hmero. La regla de la probabilidad total permite unir al
evento A de un ambiente seco (B) y de un ambiente hmedo (B).

P(A) = P(AB) U P(AB) = P(AB)P(B) + P(AB)P(B) = 0.01 X 0.9 + 0.05 X 0.1 = 0.014
La universidad est formada por tres facultades:

- La primera con el 50% de los estudiantes


- La segunda con el 25% de los estudiantes
- La tercera con el 25% de los estudiantes.

Las mujeres estn repartidas uniformemente siendo


el 60% en cada facultad. Cul es la probabilidad de
seleccionar un estudiante:

a) Que sea alumna de la primera facultad

P(que sea alumna y que sea de la 1era facultad)= P(AB)= P(BA)P(A) = 0.6 X 0.5 = 0.3 (regla de la
multiplicacin

b) Que sea de la primera facultad

P(que sea de la primera facultad) = P(A) = 0.5

c) Que sea alumna

P(que sea alumno de cualquier facultad) = P(A) = P(AB) + P(AB) + P(AB) = (0.6 X 0.5) + (0.6 X
0.25) + (0.6 X 0.25) = 0.6 (regla de la probabilidad total)

TEOREMA DE BAYES

En trminos ms generales y menos matemticos, el teorema de Bayes es de enorme relevancia


puesto que vincula la probabilidad de A dado B con la probabilidad de B dado A. Es decir, por
ejemplo, que sabiendo la probabilidad de tener un dolor de cabeza (A) dado que se tiene gripe (B),
se podra saber (si se tiene algn dato ms), la probabilidad de tener gripe (B) si se tiene un dolor
de cabeza (A).

En una operacin de llenado automatizado, la probabilidad de un llenado incorrecto cuando el


proceso opera a baja velocidad es 0.001. Cuando el proceso opera a alta velocidad la probabilidad
de un llenado incorrecto es 0.01. Suponga que 30% de los recipientes se llenan cuando el proceso
opera a alta velocidad y el resto se llena cuando el proceso opera a baja velocidad.

Antes de las preguntas analicemos el problema. Hay dos situaciones, operar a alta o baja velocidad
y llenar correcta o incorrectamente. Evento A, operar a alta velocidad y evento B, llenar
correctamente.

Cul es la probabilidad de que un recipiente sea llenado incorrectamente? Preguntan por la


probabilidad de B. Se llena a alta o baja velocidad (A). Se aplica la regla de la probabilidad total
porque en ambos escenarios, alta y baja velocidad hay llenados incorrectos.

P(B) = P(BA)P(A) + P(BA)P(A) = (0.001)(0.3) + (0.01)(0.7) = 0.0073

Si se encuentra un recipiente llenado incorrectamente, cul es la probabilidad de que se haya


llenado durante una operacin de alta velocidad? En este problema no preguntan por el evento B,
pregunta por A. Preguntan por A en funcin de B ((AB)), por lo que se debe calcular P(AB). Para

P(AB) = P(BA)P(A)/ P(BA)P(A) + P(BA)P(A) = (0.001)(0.3)/[(0.001)(0.3) + (0.01)(0.7)] = 0.0042

VARIABLES ALEATORIAS DISCRETAS Y DISTRIBUCIONES DE PROBABILIDAD


La distribucin de probabilidad de una variable aleatoria X es una descripcin de las
probabilidades asociadas con los valores posibles de X. Para una variable aleatoria discreta, es
comn especificar la distribucin con una lista de los valores posibles junto a la probabilidad de
cada uno. Si definimos la variable aleatoria X como el nmero resultante tras el lanzamiento de
un dado, los valores que puede tomar la variable son {1, 2, 3, 4, 5, 6} y sus probabilidades
asociadas es la misma (1/6) para cada uno de los resultados posibles.

Un sistema de comunicacin contiene 48 lneas externas. En un momento particular algunas de las


lneas estn en uso. Sea la variable aleatoria X que denota el nmero de lneas que estn en uso, la
cual puede asumir cualquiera de los valores enteros de 0 a 48. En determinado momento se
observa, si 10 estn en uso entonces x = 10

DISTRIBUCIN BINOMIAL

Un ensayo que solo tiene dos resultados posibles y que los ensayos que constituyen el
experimento son independientes por lo que un ensayo no afecta a otro, se dice que es un ensayo
de Bernoulli. En un ensayo de Bernoulli, la probabilidad de un xito se mantiene constante.

La probabilidad de que un bit transmitido a travs de un canal de transmisin digital se reciba con
error es 0.1 (evidentemente que no se reciba con error es 0.9). Suponiendo que lo ensayos son
independientes. Sea X el nmero de bits con error en los siguientes cuatro bits transmitidos.
Determinar P(X = 2). Con un diagrama de rbol puede determinar todos los posibles resultados
(2^4) = 16. De estos 16 resultados, el evento X = 2 consta de 6 resultados: EEOO, EOEO, EOOE,
OEEO; OEOE, OOEE. La probabilidad de cada uno de estos resultados es:
P(EEOO) = P(E)P(E)P(O)P(O) = 0.1 X 0.1 X 0.9 X 0.9 = 0.0081 (utilizando el supuesto de
independientes. Al ser 6 resultados similares y todos con la misma probabilidad, la probabilidad de
X = 2 es 6(0.0081) = 0.0486

Un experimento aleatorio que consta de n ensayos repetidos tales que: 1) los ensayos son
independientes, 2) cada ensayo produce nicamente dos resultados posibles, etiquetados como
xito y fracaso, y 3) la probabilidad de un xito en cada ensayo, denotada por p, permanece
constante, se llama experimento binomial. La variable aleatoria X que es igual al nmero de
ensayos que producen un xito tiene una distribucin binomial. Su expresin formal es:

P(X= x) = ( ) (1 )

Cada muestra de aire 10% de posibilidades de contener una molcula rara. Suponga que las
muestras son independientes. Cul es la posibilidad de que en las siguientes 18 muestras,
exactamente 2 contengan la molcula rara?

Solucin: Hay un nmero definido de ensayos (n = 18), hay una probabilidad constante = 0.1), y un
valor de X = 2.
18
P(X = 2) = ( ) (0.1)2 (0.9)182 = 153(0.1)2 (0.9)16 = 0.284
2
Determinar la probabilidad de que al menos cuatro muestras contengan la molcula rara.
18
P(X4) = ( ) (0.1)2 (0.9)18

Es mucho ms sencillo usar el evento complementario.

P(X4) = 1 P(X<4) = 1- [P(X = 0) + P(X=1) + P(X=2) + P(X=3)]= 1- (0.150 + 0.300 + 0.284 + 0.168)

P(X4) = 0.098

DISTRIBUCIN GEOMTRICA

En lugar de mantener fijo un nmero constante de ensayos, veamos la situacin de que la variable
aleatoria X denote el nmero de ensayos hasta lograr el primer xito. Por ejemplo, la probabilidad
de que un bit trasmitido a travs de un canal de transmisin digital se reciba con error es 0.1.
Entonces la variable aleatoria X ser el nmero de bits transmitidos hasta el primer error. Por
ejemplo, cual es la probabilidad de que el primer xito se consiga despus de los primeros cuatro,
es decir hasta el 5, P(X=5)

P(X=5) = P(OOOOE) = (0.9) X (0.9) X (0.9) X (0.9) X (0.1) = (0.9)^4(0.1) = 0.066

La expresin formal de la variable aleatoria X representa el nmero de ensayos hasta el primer


xito es:

P(X=x) = ( ) p , x = 1, 2, 3, .

La probabilidad de una alineacin ptica de xito en el ensamblaje de un producto de


almacenamiento ptico de datos es de 0.8. Suponga que los ensayos son independientes. Cul es
la probabilidad de que la primera alineacin de xito requiera a lo sumo cuatro ensayos?
P(X4) = P(X = 4) + P(X = 3) + P(X = 2) + P(X = 1) =

= (1 0.8)41 (0.8) + (1 0.8)31 (0.8) + (1 0.8)21 (0.8) + (1 0.8)11(0.8)

= 0.9984

Cul es la probabilidad de que la primera alineacin de xito requiera al menos cuatro ensayos?

P(X 4) = 1- P(X <4) = 1- [P(X = 3) + P(X = 2) + P(X = 1)]

DISTRIBUCIN BINOMIAL NEGATIVA

Una generalizacin de la distribucin geomtrica es la distribucin binomial negativa en la que la


variable aleatoria X es el nmero de ensayos de Bernoulli requeridos para obtener r xitos.
Entonces X tiene una distribucin binomial negativa y su frmula es

P(X = x) = ( ) ( ) para x = r, r + 1, r+2,

La probabilidad de que la calibracin de un transductor en un instrumento electrnico cumpla con
las especificaciones del sistema de medicin es 0.6. Cul es la probabilidad que se necesiten tres
operaciones de calibracin para cumplir con las especificaciones del sistema de medicin?

Solucin: X =3, r = 1
31
P(X = 3) = ( ) (1 0.6)31 0.61 = 0.092
11
DISTRIBUCIN DE POISSON

La distribucin de probabilidad de Poisson es una distribucin de probabilidad de una variable


aleatoria discreta que nos proporciona, a partir de una frecuencia de ocurrencia media (), la
probabilidad de que ocurra un determinado nmero de veces (variable aleatoria X) en un intervalo
determinado de tiempo, longitud, rea, volumen. Otros ejemplos de intervalos: partculas de
contaminacin en la fabricacin de semiconductores, imperfecciones en rollos de tela, llamadas a
una central telefnica, interrupciones de la energa elctrica, partculas atmicas emitidas por una
muestra.

Un alambre delgado de cobre presenta imperfecciones aleatoriamente distribuidas a lo largo de


determinada longitud L. Suponga que el promedio de imperfecciones a lo largo de L es . Entonces
la variable aleatoria X ser el nmero de imperfecciones en la longitud L. Por ejemplo, en un
intervalo de 1 mm de longitud del alambre se encuentran en promedio 2.3 imperfecciones,
queremos saber la probabilidad de que se encuentran 2 imperfecciones. La frmula de la
distribucin de Poisson:


P(X = x) =
!

En el ejemplo, = 2.3 imperfecciones en un mm, probabilidad buscada X = 2, e = 2.71828.

2.3 2.32
P(X = 2) = = 0.265
2!
En la probabilidad de Poisson es importante usar unidades consistentes, es decir, debe
mantenerse la relacin entre el promedio y la longitud del intervalo ya que sta puede variar.
Determinar la probabilidad de 10 imperfecciones en 5 mm. Entonces, 2.3/mm equivalen a 11.5
imperfecciones en 5 mm.

11.511.510
P(X = 10) = = 0.113
10!

Consideremos a probabilidad de al menos una imperfeccin en 2 mm de alambre. Preguntan


desde una imperfeccin en adelante. Mejor calcular la de cero y restar de 1. El promedio, ,
cambia (si en un mm hay 2.3 imperfecciones, en 2 mm habrn 4.6 imperfecciones.

4.64.60
P(X 1) = 1- P(X = 0) = 1- = 1 0.01005 = 0.9899 Altsima la probabilidad, lgico
0!

VARIABLES ALEATORIAS CONTINUAS Y DISTRIBUCIONES DE PROBABIIDD

DISTRIBUCION NORMAL

La distribucin normal es el modelo de uso ms generalizado para la distribucin de una variable


aleatoria. Casi siempre se saca el promedio de los resultados. Si se supone que cada medicin es el
resultado de una repeticin de un experimento aleatorio, entonces puede usarse la distribucin
normal para sacar conclusiones aproximadas de este resultado promedio. Esto es posible dado las
propiedades de la distribucin normal.

Algunos resultados de utilidad asociados a la distribucin normal son los siguientes:

P(X > ) o P(X < ) = 0.5 La probabilidad de que cualquier valor de X sea mayor o menor a es 0.5
P(X = 1) = 0.6827 El 68.27% de los datos de una serie caen dentro de 1 respecto a la media
P(X = 2) = 0.9545 El 95.45% de los datos de una serie caen dentro de 2 respecto a la media
P(X = 3) = 0.9973 El 99.73% de los datos de una serie caen dentro de 3 respecto a la media

Para calcular la probabilidad o rea bajo la curva se necesita determinar el valor de Z



Z=

Las mediciones de la corriente en una tira de alambre siguen una distribucin normal con una
media de 10 miliamperios y una varianza de 4. Cul es la probabilidad de que una medicin
exceda a 13 miliamperios?
13 10
Z= 2
= 1.5 Se debe determinar el rea bajo la curva a la derecha de este valor de Z.
P(X > 13) = P(Z > 1.5) 1- P(Z 1.5) = 1 - 0-93319 = 0.06681

Cul es la probabilidad que una medida est entre 9 y 11 amperios?


P(9<X<13) = P(X= 13) P(X = 9)

= P(13 - 10)/2 P(9 10)/2

= P(Z = 1.5) P(Z = -1.5)

= 0.69146 0.30854

= 0.38292

El dimetro de un eje en un propulsor de almacenamiento ptico, tiene una distribucin normal


con una media de 0.2508 pulgadas y una desviacin estndar de 0.0005 pulgadas. Las
especificaciones de los ejes son 0.2500 0.0015 pulgadas. Qu proporcin de los ejes cumple con
las especificaciones?
0.24850.2508 0.25150.2508
P(0.2485 < X < 0.2515) = P( 0.0005
<Z< 0.0005
)

= P(-4.6 < Z < 1.4)

= P(Z < 1.4) P(Z< -4.6)

= 0.91924 0.0000

= 0.91924

APROXIMACIN DE LA DISTRIBUCIN NORMAL A LA DISTRIBUCIN BINOMIAL

En muchos casos es complicado calcular probabilidades utilizando la distribucin binomial. Por


ejemplo, si se transmiten 16 millones de bits y la probabilidad de que un bit se reciba con error es
0.00001 y queremos calcular la probabilidad de que se presenten ms de 150 errores. Es un
problema de distribucin binomial porque hay un nmero definido de experimentos (16 millones),
una probabilidad constante, solo hay dos resultados posibles, los eventos son independientes y
hay un valor de X dado (150).

Es ms prctico y de repente, la nica manera de resolverlo, utilizar la aproximacin de la


distribucin normal. La aproximacin es buena utilizarlo cuando np > 5 y n(1-p) > 5. La frmula de
la aproximacin a la distribucin binomial es:

Z=
(1)

P(X > 150) = 1 P(X 150)

150(16 106 )(0.00001)


Z= = -0.79, el valor de Z en la tabla es 0.2147
(16 106) (0.00001)(10.00001)

P(X > 150) = 1 0.2147 = 0.785

APROXIMACIN NORMAL A LA DISTRIBUCIN DE POISSON


Suponga que el nmero de partculas de asbesto en un centmetro cuadrado de polvo sigue una
distribucin de Poisson con una media de 1000. Si se analiza un cm de polvo, cul es la
probabilidad de encontrar menos de 150 partculas. La probabilidad puede expresarse
exactamente como:

1000 1000
P(X 950) = 150
=0 !
Habra que calcular la probabilidad uno a uno hasta llegar a 150 y luego sumar los 151 resultados.
La dificultad es evidente. Si > 5 la aproximacin de la normal a la de Poisson es buena. Entonces
el valor de Z de la distribucin normal es

Z=

Calculamos el valor de Z y en la tabla determinamos el rea bajo la curva a la izquierda


950 1000
Z= = -1.58
1000

P(X 150) = P(Z -1.58) = 0.057

Anda mungkin juga menyukai