Anda di halaman 1dari 63

Es un sistema matemático compuesto de términos definidos e

indefinidos y de un conjuntos de suposiciones relativas a


ellos; de todo ello obtenemos conclusiones lógicas, esto es,
demostramos teoremas. Es una disciplina abstracta que
usamos como modelo para hacer deducciones relativas a
eventos que posiblemente pueden suceder en una operación
física real o imaginaria
La teoría de la probabilidad nos permite hacer deducciones
partiendo de modelos matematicos que esperamos sean
suficientemente exactas al ser utilizadas para conocer el
comportamiento de ciertos modelos usados. (*)

_Cada vez que utilizamos las matematicas con el objeto de


estudiar fenómenos observables, es indispensable empezar
por construir un modelo matematico (deterministico o
probabilístico) para estos fenómenos.

En la presentación de la presente monografía en primer lugar


hacemos una revisión de los conceptos y términos usados en
la estadística y en las probabilidades en general; puesto que
son necesarias y sirven como un vocabulario estadístico, para
luego hacer una revisión histórica de las nociones básicas de
probabilidad, las que nos llevan hacer las definiciones
clásicas y axiomaticas de la probabilidad, se hace una
demostración de las propiedades inherentes al estudio de las
probabilidades se hace una revisión de la probabilidad
condicional, el teorema de bayes, las variables aleatorias
discretas, se estudia el modelo de distribución binomial y en
forma mínima las variables aleatorias continuas.

Finalmente espero que el presente material sirva para que los


alumnos y lectores en general puedan tenerlo como material
de referencia y finalmente disculpándonos por las posibles
fallas u omisiones que pudiera tener; ya que son propias de la
mente humana.

1
SINTESIS

Mientras que la estadística se puede describir como la ciencia


y el arte de recopilar, resumir y analizar datos e inferir, estimar
y proyectar valores y consecuencias a partir de estos
elementos, la probabilidad se puede definir como el estudio
de fenómenos o experimentos puramente aleatorios o libres
de determinación. En el estudio de la probabilidad interesa
deducir las leyes del azar y los resultados que estos
determinan.
La probabilidad como un modelo matematico se inicio de los
juegos al azar, luego se definió en forma intuitiva, para que
después de un análisis profundo alcanzara la definición
axiomatica en las que reúnen muchas propiedades y tiene
diversas aplicaciones en el desarrollo de la ciencia en
general, como la economía, la medicina, la investigación
científica; etc.

APRECIACION CRITICAS Y SUGERENCIAS

Para una comprensión adecuada de los modelos estadísticos


y de las probabilidades en general es necesario que se debe
tener una buena preparación matematica y muchos pre
requisitos puesto que sin ellos es tedioso la comprensión y el
manejo adecuado de dicha disciplina; ya que tienen diversas
aplicaciones en al vidad real.
Del mismo modo hacemos una sugerencia a quienes dirigen
la parte academica de la Une y del departamento académico
matematica e informática en particular a que en la curricula
en el desarrollo de la asignatura deben ser adecuados y de
buen nivel.

2
CAPITULO I

CONCEPTOS PREVIOS

3
1. RESEÑA HISTÓRICA
La estadística evolucionó conjuntamente con la humanidad organizada, surgió ante la
necesidad que tuvieron de conocer y guardar información, entre otros, con fines de
reparto de tierras, recaudación de impuestos, manejo de recursos de disputa de
territorio, etc. Así el emperador Yao (China, 2238 a. C) realizó un censo en su imperio,
a inicios de la era cristiana el rey Herodes ordenó el empadronamiento de su
población, después del nacimiento de Jesús. La estadística como disciplina tuvo sus
inicios en Alemania a mediados del siglo XVII, en el reinado de Godofredo de
Achenwall (1719 - 1772), quienes utilizaron el término estadística y lo separaron de la
sociología. Con el desarrollo de la teoría de la probabilidad por Carl Friedrich Gauss
(1777 - 1855) y Bernoulli cobra trascendencia y hoy se aplica en todos los campos del
saber.

2.- ESTADISTICA
El origen etimológico de la palabra estadística no está bien determinada. Para
algunos viene de la voz griega STATERA que significa “balanza”, otros sostienen
que deriva del latin STATUS que significa “situación”, mientras que algunos afirman
que viene del alemán STAAT que significa “estado”.
La evolución y desarrollo de la Estadística en el mundo actual definitivamente ha
superado el significado etimológico de esta ciencia.
En el intento de precisar una idea o definición, se puede decir que la Estadística es
la ciencia que tiene por objeto la clasificación y análisis de conjuntos de datos de
observaciones, para interpretarlos y obtener leyes y relaciones entre ellas. Es la
ciencia que orienta la toma de decisiones a partir del análisis e interpretación de
observaciones realizadas en forma directa o experimentalmente.

2.1 CLASIFICACION DE LA ESTADISTICA

2.1.1 ESTADISTICA DESCRIPTIVA .- La Estadística Descriptiva es una parte de la


estadística se ocupa del desarrollo y utilización de técnicas para presentar,
procesar y analizar datos (ejemplo: edad de los habitantes de un distrito, peso
de los estudiantes de una escuela, temperatura de los días en los meses de
verano, etc.) en forma eficaz, con la finalidad de extraer conclusiones sobre el
comportamiento de la variables (características o propiedades), sin pretender
que estas conclusiones sean de tipo mas general.

2.1.2 ESTADISTICA INFERENCIAL.- Parte de la Estadística que se ocupa de los


procesos de estimación, análisis y prueba de hipótesis, con el propósito de llegar
a conclusiones que brinden una adecuada base científica para la toma de
decisiones tomando como base la información captada por la muestra.

2.1.3 SEGÚN LA NATURALEZA DE LA VARIABLE


4
a) Estadística de Atributos o Datos Cualitativos.
Cuando expresan una cualidad, característica o atributo, como por ejemplo:
estado civil, los colores, lugar de nacimiento, profesiones, formas, etc.
b) Estadísticas de Variable o Datos Cuantitativos.
Cuando el valor de la variable se expresa por una cantidad, valor que puede
resultar de la operación de contar o medir. Ejemplo: Edad, número de hijos
por familia, ingresos, nivel de desempleo, producción, etc.

Los datos cuantitativos pueden ser:


b.1) Variable Discreta
Cuando el valor de la variable resulta de la operación de contar, su valor
está representado por los números naturales (enteros positivos).
Ejemplo: número de hijos por familia, aulas por centro educativo,
profesores por categoría docente, etc.

b.2) Variable Contínua


Cuando la variable es susceptible de medirse, aquella cuyo valor se
obtiene por medición o comparación con una unidad. El valor de la
variable se expresa por cualquier número real. Ejemplo: área de parcelas,
ingresos monetarios, peso, estatura, niveles de empleo, etc.

2.1.4 SEGÚN EL ORDEN DE LAS OBSERVACIONES:


a) Datos Atemporales o no Ordinales
Cuando se prescinde del orden en que se realiza las observaciones. El orden de
la observación no altera el valor de la variable. Ejemplo: Averiguar las edades de
los alumnos de un aula, en este caso cualquiera sea el orden que se elijan los
alumnos, la edad no va a variar.
b) Series Cronológicas o Históricas
Cuando en la obtención de los datos se tiene en cuenta el orden cronológico de
la observación, o a que momento del tiempo pertenece. Son variables
analizadas en función al tiempo. Ejemplo: Población demográfica en la década
1970 – 1980, variación de precios, volúmenes de exportaciones, etc.

2.1.5 SEGÚN EL NUMERO DE VARIABLES


a) Estadística Unidimensionales.- Son las estadísticas de una sola variable,
es el caso de considerar sólo un aspecto del fenómeno estudiado. Ejemplo:
clasificar personas por edad, viviendas por el número de habitaciones, la
estatura de los estudiantes.
b) Estadística Bidimensionales.- Cuando se considera simultáneamente dos
variables o aspectos en cada elemento del conjunto o fenómeno que se
estudia. La bidimensional requiere que las variables tengan cierta asociación
de modo que una variable pudiera de alguna manera explicar el

5
comportamiento de la otra. Ejemplo: Profesores por edad y tiempo de
servicio, producción por años, etc.

2.1.6 SEGÚN LA ESCALA DE MEDICIÓN


a) Variables Nominales.- Son aquellas variables que establecen la distinción
de los elementos en diversas categorías, sin implicar algún orden entre ellas.
Distribuye a la unidad de análisis en dos o más categorías. Ejemplo: Sexo,
estado civil, deporte que practica, lugar de nacimiento, profesiones, etc.
b) Variables Ordinales.- Son aquellas variables que implican orden entre sus
categorías, están referidas a un orden o jerarquía, donde las categorías
expresan una posición de orden. Ejemplo: grado de instrucción, clases
sociales, grado de simpatía, orden de mérito, rango de agresividad.
c) Variables de Intervalo.- Son aquellas que suponen a la vez orden y grados
de distancia iguales entre las diversas categorías, pero no tienen un origen
natural, sino convencional. Ejemplo: Coeficiente de inteligencia, temperatura,
puntuación obtenida en una escala, etc.
d) Variables de Razón.- Estas variables comprende a la vez a todos los casos
anteriores, distinción, orden, distancia y origen único natural; el valor se
expresa con un número real. Ejemplo: Edad, peso, ingresos, números de
hijos, producción, accidentes de transito.

2.2 OBJETIVO DE LA ESTADISTICA


En términos generales los objetivos de la Estadística pueden ser clasificados en tres
capítulos: descripción, análisis y predicción.
a) Descripción de grandes colecciones de datos empíricos.- La descripción
supone que los datos que vienen expresados en su forma general deben ser
clasificados y presentados sistemáticamente en tablas, como una primera
reducción de datos, sin embargo la “reducción” de datos propiamente dicha
se obtiene cuando el comportamiento y características de los datos se
expresan por un conjunto de indicadores, medidas de resumen o
estadígrafos.
b) Análisis Estadístico de datos experimentales y de los fenómenos
observados.- Toda investigación estadística incluye un problema de análisis
con el objeto de formarse un concepto de una población o universo y adoptar
decisiones; en este caso no es necesario observar toda la población, sino
que será suficiente elegir una muestra representativa, la que será estudiada
con detalle para obtener conclusiones y resultados, que dentro de ciertos
márgenes de aceptación sean válidas a toda la población de la cual fue
elegida la toda la muestra. Ejemplo para analizar la sangre de una persona,
será suficiente extraer una pequeña cantidad de sangre, del mismo modo
para conocer la demanda de un artículo.
c) Predicción o comportamiento de los fenómenos en el futuro.- La
predicción puede entenderse como la estimación de resultados en el futuro.
Este objetivo de predicción y previsión está implícito tanto en la descripción

6
como en el análisis estadístico, puesto que en general interesa orientar la
toma de decisiones con vigencia y efecto en el futuro.

3. ORGANIZACIÓN DE DATOS
Los datos recopilados se organizan generalmente en tablas de frecuencias o tablas
de contingencia, para identificar las principales características del conjunto.
Las tablas de frecuencias y las representaciones gráficas son dos maneras
equivalentes de presentar la información, ambas sirven para: ORDENAR,
AGRUPAR, RESUMIR información.

Presentación ordenada de datos. Distribución de Frecuencias.

3.1. Tipos de Frecuencias:

a) Frecuencia Absoluta (fi). Número de veces que se presenta un valor o


categoría de una variable.

b) Frecuencia Relativa (hi). Es la proporción de la frecuencia de los datos


respecto al total. La frecuencia relativa se puede expresar en términos
porcentuales.

hi = fi/n

c) Frecuencia Absoluta Acumulada (Fi).


F1 = f1
F2 = f1 + f2
F3 = f1 + f2 + f3
.
.
Fk = f1 +f2 + f3 + … + fk = n

d) Frecuencia Relativa Acumulada (Hi).

H1 = h1
H2 = h1 + h2
H3 = h1 + h2 + h3
……………………………..
Hk = h1 +h2 + h3 + … + hk = 1 ó 100%

3.2. Presentación de datos cualitativos. Los datos se agrupan en clases.

Género Frecuencia.

7
Hombre 4

Mujer 6

Gráfico de barras

Pictograma

3.3. Presentación de datos cuantitativos

a. Cuantitativos discretos.

Nº de
hermanos fi
1 6
2 8
3 10
4 7
5 5

b. Cuantitativos continuos.

Cuando el número de elementos es extenso, los datos tienen que ser agrupados
en clases o intervalos. El número de intervalos en los que se agrupa la
información es una decisión que debe tomar el especialista, sin embargo, se
puede utilizar la regla de Sturges o la raíz cuadrada del número total de datos
 n  . Así:
Regla de Sturges K  1  3.3 log n

Si se utiliza esta regla, es necesario determinar el ancho de clase (w: longitud de


un intervalo de clase):
l ( A)
w , donde l ( A)  dato memor, dato mayor
K

Nivel de Colesterol Nº de personas


(mg/100 ml) (fi)
80-120 13
120-160 150

8
160-200 442
200-240 299
240-280 115
280-320 34

3.4 Presentación Gráfica:

a. Gráficos para variables cualitativas


• Gráfico de barras
- Alturas proporcionales a las • Gráficos circulares
frecuencias (absolutas o - El área de cada sector es
relativas proporcional a su frecuencia
- Se pueden aplicar también a (absolutas o relativas porcentual)
variables discretas.

• Pictogramas
- Son fáciles de entender.
- El área de cada modalidad debe ser proporcional a la frecuencia.
Consumo de carne de porcino

b. Gráficos para variables cuantitativas

– Gráfico de barras: Se utiliza


para los datos cuantitativos
discretas.

9
419
– Histogramas: Se utiliza para datos
400 375
cuantitativos continuos.
300

255

Recuento
250
215
200

200
127

Recuento
100
150
54
24 23 17
100
0 1 2 3 4 5 6 7 Ocho o más

Número de hijos
50

20 40 60 80

Edad del encuestado

10
- Otros Gráficos:

Gráfico escalonado

4. DESCRIPCIÓN DE LOS DATOS

La descripción de los datos se realiza a través de los estadígrafos o parámetros,


según se refieran a la población o muestra. Estos pueden ser:
1. De posición: Ubica el valor central de una distribución.
2. De dispersión: Mide el grado de desviación de los datos respecto a una medida
de posición.

4.1 MEDIDAS DE POSICIÓN

También llamadas de centralización o de tendencia central. Sirven para estudiar


las características de los valores centrales de la distribución atendiendo a distintos
criterios.

Así, si queremos describir de una forma breve y precisa los resultados obtenidos
por un grupo de alumnos en un cierto examen; diríamos:

a) La nota media de la clase es de 12.


b) La mitad de los alumnos han obtenido una nota inferior a 11.
c) La nota que más veces se repite es el 8.

En la expresión a) se utiliza como medida la media aritmética o simplemente la


media.
En la b) se emplea como medida la mediana, que es el valor promedio que deja por
debajo de ella la mitad de las notas y por encima de ella la otra mitad. Y en la c) se
usa el valor de la nota que más veces se ha repetido en ese examen, este valor es
la moda.
4.1.1. MEDIA

La media de una distribución de datos cuantitativos es el punto de equilibrio de la


distribución.

Media: Está dada por la suma de todos los elementos de la serie dividida por el
número de ellos. Se calcula como:
k

x i
x i 1

n
Siendo:
x : la media
k

x
i 1
i : suma de elementos

n: número de elementos (incluyendo a los de igual valor)


k: número de elementos con distinto valor.

Ejemplos:
1. La media de los valores: 5, 7, 8, 10, 15 es 9.

 x = 5 + 7 + 8 + 10 + 15 = 45

Como n = 5, aplicando la fórmula obtenemos:

x =9

2. Si las propinas de un alumno en distintos días durante un mes: 7; 5; 6,5; 3,7; 5,


6,2. La propina media es de 5,57 nuevos soles.
3. Si la media de 6 elementos se sabe que es 10. Sabiendo que cinco de ellos
son: 8, 12, 13, 5 y 9, el elemento que falta es 13.

Media ponderada: Por lo general, los datos se presentan agrupados mediante una
distribución de frecuencias que hace que no todos los elementos de la serie tengan
el mismo peso específico, y eso influye en el cálculo de la media, por eso se llama
media ponderada.

El que se define como la suma de los productos de cada elemento de la serie por
su frecuencia respectiva, dividida por el número de elementos de la serie.
k

x
i 1
i  ni
x
n

Donde ni es la frecuencia o número de veces que se repite un valor. También n i


puede ser la ponderación de cada valor xi.

Ejemplos:

1. Durante el mes de octubre de 2008 lo facturado por una compañía fue:

Ingreso en Frecuencia en
soles días
20,000 5
22,000 15
30,000 4

El ingreso medio durante ese mes será:

20.000 x 5  22.000 x 15  30.000 x 4


x  22,916.67 soles.
24

2. Un alumno obtiene en tres exámenes parciales las siguientes notas: 17, 15 y13;
en el examen final obtiene 6. Si la nota final tiene doble peso que las parciales,
su nota media es 5,4.
3. Si la renta anual media de los trabajadores del campo es de 1.000.000 de soles
y la renta anual media de los trabajadores de la construcción en esa población
es de 1.200.000 soles, la renta anual media para ambos grupos de
trabajadores es 1.100.100 soles.

Propiedades de la media: Las propiedades más importantes son:

1. La suma algebraica de las desviaciones de un conjunto de números respecto


de su media aritmética es cero.
2. La suma de los cuadrados de las desviaciones de un conjunto de números con
respecto a cualquier otro número es mínima cuando ese otro número es
precisamente la media aritmética.
3. Si suponemos, antes de calcularla, que la media de un conjunto de números es
cualquier número A, resulta que la verdadera media aritmética es:

x  A
d
n
Donde:
A: media supuesta
 d : Suma de las desviaciones respecto de A.
n: número de elementos.

4. Si A1 números tienen una media m1, A2 números una media m2, ...., An números
una media mn, entonces la media de todos ellos es:

A1  m1  A2  m 2      An  m n
x
A1  A2     An

o sea, es la media ponderada de todas las medias.

Ejemplo: En una cierta empresa de 80 empleados, 60 de ellos ganan 500.00 soles


al mes y los 20 restantes ganan 700.00 soles al mes, cada uno de ellos. Se
pide:

a) Determinar el sueldo medio


b) ¿Sería igual la respuesta si los primeros 60 empleados ganaran un sueldo
medio de 500.00 soles y los otros 20 un sueldo medio de 700.00 soles?
c) Comentar si ese sueldo medio es o no representativo.

Cálculo de la media aritmética a partir de datos agrupados en clases.


Cuando los datos están agrupados en clase, el cálculo de la media consiste en
aplicar la fórmula de la media ponderada, con la única salvedad de que se
toman como valores representativos de la variable las marcas de clase (puntos
medios de cada intervalo), que se denotan con x m.
O sea:

x
x m  ni
n

Ejemplo: Hallemos la media de la siguiente serie:


25 33 27 20 14 21 33 29 25 17
31 18 16 29 33 22 23 17 21 26
13 20 27 37 26 19 25 24 25 20
25 29 33 17 22 25 31 27 21 14
24 27 23 15 21 24 18 25 23 24

K = 1 + 3.3 log 50 = 6.6 Se puede tomar 6 o 7 intervalos.

l(A) = 13; 37 = 24


24
w 4
6

Intervalo xi nii Xi . ni
13 - 17 15 5 75
17 - 21 19 9 171
21 - 25 23 13 299
25 - 29 27 13 351
29 - 33 31 5 155
33 - 37 35 5 175
Total -- 50 1,226

Hallando la media se obtiene:


x
x m  ni

1226
 24.52
n 50

4.2. MEDIDAS DE DISPERSIÓN.

Analiza si en la distribución de los valores de la serie de datos, éstos se encuentran


concentrados o dispersos alrededor del valor central. Existen diversas medidas de
dispersión, entre las más utilizadas están el rango, la varianza, desviación estándar y
el coeficiente de variación.

4.2.1 Rango (R): mide la amplitud de los valores de la distribución y se calcula por la
diferencia entre los valores mayor y menor.

4.2.2 Varianza (S2): se define como el promedio de los cuadrados de las distancias
existentes entre cada uno de los valores de la serie y su media. Se calcula como el
cociente:

x  X 
K 2
i  fi
S 
2 i 1
n

La varianza es siempre mayor que cero, cuando su valor se aproxima a cero la


concentración de los valores de la serie de datos alrededor de la media es mayor y
si la varianza es mayor, los valores de la serie de datos alrededor de la media es
mayor, están más dispersos.

4.2.3 Desviación típica (S): Está dada por la raíz cuadrada de la varianza.

S S2
4.2.4 Coeficiente de variación de Pearson (C. V): Está dada por el cociente entre la
desviación típica y la media. Es un parámetro adimensional y permite comparar
series de distintas medias.

S
C.V . 
X

Ejemplo: Si se utiliza la serie de datos de la tabla anterior, para determinar sus


medidas de dispersión.

Tabla Nº 1

Estatura fi xi fi xi (xi -
2
x ) fi

1,01 - 1,17 4 1,09 4,36 0,7056


1,17 - 1,33 3 1,25 3,75 0,2028
1,33 - 1,49 7 1,41 9,87 0,0700
1,49 - 1,65 8 1,57 12,56 0,0288
1,65 - 1,81 3 1,73 5,19 0,1452
1,81 - 1,98 5 1,89 9,45 0,7220
Total 30 45,18 1,8744

45,18
R  1,01;1,98  0,97 y X   1,51
30
1,8744
S2   0,0625 , S  0,0625  0,25
30
0.25
C.V   0,1656  C.V  16,56%
1,51

5. Coeficientes de asimetría y curtosis.

5.1. Asimetría

Se refiere a si la curva que forman los valores de la serie presenta la misma forma a
izquierda y derecha con respecto al valor de la media.

Para medir el nivel de asimetría se utiliza el llamado Coeficiente de Asimetría de


Pearson, definido por:
As 

3 X  Xm 
S

Los resultados pueden ser:

As = 0 (distribución simétrica; existe la misma concentración de valores a la derecha


y a la izquierda de la media)

As> 0 (distribución asimétrica positiva; existe mayor concentración de valores a la


derecha de la media que a su izquierda)

As < 0 (distribución asimétrica negativa; existe mayor concentración de valores a la


izquierda de la media que a su derecha)

Ejemplo: Si a calcular el Coeficiente de Asimetría de Pearson de la serie de datos


referidos en el ejemplo anterior.
31,51  1,51
As  0
0,25

Luego, la distribución es simétrica (existe igual concentración de datos a la izquierda y


a la derecha de la media).

5.2. Coeficiente de Curtosis

El Coeficiente de Curtosis o apuntamiento, analiza el grado de agudeza que


presentan los valores alrededor de la zona central de la distribución de los datos; es
decir es una medida de la altura de la curva que determinan los datos de la
distribución y está representada por el cuarto momento con respecto a la media.

Según su grado de curtosis, una distribución puede ser:

Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de


los valores centrales de la variable.

Distribución mesocúrtica: presenta un grado de concentración medio alrededor de


los valores centrales de la variable.

Distribución platicúrtica: presenta un reducido grado de concentración alrededor de


los valores centrales de la variable.
El Coeficiente de Curtosis se puede calcular, entre otras, con la fórmula:

C3 C1

4 4

Ap  2
C 90  C 10
100 100

Los resultados pueden ser los siguientes:


Ap  0,5 (distribución leptocúrtica).

Ap  0,25(distribución mesocúrtica).

Ap  0 (distribución platicúrtica).

Ejemplo: Si se calcula el Coeficiente de Curtosis de la serie de datos de la


distribución de la tabla Nº 1, se tiene:

1,68  1,34
2 0,17
Ap    0,23
1,87  1,13 0,74

Con el que se concluye que la distribución es mesocúrtica, es decir, con una mediana
concentración alrededor de los valores centrales de la distribución.
CAPITULO II. INTRODUCCION A LA TEORIA DE LAS PROBABILIDADES

1. RESEÑA HISTORICA

En la sociedad francesa de 1650 el juego era un entretenimiento corriente, sin


demasiadas restricciones legales. En este entretenimiento están las raíces de la
teoría de la probabilidad , pues cada vez se introducido juegos mas complicados
que dejaron de sentir la necesidad de un método para calcularla probabilidad de
ganar en cada juego.

La probabilidad se obtiene dividiendo el número de casos favorables entre el


número de los casos posibles, por tanto la probabilidad de obtener oros al extraer al
azar una carta de una baraja es 10/40 = 1/4 y se admitían que al repetir la fracción
400 veces, devolviendo la carta a la baraja tras cada extracción, sería muy poco
usual que la frecuencia relativa de los oros obtenidos estuviesen alejadas de 1/4.
Un jugador apasionado, el caballero De Méré, encontró un desacuerdo entre las
frecuencias relativas de la veces que ganaba - valores observados realmente - y el
valor de la correspondiente probabilidad de ganar que el mismo había calculado.

Consultó esta discrepancia en París con el famoso matemático y filósofo Pascal,


quien se interesó por los problemas que le proponía De Méré y comenzó una
correspondencia epistolar sobre cuestiones probabilísticas con otros matemáticos
amigos, sobre todo con Fermat. Esta correspondencia puede considerarse el origen
de la teoría de probabilidades.

Pronto Pascal y Fermat probaron el desacuerdo de De Méré se debía a que era


erróneo el calculo de probabilidad que había hecho, ya que De Méré se había
equivocado al considerar como equiprobables casos que no le eran, y sólo cuando
los casos posibles son equiprobables tiene sentido aplicar la definición dada de
probabilidad.

El desarrollo de la teoría de probabilidades tiene otro punto de referencia en 1713,


en que se publica la obra "Ars conjectandi" (El arte de la Conjetura) de J. Bernoulli,
donde estudia la distribución binominal y su célebre teoría que da para esta
distribución la expresión matemática de la propiedad de estabilidad de las
frecuencias relativas.

Otro hito es la segunda edición de la obra "The Doctrine of Chances" (La doctrina
de las probabilidades) aparecidas en 1738 y debida al hugonote francés De Moivre,
que por motivos religiosos huyó de Francia refugiándose en Inglaterra, donde vivió
de la resolución de problemas de juegos de azar. En la obra señalada aparecen las
primeras indicaciones sobre las distribución normal de probabilidades.

En 1812 Laplace publica su famosa "Theoríe Analytique des probabilités", que


contiene una exposición completa y sistemática de la teoría matemática de los
juegos de azar, además de una gran cantidad de aplicaciones de la teoría de la
probabilidad a muchas cuestiones científicas y prácticas.

Tras la obra de Laplace se extendieron las aplicaciones de su obra otras ramas de


la Ciencia durante el siglo XIX, y así, Gauss y Laplace independientemente
aplicaron la teoría de la probabilidad al análisis de los errores de medida en las
observaciones físicas y astronómicas, Maxwell, Boltzmann y Gibbs aplicaron la
probabilidad en su obra "Mecánica Estadística", que ha sido fundamental en
distintas partes de la Física moderna. Ya durante nuestro siglo las aplicaciones de
la teoría de la probabilidad se han extendido por los más variados campos, como
genética, economía, psicología...
También, y pese al éxito de las aplicaciones, se oyeron voces críticas a la definición
clásica de probabilidad, que exigía "a priori" saber, o suponer, que todos los casos
posibles eran igualmente favorables. Además en ciertos casos era imposible aplicar
la definición clásica de probabilidad, como puede suceder al intentar calcular la
probabilidad de que una chincheta caiga con la punta hacia arriba, o de que un
hombre de 30 años muera el próximo año.

Si bien la matemática cambió profundamente de forma entre las dos guerras


mundiales, también es cierto que buena parte de la matemática que siguió a la
Segunda Guerra Mundial consistía en el comienzo de algo radicalmente nuevo que
anunciaba una nueva era. La teoría de conjuntos y la teoría de la medida han ido
invadiendo a lo largo del siglo XX una parte cada vez más extensa de la
matemática, pero pocas de sus ramas se han visto afectadas tan profundamente
por esta tendencia como la teoría de probabilidades, a la que Borel había dedicado
ya en 1909 sus "Eléments de la théorie des probabilités".

El primer año del nuevo siglo se anunciaba ya propicio para las aplicaciones de la
teoría de probabilidades tanto a la fisica como a la genética, puesto que en 1901
publicaba Glbbs su obra Elementary Principles in Statistical Mechanics, y el mismo
año fue fundada la revista Biometrika por Karl Pearson (1857-1936). Francis Galton
(1822-1911) fue muy precoz y un estadístico nato que estudió los fenómenos de
regresión; en 1900 Pearson en la universidad de Londres popularizó el criterio de la
«chi-cuadrado». Uno de los títulos de Poincaré había sido el de "profesor de cálculo
de probabilidades", lo que indicaba un interés creciente por el tema.

En Rusia se inició el estudio de las cadenas de sucesos eslabonados,


especialmente en 1906-1907, por obra de Andrei Andreyevich Markov (o Markoff,
1856-1922), discípulo de Tchebycheff y coeditor de las Oeuvres (2 vols., 1899-
1904) de su maestro. En la teoría cinética de los gases y en muchos fenómenos
sociales y biológicos, la probabilidad de un suceso depende frecuentemente de los
resultados anteriores, y especialmente desde mediados de este siglo las cadenas
de Markov de probabilidades eslabonadas se han estudiado muy detalladamente.
En su búsqueda de una fundamentación matemática para la teoría de
probabilidades en expansión, los estadísticos encontraron a mano las herramientas
necesarias, y hoy no es posible ya dar una exposición rigurosa de la teoría de
probabilidades sin utilizar los conceptos de función medible y de las teorías de
integración modernas.

En Rusia mismo, por ejemplo, Andrel Nicolaevich Kolmogoroff hizo importantes


progresos en la teoría de procesos de Markov (1931) y dio solución a una parte del
sexto problema de Hilbert, en el que se pedía una fundamentación axiomático de la
teoría de probabilidades, utilizando la medida de Lebesgue.
El análisis clásico se había ocupado principalmente de funciones continuas,
mientras que los problemas de probabilidades generalmente se refieren a casos
discretos. La teoría de la medida y las sucesivas extensiones del concepto de
integral se adaptaban perfectamente a conseguir una asociación más estrecha
entre el análisis y la teoría de probabilidades, especialmente a partir de mediados
del siglo, cuando Laurent Schwartz (1915- ), de la universidad de París, generalizó
el concepto de diferenciación mediante su teoría de distribuciones (1950-1951).

2. Probabilidad.

La Teoría de la Probabilidad constituye la base o fundamento de la Estadística, ya


que las ingerencias que hagamos sobre la población o poblaciones en estudio se
moverán dentro de unos márgenes de error controlado, el cual será medido en
términos de probabilidad.

Dado que la Estadística se utiliza con mucha frecuencia hoy en día, inclusive ya en
el lenguaje cotidiano, es conveniente saber entender con toda precisión qué es lo
que se nos dice, por ejemplo, en los medios de comunicación cuando se hace
referencia a la probabilidad de algún suceso.

Así, es corriente oír decir que la probabilidad de que un recién nacido sea varón es
aproximadamente del 50 %, que es muy poco probable que llueva en Torremolinos
en la segunda quincena del mes de julio, o inclusive, hasta podemos leer en la
prensa (El País, 12 de noviembre de 1991) cosas tales como que en una
evaluación internacional sobre matemáticas y ciencias, desarrollada por la National
Assessment of Educational Progress de Estados Unidos, entre escolares españoles
de 13 años, los chicos muestran un mejor rendimiento en matemáticas que las
chicas, haciendo esta afirmación con un margen de error muy pequeño (del 5 %).
Nos apresuramos a decir, claro está, que el informe no afirma que los niños tengan
una mayor aptitud o una mayor capacidad para las matemáticas, sino que
"probablemente" estos resultados son la consecuencia de unos determinados (y
erróneos) comportamientos sociales. En todo caso, el lector o lectora estará de
acuerdo conmigo en que es interesante tener muy claro qué significa el que la
probabilidad de error ante esa afirmación sea 0'05. Una respuesta completa deberá
postergarse hasta el capítulo 7, en donde se describan con detalle las técnicas
utilizadas en dicho informe, aunque el concepto de probabilidad que allí se utilice
será el que aquí se va a estudiar.

Así pues, es corriente hablar de la probabilidad de un suceso, entendiendo como tal


un número entre 0 y 1, de forma que si éste es cercano a 0 (a l), el suceso tiene
poca (mucha) probabilidad de ocurrir o haber ocurrido, aunque ya en el ejemplo
anterior hablábamos, por un lado, de una probabilidad científica de que el informe
estuviera equivocado, y, por otro, de unas " probables" causas a estos resultados.
Vemos, pues, que conviene precisar en cada caso de qué se está hablando,
tratando de evitar afirmaciones tan comunes en los medios de comunicación como
la de "... mañana es posible que llueva pero no es probable...".

En este apartado trataremos de precisar que se entiende por la probabilidad de que


algo ocurra o haya ocurrido, estudiaremos también algunas de sus principales
propiedades, y daremos algunas reglas de cómo poder calcularla en determinadas
situaciones.

NOCION INTUITIVA DE PROBABILIDAD

La noción de probabilidad, intuitivamente está relacionado con la ocurrencia o no de


un cierto suceso (A) la cual conduce a la definición intuitiva como:

P ( A ) = # c a s o s fa v o r a b le s
# c a s o s p o s ib le s

Ejemplo1. Si lanzamos una moneda; entonces la probabilidad de que salga cara será:

P (C ) = 1
2

Similarmente la probabilidad de que salga sello será:

P (S ) = 1
2

Ejemplo 2. Si lanzamos un dado; entonces la probabilidad de que salga un # para


será:
3 1
P (# p a r) = =
6 2

Ejemplo 3. Si lanzamos un dado ¿Cuál es la probabilidad de que salga el número 5?

1
P (X = 5 ) =
6
Para definir la probabilidad debemos usar ciertos conceptos preliminares como:

3. Definiciones Básicas

Para formalizar la definición de probabilidad, a través de un conjunto de axiomas, se


repasaran brevemente los conceptos de la teoría de conjuntos (o eventos), sobre los
cuales se fundamentan la definición formal de probabilidad. Así mismo se necesita
conocer los tipos de experimentos.

Para definir la probabilidad debemos usar ciertos conceptos preliminares como:

EXPERIMENTO
Un experimento es cualquier acción o proceso cuyo resultado está sujeto a
incertidumbre; es decir no se puede determinar en forma exacta.
Ejemplos: E1: Lanzar una moneda al aire
E2 : Lanzar un dado
E3 : Extraer una carta de una baraja de naipes
E4 : Lanzar una moneda y un dado
E5 : Lanzar dos monedas
E6 : Lanzar dos dados

ESPACIO MUESTRAL (S) Es el conjunto de todos los resultados posibles de un


experimento dado. Usualmente se designa a este conjunto con S.
Ejemplos: S1 = { c, s }

S2 = { 1,2,3,4,5,6 }

S3 = { 1♠, 2♠, 3♠, 4♠ , …. 10♠, J♠, Q♠, K♠


1♣, 2♣, 3♣, 4♣, …. 10♣, J♣, Q♣, K♣
1♦, 2♦, 3♦, 4♦, …. 10♦, J♦, Q♦, K♦
1♥, 2♥, 3♥, 4♥, …. 10♥, J♥, Q♥, K♥ }

S4 = { C1,C2,C3,C4,C5,C6, S1,S2, S3,S4,S5,S6 }

S5 = { CC,CS,SC,SS }

S6 = { (1,1), (1,2), (1,3), (1,4), (1,5), (1,6)


(2,1), (2,2), (2,3), (2,4), (2,5), (2,6),
(3,1), (3,2), (3,3), (3,4), (3,5), (3,6)
(4,1), (4,2), (4,3), (4,4), (4,5), (4,6)
(5,1), (5,2), (5,3), (5,4), (5,5), (5,6)
(6,1), (6,2), (6,3), (6,4), (6,5), (6,6) }

Experimento. Los experimentos u operaciones reales o hipotéticas puede dividirse en


dos clases: determinístico, no determinístico.

Experimento determinístico: si los resultados del experimento están completamente


determinados y puede describirse por una fórmula matemática llamado también
modelo determinístico.
Ejemplo.
 Soltar un globo en el aire.
 Lanzar una pelota en un pozo de agua.
 Soltar una liga estirada.

Experimento no determinístico (aleatorio). Si los resultados del experimento no


pueden predecirse con exactitud antes de realizar el experimento y tienen las
siguientes propiedades.
a) Se podría repetir indefinidamente las observaciones bajo condiciones
esencialmente invariables.
b) Se es capaz de describir todos los posibles resultados de una observación, aún
cuando no es posible establecer lo que será un resultado particular.
c) Los resultados individuales de las observaciones repetidas pueden ocurrir de
manera accidental, pero cuando el número de observaciones es grande
aparece el patrón de regularidad estadística.

Ejemplo.
 Designar un delegado del salón.
 Contar el número de automóvil que pasa por una esquina, justo, antes que
ocurra un accidente.
 Lanzar un dado.
 Observar el tiempo de vida de un foco.
 Elegir un punto en el intervalo (5,6)

Definición. El conjunto de todos los posibles resultados de un experimento aleatorio


recibe el nombre de espacio muestral (S).
El conjunto de todos los posibles resultados puede ser finito, infinito numerable o
infinito no numerable. Por ejemplo, el número de reservaciones sin cancelar constituye
un espacio muestral finito, dado que este número nunca excederá la capacidad del
avión, que es finita. El número de llegadas al servicio constituye un espacio muestral
infinito numerable, dado que es posible colocar los resultados en una correspondencia
uno a uno con los enteros positivos, que constituyen un conjunto infinito pero
numerable. La duración de una componente constituye un espacio muestral infinito
innumerable, dado que esta puede ser cualquier número real positivo.

Definición. Se dice que un espacio muestral es discreto si su resultado puede


ponerse en una correspondencia uno a uno con el conjunto de los enteros
positivos.

Definición. Se dice que un espacio muestral es continuo si sus resultados consisten


de un intervalo de número reales.

Definición. Un evento del espacio muestral es un grupo de resultados contenidos en


éste, cuyos miembros tienen una característica común. Por ejemplo se desea
saber si el número de reservaciones sin cancelar sea menor que cinco.

Definición. El evento que contiene a ningún resultado del espacio muestral recibe el
nombre de evento nulo o vacío.

Definición. El evento formado por todos los posibles resultados en E 1 o E2 o en


ambos, recibe el nombre de la unión de E1 y E2 se denota por E1  E2.

Definición. El evento formado por todos los resultados comunes tanto a E 1 como a E2
recibe el nombre de intersección de E1 y E2 se denota por E1  E2.

Definición. Se dice que los eventos E1 y E2 son mutuamente excluyentes o disjuntos


si no tienen resultados en común; en otras palabras E 1  E2 =   evento vacío.

Definición. Si cualquier resultado de E2 también es un resultado de E 1, se dice que el


evento E2 está contenido en E1, y se denota por E2  E1.

Definición. El complemento de un evento E con respecto al espacio muestral S, es


aquel que contiene a todos los resultados de S que no se encuentran en E, y se
_
denota con E

4.- DEFINICIÓN CLÁSICA DE PROBABILIDADES

Si un experimento que esta sujeto al azar, resulta de n formas igualmente probables y


mutuamente excluyentes, y si n A de estos resultados tienen un atributo A, la
probabilidad de A es la proporción de n A con respecto a n.
n
P ( A)  A
n
Observación.
1) n A = numero de casos favorables al evento A
n = numero de casos posibles.
2) N ( A)  n A
N ()  n

Ejemplo 1. Se lanza una moneda tres veces. Calcular la probabilidad que ocurran.
a) Dos sellos.
b) Por lo menos dos sellos.
c) A lo mas dos sellos.
d) A lo mas tres sellos.
e) Cuatro sellos.
Solución:
S   ccc, ccs, csc, scc, css, scs, sss, ssc
a) Evento A: “salga dos sellos”
3
A   css, scs, ssc P  A 
8
b) Evento B: ocurran por lo menos dos sellos.
4
B   css, scs, sss, ssc P B  
8
c) Evento C: ocurran a lo mas dos sellos
7
C   ccc, ccs, csc, scc, css, scs, ssc P C  
8
8
d) Evento D = S P D    1
8
0
e) Evento E = Ø P E    0
8
Propiedades A  S
1. 0  P  A  1 .
2. P  Ø   0 .
3. P S   1

Ejemplo 2. Se lanza 2 dados. Calcular la probabilidad de:


a) Suma sea más de 10.
b) El primer dado sea par.
c) Los dos dados sean iguales.
Solución

1 2 3 4 5 6
1 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)
2 (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)
3 (3, 1) (3, 2) (3, 3) (3, 4) (5, 5) (3, 6)
4 (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)
5 (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
6 (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)
N(S) = 36, N(A) = 3, N(B) = 18, N(C) = 6
P(A) = 3/36, P(B) = 18/36, P(C) = 6/36

Ejemplo 3. Un lote consta de 6 artículos buenos, 3 con pequeños defectos y


uno con defecto grave.
a) Se elige un articulo al azar ¿Cuál es la probabilidad de que no tenga defectos?
b) Si del mismo lote se recoge dos artículos sin reemplazo ¿Cuál es la
probabilidad de que exactamente uno sea bueno?
Solución
a) A: los artículos no tiene defectos
6
P  A 
10
b) B: exactamente un artículo sea bueno

10
NS     45

2 
631631
NB   24

1 01
24
P B  
45
5. Definición como frecuencia Relativa
Si un experimento aleatorio se repite “n” veces bajo las mismas condiciones y
n A de las veces que se repite el experimento ocurre el evento A. Entonces la
frecuencia relativa del evento A es:
n A  n  A
frA  y la probabilidad del evento A es: P  A  lim frA  lim
n n   n   n

Ejemplo 1. Se entrevista a un grupo selecto de empleados con respecto a un


nuevo plan de pensiones. Se realizan entrevistas detalladas a cada uno de los
empleados seleccionados en la muestra:

Clasificación Numero de
empleados
A Supervisores 120
B De mantenimiento 50
C De producción 1460
D Gerencia 302
E Secretarias 68
Total 2000

a) ¿Cuál es la probabilidad de que a la primera persona seleccionada sea


un empleado de mantenimiento?
b) ¿Cuál es la probabilidad que la primera persona seleccionada sea una
secretaria?
c) ¿Cuál es la probabilidad de que la primera persona seleccionada sea
alguien de mantenimiento o una secretaria?

Solución
50
a) P B    0.025
2000
68
b) P E    0.034
2000
50 68
c) P B  E     0.059
2000 2000

Ejemplo 2. Los miembros de un grupo de partidos políticos son

Partido Mujeres Hombres


A 500 820
B 300 950
C 270 300
Total 1070 2070
a) ¿Cuál es la probabilidad que sea mujer?
b) ¿Cuál es la probabilidad que sea del partido B?
c) ¿Cuál es la probabilidad que sea hombre y del partido C?

Solución
1070 1250 300
a) P E1    0,34 b) P E 2    0,4 c) P  E 3    0,096
3140 3140 3140

6. Definición Axiomática de probabilidad

Definición. Sea S cualquier espacio muestral y E cualquier evento de este. Se


llamará función probabilidad sobre el espacio muestral S a P(E) si satisface los
siguientes axiomas
1. P  E   0
2. P S   1
3. Si para los eventos E1, E2, E3, ...

Ei  E j  Ø,  i  j , entonces P E1  E 2  E3  ...  P E1   P  E 2   ...

Teorema 1. P(Ø) = 0
Demostración:
Sabemos que S  Ø  S , S Ø  Ø
P S  Ø   P S  Ax. 3
P  S   P Ø   P  S 
1  P Ø   1 Ax. 2
P Ø   0

Teorema 2. Para cualquier evento E  S , 0  P E   1 .


Demostración:
E  S, 0  P E   1
0  P E   P E   1
i) P  E   0
ii) P  E   1
Sabemos que P E   P  E   1
P( E )  1  P E   1
0

P( E )  1

Teorema 3. Sea S un espacio muestral que contiene a cualesquiera dos


eventos A y B, entonces: P A  B   P A  P B   P A  B 
Demostración:
Descomponemos A B y B en sucesos mutuamente excluyente
Sea A B = A (B Ā)

B = (A B) (B Ā)

Entonces: P(A B) = P(A) + P(B Ā)

P(B) = P(A B) + P(B Ā)

Por lo tanto: P(A B) = P(A) + P(B) - P(A B)

TEOREMA 4. Si A, B, C son sucesos cualesquiera; entonces

P(A B C) = P(A) + P(B) + P(C) - P(A B) – P(A C) - P(B C) + P(A B C)

Demostración:
Sea A B C = (A B)
P(A B C) = P(A B) + P(C) - P[(A B) C]

= P(A) + P(B) – P(A B) + P(C) - P[(A C) (B C)]

= P(A) + P(B) + P(C) – P(A B) – [(P(A C) + P(B C) – P(A B C)]

= P(A) + P(B) + P(C) – P(A B) - P(A C) - P(B C) + P(A B C)

TEOREMA 5.
Si A B ; entonces P(A) ≤ P(B)

Demostración:
B = A (B Ā)

P(B) = P(A) + P(B Ā) ≥ P(A)

Por lo tanto: P(A) ≤ P(B)

COROLARIO. Si A y B son sucesos mutuamente excluyente entonces:


P(A B) = P(A) + P(B)
En forma general :

a) Si A1, A2, A3, …………, An son sucesos mutuamente excluyentes; entonces:

P(A1 A2 A3 …………. An) = P(A1) + P(A2) + P(A3) + ……… + P(An)

b) Si S = A1 A2 A3 …………. An / A i Aj = Ф , i≠j

P(A1) + P(A2) + P(A3) + ……… + P(Ar) = 1

TEOREMA 6: si E  S , P  E   1  P E 

Demostración:
Sabemos que E  E  S, E E Ø
P  E  E   P  E   P  E   P (S ) Axioma 3
 P E   P  E   1
P  E   1  P E 

Ejemplo 1. Se lanza un dado, calcular la probabilidad de caiga 4 ó 2.

Solución
  1,2,3,4,5,6
E1: caiga 4.
E2: caiga 2.
E1  E 2 : “caiga 4 ó 2”
Como E1, E2 son mutuamente excluyentes
1 1 1
P E1  E 2   P E1   P E 2    
6 6 3

Ejemplo 2. De una baraja normal se extrae una carta. ¿Calcular la probabilidad


de que la carta sea una reina o un corazón?
Solución
N(S) = 52
A: una reina.
B: un corazón.
A  B : Reina y Corazón.
N(A) = 4, N(B) = 13, N(AB) = 1
4 13 1 16
P  A  B   P  A  P  B   P  A  B     
52 52 52 52

Ejemplo 3. Se tiene una urna con 5 bolas marcadas $10 c/u, 3 bolas marcadas
con $30, y 2 bolas marcadas $50 c/u. Se escoge aleatoriamente 3 bolas.
Determinar que al menos dos de ellas tengan el mismo precio?

Solución
A: “al menos dos de las bolas tengan el mismo precio”
A : “tengan precios diferentes”

10
NS     120
3 
n( A )  C15C13C12  30
P A  
30
 0.25
120

P ( A)  1  0.25  0.75

Ejemplo 4. Se lanza 2 dados. Calcular la probabilidad de que la suma no sea


10.

Solución
A: salga suma 10.

A : no sea suma 10.

3
P ( A)  A    6,4 ,  4,6 ,  5,5
36
P A   1 
3 33

36 36
7. PROBABILIDAD COJUNTA, MARGINAL Y CONDICIONAL

Experimento aleatorio: elegir una persona de una ciudad de n habitantes,


considere las características de fumador y de su sexo.

Hombre (B1) Mujer (B2)

Fumador A1 n11 n12 n, s


No fumador A2 n 21 n 22

Los eventos en S se presentan en el cuadro de doble entrada.


Supongamos que se desea determinar la probabilidad de ocurrencia simultánea

de los eventos A1 y B2 .
n12
De acuerdo a la tabla P ( A1  B2 )  , en general
n

PROBABILIDAD
n
P ( Ai  Bi )  ii CONJUNTA
n
Supongamos que se desea conocer la probabilidad
del evento A2 (no fumador). De acuerdo a la tabla

PROBABILIDAD
n21  n22 MARGINAL
P( A2 ) 
n

“Por que para determinarla se ignora una o mas características del espacio
muestral”
Supongamos que se elige una mujer B2 , ¿cuál es la probabilidad de que
fume?

n12 PROBABILIDAD
P ( A1 / B2 ) 
n12  n22 CONDICIONAL

n12 / n Pr obabilidad Conjunta


P( A1 / B2 )  
(n12  n22 ) / n Pr obabilidad M arg inal

NOTA: “/ ” se lee “dado que”

PROBABILIDAD CONDICIONAL
Definición: sea A y B cualesquiera dos eventos que se encuentran en un

espacio muestral S de manera tal que P(B)0. La probabilidad condicional de A


al ocurrir el evento B, es el cociente de la probabilidad conjunta de A y B con
respecto a la probabilidad marginal de B; de esta manera se tiene:
P( A  B)
P( A / B)  , P( B)  0
P( B)
P( A  B)  P( B) P( A / B)
Analógicamente
P( A  B)
P ( B / A)  , P ( A)  0
P ( A)

Observaciones

1)  
P( A) P B  P B P A
A B
 
P A1  A2  ...  Ai   P A1  P 2  P 3 ...P Ai 
A A
2)
A A  A   A  A ... A 
 1   1 2   1 2 i1 

Ejemplo 1. Se lanzan dos dados normales y se anotan los resultados entonces

Consideremos los sucesos:

A = { (x,y) / x+y = 10}

B = { (x,y) / x > y}

Entonces:
P(B/A) = 1/36_ = 1_
3/36 3

Similarmente:

P(A/B) = 1/36_ = 1_
15/36 15

Ejemplo 2. Se encuentra en una facultad que del 70% de los alumnos matriculados,
el 70% son mujeres y 18% son mujeres que estudian Economía.
Si elegimos un estudiante al azar y resulta que es mujer. ¿Cúal es la probabilidad de
que esté estudiando Economía?

Solución:

P(M) = 0.70 M ===> Mujer


P(H) = 0.30 H ===> Hombre
P(M E) = 0.18 E ===> Economía

P(E/M) = P(E M) / P(M) = 0.18 = 18 = 0.25


0.70 70
Ejemplo 3. Una urna contiene una bola blanca y una bola negra. Se extrae
cada vez sin reposición. Determinar la probabilidad de que le primera bola
extraída sea blanca y la segunda negra.

Solución:

A1  1ra sea blanca


A2  2 sea negra
da

P ( A1  A2 )  ?
P ( A1  A2 )
P ( A1 / A2 ) 
P ( A1 )
1 1
P( A1 )  , P ( A2 / A1 )   1
2 1

1 1
P ( A2  A1 )  .1 
2 2

PROPIEDADES:
1) 0 ≤ P(B/A) ≤ 1
2) P(S/A) = 1
3) P(B1 B2 / A) = P(B/A) + P(B2/A) ; Si B1 B2 = Φ

P(B1 B2 ….. Bn /A) = P(B1/A) + P(B2/A) + …..+ P(Bn/A) ;


Bi Bj = Φ , i≠j

Ejemplo: Supóngase que en una oficina tiene 100 máquinas calculadoras algunas
son eléctricas (E) , mientras que otras son manuales (M). Además, algunas son
nuevas (N), mientras que las otras son usadas (U). La siguiente tabla muestra el
número de máquinas de cada categoría.

a) Una persona entra a la oficina y escoge una máquina al azar y descubre que es
nueva. ¿Cúal es la probabilidad de que sea Eléctrica?

b) Cuál es la probabilidad de que sea Manual?

TEOREMA DE LA MULTIPLICACION

“La probabilidad de Éxito simultáneo para los eventos A y B, es igual a la probabilidad


de éxito de A multiplicada por la probabilidad de éxito de B, dado que A ha tenido
éxito”.

Es decir: P(A B) = P(A) . P(B/A)


Ejemplo. Si tenemos un lote de 20 artículo defectuosos y 80 artículos no
defectuosos. Si escogemos 2 artículos al azar, sin sustitución. ¿Cúal es la
probabilidad de que ambos artículos sean defectuosos?
Solución:

Sean los sucesos:

A = { El primer artículo es defectuoso } y

B = { El segundo artículo es defectuoso }

Entonces: P(A B) = P(A) . P(B/A)

P(A B) = 20 . 19

100 99
(A B) = 19 = 0.038
495

TEOREMA DE BAYES

Si A1, A2, …….. An son n sucesos mutuamente excluyentes, de los cuales al menos
uno de los Ai (i=1, 2, …. n) debe ocurrir, y sea B un suceso cualesquiera en S, la
probabilidad condicional de la ocurrencia de Ai cuando el evento B a ocurrido es:

P(Ai/B) = P(Ai) P(B/Ai)


P(A1) P(B/A1)+P(A2) P(B/A2)+….. + P(An) P(B/An)

Osea: P(Ai/B) = P(Ai) P(B/Ai)


P(Ai ) P(B/Ai)

Ejemplo 1. En una empresa del total de trabajadores, se tiene que el 50% son
Técnicos Profesionales, el 30% son Oficinistas y el 20% Personal de Servicio; además
se tiene que el 8% de los profesionales, 9% de los Oficinistas y el 10% del personal de
servicio son “provincianos” (nacidos fuera de la Capital). Supongamos que se
selecciona un trabajador al azar y resulta ser “provinciano”(B). Hallar la probabilidad
de que el trabajador sea Técnico Profesional (A 1).
Solución:
Significaría hallar: P(A1/B), de acuerdo al Teorema de Bayes:

P(A1/B) = P(A1) P(B/A1)


P(A1) P(B/A1) + P(A2) P(B/A2) + P(A3) P(B/A3)

Veamos ahora el valor de cada componente de la fórmula:

P(A1) = 0,50 ; P(A2) = 0,30 ; P(A3) = 0.20

Donde A1 = Técnico profesional ; A2 = Oficinista ; A3) = 0.20


Así mismo: P(B/A1) = 0.08 (Técnico Profesional Provinciano)
P(B/A2) = 0.09 (Oficinista Provinciano)
P(B/A3) = 0.10 (Personal de Servicio provinciano)
Luego sustituyendo en la formula de Bayes:

P(A1/B) = (0.50) (0.08)


(0.50) (0.08) + (0.30) (0.09) + (0.20) (0.10)

P(A1/B) = 0.040 = 40 = 0.46


0.087 87

Ejemplo2: Durante los últimos años se ha escrito mucho sobre la posible


relación entre fumar y el cáncer pulmonar. Supóngase que en un centro
médico, de todos los fumadores de quienes se sospecha que tenían cáncer
pulmonar, el 90% lo tenía mientras que únicamente el 5% de los fumadores lo
padecía. Si la proporción de fumadores es de 0.45. ¿Cuál es la probabilidad de
que un paciente con cáncer pulmonar, seleccionado al azar, sea fumador?
Solución:
B1 : el paciente es fumador
B2 : el paciente es no fumador
A : el paciente tiene cáncer pulmonar
P  B1   0.45
P  B2   0.55

P A   0.9 , P A   0.05


 B1   B2 

P
B1 
 ? Probabilidad de seleccionar un fumador que tiene cáncer:
 A 
P ( B1 ) P ( A / B1 )
P ( B1 / A) 
P ( B1 ) P ( A / B1 )  P( B2 ) P ( A / B2 )

0.45 x 0.90
  0.9364
0.45 x 0.90  0.55 x 0.05

Ejemplo3:
En una línea de producción hay dos procesos A y B, en el proceso A hay un
20% defectuoso y en el B hay 25% de defectuoso. En una muestra de 300
productos hay 200 del proceso A y 100 del proceso B.

a) Si se extrae un producto al azar. Hallar la probabilidad de que sea


defectuoso.
b) Si al extraer el producto resulto defectuoso. halle la probabilidad de que
provenga del proceso A.

Solución:
A: Proceso A. B: proceso B. D: Articulo defectuoso.
a) PD A  0.2
P  D   0.25
B
P D   P A  D   P B  D   A  P  B  P  D B 
 P  A P D
200 100 65
  0.2   0.25 
300 300 300

b)
 A
P  A P D
 D   P  A P  D   P  B  P  D 
PA
A B

4 40 8
 30
 
65
300 65 13

VARIABLES ALEATORIAS UNIDIMENSIONALES


Definición.- Sea E un experimento y S el espacio muestral asociado a dicho
experimento. Una función X que asigna a cada uno de los elementos s є S, un número
real X(s) , se llama una variable aleatoria.

Ejemplo 1. Sea el Experimento E : lanzamiento de dos monedas. El espacio muestral


será:
S = { cc, cs, sc, ss }

Sea la variable aleatoria x : el número de caras obtenidas en los dos lanzamientos.

X(cc) = 2 ; X(cs) = 1 ; X(sc) = 1 ; X(ss) = 0

Por lo cual Rx = { 0, 1, 2 }

Ejemplo 2. Sea el Experimento E : lanzamiento de dos dados, el espacio muestral


será:

Sea la variable aleatoria X : resultado de la suma de puntos sea par:

X(1,1) = 2
X(1,3) = X(2,2) = X(3,1) = 4
X(1,5) = X(2,4) = X(3,3) = X(4,2) = X(5,1) = 6
X(2,6) = X(3,5) = X(4,4) = X(5,3) = X(6,2) = 8
X(4,6) = X(5,5) = X(6,4) = 10
X(6,6) = 12

De aquí el recorrido:
Rx = { 2, 4, 6, 8, 10, 12 }
VARIABLES ALEATORIAS DISCRETAS

Definición.- Sea X una variable aleatoria. Si el número de valores posibles de X (Rx ó


recorrido) es finito o infinito numerables entonces X se llama X se llama variable
aleatoria Discreta.
Generalmente este tipo de variable se usa cuando se quiere describir el número de
veces en que ha ocurrido un suceso.
Ejemplo: Sea E : partículas alfa emitidas por una fuente Radioactiva.
Sea la variable aleatoria x : número de partículas observadas
Entonces : Rx = { 0, 1, 2, ……. , n }

Observaciónes:
1.- Sea x una variable aleatoria discreta. El rango o recorrido Rx de X consta a lo más
de un número de valores X1, X2, X3 ……. Infinito numerable.
2.- Sea Rx = { x1, x2, ….. xn, .. }, el rango de una variable aleatoria discreta; si le
asociamos un número p(xi) = P(X = xi) llamado la probabilidad de Xi ; entonces los
números P(xi), i = 1, 2, 3, ……, n, … deben cumplir:

Definición.- La función p definida por p(xi) = P(X = xi) se llama función de


probabilidad de la variable aleatoria X.
Ejemplo. Sea el experimento E : observar al azar dos niños recién nacidos.
S = { HH, HM, MH, MM } y sea la variable aleatoria x : número de varones
X1 = cero varones = { MM } = 0
X2 = un varón = { HM, MH } = 1
X3 = dos varones = { HH } = 2

P(x1) = 1 P(X = x1) = 1_


4 4

P(x2) = 2 = 1 P(X = x2) = 1_


4 2 2

P(x3) = 1 P(X = x3) = 1_


4 4
DISTRIBUCION DISCRETA DE PROBABILIDAD

El conjunto de pares ordenados (x, f(x)) es una función de probabilidad, función de


probabilidad, función masa de probabilidad o distribución de probabilidad de la
variable aleatoria discreta “x” si para cada resultado posible x ; cumple:

1) f(x) ≥ 0
2) f(x) = 1
3) p(X = xi) = f(xi)

Ejemplo: Un embarque de 8 microcomputadoras similares que se envía de un


distribuidor contiene 3 aparatos defectuosos. Si una escuela realiza una compra
aleatoria de 2 de éstas computadoras, encuentre la probabilidad de distribución para
el número de microcomputadoras defectuosas.
Solución:
Sea una variable aleatoria cuyos valores son los posibles números de computadoras
defectuosas compradas por la escuela. Entonces puede ser cualquiera de los
números 0, 1 y 2 ahora.

Entonces la distribución de la probabilidad de x es:

x 0 1 2
f(x) 10/8 15/28 3/28

CALCULO COMBINATORIO
VARIACIONES CON REPETICION
Comenzaremos por indicar el siguiente resultado “ Si A 1 y A2 son dos conjuntos finitos,
entonces el número de pares ordenados (a, b), donde a A 1 y b A2, está dado por.

Numero de Pares = #(A1) #(A2)

Ejemplo.
Una urna n contiene 3 esferas numeradas con 0, 1 y 2 mientras que otra, m, contiene
2 esferas numeradas con 3 y 4. De la urna n se extrae una esfera y también de la urna
m.
Si con A1 denotamos al conjunto de los resultados obtenidos al extraer la primera
esfera de la urna n y con A 2, al conjunto formado al extraer la segunda esfera de la
urna m se tendrá que el número de resultados que se pueden obtener al extraer las
dos esferas es

#(A1) #(A2) = 3 x 2 = 6

VARIACIONES SIN REPETICION

Consideremos un conjunto E que tiene m elementos; en forma consecutiva y sin


restitución escojamos n de ellos (n ≤ m).

El número de variaciones sin repetición de n elementos tomados de un conjunto de m


elementos se puede calcular con

Ejemplo:
De un grupo de 8 personas, se desea formar comités de 3 personas, donde una sea el
presidente, otra el secretario y la tercera el tesorero.
¿Cuántos comités de este tipo se pueden formar?
Solución
Esta vez interesa el orden en que se escojan las 3 personas. Luego el número de
tales comités es igual al número de variaciones de 3 elementos que se puedan formar
con las 8 personas del grupo. Esto es:

3) Variación o permutación
El numero de maneras en que se puede elegir r elementos de un conjunto de n
elementos donde interesa el orden en los elementos elegido es:
n!
Pn1r  r  n.
 n  r !
4) Combinación
El numero de maneras en que se puede elegir r elementos de un conjunto de n
elementos donde no interesa el orden en que aparecen los elementos.

n n!
 
r ! rnr !
Ejemplo 2. Determinar la probabilidad de que cuatro de cinco cartas extraídas
aleatoriamente sin reposición de una baraja normal de naipes sean ases.
Solución:
A1 : 1° sea As
A2 : 2° sea As
A3 : 3° sea As

A4 : 4° sea As
A5 : no sea As

3   2 , P A4  1 ,
P A2   , P 3
P A1  
4 A
,   
52  A1  51  A1  A2  50  A1  A2  A3  49
P 5
A   48  1

 A1  A2  A3  A4  48
4 3 2 1 1
P A1  A2  A3  A4  A5      1 
52 51 50 49 270725

Puesto que no es necesario obtener 4 ases en las cuatro primeras


extracciones, entonces el número total de formas es:
5!
5
4!1!
1 1
P  A1  A2 ....  A5   5  
270725 54145

Ejemplo 3. La facultad de Ciencias de la U. N. E. cuenta con 800 estudiantes


y 60 profesores el 10% de los profesores son de izquierda y 90% de derecha,
en los estudiantes sucede al contrario. Se selecciona al azar un miembro de la
facultad y resulta ser de derecha. ¿Cuál es la probabilidad de que se haya
elegido un estudiante?¿Cuál es la probabilidad que se haya elegido un
profesor?
Solución:
Estudiantes Profesores Total
Derecha 80 54 134
Izquierda 720 6 726
Total 800 60 860

D: Integrante de derecha.
E: Integrante es estudiante.
80
 
PE 
P  E  D   860 
80
 0.6
D P D  134 134
860
P E  D 
 
54
54
P E   860   0.4
D P D  134 134
860
Nota :
PE  D   1  P E D   1  0.6  0.4
8. Eventos independientes
Definición: sea A y B dos eventos cualesquiera de un espacio muestral S. Se
dice que el evento A es estadísticamente independiente del evento B si

PA  B   P A . Así tenemos:
PA B   P PA B B 
P  A P  B   P  A  B 

Observación
1) En general si A1 , A2 ,... An son eventos independientes.
P A1  A2  ...  An   P A1  P A2 ...P An 

2) PB A  P B 
Ejemplo 1: Dos equipos A y B se enfrentan en una serie de partidos. Gana la
serie el primer equipo que obtiene 3 victorias. En ningún partido existe la
posibilidad de empate. En cada uno de los partidos, la probabilidad de que
gane A es 2/3. Los resultados de los partidos son independientes entre si,
calcular la probabilidad de que A gane la serie, si se sabe que B obtuvo 2
victorias.
Solución
A: triunfe el equipo A.
B: triunfe el equipo B.
Que A gana la serie implica que debe obtener 3 victorias, pero como se sabe
que B obtuvo 2 victorias, evaluamos la probabilidad del suceso:
1 1 2 2 2 8
P BBAAA  P B  P B  P A P A P A      
3 3 3 3 3 243
Ejemplo 2: Se lanza una moneda y un dado. Hallar la probabilidad de que
salga cara y 4.

Solución:
A: salga cara
B: salga 4
1 1 1
P  A  B   P  A P  B    
2 6 12

Verificamo s :
 c,1 ,  c,2 ,  c,3 ,  c,4 ,  c,5 ,  c,6 
n s    
 s,1 ,  s,2 ,  s,3 ,  s,4 ,  s,5 ,  s,6 

1
n A  B   1  P  A  B  
12

Ejemplo1: Durante los últimos años se ha escrito mucho sobre la posible


relación entre fumar y el cáncer pulmonar. Supóngase que en un centro
médico, de todos los fumadores de quienes se sospecha que tenían cáncer
pulmonar, el 90% lo tenía mientras que únicamente el 5% de los fumadores lo
padecía. Si la proporción de fumadores es de 0.45. ¿Cuál es la probabilidad de
que un paciente con cáncer pulmonar, seleccionado al azar, sea fumador?
Solución:
B1 : el paciente es fumador
B2 : el paciente es no fumador
A : el paciente tiene cáncer pulmonar
P B1   0.45
P B2   0.55
P A   0.9 , P A   0.05
 B1   B2 

P B1   ? Probabilidad de seleccionar un fumador que tiene cáncer:


 A
P ( B1 ) P ( A / B1 )
P ( B1 / A) 
P ( B1 ) P ( A / B1 )  P( B2 ) P ( A / B2 )

0.45 x 0.90
  0.9364
0.45 x 0.90  0.55 x 0.05

Ejemplo2:
En una línea de producción hay dos procesos A y B, en el proceso A hay un
20% defectuoso y en el B hay 25% de defectuoso. En una muestra de 300
productos hay 200 del proceso A y 100 del proceso B.

c) Si se extrae un producto al azar. Hallar la probabilidad de que sea


defectuoso.
d) Si al extraer el producto resulto defectuoso. halle la probabilidad de que
provenga del proceso A.

Solución:
A: Proceso A. B: proceso B. D: Articulo defectuoso.
a) PD A  0.2
P  D   0.25
B
P D   P A  D   P B  D   A  P  B  P  D B 
 P  A P D
200 100 65
  0.2   0.25 
300 300 300

b)
 A
P  A P D
 D   P  A P  D   P  B  P  D 
PA
A B

4 40 8
 30
 
65
300 65 13

DISTRIBICION BINOMIAL
En una serie de hechos de la vida real es frecuente encontrarse frente a
simples dicotomías, como por ejemplo, si un individuo posee o no un
determinado atributo o características, o cuando se considera si un
experimento a tenido éxito o ha fallado. En estas situaciones es posible
formular una hipótesis acerca de la probabilidad de éxito, siempre que las
pruebas u observaciones sean independientes unas de otras y que el números
de estos sean relativamente pequeño. Con estas condiciones es posible aplicar
una expresión matemática de la Distribiución Binomial o de Bernoulli.
Para aclarar ideas, analicemos el siguiente ejemplo:
Supongamos que un inspector de control de calidad quiere saber cual es la
probabilidad de obtener cuatro tubos de luz defectuoso al tomar una muestra al
azar de quince, sabiendo que el 8% de ellos son defectuosos.
Los datos son, números de pruebas u observaciones es de 15, se espera
obtener 4 tubos de luz defectuosos, sabiendo que la probabilidad de éxito para
obtener un defectuoso es 0,08; con estos elementos se puede calcular la
probabilidad correspondiente.
La distribución binomial de probabilidad es una distribución discreta de
probabilidad. Y se dice que un experimento es “binomial” si reúne los siguientes
requisitos:
1) El número de pruebas o ensayos es fijo y no muy grande
2) Cada prueba solo tiene dos posibles resultados, a los que suele llamarse
“éxito” o “fracaso”.
3) En cada una de las pruebas la probabilidad de éxito es la misma.
4) Las pruebas son estadísticamente independientes.

DEFINICION.- Si “p” es la probabilidad de “éxito” de un suceso en un ensayo o prueba


y q=1-p es la probabilidad de “fallo” o fracaso en un solo ensayo, entonces, la
probabilidad de obtener X éxitos en N pruebas independientes, está dado por:

c px qN-x
P(x) = N X

Ejemplo 1. ¿Cuál es la probabilidad de obtener 2 caras exactamente al lanzar 6 veces


una moneda correcta?
Solución:
N = 6 lanzamientos o pruebas ;
X = 2 caras (éxitos)
p = 1/2 (probabilidad de obtener cara)
q = 1- p = 1/2

p(x=2) =

Ejemplo 2. La probabilidad de un estudiante que ingresa a la universidad logre


graduarse es 0,4. ¿Cuál es la probabilidad que de 5 estudiantes nuevos, se gradúen 3
estudiantes?
N = 5 ; X = 3 graduados ; p = 0,4 (graduarse) ; q = 0,6 (no graduarse)
VARIABLE ALEATORIA CONTINUA

Una variable aleatoria X es continua si puede tomar cualquiera de los valores de un


intervalo.
Como por ejemplo tenemos la edad y el peso de una persona, la duración de un
movimiento sísmico, el tiempo que dura una bomba eléctrica, el tiempo que dura una
bujía.

FUNCION DE DENSIDAD.- Si la frecuencia relativa de un grupo de valores


correspondientes a una variable aleatoria continua se representa mediante un
histograma, se puede comprobar que a medida que el número de valores de la
variable aumenta y se construyen intervalos de clase cada vez más pequeños, el
polígono de frecuencias relativas tiende a una curva f que cambia suavemente.

Se considera que la función f es una función límite y el area del histograma es 1, en el


límite, el área de la región que está debajo de la gráfica de la función también debe
ser 1; esto es

La función f constituirá lo que se llama función de densidad de X


A partir de la función de densidad es posible calcular probabilidades usando el
cocepto de integración. Así por ejemplo, la probabilidad de que la variable X tome
valores entre a y b se calcula como:

Formalmente, una variable aleatoria X es continua si es posible encontrar una función


f(x) no negativa que cumple con las siguientes propiedades:

a) f(x) ≥ 0

b) ,

C) P[ a ≤ x ≤ b] =
donde a puede ser -

c) no negativa que cumple con las siguientes propiedades


Problemas Propuestos

1. Las probabilidades que 3 tiradores den el blanco son, respectivamente, iguales


a 4/5, 3/4, 2/3. si en un disparo simultáneo por los 3 tiradores, exactamente dos
dan en el blanco, hallar la probabilidad de que el tercer tirador halla fallado.
2. El 5% de las unidades producidas en una fábrica se encuentran defectuosas
cuando el proceso de fabricación se encuentra bajo control. Si el proceso se
encuentra fuera de control, se produce un 30% de unidades defectuosas. La
probabilidad marginal de que el proceso se encuentre bajo es de 0.92. si se
escoge aleatoriamente una unidad y se encuentra que es defectuoso. ¿Cuál es
la probabilidad de que el proceso se encuentre bajo control?
3. En una universidad el 60% de los estudiantes son de la costa, el 40% son
mestizos y el 25% son mestizos de la costa. Si se va a seleccionar un
estudiante al azar entonces la probabilidad que sea costeño no mestizo es.
4. La probabilidad de accidente de un avión en el mes de diciembre cuando está
nublado es de 0.30, mientras que cuando está despejado es de 0.01. se sabe
que en el mes de diciembre hubo 20 días nublados y el avión tuvo un
accidente. ¿Cuál es la probabilidad de que lo tuviera en un día nublado?
5. 200 personas están distribuidas de acuerdo a su sexo y lugar de procedencia
de la siguiente manera 130 son hombres, 110 son de la capital y 30 son
mujeres y de provincias. Si se eligen 2 personas al azar calcular la posibilidad
de que:
a. Ambos sean hombres y de provincias.
b. Al menos uno de los dos escogidos sea mujer.
6. Un lote contiene 15 objetos de los cuales 7 son calificados como E (éxito) y el
resto como fracaso (F). Del lote se escogen 5 objetos al azar una tras otra.
Calcular la probabilidad de que los cinco sean éxitos si las extracciones se
hacen:
a. Con reposición.
b. Sin reposición.
7. En una habitación se encuentra el siguiente grupo de personas: 5 hombres
mayores de 21 años, 4 hombres menores de 21 años, 4 hombres menores de
21 años, 7 mujeres mayores de 21 años, 3 mujeres menores de 21 años. Se
elige una persona al azar y se definen los siguientes eventos:
A: la persona es mayor de 21 años.
B: la persona es menor de 21 años.
C: la persona es hombre.
D: la persona es mujer.
Calcular la probabilidad de que la persona elegida sea mayor de 21 años dado
que la persona resulta ser hombre.

8. Si P  A  0.4 , P B   0.5 , P  AB   0.3 . Hallar P  A  B  , P  AB  , P  A B  .


9. Si P B   0.1 , P  C   0.2 , P  BC   0.1 y P  AB C   0.1 . Hallar
a. P  B AC  .
b. P  A B C  BC  .

Para definir la probabilidad debemos usar ciertos conceptos preliminares como:

EXPERIMENTO
Un experimento es cualquier acción o proceso cuyo resultado está sujeto a
incertidumbre; es decir no se puede determinar en forma exacta.
Ejemplos: E1: Lanzar una moneda al aire
E2 : Lanzar un dado
E3 : Extraer una carta de una baraja de naipes
E4 : Lanzar una moneda y un dado
E5 : Lanzar dos monedas
E6 : Lanzar dos dados

ESPACIO MUESTRAL (S) Es el conjunto de todos los resultados posibles de un


experimento dado. Usualmente se designa a este conjunto con S.
Ejemplos: S1 = { c, s }

S2 = { 1,2,3,4,5,6 }
S3 = { 1♠, 2♠, 3♠, 4♠ , …. 10♠, J♠, Q♠, K♠
1♣, 2♣, 3♣, 4♣, …. 10♣, J♣, Q♣, K♣
1♦, 2♦, 3♦, 4♦, …. 10♦, J♦, Q♦, K♦
1♥, 2♥, 3♥, 4♥, …. 10♥, J♥, Q♥, K♥ }

S4 = { C1,C2,C3,C4,C5,C6, S1,S2, S3,S4,S5,S6 }

S5 = { CC,CS,SC,SS }

S6 = { (1,1), (1,2), (1,3), (1,4), (1,5), (1,6)


(2,1), (2,2), (2,3), (2,4), (2,5), (2,6),
(3,1), (3,2), (3,3), (3,4), (3,5), (3,6)
(4,1), (4,2), (4,3), (4,4), (4,5), (4,6)
(5,1), (5,2), (5,3), (5,4), (5,5), (5,6)
(6,1), (6,2), (6,3), (6,4), (6,5), (6,6) }

EVENTOS.- Es un subconjunto de resultados posibles, en otras palabras es un


subconjunto del espacio muestral S.
Es decir si A es un suceso, entonces A S
Se representa con las letras mayúsculas, así:
A Se lee “evento A”
B Se lee “evento B”
C Se lee “evento C”

Ejemplo 1. Sea el experimento E: lanzar una moneda entonces:


S = { c, s }
Sea el evento A : Salga cara
B : Salga sello

Ejemplo 2. Sea el experimento E2 : lanzar un dado


Entonces S = { 1, 2, 3, 4, 5, 6 }
Y los eventos: A : Salga un número par
B : Salga un número impar
C : Salga un número primo
D : Salga un número mayor que 2

Ejemplo 3. Sea el experimento E3 : Lanzar 3 monedas, entonces el espacio


muestral será:
C
C S
C C
S
S
C
C S
S C
S
S
S = { CCC, CCS, CSC, CSS, SCC, SCS, SSC, SSS }

Y sean los eventos:


A : Salgan la misma cosas a la vez
B : Salga por lo menos una cara
C : Salga por lo menos dos sellos

OBSERVACIÓN:
1.- Se dice que un evento es SIMPLE si consiste exactamente en un resultado y
compuesto si consta de más de uno.
2.- Como el conjunto vacío ( Ф ) está contenido en todo conjunto, estará también en
el espacio muestral, y a éste se le llama suceso imposible (nunca ocurre)
3.- como S S (todo conjunto está contenido en sí mismo), este se llama suceso
seguro (siempre ocurre).

ALGUNAS RELACIONES DE TEORIA DE CONJUNTOS

Un evento no es otra cosa que un conjunto, así que las relaciones y resultados de la
teoría elemental de conjuntos se puede usar para estudiar eventos.
Las siguientes operaciones se usan para construir eventos nuevos a partir de eventos
determinados.
DEFINICION:
1.- La unión de dos eventos A y B denotada por A B y se lee “A unión B” es el
evento que consiste en los resultados que están ya sea en A o en B o en ambos

eventos ( Así que la unión incluyen resultados para los que ocurren tanto A como
B, así como resultados para los que ocurre exactamente uno) es decir los
resultados en por lo menos uno de los eventos.
A B

2.- La intersección de dos eventos A y B, que se denota como A B y se lee “A


intersección B”, es el evento que consiste en los resultados que están tanto en A
como B.
A B

3.- El complemento de un evento A, denotado por Ā, es el conjunto de todos los


resultados en el espacio muestral (S)

4.- Sean A y B sucesos; Si A B = Ф ; entonces los sucesos A y B se llaman


mutuamente excluyentes.

A B=Ф

Luego de haber revisado algunos conceptos preliminares estamos en condiciones de


definir la probabilidad, a partir de dichas concepciones.

DEFINICIÓN DE PROBABILIDAD.-
Si A es un subconjunto del espacio muestral (S), donde el suceso A puede ocurrir de
“n” maneras y S de N maneras igualmente posibles, entonces la probabilidad de A
será:

n
P (A ) = =
N

Es una definición que corresponde a la teoría clásica de la probabilidad, que se


preocupa fundamentalmente de los espacios equiprobables, en tanto que el
tratamiento moderno de la teoría de la probabilidad es puramente axiomática.
DEFINICIÓN AXIOMÁTICA

Sea E un experimento aleatorio, S el espacio muestral asociado a dicho experimento y


A un suceso; entonces la probabilidad P es:

S R +
P :
A P (A )

Y que cumple:
1) P(A) ≥ 0 , A S
2) P(S) = 1
3) Si A y B son sucesos mutuamente excluyentes
entonces P ( A B ) = P(A) + P(B)

Ejemplo 1. Sea el experimento E: lanzar un dado y sean los eventos o sucesos


S = { 1, 2, 3, 4, 5, 6 }

A: Salga número par


B: Salga número primo
C: Salga un número mayor que 2
D: Salga un número impar y primo a la vez.

Hallamos:
3 1
P (A) = =
6 2
3 1
P (B) = =
6 2
4 2
P (C) = =
6 3

P (D ) = 2 = 1
6 3

AXIOMAS Y TEOREMAS SOBRE PROBABILIDADES

AXIOMA 1. Principio Fundamental de la Probabilidad


Para todo suceso A; se cumple:

0 ≤ P(A) ≥ 1
AXIOMA 2. La probabilidad del suceso seguro “S” (espacio muestral) es igual a la
unidad.
Es decir: P (S) = 1

AXIOMA 3. Si A y B son sucesos mutuamente excluyente entonces:

P(A B) = P(A) + P(B)


En forma general :

c) Si A1, A2, A3, …………, An son sucesos mutuamente excluyentes; entonces:

P(A1 A2 A3 …………. An) = P(A1) + P(A2) + P(A3) + ……… + P(An)

d) Si S = A1 A2 A3 …………. An / A i Aj = Ф , i≠j

P(A1) + P(A2) + P(A3) + ……… + P(Ar) = 1

e) Si en un espacio muestral S se define un suceso A entonces su complemento


es Ā , donde:
AUĀ = S
P(A U Ā) = P(S)
P(A U Ā) = P(A) + P(Ā) = 1

De aquí: P(A) = 1 – P(Ā) y P(Ā) = 1 – P(A)

Ejemplo 1. Una caja contiene 220 tornillos iguales de los cuales 80 son producidos
por la máquina A, 60 por la máquina B, 50 por la máquina C y 30 de la máquina D. Si
se elige un tornillo al azar de la caja.
¿Cúal es la probabilidad de que el tornillo elegido haya sido producido por las
máquinas A o C ?
Solución:
Es claro que A,B,C y D son sucesos mutuamente excluyente, porque cada tornillo es
producido por una y sólo una máquina.
P(A C) = P(A) + P(C) =

Además S = { A, B, C, D }

P(A B C D) = P(A) + P(B) + P(C) + P(D) =

TEOREMA 1. La probabilidad del suceso imposible Ф es cero.

Es decir: P(Ф) = 0
Demostración:
Sea el suceso A; entonces A = A Ф (excluyentes)
P(A) = P(A Ф)
P(A) = P(A) + P(Ф)
P(A) + 0 = P(A) + P(Ф)
P(Ф) = 0

TEOREMA 2. Si A y B son dos sucesos cualesquiera; entonces:

P(A B) = P(A) + P(B) – P(A B)

Demostración:
Descomponemos A B y B en sucesos mutuamente excluyente
Sea A B = A (B Ā)
B = (A B) (B Ā)
Entonces: P(A B) = P(A) + P(B Ā)
P(B) = P(A B) + P(B Ā)
Entonces P(A B) = P(A) + P(B) - P(A B)

TEOREMA 3. Si A, B, C son sucesos cualesquiera; entonces

P(A B C) = P(A) + P(B) + P(C) - P(A B) – P(A C) - P(B C) + P(A B C)

Demostración:
Sea A B C = (A B)
P(A B C) = P(A B) + P(C) - P[(A B) C]
= P(A) + P(B) – P(A B) + P(C) - P[(A C) (B C)]
= P(A) + P(B) + P(C) – P(A B) – [(P(A C) + P(B C) – P(A B C)]
= P(A) + P(B) + P(C) – P(A B) - P(A C) - P(B C) + P(A B C)

TEOREMA 4.
Si A B ; entonces P(A) ≤ P(B)

Demostración:
B = A (B Ā)
P(B) = P(A) + P(B Ā) ≥ P(A)
Por lo tanto: P(A) ≤ P(B)

PROBABILIDAD CONDICIONAL

Dados los eventos A y B; la probabilidad condicional de un evento B dado el evento A,


se denota por: P(B/A) y se define como:

Ejemplo 1. Se lanzan dos dados normales y se anotan los resultados entonces

Consideremos los sucesos:

A = { (x,y) / x+y = 10}

B = { (x,y) / x > y}
Entonces:

P(B/A) = 1/36_ = 1_
3/36 3

Similarmente:

P(A/B) = 1/36_ = 1_
15/36 15

Ejemplo 2. Se encuentra en una facultad que del 70% de los alumnos matriculados,
el 70% son mujeres y 18% son mujeres que estudian Economía.
Si elegimos un estudiante al azar y resulta que es mujer. ¿Cúal es la probabilidad de
que esté estudiando Economía?

Solución:

P(M) = 0.70 M ===> Mujer


P(H) = 0.30 H ===> Hombre
P(M E) = 0.18 E ===> Economía
P(E/M) = P(E M) / P(M) = 0.18 = 18 = 0.25
0.70 70

PROPIEDADES:
4) 0 ≤ P(B/A) ≤ 1
5) P(S/A) = 1
6) P(B1 B2 / A) = P(B/A) + P(B2/A) ; Si B1 B2 = Φ
P(B1 B2 ….. Bn /A) = P(B1/A) + P(B2/A) + …..+ P(Bn/A) ;
Bi Bj = Φ , i≠j

Ejemplo: Supóngase que en una oficina tiene 100 máquinas calculadoras algunas
son eléctricas (E) , mientras que otras son manuales (M). Además, algunas son
nuevas (N), mientras que las otras son usadas (U). La siguiente tabla muestra el
número de máquinas de cada categoría.
c) Una persona entra a la oficina y escoge una máquina al azar y descubre que es
nueva. ¿Cúal es la probabilidad de que sea Eléctrica?

d) Cuál es la probabilidad de que sea Manual?

TEOREMA DE LA MULTIPLICACION

“La probabilidad de Éxito simultáneo para los eventos A y B, es igual a la probabilidad


de éxito de A multiplicada por la probabilidad de éxito de B, dado que A ha tenido
éxito”.

Es decir: P(A B) = P(A) . P(B/A)

Ejemplo. Si tenemos un lote de 20 artículo defectuosos y 80 artículos no


defectuosos. Si escogemos 2 artículos al azar, sin sustitución. ¿Cúal es la
probabilidad de que ambos artículos sean defectuosos?
Solución:

Sean los sucesos:

A = { El primer artículo es defectuoso } y

B = { El segundo artículo es defectuoso }

Entonces: P(A B) = P(A) . P(B/A)

P(A B) = 20 . 19

100 99
(A B) = 19 = 0.038
495
TEOREMA DE BAYES

Si A1, A2, …….. An son n sucesos mutuamente excluyentes, de los cuales al menos
uno de los Ai (i=1, 2, …. n) debe ocurrir, y sea B un suceso cualesquiera en S, la
probabilidad condicional de la ocurrencia de Ai cuando el evento B a ocurrido es:

Ejemplo.