Fundamentos de Estadistica Inferencial y Descriptiva Semana 1 y 2

“Fundamentos de estadística
descriptiva e inferencial”
Prof. Ronald Pietri

con la colaboración de:
Prof. Carlos Buitrago
Fundamentos de estadı́stica descriptiva e inferencial - Ronald Pietri
1. SEMANA 1
1.1. Dato
Es el registro de un valor observado.
1.2. Universo y población

El universo es el conjunto de unidades fı́sicas de las cuales se toman los datos. El conjunto de
datos asociados a estas unidades es lo que se llama población, y es el conjunto de interés en el
estudio que se desea hacer. Como un ejemplo, si se desea saber la estatura promedio de un grupo
de personas, el universo lo conforman las personas en sı́, pero la población es el conjunto de sus
estaturas. Si lo que se desea saber es el peso promedio, entonces la población serı́a el conjunto de
sus pesos pero el universo sigue siendo el mismo.
Personas Estaturas en Mts Pesos en Kg

Juan 1.82 78.5
Anita 1.76 67.2
Luis 1.80 76.8
Marı́a 1.72 64.5
Antonio 1.78 72.1
En esta población hipotética, el universo está constituido por cinco personas: Juan, Anita,
Luis, Marı́a y Antonio. Pero de acuerdo a nuestro interés en el estudio, existen dos poblaciones,
las estaturas o los pesos. Debido a la correspondencia numérica entre los dos conceptos, a veces
tienden a confundirse. Realmente, siempre nos interesa el estudio estadı́stico sobre una población.
Nunca sobre un universo. Si fuera de interés el número de personas que se llaman “Juan”, entonces
la población serı́a el conjunto de nombres, pero no las personas en sı́ mismas. En este caso las
personas seguirı́an siendo el universo mientras que el conjunto de sus nombres son la población.
En pocas palabras, la población la constituyen el conjunto de datos a observar de los elemento
del universo.
Cuando lo que se observa es un solo dato de cada elemento del universo, se dice la población
está asociada a una variable univariada. En el ejemplo anterior, el conjunto de todas las estaturas
es una población formada por una variable univariada. Igual sucede si se tomen el conjunto de
datos que conforman los pesos.
Ahora supóngase que es de interés recoger ambas caracterı́sticas de cada una de las personas
que conforman la población, estatura y peso, entonces se tendrı́a que cada dato es un dato “doble”,
donde la población está asociada a una variable bivariada. Ası́, cada dato está formado por un
par de datos que son estatura y peso. Este par de datos forman un vector de dos dimensiones y
se llama dato bivariado.
Es posible que sea de interés cada población por separado donde cada una sirva para un
estudio diferente, como también podrı́a ser con la medición de un componente en la sangre
(hierro o colesterol), del ı́ndice de masa corporal o la tensión arterial. Pero también puede ser
de interés medir todas estas variables en cada persona simultáneamente con el fin de estudiar
la relación que éstas tienen entre sı́. Este serı́a el caso de una población asociada a una variable
multivariada. Cada dato es un vector aleatorio de tantas dimensiones como datos se recojan de
cada elemento del universo. Fı́jese que un vector aleatorio puede descomponerse en varios datos
únicos e indivisibles donde cada uno es una observación de una cualidad o valor de un elemento
del universo.
2
1.3. Experimento aleatorio

Se define como experimento aleatorio aquel que puede tener más de un resultado posible en
relación al “fenómeno de interés a observar”.
La definición anterior aclara que el experimento no es aleatorio en sı́ mismo, sino de acuerdo
a lo que se observe de él. Por ejemplo, si se lanza una moneda al aire, el hecho de que caiga al
piso no tiene más de un resultado posible y por lo tanto no es un experimento aleatorio. Observar
su caı́da es un experimento de fı́sica simple. Pero si lo que se desea es observar si cae cara o
sello, entonces si es un experimento aleatorio porque puede tener más de un resultado posible
y ninguno es predecible con exactitud. La no precisión de este resultado lo hace aleatorio. Si
existiera una forma de que siempre caiga cara o siempre sello con exactitud, entonces ya no serı́a
experimento aleatorio. La incertidumbre sobre el resultado lo hace aleatorio. Es de notar que no
es el lanzamiento de la moneda lo que lo califica como experimento aleatorio, sino cuando lo que
se observa tenga más de un resultado que no pueda predecirse.
1.4. Muestra
Es cualquier subconjunto de la población. La utilidad de la muestra depende de que tanto
represente a la población en términos estadı́sticos. Esto será explicado más adelante. Una muestra
está conformada por uno o más datos de la población pero sin tomar toda ésta, es decir; si la
población tiene 10000 resultados, entonces una muestra debe ser un conjunto de valores que debe
estar entre 1 solo y 9999 datos. Tomar toda la población es idóneo porque es más preciso para
el estudio, pero hay muchos casos en que esto no es posible. Si se desea saber el número de
animales de una especie determinada, no es posible contarlos a todos. Solo puede estimarse su
población en base a su distribución en una muestra. También es el caso de unas elecciones donde
se puede estimar el candidato ganador en base a un sondeo de opinión y donde es imposible hacer
unas elecciones paralelas con todos los ciudadanos participantes. Existe un concepto asociado al
muestreo llamado “Espacio muestral”.
1.5. Espacio muestral

El espacio muestral se define como el conjunto de todos los resultados posibles de un experi-
mento aleatorio. Es de notar que el espacio muestral no coincide con el número de elementos de
la población, a menos que la muestra sea de tamaño 1. Véase un ejemplo: Supóngase que se desea
una muestra de tamaño 1 en la población hipotética del ejemplo con las estaturas. El espacio
muestral tiene 5 resultados posibles que son 1.82Mts, 1.76Mts, 1.80Mts, 1.72Mts y 1.78Mts. Pero
si se desea tomar una muestra de tamaño 2, entonces el espacio muestral tendrı́a 20 resultados
posibles que serı́an:
{Juan, Anita} {Anita, Marı́a} {Anita, Juan} {Marı́a, Anita}

{Juan, Luis} {Anita, Antonio} {Luis, Juan} {Antonio, Anita}
{Juan, Marı́a} {Luis, Marı́a} D D
qué en términos de los datos de la población observador en el mismo orden serı́an:
{1.82Mts, 1.76Mts} {1.76Mts, 1.72Mts} {1.76Mts, 1.82Mts} {1.72Mts, 1.76Mts}

3
La población tiene 5 datos o, lo que es lo mismo, tiene tamaño 5, pero el espacio muestral
tiene tamaño 20. Si la muestra se hubiera tomado de tamaño 3, el espacio muestral hubiese tenido
tamaño 60 porque es la cantidad de tomas que se pueden hacer de tres en tres.
Fı́jese que cada par de datos es contado como uno diferente cuando se invierte el orden, esto es,
la muestra 1.82Mts, 1.76Mts se cuenta como un resultado distinto a 1.76Mts, 1.82Mts. En el caso
de que no sea de interés el orden de los elementos, se cuentan como una sola observación. Aquı́ se
está presentando en la forma más básica y desglosada posible. También se puede observar que en
este ejemplo no se repiten los datos como en el caso de que una persona pueda ser seleccionada
dos veces para tomar su estatura. Puede haber casos donde se repitan o donde no. Esto depende
del estudio y se aclarará más adelante.
En el caso de que se tenga que hacer el muestreo con la variable bivariada que comprende un
vector de dos variables que son estatura y peso, La población sigue teniendo 5 datos (tamaño 5)
y si se desea tomar una muestra de tamaño 2, también el espacio muestral tendrá 20 resultados
posibles (espacio muestral de tamaño 20). No debe confundirse el orden del vector de muestra,
que puede comprender estatura en la primera componente y peso en la segunda, o al revés, con
el orden en el cual se toman los vectores de muestra. El orden de los componentes del vector se
define previamente y no influye en el estudio. Puede ser (Mts , Kg) o (Kg , Mts). Pero no es lo
mismo el resultado Juan , Anita que Anita , Juan que a efectos de los datos que interesa recolectar
se escriben (1.82Mts , 78.5Kg) , (1.76Mts , 67.2Kg) y (1.76Mts , 67.2Kg) , (1.82Mts , 78.5Kg)
respectivamente. Aquı́ se asume que el primer componente del vector es la estatura y el segundo el
peso que, como se dijo antes, este orden no influye en el estudio y se define arbitrariamente. Una
vez definido, ese orden no debe cambiarse. Los vectores son indivisibles porque es claro que no
puede asociarse el peso de una persona con la estatura de otra por ejemplo. Si en la recolección
de los datos, se hubiera deseado que sea bivariado, entonces los posibles resultados en el caso
anterior se pueden escribir o representar igual para los elementos del universo seleccionados a
observar:
{Juan, Anita} {Anita, Juan}
{Juan, Luis} {Luis, Juan}
{Juan, Marı́a} {Marı́a, Juan}
{Juan, Antonio} {Antonio, Juan}
{Anita, Luis} {Luis, Anita}
{Anita, Marı́a} {Marı́a, Anita}
{Anita, Antonio} {Antonio, Anita}
{Luis, Marı́a} {Marı́a, Luis}
{Luis, Antonio} {Antonio, Luis}
{Marı́a, Antonio} {Antonio, Marı́a}
Fı́jese que son los mismos elementos del universo seleccionados que en el caso anterior que
es univariado. Pero los elementos a recolectar de la población se escriben como vectores que se
corresponden a cada uno de los 20 datos anteriores en el mismo orden escritos:
{(1.82Mts, 78.5Kg), (1.76Mts, 67.2Kg)} {(1.76Mts, 67.2Kg) , (1.82Mts, 78.5Kg)}
4
Cada resultado de una población se llama punto muestral, sea univariada, bivariada o mul-
tivariada, es decir, sea dato univariado (valor), bivariado (vector de 2 valores) o multivariado
(vector de varios valores). Cada punto muestral en el ejemplo anterior es cada resultado de del
dato o conjunto de datos observados de cada elemento del universo seleccionado. En los casos
anteriores son 20 puntos muestrales, tanto en el univariado como en el bivariado como se dijo
antes.
El número de elementos a seleccionar en una muestra se define antes del estudio. Pero lo
primero es definir la población, seguido luego de lo que debe responder el estudio. Para entender
esto veremos la definición de parámetro posteriormente.
Cuando se hace un estudio en estadı́stica, no importan tanto los datos individuales sino el
conjunto de ellos vistos como un todo. Esto hace que las descripciones exhaustivas de detalles, no
sean relevantes y no aporten a una información resumida que pueda dar una idea de la tendencia
del fenómeno. Puede que algunos datos sean interesantes a efectos de entender las razones de su
aparición, pero son excepciones. El objetivo de la estadı́stica es sintetizar algo que saque a la luz
algún denominador común en la masa de datos desordenados y confusa, puesto que el volumen
de datos hace imposible que con una mirada de inspección sencilla se pueda ver alguna relación
entre variables o coincidencias entre comportamientos.
La manera de obtener un resumen que describa un comportamiento de los datos o que haga
explı́cita, y de manera ordenada, alguna información oculta e implı́cita en los datos desordenados,
es con algo simple de interpretar que describa una o varias caracterı́sticas de la población. La
forma de sacar información es hacer cálculos con los datos para obtener valores útiles para tal
fin. Para poner el tema en contexto, se da la siguiente definición.
1.6. Parámetros
Un parámetro es un valor numérico que describe una caracterı́stica de una población. Puede
haber varios parámetros de una población que sirvan para describir varias caracterı́sticas de ella.
Véase que en la definición se aclara que su valor es numérico. No puede ser una frase o un
párrafo sino un número. Por ejemplo: El 30 % de las mujeres de esta población tiene menos de
25 años o el 20 % de los mayores de 65 años de la población X tiene hipertensión.
A pesar de que en las dos frases anteriores hay una explicación, se puede ver que hay un
parámetro en la primera que es 30 % de mujeres con una caracterı́stica que es ser menor de
25 años en una población especı́fica. En la segunda se ve que hay otra caracterı́stica que es la
hipertensión y que la sufren solo el 20 % de la población de hombres mayores de 65 años de un
determinado lugar, que puede ser de un pueblo, ciudad o paı́s tomado como población de estudio.
Hay muchos valores producto de cálculos con los datos que se han vuelto parámetros clásicos
por su utilidad. La media (o promedio) de los valores es un caso de ejemplo. El parámetro a elegir
para describir a la población, depende de lo que se desea saber de la población.
Cada parámetro tiene su forma de cálculo y es posible que un estudio contenga la definición
de un nuevo parámetro a medir. Este serı́a el caso de la creación de un instrumento de medición
en psicologı́a de alguna caracterı́stica de la personalidad.
En todo estudio de estadı́stica, lo que interesa casi siempre es el valor de uno o más parámetros
para describir una o más caracterı́sticas de la población. Otro tipo de estudio menos común es
cuando requerimos crear un nuevo parámetro como en el ejemplo de psicologı́a del párrafo anterior.
La pregunta aquı́ es ¿cómo saber el valor de un parámetro de interés para un estudio? Si
siempre se desea saber el valor de un parámetro y ya se tiene su valor, entonces el estudio ya está
hecho y se puede usar su valor para dar una idea o concluir algo. Pero como ya se dijo, un estudio
consiste en definir el parámetro que se necesita y luego buscar la manera de hallar su valor. Hay
muchos casos en que no se puede hallar el valor de un parámetro, sencillamente porque no pueden
5
medirse todos los elementos de la población y debe optarse por estimar su valor. Esta estimación,
como cualquier otra, tiene un margen de error. Estos casos se aclaran en la siguiente definición:
1.7. Estadı́stica Descriptiva e Inferencial:

Una estadı́stica es descriptiva cuando se usa para describir un conjunto de datos sea de una
muestra o de una población usando los valores de todos ellos sin omitir ninguno. Una estadı́stica
es inferencial cuando se usa para describir un conjunto de datos usando solo una parte de los
valores del conjunto. En pocas palabras, en la estadı́stica descriptiva se usan todos los datos que
se desean describir y en la inferencial solo una parte.
Por lo dicho anteriormente, se puede ver que en la estadı́stica inferencial se estima el valor del
parámetro mientras que en la descriptiva se usa su valor con mayor precisión porque o se tienen
los valores de toda la población, o solo interesa describir una muestra sin importar los valores
fuera de ella. En la estadı́stica inferencial el interés es extrapolar los resultados de una muestra a
toda una población usando técnicas que van desde el diseño del experimento y el muestreo hasta
la estimación del parámetro con el cálculo del error e imprecisiones.
Las conclusiones, sobre una población de estudio, en ambas estadı́sticas son similares y bási-
camente lo que ocurre en el caso inferencial es que es menos preciso.
Hay que aclarar una regla que se aplica como máxima en toda la estadı́stica: “Lo que se
pierde en precisión en la estadı́stica inferencial es muchı́simo menos que lo que se
ahorra en tiempo y dinero al sustituirla por un muestreo en grandes poblaciones”.
Como un ejemplo de lo dicho anteriormente, para una población de 10 millones podrı́a tenerse
una precisión aceptable del 95 %, lo que significa una posibilidad de error del 5 %, esto es una
posibilidad de fallo de 1 en 20, solo con una muestra de 400 datos. Si usted observa los números,
puede ver que la posibilidad de fallar es de 1 fallo contra 19 éxitos solo con 400 datos. Para que
la posibilidad de fallar sea de 0, se tendrı́an que tomar los 10 millones de datos de la población
(los valores aquı́ pueden tener ligeros cambios dependiendo del estudio pero son pocos). Se puede
juzgar que hacer una muestra de 10 millones de datos podrı́a ser virtualmente imposible y que
la ganancia del 100 % de precisión no justifica semejante trabajo. De hecho, si la muestra fuera
de 1500 podrı́a llegarse a precisiones del 99 %, lo que significa un margen de error de 1 fracaso
contra 99 éxitos. En esta relación está basada toda la teorı́a de estadı́stica inferencial y del
muestreo puesto que entre las variables de precisión, población y tamaño de muestra no hay
una relación de linealidad. Esta relación es logarı́tmica donde en el eje X está el tamaño de la
población y en el eje Y está el tamaño de muestra a elegir para una precisión especı́fica. Aún
más, se puede demostrar matemáticamente que para una población grande a partir de 20000
ya no importa si es mayor porque la precisión no cambia con la muestra de un mismo tamaño.
Esto significa que si una población es mayor de 20000, el tamaño de muestra usado para obtener
una precisión determinada es el mismo que para un población de 100 mil millones o más. Esto
se trata matemáticamente como población infinita y el tamaño de muestra está acotado por un
valor constante para cualquier población con una precisión o margen de error determinado.
Es bueno aclarar aquı́ que, habiendo fijado niveles de error especı́ficos tolerables, la relación
entre el tamaño de la muestra y la población tiene un punto de inflexión, esto es, “mientras la
muestra esté entre 1 y un valor constante N, el aumento del tamaño de la muestra da mucha más
precisión que lo que se sacrifica en costo, pero a partir de un valor M¿N, el aumento adicional
de la muestra no agrega precisión que justifique el costo, es decir, se comporta al revés, más
aumenta el costo que la precisión”. Por lo dicho anteriormente, es decisión del investigador tomar
una muestra razonable entre el costo, tiempo disponible y nivel de precisión o error tolerable.
Hay casos en que un parámetro puede saberse sin que se tenga hasta el último dato de toda la
población. En este caso el parámetro se toma como un valor ya conocido para cualquier estudio.
Como un ejemplo de ello, se tienen los valores sanguı́neos. Se sabe que mayor de un valor, el
6
hierro está alto y menor de otro, está muy bajo. Aunque a esta persona nunca se la haya medido
la sangre antes, su añadidura no altera los valores de los parámetros para saber si su hierro está
bajo o alto. Ya este estudio se ha realizado tantas veces como para asegurar que esos valores
son la referencia. Es como que en una elección nacional no asista un votante; esto no altera el
resultado con una precisión que sea significativa.
En los estudios realizados en muchas ocasiones y de manera probada y recurrente, se considera
que los parámetros son conocidos ası́ falten algunos datos de la población.
2. SEMANA 2
2.1. Evento
Es cualquier resultado del espacio muestral. En términos de la teorı́a de conjuntos se define
como cualquier subconjunto del espacio muestral.
Los eventos pueden clasificarse en simples o compuestos.
2.2. Evento Compuesto o simple

El evento compuesto es aquel que se compone de otros eventos, es decir, que agrupa varios,
sean dos o más de ellos y puede dividirse en otros eventos. Mientras que el simple se compone de
un solo resultado y no puede desglosarse.
Para entender la definición anterior se da el siguiente ejemplo:
Supóngase que se lanza un dado y se define el evento como el resultado del número obtenido,
que puede ser del 1 al 6. Es claro que cada resultado es un evento simple puesto que ningún
valor obtenido puede descomponerse en otros. Pero si se definen dos eventos como “un número
menor que cuatro” y “un número mayor a tres”, entonces en el primer caso se tienen tres eventos
simples que son los resultados 1, 2 y 3; y en el segundo se tienen tres eventos simples que son
4, 5 y 6. Esto mismo puede aplicarse en nuestro caso de estaturas y kilos en el caso de que se
defina un evento con las personas cuya estatura sea mayor a determinado valor. Podrı́an caer
varios dentro de un evento compuesto. Si se define una muestra de tres personas y el evento es:
“solo dos tengan una estatura superior a 1.79mts”, se ve que el evento es compuesto y tendrı́a
los siguientes 18 eventos simples:
{Juan, Luis, Anita} {Juan, Luis, Marı́a} {Juan, Luis, Marı́a}

{Juan, Anita, Luis} {Juan, Marı́a, Luis} {Juan, Antonio, Luis}
{Luis, Juan, Anita} {Luis, Juan, Marı́a} {Luis, Juan, Antonio}
{Luis, Anita, Juan} {Luis, Marı́a, Juan} {Luis, Antonio, Juan}
{Anita, Juan, Luis} {Marı́a, Juan, Luis} {Antonio, Juan, Luis}
{Anita, Luis, Juan} {Marı́a, Juan, Luis} {Antonio, Luis, Juan}
Véase que cada resultado se ve como un todo y que el orden de cada resultado se toma como
un resultado distinto. La muestra fue definida previamente, como debe ser, y se decidió que serı́a
de tamaño 3. Para otra muestra de tamaño distinto serı́an otros resultados ası́ como también si
el evento definido fuese otro. Aquı́ se presentó con los nombres de las personas pero realmente
cada toma es de tres estaturas asociadas a las personas.
2.3. Eventos excluyentes

Son los eventos que no pueden ocurrir simultáneamente.
7
Como ejemplo de evento excluyente se puede definir la cara que sale en el lanzamiento de un
dado porque es imposible que salgan dos valores al mismo tiempo en un lanzamiento. También
es el caso del lanzamiento de una moneda ya que no puede salir cara y sello al mismo tiempo.
2.4. Eventos Independientes

Dos eventos son independientes cuando la ocurrencia o no ocurrencia de uno, no altera la
probabilidad de ocurrencia del otro.
En el caso de eventos independientes, el ejemplo serı́a el lanzamiento de una moneda dos veces
puesto que lo que salga en el primer lanzamiento no influye en lo que resulte en el segundo. Al
igual sucede con el lanzamiento de un dado dos veces o de dos dados.
Hay otra definición importante a efectos de la teorı́a de la probabilidad que es útil en el estudio
de los experimentos aleatorios como lo es los eventos colectivamente exhaustivos.
2.5. Eventos colectivamente exhaustivos

Un conjunto de eventos son colectivamente exhaustivos si son excluyentes entre si tomados
de dos en dos, y la unión de todos es igual al espacio muestral.
En la definición anterior se cubren todos los resultados del espacio muestral de forma separada
en el caso de eventos colectivamente exhaustivos.
En el caso de que dos eventos no sean independientes y deban tratarse como probabilidades
que cambian en uno de ellos cuando ocurre el otro, entonces se usa el concepto de probabilidad
condicional.
2.6. Probabilidad Condicional

Es la probabilidad de que ocurra un evento cuando ya ha ocurrido otro.
En el caso de dos eventos independientes, es claro que la probabilidad condicional de uno es
la misma que la probabilidad condicional de ese evento dada la ocurrencia del otro evento, y esta
probabilidad cambia solo si hay dependencia.
2.7. Muestreo Probabilı́stico

Es aquel en el que se asocia una probabilidad a cada punto muestral. En particular el más
utilizado es donde cada punto muestral tiene la misma probabilidad y casi todos los muestreos
se basan en este principio llamado muestreo aleatorio.
Al momento de hacer un muestreo se debe usar un método que garantice o se acerque lo más
posible a que todos los elementos de la muestra tengan la misma probabilidad de ocurrir.
2.8. Probabilidad de un evento

La probabilidad de un evento se define como el cociente del número de eventos simples que
contiene, entre el número de eventos simples del espacio muestral.
La definición de probabilidad anterior es cuando cada punto muestral tiene la misma probabi-
lidad de ocurrir. Esta es la definición más usada y se adapta a prácticamente todos los estudios.
“Todo lo dicho hasta ahora es válido solamente si el muestreo es aleatorio, es
decir, cuando cada punto muestral tiene la misma probabilidad de ocurrir. De lo
contrario, no se cumplen las caracterı́sticas de la precisión con respecto al tamaño
de la muestra explicadas anteriormente.”
8
2.9. Algebra de Eventos

El álgebra de eventos es la misma que el álgebra de conjuntos. Los eventos se representan
con sı́mbolos o letras y las operaciones de eventos son análogas a las de conjuntos. A los eventos
pueden aplicárseles las operaciones matemáticas de unión, intersección y complemento. También
pueden tener relaciones de subconjunto.
Para representar la probabilidad de un evento A, se coloca la notación P (A) y se lee “Pro-
babilidad de ocurrencia del evento A”. Esto según la definición anterior de probabilidad de un
evento se escribe como el cociente de la cardinalidad del conjunto A dividido entre la cardinalidad
del espacio muestral. Si se denota al espacio muestral con la letra S, entonces la probabilidad del
evento A es la cardinalidad de A entre la cardinalidad de S, es decir P (A) = |A| |S|
Las siguientes
reglas, se cumplen:
1. Si A es un evento, entonces P (A) ≥ 0
2. Si S es el espacio muestral, entonces P (S) = 1
3. Si Ac es el complemento del evento A, entonces P = (Ac ) = 1 − P (A)
4. Si A1 , A2 , A3 , A4 ... es una secuencia finita o infinita de eventos mutuamente excluyentes,

entonces P (A1 ∪ A2 ∪ A3 ∪ A4 ...) = P (A1 ) + P (A2 ) + P (A3 ) + P (A4 ) + ...
5. La probabilidad de que no ocurra ningún evento es cero. La no ocurrencia de ningún evento

se representa como el conjunto vacı́o.
6. Si A ⊆ C, entonces P (A) ≤ P (B)
7. Para cualquier evento, A, se cumple 0 ≤ P (A) ≤ 1
8. Si A y B son dos eventos cualquiera, entonces P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
Los eventos se pueden operar tal cual como conjuntos porque son tratados como parte de
esta teorı́a. El espacio muestral es análogo al conjunto universal y cualquier ocurrencia fuera del
espacio muestral es tratado como el conjunto vacı́o.
En términos del álgebra de eventos la independencia se cumple cuando P (A∩B) = P (A)∗P (B)
y la probabilidad condicional se representa como P (A/B) y se lee “Probabilidad del evento A
dado que ya ocurrió el evento B”. También se cumple que P (A/B) = P P(A∩B) (B)
.
Es fácil ver que si dos eventos son independientes, también la probabilidad de un evento es
igual a la probabilidad condicional de ese mismo evento dado el otro. Esto es coherente con la
definición de eventos independientes. Se observa fácil aquı́ su prueba con las definiciones anteriores
escritas en términos matemáticos:
Supóngase A y B independientes, entonces P (A/B) = P P(A∩B) (B)
= P (A)∗P
P (B)
(B)
= P (A) Como se
puede ver aquı́, la probabilidad de A es la misma que la de A dado B puesto que las probabili-
dades de B se cancelan en el numerador y denominador. Esto es coherente con la definición de
independencia, la cual significa que la ocurrencia de uno no tiene nada que ver con la del otro.
=
Por las propiedades de conjuntos, también se puede escribir P (A/B ∩C) = P (A∩B∩C) P (B ∩ C)
asi como P (A/B ∪ C) = P (A ∩ (B ∪ C))P (B ∪ C) y como cualquier otra combinación con las
operaciones de conjuntos. Otros ejempĺos válidos que se cumplen son P (A ∩ B/C) = P (A∩B∩C) P (C)
y
P (A ∪ B/C) = P ((A∪B)∩C)
P (C)
Con la notación anterior se pueden escribir las definiciones de forma
más precisa y sencilla. Aquı́ va las definición de independencia:
Dos eventos son independientes si y solo si P (A ∩ B) = P (A) ∗ P (B) Y la definición puede
generalizarse a muchos eventos como sigue: Los eventos A1 , A2 , A3 , ...Ak son independientes si y
9
solo si la probabilidad de la intersección de 2, 3, ..., ok de estos eventos es igual al producto de sus

respectivas probabilidades.
Nótese que la independencia de eventos tomados de dos en dos no implica la independencia
de todos conjuntamente. Cuando en estadı́stica se habla de eventos independientes, es con ellos
tomados de dos en dos o tres en tres. . . o de cualquier cantidad de ellos o tomados todos a la vez.
10

Fundamentos de Estadistica Inferencial y Descriptiva Semana 1 y 2

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Fundamentos de Estadistica Inferencial y Descriptiva Semana 1 y 2

Diunggah oleh

Hak Cipta:

Format Tersedia

“Fundamentos de estadística

Prof. Ronald Pietri

1.2. Universo y población

Personas Estaturas en Mts Pesos en Kg

1.3. Experimento aleatorio

1.5. Espacio muestral

{Juan, Anita} {Anita, Marı́a} {Anita, Juan} {Marı́a, Anita}

qué en términos de los datos de la población observador en el mismo orden serı́an:

{1.82Mts, 1.76Mts} {1.76Mts, 1.72Mts} {1.76Mts, 1.82Mts} {1.72Mts, 1.76Mts}

1.7. Estadı́stica Descriptiva e Inferencial:

2.2. Evento Compuesto o simple

{Juan, Luis, Anita} {Juan, Luis, Marı́a} {Juan, Luis, Marı́a}

2.3. Eventos excluyentes

2.4. Eventos Independientes

2.5. Eventos colectivamente exhaustivos

2.6. Probabilidad Condicional

2.7. Muestreo Probabilı́stico

2.8. Probabilidad de un evento

2.9. Algebra de Eventos

1. Si A es un evento, entonces P (A) ≥ 0

2. Si S es el espacio muestral, entonces P (S) = 1

3. Si Ac es el complemento del evento A, entonces P = (Ac ) = 1 − P (A)

4. Si A1 , A2 , A3 , A4 ... es una secuencia finita o infinita de eventos mutuamente excluyentes,

5. La probabilidad de que no ocurra ningún evento es cero. La no ocurrencia de ningún evento

6. Si A ⊆ C, entonces P (A) ≤ P (B)

7. Para cualquier evento, A, se cumple 0 ≤ P (A) ≤ 1

8. Si A y B son dos eventos cualquiera, entonces P (A ∪ B) = P (A) + P (B) − P (A ∩ B)

solo si la probabilidad de la intersección de 2, 3, ..., ok de estos eventos es igual al producto de sus

Anda mungkin juga menyukai