Anda di halaman 1dari 10

“Fundamentos de estadística

descriptiva e inferencial”

Prof. Ronald Pietri


con la colaboración de:
Prof. Carlos Buitrago
Fundamentos de estadı́stica descriptiva e inferencial - Ronald Pietri

1. SEMANA 1
1.1. Dato
Es el registro de un valor observado.

1.2. Universo y población


El universo es el conjunto de unidades fı́sicas de las cuales se toman los datos. El conjunto de
datos asociados a estas unidades es lo que se llama población, y es el conjunto de interés en el
estudio que se desea hacer. Como un ejemplo, si se desea saber la estatura promedio de un grupo
de personas, el universo lo conforman las personas en sı́, pero la población es el conjunto de sus
estaturas. Si lo que se desea saber es el peso promedio, entonces la población serı́a el conjunto de
sus pesos pero el universo sigue siendo el mismo.

Personas Estaturas en Mts Pesos en Kg


Juan 1.82 78.5
Anita 1.76 67.2
Luis 1.80 76.8
Marı́a 1.72 64.5
Antonio 1.78 72.1

En esta población hipotética, el universo está constituido por cinco personas: Juan, Anita,
Luis, Marı́a y Antonio. Pero de acuerdo a nuestro interés en el estudio, existen dos poblaciones,
las estaturas o los pesos. Debido a la correspondencia numérica entre los dos conceptos, a veces
tienden a confundirse. Realmente, siempre nos interesa el estudio estadı́stico sobre una población.
Nunca sobre un universo. Si fuera de interés el número de personas que se llaman “Juan”, entonces
la población serı́a el conjunto de nombres, pero no las personas en sı́ mismas. En este caso las
personas seguirı́an siendo el universo mientras que el conjunto de sus nombres son la población.
En pocas palabras, la población la constituyen el conjunto de datos a observar de los elemento
del universo.
Cuando lo que se observa es un solo dato de cada elemento del universo, se dice la población
está asociada a una variable univariada. En el ejemplo anterior, el conjunto de todas las estaturas
es una población formada por una variable univariada. Igual sucede si se tomen el conjunto de
datos que conforman los pesos.
Ahora supóngase que es de interés recoger ambas caracterı́sticas de cada una de las personas
que conforman la población, estatura y peso, entonces se tendrı́a que cada dato es un dato “doble”,
donde la población está asociada a una variable bivariada. Ası́, cada dato está formado por un
par de datos que son estatura y peso. Este par de datos forman un vector de dos dimensiones y
se llama dato bivariado.
Es posible que sea de interés cada población por separado donde cada una sirva para un
estudio diferente, como también podrı́a ser con la medición de un componente en la sangre
(hierro o colesterol), del ı́ndice de masa corporal o la tensión arterial. Pero también puede ser
de interés medir todas estas variables en cada persona simultáneamente con el fin de estudiar
la relación que éstas tienen entre sı́. Este serı́a el caso de una población asociada a una variable
multivariada. Cada dato es un vector aleatorio de tantas dimensiones como datos se recojan de
cada elemento del universo. Fı́jese que un vector aleatorio puede descomponerse en varios datos
únicos e indivisibles donde cada uno es una observación de una cualidad o valor de un elemento
del universo.

2
Fundamentos de estadı́stica descriptiva e inferencial - Ronald Pietri

1.3. Experimento aleatorio


Se define como experimento aleatorio aquel que puede tener más de un resultado posible en
relación al “fenómeno de interés a observar”.
La definición anterior aclara que el experimento no es aleatorio en sı́ mismo, sino de acuerdo
a lo que se observe de él. Por ejemplo, si se lanza una moneda al aire, el hecho de que caiga al
piso no tiene más de un resultado posible y por lo tanto no es un experimento aleatorio. Observar
su caı́da es un experimento de fı́sica simple. Pero si lo que se desea es observar si cae cara o
sello, entonces si es un experimento aleatorio porque puede tener más de un resultado posible
y ninguno es predecible con exactitud. La no precisión de este resultado lo hace aleatorio. Si
existiera una forma de que siempre caiga cara o siempre sello con exactitud, entonces ya no serı́a
experimento aleatorio. La incertidumbre sobre el resultado lo hace aleatorio. Es de notar que no
es el lanzamiento de la moneda lo que lo califica como experimento aleatorio, sino cuando lo que
se observa tenga más de un resultado que no pueda predecirse.

1.4. Muestra
Es cualquier subconjunto de la población. La utilidad de la muestra depende de que tanto
represente a la población en términos estadı́sticos. Esto será explicado más adelante. Una muestra
está conformada por uno o más datos de la población pero sin tomar toda ésta, es decir; si la
población tiene 10000 resultados, entonces una muestra debe ser un conjunto de valores que debe
estar entre 1 solo y 9999 datos. Tomar toda la población es idóneo porque es más preciso para
el estudio, pero hay muchos casos en que esto no es posible. Si se desea saber el número de
animales de una especie determinada, no es posible contarlos a todos. Solo puede estimarse su
población en base a su distribución en una muestra. También es el caso de unas elecciones donde
se puede estimar el candidato ganador en base a un sondeo de opinión y donde es imposible hacer
unas elecciones paralelas con todos los ciudadanos participantes. Existe un concepto asociado al
muestreo llamado “Espacio muestral”.

1.5. Espacio muestral


El espacio muestral se define como el conjunto de todos los resultados posibles de un experi-
mento aleatorio. Es de notar que el espacio muestral no coincide con el número de elementos de
la población, a menos que la muestra sea de tamaño 1. Véase un ejemplo: Supóngase que se desea
una muestra de tamaño 1 en la población hipotética del ejemplo con las estaturas. El espacio
muestral tiene 5 resultados posibles que son 1.82Mts, 1.76Mts, 1.80Mts, 1.72Mts y 1.78Mts. Pero
si se desea tomar una muestra de tamaño 2, entonces el espacio muestral tendrı́a 20 resultados
posibles que serı́an:

{Juan, Anita} {Anita, Marı́a} {Anita, Juan} {Marı́a, Anita}


{Juan, Luis} {Anita, Antonio} {Luis, Juan} {Antonio, Anita}
{Juan, Marı́a} {Luis, Marı́a} D D

qué en términos de los datos de la población observador en el mismo orden serı́an:

{1.82Mts, 1.76Mts} {1.76Mts, 1.72Mts} {1.76Mts, 1.82Mts} {1.72Mts, 1.76Mts}


{1.82Mts, 1.80Mts} {1.76Mts, 1.78Mts} {1.80Mts, 1.82Mts} {1.78Mts, 1.76Mts}
{1.82Mts, 1.72Mts} {1.80Mts, 1.72Mts} {1.72Mts, 1.82Mts} {1.72Mts, 1.80Mts}
{1.82Mts, 1.78Mts} {1.80Mts, 1.78Mts} {1.78Mts, 1.82Mts} {1.78Mts, 1.80Mts}
{1.76Mts, 1.80Mts} {1.72Mts, 1.78Mts} {1.80Mts, 1.76Mts} {1.78Mts, 1.72Mts}

3
Fundamentos de estadı́stica descriptiva e inferencial - Ronald Pietri

La población tiene 5 datos o, lo que es lo mismo, tiene tamaño 5, pero el espacio muestral
tiene tamaño 20. Si la muestra se hubiera tomado de tamaño 3, el espacio muestral hubiese tenido
tamaño 60 porque es la cantidad de tomas que se pueden hacer de tres en tres.
Fı́jese que cada par de datos es contado como uno diferente cuando se invierte el orden, esto es,
la muestra 1.82Mts, 1.76Mts se cuenta como un resultado distinto a 1.76Mts, 1.82Mts. En el caso
de que no sea de interés el orden de los elementos, se cuentan como una sola observación. Aquı́ se
está presentando en la forma más básica y desglosada posible. También se puede observar que en
este ejemplo no se repiten los datos como en el caso de que una persona pueda ser seleccionada
dos veces para tomar su estatura. Puede haber casos donde se repitan o donde no. Esto depende
del estudio y se aclarará más adelante.
En el caso de que se tenga que hacer el muestreo con la variable bivariada que comprende un
vector de dos variables que son estatura y peso, La población sigue teniendo 5 datos (tamaño 5)
y si se desea tomar una muestra de tamaño 2, también el espacio muestral tendrá 20 resultados
posibles (espacio muestral de tamaño 20). No debe confundirse el orden del vector de muestra,
que puede comprender estatura en la primera componente y peso en la segunda, o al revés, con
el orden en el cual se toman los vectores de muestra. El orden de los componentes del vector se
define previamente y no influye en el estudio. Puede ser (Mts , Kg) o (Kg , Mts). Pero no es lo
mismo el resultado Juan , Anita que Anita , Juan que a efectos de los datos que interesa recolectar
se escriben (1.82Mts , 78.5Kg) , (1.76Mts , 67.2Kg) y (1.76Mts , 67.2Kg) , (1.82Mts , 78.5Kg)
respectivamente. Aquı́ se asume que el primer componente del vector es la estatura y el segundo el
peso que, como se dijo antes, este orden no influye en el estudio y se define arbitrariamente. Una
vez definido, ese orden no debe cambiarse. Los vectores son indivisibles porque es claro que no
puede asociarse el peso de una persona con la estatura de otra por ejemplo. Si en la recolección
de los datos, se hubiera deseado que sea bivariado, entonces los posibles resultados en el caso
anterior se pueden escribir o representar igual para los elementos del universo seleccionados a
observar:
{Juan, Anita} {Anita, Juan}
{Juan, Luis} {Luis, Juan}
{Juan, Marı́a} {Marı́a, Juan}
{Juan, Antonio} {Antonio, Juan}
{Anita, Luis} {Luis, Anita}
{Anita, Marı́a} {Marı́a, Anita}
{Anita, Antonio} {Antonio, Anita}
{Luis, Marı́a} {Marı́a, Luis}
{Luis, Antonio} {Antonio, Luis}
{Marı́a, Antonio} {Antonio, Marı́a}
Fı́jese que son los mismos elementos del universo seleccionados que en el caso anterior que
es univariado. Pero los elementos a recolectar de la población se escriben como vectores que se
corresponden a cada uno de los 20 datos anteriores en el mismo orden escritos:
{(1.82Mts, 78.5Kg), (1.76Mts, 67.2Kg)} {(1.76Mts, 67.2Kg) , (1.82Mts, 78.5Kg)}
{(1.82Mts, 78.5Kg), (1.80Mts, 76.8Kg)} {(1.80Mts, 76.8Kg) , (1.82Mts, 78.5Kg)}
{(1.82Mts, 78.5Kg), (1.72Mts, 64.5Kg)} {(1.72Mts, 64.5Kg) , (1.82Mts, 78.5Kg)}
{(1.82Mts, 78.5Kg), (1.78Mts, 72.1Kg)} {(1.78Mts, 72.1Kg) , (1.82Mts, 78.5Kg)}
{(1.76Mts, 67.2Kg), (1.80Mts, 76.8Kg)} {(1.80Mts, 76.8Kg) , (1.76Mts, 67.2Kg)}
{(1.76Mts, 67.2Kg), (1.72Mts, 64.5Kg)} {(1.72Mts, 64.5Kg) , (1.76Mts, 67.2Kg)}
{(1.76Mts, 67.2Kg), (1.78Mts, 72.1Kg)} {(1.78Mts, 72.1Kg) , (1.76Mts, 67.2Kg)}
{(1.80Mts, 76.8Kg), (1.72Mts, 64.5Kg)} {(1.72Mts, 64.5Kg) , (1.80Mts, 76.8Kg)}
{(1.80Mts, 76.8Kg), (1.78Mts, 72.1Kg)} {(1.78Mts, 72.1Kg) , (1.80Mts, 76.8Kg)}
{(1.72Mts, 64.5Kg), (1.78Mts, 72.1Kg)} {(1.78Mts, 70.2Kg) , (1.72Mts, 64.5Kg)}

4
Fundamentos de estadı́stica descriptiva e inferencial - Ronald Pietri

Cada resultado de una población se llama punto muestral, sea univariada, bivariada o mul-
tivariada, es decir, sea dato univariado (valor), bivariado (vector de 2 valores) o multivariado
(vector de varios valores). Cada punto muestral en el ejemplo anterior es cada resultado de del
dato o conjunto de datos observados de cada elemento del universo seleccionado. En los casos
anteriores son 20 puntos muestrales, tanto en el univariado como en el bivariado como se dijo
antes.
El número de elementos a seleccionar en una muestra se define antes del estudio. Pero lo
primero es definir la población, seguido luego de lo que debe responder el estudio. Para entender
esto veremos la definición de parámetro posteriormente.
Cuando se hace un estudio en estadı́stica, no importan tanto los datos individuales sino el
conjunto de ellos vistos como un todo. Esto hace que las descripciones exhaustivas de detalles, no
sean relevantes y no aporten a una información resumida que pueda dar una idea de la tendencia
del fenómeno. Puede que algunos datos sean interesantes a efectos de entender las razones de su
aparición, pero son excepciones. El objetivo de la estadı́stica es sintetizar algo que saque a la luz
algún denominador común en la masa de datos desordenados y confusa, puesto que el volumen
de datos hace imposible que con una mirada de inspección sencilla se pueda ver alguna relación
entre variables o coincidencias entre comportamientos.
La manera de obtener un resumen que describa un comportamiento de los datos o que haga
explı́cita, y de manera ordenada, alguna información oculta e implı́cita en los datos desordenados,
es con algo simple de interpretar que describa una o varias caracterı́sticas de la población. La
forma de sacar información es hacer cálculos con los datos para obtener valores útiles para tal
fin. Para poner el tema en contexto, se da la siguiente definición.

1.6. Parámetros
Un parámetro es un valor numérico que describe una caracterı́stica de una población. Puede
haber varios parámetros de una población que sirvan para describir varias caracterı́sticas de ella.
Véase que en la definición se aclara que su valor es numérico. No puede ser una frase o un
párrafo sino un número. Por ejemplo: El 30 % de las mujeres de esta población tiene menos de
25 años o el 20 % de los mayores de 65 años de la población X tiene hipertensión.
A pesar de que en las dos frases anteriores hay una explicación, se puede ver que hay un
parámetro en la primera que es 30 % de mujeres con una caracterı́stica que es ser menor de
25 años en una población especı́fica. En la segunda se ve que hay otra caracterı́stica que es la
hipertensión y que la sufren solo el 20 % de la población de hombres mayores de 65 años de un
determinado lugar, que puede ser de un pueblo, ciudad o paı́s tomado como población de estudio.
Hay muchos valores producto de cálculos con los datos que se han vuelto parámetros clásicos
por su utilidad. La media (o promedio) de los valores es un caso de ejemplo. El parámetro a elegir
para describir a la población, depende de lo que se desea saber de la población.
Cada parámetro tiene su forma de cálculo y es posible que un estudio contenga la definición
de un nuevo parámetro a medir. Este serı́a el caso de la creación de un instrumento de medición
en psicologı́a de alguna caracterı́stica de la personalidad.
En todo estudio de estadı́stica, lo que interesa casi siempre es el valor de uno o más parámetros
para describir una o más caracterı́sticas de la población. Otro tipo de estudio menos común es
cuando requerimos crear un nuevo parámetro como en el ejemplo de psicologı́a del párrafo anterior.
La pregunta aquı́ es ¿cómo saber el valor de un parámetro de interés para un estudio? Si
siempre se desea saber el valor de un parámetro y ya se tiene su valor, entonces el estudio ya está
hecho y se puede usar su valor para dar una idea o concluir algo. Pero como ya se dijo, un estudio
consiste en definir el parámetro que se necesita y luego buscar la manera de hallar su valor. Hay
muchos casos en que no se puede hallar el valor de un parámetro, sencillamente porque no pueden

5
Fundamentos de estadı́stica descriptiva e inferencial - Ronald Pietri

medirse todos los elementos de la población y debe optarse por estimar su valor. Esta estimación,
como cualquier otra, tiene un margen de error. Estos casos se aclaran en la siguiente definición:

1.7. Estadı́stica Descriptiva e Inferencial:


Una estadı́stica es descriptiva cuando se usa para describir un conjunto de datos sea de una
muestra o de una población usando los valores de todos ellos sin omitir ninguno. Una estadı́stica
es inferencial cuando se usa para describir un conjunto de datos usando solo una parte de los
valores del conjunto. En pocas palabras, en la estadı́stica descriptiva se usan todos los datos que
se desean describir y en la inferencial solo una parte.
Por lo dicho anteriormente, se puede ver que en la estadı́stica inferencial se estima el valor del
parámetro mientras que en la descriptiva se usa su valor con mayor precisión porque o se tienen
los valores de toda la población, o solo interesa describir una muestra sin importar los valores
fuera de ella. En la estadı́stica inferencial el interés es extrapolar los resultados de una muestra a
toda una población usando técnicas que van desde el diseño del experimento y el muestreo hasta
la estimación del parámetro con el cálculo del error e imprecisiones.
Las conclusiones, sobre una población de estudio, en ambas estadı́sticas son similares y bási-
camente lo que ocurre en el caso inferencial es que es menos preciso.
Hay que aclarar una regla que se aplica como máxima en toda la estadı́stica: “Lo que se
pierde en precisión en la estadı́stica inferencial es muchı́simo menos que lo que se
ahorra en tiempo y dinero al sustituirla por un muestreo en grandes poblaciones”.
Como un ejemplo de lo dicho anteriormente, para una población de 10 millones podrı́a tenerse
una precisión aceptable del 95 %, lo que significa una posibilidad de error del 5 %, esto es una
posibilidad de fallo de 1 en 20, solo con una muestra de 400 datos. Si usted observa los números,
puede ver que la posibilidad de fallar es de 1 fallo contra 19 éxitos solo con 400 datos. Para que
la posibilidad de fallar sea de 0, se tendrı́an que tomar los 10 millones de datos de la población
(los valores aquı́ pueden tener ligeros cambios dependiendo del estudio pero son pocos). Se puede
juzgar que hacer una muestra de 10 millones de datos podrı́a ser virtualmente imposible y que
la ganancia del 100 % de precisión no justifica semejante trabajo. De hecho, si la muestra fuera
de 1500 podrı́a llegarse a precisiones del 99 %, lo que significa un margen de error de 1 fracaso
contra 99 éxitos. En esta relación está basada toda la teorı́a de estadı́stica inferencial y del
muestreo puesto que entre las variables de precisión, población y tamaño de muestra no hay
una relación de linealidad. Esta relación es logarı́tmica donde en el eje X está el tamaño de la
población y en el eje Y está el tamaño de muestra a elegir para una precisión especı́fica. Aún
más, se puede demostrar matemáticamente que para una población grande a partir de 20000
ya no importa si es mayor porque la precisión no cambia con la muestra de un mismo tamaño.
Esto significa que si una población es mayor de 20000, el tamaño de muestra usado para obtener
una precisión determinada es el mismo que para un población de 100 mil millones o más. Esto
se trata matemáticamente como población infinita y el tamaño de muestra está acotado por un
valor constante para cualquier población con una precisión o margen de error determinado.
Es bueno aclarar aquı́ que, habiendo fijado niveles de error especı́ficos tolerables, la relación
entre el tamaño de la muestra y la población tiene un punto de inflexión, esto es, “mientras la
muestra esté entre 1 y un valor constante N, el aumento del tamaño de la muestra da mucha más
precisión que lo que se sacrifica en costo, pero a partir de un valor M¿N, el aumento adicional
de la muestra no agrega precisión que justifique el costo, es decir, se comporta al revés, más
aumenta el costo que la precisión”. Por lo dicho anteriormente, es decisión del investigador tomar
una muestra razonable entre el costo, tiempo disponible y nivel de precisión o error tolerable.
Hay casos en que un parámetro puede saberse sin que se tenga hasta el último dato de toda la
población. En este caso el parámetro se toma como un valor ya conocido para cualquier estudio.
Como un ejemplo de ello, se tienen los valores sanguı́neos. Se sabe que mayor de un valor, el

6
Fundamentos de estadı́stica descriptiva e inferencial - Ronald Pietri

hierro está alto y menor de otro, está muy bajo. Aunque a esta persona nunca se la haya medido
la sangre antes, su añadidura no altera los valores de los parámetros para saber si su hierro está
bajo o alto. Ya este estudio se ha realizado tantas veces como para asegurar que esos valores
son la referencia. Es como que en una elección nacional no asista un votante; esto no altera el
resultado con una precisión que sea significativa.
En los estudios realizados en muchas ocasiones y de manera probada y recurrente, se considera
que los parámetros son conocidos ası́ falten algunos datos de la población.

2. SEMANA 2
2.1. Evento
Es cualquier resultado del espacio muestral. En términos de la teorı́a de conjuntos se define
como cualquier subconjunto del espacio muestral.
Los eventos pueden clasificarse en simples o compuestos.

2.2. Evento Compuesto o simple


El evento compuesto es aquel que se compone de otros eventos, es decir, que agrupa varios,
sean dos o más de ellos y puede dividirse en otros eventos. Mientras que el simple se compone de
un solo resultado y no puede desglosarse.
Para entender la definición anterior se da el siguiente ejemplo:
Supóngase que se lanza un dado y se define el evento como el resultado del número obtenido,
que puede ser del 1 al 6. Es claro que cada resultado es un evento simple puesto que ningún
valor obtenido puede descomponerse en otros. Pero si se definen dos eventos como “un número
menor que cuatro” y “un número mayor a tres”, entonces en el primer caso se tienen tres eventos
simples que son los resultados 1, 2 y 3; y en el segundo se tienen tres eventos simples que son
4, 5 y 6. Esto mismo puede aplicarse en nuestro caso de estaturas y kilos en el caso de que se
defina un evento con las personas cuya estatura sea mayor a determinado valor. Podrı́an caer
varios dentro de un evento compuesto. Si se define una muestra de tres personas y el evento es:
“solo dos tengan una estatura superior a 1.79mts”, se ve que el evento es compuesto y tendrı́a
los siguientes 18 eventos simples:

{Juan, Luis, Anita} {Juan, Luis, Marı́a} {Juan, Luis, Marı́a}


{Juan, Anita, Luis} {Juan, Marı́a, Luis} {Juan, Antonio, Luis}
{Luis, Juan, Anita} {Luis, Juan, Marı́a} {Luis, Juan, Antonio}
{Luis, Anita, Juan} {Luis, Marı́a, Juan} {Luis, Antonio, Juan}
{Anita, Juan, Luis} {Marı́a, Juan, Luis} {Antonio, Juan, Luis}
{Anita, Luis, Juan} {Marı́a, Juan, Luis} {Antonio, Luis, Juan}

Véase que cada resultado se ve como un todo y que el orden de cada resultado se toma como
un resultado distinto. La muestra fue definida previamente, como debe ser, y se decidió que serı́a
de tamaño 3. Para otra muestra de tamaño distinto serı́an otros resultados ası́ como también si
el evento definido fuese otro. Aquı́ se presentó con los nombres de las personas pero realmente
cada toma es de tres estaturas asociadas a las personas.

2.3. Eventos excluyentes


Son los eventos que no pueden ocurrir simultáneamente.

7
Fundamentos de estadı́stica descriptiva e inferencial - Ronald Pietri

Como ejemplo de evento excluyente se puede definir la cara que sale en el lanzamiento de un
dado porque es imposible que salgan dos valores al mismo tiempo en un lanzamiento. También
es el caso del lanzamiento de una moneda ya que no puede salir cara y sello al mismo tiempo.

2.4. Eventos Independientes


Dos eventos son independientes cuando la ocurrencia o no ocurrencia de uno, no altera la
probabilidad de ocurrencia del otro.
En el caso de eventos independientes, el ejemplo serı́a el lanzamiento de una moneda dos veces
puesto que lo que salga en el primer lanzamiento no influye en lo que resulte en el segundo. Al
igual sucede con el lanzamiento de un dado dos veces o de dos dados.
Hay otra definición importante a efectos de la teorı́a de la probabilidad que es útil en el estudio
de los experimentos aleatorios como lo es los eventos colectivamente exhaustivos.

2.5. Eventos colectivamente exhaustivos


Un conjunto de eventos son colectivamente exhaustivos si son excluyentes entre si tomados
de dos en dos, y la unión de todos es igual al espacio muestral.
En la definición anterior se cubren todos los resultados del espacio muestral de forma separada
en el caso de eventos colectivamente exhaustivos.
En el caso de que dos eventos no sean independientes y deban tratarse como probabilidades
que cambian en uno de ellos cuando ocurre el otro, entonces se usa el concepto de probabilidad
condicional.

2.6. Probabilidad Condicional


Es la probabilidad de que ocurra un evento cuando ya ha ocurrido otro.
En el caso de dos eventos independientes, es claro que la probabilidad condicional de uno es
la misma que la probabilidad condicional de ese evento dada la ocurrencia del otro evento, y esta
probabilidad cambia solo si hay dependencia.

2.7. Muestreo Probabilı́stico


Es aquel en el que se asocia una probabilidad a cada punto muestral. En particular el más
utilizado es donde cada punto muestral tiene la misma probabilidad y casi todos los muestreos
se basan en este principio llamado muestreo aleatorio.
Al momento de hacer un muestreo se debe usar un método que garantice o se acerque lo más
posible a que todos los elementos de la muestra tengan la misma probabilidad de ocurrir.

2.8. Probabilidad de un evento


La probabilidad de un evento se define como el cociente del número de eventos simples que
contiene, entre el número de eventos simples del espacio muestral.
La definición de probabilidad anterior es cuando cada punto muestral tiene la misma probabi-
lidad de ocurrir. Esta es la definición más usada y se adapta a prácticamente todos los estudios.
“Todo lo dicho hasta ahora es válido solamente si el muestreo es aleatorio, es
decir, cuando cada punto muestral tiene la misma probabilidad de ocurrir. De lo
contrario, no se cumplen las caracterı́sticas de la precisión con respecto al tamaño
de la muestra explicadas anteriormente.”

8
Fundamentos de estadı́stica descriptiva e inferencial - Ronald Pietri

2.9. Algebra de Eventos


El álgebra de eventos es la misma que el álgebra de conjuntos. Los eventos se representan
con sı́mbolos o letras y las operaciones de eventos son análogas a las de conjuntos. A los eventos
pueden aplicárseles las operaciones matemáticas de unión, intersección y complemento. También
pueden tener relaciones de subconjunto.
Para representar la probabilidad de un evento A, se coloca la notación P (A) y se lee “Pro-
babilidad de ocurrencia del evento A”. Esto según la definición anterior de probabilidad de un
evento se escribe como el cociente de la cardinalidad del conjunto A dividido entre la cardinalidad
del espacio muestral. Si se denota al espacio muestral con la letra S, entonces la probabilidad del
evento A es la cardinalidad de A entre la cardinalidad de S, es decir P (A) = |A| |S|
Las siguientes
reglas, se cumplen:

1. Si A es un evento, entonces P (A) ≥ 0

2. Si S es el espacio muestral, entonces P (S) = 1

3. Si Ac es el complemento del evento A, entonces P = (Ac ) = 1 − P (A)

4. Si A1 , A2 , A3 , A4 ... es una secuencia finita o infinita de eventos mutuamente excluyentes,


entonces P (A1 ∪ A2 ∪ A3 ∪ A4 ...) = P (A1 ) + P (A2 ) + P (A3 ) + P (A4 ) + ...

5. La probabilidad de que no ocurra ningún evento es cero. La no ocurrencia de ningún evento


se representa como el conjunto vacı́o.

6. Si A ⊆ C, entonces P (A) ≤ P (B)

7. Para cualquier evento, A, se cumple 0 ≤ P (A) ≤ 1

8. Si A y B son dos eventos cualquiera, entonces P (A ∪ B) = P (A) + P (B) − P (A ∩ B)

Los eventos se pueden operar tal cual como conjuntos porque son tratados como parte de
esta teorı́a. El espacio muestral es análogo al conjunto universal y cualquier ocurrencia fuera del
espacio muestral es tratado como el conjunto vacı́o.
En términos del álgebra de eventos la independencia se cumple cuando P (A∩B) = P (A)∗P (B)
y la probabilidad condicional se representa como P (A/B) y se lee “Probabilidad del evento A
dado que ya ocurrió el evento B”. También se cumple que P (A/B) = P P(A∩B) (B)
.
Es fácil ver que si dos eventos son independientes, también la probabilidad de un evento es
igual a la probabilidad condicional de ese mismo evento dado el otro. Esto es coherente con la
definición de eventos independientes. Se observa fácil aquı́ su prueba con las definiciones anteriores
escritas en términos matemáticos:
Supóngase A y B independientes, entonces P (A/B) = P P(A∩B) (B)
= P (A)∗P
P (B)
(B)
= P (A) Como se
puede ver aquı́, la probabilidad de A es la misma que la de A dado B puesto que las probabili-
dades de B se cancelan en el numerador y denominador. Esto es coherente con la definición de
independencia, la cual significa que la ocurrencia de uno no tiene nada que ver con la del otro.
=
Por las propiedades de conjuntos, también se puede escribir P (A/B ∩C) = P (A∩B∩C) P (B ∩ C)
asi como P (A/B ∪ C) = P (A ∩ (B ∪ C))P (B ∪ C) y como cualquier otra combinación con las
operaciones de conjuntos. Otros ejempĺos válidos que se cumplen son P (A ∩ B/C) = P (A∩B∩C) P (C)
y
P (A ∪ B/C) = P ((A∪B)∩C)
P (C)
Con la notación anterior se pueden escribir las definiciones de forma
más precisa y sencilla. Aquı́ va las definición de independencia:
Dos eventos son independientes si y solo si P (A ∩ B) = P (A) ∗ P (B) Y la definición puede
generalizarse a muchos eventos como sigue: Los eventos A1 , A2 , A3 , ...Ak son independientes si y

9
Fundamentos de estadı́stica descriptiva e inferencial - Ronald Pietri

solo si la probabilidad de la intersección de 2, 3, ..., ok de estos eventos es igual al producto de sus


respectivas probabilidades.
Nótese que la independencia de eventos tomados de dos en dos no implica la independencia
de todos conjuntamente. Cuando en estadı́stica se habla de eventos independientes, es con ellos
tomados de dos en dos o tres en tres. . . o de cualquier cantidad de ellos o tomados todos a la vez.

10