.s,
!+. R OCE Y DE R OOF
+ara determinar cualquier punto percentil, siga estos pasos-
%. #etermine la frecuencia de los datos que estn debajo del punto percentil.
Simbolizaremos esta frecuencia como ; f
p
acumulada;
f
p
acumulada R 2c de los datos que estn aba)o del punto percentil3 1 8
f
p
acumulada para + R EFc 1 2 5 2FEF3 x OF R AE
(. #etermine el lmite real inferior del intervalo que contiene al punto percentil.
Llamaremos a este lmite real inferior 4
L
.
.l conocer el n*mero de datos que estn
aba)o del punto percentil podemos localizar el intervalo que contiene al punto
percentil, comparando la fp acumulada con la frecuencia acumulada de cada
intervalo !na vez localizado el intervalo que contiene al punto percentil, podemos
encontrar de inmediato su lmite real inferior, 4
L
. %n este e)emplo, el intervalo que
contiene a +
+.
es OEIOP y su lmite real inferior, 4
L
es OCE
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '9 -
?. #etermine el nmero de datos adicionales que deben considerarse en el intervalo
para alcan)ar el punto percentil.
+ara el e)emplo anterior,
C #etermine el nmero de unidades adicionales que debemos despla)ar en el intervalo
para obtener el nmero de datos adicionales.
7bserve que-
f
i
es el nmero de datos en el intervalo e
iDf nos proporciona el nmero de unidades por dato para dic0o intervalo
E #etermine el punto percentil. Logramos esto sumando las unidades adicionales al lmite
real inferior del intervalo que contiene al punto percentil
+unto percentil 5 4
L
Y !nidades adicionales
!+. 5 E@.+ F (.+ 5 EE...
+odemos escribir estos pasos en forma de ecuaci#n +or lo tanto,
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '; -
Si utilizamos esta ecuaci#n para calcular +
+.
obtenemos-
Hntentemos resolver otro problema %sta vez calcularemos !
(.
, es decir, el valor por deba)o
del cual se encuentra (., de las calificaciones
%n trminos de frecuencia acumulada, +
(.
es el valor por deba)o del cual se encuentran %@
calificaciones >(., de E. es BC3 +odemos ver en la tabla AG que +
(.
est en el intervalo 6+-6*. %n
vista de que BB calificaciones se encuentran aba)o del valor 6@.+, necesitamos A calificaciones
adicionales (onsiderando que hay E calificaciones en el intervalo y que ste tiene + unidades de
amplitud, debemos movernos
E
" A R (.%@ unidades en el intervalo .s,
+
(.
56@. +F(. %@566. 6@
0ambin podramos haber hallado +
(.
en forma directa, utilizando la ecuaci#n para el
punto percentil ,e esta manera,
Hntentemos resolver un problema ms %sta vez calcularemos +
OE
que es el valor de
la escala aba)o del cual se encuentra OEc de las calificaciones4
%n trminos de frecuencia acumulada, +O
+
es el valor de la escala por deba)o del
cual se localizan EDE calificaciones >f
p
5 E+, acumulado es igual a OEc de OF 2que es EDE
3 . partir de la tabla AG vemos que +
OE
est en el intervalo GFIGC (omo C calificaciones
se encuentran aba)o del lmite inferior de este intervalo
necesitamos agregar a OPE el n*mero adecuado de unidades de la escala para
tener EDE I CA R PE calificaciones adicionales (omo e"isten BF calificaciones en el intervalo y
ste tiene E unidades de amplitud, tendremos que desplazarnos
lo
1 PE R COE unidades
en el intervalo .s pues,
+
O
R OPE Y COE R GCDE
+
OE
tambin se puede determinar en forma directa, mediante la ecuaci#n para el
punto percentil .s,
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '= -
R!N>OS *RCNTILS
. veces queremos conocer el rango percentil de un dato en bruto +or e)emplo, como la
calificaci#n que usted obtuvo en el e"amen de estadstica fue de GM, le podra ser *til conocer
el rango percentil de este valor
l $anFo percentil de un dato es el porcentae de datos que tienen
valores ms baos que el dato en cuestin
C.lc#lo de $anFos -e$centiles
%sta situaci#n es e"actamente la opuesta a la anterior, en la que calculbamos un punto
percentil .hora conocemos el dato y necesitamos calcular el porcenta)e de datos que estn por
deba)o de l !na vez ms, debemos suponer que los datos dentro de la totalidad de cualquier
intervalo estn distribuidos de manera uniforme %n la columna de intervalos de clase de la
tabla AP podemos ver que la calificaci#n de GM se encuentra en el intervalo GEIGP %"isten EA
calificaciones que estn aba)o de GCE, el lmite inferior de este intervalo %n virtud de que
e"isten O calificaciones en el intervalo y ste tiene E unidades de amplitud, hay ONE
calificaciones por cada unidad de la escala %ntre una calificaci#n de GM y GCE, e"isten 2ONE3
2GM I GCE3 R DB calificaciones adicionales +or lo tanto, hay en total EA Y DB R EEB
calificaciones que estn por deba)o de GM (omo quiera que la distribuci#n tiene OF
calificaciones, el rango percentil de GM R 2EEBNOF3
1 BFF R OGOB
'esumiremos estas operaciones en la siguiente ecuaci#n-
.l utilizar esta ecuaci#n para determinar el rango percentil de GM, obtenemos
'esolvamos otro problema para practicar ,etermine el rango percentil de EP La
calificaci#n de EP se encuentra en el intervalo EEIEP %"isten A calificaciones que estn por
deba)o de ECE %n virtud de que e"isten C calificaciones dentro del intervalo, hay 2CNE3 2EP I
ECE3 R AM calificaciones dentro del intervalo que se encuentran aba)o de EP %n total, hay A Y
AM R MM calificaciones por deba)o de EP .s pues, el rango percentil de EP R 2MF3 1 %.. R PCA
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (@ -
Jamos a resolver otro problema de prctica (on la distribuci#n de frecuencias de las
calificaciones agrupadas de la tabla AE, determine el rango percentil de una calificaci#n
de BBO
La calificaci#n de BBO se encuentra en el intervalo BBFIBBP %l lmite inferior de este
intervalo es BFPE %"isten M Y O Y BB Y BA Y BE Y BD Y G Y O Y C R GA calificaciones por
deba)o de BFPE +uesto que hay A calificaciones dentro del intervalo y ste tiene BF unidades
de amplitud, e"isten 2ANBF3 2BBO I BFPE3 R DDE calificaciones dentro del intervalo que se
localizan aba)o de la calificaci#n de BBO %n total, e"isten GA Y DDE R GEDE calificaciones que
se encuentran por deba)o de la calificaci#n de BBO .s pues, el rango percentil de BBO R
2GEDENPF3
1 BFF R PCOD
0ambin podramos haber resuelto este problema mediante la ecuaci#n del rango
percentil .s,
>R!)IC!CIN D L!S DISTRI?UCIONS D )RCUNCI!S
Las distribuciones de frecuencias se representan a menudo por medio de grficas y no
en forma de tablas %n virtud de que la grfica se basa por completo en los datos de una
tabla, no contiene informaci#n nueva Sin embargo, una grfica presenta los datos de una
manera visual, lo cual frecuentemente facilita la tarea de observar las caractersticas
importantes de los datos .l escribir esta secci#n, hemos supuesto que usted est
familiarizado con la elaboraci#n de grficas +ues bien, aun en este caso, valdr la pena
repasar unos cuantos puntos importantes-
B !na grfica tiene dos e)es- uno vertical y el otro horizontal %l e)e vertical es el e)e de
las ordenadas o e)e G, ' el horizontal es el e)e de las abscisas o e)e 4.
D La variable independiente se coloca muy a menudo en el e)e 1 y la variable deI
pendiente en el e)e > .l trazar la grfica de una distribuci#n de frecuencias, los valores de los
datos se colocan de ordinario en el e)e 1 y la frecuencia de los valores de los datos se registran
en el e)e >
A %s necesario elegir las unidades apropiadas para registrar los datos en los e)es
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (1 -
C +ara evitar la distorsi#n de los datos, se acostumbra colocar la intersecci#n de los dos
e)es en el punto cero y despus se eligen sus escalas, de manera que la altura de los datos
graficados sea ms o menos de las tres cuartas partes de la anchura La figura AD muestra la
forma en que la infracci#n de esta regla puede deformar la impresi#n que la grfica produce
La figura muestra dos grficas basadas en los mismos datos, a saber, el n*mero de
estudiantes inscritos en una universidad grande durante los a&os BPPFIDFFD %n la parte 2a3
se ha respetado la regla mencionada con anterioridad %n la parte 2b3, la escala
correspondiente al e)e de las ordenadas no comienza en cero y se muestra
considerablemente e"pandida, en comparaci#n con la parte 2a3 Las impresiones que
producen una y otra grfica son muy diferentes La parte 2a3 produce la impresi#n correcta
de que la poblaci#n estudiantil fue muy estable, mientras que la parte 2b3 distorsiona en gran
medida los datos y produce la impresi#n de que hubo grandes fluctuaciones en la poblaci#n
universitaria
E +or lo general, la intersecci#n de los dos e)es se encuentra en cero, en ambas escalas
(uando no es as, esto se indica simbolizando una ruptura en el e)e correspondiente, cerca
de la intersecci#n +or e)emplo, en la figura AC aparece una ruptura en el e)e horizontal
para indicar que una parte de la escala ha sido suprimida
M (ada e)e debe tener un letrero y el ttulo de la grfica debe ser breve y e"plcito
.l graficar distribuciones de frecuencias, se utilizan principalmente cuatro tipos de
grficas- la grfica de barras, el 0istograma, el polgono de frecuencias ' la curva de porcentajes
acumulados.
La F$.fica de +a$$as
Se acostumbra graficar las distribuciones de frecuencias de los datos nominales u
ordinales por medio de una grfica de barras %ste tipo de grfica se ilustra en la figura AA
Se traza una barra para cada categora y la altura de la barra representa la frecuencia o
el n*mero de miembros de esa categora (omo no e"iste una relaci#n numrica entre las
categoras de los datos nominales, podemos organizar los diversos grupos en cualquier
orden a lo largo del e)e horizontal %n la figura AA estn ordenados de izquierda a derecha,
seg*n la magnitud de la frecuencia de cada categora 7bserve que, en este tipo de grfica, las
barras de cada categora no se tocan entre s %sto hace a*n ms patente la ausencia de una
relaci#n cuantitativa entre las distintas categoras
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (% -
l HistoF$ama
%l histograma se utiliza para representar distribuciones de frecuencias constituidas por
datos de intervalos o de razones 2proporciones3 Se aseme)a a la grfica de barras, salvo porque
en el histograma se traza una barra para cada intervalo de clase Los intervalos de clase se
localizan sobre el e)e horizontal, de modo que cada barra de clase comienza y termina en los
lmites reales del intervalo La altura de la barra corresponde a la frecuencia del intervalo de
clase representado (omo quiera que sea los intervalos son continuos, las barras verticales se
deben tocarse entre s, en lugar de estar espaciadas como en las grficas de barras La figura
AC muestra las calificaciones del e"amen de estadstica 2tabla AC3 representadas mediante
un histograma 7bserve que se acostumbra marcar el punto medio de cada intervalo de
clase sobre la abscisa Las calificaciones agrupadas aparecen de nuevo en la figura para
comodidad de usted
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (' -
l -olFono de f$ec#encias
%l polgono de frecuencias tambin se utiliza para representar datos de intervalo o de
raz#n %l e)e horizontal es idntico al del histograma Sin embargo, en este tipo de grfica, en
lugar de utilizar barras, se marca en la grfica un punto que corresponde al punto medio de
cada intervalo, a una altura correspondiente a la frecuencia del intervalo . continuaci#n se
unen los puntos marcados, mediante lneas rectas +or *ltimo, la lnea que une los puntos se
prolonga para que corte el e)e horizontal en el punto medio de los dos intervalos de clase
contiguos al primero y al *ltimo de los intervalos donde estn contenidos los datos (on esta
manera de cerrar la figura con el e)e horizontal, se forma un polgono del cual recibe su
nombre esta grfica La figura AE muestra las calificaciones de la tabla AC como un
polgono de frecuencias La principal diferencia entre un histograma y un polgono de
frecuencias es la siguiente- el histograma e"hibe las calificaciones como si estuvieran
distribuidas de manera uniforme en el intervalo, mientras que el polgono de frecuencias
muestra las calificaciones como si todas estuviesen concentradas en el punto medio del
intervalo .lgunos investigadores prefieren emplear el polgono de frecuencias para comparar
la forma de dos o ms distribuciones Los polgonos de frecuencias tambin tienen el efecto
de presentar los datos como si tuviesen una distribuci#n continua, lo cual ocurre en realidad
en muchos casos
La c#$3a de -o$centaGe ac#m#lado
0ambin las distribuciones de frecuencia acumulada y de porcenta)e acumulado pueden
presentarse en forma grfica S#lo ilustraremos la segunda de ellas, ya que las grficas son
esencialmente las mismas y las distribuciones de porcenta)es acumulados se emplean ms a
menudo !sted recordar que el porcenta)e acumulado para un intervalo de clase indica el
porcenta)e de datos que estn por deba)o del lmite real superior del intervalo .s, el e)e
vertical utilizado para la curva de porcenta)es acumulados se presenta en !nidades de
porcenta)es acumulados %n el e)e horizontal, en lugar de dibu)ar los puntos en el punto medio
de cada intervalo de clase, los marcamos en el lmite real superior del intervalo La figura AM
muestra las calificaciones de la tabla AO representadas como una curva de porcenta)es
acumulados ,ebe ser evidente que la curva de frecuencias acumuladas tendra la misma
forma, siendo la *nica diferencia que esta *ltima se grfica en unidades de frecuencias
acumuladas y no de porcenta)es acumulados Los percentiles y los rangos percentiles se
pueden leer directamente a partir de una curva de porcenta)es acumulados La curva de
porcenta)es acumulados recibe tambin el nombre de ojiva, con lo cual se indica que tiene la
forma de una A
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (( -
)o$ma de las c#$3as de f$ec#encia
Las distribuciones de frecuencias pueden tener formas muy diversas .lgunas de las
formas que se presentan con ms frecuencia estn en la figura AO Las curvas se clasi fican,
en general como sim/tricas o asim/tricas 2sesgadas3
Una curva es sim#trica si al doblarla a la mitad sus dos lados coinciden. $i
una curva no es sim#trica, entonces es asim#trica.
Las curvas que aparecen en la figura AO2a3, 2b3 y 2c3 son simtricas Las curvas 2d3, 2e3 y
2f3 son asimtricas Si una curva es asimtrica, puede tener sesgo -ositi3o o neFati3o4
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (/ -
(uando una curva est sesgada en fo$ma -ositi3a0 la mayor parte de los datos se
concentra en los valores ba)os del e)e horizontal y la curva disminuye hacia el e"tremo de los
valores altos (uando una curva est sesgada en fo$ma neFati3a0 la mayor parte de los datos
se concentra en los valores altos del e)e horizontal y la curva se reduce hacia el e"tremo de los
valores ba)os
La curva de la parte 2e3 est sesgada en forma positiva y la curva de la parte 2f3 est
sesgada en forma negativa
Las curvas de frecuencias son designadas a menudo seg*n su forma .s, a las curvas de
las partes 2a3, 2b3, 2c3 y 2d3 se las denomina, respectivamente, curvas en forma de campana,
rectangulares o uniformes, en forma de ! y en forma de 5
*R>UNT!S 7 *RO?LM!S
B ,efina cada uno de los conceptos de la secci#n ;0rminos importantes;
D %n qu difiere la elaboraci#n de las grficas de barras, los histogramas y los polgonos
de frecuencias? $u tipo de escala es adecuada para cada una?
La tabla siguiente muestra los salarios promedio anuales de varias categoras de
cientficos que ostentan doctorados, en %stados !nidos, en DFFD 4aga una grfica de barras
para representar estos datos, colocando ;Salario anual; sobre el e)e >, y ;(ategora de
cientfico; sobre el e)e 1 7rdene las categoras de manera que los salarios decrezcan de
izquierda a derecha
A !n estudiante de posgrado ha reunido datos acerca de MM calificaciones . partir de
estos datos, ha hecho dos distribuciones de frecuencias de datos agrupados, las cuales
presentamos a continuaci#n
%ncuentra usted alg*n error en esas distribuciones? %"plique
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (5 -
M Las siguientes calificaciones fueron obtenidas en un e"amen de letras inglesas por
los miembros de un grupo de segundo grado de una universidad-
a 4aga una distribuci#n de frecuencias para los datos no agrupados 2i R B3
b 4aga una distribuci#n de frecuencias de datos agrupados que tenga BE intervalos
apro"imadamente Liste los lmites aparentes y tambin los reales de cada intervalo
c %labore un histograma para la distribuci#n de frecuencias construida en la parte b
d %s asimtrica o simtrica la distribuci#n? Si est sesgada, lo est en forma
positiva o negativa?
e 4aga un diagrama de tallo y ho)as, en el que el *ltimo dgito sea una ho)a y el primero
sea un tallo Hncluya dos veces los valores en los tallos
f (ul diagrama le gusta ms, el histograma de la parte c o el diagrama de tallo y ho)as
de la parte e? %"plique educaci#n
M %"prese la distribuci#n de frecuencias agrupadas obtenida en la parte b del problema E
como una distribuci#n de frecuencias relativas, de frecuencias acumuladas y de porcenta)es
acumulados educaci#n
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (9 -
O !tilice la frecuencia acumulada obtenida en el problema M y determine-
a. !
E+
b +
CF
educaci#n
G !se otra vez la distribuci#n acumulada y los datos agrupados obtenidos en el
problema M y determine-
a %l rango percentil de una calificaci#n de GB
b %l rango percentil de una calificaci#n de MM
c %l rango percentil de una calificaci#n de GO
ed#caci&n
P %labore un histograma de la distribuci#n de las calificaciones agrupadas del e"amen de
letras inglesas, obtenida en el problema Eb educaci#n
BF Los siguientes datos muestran la cantidad de peso 2en libras3 perdido por cada paciente
de una clnica para el control del peso durante el *ltimo a&o-
a 4aga una distribuci#n de frecuencias de los datos agrupados con BF intervalos
apro"imadamente
b %labore un histograma de la distribuci#n de frecuencias obtenida en la parte a
c %s asimtrica o simtrica la distribuci#n? Si est sesgada, lo est en forma positiva o
negativa?
d 'ealice un diagrama de tallo y ho)as donde el *ltimo dgito sea una ho)a y el primer dgito
sea un tallo 'epita dos veces los valores del tallo e (ul diagrama le gusta ms, el histograma
de la parte b o el diagrama de tallo y ho)as de la parte d? %"plique clnica, salud
BB (onvierta la distribuci#n de frecuencias agrupadas de las prdidas de peso, determinada
en el problema BF, en una distribuci#n de frecuencias relativas y en una distribuci#n de
frecuencias acumuladas clnica, salud
BD !tilice la distribuci#n de frecuencias acumuladas obtenida en el problema BB y
determine-
a +
EF
b +
DE
clnica, salud
BA !tilice una vez ms la distribuci#n de frecuencias acumuladas obtenida en el
problema BB y determine-
a %l rango percentil de un dato de CB
b %l rango percentil de un dato de DG clnica, salud
BC 4aga un polgono de frecuencias a partir de la distribuci#n de frecuencias agrupadas
determinada en el problema BF %s simtrica la curva? Si no lo es, tiene sesgo positivo o
negativo? clnica, salud
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (; -
BE !na universidad peque&a utiliza el sistema de calificaci#n de F a CF, donde CF es la
calificaci#n ms alta posible Las calificaciones que aparecen a continuaci#n son los promedios
de las calificaciones de los estudiantes inscritos actualmente en las licenciaturas de psicologa de
esa universidad
a 4aga una distribuci#n de frecuencias para los datos agrupados, con BF intervalos
apro"imadamente
b %labore un histograma para la distribuci#n de frecuencias obtenida en la parte a
c %s asimtrica o simtrica la distribuci#n? Si est sesgada, su sesgo es positivo o
negativo?
d 'ealice un diagrama de tallo y ho)as donde el *ltimo dgito sea una ho)a y el primer
dgito sea un tallo 'epita cinco veces los valores de los tallos
e (ul diagrama le gusta ms, el histograma de la parte b o el diagrama de tallo y ho)as
de la parte d? %"plique educaci#n
BM +ara las calificaciones agrupadas del problema BE, determine-
a +
EF
b +
DF
ed#caci&n
BO %l promedio de las calificaciones de Sarah es de AB 0omando como base la
distribuci#n de frecuencias de las calificaciones agrupadas obtenidas en el parte a, cul es el
rango percentil del promedio de las calificaciones de Sarah? ed#caci&n
BG Seg*n la poltica de la universidad del problema BE, el estudiante debe tener un
promedio de calificaciones de DE o mayor como requisito para que se le otorgue un ttulo en
psicologa
a . partir de los datos no agrupados que aparecen en el problema BE, qu porcenta)e de
los estudiantes actuales de psicologa necesita me)orar sus calificaciones?
b 0omando como base la distribuci#n de frecuencias obtenida para las calificaciones
agrupadas, qu porcenta)e de los estudiantes necesita me)orar sus calificaciones?
c %"plique la diferencia entre las respuestas a las partes a y b educaci#n
BP 4aga un polgono de frecuencias utilizando la distribuci#n de calificaciones agrupadas
obtenida en el problema BE La curva es simtrica, o tiene sesgo positivo o negativo?
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (= -
DF %l departamento de psicologa de una universidad grande tiene su propio criadero de
ratas con prop#sitos de investigaci#n !n muestreo reciente de EF ratas tomadas del criadero
revel# los siguientes pesos para dichas ratas-
a 4aga una distribuci#n de frecuencias de datos agrupados con BB intervalos
apro"imadamente
b %labore un histograma de la distribuci#n frecuencias obtenida en la parte a
c La distribuci#n es simtrica o asimtrica?
d (onstruya un diagrama de tallo y ho)as en el que el *ltimo dgito sea una ho)a y los
dos primeros dgitos sean un tallo 8o repita los valores de los tallos
e (ul diagrama le gusta ms, el histograma o el diagrama de tallo y ho)as? +or qu?
biol#gica
DB (onvierta la distribuci#n de frecuencias de datos agrupados de los pesos de las
ratas obtenida en el problema DF, en una distribuci#n de frecuencias relativas, de
frecuencias acumuladas y de porcenta)es acumulados biol#gica
DD . partir de la distribuci#n de frecuencias acumuladas que obtuvo en el problema
DB, determine-
a +
EA
b. +
OE
biol#gica
DA !tilizando otra vez la distribuci#n de frecuencias acumuladas obtenida en el
problema DB determine-
a %l rango percentil de un dato de DOE
b %l rango percentil de un dato de ABG biol#gica
DC !na profesora est realizando investigaciones sobre las diferencias individuales de
los estudiantes en cuanto a su susceptibilidad para ser hipnotizados (omo parte del
e"perimento, la profesora decide administrar una parte de la %scala de Susceptibilidad
4ipn#tica de Stanford a GE estudiantes
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /@ -
Medidas de Tendencia Cent$al y ,a$ia+ilidad 1*osciIn2
%414 Int$od#cci&n
%n el capitulo anterior hemos visto como se pueden resumir los datos obtenidos del estudio
de una muestra 2o una poblaci#n3 en una tabla estadstica o un grafico 8o obstante, tras la
elaboraci#n de la tabla y su representaci#n grfica, en la mayora de las ocasiones resulta ms
eficaz dcondensarS dicha informaci#n en algunos n*meros que la e"presen de forma clara y
concisa Los fen#menos biol#gicos no suelen ser constantes, por lo que ser necesario que )unto a
una medida que indique el valor alrededor del cual se agrupan los datos, se asocie una medida
que haga referencia a la variabilidad que refle)e dicha fluctuaci#n
+or tanto el siguiente paso y ob)eto de este capitulo consistir en definir algunos tipos de
medidas 2estadsticos o parmetros3 que los sintetizan a*n ms
%s decir, dado un grupo de datos organizados en una distribuci#n de frecuencias 2o bien
una serie de observaciones sin ordenar3, pretendemos describirlos mediante dos o tres cantidades
sintticas %n este sentido pueden e"aminarse varias caractersticas, siendo las ms comunes-
La tendencia central de los datos/
La dispersi#n o variaci#n con respecto a este centro/
Los datos que ocupan ciertas posiciones
La simetra de los datos
La forma en la que los datos se agrupan
. lo largo de este capitulo, y siguiendo este orden, iremos estudiando Los estadsticos que
nos van a orientar sobre cada uno de estos niveles de informaci#n- valores alrededor de los cuales
se agrupa la muestra, la mayor o menor fluctuaci#n alrededor de esos valores, nos interesaremos
en ciertos valores que marcan posiciones caractersticas de una distribuci#n de frecuencias as
como su simetra y su forma
%4%4 stadsticos de tendencia cent$al
Las tres medidas ms usuales de tendencia central son-
la media,
la mediana,
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /1 -
la moda
%n ciertas ocasiones estos tres estadsticos suelen coincidir, aunque generalmente no es as
(ada uno de ellos presenta venta)as e inconvenientes que precisaremos mas adelante %n primer
lugar vamos a definir los conceptos anteriores
%4%414 La media
La media aritmtica de una variable estadstica es la suma de todos sus posibles valores,
ponderada por las frecuencias de los mismos %s decir, si la tabla de valores de una variable 1 es
la media es el valor que podemos escribir de las siguientes formas equivalentes-
Si los datos no estn ordenados en una tabla, entonces
!lF#nos incon3enientes de la media
La media presenta inconvenientes en algunas situaciones-
!no de ellos es que es muy sensible a los valores e"tremos de la variable- ya que todas las
observaciones intervienen en el calculo de la media, la aparici#n de una observaci#n e"trema,
harb que la media se desplace en esa direcci#n %n consecuencia, no es recomendable usar la
media como medida central en las distribuciones muy asimtricas
Si consideramos una variable discreta, por e)emplo, el n*mero de hi)os en las familias
espa&olas el valor de la media puede no pertenecer al con)unto de valores de la variable/ +or
e)emplo
X
R B, D hi)os
(onsideramos una variable discreta 1 cuyas observaciones en una tabla estadstica han
sido ordenadas de menor a mayor Llamaremos mediana,
Med al primer valor de la variable que de)a por deba)o de si al EFc de las observaciones
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /% -
%n el caso de variables continuas, las clases vienen dadas por intervalos, y aqu la formula
de la mediana se complica un poco ms 2pero no demasiado3- Sea 2lieB, lif el intervalo donde
hemos encontrado que por deba)o estn el EFc de las observaciones %ntonces se obtiene la
mediana a partir de las frecuencias absolutas acumuladas, mediante interpolaci#n lineal
2teorema de 0hales3 como sigue-
%sto equivale a decir que la mediana divide al histograma en dos partes de breas iguales a
]
+ropiedades de la mediana %ntre las propiedades de la mediana, vamos a destacar las
siguientes-
(omo medida descriptiva, tiene la venta)a de no estar afectada por las observaciones
e"tremas, ya que no depende de los valores que toma la variable, sino del orden de las mismas
+or ello es adecuado su uso en distribuciones asimtricas
%s de clculo rpido y de interpretaci#n sencilla
. diferencia de la media, la mediana de una variable discreta es siempre un valor de la
variable que estudiamos 2e) La mediana de una variable n*mero de hi)os toma siempre valores
enteros3
!n e)emplo de clculo de mediana
Sea 1 una variable discreta que ha presentado sobre una muestra las modalidades
Si cambiamos la *ltima observaci#n por otra anormalmente grande, esto no afecta a la
mediana, pero si a la media-
%n este caso la media no es un posible valor de la variable 2discreta3, y se ha visto muy
afectada por la observaci#n e"trema %ste no ha sido el caso para la mediana
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /' -
!n e)emplo de clculo de media y mediana
7btener la media aritmtica y la mediana en la distribuci#n ad)unta
,eterminar grficamente cul de los dos promedios es ms significativo
+ara ver la representatividad de ambos promedios, realizamos el histograma de la figura DA,
y observamos que dada la forma de la distribuci#n, la mediana es ms representativa que la
media
14%4'4 La moda
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /( -
Llamaremos moda a cualquier m"imo relativo de la distribuci#n de frecuencias, es decir,
cualquier valor de la variable que posea una frecuencia mayor que su anterior y su posterior
observaci#n
,e la moda destacamos las siguientes propiedades-
%s muy fcil de calcular
+uede no ser *nica
%4%4(4 Relaci&n ent$e media0 mediana y moda
%n el caso de distribuciones unimodales, la mediana est con frecuencia comprendida entre
la media y la moda 2incluso mas cerca de la media3 %n distribuciones que presentan cierta
inclinaci#n, es ms aconse)able el uso de la mediana Sin embargo en estudios relacionados con
prop#sitos estadsticos y de inferencia suele ser mas apta la media
BA stadsticos de *osici&n
Los estadsticos de posici#n van a ser valores de la variable caracterizados por superar a
cierto porcenta)e de observaciones en la poblaci#n 2o muestra3 0enemos fundamentalmente a los
percentiles como medidas de posici#n, y asociados a ellos veremos tambin los cuartiles, deciles y
cuarteles +ercentiles
+ara una variable discreta, se define el percentil de orden :, como la observaci#n, +:, que
de)a por deba)o de si el :c de la poblaci#n Jgase la figura DC %sta definici#n nos recuerda a la
mediana, pues como consecuencia de la definici#n es evidente que
%n el caso de una variable continua, el intervalo donde se encuentra +: h 2liIB, lif, se calcula
buscando el que de)a deba)o de si al :c de las observaciones ,entro de gl, +: se obtiene seg*n
la relaci#n
Medidas de Tendencia Cent$al y ,a$ia+ilidad - // -
C#a$tiles
Los cuartiles, $B, son un caso particular de los percentiles 4ay A, y se definen como-
Deciles
Se definen los deciles como los valores de la variable que dividen a las observaciones en BF
grupos de igual tama&o 9as precisamente, definimos ,B,,D, , ,P como-
Gem-lo de c.lc#lo de c#a$tiles con #na 3a$ia+le disc$eta
,ada la siguiente distribuci#n en el n*mero de hi)os de cien familias, calcular sus cuartiles
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /5 -
Gem-lo
(alcular los cuartiles en la siguiente distribuci#n de una variable continua-
Soluci#n-
B +rimer cuartel
D Segundo cuartil-
A 0ercer cuartil
%)emplo de cblculo de cuartiles con una variable continua 4an sido ordenados los pesos de
DB personas en la siguiente tabla-
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /9 -
%ncontrar aquellos valores que dividen a los datos en C partes con el mismo numero de
observaciones
Soluci#n- Las cantidades que buscamos son los tres cuartiles- $B, $D y $A +ara
calcularlos, le a&adimos a la tabla las columnas con las frecuencias acumuladas, para localizar
qu intervalos son los que contienen a los cuartiles buscados-
7bsrvese que $D R 9ed %sto es l#gico, ya que la mediana divide a la distribuci#n en dos
partes con el mismo n^mero de observaciones, y $D, hace lo mismo, pues es de)a a dos cuartos
de los datos por arriba y otros dos cuartos por aba)o
Gem-lo
La distribuci#n de una variable tiene por polgono acumulativo de frecuencias el de la figura
DE Si el n^mero total de observaciones es EF-
B %laborar una tabla estadstica con los siguientes elementos- intervalos, marcas de clase,
frecuencia absoluta, frecuencia absoluta acumulada, frecuencias relativa y frecuencias relativa
acumulada
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /; -
D (untas observaciones tuvieron un valor inferior a BF, cuntas inferior a G y cuntas
fueron superior a BB
A ,etermine los cuartiles
Sol#ci&nB
B %n la siguiente tabla se proporciona la informaci#n pedida y algunos clculos au"iliares
que nos permitirn responder a otras cuestiones
D (alculemos el n*mero de observaciones pedido-
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /= -
%4(4 Medidas de 3a$ia+ilidad o dis-e$si&n
Los estadsticos de tendencia central o posici#n nos indican donde se sit*a un grupo de
puntuaciones Los de variabilidad o dispersi#n nos indican si esas puntuaciones o valores estn
pr#"imas entre si o si por el contrario estn o muy dispersas
%4(414 RanFo
!na medida razonable de la variabilidad podra ser la amplitud o rango, que se obtiene
restando el valor mas ba)o de un con)unto de observaciones del valor mas alto
%ropiedades del ran&o
%s fcil de calcular y sus unidades son las mismas que las de la variable 8o utiliza todas
las observaciones 2s#lo dos de ellas3/ Se puede ver muy afectada por alguna observaci#n e"trema/
%l rango aumenta con el n*mero de observaciones, o bien se queda igual %n cualquier caso
nunca disminuye
%4(4%4 ,a$ianEa
La varianza, S
D
, se define como la media de las diferencias cuadrticas de n puntuaciones
con respecto a su media aritmtica, es decir
%sta medida es siempre una cantidad positiva, con propiedades interesante para la
realizaci#n de inferencia estadstica (omo sus unidades son las del cuadrado de la variable, es
mas sencillo usar su raz cuadrada, que es la que vemos en la siguiente secci#n
%4(4'4 Des3iaci&n t-ica o est.nda$
La varianza no tiene la misma magnitud que las observaciones 2e) si las observaciones se
miden en metros, la varianza lo hace en metros cuadrados Si queremos que la medida de
dispersi#n sea de la misma dimensionalidad que las observaciones bastara con tomar su raz
cuadrada +or ello se define la desviaci#n tpica, S, como
%4(4(4 Gem-lo de cJlc#lo de medidas de dis-e$si&n
(alcular el rango, varianza y desviaci#n tpica de las siguientes cantidades medidas en
metros-
A, A, C, C, E
Medidas de Tendencia Cent$al y ,a$ia+ilidad - 5@ -
Soluci#n- %l rango de esas observaciones es la diferencia entre la mayor y menor de ellas, es
decir, EeA R D +ara calcular las restantes medidas de dispersi#n es necesario calcular
previamente el valor con respecto al cual vamos a medir las diferencias i%ste es la media-
" R 2A Y A Y C Y C Y E3NE R A, G metros
La varianza es-
siendo la desviaci#n tpica su raz cuadrada-
%ropiedades de la varianza y desviacin t!pica
.mbas son sensibles a la variaci#n de cada una de las puntuaciones, es decir, si una
puntuaci#n cambia, cambia con ella la varianza La raz#n es que si miramos su definici#n, la
varianza es funci#n de cada una de las puntuaciones
La desviaci#n tpica tiene la propiedad de que en el intervalo
Se encuentra, al menos, el OEc de las observaciones Hncluso si tenemos muchos datos y
estos provienen de una distribuci#n normal 2se definir este concepto mas adelante3, podremos
llegar al PE c 8o es recomendable el uso de ellas, cuando tampoco lo sea el de la media como
medida de tendencia central
%4(4/4 Coeficiente de 3a$iaci&n
4emos visto que las medidas de centralizaci#n y dispersi#n nos dan informaci#n sobre una
muestra 8os podemos preguntar si tiene sentido usar estas magnitudes para comparar dos
poblaciones +or e)emplo, si nos piden comparar la dispersi#n de los pesos de las poblaciones de
elefantes de dos circos diferentes, S nos dar informaci#n ^til +ero qu ocurre si lo que
comparamos es la altura de unos elefantes con respecto a su peso? 0anto la media como la
desviaci#n tpica,
X
y S, se e"presan en las mismas unidades que la variable +or e)emplo, en la
variable altura podemos usar como unidad de longitud el metro y en la variable peso, el
:ilogramo (omparar una desviaci#n 2con respecto a la media3 medida en metros con otra en
:ilogramos no tiene ning*n sentido %l problema no deriva s#lo de que una de las medidas sea de
longitud y la otra sea de masa %l mismo problema se plantea si medimos cierta cantidad, por
e)emplo la masa, de dos poblaciones, pero con distintas unidades %ste es el caso en que
comparamos el peso en toneladas de una poblaci#n de BFF elefantes con el correspondiente en
miligramos de una poblaci#n de EF hormigas
%l problema no se resuelve tomando las mismas escalas para ambas poblaciones +or
e)emplo, se nos puede ocurrir medir a las hormigas con las mismas unidades que los elefantes
2toneladas3 Si la ingenier_a gentica no nos sorprende con alguna barbaridad, lo l#gico es que la
dispersi#n de la variable peso de las hormigas sea prcticamente nula 2U.unque haya algunas
que sean BFFF veces mayores que otrasV3 %n los dos primeros casos mencionados
Medidas de Tendencia Cent$al y ,a$ia+ilidad - 51 -
anteriormente, el problema viene de la dimensionalidad de las variables, y en el tercero de la
diferencia enorme entre las medias de ambas poblaciones %l coeficiente de variaci#n es lo que
nos permite evitar estos problemas, pues elimina la dimensionalidad de las variables y tiene en
cuenta la proporci#n e"istente entre medias y desviaci#n tpica Se define del siguiente modo-
%ropiedades del coeficiente de variacin
S#lo se debe calcular para variables con todos los valores positivos
0odo ndice de variabilidad es esencialmente no negativo Las observaciones pueden ser
positivas o nulas, pero su variabilidad debe ser siempre positiva ,e ah que s#lo debemos
traba)ar con variables positivas, para la que tenemos con seguridad que x " j F
8o es invariante ante cambios de origen %s decir, si a los resultados de una medida le
sumamos una cantidad positiva, b j F, para tener > R 1 Y b, entonces (J> k (J1
%s invariante a cambios de escala .s por e)emplo el coeficiente de variaci#n de una variable
medida en metros es una cantidad adimensional que no cambia si la medici#n se realiza en
centmetros
Ti-ificaci&n
Se conoce por tipificaci#n al proceso de restar la media y dividir por su desviaci#n tpica a
una variable 1 ,e este modo se obtiene una nueva variable de media x R F y desviaci#n tpica Sl
R B, que denominamos variable tipificada
%sta nueva variable carece de unidades y permite hacer comparables dos medidas que en
un principio no lo son .s por e)emplo nos podemos preguntar si un elefante es mas grueso que
una hormiga determinada, cada uno en relaci#n a su poblaci#n 0ambin es aplicable al caso en
que se quieran comparar individuos seme)antes de poblaciones diferentes +or e)emplo, si
deseamos comparar el nivel acadmico de dos estudiantes de diferentes !niversidades para la
concesi#n de una beca de estudios, en principio seria in)usto concederla directamente al que
posea una nota media mas elevada, ya que la dificultad para conseguir una buena calificaci#n
puede ser mucho mayor en un centro que en el otro, lo que limita las posibilidades de uno de los
estudiante y favorece al otro %n este caso, lo mas correcto es comparar las calificaciones de
ambos estudiantes, pero tipificadas cada una de ellas por las medias y desviaciones tpicas
respectivas de las notas de los alumnos de cada !niversidad
No conf#ndi$ coeficiente de 3a$iaci&n y ti-ificaci&n
Los coeficientes de variaci#n sirven para comparar las variabilidades de dos con)untos de
valores 2muestras o poblaciones3, mientras que si deseamos comparar a dos individuos de cada
uno de esos con)untos, es necesario usar los valores tipificados 8inguno de ellos posee unidades
y es un error frecuente entre estudiantes de bioestadstica confundirlos
%4/4 !simet$a y a-#ntamiento
Medidas de Tendencia Cent$al y ,a$ia+ilidad - 5% -
Sabemos cmmo calcular valores alrededor de los cuales se distribuyen las observaciones de
una variable sobre una muestra y sabemos cmmo calcular la dispersi#n que ofrecen los mismos
con respecto al valor de central 8os proponemos dar un paso mas all en el anlisis de la
variable %n primer lugar, nos vamos a plantear el saber si los datos se distribuyen de forma
simtrica con respecto a un valor central, o si bien la grfica que representa la distribuci#n de
frecuencias es de una forma diferente del lado derecho que del lado izquierdo
Si la simetra ha sido determinada, podemos preguntarnos si la curva es mas o menos
apuntada 2larga y estrecha3 %ste apuntamiento habrb que medirlo comparado a cierta
distribuci#n de frecuencias que consideramos normal 2no por casualidad es gste el nombre que
recibe la distribuci#n de referencia3 %stas ideas son las que vamos a desarrollar en lo que resta
del capitulo
%4/414 stadsticos de asimet$a
+ara saber si una distribuci#n de frecuencias es simtrica, hay que precisar con respecto a
qu !n buen candidato es la mediana, ya que para variables continuas, divide al histograma de
frecuencias en dos partes de igual brea +odemos basarnos en ella para, de forma natural, decir
que una distribuci#n de frecuencias es simtrica si el lado derecho de la grfica 2a partir de la
mediana3 es la imagen por un espe)o del lado izquierdo 2figura DM3 (uando la variable es
discreta, decimos que es simtrica, si lo es con respecto a la media
,entro de los tipos de asimetra posible, vamos a destacar los dos fundamentales-
'simetr!a positiva- Si las frecuencias mas altas se encuentran en el lado izquierdo de la
media, mientras que en derecho hay frecuencias mas +eque&as 2cola3
'simetr!a ne&ativa- (uando la cola est en el lado izquierdo (uando realizamos un
estudio descriptivo es altamente improbable que la distribuci#n de frecuencias sea totalmente
simtrica %n la prctica diremos que la distribuci#n de frecuencias es simtrica si lo es de un
modo apro"imado +or otro lado, a*n observando cuidadosamente la grfica, podemos no ver
claro de qu lado estn las frecuencias mas altas Se definen entonces toda una familia de
estadsticos que ayuden a interpretar la asimetra, denominados ndices de asimetra %l
principal de ellos es el momento central de tercer orden que definimos a continuaci#n
Medidas de Tendencia Cent$al y ,a$ia+ilidad - 5' -
9omento central de tercer orden
Sea 1 una variable cuantitativa > y p h HJ Llamamos momento de orden
p a-
Se denomina momento central de orden p a la cantidad
Los momentos de orden p impar, son siempre nulos en el caso de variables simtricas, ya
que para cada i que est a un lado de la media, con 2"i e x 3 k F, le corresponde una observaci#n )
del otro lado de la media tal que 2"i e x 3 R e2"i e x 3 %levando cada una de esas cantidades a p
impar, y sumando se tiene que
Si la distribuci#n fuese asimtrica positiva, las cantidades 2"ie x 3
p
, con p Q A impar positivas
estaran muy aumentadas al elevarse a p %sta propiedad nos indica que un ndice de asimetra
posible consiste en tomar p R A y elegir como estadstico de asimetra al momento central de
tercer orden .poyndonos en este ndice, diremos que hay asimetra positiva si aA j F, y que la
asimetra es negativa si aA k F nndice basado en los tres cuartiles 2>uleo?oKley3 Si una
distribuci#n es simtrica, es claro que deben haber tantas observaciones entre la que de)a por
deba)o de si las tres cuartas partes de la distribuci#n y la mediana, como entre la mediana y la
que de)a por deba)o de si un cuarto de todas las observaciones ,e forma abreviada esto es,
$A e $D R $D e $B
!na pista para saber si una distribuci#n de frecuencias es asimtrica positiva la
descubrimos observando la figura DO3-
$A e $D j $D e $B
+or analoga, si es asimtrica negativa, se tendr
$A e $D k $D e $B
+ara quitar dimensionalidad al problema, utilizamos como ndice de asimetra la cantidad-
%s claro que
%l numero obtenido, .s, es invariante ante cambios de origen de referencia y de escala
Medidas de Tendencia Cent$al y ,a$ia+ilidad - 5( -
Ot$os ndices de asimet$a4
?asndonos en que si una distribuci#n de frecuencias es simtrica y unimodal, entonces la
media, la mediana y la moda coinciden, podemos definir otras medidas de asimetra, como son-
o bien,
,iremos que hay asimetra positiva si .s j F y negativa si .s k F
%)emplo
Las edades de un grupo de personas se refle)an en la tabla siguiente-
Medidas de Tendencia Cent$al y ,a$ia+ilidad - 5/ -
,eterminar la variabilidad de la edad mediante los estadsticos varianza, desviaci#n tpica,
coeficiente de variaci#n y rango intercuart_lico %studie la simetra de la variable
Sol#ci&nB
%n primer lugar realizamos los clculos necesarios a partir de la tabla de frecuencias-
La media es x R D,FMENBEO R BA, BE a&os La varianza la calculamos a partir de la columna
de la
i i
n x
2
como sigue-
S
D
R DO,OCD, DENBEOeBA, BE
D
R A, OG a&os
D
p S R
78 . 3
R B, PC a&os
M#est$eo !leato$io y *$o+a+ilidad - 55 -
M#est$eo aleato$io y -$o+a+ilidad
INTRODUCCIN
4emos concluido nuestro anlisis de la estadstica descriptiva y ya estamos listos para
comenzar a estudiar el rea fascinante de la estadstica inferencial (on la estadstica descriptiva
nuestra preocupaci#n principal era lograr la presentaci#n y descripci#n de los con)untos de
datos de la manera ms significativa y eficaz %n la estadstica inferencial vamos ms all de la
mera descripci#n de los datos, ya que un ob)etivo bsico es el uso de los datos provenientes de
una muestra para hacer una afirmaci#n acerca de una caracterstica de la poblaci#n Se hacen
dos tipos de afirmaciones- una tiene que ver con la actividad conocida como prueba de hip#tesis y
la otra con la estimaci#n de parmetros
%n la prueba de hip#tesis, el investigador recolecta datos de un e"perimento sobre el
con)unto de su)etos de una muestra, en un intento de validar cierta hip#tesis relativa a una
poblaci#n +or e)emplo, suponga que una psic#loga dedicada a la educaci#n cree que un nuevo
mtodo para ense&ar la asignatura de matemticas a los ni&os de tercer grado, en su distrito
escolar 2poblaci#n3, es me)or que la forma usual de ense&anza %n el e"perimento, ella toma dos
muestras de los alumnos de tercer grado, a una de las cuales se le imparte el nuevo mtodo de
ense&anza y a la otra el mtodo usual (ada grupo presenta el mismo e"amen final .l hacer esta
prueba, la psic#loga no se conforma con s#lo informar que la media del grupo que recibi# el
nuevo mtodo fue mayor que la del otro grupo %lla quiere hacer una afirmaci#n como- ;La
me)ora observada en las calificaciones del e"amen final fue resultado del nuevo mtodo de
ense&anza y no del azar .dems, dicha me)ora no s#lo se aplicara a la muestra particular
sometida a prueba, sino que aparecera en toda la poblaci#n de estudiantes de tercer grado si se
les ense&ase con el nuevo mtodo; Las tcnicas utilizadas en estadstica inferencial permiten
hacer afirmaciones de este tipo
%n los e"perimentos para la estimaci#n de parmetros el investigador est interesado en
determinar la magnitud de una caracterstica de la poblaci#n +or e)emplo, a un economista
podra importarle la determinaci#n de la cantidad mensual promedio de dinero gastada el a&o
pasado en alimentos por los estudiantes de bachillerato (on los datos de una muestra y las
tcnicas de la estadstica inferencial, l puede estimar la cantidad media que gasta la poblaci#n
%l economista podra concluir con una afirmaci#n como la siguiente- ;%"iste una probabilidad
de FPE de que el intervalo qDEFIqAFF contenga la media de la poblaci#n;
Los temas de muestreo aleatorio y de probabilidad son fundamentales para la metodologa de
la estadstica inferencial %n la siguiente secci#n estudiaremos el muestreo aleatorio %l resto
del captulo tratar sobre los principios bsicos de la probabilidad
MUSTRO !L!TORIO
+ara generalizar de manera vlida, a partir de una muestra a toda la poblaci#n, tanto en los
e"perimentos de prueba de hip#tesis como en los de estimaci#n de parmetros, la muestra no
puede ser cualquier subcon)unto de la poblaci#n %s crucial que sea una muestra aleatoria
Una m#est$a aleato$ia es eleFida de la -o+laci&n mediante #n -$oceso con el
c#al se aseF#$a K#e 12 cada -osi+le m#est$a de #n tamaLo dado tenFa la misma
-$o+a+ilidad de se$ eleFida y %2 todos los miem+$os de la -o+laci&n tenFan la
misma -$o+a+ilidad de se$ seleccionados en la m#est$a4
+ara ilustrar esto, consideremos una situaci#n en la que tenemos una poblaci#n con los
datos D, A, C, E y M, y queremos e"traer de manera aleatoria una muestra de tama&o D a partir de
dicha poblaci#n 7bserve que, por lo general, una poblaci#n tendra ms datos La hemos
M#est$eo !leato$io y *$o+a+ilidad - 59 -
restringido a cinco elementos para facilitar la comprensi#n de lo que queremos poner de
manifiesto Suponga usted que estamos realizando un muestreo de esta poblaci#n y que tomamos
un dato a la vez, para luego volver a colocarlo con el resto de dicha poblaci#n antes de e"traer
otro %sto se llama muestreo con reemplazo y ser analizado posteriormente en este captulo .
continuaci#n presentamos todas las muestras de tama&o D que podemos obtener de la poblaci#n
aplicando este mtodo de muestreo-
Son DE muestras de tama&o D las que podemos obtener al realizar el muestreo de un
elemento a la vez con reemplazo +ara realizar un muestreo aleatorio, el proceso debe ser tal que
B3 las DE muestras posibles y D3 todos los datos de la poblaci#n 2D, A, C, E y M3 tengan la misma
probabilidad de ser seleccionados en la muestra
La muestra debe ser aleatoria por dos razones La primera es que para que se pueda
generalizar a toda la poblaci#n una caracterstica observada en una muestra, es necesario aplicar
las leyes de la probabilidad Si la muestra no ha sido obtenida mediante un procedimiento con el
cual se garantice que cada muestra posible del tama&o elegido tenga la misma posibilidad de ser
escogida, no podremos aplicar las leyes de probabilidad a esa muestra La importancia que tiene
para la inferencia estadstica este aspecto de aleatoriedad y de probabilidad se podr apreciar
claramente cuando hayamos analizado los captulos referentes a la prueba de hip#tesis y a las
distribuciones muestrales 2vanse los captulos BF y BD respectivamente3
La segunda raz#n para la utilizaci#n del muestreo aleatorio consiste en que, para asegurar
la generalizaci#n de una caracterstica de la muestra a toda la poblaci#n, es necesario que dicha
muestra sea representativa de la poblaci#n en cuesti#n !na forma de lograr la representatividad
consiste en elegir la muestra por medio de un proceso que garantice que todos los miembros de la
poblaci#n tengan la misma posibilidad de ser escogidos +or lo tanto, el hecho de requerir que una
muestra sea aleatoria permite aplicar las leyes de probabilidad sobre la muestra misma y, por
ende, que sta sea representativa de la poblaci#n
%s tentador pensar que podemos lograr la representatividad de una muestra utilizando
mtodos distintos al del muestreo aleatorio Sin embargo, con mucha frecuencia el
procedimiento utilizado produce una muestra sesgada 2no representativa3 !n e)emplo de esto es
la famosa encuesta presidencial del Literary ,igest de BPAM, la cual predi)o una victoria aplastante
de Landon 2EO a CAc3 ,e hecho, 'oosevelt gan# con MDc de los votos La predicci#n del Literary
,igest result# ser un error garrafal +or qu? !n anlisis posterior revel# que el error se debi# a
que la muestra no era representativa de la poblaci#n votante, sino que era una muestra sesgada
Los individuos fueron elegidos de fuentes tales como el directorio telef#nico, registros de clubes
y listas de propietarios de autom#viles %sos registros e"cluyeron de manera sistemtica a
las personas pobres, quienes tal vez no tenan telfonos ni autom#viles > ocurri# que los pobres
votaron en forma aplastante a favor de 'oosevelt .unque otros mtodos de muestreo pudieran proI
ducir una muestra representativa stos no seran *tiles para la inferencia, pues no podramos
aplicar las leyes de la probabilidad necesarias para generalizar de la muestra a toda la poblaci#n
Tcnicas -a$a el m#est$eo aleato$io
!n estudio profundo de las formas con las cuales se generan las muestras aleatorias est
ms all del ob)etivo de este libro %ste tema puede ser comple)o, en particular al traba)ar con
M#est$eo !leato$io y *$o+a+ilidad - 5; -
encuestas Sin embargo, presentaremos algunas tcnicas de uso com*n, )unto con varias
situaciones sencillas, de manera que usted pueda darse una idea de lo que esto implica Suponga
que tenemos una poblaci#n de BFF personas y queremos obtener una muestra aleatoria de DF
personas para un e"perimento !na forma de hacer esto sera enumerar a los individuos de la
poblaci#n del B al BFF, luego tomar BFF pedazos de papel y numerarlos, colocar los papeles en
un sombrero para revolverlos y despus elegir uno Jolveramos entonces a mezclar los papelitos
para elegir otro Luego, continuaramos este proceso hasta haber elegido DF pedazos de papel
Los n*meros escritos en los pedazos de papel identificaran a los individuos que compondran la
muestra %n este mtodo de muestreo aleatorio, es crucial que la poblaci#n 2los trozos de papel3
est bien; revuelta; para garantizar la aleatoriedad
!n procedimiento com*n para producir muestras aleatorias consiste en utilizar una tabla de
n*meros aleatorios, como la que hemos incluido en la tabla 5 del apndice , %ste tipo de
tablas se hace, por lo regular, mediante un programa de computadora, el cual garantiza que
todos los dgitos 2FIP3 tengan la misma posibilidad de ser elegidos cada vez que se imprima un
dgito
La tabla se puede emplear como una sucesi#n de dgitos simples consecutivos, n*meros de
dos dgitos, n*meros de tres dgitos, etc +or e)emplo, en la tabla 5, pgina ECM, si comenzamos en
el primer rengl#n y nos movemos en direcci#n horizontal por la pgina, el orden aleatorio de los
dgitos simples sera A D, P, C, D, Si quisiramos utilizar n*meros de dos dgitos, entonces el
orden aleatorio sera AD, PC, DP, EC, BM,
(omo los dgitos de la tabla son aleatorios, se pueden utilizar vertical u horizontal mente en
ambas direcciones La direcci#n que se va a usar debe especificarse antes de emplear la tabla/
para mane)arla de manera adecuada, hay que comenzar en forma aleatoria !na posibilidad de
lograr esto es hacer tar)etas con n*meros de rengl#n y de columna, colocarlas en una ca)a,
revolverlas y luego elegir un n*mero para el rengl#n y otro para la columna La intersecci#n del
rengl#n y la columna sera la posici#n del primer n*mero aleatorio Los dems n*meros seran
localizados al desplazarse desde el primer n*mero, en la direcci#n convenida antes de entrar a la
tabla +or e)emplo, suponga que queremos formar una muestra aleatoria de A su)etos de una
poblaci#n de BF su)etos +ara este e)emplo hemos decidido movernos sobre la tabla en direcci#n
horizontal, a la derecha +ara elegir la muestra, primero asignamos a cada individuo de la
poblaci#n un n*mero del F al P Luego entramos en la tabla de manera aleatoria para localizar
el primer n*mero Suponga que el dato es el primer n*mero del sptimo rengl#n, que es igual a
A %ste n*mero designa al primer su)eto de la muestra (omo hemos decidido movernos sobre la
tabla hacia la derecha, los dos n*meros siguientes son E y M ,e esta manera, los individuos que
portan los n*meros E y M completaran la muestra
'esolvamos ahora un problema en el cual la poblaci#n tiene ms individuos (on
prop#sitos ilustrativos, supondremos que se desea e"traer un muestra aleatoria de BE su)etos, de
una poblaci#n de BFF +ara variar las cosas un poco, para este e)ercicio deci dimos
desplazarnos verticalmente sobre la tabla, hacia aba)o, en lugar de hacerlo en direcci#n
horizontal, hacia la derecha (omo antes, necesitamos asignar una cifra a cada miembro de la
poblaci#n %sta vez, los n*meros asignados sern del FF al PP en vez de F a P ,e nuevo, entramos
a la tabla de manera aleatoria %sta vez suponemos que el primer dato o primer n*mero de dos
dgitos aparece en la intersecci#n de la columna A con el rengl#n BD %l guarismo de dos dgitos
localizado en esa intersecci#n es OF +or lo tanto, el primer su)eto de la muestra es el individuo a
quien le corresponde el n*mero OF +ara localizar al siguiente su)eto de la muestra, ba)amos
verticalmente en la tabla a partir del OF .s, el segundo su)eto de la muestra sera el individuo
que tiene el n*mero AA (ontinuaramos este procedimiento hasta que hayamos seleccionado BE
su)etos %l con)unto completo de n*meros que representan a los su)etos de la muestra sera- OF,
AA, GD, DD, PM, AE,BC,BD,BA, EP, PO, AO, EC, CD y GP .l obtener este con)unto de n*meros, el GD apaI
reci# dos veces en la tabla (omo el mismo individuo no puede estar en la muestra ms de una
M#est$eo !leato$io y *$o+a+ilidad - 5= -
vez, no incluimos el n*mero repetido
M#est$eo con o sin $eem-laEo
4asta ahora hemos definido una muestra aleatoria, analizamos la importancia del muestreo
aleatorio y presentamos algunas tcnicas para producir muestras aleatorias +ara completar
nuestro estudio, debemos distinguir entre el ;muestreo con reemplazoLL y el ;muestreo sin
reemplazo; +ara ilustrar la diferencia entre estos dos mtodos de muestreo, suponga que
queremos formar una muestra de dos datos provenientes de una poblaci#n compuesta por los
n*meros C, E, G y BF !na manera de hacer esto consistira en e"traer un dato de la poblaci#n,
registrar su valor, y reintegrarlo a la poblaci#n antes de e"traer el segundo elemento .s, el
primer dato podra ser elegido de nuevo en la segunda e"tracci#n %ste mtodo se llama
muestreo con reemplazo !na segunda alternativa consistira en e"traer al azar un dato de la
poblaci#n y no reemplazarlo antes de seleccionar el segundo ,e esta manera, cualquier n*mero
proveniente de la poblaci#n podra aparecer en la muestra solamente una vez . este mtodo se
le llama muestreo sin reemplazo
l m#est$eo con $eem-laEo se define como #n mtodo en el c#al cada miem+$o
de la -o+laci&n eleFida -a$a la m#est$a se $einteF$a a la -o+laci&n antes de
selecciona$ al siF#iente miem+$o4
l m#est$eo sin $eem-laEo se define como #n mtodo en el c#al los miem+$os
de la m#est$a no son $einteF$ados a la -o+laci&n antes de selecciona$ a los
miem+$os s#+sec#entes4
*RO?!?ILID!D
La probabilidad se puede estudiar desde dos puntos de vista- B3 a priori o clsico y D3 a
posteriori o emprico . priori significa aquello que se puede deducir usando s#lo la raz#n, sin
recurrir a la e"periencia ,esde el punto de vista a priori o clsico, la probabilidad se define
como-
%l smbolo p2.3 se lee como ;la probabilidad de ocurrencia del evento .; .s, la ecuaci#n
establece que la probabilidad de ocurrencia del evento . es igual al n*mero de eventos
clasificables como . dividida entre el n*mero de eventos posibles +ara ilustrar el uso de esta
ecuaci#n, veamos un e)emplo relacionado con unos dados La figura GB muestra una
ilustraci#n con un par de dados (ada dado tiene seis caras y ostenta un n*mero distinto de
puntos en cada cara Los puntos varan de uno a seis %stos cubos de apariencia inocente se
utilizan para )uegos de azar/ son la base de muchas desgracias y alegras, seg*n la dsuerteS del
)ugador
'egresando a la probabilidad a priori, suponga que vamos a arro)ar un dado una vez
(ul es la probabilidad de que el dado se detenga con un D 2el lado que tiene dos puntos3 hacia
arriba? (omo e"isten seis n*meros posibles y s#lo uno de ellos es un D, la probabilidad de que
salga un D en una tirada de un dado es-
M#est$eo !leato$io y *$o+a+ilidad - 9@ -
0ratemos de resolver otro problema mediante el punto de vista a priori (ul es la
probabilidad de obtener un n*mero mayor que C en una tirada de un dado? .hora e"isten dos
eventos clasificables como . 2obtener un E o un M3 .s,
7bserve que logramos resolver los dos problemas anteriores por medio de un razonamiento
sin recurrir a ninguna colecci#n de datos ,ebemos comparar este punto de vista con el enfoque a
posteriori o emprico de la probabilidad . posteri ori significa ;despus del hecho;, en el
conte"to de la probabilidad, significa despus de haber reunido algunos datos ,esde el punto de
vista a posteriori o emprico, la probabilidad se define como-
+ara determinar la probabilidad de obtener un D al tirar un dado, desde el punto de vista
emprico, tendramos que considerar el dado real, arro)arlo en muchas ocasiones y contar el
n*mero de veces que se presenta un D 9ientras ms veces arro)emos el dado, tanto me)or ser
+ara este problema, suponga que lanzamos el dado BFF FFF veces y que el D apareci# en BM FFF
ocasiones La probabilidad de que ocurra un D en un lanzamiento del dado se determina
mediante-
7bserve que, desde este punto de vista, antes de determinar la probabilidad es necesario
tener el dado real y reunir algunos datos %l punto interesante es que si el dado no est cargado
2entonces se dice que es un dado honesto3, al lanzarlo muchas veces la probabilidad a posteriori
se acerca a la probabilidad a priori Si arro)amos el dado una infinidad de veces, las dos
probabilidades sern iguales 7bserve tambin que si el dado est cargado 2con una distribuci#n
de peso por la cual uno de los lados quede arriba con mayor frecuencia que los dems3, la
probabilidad a posteriori ser diferente que la probabilidad a priori +or e)emplo, si el dado
est ;cargado; para que aparezca un MFBD nunca aparecer +odemos ver ahora que la ecuaci#n
a priori supone que todos los resultados posibles tienen la misma probabilidad de ocurrir +ara
la mayor parte de los problemas de este captulo y el siguiente aplicaremos el punto de vista a
priori
!lF#nos as-ectos +.sicos $elati3os a los 3alo$es de -$o+a+ilidad
+uesto que la probabilidad es esencialmente una proporci#n su valor fluct*a entre FFF y
BFF Si la probabilidad de que ocurra un evento es igual a BFF entonces es seguro que tal evento
ocurrir Si la probabilidad es igual a FFF, entonces es seguro que el evento no ocurrir +or
e)emplo, un dado com*n no tiene O puntos en ninguno de sus lados +or lo tanto, la probabilidad
de obtener un O al arro)ar un dado es igual a FFF %s seguro que no ocurrir que salga un O +or
otra parte, la probabilidad de que salga un n*mero del B al M es igual a BFF %s seguro que se
obtendr alguno de los n*meros B, D, A, C, E o M
La probabilidad de ocurrencia de un evento se e"presa como una fracci#n o un n*mero
M#est$eo !leato$io y *$o+a+ilidad - 91 -
decimal +or e)emplo, la probabilidad de elegir al azar el as de espadas en una bara)a com*n es ED
o bien FFBPD\ La respuesta se puede quedar como una fracci#n 2BNED3, pero generalmente se
convierte a su equivalente decimal 2FFBPD3
.lgunas veces, la probabilidad se e"presa como ;posibilidades con respecto a BFF; +or
e)emplo, alguien podra comentar que la probabilidad de que ocurra el evento . es de E
posibilidades en BFF Lo que esta persona quiere decir es que p2.3 R FFE %n ciertas ocasiones, la
probabilidad se e"presa tambin como las posibilidades a favor o en contra de que ocurra un
evento +or e)emplo, un apostador podra decir que las posibilidades de que =red gane la carrera
son de A a B a su favor %n trminos de probabilidades, p2que gane =red3 ANC R FOE Si las
posibilidades fuesen de A a B en contra de que =red triunfe, entonces p2que gane =red3 RBNC R
FDE
C.lc#lo de -$o+a+ilidades
La determinaci#n de la probabilidad de los eventos puede ser comple)a ,e hecho, e"isten
cursos completos dedicados a este tema y son bastante difciles +or fortuna, para nuestros
prop#sitos s#lo hay que aprender dos reglas fundamentales de la probabilidad- la de la suma y la
del producto %stas reglas proporcionarn las bases necesarias para comprender las pruebas
de inferencia estadstica que veremos ms adelante en este libro de te"to
(a re&la de la suma
La regla de la suma sirve para determinar la probabilidad de que ocurra alguno de varios
eventos posibles +ara comenzar nuestro anlisis, supongamos que s#lo e"isten dos eventos
posibles- . y ? (uando e"isten dos eventos, la regla de la suma establece lo siguiente-
La -$o+a+ilidad de oc#$$encia de ! o ? es iF#al a la -$o+a+ilidad de K#e oc#$$a
. ms la probabilidad de que ocurra ? menos la probabilidad de que ocurran
ambos, . y ?
%n forma de ecuaci#n, la regla de la suma establece que-
ec#aci&n Fene$al de la $eFla
- 1! o ?2 M - 1!2 N - 1?2 - - 1! y ?2 de la s#ma -a$a dos e3entos
Jamos a ilustrar la forma en que se utiliza esta regla Suponga que queremos determinar la
probabilidad de sacar un as o un trbol de una bara)a de cartas ordinarias %l problema ha
sido resuelto de dos maneras en la figura GD +or favor, consulte la figura al leer este prrafo %n
la primera de esas maneras, enumeramos todos los eventos que pueden ser clasificados como un
as o un trbol y utilizamos la ecuaci#n bsica para la probabilidad %"isten BM formas de obtener
un as o un trbol, por lo cual la probabilidad de sacar un as o un trbol es R BMNED R FAFOO %l
segundo mtodo emplea la regla de la suma La probabilidad de obtener un as es CNED y la
probabilidad de sacar un trbol a la vez es R BANED La probabilidad de logar un as y un
trbol es igual a R BNED Seg*n la regla de la suma, la probabilidad de conseguir un as o un
trbol es R CNED Y BANED o BNED R BMNED R FAFOO +or qu tenemos que restar la probabilidad
de obtener un as y un trbol a la vez? +orque hemos contado el as de trboles dos veces Si no lo
restramos, pensaramos de manera err#nea que e"isten BO eventos favorables siendo que s#lo
e"isten BM
%n este curso emplearemos la regla de la suma en casi todas las situaciones en las que
los eventos sean mutuamente e"cluyentes
Dos e3entos son m#t#amente e8cl#yentes si no -#eden oc#$$i$ al mismo
M#est$eo !leato$io y *$o+a+ilidad - 9% -
tiem-o4 Ot$a mane$a de deci$ esto es K#e dos e3entos son m#t#amente
e8cl#yentes si la oc#$$encia de #no im-ide la oc#$$encia del ot$o4
Los eventos de obtener un B y un D al lanzar un dado son mutuamente e"cluyentes Si el
lanzamiento termina con un B, entonces no puede haber terminado tambin con un D Los
eventos de e"traer a la vez un as y un rey al sacar una sola carta de un mazo de bara)as
ordinarias son mutuamente e"cluyentes Si la carta es un as, eso impide que la misma sea
tambin un rey %sto se puede contrastar con los eventos de e"traer a la vez un as y un trbol
al sacar una sola carta del mazo %stos dos eventos no son mutuamente e"cluyentes en virtud de
que hay una carta que es simultneamente un as y un trbol 2el as de trboles3
(uando los eventos son mutuamente e"cluyentes, la probabilidad de que ambos eventos
ocurran al mismo tiempo es igual a cero .s, p 2. y ?3 R F cuando . y ? son mutuamente
e"cluyentes %n estas condiciones, la regla de la suma se simplifica as-
+ractiquemos ahora resolviendo algunos problemas que incluyen situaciones en las que . y
? son mutuamente e"cluyentes
M#est$eo !leato$io y *$o+a+ilidad - 9' -
(ul es la probabilidad de elegir al azar un BF o un C al e"traer una carta de una bara)a
ordinaria?
S7L!(Hr8
La soluci#n se ilustra en la figura siguiente (omo deseamos sacar un BF o un C y estos
dos eventos son mutuamente e"cluyentes, la regla de la suma con eventos mutuamente
e"cluyentes resulta apropiada .s, p2BF o C3 Rp2BF3 Y p2C3
+uesto que hay cuatro BF, cuatro C y ED cartas, entonces p 2BF3 R CNED y p2C3 R CNED +or
consiguiente, p2BF o C3 R CNED R CNED R GNED R FBEAG
.l lanzar una vez un dado que no est cargado, cul es la probabilidad de obtener un B o
un n*mero par?
S7L!(Hr8
La soluci#n aparece en la figura acompa&ante (omo los eventos son mutuamente
e"cluyentes y el problema pide obtener un B o un n*mero par, podemos aplicar la regla de la
suma para este tipo de eventos .s, p2B o un n*mero par3 R p2B3 Y p2un n*mero par3 %"iste
una forma de conseguir un B, tres formas de lograr un n*mero par 2D, C, M3 y seis resultados
posibles .s, p2B3 RBNM, p2un n*mero par3 R ANM y p2B o un n*mero par3 RBNM Y ANM R CNM R
FMMMO
Suponga que va a elegir de manera aleatoria un individuo entre una poblaci#n de BAF
personas %n esa poblaci#n hay CF ni&os menores de BD a&os, MF adolescentes y AF adultos
(ul es la probabilidad de que el individuo elegido sea un adolescente o un adulto?
M#est$eo !leato$io y *$o+a+ilidad - 9( -
SOLUCIN
La soluci#n aparece en la figura acompa&ante (omo los eventos son mutuamente
e"cluyentes y queremos obtener un adolescente o un adulto, podemos emplear la regla de la
suma correspondiente .s, p 2adolescente o adulto3 R p2adolescente3 Y p2adulto3 (omo hay MF
adolescentes, AF adultos y BAF personas en la poblaci#n, p2adolescente3 R MFNBAF y p2adulto3
R AFNBAF +or lo tanto, p2adolescente o adulto3 R MFNBAF Y AFNBAF R PFNBAF R FMPDA
La regla de la suma tambin se puede utilizar en situaciones donde hay ms de dos eventos/
s#lo hacemos una sencilla e"tensi#n de la ecuaci#n empleada para esta situaci#n .s, cuando
e"isten ms de dos eventos y todos son mutuamente e"cluyentes, la probabilidad de que ocurra
cualquiera de ellos es igual a la suma de las probabilidades de cada evento . continuaci#n
mostramos la ecuaci#n-
p2.o ?o (ool3Rp2.3Yp2?3Yp2(3YYp2l3
$eFla de la s#ma -a$a m.s de dos e3entos
m#t#amente e8cl#yentes
donde l R es el *ltimo evento
(on mucha frecuencia encontraremos situaciones en las cuales los eventos no s#lo son
mutuamente e"cluyentes, sino tambin e"haustivos >a hemos definido a los dos primeros, nos
faltan los e"haustivos
!n con)unto de eventos es e8Ha#sti3o si incluye a todos los eventos posibles
+or e)emplo, al lanzar un dado una sola vez, el con)unto de eventos que consisten en obtener
B, D, A, C, E o M es e"haustivo, pues el con)unto incluye a todos los eventos posibles (uando un
con)unto de eventos es e"haustivo y mutuamente e"cluyente, e"iste una relaci#n muy *til %n
estas condiciones, la suma de las probabilidades individuales de cada evento del con)unto debe
ser igual a B .s,
+ara ilustrar esta relaci#n, consideremos el con)unto de eventos que consisten en obtener B,
D, A, C, E o M al lanzar una sola vez un dado no cargado (omo los eventos son e"haustivos y
M#est$eo !leato$io y *$o+a+ilidad - 9/ -
mutuamente e"cluyentes, la suma de sus probabilidades debe ser igual a B
+odemos ver que esto es cierto, pues p2B3 R BNM, p2D3 R BNM, p2A3 R BNM, p2C3 R BNM, p 2E3 R BNM y
p 2M3 R BNM .s,
I (uando s#lo e"isten dos eventos y stos son mutuamente e"cluyentes, se acostumbra
asignar el smbolo + a la probabilidad de que ocurra uno de los eventos y $ a la probabilidad de
que ocurra el otro evento +or e)emplo, si estamos lanzando una moneda, sta s#lo puede caer
de cara o de cruz y se presentar una situaci#n en la que s#lo hay dos eventos posibles 2cara o
cruz3 en cada lanzamiento, y stos son mutuamente e"cluyentes 2si es cara, no puede ser cruz y
viceversa3 Se acostumbra asignar + a la probabilidad de ocurrencia de uno de los eventos,
digamos cara, y $ a la probabilidad de ocurrencia del otro evento, cruz %n este caso, si la
moneda no est cargada, entonces, + R BND y $ R BND (omo los eventos son e"haustivos y
mutuamente e"cluyentes, sus probabilidades deben ser iguales a B +or consiguiente,
+ Y $ R BFF c#ando dos e3entos son e8Ha#sti3os y m#t#amente
e8cl#yentes
La $eFla del -$od#cto
.s como la regla de la suma proporciona la probabilidad de que ocurra cualquiera de
varios eventos, la regla del producto analiza la ocurrencia con)unta o sucesiva de varios eventos
7bserve que la regla del producto analiza con frecuencia lo que ocurre en ms de un lanzamiento
o e"tracci#n, mientras que la regla de la suma estudia s#lo uno de dichos lanzamientos o
e"tracciones Si nos interesa la ocurrencia con)unta o sucesiva de dos eventos . y ?, la regla del
producto establece lo siguiente-
La -$o+a+ilidad de oc#$$encia de ! y ? es iF#al a la -$o+a+ilidad de
oc#$$encia de ! -o$ la -$o+a+ilidad de oc#$$encia de ?0 dado K#e !
Ha oc#$$ido4
%n forma de ecuaci#n, la regla del producto es
7bserve que el smbolo p 2?s.3 se lee como ;la probabilidad de que ocurra ? dado que . ha
ocurrido; %sto no significa ? dividido entre . 7bserve tambin que la regla del producto se
refiere a la ocurrencia de . y ?, mientras que la regla de la suma se aplica a la ocurrencia de .
o ?
.l analizar la regla del producto, es *til distinguir tres condiciones- cuando los eventos son
mutuamente e"cluyentes, cuando los eventos son independientes y cuando los eventos son
dependientes
ReFla del -$od#ctoB e3entos m#t#amente e8cl#yentes4 >a hemos analizado la ocuI
rrencia con)unta de . y ? cuando . y ? son mutuamente e"cluyentes 'ecordar que si . y ?
son mutuamente e"cluyentes, ya que cuando los eventos son mutuamente e"cluyentes, la
ocurrencia de uno impide la ocurrencia del otro La probabilidad de su ocurrencia con)unta es
cero
M#est$eo !leato$io y *$o+a+ilidad - 95 -
p 2. y ?3 R @ $eFla del -$od#cto -a$a e3entos m#t#amente e8cl#yentes
ReFla del -$od#ctoB e3entos inde-endientes +ara comprenderla forma apropiada de aplicar
la regla del producto en esta situaci#n, tenemos que definir primero qu son los eventos
independientes
Dos e3entos son inde-endientes si la oc#$$encia de #n e3ento no tiene
efecto alF#no so+$e la -$o+a+ilidad de oc#$$encia del ot$o4
%l muestreo con reemplazo ilustra muy bien esta situaci#n +or e)emplo, suponga que
vamos a e"traer con reemplazo dos cartas, una a la vez, de una bara)a ordinaria Llamaremos .
la carta e"trada primero y ? a la carta obtenida en segundo lugar %n vista de que . es
reintegrada al mazo de cartas antes de e"traer ?, la ocurrencia de . en la primera e"tracci#n
no tiene efecto alguno sobre la probabilidad de ocurrencia de ? +or e)emplo, si . fue un as, por
el hecho de que fue reintegrado a la bara)a antes de e"traer la segunda carta, la ocurrencia de un
as en la primera e"tracci#n no tiene efecto alguno sobre la probabilidad de la ocurrencia de la
carta elegida en la segunda e"tracci#n Si . y ? son independientes, entonces la probabilidad de
? no resulta afectada por . +or lo tanto, p 2? s.3 R p 2?3 %n este tipo de situaciones, la regla
del producto se convierte en
Jeamos c#mo se emplea esta ecuaci#n Suponga que vamos a e"traer al azar dos cartas con
reemplazo, una a la vez, de una bara)a ordinaria (ul es la probabilidad de que ambas cartas
sean ases?
La soluci#n se ilustra en la figura GA (omo quiera que el problema requiere la presencia de
un as en la primera y la segunda e"tracciones, resulta apropiado aplicar la regla del producto
Supongamos que . es un as en la primera e"tracci#n y ? es un as en la segunda (omo el
muestreo es con reemplazo, . y ? son independientes .s, p2un as en la primera e"tracci#n y un
as en la segunda e"tracci#n3 R p2un as en la primera e"tracci#n3, p2un as en la segunda
e"tracci#n3 +uesto que e"isten cuatro ases posibles en la primera e"tracci#n, cuatro ases
posibles en la segunda e"tracci#n 2el muestreo se realiza con reemplazo3 y hay ED cartas en la
bara)a, entonces p2un as en la primera e"tracci#n3 R CNED y
p2un as en la segunda e"tracci#n3
R CNED +or consiguiente, p2un as en la primera e"tracci#n y un as en la segunda e"tracci#n3 R
CNED\ CNED R BMNDOFC R FFFEP
Jeamos algunos problemas en plan de prctica
M#est$eo !leato$io y *$o+a+ilidad - 99 -
Suponga que lanzamos una sola vez un par de dados no cargados (ul es la probabilidad
de obtener un D en el primer dado y un C en el segundo?
SOLUCIN
La soluci#n aparece en la figura acompa&ante (omo quiera que los dados son independientes
entre s y en vista de que el problema requiere un D y un C, podemos aplicar la regla del producto
para eventos independientes .s, p 2un D en el primer dado y un C en el segundo3 R p2un D en el
dado B3 p2un C en el dado D3 %"iste una forma de obtener un D en el primer dado, una de conseguir
un C en el segundo dado y seis resultados posibles para cada dado +or lo tanto, p2un D en el
primer dado3 R BNM, p2un C en el dado D3 RBNM, y p2un D en el dado B y un C en el dado D3 R
BNM2BNM3 R BNAM F FFDOG
Si se lanzan dos monedas una sola vez, cul es la probabilidad de que ambas cai gan con
la cara hacia arriba? Suponga que las monedas no estn cargadas y que una cara o una cruz
es el *nico resultado posible para cada moneda
M#est$eo !leato$io y *$o+a+ilidad - 9; -
SOLUCIN
La soluci#n aparece en la figura acompa&ante (omo el resultado para la primera moneda no
tiene efecto alguno sobre el resultado de la segunda, los eventos son independientes %n vista de
que en el problema se requiere una cara con la primera moneda y una cara con la segunda
moneda, podemos aplicar la regla del producto con eventos independientes .s, p2una cara en la
primera moneda y una cara en la segunda moneda3 R p2una cara en la primera moneda3 p2una
cara en la segunda moneda3 (omo s#lo e"iste una forma de obtener una cara con cada moneda y
hay dos posibilidades en cada moneda 2cara o cruz3, p2una cara en la primera moneda3 R BND y
p2una cara en la segunda moneda3 R BND +or lo tanto, p2una cara en la primera moneda y una
cara en la segunda moneda3 R BND2BND3 R BNCR FDEFF
Suponga que usted e"trae una muestra aleatoria de una bolsa de frutas La bolsa contiene
cuatro manzanas, seis naran)as y cinco duraznos Si selecciona dos frutas, una a la vez, con
reemplazo, cul es la probabilidad de que obtenga una naran)a y una manzana, en ese orden?
SOLUCIN
La soluci#n aparece en la figura acompa&ante (omo las e"tracciones son independientes
entre s 2el muestreo es con reemplazo3 y como queremos obtener una naran)a y una manzana,
aplicamos la regla del producto con eventos independientes .s, p 2una naran)a en la primera
e"tracci#n y una manzana en la segunda e"tracci#n3 R p2una naran)a en la primera e"tracci#n3
p2una manzana en la segunda e"tracci#n3 (omo e"isten M naran)as y BE frutas en la bolsa,
p2una naran)a en la primera e"tracci#n3 R MNBE +uesto que la fruta obtenida en la primera
selecci#n se reemplaza antes de e"traer la segunda, no tiene efecto alguno sobre la fruta elegida
en la segunda e"tracci#n (omo hay C manzanas y BE frutas, p2una manzana en la segunda
e"tracci#n3 CNBE +or lo tanto p2una naran)a en la primera e"tracci#n y una manzana en la
segunda e"tracci#n3 R MNBE2CNBE3 R FBFMO
M#est$eo !leato$io y *$o+a+ilidad - 9= -
Suponga que usted e"trae al azar D individuos de una poblaci#n de BBF hombres y mu)eres
4ay EF varones y MF mu)eres en esa poblaci#n %l muestreo es de un individuo a la vez, con
reemplazo (ul es la probabilidad de que la muestra contenga s#lo mu)eres?
SOLUCIN
La soluci#n aparece en la figura acompa&ante (omo el problema requiere una mu)er en
la primera e"tracci#n y una mu)er en la segunda e"tracci#n, y como estos dos eventos son
independientes 2el muestreo es con reemplazo3, aplicamos la regla del producto con eventos
independientes .s, puna mu)er en la primera e"tracci#n y una mu)er en la segunda
e"tracci#n3 R p2una mu)er en la primera e"tracci#n3 p2una mu)er en la segunda e"tracci#n3
(omo hay MF mu)eres y BBF personas en la poblaci#n, p2una mu)er en la primera e"tracci#n3 R
MFNBBF , y p2una mu)er en la segunda e"tracci#n3 R MFNBBF +or lo tanto, p2una mu)er en la
primera e"tracci#n y una mu)er en la segunda e"tracci#n3 R i
MFNBBF 2MFNBBF3 R AMFFNBDBFF R FDPOE
M#est$eo !leato$io y *$o+a+ilidad - ;@ -
La regla del producto para eventos independientes tambin se aplica en situaciones con ms
de dos eventos %n tales casos, la probabilidad de la ocurrencia con)unta de los eventos es igual al
producto de las probabilidades individuales de cada evento %n forma de ecuaci#n-
+ara mostrar el uso de esta ecuaci#n, suponga que en vez de obtener una muestra de D
individuos pertenecientes a la poblaci#n descrita en el problema de prctica GO, se e"trae una
muestra de C personas Salvo esta *ltima condici#n, el problema es el mismo La poblaci#n est
compuesta por EF hombres y MF mu)eres (omo antes, el muestreo es de una persona a la vez, con
reemplazo (ul es la probabilidad de obtener A mu)eres y B hombre, en ese mismo orden? La
soluci#n aparece en la figura GC (omo el problema requiere una mu)er en la primera y segunda y
tercera e"tracciones, y un hombre en la cuarta e"tracci#n, y como el muestreo es con reemplazo,
aplicamos la regla del producto para ms de dos eventos independientes %sta regla es similar a la
del producto para dos eventos independientes, s#lo que tiene ms factores .s, p2una mu)er en la
primera e"tracci#n y una mu)er en la segunda e"tracci#n, una mu)er en la tercera e"tracci#n y
un hombre en la cuarta e"tracci#n3 R p2una mu)er en la primera e"tracci#n3 p2una mu)er en la
segunda e"tracci#n3 p2una mu)er en la tercera e"tracci#n3p2un hombre en la cuarta e"tracci#n3
4ay MF mu)eres, EF hombres y BBF personas en la poblaci#n (omo el muestreo es con reemplazo,
p2una mu)er en la primera e"tracci#n3 R MFNBBF , p2una mu)er en la segunda e"tracci#n3 R
MFNBBF p2una mu)er en la tercera e"tracci#n3 R MFNBBF , y p2un hombre en la cuarta
e"tracci#n3 R EFNBBF as_, p2 una mu)er en la primara e"tracci#n y una mu)er en la segunda
e"tracci#n y una mu)er en la tercera e"tracci#n y un hombre en la cuarte e"tracci#n3 R MFNBBF \
MFNBBF \ MFNBBF\ EFNBBF R BFGFNBCMCB R FFOAG
ReFla del -$od#ctoB 3entos De-endientes cuando . y ? son dependientes, la
probabilidad de que ocurra ? resulta afectada por la ocurrencia de . %n este caso, no podemos
simplificar la ecuaci#n para probabilidad de . y ? 0enemos que utilizarla en su forma original
+or consiguiente, si . y b son dependientes,
+2. y ?3 R p2.3p2?s.3 $eFla del -$od#cto de e3entos de-endientes
%l muestreo sin reemplazo proporciona una buena ilustraci#n de los eventos dependientes
M#est$eo !leato$io y *$o+a+ilidad - ;1 -
Supongamos que usted va a e"traer dos cartas, una a la vez, sin reemplazo, de un mazo de
bara)as ordinarias (ul es la probabilidad de que ambas cartas sean ases?
La soluci#n se presenta en la figura GE (onvengamos en que . representa un as en la
primera e"tracci#n y 8 representa un as en la segunda e"tracci#n (omo el muestreo se realiza
sin reemplazo 2la carta obtenida en la primera e"tracci#n es retirada de la bara)a3, la ocurrencia de
A realmente afecta la probabilidad de 8. A y 8 son dependientes entre s (omo el problema
requiere un as en la primera e"tracci#n y un as en la segunda, y como estos eventos son
dependientes, aplicamos la regla del producto para eventos dependientes .s, p2un as en la
primera e"tracci#n y un as en la segunda e"tracci#n3 R p2un as en la primera e"tracci#n3p2un as
en la segunda e"tracci#n, en virtud de que se obtuvo un as en la primera e"tracci#n3 +ara la
primera e"tracci#n, hay C ases y ED cartas +or lo tanto, p2un as en la primera e"tracci#n3 RCNED
%n virtud de que el muestreo se realiza sin reemplazo,p2un as en la segunda e"tracci#n despus
de haber obtenido un as en la primera e"tracci#n3 RANEB .s, pues, p2un as en la primera
e"tracci#n y un as en la segunda e"tracci#n3 R CNED2ANEB3 R BDNDMED R FFFCE
Suponga que e"trae al azar dos frutas, una a la vez, de la misma bolsa descrita en el
problema de prctica GM (omo antes, dicha bolsa contiene cuatro manzanas, seis naran)as y cinco
duraznos Sin embargo, esta vez obtendr la muestra sin reemplazo (ul es la probabilidad de
obtener una naran)a y una manzana, en ese orden?
SOLUCIN
La soluci#n aparece en la figura acompa&ante (omo el problema requiere una naran)a y
una manzana, y como el muestreo se realiza sin reemplazo, aplicamos la regla del producto para
eventos dependientes .s_, p2una naran)a en la primera e"tracci#n y una manzana en la segunda
e"tracci#n3 R p2una naran)a en la primera e"tracci#n3p2una manzana en la segunda e"tracci#n
despus de haber obtenido una naran)a en la primera e"tracci#n3 %n la primera e"tracci#n hay
M#est$eo !leato$io y *$o+a+ilidad - ;% -
M naran)as y BE frutas +or lo tanto, p2una naran)a en la primera e"tracci#n3 R MNBE %n virtud
de que el muestreo se realiza sin reemplazo,p2una manzana en la segunda e"tracci#n despus
de haber obtenido una naran)a en la primera e"tracci#n3 R CNBC +or lo tanto, p2una naran)a en
la primera e"tracci#n y una manzana en la segunda e"tracci#n3 R MNBE 2CNBC3 R DCNDBF R FBBCA
0al como ocurre con la regla del producto para eventos independientes, la regla del producto
para eventos dependientes se aplica tambin a situaciones en las que intervienen ms de dos
eventos %n esos casos, la ecuaci#n adopta la forma siguiente-
*$o+a+ilidad y 3a$ia+les contin#as con dist$i+#ci&n no$mal
4asta este punto, en nuestro anlisis de la probabilidad hemos considerado variables discretas,
por e)emplo, el muestreo a partir de una bara)a de cartas o el lanzamiento de un par de dados
Sin embargo muchas de las variables dependientes que es necesario evaluar en los e"perimentos
son continuas, no discretas (uando una variable es continua
%n virtud de que con frecuencia 2aunque no siempre3 estas variables estn distribuidas de
manera normal, concentraremos nuestro anlisis en las variables continuas con distribuci#n
normal
+ara ilustrar el uso de la probabilidad con variables continuas que tienen una distribuci#n
normal, suponga que hemos determinado los pesos de todas las mu)eres inscritas en el cuarto
semestre de la universidad en la que usted estudia Hmaginemos que se trata de un con)unto de
datos pertenecientes a una poblaci#n cuya distribuci#n es normal, con una media de BDF libras y
una desviaci#n estndar de G libras Si elegimos al azar un dato de esta poblaci#n, cul es la
probabilidad de que el dato seleccionado sea igual o mayor que BAC?
La poblaci#n se muestra en la figura GG La media de BDF y el dato BAC se localizan sobre el e)e
1 %l rea sombreada representa a todos los datos mayores o iguales a BAC (omo el muestreo es
aleatorio, todos los datos tienen la misma posibilidad de ser seleccionados .s, la probabilidad de
obtener un dato igual o mayor que BAC se determina calculando la proporci#n del total de datos
contenidos en el rea sombreada +uesto que los datos estn distribuidos de forma normal,
podemos determinar esta proporci#n convirtiendo el dato en bruto en su valor z transformado,
para luego buscar el rea en la tabla . del apndice , .s, pues,
M#est$eo !leato$io y *$o+a+ilidad - ;' -
,e la columna ( de la tabla .,
%stamos seguros de que el lector reconocer que este tipo de problema es similar a los que
presentamos en el captulo E, cuando estudiamos los punta)es estandarizados La diferencia
principal es que, en este captulo, el problema se formula en trminos de probabilidad y no en
trminos de la proporci#n o el porcenta)e de los datos, como fue planteado en el captulo E (omo
quiera que el lector ya se ha familiarizado con problemas de esta ndole, no creemos que sea
necesario presentar muchos problemas de prctica Sin embargo, solucionaremos un par de ellos
s#lo para estar seguros (onsideremos la misma poblaci#n de mu)eres universitarias que
estudian el cuarto semestre Si se elige un dato aleatoriamente de la poblaci#n, cul es la
probabilidad de que ste sea igual o menor que BBF?
SOLUCIN
La soluci#n se muestra en la figura acompa&ante %l rea sombreada representa todos los
datos que son iguales o menores que BBF +or el hecho de que el muestreo es aleatorio, todos los
datos tienen la misma posibilidad de ser elegidos +ara determinar p 21 k BBF3 debemos
transformar primero el dato en bruto de BBF en su punta)e z . continuaci#n, podemos calcular
la proporci#n de datos contenidos en el rea sombreada, con ayuda de la tabla . .s
Dist$i+#ciones de *$o+a+ilidad - ;( -
Dist$i+#ciones de -$o+a+ilidad
La 0abla AB muestra, para el %stado de <eorgia, la proporci#n, por grupos de edades,
de todos los criminales convictos durante el a&o fiscal de BPOB y sometidos a
custodia de la 5unta %statal de (orrecci#n %n el (aptulo B aprendimos que una
tabla de este tipo es una distribuci#n de frecuencia relativa y en el (aptulo D nos
enteramos de que la probabilidad de un evento se puede interpretar como la
frecuencia relativa de sus ocurrencias %n consecuencia, nos podemos referir a la 0abla
AB como una distribuci"n de probabilidad, materia de estudio del presente captulo
0ablas como la AB se pueden encontrar frecuentemente en los informes anuales de
las agencias gubernamentales La informaci#n tiene gran inters para una gran variedad
de personas, como soci#logos, legisladores Iy traba)adores sociales adems del que
tiene para los empleados y profesionales de la agencia que prepara el informe anual
%n el presente captulo nos basaremos en lo que se aprendi# sobre al inicio del curso, que
nos hizo comprender me)or c#mo es posible sacar conclusiones sobre una poblaci#n,
e"aminando los datos de una muestra que se e"trae de ella Jamos a estudiar primero
la construcci#n de distribuciones empricas de probabilidad y, luego, algunas
distribuciones especiales de probabilidad, con variables aleatorias discretas y
continuas
Supongamos ahora que tenemos una muestra mucho ms grande de valores 1 (omo
nuestra variable aleatoria es continua, podemos hacer mediciones con cualquier n*mero de
puntos decimales +or lo tanto, al construir un histograma para esta gran muestra de
observaciones, podemos hacer nuestros intervalos de clase tan peque&os como queramos !n
histograma de frecuencia relativa construido con una muestra muy grande de valores de 1
sera seme)ante a la =igura AC si se usan intervalos de clase muy peque&os
,e esta manera vemos que a medida que crece el n*mero de observaciones y a medida que
disminuyen las amplitudes de los intervalos de clase, el histograma se aseme)a cada vez ms a una
curva suave como la que aparece en la =igura AE +arece entonces razonable suponer que el
rea entre "
a
' "
b
de la =igura AC es casi igual al rea entre "
a
'
4b
de la =igura AE
La distribuci#n de una probabilidad continua siempre se representa grficamente mediante
una curva suave %l rea comprendida ba)o de la curva, por encima del e)e horizontal y entre las
perpendiculares que se levantan sobre los dos puntos a y b es igual a la probabilidad de que la
variable aleatoria asuma los valores comprendidos entre los dos puntos
7bsrvese que este anlisis ha perseguido el prop#sito de determinar la probabilidad
comprendida en un intervalo La raz#n de esto es que, para una variable continua, !> 4 5 x& 5
F %s decir, la probabilidad de que 4 asuma un valor especfico es igual a F (onsideremos una
curva suave dibu)ada que represente una distribuci#n de probabilidad continua Se puede ver
Dist$i+#ciones de *$o+a+ilidad - =9 -
que el rea que queda encima de un punto es igual a F
(uando se trata de histogramas hechos a partir de datos de una muestra, calculamos el
rea comprendida ba)o el histograma y entre dos puntos, cada uno de los cuales est incluido en
alg*n lmite de clase, sumando las reas representadas por las celdas adyacentes del histograma
+or e)emplo, si deseamos hallar el rea entre "
a
' x
b
del histograma de la =igura AA, sumamos las
reas de las tres celdas que se encuentran entre "
a
G
"
b