Anda di halaman 1dari 139

La estadistica y el mtodo cientfico - 1 -

La estadstica y el mtodo cientfico


INTRODUCCIN
Se ha preguntado usted alguna vez en qu forma se llega a conocer la verdad? La
mayora de los estudiantes universitarios estara de acuerdo en que el descubrimiento de lo
verdadero, ya sea en el mundo, en nosotros mismos o en los dems, constituye una
actividad muy importante !n poco de refle"i#n nos revela que dedicamos gran parte del
tiempo a esa tarea Si estudiamos geografa $ueremos saber lo que es verdadero acerca de
las caractersticas geogrficas de una regi#n en particular %s la regi#n monta&osa o plana,
agrcola o industrial? Si nos interesa el estudio de la naturaleza humana, queremos saber lo
que es verdadero acerca de los humanos 'ealmente poseemos una naturaleza espiritual o
en verdad somos reducibles a simples tomos y molculas como afirmaran los
reduccionistas? (#mo piensan los humanos? $u ocurre en el cuerpo para que se produzca
una sensaci#n o un movimiento? (uando siento eno)o, es cierto que e"iste un patr#n
fisiol#gico subyacente *nico? (ul es ese patr#n? Ser profesor es mi verdadero prop#sito en
la vida? %s cierto que los animales piensan? +odramos continuar citando de manera
indefinida este tipo de e)emplos en virtud de que gran parte de la vida la transcurrimos en la
b*squeda y el hallazgo de la verdad
MTODOS D !D"UISICIN DL CONOCIMINTO
,esde un punto de vista hist#rico, la humanidad ha empleado cuatro mtodos para
adquirir conocimiento- la autoridad, el racionalismo, la intuici#n y el mtodo cientfico
!#to$idad (uando se utiliza el mtodo basado en la autoridad, algo se considera
verdadero por el solo hecho de que una tradici#n o alguna persona eminente afirma que lo es
.s, podemos creer en la teora de la evoluci#n porque nuestros ilustres profesores nos dicen
que es verdadera, o bien, creer que ,ios e"iste porque as lo afirman nuestros padres .unque
este mtodo de conocimiento tiene poca aceptaci#n en la actualidad y a veces conduce a
errores, es indispensable en la vida cotidiana Simplemente aceptamos una gran cantidad de
informaci#n como cierta con base en una autoridad, aunque s#lo sea porque no tenemos ni el
tiempo ni la pericia que se requieren para comprobarlo de primera mano +or e)emplo, yo creo,
tomando como base lo que dicen los e"pertos en fsica, que los electrones e"isten, pero nunca
he visto ninguno/ o, para hablar de algo ms cercano, si el )efe de ciruga me e"plica que el
cigarrillo provoca cncer, de)ar de fumar porque tengo fe en lo que el mdico me dice y porque
no dispongo ni de los medios ni del tiempo necesarios para investigar el tema por m mismo
Racionalismo %ste mtodo utiliza e"clusivamente el razonamiento para llegar al
conocimiento Supone que si las premisas son vlidas y el razonamiento se realiza de manera
correcta, seg*n las reglas de la l#gica, entonces las conclusiones tienen que ser la verdad
%stamos muy familiarizados con el proceso de razonar porque lo utilizamos mucho +or
e)emplo, consideremos el siguiente silogismo-
0odos los profesores de estadstica son personas interesantes %l se&or 1 es profesor de
estadstica +or lo tanto, el se&or 1 es una persona interesante
Si la primera afirmaci#n es cierta 2eso quin lo dudara?3 y si la segunda afirmaci#n es
verdadera, entonces la conclusi#n tambin debe ser verdadera 4ablando en serio, es di fcil
que alguien cuestione la importancia del proceso de razonamiento para encontrar la verdad
Sin embargo, e"iste un gran n*mero de situaciones en que, por s solo, el razonamiento es
inadecuado para encontrarla
+or e)emplo, supongamos que usted observa que 5uan, un amigo suyo, ha estado
deprimido desde hace algunos meses (omo estudiante de psicologa, usted sabe que los
problemas psicol#gicos pueden causar depresi#n +or lo tanto, es razonable pensar que 5uan
pueda tener problemas psicol#gicos que le ocasionan esa depresi#n +or otro lado, tambin
La estadistica y el mtodo cientfico - % -
sabe que sta puede ser provocada por una dieta inadecuada 6sta es otra causa posible del
problema %n este caso, e"isten dos e"plicaciones l#gicas razonables para el fen#meno +or lo
tanto, por s sola la raz#n resulta inadecuada para distinguir entre ellas %ntonces tenemos
que recurrir a la e"periencia %n verdad es deficiente la dieta de 5uan? %l me)oramiento de
sus hbitos alimenticios corregira la situaci#n? 7 bien, tiene en realidad 5uan problemas
psicol#gicos serios, y el tratamiento adecuado podra aliviar su depresi#n? ,e esta manera
comprobamos que la raz#n pura puede ser suficiente para arro)ar luz en algunos casos,
pero que es claramente inadecuada en otros
(omo veremos, el mtodo cientfico tambin utiliza la raz#n para llegar a la verdad,
pero el razonamiento puro es s#lo una parte del proceso .s, el mtodo cientfico
incorpora la raz#n, pero no es un sin#nimo de sta
Int#ici&n %l conocimiento se adquiere tambin a travs de la intuici#n (on sta
nos referimos a esa inspiraci#n s*bita, esa idea que aclara y salta a la conciencia como un
todo 8o se llega a ella por medio de la raz#n +or el contrario, con frecuencia la idea
parece surgir despus que ha fallado el razonamiento consciente . continuaci#n
presentaremos un par de e)emplos-
4e aqu el relato del propio 9etchni:off acerca de cul fue el origen de la idea de la
fagocitosis- ;!n da, cuando toda mi familia haba ido al circo para ver la notable actuaci#n de unos
simios, me qued solo en casa, con mi microscopio, y me puse a observar la vida en las clulas
m#viles de una larva transparente de un pez, cuando una nueva idea brill# s*bitamente en mi
cerebro 9e pareci# de pronto que unas clulas similares podran intervenir en la defensa del
organismo contra los intrusos .l sentir que haba algo muy interesante en este asunto, me sent
tan e"citado que comenc a andar a grandes zancadas por todo el cuarto, de un lado a otro, e
incluso fui a la playa para ordenar mis ideas; 4adamard cita una e"periencia del matemtico
<auss, quien escribi# acerca de un problema que haba tratado infructuosamente de resolver a lo
largo de varios a&os- ;=inalmente, hace dos das, tuve "ito (omo un relmpago, el acerti)o
empez# a resolverse >o no podra decir cul fue el hilo conductor que me llev# desde lo que saba
con anterioridad hasta aquello que hizo posible el "ito;
%s interesante observar que con frecuencia la idea intuitiva surge despus que el
razonamiento consciente ha fracasado y cuando el individuo ha de)ado de lado el
problema durante un tiempo .s, ?everidge cita a dos cientficos en los siguientes
trminos-
,espe)ando de mi mente todas las ideas que tena acerca del problema, camin
vigorosamente por la calle cuando de pronto, en cierto punto que a*n podra localizar, como si
viniera del cielo hacia m, una idea surgi# en mi cabeza como si una voz me la di)era a gritos
,ecid abandonar el traba)o y todas las ideas acerca de l y entonces, al da siguiente,
cuando estaba ocupado en una tarea de otra ndole, una idea lleg# a mi mente como un
relmpago, y sa era la soluci#n su sencillez misma me hizo cavilar por qu no se me haba
ocurrido pensar en ella antes
. pesar del hecho de que la intuici#n ha sido utilizada como fuente de conocimiento
durante toda la e"istencia de la humanidad, sigue siendo un proceso misterioso acerca
del cual s#lo tenemos una comprensi#n muy rudimentaria
Mtodo cientfico .unque el mtodo cientfico utiliza el razonamiento y la intuici#n
para llegar a la verdad, se fundamenta en una evaluaci#n ob)etiva que lo distingue de los
otros mtodos %l experimento cientfico se encuentra en el centro de la ciencia %l mtodo
de la ciencia es bastante directo +or alg*n medio, generalmente un razonamiento deductivo
a partir de la teora e"istente o una inducci#n a partir de hechos reales o a travs de la
intuici#n, el cientfico llega a una hip#tesis sobre cierta particularidad de la realidad
%ntonces, el investigador dise&a un e"perimento para verificar la hip#tesis de manera
La estadistica y el mtodo cientfico - ' -
ob)etiva +osteriormente, los datos obtenidos como resultado del e"perimento se analizan
en forma estadstica y la hip#tesis es aceptada o rechazada La caracterstica ms
importante de esta metodologa es que no importa lo que el cientfico crea que es
verdadero con respecto a la hip#tesis en cuesti#n, pues el e"perimento proporciona una base
para realizar una evaluaci#n objetiva de dicha hip#tesis Los datos del e"perimento obligan a
e"traer una conclusi#n acorde con la realidad, .s, la metodologa cientfica trae un
;salvavidas integrado; para garantizar que las afirmaciones de veracidad de cualquier tipo,
sobre la realidad, se a)usten a la veracidad demostrada con respecto a los fen#menos
estudiados, antes que las afirmaciones reciban la categora de verdades cientficas
!n aspecto importante de esta metodologa es que los datos demostrarn si el
investigador ha mantenido ideas err#neas o no con respecto al ob)eto de estudio %sas ideas
pueden contrastarse entonces con los datos y son verificadas de nuevo La metodologa
cientfica, aunque a veces es muy lenta, posee una caracterstica de autocorrecci#n que, a
largo plazo, tiene una alta probabilidad de llegar a la verdad (omo en este te"to se hace
nfasis en el anlisis estadstico y no en el dise&o e"perimental, no podemos dedicar mucho
tiempo al anlisis del dise&o de los e"perimentos Sin embargo, estudiaremos algunos dise&os
e"perimentales, en virtud de que estn ntimamente relacionados con el anlisis estadstico
La estadistica y el mtodo cientfico - ( -
D)INICIONS
.l analizar ste y otros materiales del libro, utilizaremos ciertos trminos tcnicos
+resentamos a continuaci#n estos trminos y sus definiciones-
*o+laci&n (on)unto completo de individuos, ob)etos o datos que el investigador est
interesado en estudiar %n un e"perimento, la poblaci#n es el grupo ms grande de individuos
del cual se pueden tomar los su)etos que participarn en dicho e"perimento
M#est$a Subcon)unto de la poblaci#n %n un e"perimento, por razones econ#micas,
lo usual es que el investigador re*na los datos acerca de un grupo de su)etos de menor
tama&o que la poblaci#n total %se grupo menor es la muestra
,a$ia+le Cualquier propiedad o caracterstica de algn evento, objeto o persona, que
puede tener diversos valores en diferentes instantes, segn las condiciones. La estatura, el
peso, el tiempo de reacci#n y la dosis de un medicamento son e)emplos de variables !na
variable debe contrastarse con una constante, la cual, por supuesto, no asume diversos
valores en diferentes instantes !n e)emplo de una constante es el smbolo matemtico @/
siempre tiene el mismo valor 2ABC si se e"presa con una precisi#n de dos cifras decimales3
,a$ia+le inde-endiente La variable independiente de un experimento es aquella que es
controlada en forma sistemtica por el investigador. %n la mayor parte de los e"perimentos, el
cientfico est interesado en determinar el efecto que produce una variable, digamos, la variable
., sobre una o ms variables +ara esto, el e"perimentador controla los niveles de la variable
. y mide el efecto que produce sobre las dems variables, . la variable A se le llama
independiente debido a que sus niveles son controlados por el investigador, sin importar los
cambios que puedan ocurrir en las dems variables +or e)emplo, un cientfico podra estar
interesado en el efecto del alcohol sobre el comportamiento social +ara investigar esto es
probable que el e"perimentador vaya modificando la cantidad de alcohol que suministra a
varias personas y mida sus consecuencias sobre la conducta social de stas La cantidad de
alcohol suministrada es la variable independiente %n otro e"perimento se estudia el efecto
de la privaci#n del sue&o con respecto al comportamiento agresivo . los su)etos de dicho
e"perimento se les priva de distintas horas de sue&o y se observan las consecuencias
resultantes en relaci#n con la agresividad %n este caso, se controla la magnitud de la
privaci#n del sue&o +or lo tanto, sta es la variable independiente
,a$ia+le de-endiente La variable dependiente en un e"perimento es la que el
investigador mide para determinar el efecto de la variable independiente +or e)emplo,
en el e"perimento que estudia los efectos del alcohol sobre el comportamiento social, la
cantidad de alcohol es la variable independiente %l comportamiento social de los su)etos se
mide para ver si resulta afectado por la cantidad de alcohol consumida .s, el
comportamiento social es la variable dependiente Se le llama dependi ente porque depende
de la cantidad de alcohol consumida %n la investigaci#n sobre la privaci#n del sue&o y el
comportamiento agresivo, se controla la cantidad de privaci#n del sue&o, y se mide el
comportamiento agresivo de los su)etos La magnitud de la privaci#n del sue&o es la variable
independiente y el comportamiento agresivo es la variable dependiente
Datos 9edidas que se realizan sobre los su)etos de un e"perimento +or lo
general, los datos consisten en las medidas de la variable dependiente o de otras caractersticas
del su)eto, como la edad, el se"o, el n*mero de individuos, etctera Los datos, en la forma
original en que son medidos, se conocen como datos brutos, en bruto u originales
stadstica 8*mero calculado a partir de los datos de la muestra, que cuantifica
una caracterstica de dicha muestra .s, el promedio de un con)unto de datos obtenidos a
partir de la muestra sera una estadstica
*a$.met$o 8*mero calculado sobre los datos de una poblaci#n que cuantifica
La estadistica y el mtodo cientfico - / -
una caracterstica de dicha poblaci#n +or e)emplo, el valor promedio de un con)unto de
datos poblacionales se llama parmetro (onviene observar que una estadstica y un
parmetro son conceptos muy similares La *nica diferencia es que la estadstica se calcula
sobre una muestra y el parmetro se calcula con respecto a una poblaci#n
!n e)emplo general- modo de presentaci#n y retenci#n
(onsideraremos ahora un e"perimento ilustrativo en el cual aplicaremos los trminos
que hemos analizado anteriormente
!n profesor lleva a cabo un e"perimento para determinar si el modo de
presentaci#n influye en el grado en que se recuerda un material +ara este
e"perimento, el investigador utiliza varios pasa)es en prosa que se presentan en
forma visual u oral Se elige a cincuenta estudiantes entre los asistentes a la
universidad en la cual traba)a ese maestro Los estudiantes se dividen en dos grupos
de DE individuos cada uno %l primer grupo recibe una presentaci#n visual de los
pasa)es en prosa y el segundo grupo escucha los pasa)es en una pre sentaci#n oral
.l final de sus respectivas presentaciones, se pide a los su)etos que escriban la
mayor parte del material que sean capaces de recordar Se calcula el promedio de
palabras recordadas por cada grupo y los promedios son comparados para ver si el
modo de presentaci#n tuvo alg*n efecto
%n este e"perimento, la variable independiente es el modo de presentaci#n de los
pasa)es en prosa, es decir, si es oral o visual La variable dependiente es el n*mero de
palabras recordadas La muestra est conformada por los EF estudiantes que participaron en
el e"perimento La poblaci#n es el grupo total de los individuos de los cuales se tom# la
muestra, es decir, todos los estudiantes que asisten a la universidad Los datos son el
n*mero de palabras recordadas por cada estudiante incluido en la muestra %l promedio de
palabras recordadas por cada grupo es una estadstica, pues mide una caracterstica de los
datos de la muestra (omo no se hizo medici#n de ninguna caracterstica de la poblaci#n, no
se calcul# ning*n parmetro en este e"perimento Sin embargo, para ilustrar el concepto,
supongamos que toda la poblaci#n hubiera presenciado una presentaci#n visual de los
pasa)es Si entonces calculramos el n*mero promedio de palabras recordadas por toda la
poblaci#n ese resultado sera un parmetro, pues con l se medira una caracterstica de los
datos correspondientes a toda la poblaci#n 'esolvamos ahora un problema para practicar la
identificaci#n de estos trminos
%specifique usted lo siguiente en el caso del e"perimento que describiremos a
continuaci#n la variable inde-endiente0 la1s2 3a$ia+le1s2 de-endiente1s20 la m#est$a0 la
-o+laci&n4 los datos0 la1s2 estadstica1s2 y el1los2 -a$.met$o1s24
!n profesor de ginecologa, miembro de una prestigiada escuela de medicina, quiere
determinar si un implante de tipo e"perimental para el control de la natalidad tiene efectos
colaterales sobre el peso corporal y la depresi#n en las mu)eres !n grupo de EFFF mu)eres
adultas, residentes de una ciudad cercana, se han ofrecido como voluntarias para el
e"perimento %l ginec#logo elige a BFF de esas mu)eres para que participen en el estudio
(incuenta de las voluntarias son asignadas al grupo B y las otras EF al grupo D, de manera que
los datos sobre el peso corporal promedio y la depresi#n promedio de cada grupo sean iguales
al principio del e"perimento Las condiciones del tratamiento son las mismas para ambos grupos,
e"cepto porque a las mu)eres del grupo B se les realiza el implante del dispositivo e"perimental
para el control natal, mientras que las mu)eres del grupo D reciben un implante placebo %l
peso corporal y el nivel de depresi#n se miden al inicio y al final de la prueba +ara medir la
depresi#n se utiliza un cuestionario estndar/ mientras ms alto sea el punta)e obtenido en
este cuestionario, tanto ms deprimida estar la persona .l final del e"perimento el peso
corporal promedio y los niveles de depresi#n promedio de cada grupo se comparan entre s
para determinar si el implante e"perimental tuvo alg*n efecto sobre estas variables +ara
La estadistica y el mtodo cientfico - 5 -
proteger a las mu)eres contra un embarazo no deseado, durante todo el e"perimento se utiliz#
tambin otro mtodo de control natal que no interfera con el implante
SOLUCIN
Variable independiente: el implante e"perimental para el control natal, versus el
placebo
Variables dependientes: el peso corporal y el nivel de depresi#n uestra: las BFF
mu)eres que participaron en el e"perimento
!oblaci"n: las EFFF mu)eres que se ofrecieron como voluntarias para el e"peri mento
#atos: los datos individuales del peso corporal y de los niveles de depresi#n de las BFF
mu)eres, al inicio y al final del e"perimento
$stadsticas: la media de los pesos corporales del grupo B al inicio y al final del
e"perimento, la media de los niveles de depresi#n del grupo al inicio y al final de la prueba,
ms las mismas cuatro estadsticas correspondientes al grupo D
!armetro: no se dieron ni se calcularon parmetros para este e"perimento Si el
ginec#logo hubiera medido los pesos corporales de las EFFF voluntarias al inicio de la prueba, la
media de esos EFFF pesos habra sido un parmetro
IN,STIC!CION CINT6)IC! 7 ST!D6STIC!
La investigaci#n cientfica se puede clasificar en dos categoras- los estudios
observacionales y los e"perimentos reales Las tcnicas estadsticas son importantes en
ambos tipos de investigaciones
st#dios o+se$3acionales %n este tipo de investigaci#n, ninguna variable es controlada en
forma activa por el investigador ,entro de esta categora de investigaci#n figuran- 12 la
o+se$3aci&n nat#$alista0 %2 la estimaci&n de -a$.met$os y '2 los est#dios co$$elacionales
%n la investigaci#n basada en la observaci#n naturalista, uno de los principales ob)etivos
consiste en obtener una descripci#n precisa de la situaci#n que se estudia <ran parte de la
investigaci#n antropol#gica y etiol#gica es de este tipo La investigaci#n de estimaci#n de
parmetros se realiza sobre las muestras para estimar el nivel de una o varias caractersticas
poblacionales 2por e)emplo, el promedio o porcenta)e de una poblaci#n3 Las encuestas de
opini#n p*blica, los escrutinios y gran parte de la investigaci#n de mercado pertenecen a esta
categora %n la investigaci#n correlacional, el e"perimentador se centra en dos o ms variables
para precisar si estn relacionadas unas con otras +or e)emplo, para determinar si la obesidad
y la alta presi#n sangunea estn relacionadas entre s en los adultos mayores de AF a&os !n
investigador tendra que medir el nivel de grasa corporal y la presi#n sangunea de una
muestra de individuos adultos mayores de AF a&os %l e"perimentador analizara a
continuaci#n los resultados para verificar si e"iste alguna relaci#n entre esas variables- es
decir, tendra que comprobar si los individuos con ba)os niveles de grasa tienen tambin ba)a
presi#n sangunea, si en los individuos con niveles moderados de grasa la presi#n sangunea
es moderada, y si aquellos con altos niveles de grasa registran una alta presi#n sangunea
8-e$imentos $eales %n este tipo de investigaci#n se intenta determinar silos cambios
registrados en una variable producen cambios en otra (on este tipo de investigaci#n se
controla una variable independiente y se estudia el efecto que sta causa sobre alguna
variable dependiente Sin embargo, puede haber ms de una variable independiente y
dependiente %n el caso ms sencillo s#lo e"isten una variable independiente y otra
dependiente !n e)emplo de este caso es el e"perimento ya mencionado en el que se intent#
investigar el efecto del alcohol sobre el comportamiento social %n esa prueba, como el lector
recordar el nivel de alcohol fue controlado por el e"perimentador y se midi# su efecto
sobre el comportamiento social
La estadistica y el mtodo cientfico - 9 -
MUSTRO !L!TORIO
%n todas las investigaciones antes descritas, los datos son recopilados, por lo general,
a partir de una muestra de su)etos y no sobre toda la poblaci#n en la cual se pretende aplicar
los resultados Lo ideal, por supuesto sera que el e"perimento se realizara sobre toda la
poblaci#n, pero generalmente eso es demasiado costoso y por eso se considera s#lo una
muestra 7bserve que no cualquier muestra sirve 6sta deber ser una muestra de tipo
aleatorio %l muestreo aleatorio ser analizado en el captulo G +or ahora, basta saber que
este muestreo permite aplicar las leyes de la probabilidad a los datos y, al mismo tiempo,
ayuda a lograr que la muestra sea representativa de la poblaci#n de la cual fue e"trada .s,
los resultados obtenidos a partir de la muestra debern aplicarse tambin a la poblaci#n !na
vez reunidos los datos, stos se analizan en forma estadstica y de ellos se e"traen las
conclusiones adecuadas acerca de la poblaci#n
ST!D6STIC! DSCRI*TI,! IN)RNCI!L
%l anlisis estadstico es el tema principal de este libro Lo hemos dividido en dos reas-
%& estadstica descriptiva ' (& estadstica inferencial. .mbas implican el anlisis de datos Si se
realiza un anlisis con el fin de describir o caracterizar un con)unto de datos que ha sido
reunido, entonces estamos en el rea de la estadstica descriptiva +or e)emplo, suponga que
su profesor de biologa acaba de registrar las calificaciones del grupo ,evuelve los
e"menes y ahora quiere describir los resultados obtenidos 6l podra calcular el promedio de
la distribuci#n para describir su tendencia central. $s probable que tambin quiera
determinar su rango para caracterizar su variabilidad. 0ambin podra representar las
calificaciones en una grfica para mostrar la forma de la distribuci#n (omo todos estos
procedimientos tienen la finalidad de describir o caracterizar los datos ya reunidos,
corresponden al campo de la estadstica descriptiva
+or otro lado, la estadstica inferencial no se refiere a la simple descripci#n de los datos
obtenidos, sino que abarca las tcnicas que nos permiten utilizar los datos muestrales para
inferir o e"traer conclusiones sobre las poblaciones de las cuales fueron obtenidos dichos
datos 6sta es la parte ms comple)a del anlisis estadstico Hmplica la probabilidad y varias
pruebas de inferencia, como la prueba t de Student y el anlisis de varian)a.
+ara ilustrar la diferencia entre la estadstica descriptiva y la inferencial, suponga que
estamos interesados en determinar el (H promedio de todos los estudiantes del primer a&o de
su universidad (omo sera demasiado costoso y tardado medir el (l de cada uno de los
alumnos que forman parte de la poblaci#n, consideraramos el empleo de una muestra
aleatoria de, digamos, DFF estudiantes y les daramos a cada uno una prueba de (H
0endramos entonces DFF calificaciones de (l como muestra, ' queremos que stas nos
sirvan para determinar el (H promedio de la poblaci"n. .unque no podemos determinar el
valor e"acto del promedio de la poblaci#n, podemos estimarlo utilizando los datos de la
muestra )unto con una prueba de inferencia llamada la prueba t de Student Los resultados
nos permitiran hacer afirmaciones tales como- ;0enemos *+, de confianza de que el intervalo
%%+-%(. contiene al (l promedio de la poblaci#n; %n este caso, no s#lo estamos describiendo
las calificaciones obtenidas, como en el caso del e"amen de biologa, sino estamos utilizando
las calificaciones de la muestra para inferir un valor correspondiente a toda la poblaci#n +or lo
tanto, estamos en el campo de la estadstica inferencial .s, la estadstica descriptiva ' la
inferencia& se pueden definir de la siguiente manera-
La estadstica desc$i-ti3a estudia las t/cnicas que se utili)an para describir o caracteri)ar
los datos obtenidos.
La estadstica infe$encia: inclu'e las t/cnicas que emplean los datos obtenidos en la
muestra para, a partir de ellos, 0acer inferencias sobre sus respectivas poblaciones.
USO D L! COM*UT!DOR! N ST!D6STIC!
La estadistica y el mtodo cientfico - ; -
%l uso de las computadoras en la estadstica se increment# en gran medida durante la
*ltima dcada ,e hecho, en la actualidad casi todos los datos de investigaci#n en las
ciencias del comportamiento se analizan mediante programas estadsticos de computadora,
en lugar de hacerlo ;a mano; con una calculadora 6stas son buenas noticias para los
estudiantes, quienes con frecuencia gustan de las ideas, conceptos y resultados de la
estadstica, pero detestan los clculos ;manuales; %l hecho es que los investigadores
tambin odian los clculos y, por lo tanto, casi siempre utilizan una computadora para
analizar los con)untos de datos de tama&o considerable Las computadoras tienen la
venta)a de ahorrar tiempo y esfuerzo, minimizar la posibilidad de errores de clculo, facilitar la
presentaci#n grfica de los datos y proporcionar un me)or mane)o de grandes con)untos de
stos . pesar de su gran utilidad, es frecuente que un curso bsico de estadstica no las
incluya +or lo tanto, he escrito esta edici#n del libro de modo que usted pueda aprender el
contenido estadstico con el material para computadora o sin l
%"isten varios programas de computadora para realizar el anlisis estadstico Los ms
populares son el Statistical +ac:age for the Social Sciences 2S+SS3, ?iomedical (omputer
+rogramsI+ series 2?9,+3, StatistiHcal .nalysis System 2S.S3, S>S0.0, 9H8H0.? y %"cel
%"isten versiones de S+SS, S.S, S>S0.0 y 9H8H0.? para mainframes y microcomputadoras
Jale la pena dedicar cierto tiempo para aprender uno o varios de estos programas +ara los
estudiantes que desean usar el S+SS con este libro de te"to, he incluido e)ercicios para
computadora en el material adicional, que se encuentra disponible en ingls, en-
httpKKKthomsonlearningcomm" %stos e)ercicios son apropiados para usarse con la edici#n
de S+SS para el estudiante
(uando usted comience a resolver problemas con computadoras, creo que empezar a
e"perimentar la diversi#n y el poder de clculo que puede aportar esta mquina a su
estudio de la estadstica ,e hecho, una vez que haya utilizado una computadora para
analizar datos, es probable que se pregunte- +or qu tengo que hacer todos estos clculos
comple)os a mano?; +or desgracia, el uso de una computadora para calcular el valor de una
estadstica no le ayuda a comprenderla La comprensi#n de la estadstica y su me)or uso se
logran a travs de la realizaci#n de clculos a mano +or supuesto, una vez que aprenda todo
lo que pueda a partir de los clculos manuales, el uso de la computadora para obtener
valores estadsticos parecer bastante razonable
L! ST!D6STIC! 7 L <MUNDO R!L<
(omo ya he mencionado, uno de los principales ob)etivos de la estadstica es ayudar en
la evaluaci#n cientfica de ciertas afirmaciones .unque usted puede ver esto como un asunto
esotrico y ale)ado de la vida cotidiana, creo que al terminar de leer este libro estar
convencido de que la comprensi#n de la estadstica tiene importantes aspectos prcticos
para su "ito personal en la vida . medida que lea este te"to, espero que sea cada vez ms
consciente de la frecuencia con la que somos bombardeados en la vida diaria por; autoridades;
que nos dicen, con base en ;afirmaciones ciertas;, lo que debemos hacer, c#mo debemos vivir,
lo que debemos comprar, lo que debemos valorar, etc %n reas de verdadera importancia
para usted, espero que comience a preguntarse cosas como- ;%stn respaldadas estas
afirmaciones por datos?;
I
,L;qu tan confiables son esos datos?;/ ;es el azar una e"plicaci#n
razonable para los datos?; Si no e"isten datos, o si stos se presentan con e"presiones como
;mi e"periencia es que ; en lugar de haber sido obtenidos por medio de e"perimentos bien
controlados, usted comenzar a cuestionarse si debe considerar en serio el conse)o de esa
autoridad
+ara ayudarle a desarrollar el aspecto de la toma de decisiones mediante la estadstica,
al final de ciertos captulos he incluido aplicaciones de la vida cotidiana con el ttulo ;(ul es
la verdad?; +ara comenzar, consideremos el siguiente material
%n este captulo analizamos la forma en que se establece la verdad
0radicionalmente se han utilizado cuatro mtodos- la autoridad, la raz#n, la intuici#n y la
La estadistica y el mtodo cientfico - = -
ciencia %l e"perimento cientfico es el elemento central de la ciencia 9ediante un
razonamiento o por si intuici#n, el investigador crea una hip#tesis acerca di cierta
particularidad de la realidad . continuaci#n, e cientfico dise&a un e"perimento a fin de
probar di manera ob)etiva la hip#tesis Los datos del e"perimento se analizan estadsticamente
y la hip#tesis es confirmada o rechazada
La mayor parte de la investigaci#n cientfica cabe en alguna de estas dos categoras- los
estudios observacionales y los e"perimentos reales La observaci#n natural, la estimaci#n de
parmetros y los estudios correlacionales se incluyen dentro de la categora de observaci#n
Su ob)etivo principal es brindar una descripci#n precisa de la situaci#n, estimar los
parmetros de la poblaci#n, o determinar si dos o ms de las variables estn relacionadas entre
s (omo no e"iste un control sistem1tico de alguna variable ni el e"perimentador al realizar
un estudio de observaci#n, este tipo de investigaci#n no permite determinar si los
cambios en una variable producirn cambios en otra %se tipo de resultado s#lo se puede
determinar a partir de e"perimentos reales
%n los e"perimentos reales, el investigador controla en forma sistemtica la variable
independiente y observa su efecto sobre una o ms variables dependientes ,ebido a
cuestiones prcticas, los datos se re*nen s#lo sobre una muestra de su)etos y no sobre
toda la poblaci#n %s importante que la muestra sea aleatoria Los datos obtenidos se
analizan despus de manera estadstica
%l anlisis estadstico puede ser descriptivo o inferencial Si el anlisis s#lo describe o
caracteriza los datos obtenidos est en el campo de la estadstica descriptiva Si el anlisis usa
los datos obtenidos para hacer inferencias sobre las poblaciones, est en el campo de la
estadstica inferencial %l conocimiento del anlisis estadstico tiene importantes
consecuencias prcticas en la vida diaria
*R>UNT!S 7 *RO?LM!S
2ota para el estudiante: usted observar que al final de algunos problemas de ste y
otros captulos, e"cepto el D, identificar por medio de color un rea especfica de la psicologa
y otros campos afines en los que el problema tiene aplicaci#n +or e)emplo, el problema M parte
b, pgina BG, es un problema del rea de la psicologa biol#gica .gregu el letrero ;biol#gica;
al final del problema, omitiendo el trmino ;psicologa; en aras de la brevedad Las reas
especficas identificadas son psicologa cognitiva, psicologa social, psicologa del desarrollo,
psicologa biol#gica, psicologa clnica, psicologa industrialNorganizacional 2HN73, psicologa de
la salud, educaci#n y otras (omo ya afirm, en el letrero que utilizo omit el trmino
;psicologa; en aras de la brevedad %spero que estos letreros sean *tiles para que su profesor
seleccione los problemas para realizar en casa y que le permitan a usted apreciar la
amplitud de las aplicaciones de este material, adems de ayudarle a identificar los
problemas que tal vez le agradara resolver, aparte de los que le hayan sido asignados
La estadistica y el mtodo cientfico - 1@ -
ARCICIOSB
,efina cada uno de los siguientes trminos-
+oblaci#n Jariable dependiente
9uestra (onstante
,atos %stadstica
Jariable +armetro
Jariable independiente
D (ules son los cuatro mtodos para adquirir el conocimiento? %scriba un prrafo
breve que e"plique los aspectos esenciales de cada uno de ellos
A %n qu difiere el mtodo cientfico de cada uno de los siguientes mtodos?
a 9todo de autoridad b 9todo de racionalismo c 9todo de intuici#n
C %scriba un prrafo breve en el cual compare la observaci#n naturalista con los
e"perimentos reales
E ,istinga entre la estadstica descriptiva y la inferencial +roponga e)emplos para
ilustrar los puntos establecidos
M %n cada uno de los siguientes e"perimentos, especifique- B3 la variable
independiente, D3 la variable dependiente, A3 la muestra, C3 la poblaci#n, E3 los datos y M3 la
estadstica-
a !n psic#logo de la salud est interesado en saber si la motivaci#n del miedo es eficaz
para reducir la incidencia del consumo de cigarrillos Se eligen CF adultos fumadores entre
los individuos que viven en la ciudad donde traba)a el psic#logo . DF de ellos se les pide
que fumen un cigarrillo, despus de lo cual presencian una pelcula cruel acerca de la forma
en que el hbito de fumar provoca cncer Se muestran imgenes cruentas de pulmones y
otros #rganos enfermos, de fumadores fallecidos en un esfuerzo por inducir el miedo a fumar
en esos su)etos %l otro grupo recibe el mismo tratamiento, e"cepto que ven una pelcula
neutral, no relacionada con el cigarrillo ,urante los dos meses posteriores a la e"hibici#n de
las cintas, el e"perimentador lleva un registro acerca de la cantidad de cigarrillos que fuman
diariamente los participantes Se calcula entonces, para cada grupo, la media de cigarrillos
fumados diariamente a partir de la e"hibici#n de la pelcula, y estas medias son comparadas
para determinar si el filme inductor del miedo tuvo alg*n efecto sobre los fumadores salud
b !n fisi#logo quiere saber si una regi#n particular del cerebro 2el hipotlamo3 est
implicada en la regulaci#n del consumo de comida Se realiza un e"perimento en el cual se
eligen AF ratas de un criadero universitario, las cuales se separan en dos grupos . uno de
estos grupos se le causan lesiones en el hipotlamo, mientras que el otro grupo es lesionado
en un rea neutral ,espus de recuperarse de las operaciones, todos los animales tienen
acceso libre al alimento durante dos semanas y se lleva un registro del consumo diario de
cada animal .l final del periodo de dos semanas se determina la media de consumo diario
de alimento para cada grupo +or *ltimo, estas medias son comparadas para ver si las
lesiones en el hipotlamo han afectado la cantidad de alimento consumido, biol#gica
c !n psic#logo clnico est interesado en evaluar tres mtodos para tratar la depresi#n- la
medicaci#n, la reestructuraci#n cognitiva y el e)ercicio Se incluye una cuarta condici#n de
tratamiento, un grupo que s#lo estar en espera de tratamiento, para tener un grupo de
control de lnea base Se recluta a MF personas deprimidas entre los estudiantes de
licenciatura de una universidad estatal grande, y BE de ellos son asignados a cada mtodo de
tratamiento Los tratamientos se administran durante seis meses, despus de lo cual cada
estudiante recibe un cuestionario dise&ado para medir el grado de depresi#n %l cuestionario
La estadistica y el mtodo cientfico - 11 -
tiene una escala de F a BFF, donde los punta)es mayores indican un mayor grado de
depresi#n Luego se calculan las medias de los valores de depresi#n para los cuatro
tratamientos y se comparan entre s para determinar la eficacia relativa de cada tratamiento
clnica, salud
d !n psic#logo social est interesado en determinar si los individuos que terminan la
ense&anza media superior y no reciben ms educaci#n ganan ms que los desertores de dicho
nivel de estudios %ntonces se lleva a cabo una encuesta nacional, en una ciudad grande del
oeste medio, se obtiene una muestra de BFF individuos de cada categora y se les pregunta
cul es el salario anual de cada uno de ellos Los resultados se organizan en una tabla y se
calcula la media de los valores de los salarios para cada grupo social
e !n psic#logo cognitivo se interesa en saber c#mo resulta afectada la retenci#n con el
espaciamiento de las sesiones de prctica !na muestra de AF alumnos de sptimo grado es
seleccionada, en una escuela de educaci#n media inferior de la localidad y se divide en tres
grupos de BF estudiantes cada uno . todos los estudiantes se les pide que memoricen una
lista de BE palabras y se les imparten tres sesiones de prctica, de E minutos cada una, para
que lo logren Las sesiones de prctica de los su)etos del grupo B tienen un espaciamiento de
BF minutos/ las del grupo D se espacian DF minutos/ y las del grupo A tienen AF minutos de
espaciamiento . todos los grupos se les somete a una prueba de retenci#n una hora despus
de la *ltima sesi#n de prctica Los resultados son registrados como el n*mero de palabras
recordadas correctamente en el periodo de prueba Se calculan y comparan las medias de
los valores de cada grupo (ognitiva
f !na psic#loga deportiva utiliza la visualizaci#n para promover un ms alto
rendimiento en los atletas universitarios %st interesada en evaluar la eficacia relativa de
la visualizaci#n por s sola, contra la visualizaci#n acompa&ada de una charla apropiada
Se realiza un e"perimento con un equipo de baloncesto estudiantil ,iez miembros del equipo
son seleccionados (inco de ellos son asignados a un grupo que s#lo recibe la visualizaci#n, y
otros cinco se asignan a un grupo de visualizaci#n ms charla Las dos tcnicas han sido
dise&adas para aumentar la precisi#n en los tiros libres (ada grupo practica su tcnica
durante un mes La precisi#n de cada )ugador en los tiros libres es medida previamente y
luego un mes despus de que empiezan a practicar esa tcnica La diferencia en los puntos se
calcula para cada )ugador y las medias de las diferencias de punta)e de cada grupo son
comparados para determinar la efectividad relativa de las dos tcnicas HNF, otra
g !n profesor de mecanografa piensa que el empleo de un orden diferente en las teclas
de una mquina facilitar una escritura ms rpida Se elige a DF estudiantes de
secretariado en una escuela de comercio de gran tama&o para participar en un
e"perimento dise&ado para probar esta suposici#n ,iez de estas estudiantes aprenden a
escribir con el teclado convencional Las otras diez reciben su entrenamiento con el nuevo
teclado .l final del periodo de entrenamiento se mide la velocidad de escritura de cada
estudiante, en palabras por minuto Luego se calcula la media de velocidad de escritura
para ambos grupos y se comparan las medias para determinar si el nuevo teclado ha tenido
alg*n efecto %ducaci#n
O Hndique cules de las siguientes afirmaciones representan una variable y cules una
constante-
a %l n*mero de letras del alfabeto
b %l n*mero de horas que tiene un da
c La hora en que usted come
d %l n*mero de estudiantes que especializan en psicologa cada a&o, en la universidad
donde estudia usted
e %l n*mero de centmetros en un metro
f La cantidad de horas que duerme usted cada noche
g Su peso
h %l volumen de un litro
La estadistica y el mtodo cientfico - 1% -
G Hndique cules de las siguientes situaciones corresponden a la estadstica descriptiva
y cules a la estadstica inferencial-
a !n informe anual para accionistas que detalla los bienes de la corporaci#n
b !n profesor de historia que anuncia a su grupo el n*mero de estudiantes que
obtuvieron la m"ima calificaci#n en un e"amen reciente
c %l clculo de la media de un con)unto de datos de una muestra para caracterizarla
d %l uso de los datos de una muestra en una encuesta para estimar la opini#n de la
poblaci#n
e 'ealizar un estudio de correlaci#n sobre una muestra para determinar si el nivel
educativo y el ingreso de la poblaci#n estn relacionados
f !n artculo de un peri#dico informa sobre los salarios promedio de los empleados
federales a partir de los datos reunidos de todos los interesados
P +ara cada una de las siguientes situaciones, identifique los datos de la muestra y los
datos de la poblaci#n-
a !na psic#loga social interesada en el comportamiento de los bebedores investiga la
cantidad de bebidas que se sirven en los bares de una ciudad en particular, cierto viernes,
durante la ;hora feliz; %n la ciudad e"isten DBA bares (omo son demasiados para
revisarlos, ella elige DF y registra el n*mero de bebidas que se sirven en ellos Los datos son
los siguientes-
EF GD CO ME
CF OM MB OD
AE CA ME OM
MA MM GA GD
EO OD OB EG
b +ara que un restaurante especializado en la venta de hamburguesas de BNC de
libra de ba)o costo pueda obtener ganancias, es necesario que cada hamburguesa servida
tenga un peso cercano a FDE de libra Sabiendo esto, el gerente del restaurante est
interesado en la variabilidad de los pesos de las hamburguesas servidas cada da ,urante
cierto da, se han servido CEF hamburguesas (omo tardara mucho en pesarlas todas, el
gerente decide pesar s#lo BE .s se obtuvieron los siguientes pesos, en libras-
FDE FDO FDE
FDM FAE FDO
FDD FAD FAG
FDP FDD FDG
FDO FCF FAB
c Se sospecha que una mquina que corta piezas peque&as de acero 2utilizada para
fabricar tornillos3 a una determinada longitud no es confiable %l capataz del taller decide
entonces verificar la producci#n del artefacto %l da de la verificaci#n, la mquina debe
producir piezas de D centmetros La tolerancia aceptable es de
I
FFE centmetros (omo
tardara mucho en medir las MFF piezas producidas en un da, elige un grupo representativo
de DE .s obtiene las siguientes longitudes, en centmetros-
DFB BPP DFE BPC DFE
La estadistica y el mtodo cientfico - 1' -
DFB DFD DFC BPA BPE
DFA BPO DFF BPG BPM
DFE BPM DFF DFB BPP
BPG BPE BPO DFC DFD
d . una psic#loga fisiol#gica que traba)a en la !niversidad de 0acoma le interesa
conocer los ritmos cardacos diast#licos, en reposo, de todas las estudiantes de dicha
universidad +ara eso toma muestras aleatorias de AF mu)eres )#venes del cuerpo
estudiantil y registra los siguientes ritmos cardacos diast#licos cuando las estudiantes
estn recostadas en una cama Las mediciones se registran en latidosNminuto
MD GE PD GE GG OB
OA GD GC GP PA OE
GB OD PO OG PF GO
OG OC MB MM GA MG
MO GA OE OF GM OD
Si desea encontrar problemas de prctica adicionales totalmente resueltos sobre los
temas que acaba de estudiar, busque (hapter B en la pgina Keb disponible en ingls en-
http-NN KKKthomsonlearningcomm"
ST!DISTIC! DSCRI*TI,!
La estadstica no es un tema sencillo/ requiere el aprendiza)e de conceptos difciles e imI
plica tambin la realizaci#n de clculos matemticos Sin embargo, me gustara darle a
usted un conse)o que, en mi opini#n, le ser de gran utilidad para comprender este material
,icho conse)o se basa en los muchos a&os que he ense&ado esta materia/ espero que lo tome
muy en serio
La mayora de los estudiantes de ciencias del comportamiento sienten mucha ansiedad al
emprender un curso de matemticas o de estadstica Sin minimizar la dificultad del tema, no es
necesario sentir tanta ansiedad +ara aprender el material contenido en este libro, usted no
tiene que ser un ;mago; del clculo o de las ecuaciones diferenciales 4e realizado un gran
esfuerzo para presentar el material de modo que los alumnos que no tengan inclinaci#n alguna
por las matemticas puedan comprenderlo Sin embargo, no puedo apartarme del todo de las
matemticas +ara tener "ito, usted deber dominar el lgebra elemental y unas cuantas
operaciones matemticas +ara ayudarle a repasar estos temas, he incluido el apndice . en el
que encontrar las matemticas que necesita como previo requisito !sted deber estudiar ese
material y asegurarse de que puede resolver los problemas incluidos en l Si tiene dificultades
para resolver esos e)ercicios, ser muy conveniente que repase el tema en un libro de te"to
bsico de lgebra elemental
7tro factor que se debe tener presente es que en estadstica se utilizan muchos smbolos
+or e)emplo, para referirnos a la media de una muestra de datos, utilizaremos el smbolo
X

2que se lee 34 barraLL3 (on frecuencia los estudiantes creen que el material es ms difcil de
lo que es en realidad e intentan aprender lo que cada smbolo significa !sted puede ahorrarse
muchos dolores de cabeza si comprende los smbolos en su )usta dimensi#n 0rtelos como si
fueran el vocabulario de otro idioma 9emorcelos e intente traba)ar
Q
con ellos desde un punto
de vista conceptual +or e)emplo, cuando vea que el te"to dice
X
, el concepto ;la media de la
muestra; deber acudir de inmediato a su mente
La estadistica y el mtodo cientfico - 1( -
0ambin es importante darse cuenta de que el material de la estadstica es acumulativo
8o se retrase en sus clases Si lo hace, no podr comprender tampoco los conceptos nuevos, en
virtud de que no ha dominado los conceptos bsicos La situaci#n puede convertirse en una
bola de nieve y, antes que se d cuenta, usted podra estar retrasado en forma irremediable
'ecuerde que debe hacer todo lo posible por mantenerse al corriente del material presentado
en clase, a medida que el curso vaya avanzando
+or *ltimo, nuestra e"periencia indica que gran parte de la comprensi#n de la estadstica
se obtiene con la resoluci#n de muchos problemas . menudo, un problema vale ms que mil
palabras (on frecuencia, aunque el te"to del libro sea claro, no entender el material hasta
que usted haya resuelto los problemas asociados con el tema +or lo tanto, resuelva muchos
problemas y vuelva a leer las secciones para asegurarse de que lo ha comprendido
%n resumen, creo que si domina el lgebra elemental, traba)a de manera diligente,
aprende los smbolos, estudia el te"to, se mantiene al tanto del material que sea e"puesto en
clase y resuelve muchos problemas, tendr "ito .unque usted no lo crea, cuando comience a
percibir por s mismo la elegancia y la diversi#n inherentes a la estadstica, llegar incluso a
disfrutarla
NOT!CIN M!TMCTIC!
%n estadstica traba)amos por lo general con datos agrupados, resultantes de la medici#n
de una o ms variables (on mucha frecuencia, los datos se obtienen a partir de muestras y
en algunas ocasiones se obtienen a partir de poblaciones +ara fines matemticos, es *til que
ciertos smbolos representen a las variables medidas en el estudio %n todo este te"to
utilizaremos la letra may*scula 1, y a veces la > para representar la2s3 variable2s3 medida2s3
.s, si estuviramos midiendo la edad de los su)etos, emplearamos la 1 para representar la
variable ;edad; Si la variable puede adoptar muchos valores, es importante distinguir entre
ellos %sto se logra agregando un subndice al smbolo 1 %ste proceso se ilustra en la tabla
DB
La estadistica y el mtodo cientfico - 1/ -
ta+la %41 La edad de seis su)etos
8*mero
del su)eto
Smbolo
del dato
Jalor del dato,
edad 2a&os3
B 1
B
G
D 1
D
BF
A 1
A
O
C 1
C
M
E 1
E
BF
M 1
M
BD
%n este e)emplo representamos la variable ;edad; mediante el smbolo 4. .dems, 2
representa el n*mero total de datos que hay en la distribuci#n %n este e)emplo, 2 5 6.
(ada uno de los seis datos representa un valor especfico de 1 +ara distinguir entre los seis
datos diferentes, se ha agregado un subndice a 1, que corresponde al n*mero de su)eto que
tiene el valor dado .s, el smbolo 1
B
corresponde al valor G del dato, 4( al valor BF del dato,
1
A
al valor O, 1
C
a 6, 4+ a BF y 1
M
a BD %n general, podemos referirnos a uno cualquiera de
los datos de la distribuci#n 4 como 4
i
, donde i puede asumir cualquier valor de B a 2, seg*n
el dato que deseemos designar %n resumen-
1 o > representan la variable medida
N representa el n*mero total de su)etos o de datos
1
i
es el iIsimo dato, donde i puede variar de B a 2.
SUM!TORI!
!na de las operaciones que se realizan con ms frecuencia en estadstica consiste en suI
mar todos los datos que pertenecen a una distribuci#n o una parte de ellos (omo no resulta
prctico escribir ;suma de todos los datos; cada vez que se necesita indicar esta operaci#n,
particularmente en ecuaciones, se utiliza una abreviatura simb#lica La letra griega
may*scula sigma 2>I3 indica la operaci#n de sumatoria La frase algebraica que se emplea
para la sumatoria es-
%sta e"presi#n se lee como ;la suma de la variable 1 de i R B a 8S Las notaciones que
aparecen arriba y aba)o del signo de sumatoria indican los datos que deben incluirse en la
operaci#n %l trmino que aparece aba)o del signo de la sumatoria nos indica el primer dato
que interviene en esta operaci#n, y el trmino que se encuentra arriba de di cho signo indica
el *ltimo de esos datos .s, esta frase se&ala que debemos sumar los datos de 1, comenzando
con el primero y concluyendo con el 8Isimo dato .s,
(uando la sumatoria se realiza con todos los datos 2de B a 83, es frecuente que la propia
frase con que se designa esta operaci#n se abrevie, omitiendo las notaciones colocadas arriba
y aba)o del signo de la suma, al igual que el subndice i ,e esta manera,
La estadistica y el mtodo cientfico - 15 -

%n el e)emplo anterior,
%sta e"presi#n indica que la suma de todos los datos 1 es EA
7bserve que no es necesario que la sumatoria se realice desde B hasta 8 +or e)emplo,
podramos querer sumar s#lo el segundo, tercero, cuarto y quinto datos 'ecuerde que la
notaci#n aba)o del signo de sumatoria indica d#nde debe comenzar la suma, y el trmino
indicado arriba de dicho signo nos dice d#nde terminarla .s, para indicar la operaci#n de
suma del segundo, tercero, cuarto y quinto datos, utilizaramos el smbolo
'esolvamos algunos problemas de prctica para la sumatoria

%"isten otros dos tipos de sumatorias que veremos con frecuencia en este libro Son 1
D
y
2T13
D
.unque se parecen, son distintos y, en general, proporcionan respuestas diferentes %l
smbolo T4
(
2suma de los cuadrados de los datos 4& indica que primero debemos elevar al
cuadrado los datos 1 y luego sumarlos .s,
La estadistica y el mtodo cientfico - 19 -

SC!L!S D MDICINB NOMIN!LS0 ORDIN!LS0 D INTR,!LOS 7 D R!DN
%n virtud de que la estadstica analiza los datos y stos son resultado de las mediciones,
necesitamos dedicar cierto tiempo al estudio de las escalas de medici#n %ste tema es de suma
importancia pues el tipo de escala de medici#n utilizado para recolectar los datos ayuda a
determinar el tipo de prueba de inferencia estadstica que conviene emplear en el anlisis de
los datos ,esde un punto de vista te#rico, una escala de medici#n puede tener uno o varios
de los siguientes atributos matemticos- magnitud, un intervalo igual entre unidades
adyacentes y un cero absoluto %"isten cuatro clases de escalas que se utilizan de manera
com*n en las ciencias del comportamiento- nominal, ordinal, de intervalo y de ra)"n. ,ifieren
en el n*mero de atributos matemticos que cada una posee
scalas nominales
!na escala nominal representa el nivel mnimo de medici#n y se utiliza con frecuencia
para variables de naturaleza cualitativa y no cuantitativa .lgunos e)emplos de variables
cualitativas son las marcas de zapatos deportivos, los distintos tipos de fruta o de m*si ca, los
das de la semana, la nacionalidad, las creencias religiosas y el color de los o)os .l utilizar una
escala nominal, la variable se divide en sus diversas categoras %stas categoras comprenden
las ;unidades; de la escala y los ob)etos se ;miden; al determinar la categora a la cual
pertenecen .s, la medici#n con una escala nominal equivale, en realidad, a clasificar los
ob)etos y a darles el nombre 2de ah lo de escala nominal3 de la categora a la cual
pertenecen
+or e)emplo, si a usted le gusta correr, es probable que est interesado en las diversas
marcas de zapatos deportivos que se ofrecen en el mercado, como ?roo:s, 8i:e, .didas,
Saucony y 8eK ?alance, para mencionar s#lo algunas Los zapatos deportivos son
importantes porque, al correr, cada zapato entra en contacto con el suelo unas GFF veces por
milla %n una carrera de E millas entrar en contacto CFFF veces Si usted pesa BDE libras 2EOE
:g3, producira un impacto total de AFF toneladas sobre cada pie durante una carrera de E
millas U%so s que es pesadoV 8o es de sorprender que los corredores sean particularmente
cuidadosos en la elecci#n de su calzado
La variable ;marca de zapatos deportivos; es de tipo cualitativo Se mide en una escala
nominal Las diversas marcas representan s#lo algunas de las posibles categoras 2unidades3
de esta escala Si tuviramos un grupo de zapatos deportivos y quisiramos medirlos con
esta escala, consideraramos cada uno y determinaramos su marca %s importante observar
que las unidades de una escala nominal son categoras, por lo cual no e"iste una relaci#n de
magnitud entre ellas .s, no e"iste una relaci#n cuantitativa entre las categoras de 8i:e y
?roo:s 8i:e no es ;ms marca; de zapatos deportivos que ?roo:s Simplemente, son marcas
distintas %sto puede quedar ms claro si llamamos a las categoras zapatos deportivos B y
zapatos deportivos D, en vez de 8i:e y ?roo:s %n este caso, los n*meros B y D son s#lo
nombres y no poseen una relaci#n de magnitud entre ellos
La estadistica y el mtodo cientfico - 1; -
!na propiedad fundamental de las escalas nominales es la equivalencia. %sto quiere
decir que todos los miembros de una clase dada son iguales desde el punto de vista de la
variable de clasificaci#n .s, a todos los pares de zapatos 8i:e se les considera iguales desde
el punto de vista de ;marca de zapatos deportivos;, a pesar de que pueda haber varios
modelos distintos de zapatos 8i:e
!na operaci#n que se realiza con frecuencia )unto con la medici#n nominal consiste en
contar las menciones de cada tipo dentro de cada clase +or e)emplo, si tuviramos varios
zapatos deportivos y determinramos la marca de cada uno, estaramos realizando una
medici#n nominal .dems, tal vez nos interesara contar el n*mero de zapatos que
pertenecen a cada categora .s, podramos tener DF zapatos 8i:e, BP Saucony y M 8eK
?alance en total %stas frecuencias nos permiten comparar el n*mero de zapatos dentro de
cada categora %sta comparaci#n cuantitativa de las cifras dentro de cada categora no debe
confundirse con la afirmaci#n hecha anteriormente de que no e"iste una relaci#n de magnitud
entre las unidades de una escala nominal +odemos comparar de manera cuantitativa las
cantidades de zapatos 8i:e con las de zapatos Saucony, pero 8i:e no es ;ms marca; de
zapatos de lo que es Saucony .s, una escala nominal no tiene los atributos matemticos de
magnitud, intervalos iguales o cero absoluto S#lo permite la clasificaci#n de los ob)etos en
categoras mutuamente e"cluyentes
scalas o$dinales
La escala ordinal representa el siguiente nivel de medici#n 0iene un nivel relativamente
ba)o de la propiedad de magnitud (on esta escala ordenamos los ob)etos medidos, tomando
como base si poseen ms, menos o la misma cantidad de la variable medida .s, una escala
ordinal permite determinar si . 7 8, A 5 8 o A 9 8.
!n e)emplo de una escala ordinal es el ordenamiento de los cinco me)ores participantes
en un concurso de oratoria, seg*n su facilidad de palabra %ntre los oradores, la persona con
el rango B fue considerada me)or que la persona que posea el rango D, quien a su vez fue me)or
que la de rango A La persona de rango A fue estimada como me)or orador que la de rango C,
la cual fue considerada me)or que la persona del rango E %s importante observar que aunque
esta escala permite hacer comparaciones del tipo ;me)or que, igual a o menor que;, no dice
nada sobre la magnitud de la diferencia entre las unidades adyacentes que pertenecen a
dicha escala %n este e)emplo, la diferencia en cuanto a la facilidad de palabra entre las
personas de rango B y D podra ser grande y la que e"iste entre los individuos de rango D y A
podra ser peque&a .s, una escala ordinal no tiene la propiedad de mantener intervalos
iguales entre las unidades adyacentes .dems, como lo *nico que tenemos son #rdenes
relativos, la escala no dice nada acerca del nivel absoluto de la variable .s, los oradores de
los cinco primeros lugares podran tener un alto nivel de facilidad de palabra o un nivel ba)o
%sta informaci#n no se puede obtener de una escala ordinal
7tros e)emplos de escala ordinal son la clasificaci#n de los corredores que participan en
el 9arat#n de ?oston seg*n su orden de llegada, la clasificaci#n de los equipos de f*tbol
americano universitario con base en las calificaciones de la .ssociated +ress, el orden de los
profesores seg*n su capacidad de ense&anza y el orden de los estudiantes seg*n su nivel de
motivaci#n
scalas de inte$3alos
La escala de intervalo representa un nivel superior de medici#n con respecto a la
escala ordinal +osee las propiedades de magnitud e igualdad de intervalos entre las unidades
adyacentes, pero no tiene un cero absoluto .s, la escala de intervalo posee las propiedades
de la escala ordinal y tiene ;intervalos iguales entre sus unidades adyacentes;/ estos intervalos
indican que e"isten cantidades iguales de la variable medida entre las unidades adyacentes en
la escala
La escala (elsius para medir la temperatura es un buen e)emplo de una escala de
La estadistica y el mtodo cientfico - 1= -
intervalo 0iene la propiedad de poseer intervalos iguales entre las unidades adyacentes,
pero no tiene un punto correspondiente al cero absoluto La propiedad de intervalos iguales
se percibe por el hecho de que un cambio dado de calor producir el mismo efecto en la lectura
de temperatura en la escala, sin importar en qu parte de sta ocurra dicho cambio .s, la
cantidad adicional de calor que provoca un cambio en la lectura de la temperatura de DW a AW
(elsius producir tambin un cambio en la lectura de EBW a EDW o de BFEW a BFMW (elsius %sto
ilustra el hecho de que cantidades iguales de calor estn representadas entre las unidades
adyacentes, en toda la escala
(omo en una escala de intervalo e"isten cantidades iguales de la variable entre las
unidades adyacentes de la misma, las diferencias equivalentes entre los n*meros de la escala
representan diferencias de la misma magnitud en la variable .s, podemos decir que la
diferencia de calor es la misma entre OGW y OEW (elsius que entre DCW y DBW de la misma
escala %sto tambin implica, desde un punto de vista l#gico, que diferencias grandes entre los
n*meros de la escala representan tambin diferencias grandes entre la magnitud de la
variable medida, y que diferencias peque&as entre los n*meros de la escala representan
peque&as diferencias en la magnitud de la variable medida .s, la diferencia de calor entre
GFW y MEW es mayor que la diferencia entre BGW y BEW (elsius, y la diferencia de calor entre PAW
y PBW es menor que la diferencia entre CGW y CFW (elsius %n vista del anlisis anterior, podemos
ver que adems de determinar si A 5 8, A 7 8 o A 9 8, una escala de intervalo nos permite
determinar si A - 8 5 C - #, A - 8 7 C - # o A-89C-#.
scalas de $aE&n
%l siguiente y m"imo nivel de medici#n es la escal a de ra)"n. 0iene todas las
propiedades de una escala de intervalo y, adems, posee un cero absoluto Sin ste no se
pueden calcular las razones con respecto a las lecturas de la escala (omo este tipo de escala
tiene un cero absoluto, con ella se pueden utilizar razones 2de aqu el nombre escala de
ra)"n&.
!n e)emplo adecuado para ilustrar la diferencia entre la escala de intervalo y la de
raz#n consiste en comparar la escala (elsius de temperatura con la escala Xelvin %l cero de la
escala Xelvin es el cero absoluto 2la ausencia completa de calor3 %l cero de la escala (elsius
es la temperatura a la cual se congela el agua %s un punto cero arbitrario que se presenta en
realidad a los DOAW Xelvin La escala (elsius es de intervalo y la escala Xelvin es de raz#n La
diferencia de calor entre GW y PW es igual a la diferencia entre PPW y BFFW sin importar que la
escala sea (elsius o Xelvin Sin embargo, no podemos calcular razones con la escala
(elsius !na lectura de DFW (elsius no es el doble de caliente que BFW (elsius %sto se puede
comprobar al convertir las lecturas (elsius al calor real que representan %n trminos de calor
real, DFW (elsius es en realidad DPAWX 2DOAW Y DFW3, y BFW (elsius es en realidad DGAWX 2DOAW
Y BFW3 %s obvio que DPAW no es el doble de DGAW +uesto que la escala Xelvin tiene un cero
absoluto, una lectura de DFW en esta escala es el doble de caliente que una de BFW ,e esta
manera se pueden utilizar razones con la escala Xelvin
7tros e)emplos de variables medidas con escalas de razones son- el tiempo de reacci#n, la
longitud, el peso, la edad y la frecuencia de cualquier evento,
como el n*mero de zapatos 8i:e incluidos en el con)unto de
zapatos deportivos que comentamos con anterioridad (on
una escala de este tipo, usted puede establecer razones y
realizar todas las dems operaciones matemticas
asociadas por lo general a los n*meros 2es decir, suma,
resta, multiplicaci#n y divisi#n3 Las cuatro escalas de
medici#n y sus caractersticas se resumen en la figura DB
8ominal
Las unidades de la escala son categoras Los ob)etos se
miden al determinar la categora a la cual pertenecen 8o e"iste
una relaci#n de magnitud entre las categoras
La estadistica y el mtodo cientfico - %@ -
O$dinal
+osee la propiedad de magnitud Se puede ordenar a los ob)etos seg*n que posean ms,
menos o igual cantidad de la variable medida .s, se puede determinar si A 7 8, A 5 8, A 9 8.
8o se puede determinar cunto mayor o menor es A que 8 en relaci#n con el atributo medido
Inte$3alo y $aE&n
:ntervalo: posee las propiedades de magnitud e intervalos iguales entre unidades
adyacentes Se pueden hacer las mismas determinaciones que en la escala ordinal y,
adems, determinar si A - 8 5 C - #, A- 87 C ; # o A-89C-#.
<a)"n: posee las propiedades de magnitud, intervalos iguales entre unidades adyacentes y
un punto cero absoluto Se pueden realizar todas las operaciones matemticas asociadas por
lo general con los n*meros, incluidas las razones
SC!L!S D MDICIN N L!S CINCI!S DL COM*ORT!MINTO
%n las ciencias del comportamiento, muchas de las escalas utilizadas se consideran con
frecuencia como si fuesen de intervalo sin establecer con claridad que la escala, en realidad,
posee intervalos iguales entre unidades adyacentes La medici#n del (H/ las variables
emocionales como la ansiedad y la depresi#n/ las variables de la personalidad 2como la
autosuficiencia, la introversi#n, la e"troversi#n y la dominancia3/ las variables de eficiencia o
logros terminales/ las variables de actitud, entre otras, corresponden a esta categora (on
todas estas variables es claro que las escalas no son de raz#n +or e)emplo, en el caso del (H,
si una persona ha obtenido un cero en la escala de inteligencia para adultos de Zechsler
2Z.HS3, no podramos decir que tiene inteligencia nula Se supone que se encontraran algunas
preguntas que podra contestar el individuo en cuesti#n, de modo que tendra un (l superior a
cero .s, la prueba Z.HS no tiene un punto cero absoluto y las razones no son adecuadas +or
lo tanto, no es correcto decir que una persona con un (H de BMF es lo doble de inteligente que
alguien con un (l de GF
+or otro lado, parece que podemos hacer algo ms que s#lo especificar un
ordenamiento de los individuos !na persona que posee un (l de BFF tiene una inteligencia
ms cercana a alguien con un (l de BBF que a otra persona con un (H de MF %sto parece ser
una escala de intervalo, pero es difcil establecer que la escala en realidad posea intervalos
iguales entre las unidades adyacentes 9uchos investigadores consideran tales variables como
si fuesen medidas en escalas de intervalo, en particular cuando el instrumento de medici#n
est bien normalizado, como en el caso del Z.HS %s mucho ms discutible considerar como
escalas de intervalos las escalas deficientemente normalizadas que miden variables
psicol#gicas %ste tema surge en particular en la estadstica inferencial, donde el nivel de las
escalas puede influir en la selecci#n de la prueba que se usar en el anlisis de datos %"isten
dos criterios al respecto %l primero afirma que el uso de ciertas pruebas, como la t de
Student y el anlisis de varianza, deben limitarse a los datos que pertenecen a escalas de
intervalo y de raz#n %l segundo criterio no concuerda con lo anterior y afirma que esas pruebas
tambin se pueden utilizar con datos nominales y ordinales Sin embargo, este tema es
demasiado comple)o para ser considerado aqu
,!RI!?LS CONTINU!S 7 DISCRT!S
ya se defini# la variable como una propiedad o caracterstica de alguna cosa que puede
asumir ms de un valor 0ambin distinguimos entre las variables independientes y
dependientes .dems de esto, las variables pueden ser continuas o discretas-
Una variable contin#a es aquella que tericamente puede asumir
un nmero infinito de valores entre
,
las unidades adyacentes de
La estadistica y el mtodo cientfico - %1 -
una escala.
Una 3a$ia+le disc$eta es aquella para la cual no existen valores
posibles localizados entre las cantidades adyacentes de una escala.
%l peso, la estatura y el tiempo son e)emplos de variables continuas +ara cada una de
estas variables e"iste, de manera potencial, una infinidad de valores entre las unidades
adyacentes Si estamos midiendo el tiempo y la unidad mnima que utilizamos es un segundo,
entonces entre B y D segundos e"iste una infinidad de valores posibles- BB segundos, BFB
segundos, BFFB segundos, y as sucesivamente +odemos aplicar el mismo argumento al peso y
a la estatura
%sto no ocurre con una variable discreta %l ;n*mero de hi)os en una familia; es un
e)emplo de variable discreta %n este caso, la menor unidad es un hi)o y no e"isten valores
posibles entre uno y dos hi)os, dos y tres hi)os, etc La caracterstica de una variable discreta
es que cambia por cantidades fi)as sin que haya valores intermedios 7tros e)emplos son- ;el
n*mero de estudiantes en su grupo;, ;el n*mero de profesores en una universidad; y ;el
n*mero de citas que tuvo el *ltimo mes;
Lmites $eales de #na 3a$ia+le contin#a
(omo una variable continua puede tener una infinidad de valores entre las unidades
adyacentes de una escala, todas las mediciones realizadas sobre esta variable son
aproximadas. !tilizaremos el peso para ilustrar esto Suponga que comenz# una dieta el da de
ayer, que es primavera, casi verano, y que el clima ideal para ponerse el tra)e de ba&o est ya
muy pr#"imo ,e cualquier modo, usted se pes# ayer en la ma&ana y su peso fue se&alado
por la agu)a de la figura DD Hmagine que la escala de la figura tiene una precisi#n s#lo a la
libra 2o :ilo3 ms cercana %l peso registrado fue de BGF libras 2GA :3 %sta ma&ana, cuando
usted se pes# despus de un da de hacer dieta, la agu)a lleg# hasta el lugar indicado con
lnea interrumpida $u peso registr# esta vez? +or ser un rasgo muy humano, sabemos que
a usted le agradara registrar BOP libras/ sin embargo, como futuro cientfico, usted busca la
verdad a cualquier precio +or eso registra de nuevo BGF libras (undo podra registrar BOP
libras? (uando la agu)a est deba)o del punto medio entre BOP y BGF libras ,e manera
anloga, usted seguira registrando BGF libras si la agu)a estuviera arriba de BGF, pero antes del
punto medio entre BGF y BGB libras +or consiguiente, cada vez que se registre el peso de BGF
libras, eso no quiere decir que sean e"actamente BGF libras, sino que el peso est entre BGF [
FE libras 8o conocemos el valor e"acto del peso, pero estamos seguros de que se encuentra
en el rango de BOPE a BGFE %ste rango especifica los lmites reales del peso de BGF libras %l
valor de BOPE es el lmite real inferior y BGFE es el lmite real superior
La estadistica y el mtodo cientfico - %% -

+or e)emplo, si la variable en cuesti#n es el peso, la menor unidad es B libra, y registramos
BGF libras, los lmites reales estn arriba y aba)o de BGF libras por
DB
libra .s, los lmites
reales son BOPE y BGFE libras\ Si la unidad mnima fuese FB libras y no B libra y
registrramos BGFF libras, entonces los lmites reales seran BGF [ ]2FB3, es decir, BOPPE y
BGFFE
Cif$as siFnificati3as
%n estadstica analizamos datos/ este anlisis implica numerosos clculos matemticos
(on mucha frecuencia obtenemos un residuo decimal, por e)emplo, despus de realizar una
divisi#n (uando esto ocurre, necesitamos decidir la cantidad de cifras decimales que
utilizaremos para el residuo
%n las ciencias fsicas, por lo general, se utiliza el mismo n*mero de cifras significativas
que tienen los datos en bruto +or e)emplo, si medimos el peso de cinco su)etos hasta tres cifras
significativas 2BOA, BEM, BMD, BME y BOE libras3 y queremos calcular el promedio de estos pesos,
nuestra respuesta deber contener s#lo tres cifras significativas .s,
La respuesta de BMMD se redondea a tres cifras significativas, dando un resultado final de
BMM libras +or varias razones, este procedimiento no se ha seguido en las ciencias del
comportamiento, sino que se ha establecido una tradici#n en la cual la mayor parte de los
valores finales se e"presan con dos o tres cifras decimales, sin importar el n*mero de cifras
significativas de los datos en bruto (omo ste es un te"to para usarse en las ciencias del
comportamiento, hemos optado por seguir esta tradici#n .s, en este libro daremos la mayor
parte de nuestras respuestas finales hasta con dos cifras decimales %n al gunas ocasiones
habr e"cepciones +or e)emplo, los coeficientes de correlaci#n y de regresi#n tienen tres cifras
decimales, y los valores de probabilidad se dan a menudo hasta con cuatro cifras decimales, lo
cual es consistente con la tradici#n $s una prctica comn reali)ar todos los clculos
intermedios con dos o ms cifras decimales de las que tendr la respuesta final. .s, cuando se
le pida que esta *ltima tenga dos cifras decimales, usted deber realizar los clculos
intermedios con cuatro cifras decimales por lo menos y redondear la respuesta final a dos
cifras
Redondeo
(onsiderando que e"presaremos nuestras respuestas finales con dos, y en algunas
ocasiones hasta con tres o cuatro cifras decimales, necesitamos decidir c#mo se determinar
el valor del *ltimo dgito +or fortuna, las siguientes reglas de redondeo son bastante sencillas
y directas-
B ,ivida en dos partes el n*mero que desea redondear- la respuesta potencial y el
residuo La respuesta potencial es el n*mero original y debe llegar solamente hasta el n*mero
deseado de cifras decimales %l residuo es el resto de ese n*mero original
D (oloque un punto decimal antes del primer dgito del residuo, creando de esta
manera un residuo decimal
A Si el residuo decimal es mayor que ], sume B al *ltimo dgito de la respuesta
La estadistica y el mtodo cientfico - %' -
C Si el residuo decimal es menor que ], de)e el *ltimo dgito de la respuesta sin cambio
alguno
E Si el residuo decimal es igual a ], sume B al *ltimo dgito de la respuesta si dicho
dgito es impar, pero si es par, d)elo sin cambio alguno
+robemos con algunos e)emplos 'edondearemos los n*meros de la columna de la
izquierda, en la tabla DD, hasta dos cifras decimales
+ara realizar este redondeo, el n*mero se separa en dos partes- la respuesta potencial y
el residuo %n vista de que estamos redondeando a dos cifras decimales, la respuesta potencial
termina en la segunda cifra decimal %l resto del n*mero constituye el resi duo +ara el primer
n*mero, ACFBAEF ACFB constituye la respuesta potencial y AEF es el residuo (omo AEF es
menor que ], el *ltimo dgito de la respuesta potencial permanece sin cambio alguno y la
respuesta final es ACFB +ara el segundo n*mero, ACFBOMB, el residuo decimal 2OMB3 es
mayor que ] +or lo tanto, tenemos que sumar B al *ltimo dgito, con lo cual la respuesta
correcta es ACFD +ara los dos n*meros siguientes, el residuo decimal es igual a ] %l n^mero
CEFCEFF se convierte en CEFC en vitud de que el ^ltimo d_gito de la respuesta potencial es par
%l n^mero CEFEEFF se convierte en CEFM debido a que el ^ltimo d_gito es impar
*R>UNT!S 7 *RO?LM!S
B ,efina los conceptos que aparecen en la secci#n ;0rminos importantes; y proponga
un e)emplo de cada uno
D Hdentifique cules de las siguientes variables son continuas y cules son discretas- a
La hora del da
a La hora del d_a
b 8*mero de mu)eres en su grupo
c 8*mero de veces que una rata oprime la palanca en una ca)a de S:inner
d %dad de los su)etos en un e"perimento
e 8*mero de palabras recordadas
f +eso del alimento ingerido
g +orcenta)e de estudiantes de su grupo que son mu)eres
h Jelocidad de los corredores en una carrera
A Hdentifique la escala de cada una de las siguientes variables-
a 8*mero de bicicletas que utilizan los estudiantes de primer a&o
b 0ipos de bicicletas utilizadas por los estudiantes de primer a&o
c %l (H de sus profesores 2suponga que utiliza una escala con intervalos iguales3
La estadistica y el mtodo cientfico - %( -
d %l dominio de las matemticas, clasificado en las categoras de malo, regular y bueno
e Sensaci#n de ansiedad al hablar en p*blico, calificada seg*n una escala de F a BFF
2suponga que la diferencia en el grado de ansiedad entre las unidades adyacentes de toda
la escala no siempre es la misma3
f %l peso de un grupo de personas sometidas a una dieta
g %l tiempo de reacci#n al escuchar un sonido
h %l dominio de las matemticas, medido en una escala de F a BFF La escala est bien
normalizada y se puede considerar que tiene intervalos iguales entre las unidades adyacentes
i Las calificaciones de los profesores asignadas por los estudiantes, en una escala de EF
puntos 8o e"iste una base suficiente para suponer que los intervalos entre las unidades
adyacentes son iguales
C !n estudiante mide la asertividad con una escala
de intervalos %s correcto decir que un punta)e de AF en la escala representa la mitad
de asertividad que un punta)e de MF? %"plique
E +ara cada uno de los siguientes con)untos de datos, determine
M 'edondee los siguientes n*meros a dos cifras decimales-
O ,etermine los limites reales de los siguiente valores-
a BF libras 2suponga que la unidad de medida minima es de B libra3
b DE segundos 2suponga que la unidad de medida mnima es de FB segundo3
c BFF gramos 2suponga que la unidad de medida mnima es de BF gramos3
d DFB centmetros 2suponga que la unidad de medida mnima es de FFB centmetro3
e EDAD segundos 2suponga que la unidad de medida mnima es de B milisegundo3
G ,etermine los valores de las siguientes e"presiones-

P %n un e"perimento para medir los tiempos de reacci#n de ocho su)etos se obtuvieron
los siguientes datos, en milisegundos-
La estadistica y el mtodo cientfico - %/ -
P %n un e"perimento para medir los tiempos de reacci#n de ocho su)etos se obtuvieron
los siguientes datos, en milisegundos-

a Si 1 representa la variable del tiempo de reacci#n, asigne a cada uno de los datos su
smbolo 1, apropiado
b (alcule >I 1 para estos datos
BF 'epresente cada una de las siguientes e"presiones por medio de la notaci#n de
sumatoria Suponga que el n*mero total de datos es BF

BB 'edondee los siguientes n*meros a una cifra decimal-
a BCDA b DADEF c BFFOEF d CBMED e AEACG
BD +ara cada uno de los con)untos de datos correspondientes a los problemas Eb y Ec,
demuestre que T1
D
` 2T13
D
BA . partir de los datos 1
B
R A, 1
D
R C, 1
A
R O y 1
C
R BD, determine usted los
valores de las siguientes e"presiones 2esta pregunta corresponde a la nota DB3

BC 'edondee cada uno de los siguientes n*meros a una cifra decimal y a dos cifras
decimales
a CBCGD
b CBEFB
c CBMEF
d CBPEF
NOT!S
DB 9uchos libros de te"to incluyen un anlisis de otras reglas para la sumatoria,
como la sumatoria de una variable ms una constante, la sumatoria de una variable por una
constante, etc (omo estos conceptos no son necesarios para comprender el material de este
libro, no los incluimos en el cuerpo principal del te"to, pero hemos presentado aqu ese
material %l conocimiento de las reglas de la sumatoria puede ser muy *til como
antecedente para los cursos de estadstica que se imparten en el nivel de posgrado
La estadistica y el mtodo cientfico - %5 -
ReFla 1 La suma de los valores de una variable ms una constante es igual a la suma
de los valores de la variable ms 8 veces la constante %n forma de ecuaci#n, se representa
as-
La validez de esta ecuaci#n se puede apreciar mediante la sencilla demostraci#n
algebraica que presentaremos a continuaci#n-
+ara ilustrar el uso de esta ecuaci#n, suponga que queremos calcular la suma de los
siguientes datos con la constante A sumada a cada uno de ellos-
ReFla % La suma de los valores de una variable menos una constante es igual a la
suma de los valores de la variable menos 8 veces la constante %n forma de ecuaci#n

La demostraci#n algebraica de esta ecuaci#n es la siguiente-
+ara ilustrar el uso de esta ecuaci#n, suponga que queremos determinar la suma de los
siguientes datos con la constante D restada de cada uno-

ReFla ' La suma de una constante por el valor de una variable es igual a la constante
multiplicada por la suma de los valores de la variable %n forma de ecuaci#n,

La estadistica y el mtodo cientfico - %9 -
. continuaci#n demostraremos la validez de esta ecuaci#n-

+ara ilustrar el uso de esta ecuaci#n, suponga que queremos determinar la suma
de C por cada uno de los siguientes datos-
ReFla (4 La suma de una constante dividida entre los valores de una variable es igual a
la constante, dividida entre la suma de los valores de la variable %n forma de ecuaci#n,
. continuaci#n demostraremos la validez de esta ecuaci#n-
Jeamos una vez ms un e)emplo para ilustrar el uso de esta ecuaci#n Suponga que
queremos determinar la suma de cada uno de los siguientes datos divididos entre C-
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - %; -
INTRODUCCINB DISTRI?UCIONS D )RCUNCI!S NO !>RU*!D!S
Supongamos que le acaban de devolver su primer e"amen de estadstica y que en l
obtuvo una calificaci#n de GM %s natural que sienta inters por saber qu tan bueno fue ese
resultado con respecto a los dems estudiantes !sted tiene muchas preguntas que hacer-
cuntos estudiantes obtuvieron GM?, hubo muchas calificaciones ms altas que la suya?,
cuntas calificaciones fueron ms ba)as que la de usted? Las calificaciones en bruto del
e"amen se presentan desorganizadas en la tabla AB .unque en ella aparecen todas las
calificaciones, resulta difcil entenderlas por la forma en la que han sido dispuestas en dicha
tabla !n arreglo ms eficiente, y que tiene mayor significado, podra consistir en listar las
calificaciones seg*n su frecuencia de aparici#n %sta lista se conoce como una distribuci"n de
frecuencias.

=na dist$i+#ci&n de f$ec#encias presenta los valores de los datos ' la frecuencia con que se
presentan. .l ser mostrados en una tabla, los valores de los datos se presentan en orden y, por
lo general, el valor del dato ms ba)o aparece en la parte inferior de la tabla
Las calificaciones de la tabla AB han sido dispuestas seg*n una distribuci#n de frecuencias
que se presenta en la tabla AD .hora los datos tienen mayor significado %n primer lugar,
resulta fcil observar que hay D calificaciones de GM .dems, cuando sumamos las frecuencias
apropiadas 2f3 podemos determinar cul es el n*mero de calificaciones mayores que y menores
que GM Se puede ver que hay BE calificaciones ms altas y EA calificaciones ms ba)as que la de
usted 0ambin es fcil determinar el rango de los datos en una distribuci#n de frecuencias %n
el caso del e"amen de estadstica, las calificaciones variaron en un rango de entre CM y PP .
partir de este e)emplo podemos ver que el ob)etivo principal de una distribuci#n de
frecuencias consiste en presentar los datos de una manera que facilite su comprensi#n e
interpretaci#n
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - %= -

D!TOS !>RU*!DOS
(uando se dispone de muchos datos con un rango muy amplio, como en el caso del
e"amen de estadstica que estamos considerando, la enumeraci#n de los datos individuales
produce muchos valores cuya frecuencia es cero 2nula3 y el resultado es una presentaci#n en la
que resulta difcil visualizar la forma de la distribuci#n y su tendencia central %n estas
condiciones, los datos individuales se agrupan por lo general en intervalos de clase y se
presentan como una distribuci"n de frecuencias de datos agrupados. La tabla AA muestra las
calificaciones del e"amen de estadstica agrupadas en dos distribuciones de frecuencias, una en
la que cada intervalo tiene D unidades de amplitud y la otra con intervalos de BP unidades de
amplitud
.l agrupar datos, uno de los puntos importantes consiste en determinar cul ser la amplitud
de cada intervalo (ada vez que los datos son agrupados se pierde un poco de informaci#n
9ientras ms amplio sea el intervalo, ms informaci#n se perder +or e)emplo, considere la
distribuci#n que aparece en la tabla AA con intervalos de BP unidades de amplitud .unque este
amplitud de intervalo produce una presentaci#n suave 2no e"isten frecuencias nulas3, se ha
perdido mucha informaci#n +or e)emplo, c#mo estn distribuidas las AG calificaciones en el
intervalo de OM a PC?, estn en PC? o en OM? o estn distribuidas de manera uniforme en todo
el intervalo? La cuesti#n es que no sabemos c#mo estn distribuidas en el intervalo 4emos
perdido esa informaci#n al agrupar los datos 7bserve que mientras ms amplio sea el intervalo,
mayor ser la ambigaedad
,ebe parecer obvio que mientras menor sea el intervalo, tanto ms fielmente se
preservarn los datos originales %l caso e"tremo se presenta cuando la amplitud del intervalo
se reduce a una sola unidad, con lo cual regresamos a la situaci#n de los datos individuales
Sin embargo, cuando el intervalo se vuelve demasiado estrecho, nos encontramos con los
mismos problemas que en el caso de los datos individuales/ a saber, valores cuya frecuencia es
nula y una presentaci#n poco clara en lo referente a la forma de la distribuci#n y su tendencia
central La distribuci#n de frecuencias con intervalos de D unidades de amplitud que aparece en
la tabla AA es un e)emplo en el cual los intervalos son demasiado peque&os
+or la e"plicaci#n anterior podemos ver que, al agrupar los datos, hay que resolver el
dilema entre perder informaci#n y tener una presentaci#n visual significativa +ara lograr lo
me)or de ambas opciones debemos elegir una amplitud de intervalo que no sea ni muy amplia ni
muy estrecha %n la prctica, determinamos de ordinario la amplitud del intervalo dividiendo la
distribuci#n en un total de BF a DF intervalos . lo largo de los a&os se ha demostrado que este
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '@ -
rango de intervalos funciona bien con la mayor parte de las distribuciones ,entro de este rango,
el n*mero especfico de intervalos que se utilice depender del n*mero y el rango de los datos
en bruto 7bserve que mientras ms intervalos utilice, tanto ms estrecho ser cada uno de
stos
%laboraci#n de una distribuci#n de frecuencias de datos agrupados
Los pasos para hacer una distribuci#n de frecuencias para datos agrupados son los
siguientes-
B %ncontrar el rango de los datos
D ,eterminar la amplitud de cada intervalo de clase 2i3
A 4acer una lista con los lmites de cada intervalo de clase, colocando en la parte inferior
de la misma al intervalo que contenga el dato ms peque&o 2mnimo3
4acer una lista con los lmites de cada intervalo de clase, colocando en la parte inferior de la
misma al intervalo que contenga el dato ms peque&o 2mnimo3
C (ontar los datos en bruto contenidos en los intervalos de clase correspondientes E
Sumar las cuentas de cada intervalo para obtener la frecuencia del intervalo
.pliquemos estos pasos a los datos de la tabla AB
%. #eterminaci"n del rango.
'ango R ,ato m"imo menos dato mnimo R PP I CM R EA
D #eterminaci"n de la amplitud del intervalo >i&. Supongamos que nos interesa agrupar los
datos en BF intervalos de clase apro"imadamente
(uando i tenga un residuo decimal, deberemos aplicar la regla y redondear i al mismo
n*mero de cifras decimales que aparece en los datos en bruto .s pues, i se redondea a E
?. La lista de los intervalos. (omenzaremos con el intervalo inferior %l primer paso
consiste en determinar el lmite inferior de dicho intervalo 4ay dos requisitos que deben
cumplirse-
a %l lmite inferior de este intervalo debe ser tal que el intervalo contenga al dato
mnimo
b Se acostumbra hacer que el lmite inferior de este intervalo sea e"actamente
divisible entre i
%n virtud de estos dos requisitos, al lmite inferior se le asigna el valor del dato ms
peque&o 2o mnimo3 de la distribuci#n si ste es e"actamente divisible entre i Si no lo es,
entonces el lmite inferior es asignado al siguiente valor ms peque&o que sea e"actamente
divisible entre i %n nuestro e)emplo, el lmite inferior del intervalo ms ba)o comienza en CE,
ya que la calificaci#n mnima 2CM no es e"actamente divisible entre E3
!na vez que hemos determinado el lmite inferior del primer intervalo, ya podemos hacer
la lista de todos los intervalos (omo cada intervalo tiene E unidades de amplitud, el
intervalo inferior abarca de CE a CP .unque podra parecer que este intervalo tiene s#lo C
unidades de amplitud, en realidad tiene E Si tiene alguna duda, bastar que cuente las
unidades 2CE, CM, CO, CG, CP3 .l listar los dems intervalos, debemos cerciorarnos de que los
intervalos son continuos y mutuamente e"cluyentes (on esta e"presi#n 2mutuamente
e"cluyentes3 queremos decir que los intervalos deben ser tales, que ning*n dato podr
quedar incluido de manera vlida en ms de un intervalo .plicando estas reglas obtenemos
los intervalos que aparecen en la tabla AC 7bserve que, seg*n la e"posici#n sobre anlisis de
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '1 -
los lmites reales presentada en el captulo D, los intervalos de clase que aparecen en la
primera columna representan lmites aparentes Los limite, reales se encuentran en la
segunda columna La forma usual de hacerlo consiste en listar s#lo los lmites aparentes de
cada intervalo y omitir de la lista los lmites reales Seguiremos esta prctica en los e)emplos
subsecuentes
@. Conteo de los datos. . continuaci#n, introducimos los datos en bruto en los intervalos
de clase adecuados %ste conteo es un procedimiento por el cual se repasa toda la distribuci#n
de manera sistemtica, de modo que por cada dato en bruto se escribe una raya vertical )unto
al intervalo que contiene a dicho dato .s_ pues, para PE 2la primera calificaci#n de la tabla
AB3 colocamos una raya en el intervalo PEIPP 4emos seguido este procedimiento con todas las
calificaciones , de este modo obtuvimos los resultados que aparecen en la tabla AC
+. Auma de frecuencias. +or *ltimo, las rayas del recuento se convierten en
frecuencias, al sumar todas las que corresponden a cada intervalo %stas frecuencias se
muestran tambin en la tabla AC
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '% -

0ratemos de resolver un problema en plan de prctica . partir de los siguientes PF datos,
haga una distribuci#n de frecuencias de datos agrupados que tenga BD intervalos
apro"imadamente

SOLUCIN
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '' -
14 $ncuentre el rango. 'ango R dato m"imo I dato mnimo R BAG I DD R BBM (.
#etermine la amplitud del intervalo >i&:
?. Baga una lista de los lmites de cada intervalo de clase. %n virtud de que el dato
mnimo de la distribuci#n 2DD3 no es divisible de manera e"acta entre i, el lmite inferior del
primer intervalo es DF +or qu DF? +orque es el siguiente valor inferior que es e"actamente
divisible entre BF Los lmites de cada intervalo de clase aparecen listados en la tabla AE
@. <egistre los datos en bruto en los intervalos de clase adecuados. %sto se llev# a cabo en la
tabla AE
+. Aume los registros de cada intervalo para obtener su frecuencia. %sto se llev# a cabo en la
tabla AE

SOLUCIN
1. $ncuentre el rango. 'ango R dato m"imo I dato mnimo R EF I FM R CC
(. #etermine la amplitud del intervalo >i&:
?. Liste los lmites de cada intervalo de clase. (omo el dato mnimo en la distribuci#n
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '( -
>..6& se puede dividir de manera e"acta entre i, sta se convierte en el lmite inferior del primer
intervalo Los lmites de cada intervalo aparecen en la tabla AM
@. <cgistre los datos en bruto en los intervalos de clase adecuados. %sto se llev# a cabo
en la tabla AM
+. Aume los registros de cada intervaloC para obtener su frecuencia. %sto se llev# cabo en
la tabla ?E
7bserve que en virtud de que la unidad de medici#n ms peque&a en los datos en bruto
es de FB, los limites reales para cualquier dato estbn a I FFE del dato mencionado .s, los
lmites reales para el intervalo CGIEd son COEIEFE
)$ec#encia $elati3a0 f$ec#encia ac#m#lada y dist$i+#ciones de -o$centaGes
ac#m#lados
. menudo se desea e"presar los datos de una distribuci#n de frecuencias como una
frecuencia relativa, como una frecuencia acumulada o como una distribuci#n de
porcenta)es acumulados
Una dist$i+#ci&n de f$ec#encias $elati3as indica la proporcin del
nmero total de datos que aparecen en cada intervalo.
Una dist$i+#ci&n de f$ec#encias ac#m#ladas indica el nmero de datos
que estn por debao del l!mite real superior de cada intervalo.
Una dist$i+#ci&n de -o$centaGes ac#m#lados indica el porcentae de
datos que estn por debao del l!mite real superior de cada intervalo.
La tabla AO muestra la distribuci#n de frecuencias de las calificaciones del e"amen de
estadstica, e"presadas como frecuencias relativas, frecuencias acumuladas y
distribuci#n de porcenta)es acumulados +ara convertir una distribuci#n de frecuencias
en una distribuci#n de frecuencias relativas dividimos la frecuencia de cada intervalo entre
el n*mero total de calificaciones .s,
+or e)emplo, para determinar la frecuencia relativa para el intervalo CEICP, dividimos
su frecuencia 2B3 entre la cantidad total de calificaciones 2OF3 disponibles +or
consiguiente, la frecuencia relativa que corresponde a este intervalo es de R BNOF

R FFB
La frecuencia relativa resulta *til porque nos indica la proporci#n de calificaciones que
est contenida en el intervalo
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '/ -
La frecuencia acumulada para cada intervalo se calcula sumando la frecuencia de
ese intervalo a las frecuencias de todos los intervalos de clase que estn deba)o de l
.s, la frecuencia acumulada para el intervalo MFIMC R C Y C Y D Y B R BB

%l porcenta)e acumulado de cada intervalo se determina convirtiendo las frecuencias
acumuladas en porcenta)es acumulados La ecuaci#n que se usa para esto es
-
+ara el intervalo MFIMC tenemos que-

Las distribuciones de frecuencias acumuladas y de porcenta)es acumulados son *tiles para
determinar percentiles y rangos percentiles
*RCNTILS
Los percentiles son medidas de posici#n relativa Se utilizan asiduamente en la educaci#n
con el fin de comparar el rendimiento de un individuo con el rendimiento de un grupo de
referencia
Un -e$centil o -#nto -$esentid es el valor sobre la escala de medicin, debao
del
cual se encuentra un porcentae dado de los datos incluidos en la
distribucin" i.
.s, el se"agsimo punto percentil es el valor sobre la escala de medida, deba)o del cual
est MFc de los datos de la distribuci#n
C.lc#lo de los -#ntos -e$centiles
Suponga usted que estamos interesados en calcular el quincuagsimo punto percentil
para las calificaciones del e"amen de estadstica %stas calificaciones han sido presentadas
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '5 -
en la tabla AG como distribuciones de frecuencias acumuladas y de porcenta)es
acumulados %mplearemos el smbolo
!+.
para representar al quincuagsimo punto percentil
$u entendemos por el quincuagsimo punto percentil? . partir de la definici#n de punto
percentil,
!+.
es el valor de la escala deba)o del cual se encuentra EFc de las calificaciones
(omo quiera que hay en total OF calificaciones en la distribuci#n,
!+.
debe ser el valor deba)o
del cual se encuentran AE calificaciones 2EFc de OF es AE3 .l observar la columna de las
frecuencias acumuladas y desplazarnos de aba)o hacia arriba, vemos que +
+.
se localiza en
el intervalo OEIOP Sin embargo, en este momento no sabemos qu valor de la escala
debemos asignar a +
+.
.

Lo *nico que sabemos es que le corresponde alg*n valor dentro de
los lmites reales del intervalo OEIOP, que son OCE y OPE +ara determinar el punto en el cual
se localiza +
so
,

suponemos que todas las calificaciones estn distribuidas de manera uniforme
en todo el intervalo
%n vista de que DO de las calificaciones se encuentran deba)o de OCE, tenemos que
desplazarnos dentro del intervalo hasta obtener G calificaciones adicionales 2vase la figura
AB3 +uesto que e"isten BM calificaciones en el intervalo
I
y ste tiene E unidades de
amplitud en la escala, cada calificaci#n del intervalo ocupa ENBM de la unidad +ara obtener
G calificaciones adicionales, tenemos que desplazarnos +D%6

4 G R DE unidades dentro del
intervalo .l sumar DE al lmite inferior de OCE, llegamos a +
so


.s,
!+. R OCE Y DE R OOF
+ara determinar cualquier punto percentil, siga estos pasos-
%. #etermine la frecuencia de los datos que estn debajo del punto percentil.
Simbolizaremos esta frecuencia como ; f
p
acumulada;
f
p
acumulada R 2c de los datos que estn aba)o del punto percentil3 1 8
f
p
acumulada para + R EFc 1 2 5 2FEF3 x OF R AE
(. #etermine el lmite real inferior del intervalo que contiene al punto percentil.
Llamaremos a este lmite real inferior 4
L
.

.l conocer el n*mero de datos que estn
aba)o del punto percentil podemos localizar el intervalo que contiene al punto
percentil, comparando la fp acumulada con la frecuencia acumulada de cada
intervalo !na vez localizado el intervalo que contiene al punto percentil, podemos
encontrar de inmediato su lmite real inferior, 4
L
. %n este e)emplo, el intervalo que
contiene a +
+.
es OEIOP y su lmite real inferior, 4
L
es OCE

Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '9 -
?. #etermine el nmero de datos adicionales que deben considerarse en el intervalo
para alcan)ar el punto percentil.
+ara el e)emplo anterior,
C #etermine el nmero de unidades adicionales que debemos despla)ar en el intervalo
para obtener el nmero de datos adicionales.
7bserve que-
f
i
es el nmero de datos en el intervalo e
iDf nos proporciona el nmero de unidades por dato para dic0o intervalo
E #etermine el punto percentil. Logramos esto sumando las unidades adicionales al lmite
real inferior del intervalo que contiene al punto percentil
+unto percentil 5 4
L
Y !nidades adicionales
!+. 5 E@.+ F (.+ 5 EE...
+odemos escribir estos pasos en forma de ecuaci#n +or lo tanto,
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '; -
Si utilizamos esta ecuaci#n para calcular +
+.
obtenemos-
Hntentemos resolver otro problema %sta vez calcularemos !
(.
, es decir, el valor por deba)o
del cual se encuentra (., de las calificaciones
%n trminos de frecuencia acumulada, +
(.
es el valor por deba)o del cual se encuentran %@
calificaciones >(., de E. es BC3 +odemos ver en la tabla AG que +
(.
est en el intervalo 6+-6*. %n
vista de que BB calificaciones se encuentran aba)o del valor 6@.+, necesitamos A calificaciones
adicionales (onsiderando que hay E calificaciones en el intervalo y que ste tiene + unidades de
amplitud, debemos movernos
E
" A R (.%@ unidades en el intervalo .s,
+
(.
56@. +F(. %@566. 6@
0ambin podramos haber hallado +
(.
en forma directa, utilizando la ecuaci#n para el
punto percentil ,e esta manera,
Hntentemos resolver un problema ms %sta vez calcularemos +
OE
que es el valor de
la escala aba)o del cual se encuentra OEc de las calificaciones4
%n trminos de frecuencia acumulada, +O
+
es el valor de la escala por deba)o del
cual se localizan EDE calificaciones >f
p
5 E+, acumulado es igual a OEc de OF 2que es EDE
3 . partir de la tabla AG vemos que +
OE
est en el intervalo GFIGC (omo C calificaciones
se encuentran aba)o del lmite inferior de este intervalo
necesitamos agregar a OPE el n*mero adecuado de unidades de la escala para
tener EDE I CA R PE calificaciones adicionales (omo e"isten BF calificaciones en el intervalo y
ste tiene E unidades de amplitud, tendremos que desplazarnos
lo
1 PE R COE unidades
en el intervalo .s pues,
+
O
R OPE Y COE R GCDE
+
OE
tambin se puede determinar en forma directa, mediante la ecuaci#n para el
punto percentil .s,

Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - '= -
R!N>OS *RCNTILS
. veces queremos conocer el rango percentil de un dato en bruto +or e)emplo, como la
calificaci#n que usted obtuvo en el e"amen de estadstica fue de GM, le podra ser *til conocer
el rango percentil de este valor
l $anFo percentil de un dato es el porcentae de datos que tienen
valores ms baos que el dato en cuestin
C.lc#lo de $anFos -e$centiles
%sta situaci#n es e"actamente la opuesta a la anterior, en la que calculbamos un punto
percentil .hora conocemos el dato y necesitamos calcular el porcenta)e de datos que estn por
deba)o de l !na vez ms, debemos suponer que los datos dentro de la totalidad de cualquier
intervalo estn distribuidos de manera uniforme %n la columna de intervalos de clase de la
tabla AP podemos ver que la calificaci#n de GM se encuentra en el intervalo GEIGP %"isten EA
calificaciones que estn aba)o de GCE, el lmite inferior de este intervalo %n virtud de que
e"isten O calificaciones en el intervalo y ste tiene E unidades de amplitud, hay ONE
calificaciones por cada unidad de la escala %ntre una calificaci#n de GM y GCE, e"isten 2ONE3
2GM I GCE3 R DB calificaciones adicionales +or lo tanto, hay en total EA Y DB R EEB
calificaciones que estn por deba)o de GM (omo quiera que la distribuci#n tiene OF
calificaciones, el rango percentil de GM R 2EEBNOF3

1 BFF R OGOB
'esumiremos estas operaciones en la siguiente ecuaci#n-

.l utilizar esta ecuaci#n para determinar el rango percentil de GM, obtenemos

'esolvamos otro problema para practicar ,etermine el rango percentil de EP La
calificaci#n de EP se encuentra en el intervalo EEIEP %"isten A calificaciones que estn por
deba)o de ECE %n virtud de que e"isten C calificaciones dentro del intervalo, hay 2CNE3 2EP I
ECE3 R AM calificaciones dentro del intervalo que se encuentran aba)o de EP %n total, hay A Y
AM R MM calificaciones por deba)o de EP .s pues, el rango percentil de EP R 2MF3 1 %.. R PCA
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (@ -

Jamos a resolver otro problema de prctica (on la distribuci#n de frecuencias de las
calificaciones agrupadas de la tabla AE, determine el rango percentil de una calificaci#n
de BBO
La calificaci#n de BBO se encuentra en el intervalo BBFIBBP %l lmite inferior de este
intervalo es BFPE %"isten M Y O Y BB Y BA Y BE Y BD Y G Y O Y C R GA calificaciones por
deba)o de BFPE +uesto que hay A calificaciones dentro del intervalo y ste tiene BF unidades
de amplitud, e"isten 2ANBF3 2BBO I BFPE3 R DDE calificaciones dentro del intervalo que se
localizan aba)o de la calificaci#n de BBO %n total, e"isten GA Y DDE R GEDE calificaciones que
se encuentran por deba)o de la calificaci#n de BBO .s pues, el rango percentil de BBO R
2GEDENPF3

1 BFF R PCOD
0ambin podramos haber resuelto este problema mediante la ecuaci#n del rango
percentil .s,

>R!)IC!CIN D L!S DISTRI?UCIONS D )RCUNCI!S
Las distribuciones de frecuencias se representan a menudo por medio de grficas y no
en forma de tablas %n virtud de que la grfica se basa por completo en los datos de una
tabla, no contiene informaci#n nueva Sin embargo, una grfica presenta los datos de una
manera visual, lo cual frecuentemente facilita la tarea de observar las caractersticas
importantes de los datos .l escribir esta secci#n, hemos supuesto que usted est
familiarizado con la elaboraci#n de grficas +ues bien, aun en este caso, valdr la pena
repasar unos cuantos puntos importantes-
B !na grfica tiene dos e)es- uno vertical y el otro horizontal %l e)e vertical es el e)e de
las ordenadas o e)e G, ' el horizontal es el e)e de las abscisas o e)e 4.
D La variable independiente se coloca muy a menudo en el e)e 1 y la variable deI
pendiente en el e)e > .l trazar la grfica de una distribuci#n de frecuencias, los valores de los
datos se colocan de ordinario en el e)e 1 y la frecuencia de los valores de los datos se registran
en el e)e >
A %s necesario elegir las unidades apropiadas para registrar los datos en los e)es
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (1 -
C +ara evitar la distorsi#n de los datos, se acostumbra colocar la intersecci#n de los dos
e)es en el punto cero y despus se eligen sus escalas, de manera que la altura de los datos
graficados sea ms o menos de las tres cuartas partes de la anchura La figura AD muestra la
forma en que la infracci#n de esta regla puede deformar la impresi#n que la grfica produce
La figura muestra dos grficas basadas en los mismos datos, a saber, el n*mero de
estudiantes inscritos en una universidad grande durante los a&os BPPFIDFFD %n la parte 2a3
se ha respetado la regla mencionada con anterioridad %n la parte 2b3, la escala
correspondiente al e)e de las ordenadas no comienza en cero y se muestra
considerablemente e"pandida, en comparaci#n con la parte 2a3 Las impresiones que
producen una y otra grfica son muy diferentes La parte 2a3 produce la impresi#n correcta
de que la poblaci#n estudiantil fue muy estable, mientras que la parte 2b3 distorsiona en gran
medida los datos y produce la impresi#n de que hubo grandes fluctuaciones en la poblaci#n
universitaria
E +or lo general, la intersecci#n de los dos e)es se encuentra en cero, en ambas escalas
(uando no es as, esto se indica simbolizando una ruptura en el e)e correspondiente, cerca
de la intersecci#n +or e)emplo, en la figura AC aparece una ruptura en el e)e horizontal
para indicar que una parte de la escala ha sido suprimida
M (ada e)e debe tener un letrero y el ttulo de la grfica debe ser breve y e"plcito
.l graficar distribuciones de frecuencias, se utilizan principalmente cuatro tipos de
grficas- la grfica de barras, el 0istograma, el polgono de frecuencias ' la curva de porcentajes
acumulados.
La F$.fica de +a$$as
Se acostumbra graficar las distribuciones de frecuencias de los datos nominales u
ordinales por medio de una grfica de barras %ste tipo de grfica se ilustra en la figura AA
Se traza una barra para cada categora y la altura de la barra representa la frecuencia o
el n*mero de miembros de esa categora (omo no e"iste una relaci#n numrica entre las
categoras de los datos nominales, podemos organizar los diversos grupos en cualquier
orden a lo largo del e)e horizontal %n la figura AA estn ordenados de izquierda a derecha,
seg*n la magnitud de la frecuencia de cada categora 7bserve que, en este tipo de grfica, las
barras de cada categora no se tocan entre s %sto hace a*n ms patente la ausencia de una
relaci#n cuantitativa entre las distintas categoras
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (% -
l HistoF$ama
%l histograma se utiliza para representar distribuciones de frecuencias constituidas por
datos de intervalos o de razones 2proporciones3 Se aseme)a a la grfica de barras, salvo porque
en el histograma se traza una barra para cada intervalo de clase Los intervalos de clase se
localizan sobre el e)e horizontal, de modo que cada barra de clase comienza y termina en los
lmites reales del intervalo La altura de la barra corresponde a la frecuencia del intervalo de
clase representado (omo quiera que sea los intervalos son continuos, las barras verticales se
deben tocarse entre s, en lugar de estar espaciadas como en las grficas de barras La figura
AC muestra las calificaciones del e"amen de estadstica 2tabla AC3 representadas mediante
un histograma 7bserve que se acostumbra marcar el punto medio de cada intervalo de
clase sobre la abscisa Las calificaciones agrupadas aparecen de nuevo en la figura para
comodidad de usted
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (' -
l -olFono de f$ec#encias
%l polgono de frecuencias tambin se utiliza para representar datos de intervalo o de
raz#n %l e)e horizontal es idntico al del histograma Sin embargo, en este tipo de grfica, en
lugar de utilizar barras, se marca en la grfica un punto que corresponde al punto medio de
cada intervalo, a una altura correspondiente a la frecuencia del intervalo . continuaci#n se
unen los puntos marcados, mediante lneas rectas +or *ltimo, la lnea que une los puntos se
prolonga para que corte el e)e horizontal en el punto medio de los dos intervalos de clase
contiguos al primero y al *ltimo de los intervalos donde estn contenidos los datos (on esta
manera de cerrar la figura con el e)e horizontal, se forma un polgono del cual recibe su
nombre esta grfica La figura AE muestra las calificaciones de la tabla AC como un
polgono de frecuencias La principal diferencia entre un histograma y un polgono de
frecuencias es la siguiente- el histograma e"hibe las calificaciones como si estuvieran
distribuidas de manera uniforme en el intervalo, mientras que el polgono de frecuencias
muestra las calificaciones como si todas estuviesen concentradas en el punto medio del
intervalo .lgunos investigadores prefieren emplear el polgono de frecuencias para comparar
la forma de dos o ms distribuciones Los polgonos de frecuencias tambin tienen el efecto
de presentar los datos como si tuviesen una distribuci#n continua, lo cual ocurre en realidad
en muchos casos
La c#$3a de -o$centaGe ac#m#lado
0ambin las distribuciones de frecuencia acumulada y de porcenta)e acumulado pueden
presentarse en forma grfica S#lo ilustraremos la segunda de ellas, ya que las grficas son
esencialmente las mismas y las distribuciones de porcenta)es acumulados se emplean ms a
menudo !sted recordar que el porcenta)e acumulado para un intervalo de clase indica el
porcenta)e de datos que estn por deba)o del lmite real superior del intervalo .s, el e)e
vertical utilizado para la curva de porcenta)es acumulados se presenta en !nidades de
porcenta)es acumulados %n el e)e horizontal, en lugar de dibu)ar los puntos en el punto medio
de cada intervalo de clase, los marcamos en el lmite real superior del intervalo La figura AM
muestra las calificaciones de la tabla AO representadas como una curva de porcenta)es
acumulados ,ebe ser evidente que la curva de frecuencias acumuladas tendra la misma
forma, siendo la *nica diferencia que esta *ltima se grfica en unidades de frecuencias
acumuladas y no de porcenta)es acumulados Los percentiles y los rangos percentiles se
pueden leer directamente a partir de una curva de porcenta)es acumulados La curva de
porcenta)es acumulados recibe tambin el nombre de ojiva, con lo cual se indica que tiene la
forma de una A
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (( -
)o$ma de las c#$3as de f$ec#encia
Las distribuciones de frecuencias pueden tener formas muy diversas .lgunas de las
formas que se presentan con ms frecuencia estn en la figura AO Las curvas se clasi fican,
en general como sim/tricas o asim/tricas 2sesgadas3
Una curva es sim#trica si al doblarla a la mitad sus dos lados coinciden. $i
una curva no es sim#trica, entonces es asim#trica.
Las curvas que aparecen en la figura AO2a3, 2b3 y 2c3 son simtricas Las curvas 2d3, 2e3 y
2f3 son asimtricas Si una curva es asimtrica, puede tener sesgo -ositi3o o neFati3o4
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (/ -
(uando una curva est sesgada en fo$ma -ositi3a0 la mayor parte de los datos se
concentra en los valores ba)os del e)e horizontal y la curva disminuye hacia el e"tremo de los
valores altos (uando una curva est sesgada en fo$ma neFati3a0 la mayor parte de los datos
se concentra en los valores altos del e)e horizontal y la curva se reduce hacia el e"tremo de los
valores ba)os
La curva de la parte 2e3 est sesgada en forma positiva y la curva de la parte 2f3 est
sesgada en forma negativa
Las curvas de frecuencias son designadas a menudo seg*n su forma .s, a las curvas de
las partes 2a3, 2b3, 2c3 y 2d3 se las denomina, respectivamente, curvas en forma de campana,
rectangulares o uniformes, en forma de ! y en forma de 5
*R>UNT!S 7 *RO?LM!S
B ,efina cada uno de los conceptos de la secci#n ;0rminos importantes;
D %n qu difiere la elaboraci#n de las grficas de barras, los histogramas y los polgonos
de frecuencias? $u tipo de escala es adecuada para cada una?
La tabla siguiente muestra los salarios promedio anuales de varias categoras de
cientficos que ostentan doctorados, en %stados !nidos, en DFFD 4aga una grfica de barras
para representar estos datos, colocando ;Salario anual; sobre el e)e >, y ;(ategora de
cientfico; sobre el e)e 1 7rdene las categoras de manera que los salarios decrezcan de
izquierda a derecha
A !n estudiante de posgrado ha reunido datos acerca de MM calificaciones . partir de
estos datos, ha hecho dos distribuciones de frecuencias de datos agrupados, las cuales
presentamos a continuaci#n
%ncuentra usted alg*n error en esas distribuciones? %"plique
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (5 -
M Las siguientes calificaciones fueron obtenidas en un e"amen de letras inglesas por
los miembros de un grupo de segundo grado de una universidad-
a 4aga una distribuci#n de frecuencias para los datos no agrupados 2i R B3
b 4aga una distribuci#n de frecuencias de datos agrupados que tenga BE intervalos
apro"imadamente Liste los lmites aparentes y tambin los reales de cada intervalo
c %labore un histograma para la distribuci#n de frecuencias construida en la parte b
d %s asimtrica o simtrica la distribuci#n? Si est sesgada, lo est en forma
positiva o negativa?
e 4aga un diagrama de tallo y ho)as, en el que el *ltimo dgito sea una ho)a y el primero
sea un tallo Hncluya dos veces los valores en los tallos
f (ul diagrama le gusta ms, el histograma de la parte c o el diagrama de tallo y ho)as
de la parte e? %"plique educaci#n
M %"prese la distribuci#n de frecuencias agrupadas obtenida en la parte b del problema E
como una distribuci#n de frecuencias relativas, de frecuencias acumuladas y de porcenta)es
acumulados educaci#n
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (9 -
O !tilice la frecuencia acumulada obtenida en el problema M y determine-
a. !
E+
b +
CF
educaci#n
G !se otra vez la distribuci#n acumulada y los datos agrupados obtenidos en el
problema M y determine-
a %l rango percentil de una calificaci#n de GB
b %l rango percentil de una calificaci#n de MM
c %l rango percentil de una calificaci#n de GO
ed#caci&n
P %labore un histograma de la distribuci#n de las calificaciones agrupadas del e"amen de
letras inglesas, obtenida en el problema Eb educaci#n
BF Los siguientes datos muestran la cantidad de peso 2en libras3 perdido por cada paciente
de una clnica para el control del peso durante el *ltimo a&o-
a 4aga una distribuci#n de frecuencias de los datos agrupados con BF intervalos
apro"imadamente
b %labore un histograma de la distribuci#n de frecuencias obtenida en la parte a
c %s asimtrica o simtrica la distribuci#n? Si est sesgada, lo est en forma positiva o
negativa?
d 'ealice un diagrama de tallo y ho)as donde el *ltimo dgito sea una ho)a y el primer dgito
sea un tallo 'epita dos veces los valores del tallo e (ul diagrama le gusta ms, el histograma
de la parte b o el diagrama de tallo y ho)as de la parte d? %"plique clnica, salud
BB (onvierta la distribuci#n de frecuencias agrupadas de las prdidas de peso, determinada
en el problema BF, en una distribuci#n de frecuencias relativas y en una distribuci#n de
frecuencias acumuladas clnica, salud
BD !tilice la distribuci#n de frecuencias acumuladas obtenida en el problema BB y
determine-
a +
EF
b +
DE
clnica, salud
BA !tilice una vez ms la distribuci#n de frecuencias acumuladas obtenida en el
problema BB y determine-
a %l rango percentil de un dato de CB
b %l rango percentil de un dato de DG clnica, salud
BC 4aga un polgono de frecuencias a partir de la distribuci#n de frecuencias agrupadas
determinada en el problema BF %s simtrica la curva? Si no lo es, tiene sesgo positivo o
negativo? clnica, salud
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (; -
BE !na universidad peque&a utiliza el sistema de calificaci#n de F a CF, donde CF es la
calificaci#n ms alta posible Las calificaciones que aparecen a continuaci#n son los promedios
de las calificaciones de los estudiantes inscritos actualmente en las licenciaturas de psicologa de
esa universidad
a 4aga una distribuci#n de frecuencias para los datos agrupados, con BF intervalos
apro"imadamente
b %labore un histograma para la distribuci#n de frecuencias obtenida en la parte a
c %s asimtrica o simtrica la distribuci#n? Si est sesgada, su sesgo es positivo o
negativo?
d 'ealice un diagrama de tallo y ho)as donde el *ltimo dgito sea una ho)a y el primer
dgito sea un tallo 'epita cinco veces los valores de los tallos
e (ul diagrama le gusta ms, el histograma de la parte b o el diagrama de tallo y ho)as
de la parte d? %"plique educaci#n
BM +ara las calificaciones agrupadas del problema BE, determine-
a +
EF
b +
DF
ed#caci&n
BO %l promedio de las calificaciones de Sarah es de AB 0omando como base la
distribuci#n de frecuencias de las calificaciones agrupadas obtenidas en el parte a, cul es el
rango percentil del promedio de las calificaciones de Sarah? ed#caci&n
BG Seg*n la poltica de la universidad del problema BE, el estudiante debe tener un
promedio de calificaciones de DE o mayor como requisito para que se le otorgue un ttulo en
psicologa
a . partir de los datos no agrupados que aparecen en el problema BE, qu porcenta)e de
los estudiantes actuales de psicologa necesita me)orar sus calificaciones?
b 0omando como base la distribuci#n de frecuencias obtenida para las calificaciones
agrupadas, qu porcenta)e de los estudiantes necesita me)orar sus calificaciones?
c %"plique la diferencia entre las respuestas a las partes a y b educaci#n
BP 4aga un polgono de frecuencias utilizando la distribuci#n de calificaciones agrupadas
obtenida en el problema BE La curva es simtrica, o tiene sesgo positivo o negativo?
Dist$i+#ciones de )$ec#encias -a$a datos no aF$#-ados y aF$#-ados - (= -
DF %l departamento de psicologa de una universidad grande tiene su propio criadero de
ratas con prop#sitos de investigaci#n !n muestreo reciente de EF ratas tomadas del criadero
revel# los siguientes pesos para dichas ratas-
a 4aga una distribuci#n de frecuencias de datos agrupados con BB intervalos
apro"imadamente
b %labore un histograma de la distribuci#n frecuencias obtenida en la parte a
c La distribuci#n es simtrica o asimtrica?
d (onstruya un diagrama de tallo y ho)as en el que el *ltimo dgito sea una ho)a y los
dos primeros dgitos sean un tallo 8o repita los valores de los tallos
e (ul diagrama le gusta ms, el histograma o el diagrama de tallo y ho)as? +or qu?
biol#gica
DB (onvierta la distribuci#n de frecuencias de datos agrupados de los pesos de las
ratas obtenida en el problema DF, en una distribuci#n de frecuencias relativas, de
frecuencias acumuladas y de porcenta)es acumulados biol#gica
DD . partir de la distribuci#n de frecuencias acumuladas que obtuvo en el problema
DB, determine-
a +
EA
b. +
OE
biol#gica
DA !tilizando otra vez la distribuci#n de frecuencias acumuladas obtenida en el
problema DB determine-
a %l rango percentil de un dato de DOE
b %l rango percentil de un dato de ABG biol#gica
DC !na profesora est realizando investigaciones sobre las diferencias individuales de
los estudiantes en cuanto a su susceptibilidad para ser hipnotizados (omo parte del
e"perimento, la profesora decide administrar una parte de la %scala de Susceptibilidad
4ipn#tica de Stanford a GE estudiantes
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /@ -
Medidas de Tendencia Cent$al y ,a$ia+ilidad 1*osciIn2
%414 Int$od#cci&n
%n el capitulo anterior hemos visto como se pueden resumir los datos obtenidos del estudio
de una muestra 2o una poblaci#n3 en una tabla estadstica o un grafico 8o obstante, tras la
elaboraci#n de la tabla y su representaci#n grfica, en la mayora de las ocasiones resulta ms
eficaz dcondensarS dicha informaci#n en algunos n*meros que la e"presen de forma clara y
concisa Los fen#menos biol#gicos no suelen ser constantes, por lo que ser necesario que )unto a
una medida que indique el valor alrededor del cual se agrupan los datos, se asocie una medida
que haga referencia a la variabilidad que refle)e dicha fluctuaci#n
+or tanto el siguiente paso y ob)eto de este capitulo consistir en definir algunos tipos de
medidas 2estadsticos o parmetros3 que los sintetizan a*n ms
%s decir, dado un grupo de datos organizados en una distribuci#n de frecuencias 2o bien
una serie de observaciones sin ordenar3, pretendemos describirlos mediante dos o tres cantidades
sintticas %n este sentido pueden e"aminarse varias caractersticas, siendo las ms comunes-
La tendencia central de los datos/
La dispersi#n o variaci#n con respecto a este centro/
Los datos que ocupan ciertas posiciones
La simetra de los datos
La forma en la que los datos se agrupan
. lo largo de este capitulo, y siguiendo este orden, iremos estudiando Los estadsticos que
nos van a orientar sobre cada uno de estos niveles de informaci#n- valores alrededor de los cuales
se agrupa la muestra, la mayor o menor fluctuaci#n alrededor de esos valores, nos interesaremos
en ciertos valores que marcan posiciones caractersticas de una distribuci#n de frecuencias as
como su simetra y su forma
%4%4 stadsticos de tendencia cent$al
Las tres medidas ms usuales de tendencia central son-
la media,
la mediana,
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /1 -
la moda
%n ciertas ocasiones estos tres estadsticos suelen coincidir, aunque generalmente no es as
(ada uno de ellos presenta venta)as e inconvenientes que precisaremos mas adelante %n primer
lugar vamos a definir los conceptos anteriores
%4%414 La media
La media aritmtica de una variable estadstica es la suma de todos sus posibles valores,
ponderada por las frecuencias de los mismos %s decir, si la tabla de valores de una variable 1 es
la media es el valor que podemos escribir de las siguientes formas equivalentes-
Si los datos no estn ordenados en una tabla, entonces
!lF#nos incon3enientes de la media
La media presenta inconvenientes en algunas situaciones-
!no de ellos es que es muy sensible a los valores e"tremos de la variable- ya que todas las
observaciones intervienen en el calculo de la media, la aparici#n de una observaci#n e"trema,
harb que la media se desplace en esa direcci#n %n consecuencia, no es recomendable usar la
media como medida central en las distribuciones muy asimtricas
Si consideramos una variable discreta, por e)emplo, el n*mero de hi)os en las familias
espa&olas el valor de la media puede no pertenecer al con)unto de valores de la variable/ +or
e)emplo
X
R B, D hi)os
(onsideramos una variable discreta 1 cuyas observaciones en una tabla estadstica han
sido ordenadas de menor a mayor Llamaremos mediana,
Med al primer valor de la variable que de)a por deba)o de si al EFc de las observaciones
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /% -
%n el caso de variables continuas, las clases vienen dadas por intervalos, y aqu la formula
de la mediana se complica un poco ms 2pero no demasiado3- Sea 2lieB, lif el intervalo donde
hemos encontrado que por deba)o estn el EFc de las observaciones %ntonces se obtiene la
mediana a partir de las frecuencias absolutas acumuladas, mediante interpolaci#n lineal
2teorema de 0hales3 como sigue-
%sto equivale a decir que la mediana divide al histograma en dos partes de breas iguales a
]
+ropiedades de la mediana %ntre las propiedades de la mediana, vamos a destacar las
siguientes-
(omo medida descriptiva, tiene la venta)a de no estar afectada por las observaciones
e"tremas, ya que no depende de los valores que toma la variable, sino del orden de las mismas
+or ello es adecuado su uso en distribuciones asimtricas
%s de clculo rpido y de interpretaci#n sencilla
. diferencia de la media, la mediana de una variable discreta es siempre un valor de la
variable que estudiamos 2e) La mediana de una variable n*mero de hi)os toma siempre valores
enteros3
!n e)emplo de clculo de mediana
Sea 1 una variable discreta que ha presentado sobre una muestra las modalidades
Si cambiamos la *ltima observaci#n por otra anormalmente grande, esto no afecta a la
mediana, pero si a la media-
%n este caso la media no es un posible valor de la variable 2discreta3, y se ha visto muy
afectada por la observaci#n e"trema %ste no ha sido el caso para la mediana
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /' -
!n e)emplo de clculo de media y mediana
7btener la media aritmtica y la mediana en la distribuci#n ad)unta
,eterminar grficamente cul de los dos promedios es ms significativo
+ara ver la representatividad de ambos promedios, realizamos el histograma de la figura DA,
y observamos que dada la forma de la distribuci#n, la mediana es ms representativa que la
media
14%4'4 La moda
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /( -
Llamaremos moda a cualquier m"imo relativo de la distribuci#n de frecuencias, es decir,
cualquier valor de la variable que posea una frecuencia mayor que su anterior y su posterior
observaci#n
,e la moda destacamos las siguientes propiedades-
%s muy fcil de calcular
+uede no ser *nica
%4%4(4 Relaci&n ent$e media0 mediana y moda
%n el caso de distribuciones unimodales, la mediana est con frecuencia comprendida entre
la media y la moda 2incluso mas cerca de la media3 %n distribuciones que presentan cierta
inclinaci#n, es ms aconse)able el uso de la mediana Sin embargo en estudios relacionados con
prop#sitos estadsticos y de inferencia suele ser mas apta la media
BA stadsticos de *osici&n
Los estadsticos de posici#n van a ser valores de la variable caracterizados por superar a
cierto porcenta)e de observaciones en la poblaci#n 2o muestra3 0enemos fundamentalmente a los
percentiles como medidas de posici#n, y asociados a ellos veremos tambin los cuartiles, deciles y
cuarteles +ercentiles
+ara una variable discreta, se define el percentil de orden :, como la observaci#n, +:, que
de)a por deba)o de si el :c de la poblaci#n Jgase la figura DC %sta definici#n nos recuerda a la
mediana, pues como consecuencia de la definici#n es evidente que
%n el caso de una variable continua, el intervalo donde se encuentra +: h 2liIB, lif, se calcula
buscando el que de)a deba)o de si al :c de las observaciones ,entro de gl, +: se obtiene seg*n
la relaci#n
Medidas de Tendencia Cent$al y ,a$ia+ilidad - // -
C#a$tiles
Los cuartiles, $B, son un caso particular de los percentiles 4ay A, y se definen como-
Deciles
Se definen los deciles como los valores de la variable que dividen a las observaciones en BF
grupos de igual tama&o 9as precisamente, definimos ,B,,D, , ,P como-
Gem-lo de c.lc#lo de c#a$tiles con #na 3a$ia+le disc$eta
,ada la siguiente distribuci#n en el n*mero de hi)os de cien familias, calcular sus cuartiles
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /5 -
Gem-lo
(alcular los cuartiles en la siguiente distribuci#n de una variable continua-
Soluci#n-
B +rimer cuartel
D Segundo cuartil-
A 0ercer cuartil
%)emplo de cblculo de cuartiles con una variable continua 4an sido ordenados los pesos de
DB personas en la siguiente tabla-
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /9 -
%ncontrar aquellos valores que dividen a los datos en C partes con el mismo numero de
observaciones
Soluci#n- Las cantidades que buscamos son los tres cuartiles- $B, $D y $A +ara
calcularlos, le a&adimos a la tabla las columnas con las frecuencias acumuladas, para localizar
qu intervalos son los que contienen a los cuartiles buscados-
7bsrvese que $D R 9ed %sto es l#gico, ya que la mediana divide a la distribuci#n en dos
partes con el mismo n^mero de observaciones, y $D, hace lo mismo, pues es de)a a dos cuartos
de los datos por arriba y otros dos cuartos por aba)o
Gem-lo
La distribuci#n de una variable tiene por polgono acumulativo de frecuencias el de la figura
DE Si el n^mero total de observaciones es EF-
B %laborar una tabla estadstica con los siguientes elementos- intervalos, marcas de clase,
frecuencia absoluta, frecuencia absoluta acumulada, frecuencias relativa y frecuencias relativa
acumulada
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /; -
D (untas observaciones tuvieron un valor inferior a BF, cuntas inferior a G y cuntas
fueron superior a BB
A ,etermine los cuartiles
Sol#ci&nB
B %n la siguiente tabla se proporciona la informaci#n pedida y algunos clculos au"iliares
que nos permitirn responder a otras cuestiones
D (alculemos el n*mero de observaciones pedido-
Medidas de Tendencia Cent$al y ,a$ia+ilidad - /= -
%4(4 Medidas de 3a$ia+ilidad o dis-e$si&n
Los estadsticos de tendencia central o posici#n nos indican donde se sit*a un grupo de
puntuaciones Los de variabilidad o dispersi#n nos indican si esas puntuaciones o valores estn
pr#"imas entre si o si por el contrario estn o muy dispersas
%4(414 RanFo
!na medida razonable de la variabilidad podra ser la amplitud o rango, que se obtiene
restando el valor mas ba)o de un con)unto de observaciones del valor mas alto
%ropiedades del ran&o
%s fcil de calcular y sus unidades son las mismas que las de la variable 8o utiliza todas
las observaciones 2s#lo dos de ellas3/ Se puede ver muy afectada por alguna observaci#n e"trema/
%l rango aumenta con el n*mero de observaciones, o bien se queda igual %n cualquier caso
nunca disminuye
%4(4%4 ,a$ianEa
La varianza, S
D
, se define como la media de las diferencias cuadrticas de n puntuaciones
con respecto a su media aritmtica, es decir
%sta medida es siempre una cantidad positiva, con propiedades interesante para la
realizaci#n de inferencia estadstica (omo sus unidades son las del cuadrado de la variable, es
mas sencillo usar su raz cuadrada, que es la que vemos en la siguiente secci#n
%4(4'4 Des3iaci&n t-ica o est.nda$
La varianza no tiene la misma magnitud que las observaciones 2e) si las observaciones se
miden en metros, la varianza lo hace en metros cuadrados Si queremos que la medida de
dispersi#n sea de la misma dimensionalidad que las observaciones bastara con tomar su raz
cuadrada +or ello se define la desviaci#n tpica, S, como
%4(4(4 Gem-lo de cJlc#lo de medidas de dis-e$si&n
(alcular el rango, varianza y desviaci#n tpica de las siguientes cantidades medidas en
metros-
A, A, C, C, E
Medidas de Tendencia Cent$al y ,a$ia+ilidad - 5@ -
Soluci#n- %l rango de esas observaciones es la diferencia entre la mayor y menor de ellas, es
decir, EeA R D +ara calcular las restantes medidas de dispersi#n es necesario calcular
previamente el valor con respecto al cual vamos a medir las diferencias i%ste es la media-
" R 2A Y A Y C Y C Y E3NE R A, G metros
La varianza es-
siendo la desviaci#n tpica su raz cuadrada-
%ropiedades de la varianza y desviacin t!pica
.mbas son sensibles a la variaci#n de cada una de las puntuaciones, es decir, si una
puntuaci#n cambia, cambia con ella la varianza La raz#n es que si miramos su definici#n, la
varianza es funci#n de cada una de las puntuaciones
La desviaci#n tpica tiene la propiedad de que en el intervalo
Se encuentra, al menos, el OEc de las observaciones Hncluso si tenemos muchos datos y
estos provienen de una distribuci#n normal 2se definir este concepto mas adelante3, podremos
llegar al PE c 8o es recomendable el uso de ellas, cuando tampoco lo sea el de la media como
medida de tendencia central
%4(4/4 Coeficiente de 3a$iaci&n
4emos visto que las medidas de centralizaci#n y dispersi#n nos dan informaci#n sobre una
muestra 8os podemos preguntar si tiene sentido usar estas magnitudes para comparar dos
poblaciones +or e)emplo, si nos piden comparar la dispersi#n de los pesos de las poblaciones de
elefantes de dos circos diferentes, S nos dar informaci#n ^til +ero qu ocurre si lo que
comparamos es la altura de unos elefantes con respecto a su peso? 0anto la media como la
desviaci#n tpica,
X
y S, se e"presan en las mismas unidades que la variable +or e)emplo, en la
variable altura podemos usar como unidad de longitud el metro y en la variable peso, el
:ilogramo (omparar una desviaci#n 2con respecto a la media3 medida en metros con otra en
:ilogramos no tiene ning*n sentido %l problema no deriva s#lo de que una de las medidas sea de
longitud y la otra sea de masa %l mismo problema se plantea si medimos cierta cantidad, por
e)emplo la masa, de dos poblaciones, pero con distintas unidades %ste es el caso en que
comparamos el peso en toneladas de una poblaci#n de BFF elefantes con el correspondiente en
miligramos de una poblaci#n de EF hormigas
%l problema no se resuelve tomando las mismas escalas para ambas poblaciones +or
e)emplo, se nos puede ocurrir medir a las hormigas con las mismas unidades que los elefantes
2toneladas3 Si la ingenier_a gentica no nos sorprende con alguna barbaridad, lo l#gico es que la
dispersi#n de la variable peso de las hormigas sea prcticamente nula 2U.unque haya algunas
que sean BFFF veces mayores que otrasV3 %n los dos primeros casos mencionados
Medidas de Tendencia Cent$al y ,a$ia+ilidad - 51 -
anteriormente, el problema viene de la dimensionalidad de las variables, y en el tercero de la
diferencia enorme entre las medias de ambas poblaciones %l coeficiente de variaci#n es lo que
nos permite evitar estos problemas, pues elimina la dimensionalidad de las variables y tiene en
cuenta la proporci#n e"istente entre medias y desviaci#n tpica Se define del siguiente modo-
%ropiedades del coeficiente de variacin
S#lo se debe calcular para variables con todos los valores positivos
0odo ndice de variabilidad es esencialmente no negativo Las observaciones pueden ser
positivas o nulas, pero su variabilidad debe ser siempre positiva ,e ah que s#lo debemos
traba)ar con variables positivas, para la que tenemos con seguridad que x " j F
8o es invariante ante cambios de origen %s decir, si a los resultados de una medida le
sumamos una cantidad positiva, b j F, para tener > R 1 Y b, entonces (J> k (J1
%s invariante a cambios de escala .s por e)emplo el coeficiente de variaci#n de una variable
medida en metros es una cantidad adimensional que no cambia si la medici#n se realiza en
centmetros
Ti-ificaci&n
Se conoce por tipificaci#n al proceso de restar la media y dividir por su desviaci#n tpica a
una variable 1 ,e este modo se obtiene una nueva variable de media x R F y desviaci#n tpica Sl
R B, que denominamos variable tipificada
%sta nueva variable carece de unidades y permite hacer comparables dos medidas que en
un principio no lo son .s por e)emplo nos podemos preguntar si un elefante es mas grueso que
una hormiga determinada, cada uno en relaci#n a su poblaci#n 0ambin es aplicable al caso en
que se quieran comparar individuos seme)antes de poblaciones diferentes +or e)emplo, si
deseamos comparar el nivel acadmico de dos estudiantes de diferentes !niversidades para la
concesi#n de una beca de estudios, en principio seria in)usto concederla directamente al que
posea una nota media mas elevada, ya que la dificultad para conseguir una buena calificaci#n
puede ser mucho mayor en un centro que en el otro, lo que limita las posibilidades de uno de los
estudiante y favorece al otro %n este caso, lo mas correcto es comparar las calificaciones de
ambos estudiantes, pero tipificadas cada una de ellas por las medias y desviaciones tpicas
respectivas de las notas de los alumnos de cada !niversidad
No conf#ndi$ coeficiente de 3a$iaci&n y ti-ificaci&n
Los coeficientes de variaci#n sirven para comparar las variabilidades de dos con)untos de
valores 2muestras o poblaciones3, mientras que si deseamos comparar a dos individuos de cada
uno de esos con)untos, es necesario usar los valores tipificados 8inguno de ellos posee unidades
y es un error frecuente entre estudiantes de bioestadstica confundirlos
%4/4 !simet$a y a-#ntamiento
Medidas de Tendencia Cent$al y ,a$ia+ilidad - 5% -
Sabemos cmmo calcular valores alrededor de los cuales se distribuyen las observaciones de
una variable sobre una muestra y sabemos cmmo calcular la dispersi#n que ofrecen los mismos
con respecto al valor de central 8os proponemos dar un paso mas all en el anlisis de la
variable %n primer lugar, nos vamos a plantear el saber si los datos se distribuyen de forma
simtrica con respecto a un valor central, o si bien la grfica que representa la distribuci#n de
frecuencias es de una forma diferente del lado derecho que del lado izquierdo
Si la simetra ha sido determinada, podemos preguntarnos si la curva es mas o menos
apuntada 2larga y estrecha3 %ste apuntamiento habrb que medirlo comparado a cierta
distribuci#n de frecuencias que consideramos normal 2no por casualidad es gste el nombre que
recibe la distribuci#n de referencia3 %stas ideas son las que vamos a desarrollar en lo que resta
del capitulo
%4/414 stadsticos de asimet$a
+ara saber si una distribuci#n de frecuencias es simtrica, hay que precisar con respecto a
qu !n buen candidato es la mediana, ya que para variables continuas, divide al histograma de
frecuencias en dos partes de igual brea +odemos basarnos en ella para, de forma natural, decir
que una distribuci#n de frecuencias es simtrica si el lado derecho de la grfica 2a partir de la
mediana3 es la imagen por un espe)o del lado izquierdo 2figura DM3 (uando la variable es
discreta, decimos que es simtrica, si lo es con respecto a la media
,entro de los tipos de asimetra posible, vamos a destacar los dos fundamentales-
'simetr!a positiva- Si las frecuencias mas altas se encuentran en el lado izquierdo de la
media, mientras que en derecho hay frecuencias mas +eque&as 2cola3
'simetr!a ne&ativa- (uando la cola est en el lado izquierdo (uando realizamos un
estudio descriptivo es altamente improbable que la distribuci#n de frecuencias sea totalmente
simtrica %n la prctica diremos que la distribuci#n de frecuencias es simtrica si lo es de un
modo apro"imado +or otro lado, a*n observando cuidadosamente la grfica, podemos no ver
claro de qu lado estn las frecuencias mas altas Se definen entonces toda una familia de
estadsticos que ayuden a interpretar la asimetra, denominados ndices de asimetra %l
principal de ellos es el momento central de tercer orden que definimos a continuaci#n
Medidas de Tendencia Cent$al y ,a$ia+ilidad - 5' -
9omento central de tercer orden
Sea 1 una variable cuantitativa > y p h HJ Llamamos momento de orden
p a-
Se denomina momento central de orden p a la cantidad
Los momentos de orden p impar, son siempre nulos en el caso de variables simtricas, ya
que para cada i que est a un lado de la media, con 2"i e x 3 k F, le corresponde una observaci#n )
del otro lado de la media tal que 2"i e x 3 R e2"i e x 3 %levando cada una de esas cantidades a p
impar, y sumando se tiene que
Si la distribuci#n fuese asimtrica positiva, las cantidades 2"ie x 3
p
, con p Q A impar positivas
estaran muy aumentadas al elevarse a p %sta propiedad nos indica que un ndice de asimetra
posible consiste en tomar p R A y elegir como estadstico de asimetra al momento central de
tercer orden .poyndonos en este ndice, diremos que hay asimetra positiva si aA j F, y que la
asimetra es negativa si aA k F nndice basado en los tres cuartiles 2>uleo?oKley3 Si una
distribuci#n es simtrica, es claro que deben haber tantas observaciones entre la que de)a por
deba)o de si las tres cuartas partes de la distribuci#n y la mediana, como entre la mediana y la
que de)a por deba)o de si un cuarto de todas las observaciones ,e forma abreviada esto es,
$A e $D R $D e $B
!na pista para saber si una distribuci#n de frecuencias es asimtrica positiva la
descubrimos observando la figura DO3-
$A e $D j $D e $B
+or analoga, si es asimtrica negativa, se tendr
$A e $D k $D e $B
+ara quitar dimensionalidad al problema, utilizamos como ndice de asimetra la cantidad-
%s claro que
%l numero obtenido, .s, es invariante ante cambios de origen de referencia y de escala
Medidas de Tendencia Cent$al y ,a$ia+ilidad - 5( -
Ot$os ndices de asimet$a4
?asndonos en que si una distribuci#n de frecuencias es simtrica y unimodal, entonces la
media, la mediana y la moda coinciden, podemos definir otras medidas de asimetra, como son-
o bien,
,iremos que hay asimetra positiva si .s j F y negativa si .s k F

%)emplo
Las edades de un grupo de personas se refle)an en la tabla siguiente-
Medidas de Tendencia Cent$al y ,a$ia+ilidad - 5/ -
,eterminar la variabilidad de la edad mediante los estadsticos varianza, desviaci#n tpica,
coeficiente de variaci#n y rango intercuart_lico %studie la simetra de la variable
Sol#ci&nB
%n primer lugar realizamos los clculos necesarios a partir de la tabla de frecuencias-
La media es x R D,FMENBEO R BA, BE a&os La varianza la calculamos a partir de la columna
de la
i i
n x
2
como sigue-
S
D
R DO,OCD, DENBEOeBA, BE
D
R A, OG a&os
D
p S R
78 . 3
R B, PC a&os
M#est$eo !leato$io y *$o+a+ilidad - 55 -
M#est$eo aleato$io y -$o+a+ilidad
INTRODUCCIN
4emos concluido nuestro anlisis de la estadstica descriptiva y ya estamos listos para
comenzar a estudiar el rea fascinante de la estadstica inferencial (on la estadstica descriptiva
nuestra preocupaci#n principal era lograr la presentaci#n y descripci#n de los con)untos de
datos de la manera ms significativa y eficaz %n la estadstica inferencial vamos ms all de la
mera descripci#n de los datos, ya que un ob)etivo bsico es el uso de los datos provenientes de
una muestra para hacer una afirmaci#n acerca de una caracterstica de la poblaci#n Se hacen
dos tipos de afirmaciones- una tiene que ver con la actividad conocida como prueba de hip#tesis y
la otra con la estimaci#n de parmetros
%n la prueba de hip#tesis, el investigador recolecta datos de un e"perimento sobre el
con)unto de su)etos de una muestra, en un intento de validar cierta hip#tesis relativa a una
poblaci#n +or e)emplo, suponga que una psic#loga dedicada a la educaci#n cree que un nuevo
mtodo para ense&ar la asignatura de matemticas a los ni&os de tercer grado, en su distrito
escolar 2poblaci#n3, es me)or que la forma usual de ense&anza %n el e"perimento, ella toma dos
muestras de los alumnos de tercer grado, a una de las cuales se le imparte el nuevo mtodo de
ense&anza y a la otra el mtodo usual (ada grupo presenta el mismo e"amen final .l hacer esta
prueba, la psic#loga no se conforma con s#lo informar que la media del grupo que recibi# el
nuevo mtodo fue mayor que la del otro grupo %lla quiere hacer una afirmaci#n como- ;La
me)ora observada en las calificaciones del e"amen final fue resultado del nuevo mtodo de
ense&anza y no del azar .dems, dicha me)ora no s#lo se aplicara a la muestra particular
sometida a prueba, sino que aparecera en toda la poblaci#n de estudiantes de tercer grado si se
les ense&ase con el nuevo mtodo; Las tcnicas utilizadas en estadstica inferencial permiten
hacer afirmaciones de este tipo
%n los e"perimentos para la estimaci#n de parmetros el investigador est interesado en
determinar la magnitud de una caracterstica de la poblaci#n +or e)emplo, a un economista
podra importarle la determinaci#n de la cantidad mensual promedio de dinero gastada el a&o
pasado en alimentos por los estudiantes de bachillerato (on los datos de una muestra y las
tcnicas de la estadstica inferencial, l puede estimar la cantidad media que gasta la poblaci#n
%l economista podra concluir con una afirmaci#n como la siguiente- ;%"iste una probabilidad
de FPE de que el intervalo qDEFIqAFF contenga la media de la poblaci#n;
Los temas de muestreo aleatorio y de probabilidad son fundamentales para la metodologa de
la estadstica inferencial %n la siguiente secci#n estudiaremos el muestreo aleatorio %l resto
del captulo tratar sobre los principios bsicos de la probabilidad
MUSTRO !L!TORIO
+ara generalizar de manera vlida, a partir de una muestra a toda la poblaci#n, tanto en los
e"perimentos de prueba de hip#tesis como en los de estimaci#n de parmetros, la muestra no
puede ser cualquier subcon)unto de la poblaci#n %s crucial que sea una muestra aleatoria
Una m#est$a aleato$ia es eleFida de la -o+laci&n mediante #n -$oceso con el
c#al se aseF#$a K#e 12 cada -osi+le m#est$a de #n tamaLo dado tenFa la misma
-$o+a+ilidad de se$ eleFida y %2 todos los miem+$os de la -o+laci&n tenFan la
misma -$o+a+ilidad de se$ seleccionados en la m#est$a4
+ara ilustrar esto, consideremos una situaci#n en la que tenemos una poblaci#n con los
datos D, A, C, E y M, y queremos e"traer de manera aleatoria una muestra de tama&o D a partir de
dicha poblaci#n 7bserve que, por lo general, una poblaci#n tendra ms datos La hemos
M#est$eo !leato$io y *$o+a+ilidad - 59 -
restringido a cinco elementos para facilitar la comprensi#n de lo que queremos poner de
manifiesto Suponga usted que estamos realizando un muestreo de esta poblaci#n y que tomamos
un dato a la vez, para luego volver a colocarlo con el resto de dicha poblaci#n antes de e"traer
otro %sto se llama muestreo con reemplazo y ser analizado posteriormente en este captulo .
continuaci#n presentamos todas las muestras de tama&o D que podemos obtener de la poblaci#n
aplicando este mtodo de muestreo-
Son DE muestras de tama&o D las que podemos obtener al realizar el muestreo de un
elemento a la vez con reemplazo +ara realizar un muestreo aleatorio, el proceso debe ser tal que
B3 las DE muestras posibles y D3 todos los datos de la poblaci#n 2D, A, C, E y M3 tengan la misma
probabilidad de ser seleccionados en la muestra
La muestra debe ser aleatoria por dos razones La primera es que para que se pueda
generalizar a toda la poblaci#n una caracterstica observada en una muestra, es necesario aplicar
las leyes de la probabilidad Si la muestra no ha sido obtenida mediante un procedimiento con el
cual se garantice que cada muestra posible del tama&o elegido tenga la misma posibilidad de ser
escogida, no podremos aplicar las leyes de probabilidad a esa muestra La importancia que tiene
para la inferencia estadstica este aspecto de aleatoriedad y de probabilidad se podr apreciar
claramente cuando hayamos analizado los captulos referentes a la prueba de hip#tesis y a las
distribuciones muestrales 2vanse los captulos BF y BD respectivamente3
La segunda raz#n para la utilizaci#n del muestreo aleatorio consiste en que, para asegurar
la generalizaci#n de una caracterstica de la muestra a toda la poblaci#n, es necesario que dicha
muestra sea representativa de la poblaci#n en cuesti#n !na forma de lograr la representatividad
consiste en elegir la muestra por medio de un proceso que garantice que todos los miembros de la
poblaci#n tengan la misma posibilidad de ser escogidos +or lo tanto, el hecho de requerir que una
muestra sea aleatoria permite aplicar las leyes de probabilidad sobre la muestra misma y, por
ende, que sta sea representativa de la poblaci#n
%s tentador pensar que podemos lograr la representatividad de una muestra utilizando
mtodos distintos al del muestreo aleatorio Sin embargo, con mucha frecuencia el
procedimiento utilizado produce una muestra sesgada 2no representativa3 !n e)emplo de esto es
la famosa encuesta presidencial del Literary ,igest de BPAM, la cual predi)o una victoria aplastante
de Landon 2EO a CAc3 ,e hecho, 'oosevelt gan# con MDc de los votos La predicci#n del Literary
,igest result# ser un error garrafal +or qu? !n anlisis posterior revel# que el error se debi# a
que la muestra no era representativa de la poblaci#n votante, sino que era una muestra sesgada
Los individuos fueron elegidos de fuentes tales como el directorio telef#nico, registros de clubes
y listas de propietarios de autom#viles %sos registros e"cluyeron de manera sistemtica a
las personas pobres, quienes tal vez no tenan telfonos ni autom#viles > ocurri# que los pobres
votaron en forma aplastante a favor de 'oosevelt .unque otros mtodos de muestreo pudieran proI
ducir una muestra representativa stos no seran *tiles para la inferencia, pues no podramos
aplicar las leyes de la probabilidad necesarias para generalizar de la muestra a toda la poblaci#n
Tcnicas -a$a el m#est$eo aleato$io
!n estudio profundo de las formas con las cuales se generan las muestras aleatorias est
ms all del ob)etivo de este libro %ste tema puede ser comple)o, en particular al traba)ar con
M#est$eo !leato$io y *$o+a+ilidad - 5; -
encuestas Sin embargo, presentaremos algunas tcnicas de uso com*n, )unto con varias
situaciones sencillas, de manera que usted pueda darse una idea de lo que esto implica Suponga
que tenemos una poblaci#n de BFF personas y queremos obtener una muestra aleatoria de DF
personas para un e"perimento !na forma de hacer esto sera enumerar a los individuos de la
poblaci#n del B al BFF, luego tomar BFF pedazos de papel y numerarlos, colocar los papeles en
un sombrero para revolverlos y despus elegir uno Jolveramos entonces a mezclar los papelitos
para elegir otro Luego, continuaramos este proceso hasta haber elegido DF pedazos de papel
Los n*meros escritos en los pedazos de papel identificaran a los individuos que compondran la
muestra %n este mtodo de muestreo aleatorio, es crucial que la poblaci#n 2los trozos de papel3
est bien; revuelta; para garantizar la aleatoriedad
!n procedimiento com*n para producir muestras aleatorias consiste en utilizar una tabla de
n*meros aleatorios, como la que hemos incluido en la tabla 5 del apndice , %ste tipo de
tablas se hace, por lo regular, mediante un programa de computadora, el cual garantiza que
todos los dgitos 2FIP3 tengan la misma posibilidad de ser elegidos cada vez que se imprima un
dgito
La tabla se puede emplear como una sucesi#n de dgitos simples consecutivos, n*meros de
dos dgitos, n*meros de tres dgitos, etc +or e)emplo, en la tabla 5, pgina ECM, si comenzamos en
el primer rengl#n y nos movemos en direcci#n horizontal por la pgina, el orden aleatorio de los
dgitos simples sera A D, P, C, D, Si quisiramos utilizar n*meros de dos dgitos, entonces el
orden aleatorio sera AD, PC, DP, EC, BM,
(omo los dgitos de la tabla son aleatorios, se pueden utilizar vertical u horizontal mente en
ambas direcciones La direcci#n que se va a usar debe especificarse antes de emplear la tabla/
para mane)arla de manera adecuada, hay que comenzar en forma aleatoria !na posibilidad de
lograr esto es hacer tar)etas con n*meros de rengl#n y de columna, colocarlas en una ca)a,
revolverlas y luego elegir un n*mero para el rengl#n y otro para la columna La intersecci#n del
rengl#n y la columna sera la posici#n del primer n*mero aleatorio Los dems n*meros seran
localizados al desplazarse desde el primer n*mero, en la direcci#n convenida antes de entrar a la
tabla +or e)emplo, suponga que queremos formar una muestra aleatoria de A su)etos de una
poblaci#n de BF su)etos +ara este e)emplo hemos decidido movernos sobre la tabla en direcci#n
horizontal, a la derecha +ara elegir la muestra, primero asignamos a cada individuo de la
poblaci#n un n*mero del F al P Luego entramos en la tabla de manera aleatoria para localizar
el primer n*mero Suponga que el dato es el primer n*mero del sptimo rengl#n, que es igual a
A %ste n*mero designa al primer su)eto de la muestra (omo hemos decidido movernos sobre la
tabla hacia la derecha, los dos n*meros siguientes son E y M ,e esta manera, los individuos que
portan los n*meros E y M completaran la muestra
'esolvamos ahora un problema en el cual la poblaci#n tiene ms individuos (on
prop#sitos ilustrativos, supondremos que se desea e"traer un muestra aleatoria de BE su)etos, de
una poblaci#n de BFF +ara variar las cosas un poco, para este e)ercicio deci dimos
desplazarnos verticalmente sobre la tabla, hacia aba)o, en lugar de hacerlo en direcci#n
horizontal, hacia la derecha (omo antes, necesitamos asignar una cifra a cada miembro de la
poblaci#n %sta vez, los n*meros asignados sern del FF al PP en vez de F a P ,e nuevo, entramos
a la tabla de manera aleatoria %sta vez suponemos que el primer dato o primer n*mero de dos
dgitos aparece en la intersecci#n de la columna A con el rengl#n BD %l guarismo de dos dgitos
localizado en esa intersecci#n es OF +or lo tanto, el primer su)eto de la muestra es el individuo a
quien le corresponde el n*mero OF +ara localizar al siguiente su)eto de la muestra, ba)amos
verticalmente en la tabla a partir del OF .s, el segundo su)eto de la muestra sera el individuo
que tiene el n*mero AA (ontinuaramos este procedimiento hasta que hayamos seleccionado BE
su)etos %l con)unto completo de n*meros que representan a los su)etos de la muestra sera- OF,
AA, GD, DD, PM, AE,BC,BD,BA, EP, PO, AO, EC, CD y GP .l obtener este con)unto de n*meros, el GD apaI
reci# dos veces en la tabla (omo el mismo individuo no puede estar en la muestra ms de una
M#est$eo !leato$io y *$o+a+ilidad - 5= -
vez, no incluimos el n*mero repetido
M#est$eo con o sin $eem-laEo
4asta ahora hemos definido una muestra aleatoria, analizamos la importancia del muestreo
aleatorio y presentamos algunas tcnicas para producir muestras aleatorias +ara completar
nuestro estudio, debemos distinguir entre el ;muestreo con reemplazoLL y el ;muestreo sin
reemplazo; +ara ilustrar la diferencia entre estos dos mtodos de muestreo, suponga que
queremos formar una muestra de dos datos provenientes de una poblaci#n compuesta por los
n*meros C, E, G y BF !na manera de hacer esto consistira en e"traer un dato de la poblaci#n,
registrar su valor, y reintegrarlo a la poblaci#n antes de e"traer el segundo elemento .s, el
primer dato podra ser elegido de nuevo en la segunda e"tracci#n %ste mtodo se llama
muestreo con reemplazo !na segunda alternativa consistira en e"traer al azar un dato de la
poblaci#n y no reemplazarlo antes de seleccionar el segundo ,e esta manera, cualquier n*mero
proveniente de la poblaci#n podra aparecer en la muestra solamente una vez . este mtodo se
le llama muestreo sin reemplazo
l m#est$eo con $eem-laEo se define como #n mtodo en el c#al cada miem+$o
de la -o+laci&n eleFida -a$a la m#est$a se $einteF$a a la -o+laci&n antes de
selecciona$ al siF#iente miem+$o4
l m#est$eo sin $eem-laEo se define como #n mtodo en el c#al los miem+$os
de la m#est$a no son $einteF$ados a la -o+laci&n antes de selecciona$ a los
miem+$os s#+sec#entes4
*RO?!?ILID!D
La probabilidad se puede estudiar desde dos puntos de vista- B3 a priori o clsico y D3 a
posteriori o emprico . priori significa aquello que se puede deducir usando s#lo la raz#n, sin
recurrir a la e"periencia ,esde el punto de vista a priori o clsico, la probabilidad se define
como-
%l smbolo p2.3 se lee como ;la probabilidad de ocurrencia del evento .; .s, la ecuaci#n
establece que la probabilidad de ocurrencia del evento . es igual al n*mero de eventos
clasificables como . dividida entre el n*mero de eventos posibles +ara ilustrar el uso de esta
ecuaci#n, veamos un e)emplo relacionado con unos dados La figura GB muestra una
ilustraci#n con un par de dados (ada dado tiene seis caras y ostenta un n*mero distinto de
puntos en cada cara Los puntos varan de uno a seis %stos cubos de apariencia inocente se
utilizan para )uegos de azar/ son la base de muchas desgracias y alegras, seg*n la dsuerteS del
)ugador
'egresando a la probabilidad a priori, suponga que vamos a arro)ar un dado una vez
(ul es la probabilidad de que el dado se detenga con un D 2el lado que tiene dos puntos3 hacia
arriba? (omo e"isten seis n*meros posibles y s#lo uno de ellos es un D, la probabilidad de que
salga un D en una tirada de un dado es-
M#est$eo !leato$io y *$o+a+ilidad - 9@ -
0ratemos de resolver otro problema mediante el punto de vista a priori (ul es la
probabilidad de obtener un n*mero mayor que C en una tirada de un dado? .hora e"isten dos
eventos clasificables como . 2obtener un E o un M3 .s,

7bserve que logramos resolver los dos problemas anteriores por medio de un razonamiento
sin recurrir a ninguna colecci#n de datos ,ebemos comparar este punto de vista con el enfoque a
posteriori o emprico de la probabilidad . posteri ori significa ;despus del hecho;, en el
conte"to de la probabilidad, significa despus de haber reunido algunos datos ,esde el punto de
vista a posteriori o emprico, la probabilidad se define como-

+ara determinar la probabilidad de obtener un D al tirar un dado, desde el punto de vista
emprico, tendramos que considerar el dado real, arro)arlo en muchas ocasiones y contar el
n*mero de veces que se presenta un D 9ientras ms veces arro)emos el dado, tanto me)or ser
+ara este problema, suponga que lanzamos el dado BFF FFF veces y que el D apareci# en BM FFF
ocasiones La probabilidad de que ocurra un D en un lanzamiento del dado se determina
mediante-

7bserve que, desde este punto de vista, antes de determinar la probabilidad es necesario
tener el dado real y reunir algunos datos %l punto interesante es que si el dado no est cargado
2entonces se dice que es un dado honesto3, al lanzarlo muchas veces la probabilidad a posteriori
se acerca a la probabilidad a priori Si arro)amos el dado una infinidad de veces, las dos
probabilidades sern iguales 7bserve tambin que si el dado est cargado 2con una distribuci#n
de peso por la cual uno de los lados quede arriba con mayor frecuencia que los dems3, la
probabilidad a posteriori ser diferente que la probabilidad a priori +or e)emplo, si el dado
est ;cargado; para que aparezca un MFBD nunca aparecer +odemos ver ahora que la ecuaci#n
a priori supone que todos los resultados posibles tienen la misma probabilidad de ocurrir +ara
la mayor parte de los problemas de este captulo y el siguiente aplicaremos el punto de vista a
priori
!lF#nos as-ectos +.sicos $elati3os a los 3alo$es de -$o+a+ilidad
+uesto que la probabilidad es esencialmente una proporci#n su valor fluct*a entre FFF y
BFF Si la probabilidad de que ocurra un evento es igual a BFF entonces es seguro que tal evento
ocurrir Si la probabilidad es igual a FFF, entonces es seguro que el evento no ocurrir +or
e)emplo, un dado com*n no tiene O puntos en ninguno de sus lados +or lo tanto, la probabilidad
de obtener un O al arro)ar un dado es igual a FFF %s seguro que no ocurrir que salga un O +or
otra parte, la probabilidad de que salga un n*mero del B al M es igual a BFF %s seguro que se
obtendr alguno de los n*meros B, D, A, C, E o M
La probabilidad de ocurrencia de un evento se e"presa como una fracci#n o un n*mero
M#est$eo !leato$io y *$o+a+ilidad - 91 -
decimal +or e)emplo, la probabilidad de elegir al azar el as de espadas en una bara)a com*n es ED
o bien FFBPD\ La respuesta se puede quedar como una fracci#n 2BNED3, pero generalmente se
convierte a su equivalente decimal 2FFBPD3
.lgunas veces, la probabilidad se e"presa como ;posibilidades con respecto a BFF; +or
e)emplo, alguien podra comentar que la probabilidad de que ocurra el evento . es de E
posibilidades en BFF Lo que esta persona quiere decir es que p2.3 R FFE %n ciertas ocasiones, la
probabilidad se e"presa tambin como las posibilidades a favor o en contra de que ocurra un
evento +or e)emplo, un apostador podra decir que las posibilidades de que =red gane la carrera
son de A a B a su favor %n trminos de probabilidades, p2que gane =red3 ANC R FOE Si las
posibilidades fuesen de A a B en contra de que =red triunfe, entonces p2que gane =red3 RBNC R
FDE
C.lc#lo de -$o+a+ilidades
La determinaci#n de la probabilidad de los eventos puede ser comple)a ,e hecho, e"isten
cursos completos dedicados a este tema y son bastante difciles +or fortuna, para nuestros
prop#sitos s#lo hay que aprender dos reglas fundamentales de la probabilidad- la de la suma y la
del producto %stas reglas proporcionarn las bases necesarias para comprender las pruebas
de inferencia estadstica que veremos ms adelante en este libro de te"to
(a re&la de la suma
La regla de la suma sirve para determinar la probabilidad de que ocurra alguno de varios
eventos posibles +ara comenzar nuestro anlisis, supongamos que s#lo e"isten dos eventos
posibles- . y ? (uando e"isten dos eventos, la regla de la suma establece lo siguiente-
La -$o+a+ilidad de oc#$$encia de ! o ? es iF#al a la -$o+a+ilidad de K#e oc#$$a
. ms la probabilidad de que ocurra ? menos la probabilidad de que ocurran
ambos, . y ?
%n forma de ecuaci#n, la regla de la suma establece que-
ec#aci&n Fene$al de la $eFla
- 1! o ?2 M - 1!2 N - 1?2 - - 1! y ?2 de la s#ma -a$a dos e3entos
Jamos a ilustrar la forma en que se utiliza esta regla Suponga que queremos determinar la
probabilidad de sacar un as o un trbol de una bara)a de cartas ordinarias %l problema ha
sido resuelto de dos maneras en la figura GD +or favor, consulte la figura al leer este prrafo %n
la primera de esas maneras, enumeramos todos los eventos que pueden ser clasificados como un
as o un trbol y utilizamos la ecuaci#n bsica para la probabilidad %"isten BM formas de obtener
un as o un trbol, por lo cual la probabilidad de sacar un as o un trbol es R BMNED R FAFOO %l
segundo mtodo emplea la regla de la suma La probabilidad de obtener un as es CNED y la
probabilidad de sacar un trbol a la vez es R BANED La probabilidad de logar un as y un
trbol es igual a R BNED Seg*n la regla de la suma, la probabilidad de conseguir un as o un
trbol es R CNED Y BANED o BNED R BMNED R FAFOO +or qu tenemos que restar la probabilidad
de obtener un as y un trbol a la vez? +orque hemos contado el as de trboles dos veces Si no lo
restramos, pensaramos de manera err#nea que e"isten BO eventos favorables siendo que s#lo
e"isten BM
%n este curso emplearemos la regla de la suma en casi todas las situaciones en las que
los eventos sean mutuamente e"cluyentes
Dos e3entos son m#t#amente e8cl#yentes si no -#eden oc#$$i$ al mismo
M#est$eo !leato$io y *$o+a+ilidad - 9% -
tiem-o4 Ot$a mane$a de deci$ esto es K#e dos e3entos son m#t#amente
e8cl#yentes si la oc#$$encia de #no im-ide la oc#$$encia del ot$o4
Los eventos de obtener un B y un D al lanzar un dado son mutuamente e"cluyentes Si el
lanzamiento termina con un B, entonces no puede haber terminado tambin con un D Los
eventos de e"traer a la vez un as y un rey al sacar una sola carta de un mazo de bara)as
ordinarias son mutuamente e"cluyentes Si la carta es un as, eso impide que la misma sea
tambin un rey %sto se puede contrastar con los eventos de e"traer a la vez un as y un trbol
al sacar una sola carta del mazo %stos dos eventos no son mutuamente e"cluyentes en virtud de
que hay una carta que es simultneamente un as y un trbol 2el as de trboles3
(uando los eventos son mutuamente e"cluyentes, la probabilidad de que ambos eventos
ocurran al mismo tiempo es igual a cero .s, p 2. y ?3 R F cuando . y ? son mutuamente
e"cluyentes %n estas condiciones, la regla de la suma se simplifica as-
+ractiquemos ahora resolviendo algunos problemas que incluyen situaciones en las que . y
? son mutuamente e"cluyentes

M#est$eo !leato$io y *$o+a+ilidad - 9' -
(ul es la probabilidad de elegir al azar un BF o un C al e"traer una carta de una bara)a
ordinaria?
S7L!(Hr8
La soluci#n se ilustra en la figura siguiente (omo deseamos sacar un BF o un C y estos
dos eventos son mutuamente e"cluyentes, la regla de la suma con eventos mutuamente
e"cluyentes resulta apropiada .s, p2BF o C3 Rp2BF3 Y p2C3
+uesto que hay cuatro BF, cuatro C y ED cartas, entonces p 2BF3 R CNED y p2C3 R CNED +or
consiguiente, p2BF o C3 R CNED R CNED R GNED R FBEAG

.l lanzar una vez un dado que no est cargado, cul es la probabilidad de obtener un B o
un n*mero par?
S7L!(Hr8
La soluci#n aparece en la figura acompa&ante (omo los eventos son mutuamente
e"cluyentes y el problema pide obtener un B o un n*mero par, podemos aplicar la regla de la
suma para este tipo de eventos .s, p2B o un n*mero par3 R p2B3 Y p2un n*mero par3 %"iste
una forma de conseguir un B, tres formas de lograr un n*mero par 2D, C, M3 y seis resultados
posibles .s, p2B3 RBNM, p2un n*mero par3 R ANM y p2B o un n*mero par3 RBNM Y ANM R CNM R
FMMMO

Suponga que va a elegir de manera aleatoria un individuo entre una poblaci#n de BAF
personas %n esa poblaci#n hay CF ni&os menores de BD a&os, MF adolescentes y AF adultos
(ul es la probabilidad de que el individuo elegido sea un adolescente o un adulto?
M#est$eo !leato$io y *$o+a+ilidad - 9( -
SOLUCIN
La soluci#n aparece en la figura acompa&ante (omo los eventos son mutuamente
e"cluyentes y queremos obtener un adolescente o un adulto, podemos emplear la regla de la
suma correspondiente .s, p 2adolescente o adulto3 R p2adolescente3 Y p2adulto3 (omo hay MF
adolescentes, AF adultos y BAF personas en la poblaci#n, p2adolescente3 R MFNBAF y p2adulto3
R AFNBAF +or lo tanto, p2adolescente o adulto3 R MFNBAF Y AFNBAF R PFNBAF R FMPDA

La regla de la suma tambin se puede utilizar en situaciones donde hay ms de dos eventos/
s#lo hacemos una sencilla e"tensi#n de la ecuaci#n empleada para esta situaci#n .s, cuando
e"isten ms de dos eventos y todos son mutuamente e"cluyentes, la probabilidad de que ocurra
cualquiera de ellos es igual a la suma de las probabilidades de cada evento . continuaci#n
mostramos la ecuaci#n-
p2.o ?o (ool3Rp2.3Yp2?3Yp2(3YYp2l3
$eFla de la s#ma -a$a m.s de dos e3entos
m#t#amente e8cl#yentes
donde l R es el *ltimo evento
(on mucha frecuencia encontraremos situaciones en las cuales los eventos no s#lo son
mutuamente e"cluyentes, sino tambin e"haustivos >a hemos definido a los dos primeros, nos
faltan los e"haustivos
!n con)unto de eventos es e8Ha#sti3o si incluye a todos los eventos posibles
+or e)emplo, al lanzar un dado una sola vez, el con)unto de eventos que consisten en obtener
B, D, A, C, E o M es e"haustivo, pues el con)unto incluye a todos los eventos posibles (uando un
con)unto de eventos es e"haustivo y mutuamente e"cluyente, e"iste una relaci#n muy *til %n
estas condiciones, la suma de las probabilidades individuales de cada evento del con)unto debe
ser igual a B .s,
+ara ilustrar esta relaci#n, consideremos el con)unto de eventos que consisten en obtener B,
D, A, C, E o M al lanzar una sola vez un dado no cargado (omo los eventos son e"haustivos y
M#est$eo !leato$io y *$o+a+ilidad - 9/ -
mutuamente e"cluyentes, la suma de sus probabilidades debe ser igual a B
+odemos ver que esto es cierto, pues p2B3 R BNM, p2D3 R BNM, p2A3 R BNM, p2C3 R BNM, p 2E3 R BNM y
p 2M3 R BNM .s,
I (uando s#lo e"isten dos eventos y stos son mutuamente e"cluyentes, se acostumbra
asignar el smbolo + a la probabilidad de que ocurra uno de los eventos y $ a la probabilidad de
que ocurra el otro evento +or e)emplo, si estamos lanzando una moneda, sta s#lo puede caer
de cara o de cruz y se presentar una situaci#n en la que s#lo hay dos eventos posibles 2cara o
cruz3 en cada lanzamiento, y stos son mutuamente e"cluyentes 2si es cara, no puede ser cruz y
viceversa3 Se acostumbra asignar + a la probabilidad de ocurrencia de uno de los eventos,
digamos cara, y $ a la probabilidad de ocurrencia del otro evento, cruz %n este caso, si la
moneda no est cargada, entonces, + R BND y $ R BND (omo los eventos son e"haustivos y
mutuamente e"cluyentes, sus probabilidades deben ser iguales a B +or consiguiente,
+ Y $ R BFF c#ando dos e3entos son e8Ha#sti3os y m#t#amente
e8cl#yentes
La $eFla del -$od#cto
.s como la regla de la suma proporciona la probabilidad de que ocurra cualquiera de
varios eventos, la regla del producto analiza la ocurrencia con)unta o sucesiva de varios eventos
7bserve que la regla del producto analiza con frecuencia lo que ocurre en ms de un lanzamiento
o e"tracci#n, mientras que la regla de la suma estudia s#lo uno de dichos lanzamientos o
e"tracciones Si nos interesa la ocurrencia con)unta o sucesiva de dos eventos . y ?, la regla del
producto establece lo siguiente-
La -$o+a+ilidad de oc#$$encia de ! y ? es iF#al a la -$o+a+ilidad de
oc#$$encia de ! -o$ la -$o+a+ilidad de oc#$$encia de ?0 dado K#e !
Ha oc#$$ido4
%n forma de ecuaci#n, la regla del producto es
7bserve que el smbolo p 2?s.3 se lee como ;la probabilidad de que ocurra ? dado que . ha
ocurrido; %sto no significa ? dividido entre . 7bserve tambin que la regla del producto se
refiere a la ocurrencia de . y ?, mientras que la regla de la suma se aplica a la ocurrencia de .
o ?

.l analizar la regla del producto, es *til distinguir tres condiciones- cuando los eventos son
mutuamente e"cluyentes, cuando los eventos son independientes y cuando los eventos son
dependientes
ReFla del -$od#ctoB e3entos m#t#amente e8cl#yentes4 >a hemos analizado la ocuI
rrencia con)unta de . y ? cuando . y ? son mutuamente e"cluyentes 'ecordar que si . y ?
son mutuamente e"cluyentes, ya que cuando los eventos son mutuamente e"cluyentes, la
ocurrencia de uno impide la ocurrencia del otro La probabilidad de su ocurrencia con)unta es
cero
M#est$eo !leato$io y *$o+a+ilidad - 95 -
p 2. y ?3 R @ $eFla del -$od#cto -a$a e3entos m#t#amente e8cl#yentes
ReFla del -$od#ctoB e3entos inde-endientes +ara comprenderla forma apropiada de aplicar
la regla del producto en esta situaci#n, tenemos que definir primero qu son los eventos
independientes
Dos e3entos son inde-endientes si la oc#$$encia de #n e3ento no tiene
efecto alF#no so+$e la -$o+a+ilidad de oc#$$encia del ot$o4
%l muestreo con reemplazo ilustra muy bien esta situaci#n +or e)emplo, suponga que
vamos a e"traer con reemplazo dos cartas, una a la vez, de una bara)a ordinaria Llamaremos .
la carta e"trada primero y ? a la carta obtenida en segundo lugar %n vista de que . es
reintegrada al mazo de cartas antes de e"traer ?, la ocurrencia de . en la primera e"tracci#n
no tiene efecto alguno sobre la probabilidad de ocurrencia de ? +or e)emplo, si . fue un as, por
el hecho de que fue reintegrado a la bara)a antes de e"traer la segunda carta, la ocurrencia de un
as en la primera e"tracci#n no tiene efecto alguno sobre la probabilidad de la ocurrencia de la
carta elegida en la segunda e"tracci#n Si . y ? son independientes, entonces la probabilidad de
? no resulta afectada por . +or lo tanto, p 2? s.3 R p 2?3 %n este tipo de situaciones, la regla
del producto se convierte en
Jeamos c#mo se emplea esta ecuaci#n Suponga que vamos a e"traer al azar dos cartas con
reemplazo, una a la vez, de una bara)a ordinaria (ul es la probabilidad de que ambas cartas
sean ases?
La soluci#n se ilustra en la figura GA (omo quiera que el problema requiere la presencia de
un as en la primera y la segunda e"tracciones, resulta apropiado aplicar la regla del producto
Supongamos que . es un as en la primera e"tracci#n y ? es un as en la segunda (omo el
muestreo es con reemplazo, . y ? son independientes .s, p2un as en la primera e"tracci#n y un
as en la segunda e"tracci#n3 R p2un as en la primera e"tracci#n3, p2un as en la segunda
e"tracci#n3 +uesto que e"isten cuatro ases posibles en la primera e"tracci#n, cuatro ases
posibles en la segunda e"tracci#n 2el muestreo se realiza con reemplazo3 y hay ED cartas en la
bara)a, entonces p2un as en la primera e"tracci#n3 R CNED y

p2un as en la segunda e"tracci#n3
R CNED +or consiguiente, p2un as en la primera e"tracci#n y un as en la segunda e"tracci#n3 R
CNED\ CNED R BMNDOFC R FFFEP
Jeamos algunos problemas en plan de prctica
M#est$eo !leato$io y *$o+a+ilidad - 99 -

Suponga que lanzamos una sola vez un par de dados no cargados (ul es la probabilidad
de obtener un D en el primer dado y un C en el segundo?
SOLUCIN
La soluci#n aparece en la figura acompa&ante (omo quiera que los dados son independientes
entre s y en vista de que el problema requiere un D y un C, podemos aplicar la regla del producto
para eventos independientes .s, p 2un D en el primer dado y un C en el segundo3 R p2un D en el
dado B3 p2un C en el dado D3 %"iste una forma de obtener un D en el primer dado, una de conseguir
un C en el segundo dado y seis resultados posibles para cada dado +or lo tanto, p2un D en el
primer dado3 R BNM, p2un C en el dado D3 RBNM, y p2un D en el dado B y un C en el dado D3 R
BNM2BNM3 R BNAM F FFDOG

Si se lanzan dos monedas una sola vez, cul es la probabilidad de que ambas cai gan con
la cara hacia arriba? Suponga que las monedas no estn cargadas y que una cara o una cruz
es el *nico resultado posible para cada moneda
M#est$eo !leato$io y *$o+a+ilidad - 9; -
SOLUCIN
La soluci#n aparece en la figura acompa&ante (omo el resultado para la primera moneda no
tiene efecto alguno sobre el resultado de la segunda, los eventos son independientes %n vista de
que en el problema se requiere una cara con la primera moneda y una cara con la segunda
moneda, podemos aplicar la regla del producto con eventos independientes .s, p2una cara en la
primera moneda y una cara en la segunda moneda3 R p2una cara en la primera moneda3 p2una
cara en la segunda moneda3 (omo s#lo e"iste una forma de obtener una cara con cada moneda y
hay dos posibilidades en cada moneda 2cara o cruz3, p2una cara en la primera moneda3 R BND y
p2una cara en la segunda moneda3 R BND +or lo tanto, p2una cara en la primera moneda y una
cara en la segunda moneda3 R BND2BND3 R BNCR FDEFF
Suponga que usted e"trae una muestra aleatoria de una bolsa de frutas La bolsa contiene
cuatro manzanas, seis naran)as y cinco duraznos Si selecciona dos frutas, una a la vez, con
reemplazo, cul es la probabilidad de que obtenga una naran)a y una manzana, en ese orden?
SOLUCIN
La soluci#n aparece en la figura acompa&ante (omo las e"tracciones son independientes
entre s 2el muestreo es con reemplazo3 y como queremos obtener una naran)a y una manzana,
aplicamos la regla del producto con eventos independientes .s, p 2una naran)a en la primera
e"tracci#n y una manzana en la segunda e"tracci#n3 R p2una naran)a en la primera e"tracci#n3
p2una manzana en la segunda e"tracci#n3 (omo e"isten M naran)as y BE frutas en la bolsa,
p2una naran)a en la primera e"tracci#n3 R MNBE +uesto que la fruta obtenida en la primera
selecci#n se reemplaza antes de e"traer la segunda, no tiene efecto alguno sobre la fruta elegida
en la segunda e"tracci#n (omo hay C manzanas y BE frutas, p2una manzana en la segunda
e"tracci#n3 CNBE +or lo tanto p2una naran)a en la primera e"tracci#n y una manzana en la
segunda e"tracci#n3 R MNBE2CNBE3 R FBFMO
M#est$eo !leato$io y *$o+a+ilidad - 9= -

Suponga que usted e"trae al azar D individuos de una poblaci#n de BBF hombres y mu)eres
4ay EF varones y MF mu)eres en esa poblaci#n %l muestreo es de un individuo a la vez, con
reemplazo (ul es la probabilidad de que la muestra contenga s#lo mu)eres?
SOLUCIN
La soluci#n aparece en la figura acompa&ante (omo el problema requiere una mu)er en
la primera e"tracci#n y una mu)er en la segunda e"tracci#n, y como estos dos eventos son
independientes 2el muestreo es con reemplazo3, aplicamos la regla del producto con eventos
independientes .s, puna mu)er en la primera e"tracci#n y una mu)er en la segunda
e"tracci#n3 R p2una mu)er en la primera e"tracci#n3 p2una mu)er en la segunda e"tracci#n3
(omo hay MF mu)eres y BBF personas en la poblaci#n, p2una mu)er en la primera e"tracci#n3 R
MFNBBF , y p2una mu)er en la segunda e"tracci#n3 R MFNBBF +or lo tanto, p2una mu)er en la
primera e"tracci#n y una mu)er en la segunda e"tracci#n3 R i
MFNBBF 2MFNBBF3 R AMFFNBDBFF R FDPOE
M#est$eo !leato$io y *$o+a+ilidad - ;@ -
La regla del producto para eventos independientes tambin se aplica en situaciones con ms
de dos eventos %n tales casos, la probabilidad de la ocurrencia con)unta de los eventos es igual al
producto de las probabilidades individuales de cada evento %n forma de ecuaci#n-
+ara mostrar el uso de esta ecuaci#n, suponga que en vez de obtener una muestra de D
individuos pertenecientes a la poblaci#n descrita en el problema de prctica GO, se e"trae una
muestra de C personas Salvo esta *ltima condici#n, el problema es el mismo La poblaci#n est
compuesta por EF hombres y MF mu)eres (omo antes, el muestreo es de una persona a la vez, con
reemplazo (ul es la probabilidad de obtener A mu)eres y B hombre, en ese mismo orden? La
soluci#n aparece en la figura GC (omo el problema requiere una mu)er en la primera y segunda y
tercera e"tracciones, y un hombre en la cuarta e"tracci#n, y como el muestreo es con reemplazo,
aplicamos la regla del producto para ms de dos eventos independientes %sta regla es similar a la
del producto para dos eventos independientes, s#lo que tiene ms factores .s, p2una mu)er en la
primera e"tracci#n y una mu)er en la segunda e"tracci#n, una mu)er en la tercera e"tracci#n y
un hombre en la cuarta e"tracci#n3 R p2una mu)er en la primera e"tracci#n3 p2una mu)er en la
segunda e"tracci#n3 p2una mu)er en la tercera e"tracci#n3p2un hombre en la cuarta e"tracci#n3
4ay MF mu)eres, EF hombres y BBF personas en la poblaci#n (omo el muestreo es con reemplazo,
p2una mu)er en la primera e"tracci#n3 R MFNBBF , p2una mu)er en la segunda e"tracci#n3 R
MFNBBF p2una mu)er en la tercera e"tracci#n3 R MFNBBF , y p2un hombre en la cuarta
e"tracci#n3 R EFNBBF as_, p2 una mu)er en la primara e"tracci#n y una mu)er en la segunda
e"tracci#n y una mu)er en la tercera e"tracci#n y un hombre en la cuarte e"tracci#n3 R MFNBBF \
MFNBBF \ MFNBBF\ EFNBBF R BFGFNBCMCB R FFOAG
ReFla del -$od#ctoB 3entos De-endientes cuando . y ? son dependientes, la
probabilidad de que ocurra ? resulta afectada por la ocurrencia de . %n este caso, no podemos
simplificar la ecuaci#n para probabilidad de . y ? 0enemos que utilizarla en su forma original
+or consiguiente, si . y b son dependientes,
+2. y ?3 R p2.3p2?s.3 $eFla del -$od#cto de e3entos de-endientes
%l muestreo sin reemplazo proporciona una buena ilustraci#n de los eventos dependientes
M#est$eo !leato$io y *$o+a+ilidad - ;1 -
Supongamos que usted va a e"traer dos cartas, una a la vez, sin reemplazo, de un mazo de
bara)as ordinarias (ul es la probabilidad de que ambas cartas sean ases?
La soluci#n se presenta en la figura GE (onvengamos en que . representa un as en la
primera e"tracci#n y 8 representa un as en la segunda e"tracci#n (omo el muestreo se realiza
sin reemplazo 2la carta obtenida en la primera e"tracci#n es retirada de la bara)a3, la ocurrencia de
A realmente afecta la probabilidad de 8. A y 8 son dependientes entre s (omo el problema
requiere un as en la primera e"tracci#n y un as en la segunda, y como estos eventos son
dependientes, aplicamos la regla del producto para eventos dependientes .s, p2un as en la
primera e"tracci#n y un as en la segunda e"tracci#n3 R p2un as en la primera e"tracci#n3p2un as
en la segunda e"tracci#n, en virtud de que se obtuvo un as en la primera e"tracci#n3 +ara la
primera e"tracci#n, hay C ases y ED cartas +or lo tanto, p2un as en la primera e"tracci#n3 RCNED
%n virtud de que el muestreo se realiza sin reemplazo,p2un as en la segunda e"tracci#n despus
de haber obtenido un as en la primera e"tracci#n3 RANEB .s, pues, p2un as en la primera
e"tracci#n y un as en la segunda e"tracci#n3 R CNED2ANEB3 R BDNDMED R FFFCE
Suponga que e"trae al azar dos frutas, una a la vez, de la misma bolsa descrita en el
problema de prctica GM (omo antes, dicha bolsa contiene cuatro manzanas, seis naran)as y cinco
duraznos Sin embargo, esta vez obtendr la muestra sin reemplazo (ul es la probabilidad de
obtener una naran)a y una manzana, en ese orden?
SOLUCIN
La soluci#n aparece en la figura acompa&ante (omo el problema requiere una naran)a y
una manzana, y como el muestreo se realiza sin reemplazo, aplicamos la regla del producto para
eventos dependientes .s_, p2una naran)a en la primera e"tracci#n y una manzana en la segunda
e"tracci#n3 R p2una naran)a en la primera e"tracci#n3p2una manzana en la segunda e"tracci#n
despus de haber obtenido una naran)a en la primera e"tracci#n3 %n la primera e"tracci#n hay
M#est$eo !leato$io y *$o+a+ilidad - ;% -
M naran)as y BE frutas +or lo tanto, p2una naran)a en la primera e"tracci#n3 R MNBE %n virtud
de que el muestreo se realiza sin reemplazo,p2una manzana en la segunda e"tracci#n despus
de haber obtenido una naran)a en la primera e"tracci#n3 R CNBC +or lo tanto, p2una naran)a en
la primera e"tracci#n y una manzana en la segunda e"tracci#n3 R MNBE 2CNBC3 R DCNDBF R FBBCA
0al como ocurre con la regla del producto para eventos independientes, la regla del producto
para eventos dependientes se aplica tambin a situaciones en las que intervienen ms de dos
eventos %n esos casos, la ecuaci#n adopta la forma siguiente-

*$o+a+ilidad y 3a$ia+les contin#as con dist$i+#ci&n no$mal
4asta este punto, en nuestro anlisis de la probabilidad hemos considerado variables discretas,
por e)emplo, el muestreo a partir de una bara)a de cartas o el lanzamiento de un par de dados
Sin embargo muchas de las variables dependientes que es necesario evaluar en los e"perimentos
son continuas, no discretas (uando una variable es continua
%n virtud de que con frecuencia 2aunque no siempre3 estas variables estn distribuidas de
manera normal, concentraremos nuestro anlisis en las variables continuas con distribuci#n
normal
+ara ilustrar el uso de la probabilidad con variables continuas que tienen una distribuci#n
normal, suponga que hemos determinado los pesos de todas las mu)eres inscritas en el cuarto
semestre de la universidad en la que usted estudia Hmaginemos que se trata de un con)unto de
datos pertenecientes a una poblaci#n cuya distribuci#n es normal, con una media de BDF libras y
una desviaci#n estndar de G libras Si elegimos al azar un dato de esta poblaci#n, cul es la
probabilidad de que el dato seleccionado sea igual o mayor que BAC?
La poblaci#n se muestra en la figura GG La media de BDF y el dato BAC se localizan sobre el e)e
1 %l rea sombreada representa a todos los datos mayores o iguales a BAC (omo el muestreo es
aleatorio, todos los datos tienen la misma posibilidad de ser seleccionados .s, la probabilidad de
obtener un dato igual o mayor que BAC se determina calculando la proporci#n del total de datos
contenidos en el rea sombreada +uesto que los datos estn distribuidos de forma normal,
podemos determinar esta proporci#n convirtiendo el dato en bruto en su valor z transformado,
para luego buscar el rea en la tabla . del apndice , .s, pues,

M#est$eo !leato$io y *$o+a+ilidad - ;' -
,e la columna ( de la tabla .,
%stamos seguros de que el lector reconocer que este tipo de problema es similar a los que
presentamos en el captulo E, cuando estudiamos los punta)es estandarizados La diferencia
principal es que, en este captulo, el problema se formula en trminos de probabilidad y no en
trminos de la proporci#n o el porcenta)e de los datos, como fue planteado en el captulo E (omo
quiera que el lector ya se ha familiarizado con problemas de esta ndole, no creemos que sea
necesario presentar muchos problemas de prctica Sin embargo, solucionaremos un par de ellos
s#lo para estar seguros (onsideremos la misma poblaci#n de mu)eres universitarias que
estudian el cuarto semestre Si se elige un dato aleatoriamente de la poblaci#n, cul es la
probabilidad de que ste sea igual o menor que BBF?
SOLUCIN
La soluci#n se muestra en la figura acompa&ante %l rea sombreada representa todos los
datos que son iguales o menores que BBF +or el hecho de que el muestreo es aleatorio, todos los
datos tienen la misma posibilidad de ser elegidos +ara determinar p 21 k BBF3 debemos
transformar primero el dato en bruto de BBF en su punta)e z . continuaci#n, podemos calcular
la proporci#n de datos contenidos en el rea sombreada, con ayuda de la tabla . .s
Dist$i+#ciones de *$o+a+ilidad - ;( -
Dist$i+#ciones de -$o+a+ilidad
La 0abla AB muestra, para el %stado de <eorgia, la proporci#n, por grupos de edades,
de todos los criminales convictos durante el a&o fiscal de BPOB y sometidos a
custodia de la 5unta %statal de (orrecci#n %n el (aptulo B aprendimos que una
tabla de este tipo es una distribuci#n de frecuencia relativa y en el (aptulo D nos
enteramos de que la probabilidad de un evento se puede interpretar como la
frecuencia relativa de sus ocurrencias %n consecuencia, nos podemos referir a la 0abla
AB como una distribuci"n de probabilidad, materia de estudio del presente captulo
0ablas como la AB se pueden encontrar frecuentemente en los informes anuales de
las agencias gubernamentales La informaci#n tiene gran inters para una gran variedad
de personas, como soci#logos, legisladores Iy traba)adores sociales adems del que
tiene para los empleados y profesionales de la agencia que prepara el informe anual
%n el presente captulo nos basaremos en lo que se aprendi# sobre al inicio del curso, que
nos hizo comprender me)or c#mo es posible sacar conclusiones sobre una poblaci#n,
e"aminando los datos de una muestra que se e"trae de ella Jamos a estudiar primero
la construcci#n de distribuciones empricas de probabilidad y, luego, algunas
distribuciones especiales de probabilidad, con variables aleatorias discretas y
continuas

'41 DISTRI?UCIONS D ,!RI!?LS DISCRT!S


n inicio de este manual definimos variable discreta como una variable cuyos valores
estn separados por alguna cantidad !n e)emplo de variable discreta consiste en los
valores que obtenemos al contar el n*mero de admisiones en un hospital %n este
e)emplo, la variable puede tener solamente los valores F, B, D, 8o puede haber valores
como, BAAM DBMFE
(on frecuencia resulta conveniente poder idear alg*n mecanismo o regla que nos
permita determinar la probabilidad de que la variable discreta 1 asuma alg*n valor
particular 84
D)INICION
Dist$i+#ciones de *$o+a+ilidad - ;/ -
Cualquier regla o mecanismo que sirva para determinar !>4 5 x&, probabilidad de que la
variable aleatoria 4 tome cada uno de los valores posibles x, se denomina una dist$i+#ci&n
de -$o+a+ilidad4
%sta regla o mecanismo puede ser una tabla, un grfico o una f#rmula !na f#rmula
que se emplee para calcular !>4 5 "3 se denomina funcin de probabilidad '
generalmente se denota por f2"3 %s decir, f>x& 5 !>4 5 x&.
Gem-lo '41
Las dos primeras columnas de la 0abla AD muestran la distribuci#n del n*mero de
arrestos anteriores para EFF adolescentes que, durante un a&o, comparecieron ante un
tribunal de menores
I
,enotemos por 1 la variable aleatoria discreta ;n*mero de arrestos anteriores; y por "
los valores que 1 puede tomar !tilizando el concepto de probabilidad de frecuencia
relativa, podemos calcular, para cada ", la probabilidad de que cada 1 tome ese valor
%stas probabilidades, que se denotan por !>4 5 "3, se muestran en la *ltima columna de
la 0abla AD %sta tabla ilustra la forma en que se puede representar una distribuci#n de
probabilidad por medio de una tabla
+odemos utilizar la 0abla AD para saber cules son las probabilidades de que un )oven
haya tenido determinado n*mero de arrestos previos .s, por e)emplo, la probabilidad de
que un )oven escogido al azar en este grupo haya tenido dos arrestos previos es de FBD
%sto mismo lo podemos e"presar en una forma ms compacta como !>4 5 D3 R FBD Las dos
caractersticas necesarias en una distribuci#n de probabilidad aparecen en la 0abla AD
Son las siguientes-
%n otras palabras, la probabilidad de ocurrencia de cada x debe ser u n nmero igual o
mayor que F y la suma de todas las probabilidades correspondientes a cada uno de los
valores de 1 tiene que ser igual a B 0omadas en su con)unto, estas dos caractersticas
llevan implcito lo que ya hemos aprendido, es decir, que la probabilidad de un evento es un
n*mero comprendido entre F y B
'ecordemos que para que una distribuci#n de probabilidad e"ista deben estar
presentes las dos caractersticas que se establecieron anteriormente
(on frecuencia estamos interesados en conocer la probabilidad de que 1 tome un valor
Dist$i+#ciones de *$o+a+ilidad - ;5 -
menor o igual a " (on los datos del %)emplo AB deseamos hallar !>4 H A3, es decir, la
probabilidad de que un adolescente del grupo haya tenido tres arrestos anteriores o
menos Hnformaci#n de este tipo es muy *til para hacer programas de educaci#n y
rehabilitaci#n de delincuentes )uveniles
,%=H8H(H78
La probabilidad de que la variable aleatoria 4 asuma valores menores o iguales a x se llama
funci#n de distribuci#n acumulada de 4 ' se denota por I>x &.
,e esta manera, podemos escribir

.s, para calcular la probabilidad de que 1 sea menor o igual a un determi nado valor,
digamos a, procedemos de la siguiente manera-
+odemos facilitar el clculo de !>4 H x& acumulando los valores !>4 R "3 dados en la tabla
de la distribuci#n de probabilidad La 0abla AA muestra los resultados obtenidos al
acumular los valores !>4 5 x& de la 0abla AD %"aminando esta tabla vemos que !> 4 + A3
R FPM
+odemos representar grficamente las distribuciones de probabilidad y las funciones
de distribuci#n acumulada La apariencia fsica de estos grficos es tpica cuando la variable
que se estudia es discreta
%n la figura AB 2b3, las probabilidades estn representadas solamente por las lneas
horizontales Las lneas verticales no sirven sino para unir las lneas que representan
las probabilidades y por eso no parece que estuvieran flotando en el espacio 4ay que
tener presente que f 2"3 es igual a F para cualquier valor de x que 4 no pueda asumir y
en consecuencia I>x& es igual a F cuando " R F (on base en la =igura ?.% >a&, podemos
determinar que !>4 5 ?& 5 f>?& 5 FFC (on base en la =igura AB 2b3, podemos determinar
que !>4 9 ?& 5 I>?& 5 ..*6.
Dist$i+#ciones de *$o+a+ilidad - ;9 -
Las distribuciones que hemos estudiado hasta ahora en esta secci#n pueden llamarse
distribuciones empricas, porque se han construido directamente con los datos de un
e"perimento %n el resto de esta secci#n vamos a estudiar una distribuci#n discreta especial-
la distribuci"n binomial. %sta distribuci#n se basa en un proceso determinado, que, cuando es
operativo, produce datos que se distribuyen de acuerdo con una regla bien definida
<eneralmente no estamos en capacidad de decir con certeza que los datos de que
disponemos se han distribuido e"actamente como lo especifica la regla Sin embargo, con
frecuencia vamos a decir que la variable aleatoria en la que estamos interesados est
distribuida en tal forma que su distribuci#ntde probabilidad puede aproximarse por medio de
la regla de esta distribuci#n especial %n consecuencia, vamos a utilizar la regla 2funci#n de
probabilidad3 para calcular probabilidades de inters
La dist$i+#ci&n +inomial
(onsideremos un e"perimento aleatorio que produce, en cada ensayo, *nicamente uno de dos
resultados mutuamente e"cluyentes %)emplos de este tipo de e"perimentos son los que se
enumeran a continuaci#n-
B %l nacimiento de un ni&o Los resultados posibles son- ;hombre; y ;mu)er;
D Se elige al azar un ni&o entre un grupo en el que m ni&os tienen una inteligencia superior al
promedio ' n ni&os una inteligencia igual o inferior al promedio Los resultados posibles son-
;ni&o con inteligencia superior al promedio; y ;ni&o con inteligencia igual o inferior al
promedio;
A Se selecciona al azar un paquete de cereales de los que estn en un estante de un almacn
de comestibles que contiene a paquetes de marca A y b paquetes de marca 8. Los
resultados posibles son- ;paquete de cereales de marca A3 y ;paquete de cereales de marca 83.
C !n estudiante presenta un e"amen final Los resultados posibles son- ;aprobar; y
;reprobar;
Los e"perimentos de este tipo, en los que no se puede producir, en cada ensayo, sino uno
de dos resultados mutuamente e"cluyentes se denominan ensa'os de 8ernoulli, en honor al
matemtico suizo 5a:ob ?ernoulli 2BMECBOFE3, considerado como uno de los fundadores de la
teora de la probabilidad +or conveniencia, se suele denominar arbitrariamente uno de los
resultados de un ensayo de ?ernoulli como "ito 2%3 y al otro como fracaso 2=3 .dems, se
suele denotar por p la probabilidad de que un "ito ocurra en un ensayo y por 2B Ip3 ) q la
probabilidad de que ocurra un fracaso
.hora consideremos una serie de varios ensayos de ?ernoulli que satisfaga las siguientes
condiciones-
B La probabilidad de un "ito p permanece constante de un ensayo a otro
D Los ensayos son independientes
<eneralmente tiene importancia poder determinar la probabilidad de que se observen x
n*mero de "itos cuando se repite un e"perimento n veces ba)o las condiciones que se acaban de
establecer
Supongamos, por e)emplo, que el DF c de los pacientes que se han dado de alta en un
hospital durante los diez *ltimos a&os han sido adolescentes %l encargado de las historias
clnicas, a quien un mdico le solicita que retire las historias de tres adolescentes, puede
preguntarse qu probabilidad hay de obtener x 5 A historias de adolescentes 2"itos3, si n 5 E
historias se sacan al azar Ser conveniente que podamos obtener una f#rmula que sirva para
todos los valores de n ' x.
Dist$i+#ciones de *$o+a+ilidad - ;; -
Supongamos que n ensayos de ?ernoulli dieron como resultado n - x fracasos seguidos de "
"itos %sta secuencia la podemos representar de la manera siguiente-

,e acuerdo con la regla de la multiplicaci#n, la probabilidad de que esta secuencia
particular de resultados se produzca es igual a qqq . . . q ppp ... p 5 q3 - xpx

La probabilidad sera
a*n en el caso en que cambie el orden en que ocurrieron los " "itos y los n - x fracasos
Si se quiere determinar la probabilidad de que " "itos sean observados en n ensayos, el
orden en que ocurren los "itos no tiene importancia %n consecuencia debemos conocer el
n*mero de secuencias posibles de "itos y fracasos que produzcan e"actamente " "itos
+odemos calcular este n*mero siguiendo la f#rmula dada en el (aptulo D para encontrar el
n*mero de permutaciones de n cosas, de las cuales x son de un tipo y n-x son de otro tipo
Seg*n esta f#rmula, el n*mero de secuencias deseado es
Si se tiene un valor peque&o para n, resulta bastante fcil enumerar cada una de las secuencias
posibles y se&alarlas con los n*meros B, D, A, , 2"3 (onsidere nos el e)emplo de las historias
clnicas %l n*mero de secuencias de c*neo historias clnicas en las que tres corresponden a
adolescentes, designadas con la % de "ito y el resto con la = de fracaso, est dado por
+odemos enumerar estas secuencias as-
'esultaran e"actamente " "itos sobre n ensayos si ocurriera la secuencia 8o B o la
secuencia 8o D o la secuencia
I
8o A, , o la secuencia 8o 2e3 Seg*n la regla de la suma,
entonces, la probabilidad de observar e"actamente x "itos sobre n ensayos de ?ernoulli es
igual a la probabilidad de la secuencia 8o B m.s la probabilidad de la secuencia 8o % m.s la
probabilidad de la secuencia 8o A, ms la probabilidad de la secuencia 8o 21;3 (omo hay
un total de 2z3 secuencias y como la probabilidad de ocurrencia de cada una es igual a q
nI "
\ p
"
, podemos e"presar la probabilidad de que ocurran e"actamente x "itos en n ensayos
de ?ernoulli mediante la e"presi#n
donde 4 es la variable aleatoria ;n*mero de "itos; y los valores que 4 puede tomar son " R
F, B, D, A, , n. %l miembro izquierdo de la ecuaci#n se lee ;la probabilidad de que 4 sea
igual a ", dado n ' p3. La ecuaci#n tambin se puede escribir
Jolviendo nuevamente al e)emplo de las historias clnicas, encontramos, utilizando la
ecuaci#n anterior, que la probabilidad de sacar las historias cl nicas de A adolescentes si n R
E y si la probabilidad de sacar la historia clnica de un adolescente es FDF, es igual a
Dist$i+#ciones de *$o+a+ilidad - ;= -
.hora es posible hacer una lista de los valores que 1 puede tomar )unto a la
probabilidad de ocurrencia de cada valor %n otras palabras, por medio de la ecuaci#n
podemos representar la distribuci#n de probabilidad de 1 en forma tabular, tal como se
puede ver en la 0abla AC
>a sabemos que las dos caractersticas necesarias de una distribuci#n de probabilidad
consisten en que cada valor de !> 4 5 x& tiene que ser mayor o igual a F y que la suma de
todos los valores de +21 R "3 debe ser igual a B +ara comprobar que el primer requisito se
satisface en la 0abla AC, obsrvese que p y n son ambos positivos y en consecuencia !>4 5
"3 nunca puede ser negativa +ara comprobar que la segunda condici#n tambin se satisface,
observemos que las probabilidades !> 4 5 x& son idnticas a los trminos de la e"pansi#n
binomial de > q F p&, que se desarrolla de la manera siguiente
y puesto que q Y p R B, tenemos

(omo resultado de esta relaci#n, generalmente nos referimos a la distribuci#n de
probabilidad dada en la 0abla AC, como distribuci"n binomial de probabilidad, o ms
sencillamente como distribuci"n binomial.
La distribuci#n binomial es realmente una familia de distribuciones, puesto que para
cada valor diferente de n ' p, que se denominan parmetros de la distribuci#n binomial, se
puede definir una distribuci#n diferente La =igura AD muestra la forma en que vara la
distribuci#n binomial seg*n toman diferentes valores los parmetros p y n Sin tener en
cuenta el valor de n, la distribuci#n es simtrica cuando p R FE (uando p es mayor que
FE, la distribuci#n es asimtrica y su m"imo se encuentra a la derecha del
centro (uando p es menor que FE, la distribuci#n es asimtrica y su m"imo se encuentra
a la izquierda del centro
Dist$i+#ciones de *$o+a+ilidad - =@ -
(uando las condiciones de una serie de ensayos de ?ernoulli se han satisfecho, la distribuci#n
binomial constituye un instrumento muy *til para determinar probabilidades Si se quiere
calcular la probabilidad de que ocurran " "itos en n ensayos de ?ernoulli, simplemente se eval*a
nuestra ecuaci#n para los valores especficos de " y n.I
Sin embargo, debemos tener presente que el uso adecuado de la distribuci#n binomial
depende de la suposici#n de que los n ensayos del e"perimento sean n ensayos tomados de un
n*mero infinito de ensayos posibles %n las aplicaciones prcticas de la distribuci#n binomial,
decimos que esta se puede aplicar cuando la muestra se e"trae de una poblaci#n infinita o
cuando se e"trae de una poblaci#n finita con reemplazamiento (omo en la prctica se suele
e"traer la muestra sin reemplazamiento, hay que tener mucho cuidado al aplicar la
distribuci#n binomial
%"iste un consenso general en que cuando el tama&o de la poblaci#n es grande en
relaci#n con el tama&o de la muestra y cuando p no tiene un valor demasiado cercano a F o
a B, se puede utilizar la distribuci#n binomial si la muestra se e"trae sin reemplazamiento de
una poblaci#n finita %sta no es una gua muy precisa, pero no se puede disponer fcilmente
de otra me)or .lgunos profesionales recomiendan que se utilice la distribuci#n binomial s#lo
cuando la poblaci#n tenga por lo menos diez veces el tama&o de la muestra
(on otro e)emplo se puede e"plicar me)or el uso de la distribuci#n binomial
Dist$i+#ciones de *$o+a+ilidad - =1 -
%)emplo AD
%n un rea geogrfica determinada, el CF G de la poblaci#n adulta pertenece al partido
dem#crata Se saca una muestra aleatoria de diez adultos $u probabilidad hay de que
tres de ellos pertenezcan al partido dem#crata? Suponemos que el tama&o de la poblaci#n es
grande en relaci#n con el tama&o de la muestra 0enemos pues una pregunta que se puede
contestar por medio de la distribuci#n binomial, donde n R BF, p R FC y " R A +or medio
de nuestra ecuaci#n hallamos que-
+or lo tanto, la probabilidad de que haya tres dem#cratas entre diez adul tos escogidos al
azar en una poblaci#n grande en la que el CFc son dem#cratas es de FDBEF
0ablas de la distribuci#n binomial %l clculo de las probabilidades binomiales mediante la
ecuaci#n anterior puede resultar increblemente laborioso cuando n es grande
.fortunadamente, se han preparado tablas de probabilidades binomiales y entonces no es
necsario el uso directo de la ecuaci#n Solamente necesitamos utilizar una tabla con los
valores dados de n, p ' x para obtener la probabilidad deseada La 0abla , del .pndice es
una parte de una tabla de este tipo
+ara e"plicar el uso de la 0abla , consideremos nuevamente el %)emplo AD en el cual
desebamos saber la probabilidad de que hubiera tres dem#cratas entre diez adultos
seleccionados al azar en una poblaci#n que tena el CFc de dem#cratas +ara hallar esta
probabilidad en la 0abla ,, localizamos primero n 5 BF, luego la columna de p 5 FCF y
finalmente, para n R BF, la fila marcada con un A %l registro tabular que se encuentra en la
intersecci#n de esta hilera y la columna, es la probabilidad que se busca 4allamos que es
FDBEF, valor que obtuvimos por medio de la ecuaci#n
(#mo hallar las probabilidades binomiales acumuladas (on frecuencia se necesita saber
cules son las probabilidades que hay de que 1 asuma valores mayores que un valor dado ",
valores menores que un valor dado " o valores que estn dentro de un intervalo limitado por
dos valores dados de 1, digamos ", y "D
Jolvamos a referirnos al rea geogrfica donde el CF c de la poblaci#n es dem#crata
Supongamos que deseamos saber la probabilidad de encontrar entre A y E dem#cratas en un
grupo de BF personas del rea, elegidas al azar
Si estn dados n, p y ", la probabilidad de que 4 sea mayor que x se halla sumando las
probabilidades individuales %sto es,

,e la misma manera, la probabilidad de que 1 asuma valores menores que x se halla
sumando las probabilidades de los valores individuales de 4 entre F y "IB %s decir
Dist$i+#ciones de *$o+a+ilidad - =% -
=inalmente, la probabilidad de que 1 asuma valores entre ", y "D inclusive, se halla
sumando las probabilidades de valores individuales de 1 entre ", y "D inclusive %sto lo
e"presamos en una forma ms condensada como-

+odemos obtener todas estas clases de probabilidades sumando los n*meros apropiados de
la 0abla , del .pndice Jamos a e"plicar el procedimiento con un e)emplo
%)emplo AA
%l AE c de los internos de una instituci#n correccional son reincidentes Se selecciona,
para una evaluaci#n, una muestra aleatoria de BE internos
2a3 4allar la probabilidad de que el n*mero de reincidentes del grupo sea mayor que BF
Soluci#n- Seg*n la 0abla , del .pndice, hallamos
2b3 4allar la probabilidad de que E o ms sean reincidentes Soluci#n- (on la
0abla , del .pndice obtenemos

2c3 4allar la probabilidad de que menos de G sean reincidentes Soluci#n- (on la
0abla , del .pndice hallamos

2d3 4allar la probabilidad de que P o menos sean reincidentes Soluci#n- Seg*n la
0abla , del .pndice tenemos

2e3 4allar la probabilidad de que el n*mero de reincidentes est entre E y BD inclusive
Soluci#n- (on la tabla , del .pndice obtenemos
Dist$i+#ciones de *$o+a+ilidad - =' -

2f3 4allar la probabilidad de que el n*mero de reincidentes sea mayor que M pero menor
que BD
Soluci#n- Seg*n la tabla , del .pndice hallamos

!so de la 0abla , del .pndice para p j FE 7bsrvese que la 0abla , del .pndice no
contiene valores de p mayores que FEF +ara encontrar las probabilidades binomiales en la
0abla ,, cuando p es mayor que FEF, empleamos la tabla marcada con n como de
costumbre, pero localizamos la columna correspondiente a lI p y no a p y la fila
correspondiente a nI" y no a " %n otras palabras, hallamos la probabilidad deseada en la
intersecci#n de la columna marcada con BIp y la fila marcada n-x, para una n dada
!tilizando nuestra notaci#n usual podemos escribir
%"pliquemos esto por medio de un e)emplo
%)emplo AC
%l OFc de los adultos que viven en una comunidad tiene ms de DE a&os de edad Se
seleccionan cinco adultos al azar $u probabilidad hay de que A tengan ms de DE a&os?
+ara hallar esta probabilidad, localizamos n R E en la 0abla , y luego encontramos la
intersecci#n de la columna correspondiente a B I FO R FA y la fila correspondiente a E I A R
D
%ncontramos que la probabilidad es FAFGO
+odemos verificar que este resultado es correcto por medio de nuestra ecuaci#n-
%5%'(H(H7S
t B !n estudiante que no se ha preparado absolutamente nada para un e"amen, ve que
este contiene DF preguntas de verdadero y falso ,ecide lanzar al aire una moneda para
responder .nota ;verdadero; si la moneda cae por cara y ;falso; si cae por sello
2a3 $u probabilidad hay de que pase el e"amen si para hacerlo
debe contestar correctamente el OF cde las preguntas?
2b3 $u probabilidad hay de que conteste por lo menos la mitad
de las preguntas correctamente?
Dist$i+#ciones de *$o+a+ilidad - =( -
D La probabilidad de que un individuo acierte, en un solo tiro, con un dardo en el centro
de un blanco es de FCF Lanza BF dardos consecutivamente 4allar la probabilidad de que d
en el blanco-
2a3 0odas las BF veces
2b3 (inco veces
2c3 %ntre A y O veces inclusive 2d3 9enos de A veces
A La probabilidad de un nacimiento masculino es de FED (ul es la probabilidad
de que en una familia que tiene A hi)os, haya 2a3 0res varones?
2b3 8ing*n var#n?
2c3 +or lo menos un var#n?
C Supongamos que el AF c de los estudiantes de una universidad se oponen a pagar
una cuota para actividades estudiantiles 4allar la probabilidad de que en una muestra
aleatoria de DE estudiantes el n*mero de estudiantes que se opone a la cuota sea-
2a3 %"actamente E
2b3 9ayor que E
2c3 (inco o menos
2d3 !n n*mero comprendido entre M y BF inclusive
E !na secretaria que debe llegar a su traba)o todas las ma&anas a las G-FF se
retarda BE minutos o ms el DFc de las veces %l presidente de la compa&a, que no
llega sino a las BF-FF am, llama ocasionalmente a la oficina entre G-FF y G-BE para dictar
una carta (ul es la probabilidad de que, tres ma&anas de las M en que el presidente
llama, la secretaria no est en la oficina?
M %n el BE , de los hogares de un rea metropolitana no hay nadie por la noche entre
las O-FF y la media noche !na persona que est haciendo una encuesta telef#nica
selecciona al azar BF hogares de esa zona y los encuesta entre las O-FF y la media noche (ul
es la probabilidad df- que la persona que est haciendo la encuesta no obtenga respuesta en
2a3 0odas las BF llamadas?
2b3 %"actamente E llamadas?
2c3 0res llamadas o menos?
2d3 (ul es la probabilidad de que la persona obtenga una respues
ta en cada una de las BF llamadas?
O !n mtodo modelo para ense&ar una habilidad especial a ciertos individuos
retardados resulta efectivo en el EF c de los casos Se ensayo un nuevo mtodo con BE
personas Si el nuevo mtodo no es me)or que el mtodo modelo, cul es la probabilidad de
que BB o ms aprendan la habilidad?
G %l archivo de personal de una fbrica indica que el BF c de los empleados de la
lnea de monta)e se retiran al a&o de haber sido contratados Se acaba de contratar BF
empleados nuevos
2a3 (ul es la probabilidad de que e"actamente la mitad de ellos
siga traba)ando despus de un a&o?
2b3 (ul es la probabilidad de que todos sigan traba)ando des
Dist$i+#ciones de *$o+a+ilidad - =/ -
pus de un a&o?
2c3 (ul es la probabilidad de que A de los BF se vayan antes de terminar el a&o?
P %n una zona geogrfica, el BEc de los adultos son analfabetos ,ada una muestra
aleatoria de DE adultos de esta rea, cul es la probabili dad de que el n*mero de
analfabetos sea
2a3 %"actamente BF?
2b3 9enos de E? 2c3 (inco o ms?
2d3 %ntre A y E inclusive?
2e3 9enos de O pero ms de C?
'4% DISTRI?UCIONS D ,!RI!?LS CONTINU!S
%n el (aptulo B definimos una variable continua como una variable qu puede asumir
cualquier valor dentro de un intervalo de valores y citamos como e)emplos variables que se
pueden medir en unidades de altura, peso, tiempo o temperatura
%n la Secci#n AB donde se estudiaron las variables discretas, aprendimos a determinar la
probabilidad de que la variable aleatoria discreta 1, asuma un valor particular " 4emos
estudiado los mtodos tabulares, grficos y matemticos 2por medio de una f#rmula3
(uando concentramos la atenci#n en una variable continua, generalmente deseamos
saber determinar la probabilidad de que 1 asuma valores dentro de alg*n intervalo +or
e)emplo, deseamos saber la probabilidad de que 1 asuma valores entre 1
a
' 4
b,
la
probabilidad de que 1 sea mayor que 1
b
o la probabilidad de que 1 sea menor que 1
a

4emos visto que las distribuciones de frecuencia y las distribuciones de frecuencia
relativa de variables continuas se construyen definiendo unos intervalos de clase y
determinando la frecuencia o frecuencia relativa con que las observaciones quedan
incluidas dentro de los intervalos de clase 0ambin vimos que las distribuciones de
frecuencia y las distribuciones de frecuencia relativa se pueden representar grficamente
por medio de histogramas y polgonos de frecuencia %l rea que queda comprendida ba)o
el histograma o el polgono de frecuencia entre dos valores cualesquiera, digamos 1
a
' 4
b,
de
una variable aleatoria 1 que se est estudiando, es igual a la frecuencia relativa de la
ocurrencia de los valores de 4 entre 1
a
' 4
b
.

,e acuerdo con el estudio de las
probabilidades, sabemos que si los datos de que disponemos son una muestra e"trada de
una poblaci#n, podemos interpretar estas frecuencias relativas como estimaciones de las
probabilidades verdaderas correspondientes +or lo tanto, podemos interpretar la frecuencia
relativa de que ocurran valores muestrales de 4 entre x
a
' x
b
2inclusive3 como una estimaci#n
de +2"
a
k 4 H "
b
3, es decir, de la probabilidad de que 1 tome valores entre "
a
'
4b
2inclusive3
Dist$i+#ciones de *$o+a+ilidad - =5 -
Supongamos que tenemos una muestra de medidas de una variable continua aleatoria
1 !n histograma de frecuencia relativa para los datos de esa muestra podra tener la imagen
de la =igura AA La regi#n sombreada de la figura se puede interpretar corno una estimaci#n
de la probabilidad de que 1 asuma valores entre "
a
y "
b

Supongamos ahora que tenemos una muestra mucho ms grande de valores 1 (omo
nuestra variable aleatoria es continua, podemos hacer mediciones con cualquier n*mero de
puntos decimales +or lo tanto, al construir un histograma para esta gran muestra de
observaciones, podemos hacer nuestros intervalos de clase tan peque&os como queramos !n
histograma de frecuencia relativa construido con una muestra muy grande de valores de 1
sera seme)ante a la =igura AC si se usan intervalos de clase muy peque&os
,e esta manera vemos que a medida que crece el n*mero de observaciones y a medida que
disminuyen las amplitudes de los intervalos de clase, el histograma se aseme)a cada vez ms a una
curva suave como la que aparece en la =igura AE +arece entonces razonable suponer que el
rea entre "
a
' "
b
de la =igura AC es casi igual al rea entre "
a
'
4b
de la =igura AE
La distribuci#n de una probabilidad continua siempre se representa grficamente mediante
una curva suave %l rea comprendida ba)o de la curva, por encima del e)e horizontal y entre las
perpendiculares que se levantan sobre los dos puntos a y b es igual a la probabilidad de que la
variable aleatoria asuma los valores comprendidos entre los dos puntos
7bsrvese que este anlisis ha perseguido el prop#sito de determinar la probabilidad
comprendida en un intervalo La raz#n de esto es que, para una variable continua, !> 4 5 x& 5
F %s decir, la probabilidad de que 4 asuma un valor especfico es igual a F (onsideremos una
curva suave dibu)ada que represente una distribuci#n de probabilidad continua Se puede ver
Dist$i+#ciones de *$o+a+ilidad - =9 -
que el rea que queda encima de un punto es igual a F
(uando se trata de histogramas hechos a partir de datos de una muestra, calculamos el
rea comprendida ba)o el histograma y entre dos puntos, cada uno de los cuales est incluido en
alg*n lmite de clase, sumando las reas representadas por las celdas adyacentes del histograma
+or e)emplo, si deseamos hallar el rea entre "
a
' x
b
del histograma de la =igura AA, sumamos las
reas de las tres celdas que se encuentran entre "
a

G
"
b

Hgualmente, para obtener el rea entre "


a
y "
b
del histograma de la =igura AC, sumamos las
reas de las celdas que se encuentran entre x
a
' x
b
.

%n este caso la tarea es menos atractiva
que en el caso del primer histograma
%l clculo del rea comprendida ba)o una curva suave, como el rea entre "a y "b de la =igura
AE, constituye un buen problema porque no tenemos ninguna celda y por lo tanto ning*n rea
para sumar +ara calcular un rea de este tipo necesitamos usar el clculo integral (omo el
estudiante no tiene por qu estar familiarizado con este clculo trataremos de l en forma
muy rpida
%n el proceso de integraci#n, el clculo integral utiliza una tcnica matemtica que es el
lmite de una sumaci#n .s pues, cuando uno emplea el clculo integral para hallar el rea ba)o
una curva suave, en realidad est agregando reas de rectngulos infinitesimalmente peque&os
2celdas3 +ara e)ecutar los clculos que se requieren en la integraci#n, hay que conocer la
f#rmula de la distribuci#n especfica que se est estudiando
.fortunadamente en este libro no vamos a utilizar el clculo integral en ninguna de las
distribuciones de probabilidad continua Las reas ba)o las curvas que tienen inters ya han
sido determinadas, tabuladas y estn a nuestra disposici#n en las tablas del .pndice, que
mencionaremos cada vez que sea necesario
La dist$i+#ci&n no$mal
%ntre todas las distribuciones continuas que se conocen, una de las ms importantes en
estadstica es la distribuci"n normal. La f#rmula de esta distribuci#n fue publicada por primera
vez por .braham ,emoivre 2BMMOBOEC3 en BOAA 7tros matemticos que figuran, en primer
plano, en la historia inicial de la distribuci#n normal son +ierre Simon, el 9arqus de Laplace
2BOCP IBGDO3 y (arl =riedrich <auss 2BOOOIBGEE3, en cuyo honor se denomina a veces
distribuci"n de Jauss.
La f#rmula de la distribuci#n normal es

Dist$i+#ciones de *$o+a+ilidad - =; -

y

indica que el trmino entre corchetes es el e"ponente de e, donde
La =igura AM muestra la grfica de una distribuci#n normal con media K y varianza L
(

.lgunas caractersticas importantes de la distribuci#n normal son las que se mencionan a


continuaci#n-
B %l rea total comprendida ba)o la curva y por encima del e)e horizontal es igual a B 2unidad
cuadrada3
D La distribuci#n es simtrica al respecto de su media %s decir, el EF c del rea est a la
derecha de la media y el EF c a la izquierda
A La media, la mediana y la moda son todas iguales
C La distancia horizontal que hay desde el punto de infle"i#n de la curva 2el punto
donde la curva de)a de ser c#ncava hacia aba)o y empieza a ser c#ncava hacia arriba3 hasta una
perpendicular levantada sobre la media es igual a la desviaci#n tpica a, como se muestra en la
=igura AM
E La distribuci#n normal es realmente una ;familia; de distribuciones, puesto que e"iste
una distribuci#n diferente para cada valor de u y v La =igura AO muestra tres
distribuciones normales con la misma desviaci#n tpica pero con diferente media (omo
podemos ver, el valor de u sit*a la distribuci#n en el e)e horizontal Las distribuciones que
tienen diferentes medias se sit*an en diferentes posiciones sobre el e)e horizontal
Dist$i+#ciones de *$o+a+ilidad - == -
La =igura AG muestra tres distribuciones normales con la misma media pero con diferentes
desviaciones tpicas %sta figura muestra c#mo mientras ms grande sea la desviaci#n tpica
ms plana y ms e"tendida es la grfica de la distribuci#n
Dist$i+#ciones de *$o+a+ilidad - 1@@ -
M La curva de una distribuci#n normal se e"tiende de Iw hasta Y w
O Si levantamos perpendiculares a una distancia de una desviaci#n tpica de la media en
cada uno de los dos lados, el rea comprendida entre estas dos perpendiculares, la curva y
el e)e horizontal es igual apro"imadamente a FMG, esto es, apro"imadamente al MG c del rea
total ,e igual manera, podemos encerrar apro"imadamente el PEc del rea total deba)o de
la curva de una distribuci#n normal, levantando perpendiculares a una distancia de dos
desviaciones tpicas de la media en cada uno de los dos lados +odemos encerrar
apro"imadamente el PPOc del rea total, levantando perpendiculares a una distancia de tres
desviaciones estndar desde la media en cada uno de los dos lados La =igura AP e"plica estos
hechos
Si una variable aleatoria 1 est normalmente distribuda, podemos calcular !>x
a
9 4 x "
b
3, la
probabilidad de que 4 asuma valores entre "a y "
b
, integrando la ecuaci#n de la distribuci#n
normal desde "a hasta
4b.
La =igura ABF muestra el rea correspondiente a la probabilidad
deseada
.fortunadamente, no habra necesidad, como se e"plicar a continuaci#n, de realizar
efectivamente la integraci#n de la f#rmula para hallar >! x
a
k1 k 4
b
& o cualquier otra
probabilidad que se est buscando
7bsrvese que en el caso de las distribuciones continuas, !>x
a
9 4 9 x
b
* da el mismo
Dist$i+#ciones de *$o+a+ilidad - 1@1 -
resultado que !>x
a
9
4
9 1b*. (omo el rea que queda sobre los puntos x
a
'
4b
es F, estos
puntos terminales no contribuyen en nada a la probabilidad asociada al intervalo
La dist$i+#ci&n no$mal estanda$iEada
>a hemos observado que hay una distribuci#n normal diferente para cada valor diferente
de u y v
D
!na distribuci#n normal de especial importancia en estadstica es la distribuci"n normal
estandari)ada que tiene una media u R F y una varianza v
(
R B
Las reas de la distribuci#n normal estandarizada correspondientes a varias probabilidades
se encuentran actualmente tabuladas La 0abla % del .pndice es un e)emplo %l cuerpo de esta
tabla da las reas ba)o la curva entre F y za, un valor especfico de l, variable aleatoria que est
normalmente distribuida con media F y varianza B %l rea sombrada de la =igura ABB corresponde
al n*mero de la 0abla % para +2F k l x za3
%)emplo AE
4allar el rea ba)o de la curva normal estandarizada entre F y z R I DFE


Soluci#n- %l rea que se busca es el rea sombreada en la =igura ABD +ara hallar el valor
numrico de esta rea, localizamos el n*mero DF en la columna que est ms hacia la izquierda y
el n*mero FFE en la fila superior de la 0abla % del .pndice %l n*mero que aparece en la
intersecci#n de esa columna y esa fila, FCOPG, es el rea que estamos buscando
%)emplo AM
(ul es la probabilidad de que un valor de z sacado al azar est comprendido entre F y
IDFE?
Dist$i+#ciones de *$o+a+ilidad - 1@% -
Soluci#n- %n virtud de la simetra de la distribuci#n normal, el rea entre F y IDFE es
e"actamente igual al rea entre F y Y DFE, como se ve en la =igura ABA
Gem-lo AO
Soluci#n- +odemos concebir que el rea que se busca en este e)emplo consta de dos partes
!na parte est a la izquierda de F y la otra parte a la derecha, como se ve en la =igura ABC
+ara hallar el rea con la 0abla % del .pndice, buscamos primero el rea entre F y
BED, o sea FCAEO Luego buscamos el rea entre F y BOG, o sea FCMDE 4allamos el
rea total sumando FCAEO y FCMDE La respuesta es FGPGD
%)emplo AG
4allar +2l j BMO3
Soluci#n- %n la =igura ABE se muestra el rea que se nos pide encontrar %sta rea no
est dada directamente en la 0abla % 'ecordemos que el rea total a la derecha de F es
FEFFF +ara buscar el rea a la derecha de BMO, buscamos el rea entre F y BMO y la restamos
de FEFFF 7btenemos FEFFF I FCEDE R FFCOE
!-licaciones de la dist$i+#ci&n no$mal
8o es muy probable que, en la naturaleza, encontremos variables aleatorias que se
distribuyan normalmente con e"actitud porque la distribuci#n normal es un ideal matemtico
Sin embargo, muchas variables aleatorias continuas pueden caracterizarse mediante una
distribuci#n normal ,entro de este tipo de variables se pueden incluir la estatura de los
Dist$i+#ciones de *$o+a+ilidad - 1@' -
individuos que pertenecen a ciertas poblaciones bien definidas, las dimensiones de ciertos
artculos manufacturados, como el dimetro de las lavadoras, los (H de las personas y otros
diversos punta)es de pruebas
(uando en una investigaci#n, la variable de inters est normalmente distribuida por lo
menos de manera apro"imada, utilizamos en su anlisis el conocimiento que tenemos de la
distribuci#n normal ,e la misma manera que con la distribuci#n normal estandarizada,
podemos responder preguntas de probabilidad en relaci#n a una variable aleatoria 1 que est
normalmente distribuida por lo menos de manera apro"imada +or e)emplo, podramos
desear saber la probabilidad de que alguna variable 1 aleatoria distribuida normalmente en forma
apro"imada, con media u y desviaci#n tpica v, asuma valores comprendidos entre "a y "
b
+ara
obtener dichas probabilidades, transformamos la variable 1, con media u y varianza L
(,
en la
variable normal estndar, l, con media F y varianza BI

%sto lo hacemos por medio de la f#rmula
mediante la cual cualquier valor x de la variable aleatoria 4 se transforma en un valor z de la
variable normal estandarizada l La =igura ABM muestra la relaci#n entre la escala original, en
unidades de 1, y la escala transformada, en unidades de l
!na vez que hayamos hecho estas transformaciones, podemos utilizar la 0abla % del
.pndice para hallar las probabilidades de inters %"pliqumonos con algunos e)emplos
%)emplo AP
Los (H de los individuos que componen una determinada poblaci#n tienen apro"imadamente
una distribuci#n normal, con una media de BFF y una desviaci#n tpica de BF
2a3 4allar la proporci#n de individuos con (H mayores que BDE
Dist$i+#ciones de *$o+a+ilidad - 1@( -
Soluci#n- (onvertimos primero BDE en un valor z por medio de la f#rmula
%l problema ahora se reduce a encontrar el rea ba)o la curva normal estandarizada que
est a la derecha de DE Seg*n la 0abla % encontramos que el rea es FFFMD La =igura ABO
e"plica el procedimiento
2b3 (ul es la probabilidad de que un individuo elegido al azar entre los de esa poblaci#n
tenga un (H entre BFE y BBE?

Seg*n la 0abla % del .pndice encontramos que el rea deseada es FDCBO La =igura ABG
muestra grficamente esta probabilidad

Soluci#n- 0enemos
Dist$i+#ciones de *$o+a+ilidad - 1@/ -
La =igura ABP muestra grficamente esta probabilidad
La a-$o8imaci&n no$mal de la +inomial
La utilidad que tiene la distribuci#n normal en estadstica se puede comprender me)or si
se tiene en cuenta el hecho de que esta distribuci#n proporciona una buena apro"imaci#n de la
distribuci#n binomial, cuando n es grande y p no est demasiado cercano a F # B !na regla
prctica que se sigue con frecuencia establece que la apro"imaci#n normal de la binomial es
apropiada cuando np ' n>% -p& son mayores que cinco
+ara utilizar la apro"imaci#n normal, hacemos que u 5 np L 5 Mnp>%
-
p& y convertimos los
valores de la variable original en valores de z para hallar las probabilidades que presenten
inters (uando el tama&o de la muestra que se va a analizar no es uno de los valores de n
dados que figuran en las tablas binomiales disponibles, la apro"imaci#n normal a la binomial
proporciona una alternativa conveniente
Dist$i+#ciones de *$o+a+ilidad - 1@5 -
(omo la distribuci#n normal es continua y la binomial es una distribuci#n discreta,
podemos obtener me)ores resultados si hacemos un a)uste en que se tenga en cuenta este
hecho cuando utilicemos la apro"imaci#n %ste a)uste, denominado correcci"n de continuidad,
se puede comprender me)or observando un histograma construido con datos binomiales y con
una curva suave superpuesta La figura ADF muestra esto para n 5 (. ' p 5 FA
%n la =igura ADF, la probabilidad de que 1 R " es igual al rea del rectngulo centrado en x.
+or e)emplo, la probabilidad de 4 5 G es igual al rea del rectngulo centrado en G +odemos ver
que este rectngulo se e"tiende de OE a GE Si consultamos la 0abla , del .pndice
encontramos que esta rea es igual a FBBCC %n la =igura ADF 2a3, aparece sombreada el rea
correspondiente
(uando utilizamos la apro"imaci#n normal de la binomial, debemos tener en cuenta el
hecho de que, para la binomial, +21 R "3 es el rea del rectngulo centrado en x. (uando
convertimos valores de x en valores de z, la correcci#n de continuidad consiste en sumar FE
a, yNo restar FE de, ", seg*n sea conveniente +ara e"plicar me)or esto, utilicemos la
correcci#n de continuidad y la apro"imaci#n normal para hallar la probabilidad de que 1
asuma un valor comprendido entre "a R OE ' 4
b
R GE (onvirtiendo a valores z, tenemos
Dist$i+#ciones de *$o+a+ilidad - 1@9 -

,e acuerdo con la 0abla % hallamos que la probabilidad que buscamos es FBDBE,
valor que est razonablemente cerca a la probabilidad e"acta de FBBCC %l rea ba)o la
curva normal, correspondiente a +2OEk1 x GE3, aparece sombreada en la =igura ADF 2b3
!tilicemos este mismo e)emplo para hallar +2E k 1 x BF3 !tilizando probabilidades
binomiales mediante la 0abla ,, encontramos que la respuesta es FOCEC %l rea correspondiente
aparece sombreada en la =igura ADB2a3
+or medio de la apro"imaci#n normal encontramos
%l rea correspondiente aparece sombreada en la =igura ADB2b3 8uevamente, vemos que la
apro"imaci#n normal da un resultado muy cercano a la probabilidad e"acta Si no
hubiramos utilizado la correcci#n de continuidad, la apro"imaci#n normal hubiera dado
Jemos que esta apro"imaci#n no est tan cercana a la probabilidad verdadera de
FOCEC como la apro"imaci#n obtenida empleando la correcci#n de continuidad (uando
Dist$i+#ciones de *$o+a+ilidad - 1@; -
n es grande y p no est demasiado cerca a F o a B, generalmente se omite la correcci#n
de continuidad si se trata de encontrar probabilidades relacionadas con intervalos tales
como

ARCICIOS
BF ,ada la variable aleatoria l que se distribuye como la distribuci#n normal estndar,
hallar lo siguiente-
2a3 +2z k BOO3
2b3 +2z k DCM3
2c3 +2F k z k FPE3
2d3 +2IDFF x z x BGF3
2e3 +2IDBF k z k IBME3
2f3 +2BCE k z k DBE3
2g3 La proporci#n de valores z mayores que BPM
2h3 La probabilidad de que l asuma valores entre IBPM y Y BPM
2i3 La frecuencia relativa de ocurrencia de valores mayores que IB ME
2)3 La probabilidad de que z sacada al azar est entre IDEG y YDEG
BB !na empresa ha encontrado que la duraci#n de sus llamadas telef#nicas a larga
distancia tiene apro"imadamente una distribuci#n normal, con media de tres minutos y
desviaci#n tpica de un minuto
2a3 %n qu proporci#n las llamadas a larga distancia tienen una duraci#n de ms de dos
minutos, pero de menos de tres y medio minutos?
2b3 $u proporci#n de llamadas se completan en un minuto o menos?
2c3 !na secretaria va a hacer una llamada a larga distancia (ul es la probabilidad de que
dure ms de cinco minutos?
BD !n psic#logo descubre que su)etos ;normales; completan una tarea determinada en
un promedio de diez minutos %l tiempo requerido para completar la tarea est
apro"imadamente normalmente distribuido con una desviaci#n tpica de tres minutos 4allar
lo siguiente-
2a3 La proporci#n de su)etos normales que completan la tarea en menos de cuatro
minutos
2b3 La proporci#n de su)etos que requieren ms de cinco minutos para completar la tarea
2c3 La probabilidad de que un su)eto normal, a quien se le haya asignado la tarea, la
complete en tres minutos
BA !nos e"pertos agrcolas descubren que el rendimiento por acre de un determinado
tipo de grano tiene una distribuci#n apro"imadamente normal, con media y desviaci#n tpica de
CF y BF toneladas por acre respectivamente
2a3 $u proporci#n del rea en acres sembradas de este grano producen ms de
cincuenta toneladas por acre?
2b3 Si se elige al azar un acre en la hacienda donde se siembra este grano, cul es la
probabilidad de que produzca menos de BE toneladas?
BC Los punta)es de una prueba de aptitud escolar estn normalmente distribuidos con
una media de MFF y una varianza de BF FFF?
Dist$i+#ciones de *$o+a+ilidad - 1@= -
2a3 $u proporci#n de los encuestados tiene un punta)e por deba)o de AFF?
2b3 !na persona va a presentar la prueba $u probabilidad tiene de obtener un punta)e
de GEF o ms? 2c3 $u proporci#n de punta)es estar entre CEF y OFF?
BE %n una poblaci#n determinada la estatura de los adultos hombres est ms o menos
normalmente distribuida, con una media y una desviaci#n tpica de OF y A pulgadas
respectivamente
2a3 $u proporci#n de hombres tiene entre ME y OA pulgadas de altura?
2b3 Se elige al azar un adulto en esa poblaci#n (ul es la probabilidad de que tenga ms de
seis pies de altura?
2c3 $u proporci#n de adultos tiene menos de E pies y G pulgadas de altura?
BM La longitud de los ptalos en una especie de flor est normalmente distribuida con una
media y desviaci#n tpica de C y D cm respectivamente
2a3 $u proporci#n de ptalos tiene ms de E cm?
2b3 $u proporci#n tiene menos de D
I
L, cm?
BO La velocidad de los autom#viles al pasar por un punto de verificaci#n de una
autopista est ms o menos normalmente distribuida, con una media de CE mph y una
varianza de DE
2a3 $u proporci#n de los autom#viles que pasan por el punto de control via)a a ms de
EF mph?
2b3 $u proporci#n pasa por el punto de control a una veloci dad de menos de CF mph?
2c3 Supongamos que la velocidad lmite en el control es de EE
mph $u proporci#n de autom#viles e"ceden esta veloci dad cuando pasan por el
control?
BG %n un sector del pas los gastos semanales de alimentaci#n de una familia estn ms
o menos normalmente distribuidos, con media y desviaci#n tpica de qMF y qBE
respectivamente
2a3 4allar la proporci#n de familias que gastan en alimentos ms de qGF por semana
2b3 4allar la proporci#n que gasta menos de qEF por semana
BP ,entro de la poblaci#n de una prisi#n, el AF c de los reclusos est all por robo Se
selecciona una muestra aleatoria de EF (ul es la probabilidad de que el n*mero de
reclusos por robo en esa muestra est entre DF y DC?
DF Supongamos que el CFc de los individuos que componen una poblaci#n estn a
favor de un proyecto de ley determinado (ul es la probabilidad de que en una muestra
aleatoria de BFF individuos se encuentre un n*mero comprendido entre AF y EF de votos a favor?
!-ndiceB Ta+las - 11@ -

!-ndiceB Ta+las - 111 -

!-ndiceB Ta+las - 11% -

!-ndiceB Ta+las - 11' -

!-ndiceB Ta+las - 11( -

!-ndiceB Ta+las - 11/ -

!-ndiceB Ta+las - 115 -

!-ndiceB Ta+las - 119 -

!-ndiceB Ta+las - 11; -

!-ndiceB Ta+las - 11= -

!-ndiceB Ta+las - 1%@ -

!-ndiceB Ta+las - 1%1 -

!-ndiceB Ta+las - 1%% -

!-ndiceB Ta+las - 1%' -

!-ndiceB Ta+las - 1%( -

!-ndiceB Ta+las - 1%/ -

!-ndiceB Ta+las - 1%5 -

!-ndiceB Ta+las - 1%9 -

!-ndiceB Ta+las - 1%; -

!-ndiceB Ta+las - 1%= -

!-ndiceB Ta+las - 1'@ -

!-ndiceB Ta+las - 1'1 -

!-ndiceB Ta+las - 1'% -

!-ndiceB Ta+las - 1'' -

!-ndiceB Ta+las - 1'( -

!-ndiceB Ta+las - 1'/ -

!-ndiceB Ta+las - 1'5 -

!-ndiceB Ta+las - 1'9 -

!-ndiceB Ta+las - 1'; -

!-ndiceB Ta+las - 1'= -

Anda mungkin juga menyukai