,
M.l
Aspectos bsicos de la tnterfazjer usuaro'lI&:WDdws 27
":
Al,'~.
36
. :.'1-
.;' . '
..~"
.~~ ,
~.
"
"""
sus aplicaciones
Obtef,,~nctusioris ecerce"
de las poblaciones. besndose
. soierreo t e en la iflformac iOn
z de las
'"!
Presentar y
~ ... describir la
mueStras
iriformad6il
I
I
Probabilidad bsice
y distr ibuciones de
probabilidad (captulo 4)
I
Estadst ica
descriptiva
(captulo 31
lm roducc o y
recopilacin de t-datos {capit ulo 11
Tablas y
grficas
(captulo 2)
Cmo mejorar
los procesos
t--
I
Distribucione s
m uestraes y est imacin
{capt ulo 51
M odelo de regresin
lineal simp le y
co rrelacin
(capt ulo 91
Con strucci n
de mod elos de
regresin mlt iple
(cap itulo 101
Anallsis de
senes
de tiempo
(capitu lo 11J
Pruebas de
hiptesis
(captulos 6--8)
Mapa de rutas
(vanse las referencias 12, 19, 20, 24 Y 25), el desarro llo en las matem ticas de las teoras
de probabilidad, y el surgimiento de la computad ora.
Se han recopilado datos a trav s de los registros histricos. Durante las civilizaciones
egipci a. griega y romana se obtuvieron datos co n el propsito primordial de cobrar impue stos y reclutar soldados. En la Edad Media era frecuente que las instituciones ecle sisticas
llevaran registros de nacimientos, muertes y matrimonio s. En Estados Unidos se mantuvieron diversos registros du rante la poca colonial (vase la referencia 25), y a part ir de 1790
la Constituci n Federal (de Estados Unidos) requiri el levantamiento de un censo cada 10
aos. De hecho. las necesidades cada vez mayore s del cens o estimularon la invencin de
mquina s tabuladoras a principios del siglo xx. Este hecho llev al desarrollo de las computadoras de gran capacidad y despus, al de las computadoras persona les.
La incursin de la tecnologa de comp utadoras ha transformado radicalmente el campo de
la estadstica durante los ltimo s 30 aos. Paquete s para computadoras centrales como SAS
y SPSS se popu larizaron en los aos 60 y 70. Durante la dcada de los 80, el so ftware estadstico experiment una amplia revolucin tecnolgica. Adem s de las mejo ras usuales
que se realizaron en las actualiza ciones peri dicas . la disponibilidad de las computadoras
pe rsonales conduj o al desarrollo de nue vos paquetes. Por otra parte. las versi ones para
computadoras personales de paquetes ya existentes, tales como SAS , SPSS y Min itab (vanse las referencias 16, 18 Y 23) se desarro llaron con rapidez, y el creciente uso de las hojas
de clcu lo como Lotus 1-2-3 y Microsoft Exce l (vanse las referencias 14 y 15) llevaron a
la incorpora cin de eleme ntos estadsticos en tales paq uetes.
En este libro se ilustrar la informaci n de salida del paquete estadstico Minitab, y la
salida de las hojas de clculo de Microsoft Excel . Adem s, los apnd ices al final del libro
contienen exp licacione s sobre el uso de Minitab y Microsoft Excel para los tema s que se
presentan en cada captulo,
A pesar de que el software estadstico y las hojas de clculo han permitido la realizacin de los anlisi s ms elaborados, no debemos perder de vista que pueden surgir problemas cuando los usuario s ---que no comprenden las suposiciones o las limitaciones de los
procedimientos estad sticos- obt ienen conclusiones errneas a partir de los resultado s que
se obtuvieron gracias a la computadora . Por ello. y por fines pedaggicos, creemos que es
importante que las aplicaciones de los mtodos que se presen tan en el libro se ilustre n con
ejemplos resueltos,
El pensamiento' estadstic:o se pu."fudefinii romo el 'Conjtl:,to de procesos del'jeri-samiento que se onen/in'- I" forma de entender, administrar y reducir la variaci6n:
El pensamiento estadstico incluye el reconocimiento de que los datos son intrnsecamente
variables (no hay dos cosas o dos personas exactament e iguales en todos los sentidos) y
que la identificacin , medicin, control y reduccin de la variacin propor cionan oportunidades para mejorar la calidad. Los mtodos estadsticos pueden ser el medio que permite
aprovechar esas oportun idades.
El papel de los mtodos estadsticos -en el contexto del mejoramiento de la calidadpuede comprenderse mejor si se analiza el modelo de mejoramien to de la calidad que se
presenta en la figura L L En esta figura se ve que el tringulo est integrado por tres partes: en el vrtice superior se encuentra la filosofa administrativa, y en los otros vrtices estn los mtodos estadsticos y las herramientas de comportamiento. Cada aspecto es indispensab le para mejorar la calidad a largo plazo, tanto de los productos manufacturados como
de los servicios que presta .una organizacin. Una filosofa slida de la administracin proporciona una base co nstante para los esfuerzos dedicados a mejorar la calidad. Entre los
enfoques disponibles se encuentra n los que se atribuyen a W. Edwards Deming (vase las
referencias 4 y 5 Y la seccin 12.2) y a Joseph Juran (vase las referencias 10 y 11).
Co n el tin de implantar el enfoque de mejoramiento de la calidad en una organizacin,
se deben utilizar las herramientas de comportamiento y los mtodos estadsticos. Cada uno
ayuda a comprender y mejorar los procesos. Entre las herramientas tiles de comportamiento
estn los diagramas de flujo del proceso y los diagramas de esqueleto de pescado, la lluvia
de ideas, la toma de decisiones en grupos focale s y la integracin de equipos. (Una discusin ms amplia se encuentra en las referencias 4 y 22.) Las numerosas tablas, grficas y
la esta dstica descripti va que se estudian en los captulos 2 y 3; y las grticas de control
que se desarrollan en el captulo 12 figuran entre los mtodos estadsticos ms tiles para
mejorar la calidad.
FIGURA 1.1
Filosofa
administrativa
Mtodos
estadsticos
Herramientas
de comportamiento
La necesi dad de recopilar da tos co n alcanc e nacional tuvo una relacin estrecha con el desa-
datos.
Aunque los mtod os de la estadstica descriptiva son importantes para caracteriza r y presentar los datos (vase los captulos 2 y 3). el desarrollo de los mtodos de inferencia estadstica
-basado en las teoras de proba bilidad- es lo que llev a la aplicacin amplia de la esta d stica e n todos los ca mpos de la investigacin en la poca actual.
El mpet u inicial del desa rro llo en las matemtic as de la teora de la probabili dad surgi de la investigacin de los juegos de azar dura nte el Ren acimiento. Los funda mentos de
la teora de probabilidad pueden rastrearse hacia mediados del siglo XV II en la co municacin entre el matemtico Pascal y el j ugador Chevalier de Mere (vas e las referencia s 12
y 13). stos y otros desarroll os. de matem ticos co mo Bemoull i, DeMo ivre y Ga uss, fueron los primeros fundamentos tericos de la estadstica infere ncia1. Sin embargo. no fue
hasta principios del siglo xx cuando especialistas en estadstica como Pearson, Fisher, Gosseto Ncyrnan, Wald y Tukey iniciaron el desarrollo de los mt odos de inferenci a estadstica .
que en la poca actua l tienen una amplia aplicac in en muchos campos.
La ln1ereDda ~c;'Se define corno aquellos mtodos que hacen ~bl~),tsti
maci n de una cancterstica de una poblacin. o la toma de una decisi n con 'respec :' '
to a una poblacin basada slo en resultados muestrales.
Suponga que el rector de su universidad quiere realizar una encuesta y recabar la opi nin
de los estudiantes con relacin a la calidad de vida en el campus. En este caso la poblacin, o universo, seran todos los estudiantes que estn inscrito s actualmente, mientras que
la muestra estara integrada solamente por los estudiantes que fueron seleccionados para
partici par en el estudio. El objetivo sera describ ir las diferent es actitudes o caracterstic as
de toda la poblacin (los parm et ros). Esto se lograra mediante e l uso de los mtodos estadsticos obtenidos, a partir de la muestra de estudiantes para estimar las diferentes actitudes o caractersticas de inters en la poblacin. Por tanto. un aspec to importante de la inferencia estadstica es usar mtodos estadsticos muestrales para obtener conclusiones respecto
a los par metros de la poblacin.
La necesidad de uso de los mtodos de inferencia esta dstica se de riva de la necesidad
del muestreo. A medida que una poblacin crece . por lo general resulta demasiado costoso, tardado y tedioso obtener informacin de toda la poblacin. Las decision es respecto a
las carac tersticas de la poblacin deben basarse en la informacin que est contenida en
una muestra de esa poblacin. La teora de probabilidad proporciona el vnculo al determinar la posibilidad de que los resultados de la muestra reflejen los resultados de la poblacin.
Good Tunes es una compaa de pedidos por catlogo que vende equipos de audio de alta
calidad a travs de su pgina en Internet. Good Tunes sabe que, para tener xito, los clientes
deben estar convencidos de que ella les proporciona un servicio excepcional y que la mercanca adquirida es de la ms alta calidad. Para ayudar a evaluar la percepcin de los clientes, en cada pedido se incluye un cuestionario sobre su satisfaccin. Se pide que los clientes
regresen el cuestionario lo ms pronto posible, y Good Tunes ofrece mercanca gratis o con
descuento a quienes lo hacen en menos de un mes despus de efectuar su compra. Se presenta un resumen de la encuesta.
Indique cuntos das transcurrieron desde que orden su mercanca hasta que la recibi.
Cunto dinero (en dlares) planea gastar en equipo estereofnico en los prximos 12
meses?
Cmo califica el servicio que ofrece Good Tunes respecto a su ltima compra?
O Mucho mejor de lo esperado
O Peor de lo esperado
O Mejor de lo esperado
O Mucho peor de lo esperado
O Tal como lo esperaba
Cmo califica la calidad del equipo estereofnico que acaba de adquirir en Good
Tunes?
O Mucho mejor de lo esperado
o Peor de lo esperado
O Mucho peor de lo esperado
O Mejor de lo esperado
O Tal como lo esperaba
Planea adquirir ms mercanca en Good Tunes durante los prximos 12 meses?
S_No_
La obtencin de informacin apropiada es esencial para manejar un negocio. Puede pensar
que los datos son la informacin que le permitir tomar una mejor decisin en una situacin especfica. Existen muchas situaciones en que los datos son necesarios:
Un investigador de mercado necesita evaluar las caractersticas de los productos para
distinguir entre varios de ellos.
Un fabricante de productos farmacuticos debe determinar si un nuevo medicamento
es ms efectivo que los medicamentos de uso comn.
Un administrador desea vigilar un proceso en forma peridica para saber si la calidad
del servicio que proporciona -o la calidad de los productos que fabrica- cumple
con los estndares de la compaa.
Un auditor desea revisar las transacciones financieras de una compaa a fin de averiguar si sta cumple o no con los principios vigentes de contabilidad.
Un inversionista potencial desea determinar qu compaas y cules industrias tienen
posibilidades de crecimiento acelerado en un periodo de recuperacin econmica.
Un estudiante quiere obtener datos sobre los grupos de rack favoritos de sus compaeros para satisfacer su curiosidad.
Existen seis razone s para recopilar datos , co mo se ilu stra en el cuadro 1.1.
La encuesta de satisfaccin para el cliente de Good Tu nes (en el ejemplo del uso de la
estadstica) muestra las razones 1, 3,4 Y 5; por ejemplo, esta empresa recopila datos como
resultado de una encuesta; luego los analiza para medir el des empeo, evala los estndares y ayuda a formular cursos de acci n alternativos si es necesario.
Es en extremo impo rtante empezar el anlisis estadstico co n la identificacin de las fuentes de datos ms adecuadas , Si los datos presentan sesgos , ambigedades u otros tipos de
errores, no bastarn las metodologas ms imagi nativas y elaboradas de anlisis para compensar tale s deficiencias.
FUENTES DE DATOS
Existen cuatro fuentes para la recopilacin de datos. seg n se ilustra en el cuadro 1.2.
Los recopiladores de datos son fuentes primarias; los compiladores de datos se llaman
fuentes secundarias. Como se ve en el cuadro 1.2, el prim er mtodo para obtener dato s es
consultar las fuentes gubernamentales. industriales o indi viduales . De estas tres fuentes. el
gobierno federal es el principal recopilador de datos, ya sea para fines pbl icos o privados.
Mucha s oficinas gubernamentales facilitan este trabajo . El Bureau of Labo r Stat istics, en
Estados Unidos, es el responsable de la reco pilacin de datos sobre empleo, as como del
estab lecimiento mensual del conocido lld ice de Precios al Consumidor. Adems del requerimi ento constitucio nal para realizar un censo cada 10 aos. el Bureau of the Census (oficina de censos) monitorea una amplia variedad de encuestas sobre poblaci n, vivie nda y
manufactura. Tambin , lleva a cabo estudios especiales sobre ciertos tema s: criminalidad,
viaj es y cuid ado de la salud.
Aparte del gobierno federal, vari as publicaciones comerciales presentan datos acerca de
grupos indu striales es pecficos. Algunos servicio s de inve rsin como Moody' s proporcionan
datos financieros sobre compaa s. Servicios sindicalizados. como A.C. Nielscn, proporcionan a sus clientes informacin que les permite comparar sus productos con la competencia.
Los perid icos ofrecen una amplia informacin numric a respecto a estadsticas de precios.
condiciones climatolgicas y de portes.
La segunda fuente para recopilar datos es la experim entacin. En un experimento se ejerce un control estricto sobre los tratamientos; por ejemplo, en un estudio para verificar la
efectividad de un deter gente para ropa, el investigador determinar qu marcas son ms
efect ivas para limp iar ropa manchada al lavar las prend as en lugar de preguntar a los consumidores cul marca es la mej or. En general. los diseos experimentales adecuados son
temas de estudio a niveles ms avan zados , pues con frecuencia involucran procedim ientos
estadsticos elaborados. Sin embargo, con el fin de desarrollar la sensibilidad para la prueba y experimentaci n, los conceptos fundamentales del diseo de experimentos se estudiarn en los captulos 6 a 8.
La lercera fuente de dalas se obtiene al reali zar una encuesta. En ella no se ejerce control sobre el comportamiento de las personas que se investigan. Slo se hacen preguntas
sobre sus creencias , actitudes, comportamiento y otras caractersticas. Las respuestas se editan, codi fican y tabulan para su anlisis.
E l cuarto mtod o para recop ilar datos con siste en realizar un estudio observacio nal. Un
investigador observa el co mportamie nto. de manera directa. casi siempre en el ento rno natural. La mayor parte del conocimiento sobre la conduc ta de los animales se ha desa rrollado de esta manera. al igual que los co nocimientos cientficos en muchos campos. co mo en
astronoma y geologa, donde la experi mentaci n y las encue stas son impracti cables o im posibles.
Los estudio s observaciona les se presentan en formas muy variadas en las empresas; todos estn diseados para recop ilar informaci n en un medio gru pal. y ayudar en el proceso de toma de decisiones. Como eje mplo. el grupo focal es una herramienta bastante conocida en la investigaci n de mercado, se aplica para obtener respuestas no estructuradas
a partir de pregunt as abiertas : un moderador conduce la discu sin y todos los participantes
responden a las preguntas . Otros formatos ms estruc turados . que involu cran dinmicas de
grupo para obten er informacin (y llegar a un consenso) incluyen varios mtodo, de psicologa industrial y del comportamiento organizacional, co mo son la lluvia de ideas. la t cnica Del phi y el mtodo de grupo nomin al (vase la referencia 22). Estas herramienta s se
han popul arizado en los ltimos aos debido al impacto de la fi losofa de administracin
de la calidad total (TQM, toral qual tv management) en las em presas. TQM hace hincap i
en la importancia del trabajo en equipo y el empowerment de los empleados. en un intento por mejorar cada produ cto o serv icio.
COM E NTARIO:
Gracias al amplio uso de las tecnologas de la inform aci n, en la actualidad se tiene una gran
cantidad de infon nacin y datos oport unos y precisos --que proceden de innumerables fuentes- o Los cdigos de barras registran, de manera automtica. la informacin de inventario
cuando se adquieren productos en los supermercados. tiendas departamentales y otros medios.
Los cajeros automticos hacen posibles transacciones bancarias que se reflejan de inmediato
en los saldos de las cuentas. Las oficinas de venta de boletos de avin y las agencias de viajes tienen informacin actualizada al minuto sobre el espacio disponible en vuelos y hoteles.
Tran sacciones que hace una dcada tomaban horas, e incluso das. hoy se realizan en cuesti n
de segundos.
El uso de la biblioteca para la investigacin ha adquirido un nuevo significado. Ya no se
limita al uso de medios impresos como libros, peridicos. revistas, folletos y diarios. Con los
sistemas de informacin en computadoras es posible buscar y recuperar datos en forma electrnica usando bases de datos en CO-RM: navegar en la red o intercambiar mensajes por correo electrnico con otros usuarios de Internet. La expresin " visita la biblioteca" ahora incluye
las visitas electrnicas desde la casa u oficina. con la ayuda del equipo de cmputo adecuado.
Para disear un expe rimento. aplicar una encuesta o realizar un estudio por observaci n, se
deben comprender los distintos tipos de datos y niveles de medici n. Para demostrar algu-
nos aspectos de la obtencin de datos, analizaremos la obtencin de datos en una encuesta. aunque muchos de ellos aparecen en otros tipos de investigacin.
TIPOS DE DATOS
Los especialistas en estadstica desarrollan encuestas para manejar una amplia variedad de
fenmenos o caractersticas. llamados variables aleatorias. Los datos. que son los resultados observados de estas variables aleatorias, indudablemente sern distintos de una respuesta a otra.
Como se ilustra en la fi gura 1.2, existen dos tipos de variables aleatorias que se obtienen con los resultados observados o datos: categricas y numricas.
Tipo de datos
Categricas - -
Tipo de pregunta
-
Discretas
Num r icas~
Cuntas suscripciones a
revistas tiene actualmente?
f,GURA
Respue stas
Si O
No
Nmero
Pulgadas
1.1
1.2
1.3
Suponga que en un establecimiento de co mida rpida se venden tres tipos de bebida: refrescos. t y caf. Explique por qu el tipo de bebida que se expende es un ejem plo de
variable categrica.
Suponga que los refrescos se venden en tres tamaos en el mismo establecimiento: chico.
mediano y grande. Explique por qu el tamao del refresco es una variable categrica.
Suponga que se quiere medir el tiempo de vuelo de un avin ---que se desplaza en tre
Nueva York y Los ngeles- desde el despegue hasta el aterriz aje. Explique por qu el
tiempo de vuelo del avin es un ejemplo de variable numrica.
Aplicacin de conceptos
1A
1.5
1.6
1.7
Para cada una de las siguientes variables aleatorias determine si es ca tegrica o numri ca. Si
es numrica, determi ne si el fenmeno de inters es discreto o co ntinuo.
( a) Nmero de telfonos por vivienda
(g) Posesin de un telfono celular
(b) Tipo de telfono princip al en uso
(h) Nmero de llamadas locales por mes
(e) Nmero de llamadas de larga distan cia
(i) Duracin (en minutos) de la llamada
local m s larga por mes
por mes
(d) Duracin (en minutos) de la llamada
(j ) Si hay una lnea telefnica co nectada a
un mdem en la vivienda
de larga distancia ms larga por mes
(e) Color del telfono principal en uso
(k) Si hay un fax en la vivienda
(O Costo mensual (en pesos y centavos)
de las llamadas de larga distanc ia
Suponga que se ha obtenido la siguiente informacin en tre los est udia ntes que salan de
la librera del campus durant e la primera semana de clases:
(f) Posesin de una computador a personal
(a) Cantidad de dinero que se utiliza para
adquirir libros
(g) Posesin de una videocaserera
(b) Nmero de libros de texto que se ad(h) Nmero de materias en las que se insquieren
cribi en el semestre actual
(i) Si adquiri o no. alguna prenda de
(c) Tiempo empleado para co mprar en la
librera
vestir en la librera.
(j) Forma de pago
(d) Especialidad acadmica
(e) Hombre o mujer
Clasifique cada variable como categrica o numr ica. Si es numrica. determine si es discreta o continua.
Para cada una de las variables aleatorias siguientes. determin e si es categrica o numrica. Si es num rica. indique si el fenmeno de inters es discreto o continuo.
(a) Marca de la comp utadora (que utiliza
(e) Nmero de perso nas que usan la
con mayo r frecuencia. en caso que
computadora en la vivienda
( f) Nmero de suscripciones a revistas de
tenga varias)
(b) Cos to de la computadora personal
comp utacin
(e) Tiempo de uso de la computadora por
(g) Paquete de procesador de textos que
semana
usa principalmente
(d) Uso principal de la computadora
(h) Indicar si la co mputadora est conectada a Internet
Para cada una de las variab les aleatorias siguientes. determine si es categrica o numrica. Si es numrica. indique si el fenmeno de inters es discreto o co ntinuo.
(a) Cantidad de dinero que destin a com(e) Periodo ms probable para la co mpra
pras de ropa dura nte el ltimo mes
de ropa (entre semana, por la noche .
(b) Nmero de abrigos de invierno que se
en fin de semana)
tienen
(f) Nmero de pares de guantes de invier(e) Tienda de depart amentos favorita
no que se tiene n
(d) Tiempo que invirti en ir de compras
(g) Medio principal de transpone que se
para adquirir rop-d durante el ltimo mes
utiliz para ir a comprar ropa
1.8
1.9
Suponga que la siguiente informaci n se obtuvo de la solicitud de un prstamo hipotecario que Robert Keeler entreg a la Metro County Sav ings and Loan Association:
(a) Lugar de residencia: Stony Brook.
(i) Ingreso familiar anual: 66.000 dlares
Nueva York
(j) Otro... ingresos: 16.000 dlares
{b) Tipo de vivienda: unifamiliar
(k ) Estado civil: casado
(e) Fecha de nacimiento: 9 de abril de 1962 (1) Nmero de hijos: 2
(d) Pagos mensuales: 1.427 dlares
(m ) Prstamo hipotecario solicitado:
(e ) Ocupacin: reportero y redactor en un
120,000 dlares
peridico
en) Plazo para el pago del prstamo:
(O Empresa donde labora: Dailv
30 aos
Newspaper
(o) Otros prstamo!'> : automvil
(g) Antigedad en el empleo: 14 aos
(p) Importe de otros prstamos:
(h) Nmero de empleos en los ltimos JO
8.000 dlares
aos: 1
Clasifique cada una de las respuestas por tipo de datos.
Una de las variables que se incluye con mayor frecuencia en las encuestas es el ingreso.
A veces la pregunta se enuncia: "cul es su ingreso (en miles de dlares)?" En otras encuestas, se pide lo siguiente: "marque con una X el crculo que corresponde a su nivel de
ingresos".
-
(a) Explique por qu en el caso de la primera pregunta el ingreso puede considerarse discreto o co ntinuo.
(b) Qu tipo de pregunta usara si realizara una encuesta? Por qu?
(e) Qu pregunta tiene ms probabilidades de ofrecer una tasa ms alta de respuesta..?
Por qu?
1.10 Si dos estudiantes obtienen una calificacin de 90 en el mismo examen, qu argumentos se
pueden usar para mostrar que la variable aleatoria --calificacin de la prueba- es continua?
1.11 Suponga que el director de investigacin de mercado de una gran cadena de tiendas departamentales desea realizar una encuesta en el rea metropolitana para determinar el
tiempo mensual que invierten en adquirir ropa las mujeres que trabajan.
(a) Describa la poblac in y la muestra de inters, e indique el tipo de datos que el director est interesado en recolectar.
(b ) Desarrolle un primer borrador del cuestionario requerido en el inciso (a); escriba una serie de tres preguntas categricas y tres numricas que sean apropiadas para esta encuesta.
Como se mencion en la seccin 1.4, una muestra es la porcin de la pobl acin que se selecciona para el anli sis, En lugar de hacer el censo completo de una poblacin, los procedimientos de muestreo estadstico se ce ntran en un pequeo grupo representativo de la poblacin ms gra nde. La mu estra o btenida pro po rci o na informaci n que se pu ed e usar para
estimar caractersticas de toda la poblacin .
El proceso de mu estreo co mie nza co n la loc alizacin de las fuente s ad ecuadas de d atos.
como listados de poblacin, directorios, planos y otras fuentes llamadas marcos. Las muestras se extr aen de estos marcos. Si el marco es inadecuado debido a que ciertos grupos de
individuos o de objetos en la poblacin no se incluyeron de manera apropiada, entonces las
muestras sern inex ac tas y sesgad as . Utilizar d iferen tes marco s pa ra gene rar d atos pu ed e
'
Considere el siguiente titular de un peridico que circul en los suburbios de Nueva York
en la dcada de los ochenta: "Error en el conteo de habitantes: Es Suffolk ms populoso
que Nassau? LILC O y la Oficina de Censos estn en desacuerdo" (Newsday , 25 de abril de
1988). Segn los datos de la encuesta en Suffolk, el jefe de estado del condado de S uffolk
consider que su poblado era el ms habitado mientras que su homlogo del condado de
Nassau no estuvo de acuerdo y cit sus propios datos de encues ta. Quin tena la razn?
SOL UCIN
Las diferencias entre ambas estimaciones provienen del hecho de que la Oficina de Censos
(Bureau of Census) y la Long Island Lighting Co mpany (LILCO) utilizaron marcos y frmulas diferente s para calcular la poblacin de ambo s condados. La Bureau of Census utiliz
las tasas de nacimientos y decesos, los patrones de migracin que muestran las decl araciones del impuesto sobre la renta, y una frmula demogrfica que estim a que el nmero promedio de personas por vivienda ha disminuido en los ltimos aos. Para su encuesta. la
empresa LILCO us el nmero anual de medidores de electricidad y gas, los perm isos de
construccin y un factor para calcular el nmero de habitantes en cada casa.
Hay tres razones principales para obte ner una mue stra, como se describe en el cuadro 1.3.
, : "I,t:I':;\~~' :
-~~~~~.~
Como se describe en la figura 1.3, existen dos tipos bsicos de muestras: la no probabilstica y la probabilstica.
.
,-~,
, . ~;;'~ ,~ "
,'_ : . ~ ~I
).;
-- ~;"
.'': "
.c. ,
'-
"=,,,:.
;,
~ '~E ,
.~III\!!. ~~ P~~
....
'~ ~ ~,,:~t<:-
';...,o
~~
suJe~~, . 13...
.~ ~ijJ;~fE~
~ ~,P
.-.~.~ ~',:~~~~~, ~!'"j--,-~": ~(;~4:r h_fi ~~~~}~~!i., ~}1 ~~~ .' ;:i~~~>
Muestras no probabilsticas
.------,.
M uestra
subjetiva
FIGUIlA
'.3
M uestra
por cuota
Mu estra
por grupos
naturales
Mu estra
aleatoria
simple
Mu estra
Muestra
Muestra
siste mtica estratificada conglomerada
Tipos de muestra.
Los cuatro tipos de muestras probabilsticas que se utilizan co n mayor frec uencia son las
muestras aleatoria simple, sistemtica , estratificada y conglomerada. Estos mtodos de muestreo varan en tre s por su costo, precisin y complejid ad. A con tinuacin se analizan estos
tipos de muestras.
Uno de estos mtodos utiliza una tabla de nmeros aleatorios (vase la tabla E.l en el
apnd ice E) para obtener la muestra. Una tabla de nmeros aleatorios est formada por una
serie de dgitos que se generan en fonna aleatoria y se colocan en la sec uencia en que se
generaro n (vase las refe rencias 9 y 21). Como el sistema numrico usa \O dgi tos (O. 1.
2. . . .. 9). la probabilid ad de generar aleatoria mente un dgit o es igual a la proba bilidad de
generar cualquier otro. Esta probabil idad es 1 de 10. Por lo tanto. si se genera una secuencia de 800 dgitos. se espera qoe ce rca de 80 de ellos sean el dgito O. 80 el d gito l . etc.
De hecho, lo normal es que los investigad ores que utilizan tablas de nmeros aleatorios verifiquen la aleatoriedad de los dgi tos generad os antes de emplearlos. La tabla E. l cumple
con los criterios de aleatoriedad. Debido a qoe cada dgito o secuencia de dgitos en la tabla es aleatorio. se poede leer en sentido boriz ontal o vertical. Los mrgen es de la tabla
muestran nme ros de rengln y columna. Los dgitos se agrupan en secuen cias de cinc o
para facilitar la lectu ra.
Para usar una tabla como esta en lugar de una urna para seleccio nar una muestra. primero se asignan los nmeros de cdigo a los miembros individu ales de la poblacin. Entonces
se obtiene la muestra aleatoria leyendo la tabla y seleccionando los elementos del marco de
poblaci n cuyos nmeros de cdigo co inciden con los dgitos encontrados en la labia . Para
comprender mejor el proceso de selecci n de una muestra. co nsidere el ejemplo 1.2.
Suponga que una co mpaa desea seleccio nar un tamao de muestra de 31 trabaj adores de
tiempo co mpleto entre una poblaci n de 800 empleados de tiempo completo. para obtener
informacin sobre los gastos del plan de cuidados dentales que patrocin a la compaa. Se
supone que no todos los empleados estar n dispuestos a respond er la encuesta. por lo que
deben enviarse ms de 32 cue stionarios para obtener las 32 respuestas deseadas. Asumiendo que 8 de \O trabaj adores de tiempo completo respondern la encuesta <es decir. una tasa de respuesta de 80%) . se requ iere un total de 40 empleados para obtener las 32 respuestas. Por consiguiente, se enviar la encuesta a 40 empleados de tiempo completo. elegidos
de los archivos de personal de la compaa. Cmo se obtendr. de hecho, la muestra aleatori a simple?
SOL UCIN
Para seleccionar la muestra al azar. se usa una tabla de nmeros aleatorios. El marco de poblacin consiste en una lista de los nombre s y su nmero de buzn en la compaa (de los
N = 800 empl ead os de tiempo completo) que se obtienen de los ex pedientes de personal.
Como el tamao de la poblaci n (800) es un nmero con tres dgitos. cada nmero de cdigo asignado tambi n debe co ntener tres dgitos. para que todos los empl eados de tiempo
completo tengan la misma probabilidad de ser seleccionados. Entonces, se asigna el cdigo 00 1 al primer empl eado de tiempo completo en la lista de poblacin. el cdigo 002 al
segundo empleado de tiempo completo. etc .. hasta asignar el cdigo 800 al ensimo empleado en la lista de poblacin . Debid o a que N = 800 es el valor de cdigo ms grande
posible. se descartan todos los cd igos de Ires dgitos mayores que N <es decir. 80 1 a 999
y 000).
Para seleccio nar la muestra aleatoria simple. se elige al azar un punto de partida en la
labia de nme ros aleatorios. Un mtodo con siste en cerrar los ojos y sealar nmeros de
la tabla en forma aleatoria con un lpiz. Suponga que con este procedimiento el punto de
partida seleccionado es el rengln 06 y la columna 05 de la tabla 1.1 en la pgina 16 (que
es una rplica de la tabla E.l). Aunque la tabl a se puede leer en cualquier dire ccin. supong a que se toman secuencias de tres dgitos de derecha a izquierda sin saltarse nmeros.
La persona que tiene el nmero de cdigo 003 es el primer empleado de tiempo completo en la muestra (rengln 06 y columnas 05 a 07), el segundo individuo corresponde al
cdigo 364 (rengln 06 y columnas 08 a 10), y el tercero al cdigo 884. Como el nmero
de cdigo ms alto para cualquier empleado es 800, ste se descarta. Del tercer al dcimo
miembro de la muestra sern los empleados con nmeros de cdigo respectivos 720, 433 ,
463, 363. 109, 592, 470 Y 705.
El proceso de seleccin contina en fonna similar hasta obtener la muestra requerida de
40 empleados de tiempo compl eto. Durante este proceso, si se rep ite cualquier secuencia
de cdigo de tres dgitos. el empleado que corresponde a esa secuencia de cdigo se incluye de nuevo como parte de la muestra si se trata de un muestreo con reemplazo; sin embargo. la secuencia de cdigos repetidos se descarta si se tiene un muestreo sin ree mplazo.
,;~, ;. ~: ""
.>"
'~' f:.:' :;
')_ ; ~-
,,:,,~ - -
Muestra sistemtica En una muestra sistemtica. se dividen N individuos O elementos del marco de poblacin en k grupos, dividiendo el tamao de la poblacin N entre el
tamao de la muestra deseado n. Es decir,
N
k=n
donde k se redondea al entero ms cercano. Para obtener una muestra sistemtica. el primer individuo o elemento se selecciona al azar entre los k individuos o elementos del primer
grupo del marco de poblacin y, para el resto de la muestra. se elige un individuo o elemento cada k en la lista completa de la poblacin.
Cuando el marco de poblacin consiste en listas de cheques numerados, notas de venta
o facturas, listas de miembros de un club. el registro de estudiantes inscritos, o a tal vez
un nmero predeterm inado de artculos consecutivos que salen de una lnea de ensamble.
es ms rpido y fcil obtener una muestra sistemtica que una muestra aleatoria simple. En
estas situaciones la muestra sistemtica es un mecanismo conveniente para obtener Jos datos deseados.
Aunque su aplicacin es ms sencilla, en general, los mtodos de muestreo aleatorio simple y de muestreo sistemtico son menos eficientes que otros mtodos de muestreo probabilstico ms elaborados. Es decir, para cualquier muestra que se adquiere mediante muestreo aleatorio simple o muestreo sistemtico. los datos obtenidos pueden o no ser una buena
representacin de las caractersticas fundamentales (parmetros) de la poblacin. Aunque la
mayor parte de las muestras aleatorias simples son representativas de la poblacin correspondiente. no es posible saber si una muestra en particular es. de hecho. representativa.
Se presentan posibilidades todava mayores de un sesgo en la seleccin y una falta de
representatividad de las caractersticas de la poblacin en el muestreo sistemtico. Si existiera un patrn en el listado del marco de poblacin. podran ocurrir errores de seleccin
importantes. Para evitar el problema potencial de la representacin desproporcionada de grupos especficos en una muestra, se pueden usar los mtodos de muestreo estratificado o de
muestreo conglomerado.
Muestra estratificada En una muestra estratificada, primero se dividen los N individuos o elementos de la poblacin en subpoblaciones separadas. o estratos. de acuerdo con
alguna caracterstica comn. Se realiza un muestreo aleatorio simple en cada estrato y despus se combinan los resultados de las muestras aleatorias separadas. Estos mtodos de
muestreo son ms eficientes que el muestreo aleatorio simple o el sistemtico, porque garantizan la representacin de individuos o elementos de toda la poblacin. lo que asegura
una mayor precisin en las estimaciones de los parmetros poblacionales fundamentales .
Lo que proporciona la precisin. una vez combinados los estratos. es la homogeneidad de
individuos o elementos dentro de cada estrato.
Tabla l.l
RENGLN
Inicio de la
seleccin
(rengln 06,
col umn a 05 )
01
02
03
04
05
06
07
08
09
\O
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
00000
12345
00001
67890
11111
12345
11112
67890
22222
12345
22223
67890
33333
12345
33334
67890
49280
6 1870
43898
62993
33850
97340
70543
89382
37818
60430
82975
39087
55700
14756
32166
23236
45794
09893
54382
94750
70297
85157
11100
36871
23913
88924
4 1657
65923
93912
58555
03364
29776
93809
72142
22834
66158
71938
24586
23997
53251
73751
26926
20505
74598
89923
34135
47954
02340
50775
48357
35779
07468
25078
30454
51438
88472
10087
00796
67140
14130
84731
40355
93247
78643
70654
31888
15130
14225
91499
37089
53140
32979
12860
30592
63308
00283
08612
86129
84598
85507
04334
10072
95945
50785
96593
19436
54324
32596
75912
92827
81718
82455
68514
14523
20048
33340
26575
74697
57143
16090
81163
98083
78496
56095
71865
63919
55980
34\01
22380
23298
55790
08401
11865
83832
63491
06546
78305
46427
68479
80336
42050
57600
96644
1738 1
51690
07275
97349
97653
20664
79488
36394
64688
81277
16703
56203
69229
26299
63397
32768
04233
83246
55058
56788
27686
94598
82341
40881
89439
68856
54607
89863
20775
91550
12872
76783
11095
68239
02348
45091
08078
64647
31708
92470
20461
88872
44940
15925
13675
59208
43189
57070
69662
04877
47182
78822
83554
36858
82949
73742
25815
35041
55538
66090
53362
92671
28661
49420
44251
18928
33825
47651
52551
% 297
46 162
26940
441 04
12250
28707
25853
72407
Fuente: Rep roduccin parcia! de The Rand Corporation. A Million Random Digits with 100 ,000 Normal Deviates (G encoe, JL: The Free Press,
1955 ); presentada en la tabla E./ del apndice E al final del libro.
Aplicacin de conceptos
1.15 Para un estudio q ue inclu ye entrevistas personales a los participant es (en lugar de enc uestas por correo o por telfo no) explique por qu una mues tra alea toria simple puede ser
menos prcti ca que otros m todos.
1.16 Supong a que se desea selecc io nar una mue stra aleatori a simple de tamao I de una poblacin de tres art cu los (A, B Y e). La regla para ext raer la mues tra es: se lanz a una
moneda ; si sale cara , se elige el artc ulo A; si sale cruz. se lanza la moneda de nuevo:
esta vez, si es ca ra. se elige B; si es cruz. se elige C. Explique por qu se trata de una
muestra alea toria. pero no de una muestra aleato ria simple.
t. t 1 Suponga que una poblaci n tiene cuatro elementos (A , S, y D ). Se desea obtener una
mue stra aleatoria de tamao 2 y se decid e hacerlo de la siguiente manera; se lanza
una moneda ; si sale cara. la muestra sern los elementos A y B; si sale cruz, la muestra
sern los eleme ntos C y D . Aunque se trata de una muestra alea toria. no es una
muestra aleatoria simple. Expl ique por qu. (Si real iz el prob lema 1.16. compare el procedim ient o descri to en l con el procedimiento que se describe en este problema.)
1.18 Suponga que se pide al secretari o administrativo de una universidad con una pob lacin
de N = 4.000 estudiantes (de tiempo completo) que rea lice una encuesta pa ra med ir la
satisfaccin respecto a la calidad de vida en el cam pus. La siguiente tabla con tiene una
clasificacin de los 4.000 estudiantes de tiempo co mpleto insc ritos po r sexo y ao q ue
cursan.
Aso C UR SADO
l ER
20
3ER
40
SEXO
A O
A O
AO
AO
T OTAL
Mujer
700
560
1,260
520
460
980
500
400
480
380
860
2,200
1,800
4,000
Hombre
Tota l
900
El secretario adm inistrativo se propone lomar una mue stra probabilstica de n == 200 estu diantes y proyec tar los result ados a tod a la poblac in de es tud iantes de tiempo co mpleto.
(a) Si el marco de po blacin d ispon ible en los expediente s escolares es un listado
alfab tico de los nombres los N = 4,00 0 estudiantes de tiem po com pleto inscritos,
qu tipo de muestra podra extraerse? Justifique su respuesta.
(b) C ul seria la ventaj a de seleccionar una mue stra aleatoria simp le en el inciso (a)?
(c) C ul sera la ventaja de se leccionar una muestra sistemtica en el inciso (a )?
(d ) Si el marco de pob lacin disponible en los expedien tes es un listado de no mbre s de
los N = 4.000 estudiantes de tiempo com pleto inscritos. recop ilados en ocho listas
alfabticas separadas. seg n el sexo y ao que cu rsan, como se muestra en la labia
ante rior. q u tipo de muestra deber em plearse? Justifique su respu esta .
(e) Suponga que los N = 4,000 estudiantes de tiempo completo inscritos viven en uno
de los 20 dormitorios del campus. Cada dormitorio consta de cuatro pisos con 50
camas por piso. lo que significa 200 estudiantes. La poltica del colegio es integrar a
los estudiantes por sexo y ao que cursan en cada piso de dormitorios. Si el director
administrativo pudiera recopilar un marco de poblacin con los listados de los estudiantes que ocupan cada piso de dormitorio, qu tipo de muestra deber emplear?
Justifique su respuesta.
1.19 Una bitcora de ventas contiene copias foliadas de las facturas. Los folios van de 000 I a
5000.
(a) Inicie en el rengln 16, columna l. y proceda por rengln en la tabla E.I, para seleccionar una muestra aleatoria simple de 50 folios de facturas.
(b) Seleccione una muestra sistemtica de 50 nmeros de facturas. Use los nmeros aleatorios en el rengln 20. columnas cinco a siete, como punto inicial de su seleccin.
(e) Las facturas elegidas en el inciso (a) son las mismas que las elegidas en el inciso
(b)? Por qu s o por qu no?
1.20 Suponga que 5,000 facturas de ventas estn separadas en cuatro estratos. El estrato 1
contiene 50 facturas; el estrato 2, 500 facturas; el 3, 1,000 Y el 4, 3,450 facturas. Deben
seleccionarse todas las facturas del estrato 1, y 50 de cada uno de los dems estratos.
(a) Qu tipo de muestreo deber realizarse? Por qu?
(b) Explique cmo realizara el muestreo de acuerdo con el mtodo descrito en el inciso (a).
(e) Por qu el tipo de muestreo en el inciso (a) no es una muestra aleatoria simple?
V I/
muestreo
l/O
probabilstico desastroso
En 1936. la revista U/erar)" Digest predijo que el gobe rnador Alf Landon de Kansas recibira
57% de los votos y derrotara e n forma abrumadora la ambici n del presidente FrankJin D.
Roo sevel t de reelegi rse. Sin embargo , Landon fue derrotado, ya que slo recibi 38% de los
votos. El error co metido por una revista respec to a una encuesta importante no tena precedentes. Como resultado. la prediccin acab con la credibilidad de la revista ante el pb lico,
y la llev a la quiebra.
Los encuestadores de Literary Digest pensaron que haban hecho todo bien. Haban basado su prediccin en un tamao de muestra muy grande. 2.4 millones de encuestados, de una
encuesta enviada a 10 millones de votantes registrados, Qu sali mal? Hay dos respuestas:
sesgo de seleccin y sesgo de no respuesta.
Para com prender el papel del sesgo de selecci n. debemos analizar algunos antecedentes
histricos. En 1936, Estados Unidos sufra todav a por la Gra n Depresin. Sin tomar en cuenla esto. la Literary D gest recopil su marco de poblacin a partir de fuentes como directorios
telefnicos, listas de miemb ros de clubes, suscriptores a revistas y registros de automviles
(referencia 6). Sin darse cuenta eligieron un marco de poblaci n compue sto por gente rica. y
excluy eron a la mayora de la poblacin votante que. durante la Gran Depresin. no pod a pagar un telfono, la membresfa de un club. suscripciones a revistas o adquirir un automvil.
Asf, la estimacin de 57% de votos para Landon pudo haber estado muy cercana al marco. no
as a la poblacin real .
El sesgo de no respuesta ocurri cuando la muestra de 10 millones de volantes registrad os
produjo solamente 2.4 millones de respuestas. Una tasa de respuesta de slo 24% es demasiado baja para producir estimaciones precisas de los parmetros de poblacin sin algn mecanismo que garantice que los 7.6 millones de individuos que no respondie ron tenfan una opinin similar. Sin embargo, el problema del sesgo de no respuesta fue secundario con relacin
al problema del sesgo de selecci n. Aun cuando los 10 millones de votante s registrados en la
muestra hubieran respondido, no se habra compen sado el hecho de que la com posicin del
marco te na diferencias tan sustanciales con respecto a la poblacin votante real.
Error de no respuesta No tod as las person as estn dispuestas a contestar un a encuesta. De hecho , la in ve sti gaci n indica que lo s individu o s d e las cl ases econmicas alta y ba -
ja tienden a responder con menos frecuencia que los individuos de clase media. El error
de no respuesta surge del fracaso al recopilar datos de todos los sujetos de la muestra y
el resultado es un sesgo de no re spuesta. Como en general. no se puede suponer que las
personas que no responden son semejantes a aquellas que s responden, es en extremo im-
portante dar seguimiento a las no respuestas des pus de un periodo espec fico. Debern hacerse varios intentos. ya sea por co rreo o tel fono. para co nvencerlos y que cambien de opinin . Con base en estos resultados, las estimaciones obtenidas con las respuestas inici ales
se co mbinan con las estimaci one s obte nidas con el seguimiento. de manera que las inferen-
Error de muestreo Existen tres razo nes principale s para extraer una muestra en lugar
de realiz ar un censo completo: es ms rpido, menos costoso y ms efici ente . Sin embargo,
en el marco de poblacin. el azar determina quin estar (o quin no estar) incluido. El
error de muestreo refleja la heterogeneidad, o las "diferencias aleatorias", de una muestra
a otra segn la probabilidad de que individuos o elementos espe cficos sean seleccionados
en unas muestras determ inadas.
Cuando se observan los re sultados de so ndeos O enc uestas en peridicos y revistas. a
menudo se hacen afirmac iones respecto al margen de error o prec isin: por eje mplo. Use
espera que los resultados de este escrutinio estn entre 4 puntos porcentuales del valor
real". Este margen de error es e l e rror de mue streo . Este error se puede reduci r con tamaos de mue stras ms grandes, aunque esto incrementar el cos to de la encuesta.
Error de medicin Cuando se quiere realizar una buena investigacin por medio de
e ncuestas. se dise a un cuestionario que permita reu nir infonnacin importante. Los datos
obtenidos debe n ser vlidos; es decir. las respuestas "correctas" deben ser ev aluadas y plantearse de manera que arrojen medidas significativas.
Pero exi ste un dilema, es ms fcil decir que se obtie nen mediciones sig nificativas que
Se le ha dado mucha atencin al error de medicin que oc urre por fallas de redacci n en
el enunciado de las pregun tas (referencia 7). Una preg unta debe ser clara. no ambigua. Debe presentarse en forma objetiva y neutral; se deben evitar las "preguntas guiadas".
Existen tres fuentes de errores en la medicin: redacci n ambigua de las preguntas. efec-
to de halo y errores de la persona que contesta. Co mo ej emplo de ambigedad en la redaccin. en noviem bre de 1993 el Departamento de Trabajo [Labor Depanmen de estados
Unidos inform que la tasa de dese mpleo se haba subestimado durante ms de una dcada debido a fallas en la redaccin de las preguntas en la Encuesta de Poblacin Actual [Current Population Survey) . En particular. esta falla provoc que se minimizara la prese ncia
de las mujeres en la fuerza laboral. Como la tasa de desempleo est ligada a los programas
de beneficio social, como los sistemas estatales de compen sacin por desem pleo. era imperativo que los investigadores del gobierno rectificaran la situacin con ajustes a) co ntenido
de las preguntas.
El "efecto de halo" se presenta cuando la persona que responde se siente obligada a complacer al entrevi stador. Este tipo de error puede minimizarse con la capacitacin adecuada
en la realizacin de entrevistas.
El error que proviene de la perso na que responde se produce cuando sta reali za un esfuerzo dema siado grand e o demasiad o pequeo. Existen dos form as para minimi zar esta
clase de error: (1) mediante una revisin cuidadosa de los datos y un nuevo llamado a aquellos individuo s cuyas respuestas parecen raras y (2) al establ ecer un programa de llamada s
aleatorias para verificar la con fiabilid ad de las respue stas.
Aspectos ticos
Respecto a la proliferacin de investigaciones que se apoyan en encuestas (referencia 2),
Eric Miller , editor del boletn de noticias Research Alert, afirm que " ha habido una lenta
prdida de tica. Lo que preocupa es que las person as toman decisiones con base a lo que
se publica. Puede que se trate de un crimen invisible. pero si existen vctimas". No todas
las investigaciones so n buenas, significativas o important es, y no todas so n ticas . Debe intentarse distingui r entre un diseo de encuesta deficiente y un diseo carente de tica.
Las consideraciones ticas surgen con relaci n a cuatro tipos de errores poten ciales que
pueden ocurrir cuando se disean encue stas que utilizan mue stras probabilsticas aleatoria s:
error de cobert ura o sesgo de selecci n. error o sesgo de no respuesta, error de mue streo
y error de medicin. El error de cobertura o sesgo de seleccin se convierte en un problema tico slo si se excluyen a propsito grupos especficos de individuos del marco de poblacin, para obtener resultados sesgados, que indican una posicin ms favorable para el
patrocinador de la encuesta.
De igual manera, el error o sesgo de no respuesta se convi erte en un problema tico solo si es menos probabl e que grupos o individuos especficos respond an a un formato de encuesta dado y si e) patr ocinador disea a propsito la encuesta, con el fin de excluir a eso
grupos o individuos. El error de muestreo se convierte en un problema t ico slo cuando
los resultados se presentan, a prop sito, sin referencia al tamao de muestra o al margen
de error, de modo que el patrocinador puede promov er un punto de vista que de otra manera sera insignificante. El error de medici n se con vierte en un problema tico en cualquiera de las tres formas: (1 ) un patrocinador puede elegir. en form a delibe rada , preguntas
orientadas que guan las respuestas hacia direccin especfica; (2) un entrev istador, median te actitudes y tono de voz, puede crear un efecto deliberad o de halo o puede guiar las respuestas en ciert a direc cin; (3) alguien que respond e, pero no est de acuerdo con la encuesta. puede proporcio nar informaci n falsa, a propsi to.
RESUMEN
Como puede observarse en la grfica de resumen en la pgina 23, este captulo present
una introduccin a la estadstica y analiz la recoleccin de datos. Se estudiaron diferente,
modos de respuesta a una encuesta, varios tipos de datos y diversas maneras de seleccionar muestras aleatorias. Adems, se examinaron varios aspecto s que estn relacionados COI
el valor de una encuesta.
Una vez recopilados, los datos deben organizarse y prepararse para facilitar su anlisis
En los dos captulos siguientes. se mostrarn diferentes mtodos para presentar los datos el
tablas y grficas, se describirn varias tcnicas de "anlisis exploratorio de datos" y se de
sarrollarn mediciones descripti vas resumida s que son muy tiles para el anlisis y la in
terpretaci n de datos.
nos clave
-acin de la calidad total
cobertura 19
medicin 20
muestreo 20
no respuesta 20
'o 5
'a descriptiva 5
15
irirnarias 7
;ecundarias 7
cal 8
inferencia estadstica
pensamiento estadstico
marcos
11
poblacin 5
muestra
sesgo de no respuesta 20
sesgo de seleccin 19
tabla de nmeros aleatorios 14
universo 5
variables aleatorias 9
variables aleatorias categricas 9
variables aleatorias continuas 9
variables aleatorias discretas 9
variables aleatorias numricas 9
1.29 Cmo se relaciona el desarrollo del campo de la estadstica con las necesidades de los
censos?
1.30 Cul ha sido el cambio en los programas estadsticos (software) en los ltimos 30
aos?
1.31 Cules son los tres aspectos del mejoramiento de la calidad?
1.32 Cul es la diferencia entre una variable aleato ria categrica y una variable aleatoria nu
mrica?
1.33 Cul es la diferencia entre datos discretos y datos continuos?
1.34 Cules son las principales razones para obtener datos?
1.35 Cul es la difere ncia entre muestreo probabi lstico y muestreo no probabilstico?
1.36 Cules son algunos de los problemas potenciales que surgen al utilizar mtodos "de ur
na" para obtener una muestra aleatoria simple?
1.31 Cul es la diferencia entre muestreo con reemplazo y muestreo sin reemplazo?
1.38 En qu difieren una muestra aleatoria simple y una muestra sistemtica?
1.39 Explique la diferencia entre una muestra estrat ificada y una muestra sistemtica.
1.40 Cul es la diferencia entre una muestra estratificada y una muestra conglomerada ?
1.41 Qu distingue a las cuatro fuentes potenciales de error cuando se manejan encuestas di
se adas para el muestreo probabilstico ?
Estadst ica
..-
Muest ra
Pensamiento
estadst ico
Poblacin
Mejoramiento
del proceso
I
Parmet ro
..-
I
Variable
aleato ria
Catecrice
Numrica
de
variable
Discreta
Continua
I
Fuent e
de datos
1
Usar los
datos publicados
Disear
un experim ento
Realizar
una encuesta
Realizar un
estudio obse rvacional
I
Tipo de
muestra
Aspec tos
t icos
I
Probabilst ica
No probabilsti ca
Problemas de repaso
t .4 2 La Data and Story Library DASL) (h tt p://li b.sta Lcmu.ed uIDASL) e, una bibliotec a en
lnea de archivos de datos y artculos que muestran el uso de mtodos estadsticos bsicos. Cada conj unto de datos tiene uno o ms artculos asociados. slos se clasifican por
mtodo y tema. Visite este sitio en la red y, despus de leer un artculo . resuma la forma
en que se us la estadstica en una de las reas.
1.43 Visite el siguiente sitio en la red, patrocinado por Microsoft Corporation para Microsoft
Excel: (htt p://www.m icro soft.comfoffice/excel). Explique la forma en que Microsoft
Excel puede ser til en el campo de la estadstica.
1.44 Visite el sitio de Minitab en la red (htt p ://www.mi nitab.com). Explique cmo puede ser
til en un negocio el uso de un paquete estadstico de software.
.45 La organizacin Gallup presenta el resultado de esc rutinios recientes en su direccin de
lntemct;
hllp:l/gallup.com
~
~
~
1.46
1A7
1.48
L49
VIsite este sino y elija Hustness ano me bconomy. Para la encuesta mrncaca,
(a) proporcione un ejemp lo de variable aleato ria categrica que se encuentre en esta encuesta.
(b) proporcione un ejemplo de variabl e aleatoria numrica que se encuent re en esta encuesta .
(e) desarro lle tres preguntas que se puedan utilizar en esta encuesta.
El sitio de British Airway s (http :// www.b ri tisha r wa ys.comlfeed ba cklfeedba ck.shtml)
proporciona un cuestionario que se puede con testar en forma electrnica .
Entre las preguntas enumeradas en e l pasado estn las siguientes:
1. C mo se enter de la exi stencia del sitio de British Airway s en Internet?
2. Qu edad alcanz en su hi mo cumpleao s?
3. Cul es la ve locidad de su con exin a Internet?
(a) La encuesta en el sitio de British Airways. represe nta una muestra aleatoria? Exp lique.
(b) Cmo se puede obtener una muestra aleatoria?
(c) Defina el marco para British Airways.
(d) Si no lo hace la encuesta. escriba una pregunta donde la edad sea una variable numrica.
(e) Diga si la pregunt a "cmo se ente r de la existencia de l sitio de British Airways en
Internet'?" es una variable categrica o numrica . Expl ique.
(O D tres preguntas que no figuren en la encuesta de British Airw ays y que piense que
debe ran incluirse.
Por tradicin el sondeo poltico se ha realizado med iante en trevistas telefnicas. Los investigadore s de la finn a Harris Black Intemational LId. aseguran que e l sondeo por Internet es
menos cos toso. ms rpido, y ofrece una tasa de respuestas ms alta que las encue stas por
telfono . Los cr ccs estn preocupados por la confiabilidad cientfica de este enfoque (Wall
St reet Jouma , 19 de abril de 1999 ). A pesar de fuertes crti cas. el sondeo por Internet se
usa cada vez ms. Qu preoc upaciones tendra usted acerca del escrutinio por Intern et?
Un estudio realizado por Raj esh Mirani y Albert Lederer ("An lnstrument for Accessi ng
the Organiz ationa l Benefits of IS Projects ", Decision Sciences, vol. 29. 1998, pgs . 803838) analiza los beneficios organizacionales de los proyect os de sistemas de informacin
(lS ). Los investigadore s enviaron por correo 936 cuestionarios al azar entre miembro s de
una organizacin grande de sistemas de informaci n en el mbito nacional. Se recibieron
200 respuestas vlidas. o una tasa de respuesta de 21 %. De las 200 respuestas, 190 contestaron preguntas sobre un proyecto IS recin terminado . El presupuesto promedio para estos
proyectos fue de 3.8 millones de dlares en un interv alo de 4,000 a 100,000.000 dlares.
De estas 190, 45% indic que se reque ra la aprobacin del CEO antes de iniciar los proyectos.
(a) Qu fuente de datos se utiliz en este estudio?
(b) Indique una variable aleatoria categrica que se mencion a en este art culo.
(e) Indique una varia ble aleatoria numrica que se menciona en este articulo.
(d ) Analice el mtodo de muestreo que se utiliza en este estudio.
(e) .Qu tipos de errores de encues ta que puede n encontrar los investigadores?
The U.S. Census Bureau (Ofic ina de Censos de Estados Unidos] (h ttp://,,,ww.census.gov/)
mantiene un amplio sitio en la red que tiene vncu los co n muchos tipos de datos. El sitio
co ntiene informacin sobre personas, negoc ios. geografa y otras categoras. Visite el sitio y
localice la descripci n del Ame rican Housing Survey en la seccin People.
(a) Resuma brevemente la descripci n del Ameri can Housing Survey.
(b) Qu tan grande es la muestra , y qu tipo de mtodo de muestreo se usa?
(e) D un ejemp lo de variable aleatoria categrica en esta encue sta.
(d) D un ejem plo de var iable aleatoria numrica en esta encuesta.
(e) Qu tipo de negocio puede beneficiarse con la informa cin reunida por la American
Housing Surve y? Explique.
(f) Visite el enl ace de Business. y localice la seccin ded icada al sector de manufa ctura .
Describa el Annual Survey of Manufacturers.
(g) Qu tan gra nde es la muestra. y qu tipo de mtodo de muestreo se usa?
(h) Propo rcione un ejemplo de variab le alea toria categrica en esta encuesta.
(i )
(j ) Cmo se beneficia un ejecutivo de una compaa de manufactura con la informacin reunida por la Annual Survey of Manufacturers ?
t .50 Suponga que el gerente de la div isin de servicio a clientes de una compaa que fabrica
aparatos electrnicos desea determin ar si los clientes que han adqu irido una videocasetera
en los ltimos 12 meses estn satisfechos con sus productos. El gerente planeaba anexar
la encues ta a las plizas de garanta.
(a) Describa la poblacin.
(b) Describa el marco de poblacin.
(e) Qu diferencia s hay entre la poblacin y el marco? C mo pueden afectar los resultado s?
(d! Desarrolle tres preguntas categricas apropiadas para esta encue sta .
(e) Desarrolle tres preguntas numri cas apropiadas para esta encuesta .
(f) Cmo puede seleccionarse una muestra aleatoria simple entre las plizas de garanta?
(g) Si el gerente desea seleccionar una muestra de plizas de garanta para cada marca
de videocaseteras. cmo debe seleccionar la muestra? Exp lique.
t .51 Los sondees polticos se realizan para predecir los resultados de una eleccin . Por rutina
esto s resu ltados se prese ntan en los peridicos y la televisin durante las semanas y los
meses previos a las eleccione s. Para una eleccin especfica, como la del presidente de
Estados Unidos,
(a) cul es la poblacin a la que se qu iere generalizar?
(b) ,cmo se obtiene una muestr a aleatoria de esa poblacin?
(e) segn lo que sabe acerca de c mo se llevan a cabo esos sondeos , qu problemas
podran presentars e con el muestreo en ellos?
1.52 El siguiente cuestionario se encuent ra en cada habitacin de un hotel con ocido y respet ado . La intencin de la admin istracin es eva luar la satisfaccin de l husped.
@ Q
rea de reservaciones
Botones
Recepcionis ta
Habitaci n
Limp ieza
Restaurante
(a) Cree que este diseo con cuatro categoras de "caras" proporciona a la admin istraci n informacin suficiente sob re cada uno de los servicios mencionados? Analice .
(b) Mejorara este cuestionario con otra "cara fruncida" para balancear las dos "caras
sonrientes"? Explique .
(e) Cul es el valor de las encues tas de autoselecci6n com o sta ? Se pueden usar para
proyectar las opiniones de todos los huspedes durante un intervalo dado (como una
se mana o un mes) ? Exp lique.
(d) Cmo se puede seleccion ar una muestra aleatoria de husped es?
(e) Qu pregunta categrica agregara a la encuesta ?
(f) Qu preg unta numrica agregara a la encuesta ?
1.53 Suponga que un fabrican te de alime ntos para gatos planea realizar una encuesta entre las
familias de Estados Unidos para determ inar los hbitos de compra de los dueos de ga
tos. Entre las pregunta s a incluir se encuentran las relac ionadas con
l . dnde suele comprarse la comida para gatos .
2. si se compra com ida seca o blanda.
3. nmero de gatos que hay en la casa .
4. si se trata de un gato con ped igr o no .
11-----PROYECTO DE EQUIPO
PEI.1
Suponga que se obtuv o la siguiente inform acin sobre F. Jay Mari cuand o fue admitido en
la enfermera de la Universid ad de Brandwein.
(g) Tipo de sa ngre: B positivo
(a) Sexo: masculino
(h) Alergias conocidas a medicame ntos : nin(b ) Residencia o dormit orio: Mogelever Hall
guna
(e) Ao que cursa: seg undo ao
(d) Te mpera tura: 102. 2" F (o ral)
(i) Diagnstico prel iminar: gripe
G) Duracin estimada de es tancia: 3 das
(e ) Pulso: 70 latidos por minuto
(f) Presin sangunea: 130/80 mgimm(g)
Cla sifique cada una de las 10 respuestas por tipo de da tos. (Sugerencia: cuidado co n la presin sangunea: puede ser engaosa.)
Caso de estudio -
Referencias
1. Cccbran, W. G., Samp ling Techniq ues, 3d ed . (New York :
Wiley. 1977 ).
2. Crc ssen . e., "Margin of Error: Studies and Surveys Proliferare, bUI Poor Methodology Makes Man y Unrellable" , The
Wall Street Joum al, Nove mber 14, 1991. A l and A9 .
3. Dem ing, W. E., Sample Design in Bus iness Research (New
Yo rk: Wiley. 1960 ).
4 . Deming , W. E. Out 01 the Crisi s (Ca mbridge: Ma ssachusetts Institute of Technology Center for Advanced Engineering Study, 1986).
5. Deming, W. R . The New Econom ics for Indust ry, Govemmem, Education (Cambridge: Massachusetts Institute of
Techno1ogy Cenler for Advanced Engineering Study. 1993).
6. Gallup, G. H., The Sophisticated Po t-wa tcher's Guide
(Princeton , NJ : Princeton pinion Pre ss, 1972).
7. Gol eman, D. "P ollsters Enlist Psychcl ogists in Ques t for
Unblased Results", The New York Times , Sept ember 7.
199 3. C1 andC lI .
S. Grcves, R. M., Survey Er rors and Survey Costs (New York:
W i1cy, 1989).
9. Hansen. M. R . W . N. Hurwitz , and W . G . Madc w. Samp le
Survev Methods and Theory, vols. 1 and 2 (New York: Wiley, 1953).
O. Juran. J . M.. Juran on Leadership fo r Qua/U}' (New Yo rk:
Th e Free Press. 1989 ).
1. Juran, J. M. and F. M. Gryna, Qua liry Pla nning and Analy sls. 2d ed . (New York : McGrJ w-H ill, 1980) .
2. Kendall , M. G.. and R. L. Ptacketr. eds ., S tudies in che HislOry of Sunistics and Probability. vol. 2 (London: Charles
W. Gri rfin, 1977 ).
13. Kirk, R. E.. OO. Statist ical Issues: A Reader f o r the Behavtora l Sciences (Monterey. CA: Rroo kslCole, 1972 ).
14. Lo tus J2 -3 R elease 5 (Cambridge, MA : Lotu s Devel opmen t Corporation , 1994 ).
15. Microsoft Exce 2000 (Re dmond, WA : Microsoft Co rporation, 199 9).
16 . M ntab Version 12 (State College. PA: Minitab, Inc. 199 5).
17. Mostell er, F., et al., The Pre-Election Polls 0/ 19-18 (New
York: Social Science Research Council, 1949).
18. Norusis. M., SPSS Guide to Data Analy ss Jo, SPSSX:
Wilh Additional ln structions 101' SPSSlPC + (C hicago:
SP SS lnc., 1986).
19. Pearson , E. S. ed., TI~ Hstory 01 Statistics in the Seventeeruh and Ei ghteent h Cen tures (New York: Macm illan,
1978).
20. Pearson, E. S., and M. G. Kendall, OOs. Srudies in the History
of Statistics and Probability (Darien. Cf: Hafner. 197 0).
2 1. Rand Corporation , A M illioll Random Dgits with 100. 000
No rma l Deviates (Ne w York: Th e Free Press, 1955 ).
22. Robb ins, S. P.. Management, 5th ed. (U pper Saddle River,
NJ: Prent ice Hall , 1997 ).
23 . SAS Longuage and Proced eres Usage. Venio" 6 (Rale igh,
NC : SAS Institute, 1988).
24. Walke r, H. M ., Stud ies in the History of the Sta tistica l
Meth od t Bald more: WilJiams & Witkin s. 19 29 ).
25. Wattenberg, B. E., ed ., Statistica l H story of the United
Sta tes : Fro m Colonial Tim es lo the Presen t (Ne w York :
Ras ic Boo ks. 1976 ).
.ste apndice proporc iona una orientaci n acerca de los conceptos b sicos qu e se necesitan par a utiliar Microsoft Excel O Minitab, que corren en una interfaz de usuario de Windows. que a su vez utiliza
entanas o marcos para dividir la pantalla. En es ta interfaz de usuario. a pesar de que la com unicain se puede lograr oprimiendo una co mbinacin de teclas, la seleccin de tare as es ms sencilla si
e utiliza un sealado r, como un ratn o un puntero de esfera o de pantalla de tacto. Al move r e l disositivo sealador (mo use o ratn) se mueve el puntero o curso r, que es una image n grfica en la
antalla que suele apare cer como una flecha. Al mover el pun tero del ratn sobre otro obj eto y preo nar uno de los botones se define una ope racin co n el ratn. En el cuad ro A 1.1.1 se presentan cuao tipos de ope raciones con el ratn que se utilizan en Microsoft Excel o Minitab.
En un ambiente de ventanas, las operaciones de ratn se aplican a una amplia variedad de obje tos
en la pantalla. En primer lugar se tienen las venta nas , marcos que sirven para contener otras ventanas o los objetos que se describen en este apndice. Se pueden seleccionar y arrastrar muchas ventanas desde una posicin en la pantalla a orra. y a veces se puede modifica r su tama o. es decir.
modificar sus dimensiones.
Otros objetos comunes en el ambiente de ventanas incluyen conos flotantes. barras de tareas o de
herramientas. barras de men y cuadros de dilogo.
conos flotantes
Los conos flotantes son grficos que representan una aplicacin o un documento especficos. pueden seleccionarse y arrastrarse a otra posicin. El hecho de activar un cono que representa Microsoft Excel es una forma tpica de iniciar el programa de ExceI.
Barras de men
Las barras d e men son listas horizontales de palabras que representan un conjunto de opciones. Al
seleccionar una opcin aparece un men desplegable [pull-down] o una lista con ms palabras para elegir.
Cuadros de dilogo
Al hacer una seleccin en un men o una barra de herramientas. a menudo aparece un tipo especial
de ventana llamada cuadro de dilogo. Los cuadros de dilogo se usan para desplegar mensajes o
para pedir al usuario que elija o proporcione informacin adicional. Los obje tos comunes en muchos
cuadros de dilogo se enumeran en el cuadro A1.1.2.
COM ENTARIO:
UIl
men
En este texto. los autores abreviarn las selecciones de men con una raya vertical para
separar las opciones. Por ejemplo, se usar Archivo I Abrir en vez de la expresin "seleccione el men de Archivo. y luego la opcin Abrir". Adems, tal como se escribi Archivo 1 Abrir . las selecciones aparecern en negritas.
..
~
?_" ' --'''' -.-,. "-
:.
'ihe et t
F,GURA
A 1.2.1
La hoja de clculo que se presenta en el rea de trabajo est maximizada. y la cubre completamente. Los botones para cambiar tamao y cerrar la ventana aparecen en la barra de ttulo y en la de men. Las barras de desplazamiento, horizontal y vertical, permiten desplegar las partes de la hoja de
clculo que estn fuera de la pantalla. Las etiquetas de hojas, que identifican el nombre de cada una,
se utilizan para ir de una hoja a otra (del cuaderno de trabajo). Una barra de estado puede proporcionar inform acin acerca de la operacin actual y el estado de algunas teclas.
Con esta notacin, se puede distinguir entre dos celdas que tienen la misma posicin en dos hojas diferentes del mismo libro. Por ejemplo, Datos!AI y Clculos!AI se refieren a la celda de la esquina
superior izquierda de las hojas respectivas de datos y clculos. Esta notacin extendida slo es necesaria cuando se hace referencia a una celda que est en una hoja diferente a la hoja donde se est trabajando.
Adems de celdas individuales. se puede n hacer referencias a bloques de celdas que son grupos
rectangulares de celdas adyacentes. Los bloques de celdas se identifican con la esquina superior izquierda y la esquina inferior derecha del bloque. La forma correcta de indicar el bloque es
Superiorll.quierda:/nf eriorDaecJUl
Por ejemplo. el bloque de celdas Al :B3 se refiere al grupo de seis celdas en la hoja de trabajo que
contiene las celdas Al . Bt , A2. 8 2. A3 Y 8 3. Y el bloque A I:A8 se refiere a las ocho primeras cel o
das en la primera columna de la hoja. Se pueden indicar bloques en la fonna siguiente
Nombrelloja!Sup eriorIzquierda:lnferiorDerecha
y se refieren a bloque s que no estn en la hoja de trabajo.
A veces es necesario distinguir entre dos celdas que tienen la misma posicin en dos hojas de trabajo (que tienen nomb res iguales) en dos libros distintos que se guardan en la misma carpeta o directorio. En esos caso s, las referencias a las celdas se escriben en la forma
'{NombreLibro/NombreHoja '!ColumnaFila
como en [MUl1JAL]Data'!A l , que se refiere a la celda que est en la esquina superior izquierda de
la hoja de trabajo Data en el libro MUTUAL.
Tabla A 1.2.1
NO~BRE
AHen
125
Barry
250
Diane
Kim
Susan
72
105
48
Ahora se usar Microsoft Excel para realizar un anlisis estadstico de estos dalas. Segn la tabla
A 1.2.1. se decide que el encabezado de la primera columna, "Nombre", debe aparecer en la celda A l.
Con el mismo razonamie nto, el encabezado de "C antidad" debe aparecer en la celda B1, Y los valores de cada variable para los cinco clientes, en las cinco filas siguientes (de la 2 a la 6). Una vez especificadas las direcc iones de las celdas para las pan es de la hoja de clculo, se capturan los valores
en las celdas de una hoja de clculo que se identifica con el nombre "Datos". Para hacer esto. active Microsoft Excel, y seleccione Ar chivo I Nue vo para crear una nueva hoja de clculo. Camb ie el
nombre de la Hoja l por Datos,
Seleccione la celda Al haciendo clic en su interior. Un borde especial que resalta la celda. aparece alrededor de ella e indica que la celda A I es ahora la celda activa donde se introducir el siguiente valor. (Tambin observe que A l. la direccin de la celda activa, aparece en el cuadro de referencia de celdas.) Escriba el encabezado de columna. "Nom bre". Al hacerlo. observe que las letras
aparecen en el cuadro de edicin de la barra de fnnu las al igual que en la celda A l . Presione la tecla Enter (o haga e1ie en la marca de correcto a la izquierda del cuadro de edicin) para terminar.
(Si su teclado no tiene la tecla Enter entonce s debe presionar la tecla Retum .) Contine con la seleccin de la celda B l y escriba el encabezado de colu mna "Cantidad" .
Una vez escritos los encabezados. puede iniciar la ca ptura de los valores en cada columna. Se escribirn los valores por columna. utilizando la tecla Enter (Retum) , que da el avance automtico de
la celda activa un rengln hacia abajo. despus de cada dato. (Si desea ingresar valores por rengln.
debe presionarse la tecla Tab [tabulador] despus de cada dato para desplazarse a la celda activa, que
est una columna a la dcrecha.)
Seleccione la celda A2. escrib a el nombre Allen, y oprima la tecla Enter (Retum ). Escriba el resto de los nombres en las celdas A3 a A6. oprimiendo Enter despus de cada nombre. Seleccione la
celda B2. y escriba la cantidad J25 de la tabla A l. 1. Despus siga con las cantidades 250. 72. 105 Y
48 en las celdas B3 a 86. Una vez introducidos todos los valores de la tabla fuente en la boja de trabajo "Datos", debe guardar una copia del trabajo en el disco con Arc hivo I Guardar o Arch ivo I
Gu ardar como , antes de continuar.
COMENTARIO:
Al escribir dalas en una hoja de clculo. es probable que se cometan errores. Para corregirlos.
puede seguir alguna de las siguientes instrucciones:
COMENTARIO:
Se pueden copiar objetos que van desde una sola celda hasta una hoja co mpleta para simplificar o acelerar el diseo de una hoja de clcu lo. En gen eral, copiar implica que primero se debe seleccionar el objeto y lue go los comandos apropia dos para copiar y pegar.
Para copiar el elemento de una celda o WJ grupo de elementos. seleccione la celda o grupo de celdas que con
tienen los elementos que se l'an a copia r arrastrando el puntero del raln por todas las celdas del grupo. Seleccione Ed:in I Copiar. Seleccione la celda (o la primera celda del grupo) que recibir la copia. Seleccione Edicin I Pegar. (Nota: Al copia r elementos que contienen f rmulas quiz no se obtengan elementos
duplicados. Consulte el apndice 2.1 pa ra una explicacin de las direcciones absolutas.
Para copiar una hoja completa. seleccione la lroja que desea copiar haciendo un clc en el tabulador de la hoja (cuadro superior izquierdo que est entre las barras de letras y nmeros). Seleccione Edic in I Mover o co..
piar hoja. En el cuadro de dilogo Mover o copiar, marque Crear una copia. Seleccione (n ue vo libro) en la
lista desplegabl e del cuadro Al libro: si la copia de la hoja de clculo se va a colocar en un nuevo libro. Seleccione la posici n de la copia en el cuaderno de trabajo en el cuadro Antes de la hoja : y haga elie en el
botn Aceptar.
Asistentes (Wiz:ards)
Los asistent es son conjuntos de cuadros de dilogo entrelazados que guan al usuario en la tarea de
crear cienos obje tos en libros de trabajo. Los usuarios proporcio nan informaci n y eleccio nes en los
cuadros enlazados y avanzan haciendo clic en un botn "Siguiente" (y al final en "Terminar" para
crear el objeto; un e1ic en "Cancelar" suspende la tarea). Como ejemplo, considere el Asistente pa
ra importar texto de Microsoft Excel que ayuda a importar o transferir datos de un archivo de texto a una hoja de clculo. (Un archivo de texto contiene valores no etiquetados y sin formato que estn separados por delimitadores como espacios, comas o tabuladores .)
Para ilustrar este asistente, suponga que el archivo de texto MUTUAL.TXT con tiene un conjun to
de dates sobre fondos mutuos (este archivo se proporciona en el CD-ROM que acompaa al libro).
Para importar los datos de este archivo a una hoja de clculo Excel: seleccio ne Archivo r Abrir. En
el cuadro de dilogo. seleccione la carpeta que contie ne el archivo MUTIJAL.TXT de la lista desplegable "Buscar en" . Seleccione la opcin Archivos de texto (* .pr n; ...!xt; ...csv) de la lista "Ti po de
Archivo". Tambin se puede seleccionar la opcin Todos los archivos (* .*) . Introduzca el nombre
MUTUAL TXT en el cuadro " Nombre de archivo " o seleccinelo en la lista de archivos. (Si el archivo no aparece en [a lista de archivos, verifique que [os dos pasos anteriore s sean correctos.) Haga
elic en el botn Abrir.
Esto inicia el "Asistente para importar texto en tres pasos". En el cuadro de dilogo del Asistente para importar texto -paso 1-, seleccione la opcin De ancho fijo (porque los valores de datos
para las variables en este archivo se colocaron en columnas de ancho fijo). Observe que 10 que el texto llama "variables" son "campos" en el cuadro de dilogo. Haga clic en el botn Siguiente. En el
cuadro de dilogo del Asistente para importar texto - paso 2- haga die en el botn Siguiente para
aceptar la colocacin de los datos de cada lnea del archivo de texto en columnas. (Arrastre la lnea
vertical que separa columnas para alterar la colocacin. si fuera necesario.) En el cuadro de dilogo
de Asistente para importar texto -paso 3- . seleccione el botn de opcin General debajo del encabezado de formato de datos de columna. Haga clc en el botn Terminar. Los datos del archivo de texlo se transfieren a una hoja de clculo nueva. con el mismo nombre del archivo de texto (MlITUAL.
en este caso), en un nuevo libro de trabajo. Guarde este libro con formato Microsoft Excel (.XLS).
Recuerde que debe revisar los objetos que se crearon con los asistentes en busca de errores. Si los
objetos 'contienen errores se pueden modificar, ya sea oprimiendo el botn derecho en el objeto y seleccionando la opcin apropiada del men resumido, o bien borrndolos y crendolos de nuevo con
ayuda del asistente. (En este ejemplo, un buen procedimiento sera revisar los datos que se transfirieron y, quiz. insertar encabezados de columna ; para ello seleccione cualquier celda de la fila l. luego Insertar I Filas. por ltimo, escriba los encabezado s deseados para las columnas.)
Complementos
Los com plementos son procedimientos preprogramad os y opcionales que amplan la funcionalidad
de Microsoft Excel. Algunos de ellos. como las herramientas para anlisis de datos. se incluyen en
los archivos de Microsoft Excel; se instalan con el programa de Instalacin de Microsoft Excel y estn disponibles para los usuarios en forma permanente. Otros, llamados complementos de "terceras
personas", como PHStat de Prentice Hall (que se incluye en el CO-ROM que acompaa a esta edicin en espaol) se instalan por separado.
Los complementos modifican la barra de men de Microsoft Excel insertando ya sea un nuevo
men de opciones a un men preexistente, o un nuevo men de opciones. Una vez seleccionados. algunos suplementos de opciones conducen a recuadros de dilogo que le piden al usuario ingresar informacin y realizar selecciones, mientras que otros generan nuevos objetos o resultados en forma
directa.
Por ejemplo el suplemento de herramien tas para anlisis de datos inserta la opcin "Anlisis de
datos" en el men de herramie ntas. mientras que el complemento PHSIaI inserta el men desplegable PHStat en la barra de men (vase la figura A1.2.1). La seleccin de Her r am ienta s I Anlisis
eHStat VllIt- t
,,
DIIi:" ~aral:kln
oec-.-MaI<h;J
'
..
~.
~ Distrb1ens
fIGURA A 1.2.2
Men PHSta t
de datos hace que el complemento de herramientas muestre el cuadro de dilogo Anlisis de datos
donde se puede seleccionar el anlisis estadstico de inters. Si se elige PHStat en la barra de men
aparece un men de opciones (vase la figura A 1.2.2) para elegir la operacin de inters. Estas opciones llevan a uno o ms cuadros de dilogo o generan algn objeto del libro de trabajo.
Se pueden cargar muchos suplementos separados, incl uso PBSta t, en fonna tempora l. Se hace doble ene en el cono de PHStat for Exeel 97/2000 o PHStat Ior Exeel 9S en el escritorio (vase las
instrucciones para la instalacin de PHStat en el apndice F) o se usan los procedimi entos para abrir
un archivo de un cuaderno de trabajo Excel (al seleccionar PHStat en el men Start de Prentice Hall
Add- Ins se carga el complemento). Al cargarlos en forma temporal, los complementos pueden accionar el cuadro de dilogo de control de virus en macros que advierte la posible existencia de virus. Si
se presenta este cuadro de dilogo, presione el botn Activar macros para permitir la carga del complemento sin virus (como PHStat). Tenga cuidado de no cargar como temporal un complemento que
est instalado como permanente. para evitar resultados impredecibles.
Recuerde que para utilizar Microsoft Excel y el comp lemento PHStat de este libro, se deben instalar los complementos herramientas de anlisis de datos y herramientas de anlisis de datos - VBAque proporciona Microsoft Excel e instalar (o cargar como temporal) el complemento PHStat de Prentice Hall que se incluye en el CO-ROM que acompa a el libro . Se deben instalar los complementos
de herramientas de anlisis para poder utilizar PHStat, ya que ste no funciona si detecta que no se
instalaron las herramientas.
Resumen
En este apndice se present una introduccin a las caractersticas bsicas de Microsoft Excel. En el
resto de los apndices de Excel se vern muchos aspectos adic ionales de Excel en el conte xto de anlisis estadsticos especficos.
C1
--1- -
2
J
-_.- . - , --- ~
.-
.... -
_.- -.
~_
'
_l_~._'_~_-
- - l - - - - _ . :, _ _ ,_ _....
...-+- -
,
~~-'-
.~
- -'- !
;- -
,--
t--
" ~ o
FIGURA A
1.3.1
Enter, y se mueve a la derecha al presionar Enter cuando la flecha apunta hacia la derecha. Al hacer die en la flecha ca mbia la direccin en que se insertan los datos.
Por ejemplo, supo nga que se tienen datos sobre la ca ntidad de dinero que gastaron cinco clientes
en una tienda departamental. Los resultados se muestran en la tabla A1.3.l.
Tabla A 1.3.1
N O MUR E
AHen
Barry
CANTIDAD (01.8)
125
250
Diane
72
Kim
105
Susan
48
Empiece en la fila de la flecha. Esta fila se usa para escribir los nombres de cada variable. En la
primera col umna (con etiquet a el ), escriba la etiqueta de la primera variable (Nombre) y oprima Enter. Esto mueve el curso r a la prim era fila de esta columna . Escriba Allen en la fila l. Barry en la
fila 2. Diane e n la 3. Kim en la 4 y Susan en la fila 5. Mue va e l cursor al rea de encabezados en
la parte superior de la co lumna 2 (abajo de C2), escriba Can tidad co mo etiqueta de esta co lumna.
Despus de presionar Enter para moverse a la fila I en la columna e 2, inserte 125, la canti dad que
gast Allen. Contine con las cantidades que gasta ron Jos otros clientes en la" filas respe ctivas, fila
2 a fila 5.
Al realizar los anlisis estadsticos en este libro. a men udo se enco ntrar n conjuntos de da tos con
un gran nmero de obse rvaciones . Si este tipo de conjuntos de dato s se cap turan y guardan en un archivo de datos. parece sensato tratar de importar el contenido de l archivo a una hoja de datos, para
evitar volver a introd ucir cada una de las observacione s. Los co njuntos de datos que se usaron aqu
se e ncuentran almacenados en difere ntes formato s, incluyendo el formato Minitab (.MTW ). Para importar los conten idos de una hoja de clcu lo Minit ab, abra el archivo de inters (de Min itab ) a par-
tir del directorio apropiado. Para esto se elige File I Open Worsheet en la barra de men y despus se
selecciona el archivo adecuado del directorio.
Aunque el programa Minitab puede importar datos almacenados en varios tipos de archivos especiales (como Microsoft Excelj, es posible que en otras situaciones encuentre datos guardados como
archivos de texto. archivos que contienen valores sin nombres y sin formato, datos separados por espacios, comas o tabuladores. Para abrir datos de un archivo se usa el comando File I Open worksheet . Esto proporciona el cuadro de dilogo Open Worksheet. En este cuadro de dilogo se pueden
abrir muchos archivos diferentes, que incluyen archivos Minitab (.MTW), Microsoft Excel (.XLS).
de datos (.DAn y de texto (.TXn. Para asegurar que aparece el tipo de archivo adecuado en el cuadro de Files, seleccione el archivo que desea abrir. Para verlo en la hoja de trabajo, haga clc en el
botn Preview.
Si la primera fila empieza con datos y no contiene los nombres de las variables (como es el caso
de los archivos con terminacin .TXT que se incluyen en el CD-ROM que acompaa al libro), haga
die en el cuadro Optlons. Seleccione Nane entre las opciones del cuadro de Variable Names. Seleccione Free Fonnat de las opciones del cuadro Field Definitions. Haga d ie en el botn OK. Cuan.
do est listo para abrir el archivo seleccionado. haga clic en Open para abrir el archivo seleccionado que aparecer en la ventana Data. Inse-rte los nombres de cada variable. y salve el archivo como
una hoja de clculo Minitab.