Anda di halaman 1dari 26

En el tercer cundro de diálogo, seleccione la pestaña TItul05.

Escriba Diagrama de Pardo en el


cuadro de edición 'Título del gritico", Grupo en el cuadro de "Eje de categorías (X)", % en "Eje
de valores (n" y % acum en "Segundo eje de valores (n". Seleccione la peslaña Eje. Activc el cua-
dro de Eje principal de categorías (X)" y los dos cuadros de Eje de valores (Y). Seleccione la pestaña
Lineas de división. Desactive todas las opciones. Seleccione la etiqueta u}'cnda. De.e;activeel cuadro
de "Mostm leyenda". Vaya a la pestaña Rótulos de datos. Active la opción Ninguno en el grupo de
"Rótulos de datos". Elija la pestaña Tabln de datos. Desactive el cuadro de "Mostrar tabla de da.
tos". Haga die en Siguiente.
En el cuarto cuadro de diálogo. seleccione la opción "en una hoja nue"a" y escriba Pardo en
el cuadro de ~ición a la derecha de la opción. Haga dic en Terminar para crear la grática. Para en-
rregir la ~ala del eje secundario Y, haga die derecho en el eje secundario a la derecha de la gráfi-
ca. Seleccione Fonnalo de ejes del menú directo que se despliega. En el cuadro de diálogo. haga ~
die en la pestaña Esenia. Cambie el valor en el cuadro de edición "Máximo" a l. Haga dic en el
botón Aceptar.

Uso de PHStat pora obtener una tabla resumen de dos


sentidos y un diagrama de barros lado a lado
Si se dispone de datos sin procesar, es posible usar el suplemento PHSlat para obtener tablas de con-
Resumen y~1JA'-scrip~i6n
tingencia de dos sentidos y diagramas de barras lado a lado. Por ejemplo. para la lista de cargos y
objetivos de los fondos, abra el cuaderno de trabajo MUTUAL.XLS. Seleccione PHSlal1 Two Way
Tables & Charts. Escirba El:E195 en el cuadro de "Row Variable Cell Rangc". Escriba Gl:G195
en el cuadro de ''Column Variable Cell Range". Active el cuadro First cell in bolh ranges contains
de datos numéricos
Inbel que Indica que hay rolUlos en las primerns celdas. Active el cuadro de Side-hy-Side Bar Chart.
Haga dic en el botón OK. El suplemento proporciona una tabla de comingencia y un diagrama de Introdu<:clón 102
bmas lado a lado en hojas separndas. 3. t Exploraci6n de datos numéricos y sus propiedades 102
3.2 Medidas de tendencia central, variaci6n y rorma 103
3.3 Análisis exploratorio de datos 128
3.4 Obtenci6n de medidas descriptivas de resumen a partir de una poblaci6n 133

+ ApÉNDICE 2.2 USO DE MINITAB PARA TABLAS Y GRÁFICAS


______ ~ ~_~_~_.r. __
'_ _J
3.5 Reconocimiento y práctica de resúmenes descriptivos adecuados y
consideraci6n de aspectos éticos ] 39
En este capftulo se desarrollaron diversas tablas y gráficas pan rendimientos nnuales de fondos mutuos.
Se pueden obtener muchas de estas tablas y grnficas con Minilab. Resumen 141
A3.1 Uso de Microsoft Excel en la estadística descriptiva 150
Cómo obtener un diagrama de tallo y hoja
Para obtener el diagrama. de tallo y boja de la figurn 2.1 en la página 42, deben distinguirse los da- A3.2 Uso de Minitah en la estadística descriptiva 151
tos para separar los rendimientos porcentuales a un año para los 59 fondos de crecimiento y para los
135 fondos mixtos. Pm hacerlo, abra el archivo MUTUAL.MnV y seleccione Munip I StneklUns.
Inck 1 Uns1.ack One C(llumn para amomonar/desamontonar una columna. En el cuadro de diálogo
"Unslaek One Column" escriba C4 o 'IYr%Rct' en el cuadro de edición "Unstaek the data in". Es-
criba C9 Cl0 en el cuadro de "Store ustacked dala in". Escriba C7 u 'Obj' en el cuadro de "Using
subscripts in". Haga clic en el botón OK.
Los rendimientos porcentuales a un año se encuentran ahorn.en las columnas C9 (crecimiento) y
CIO (mixto). Después de asignar etiquetas a estas variables, seleccione Stnt I E()A I Slem-and-Leaf.
En el cuadro de diálogo "Stem-and-Leaf' escriba C9 o 'lYr%RetGrow' en el cuadro de edición "Va-
riables" y 1 en el cuadro de "Inmment" (para tener tallos iguales a I). Haga clie en OK.

Cómo obtener un histograma


Con los datos separados (como en el caso del diagrama. de tallo y hoja), para obtener el histograma
de la figura 2.2 en la página SO, seleccione Crnph I Histogrnm. Escriba C9 o 'IYr%RetGrow' en
,
\
el cuadro de "Graph variables". Haga clie en el botón de Options. Bajo "rype of Histogram" haga
clie en el botón Pen:enl. Para 'íype of lnterval" baga cHe en el botón CUlpoínt. En la "Definition
of lntervals" active Midpointo¡Jcutpoinl positions e ing~ los valores 20, 25, 30, 35, 40, 45, 50.
Haga die en OK parn regresar al cuadro de diálogo Uislogram. Oprima el botÓn OK para obtener el
histograma.
!
11
98 CAPfTuw2 PRESEm'ACIÓN DE DATOS EN TABI .•.••.
S y GRÁflCAS

L ------+
OBJETlVOS,DEl CAPíTULO .Tabla 3.' Rendimien~o total a un año para acciones
de fondos cuya estructura de cargos consiste
.1 Describí;' l~ tendencia central de los datos numéricos
en cargos de ventas pagados por los
./ Describir la variación de los datos numéricos activos de los fondos
./ Describir la fonna de una distribución
RENDIMIENTO PORCENTUAL
./ Introducir la gráfica de caja y bigotes [box~and-whiskerl como una herramienta para describir
FONDOS TOTAL A UN AÑO
las características de los datos numéricos
./ Calcular medidas descriptivas de resumen a partir de una población Amcore Vinlage Equity 32.2
Baron Funds Asset 29.5
Introducción Berger SmCoGrow 29.9
En el capítulo anterior analizamos la presentación de 9at05 numéricos y categóricos en forma Chicago Trust Growlnc 32.4
tabular y gráfica. ¿Cómo podemos interpretar esa información? Aunque la presentación de Dodge & Cox DomíniSo 30.5
los datos es una componente esencial de la estadística descriptiva, la tarea no termina ahí. Federated lnstítul MaxCapSve 30.1
Dentro del manejo de la información numérica, un buen análisis de datos no se limita a la First Funds OroIne III 32.1
presentación de datos y la observación de lo que estos tratan de transmitir, también abarca Harris Insighl lnst Haven 35.2
los cálculos y el resumen de las características importantes y el análisis de lo que contienen. Mentor Merger 10.0
En este capítulo se examinan los datos numéricos y sus propiedades. En primer lugar se Rainler Reich Tang 20.6
estudian las medidas de tendencia central, variación y forma. Enseguida se explora el análi-
Robertson Stephens ValGrow 28.6
sis de datos y el cálculo de las medidas descriplivas de resumen a partir de una población.
SSgA S&P500Idx 30.5
Por último, analiza cómo reconocer y realizar resúmenes descriptivos adecuados, además de
SSgA SmallCap 38.0
considerar los aspectos éticos pertinentes.
1784 OrowIne 33.0
Stagecoach CorpStk 29.4

liI
ARCHIVO
Westwood Eq R 37.1 DE DATOS

Wright Yacktman 28.6 MUTUAL

• EXPLORACiÓN DE DATOS NUMÉRICOS Y SUS PROPIEDADES Acomodados en un arreglo ordenado, los rendimientos totales a un año de estos fondos
de acciones nacionales (en porcentaje) son:

10.020.628.6 28.6 29.4 29.5 29.9 30.1 30.5 30.5 32.1 32.2 32.4 33.0 35.2 37.1 38.0
• CÓMO UTILIZAR LA ESTADíSTICA: Evaluación del rendimiento de fondos mutuos
Aquí, 10.0 Y quizás 20.6 podrían considerarse valores alejados o extremos.
Para introducir las ideas más relevantes de este capítulo, cabe recordar el estudio del rendi-
miento de fondos generales nacionales. Al determinar una estrategia de inversión, será útil Quizá sería interesante analizar las causas que hacen que el rendimiento total a un año de
comparar el porcentaje de rendimiento total a un año de los fondos con base en sus estructu- Mentor Merger fuera tan inferior al alcanzado por los otros fondos cuyos cargos de ventas se
ras dc cargos. Para ilustrar este tipo de evaluación, primero se estudian los 17 fondos cuya pagan con los activos de los fondos. Una comparación del informe de este fondo con los re-
estructura de cargos consiste en gastos de venta pagados con los activos del fondo y luego se portes de los fondos con rendimientos superiores podría proporcionar cierta visión útil para
comparan los rendimientos de las cinco estructuras de cargos. • el análisis de inversiones futuras.
Sin embargo, si nos pidieran examiri.ar los datos y presentar un resumen breve, todo lo
Las tasas de rendimiento total a un año se presentan en la tabla 3.1. Observe que los 17 fon- que se podría esperar sería la formulación de tres afinnaciones que son similares a las ante-
dos se presentan en orden alfabético con los rendimientos totales a un año (en porcentajes). riores, sin un mayor conocimiento de la estadística.
¿Qué podemos aprender de esos datos con el fin de evaluar posibles inversiones futuras? Es posible incrementar la comprensión de lo que significan los datos con un examen más
Con base en esta muestra se pueden hacer las tres observaciones siguientes: formal de las tres propiedades principales que describen un conjunto de datos numéricos:
1. Dos de los fondos obtuvieron un rendimiento total anual de 28.6%, y otros dos fondos tendencia central, variación y foma. I

obtuvieron un rendimiento total a un año de 30.5%. Estos son los valores que ocurren
con mayor frecuencia o valores modales, se considera que este conjunto de datos es
bimodal. Los rendimientos anuales logrados por cada uno de los demás fondos difie- • MEDIDAS DE TENDENCIA CENTRAL, VARIACiÓN Y FORMA
ren entre sí.
2. La dispersión de los rendimientos totales a un año va de 10.0 a 38.0 por ciento. En cualquier análisis o interpretación, se pueden usar muchas medidas descriptivas que re-
3. Parece existir al menos'un rendimiento total a un año inusual o bajo en extremo en es- presentan las propiedades de tendencia central, variación y forma para resumir las caracterís-
te conjunto de datos: el alcanzado por Mentor Merger. ticas importantes de,un conjunto de datos. Si se calculan estas medidas descriptivas globales

102 CAPÍTULO 3 RESUMEN y DESCRIPCIÓN DE DATOS NUMÉRICOS MEDIDAS DE TENDENClA CENTRAL, .'1 ARIACIÓN y FORMA 103
a partir de una muestra de datos. se denominan ~srad{sticos; en cambio. si se calculan para
toda la población de los datos se denominan parámetros. Como los especialistas en estadísti- . I Ejemplo 3.1 Cálculo de la media ariimélica
ca suelen usar muestras en lugar de toda la población, este libro dedicará una mayor aten-
I _'_' ~~ _

---~
Calcule la media aritmética de los rendimicnlos porcentuales totales a un año de los 17 fon-
ción a los estadísticos que a los parámclros, al describir las propiedades de tendencia central,
variación y forma. dos de acciones generales nacionales presentados en la tabla 3.1 de la página 103.
SOLUCiÓN
Medidas de lendencio central
La mayor parte de los conjuntos de datos muestra una tendencia bien determinada a agruparse Primero se asignan los valores XI a los 17 fondos ..
o aglomerarse:alrededor de cierto punto central. Así. para cualquier conjunto específico de da. XI == 32.2 en Arncore Vintagc Equity
tos. casi siempre se puede seleccionar algún valor típico. o promedio, para describir todo el X2 == 29.5 en Baron Fund Assets
conjunto. Este valor Ifpico descriptivo es una medida de tendencia central o uhicación.
XJ = 29.9 en Beeger SmCoGrow
Los cinco tipos de promedios que se utilizan con frecuencia como medidas de tendencia
central son la media aritmética. la mediana. la moda. el rango medio (o centro de recorrido) X4 == 32.4 en Chicago Trust Growlnc
y el eje m('dio. X.s = 30.5 en Dodgc & Cox DominiSo
• Media aritmética La media aritmélica (también llamada media) es el promedio O me- X6 = 30.1 en Federnled Institut MaxCapSvc
dida de tendencia central que se utiliza con mayor frecuencia. Se calcula con la suma de X7 = 32.1 en First Funds Grolnc III
todas las observaciones en un conjunto de datos. dividida entre el número de elementos in- Xg = 35.2 en Harris Insighllnst Haven
volucrados. Así, para una muestra que contiene n observaciones. X" Xl, X), ... , XII' la me. X9 = 10.0 en Mentor Merger
dia aritmética [representada por el símbolo X (llamada "X barra")) puede escribirse como Xro = 20.6 en Rainler Reich Tang
X_ XI + X2 + Xl + ... + X" XJ 1 = 28.6 en Robertson Stephens ValGrow
n X12 = 30.5 en SSgA S&P500ldx
Para simplificar la notación. elténnino XI) = 38.0 en SSgA SmallCap

X104 = 33.0 en 1784 GrowInc


XI.5 = 29.4 en Stagecoach CorpStk
Xl6 = 37.1 en Weslwood Eq R
(que significa SU11U1 de todos los valores de Xi) que se utiliza siempre que se desea sumar una
serie de observaciones. Es decir, Xl7 = 28.6 en Wright Yacktman
La media aritmética para esta muestra sc calcula como siguc:
" = XI
2:X¡ + Xl + X) + ... + XII
i-l ¿X,
• Las reglas que se aplican a la notación de suma se presentan en el apéndice B. Al utilizar cs-
X = '=.!- _ 32.2 + 29.5 + 29.9 + ... + 28.6 29.86
n 17
ta notación. la media aritmética de la muestra se puede expresar como sigue.

Media aritmética Se observa que la media de los rendimientos porcentuales totales a un año se calcula en
La media aritmética 'es la suma de los valore~ dividida entre el núme'ro de valores. 29.86. aun cuando ningún fondo específico de la muestra tiene ese valor. Además. se ve en el
diagrama de puntos de la figura 3.1 en la págioa 106 que para este conjunto de datos. seis
observaciones son menores que la media y II son mayores. La media actúa como un punto
de balance de manera que las observaciones más pequeñas 'compensan a las más grandes.
(3.1) Observe que el cálculo de la media se basa en todas las observaciones (XI>X2, X) •... , XII)
del conjunto de datos. Ninguna otra medida de tendencia central de uso común posee esta
donde característica.
x = media aritmética de la muestra
n = tamaño de la muestra COMENTARIO: Cuándo usar la media aritmética
X~ = i-tsima observación de la variable aleatoria X Debido a que su cálculo se basa en todas las observaciones. cualquier valor extremo afec-
ta mucho a la media aritmética. En ese caso, la media aritmética es una representación
fx¡ = suma de todos los valores Xi en la muestra (véase el apéndice B) distof5ionada de lo que transmiten los datos; entonces, la media no es el mejor promedio
~.l
para describir o resumir un conjunto de datos que tiene valores extremos. Esto es lo que
sucede en el ejemplo 3.1.
El cálculo de la media aritmética se ilustra en el ejemplo 3.1.

104 CAPITULO 3 RESUMEN y DESCRIPCiÓN DE DATOS NUM~RlCOS


MEDIDAS DE TE.•.••
'OENCI ..••CENTR ..•••••VARIACIÓN y FORM ..•• lOS
.1 Mediano
La mediana es el valor tal quc 50% "de las obse~ciones son menores y 50% de ellas'
son mayores.

Mediana = n ; I observaci6n ordenada en la posición (3.2)

r/G%RA 3. J D¡ogra~o de puntos que represento los rendimienfos porcentuales lotoles o un año que obtuvieron 17
on os generales nOCIonalescon cargos de venIa pagodas par los activos del fondo La ccuación (3.2) se usa paro encontrnr el lugar correspondiente a la mediana en el arreglo
ordenado, según una de dos reglas:
REGlA 1 Si el tamaño de la muestra es un número impar, entonces la mediana está repre-
Pa.ra mostrar. cl efecto que pueden tencr los valores extremos cuando se resume y se sentada por el valor numérico que corresponde a la p:>sici6n (n + 1)/2 de las observaciones
descnbe la propIedad de la tendencia central, suponga que se elimina el valor extremo de ordenadas.
Mentor Merger. En el ejemplo 3.2 se explora el cambio de la media aritmética de los rendi- REGlA 2 Si el tamaño de la muestra es un número par, entonces la posición se encuentra
mientos porcentuales totales a un año. .
entre las dos observaciones que e.c;tána la mitad del arreglo ordenado. La mediana es el pro-
medio de los valores numéricos de estas dos observaciones.
'Ejemplo 3.2 Cálculo de la media arit;nélic~ El ejemplo 3.3 ilustra el cálculo de la mediana.
Calcule la media aritmética para los rendimientos porcentuales a un año después de elimi~ar
el valor cxtremo Mentan Merger.
Ejemplo 3.3 álculo Úla' mediana 0- partir
SOLUCiÓN de una m'lles/ra de tamaño impar
La media aritmética de esta muestra de 16 fondos se calcula como siguc: Del ejemplo del porcentaje de rendimientos a un año que obtuvieron los fondos de acciones
h
X = ~ = 32,2 + 29,5 + 29,9 + ' , , + 28,6
gen.erales (con cargos de venta pagados por los activos de los fondos), los datos sin procesar
(en bruto) son los siguientcs.
n 16 31.11 32.2 29,5 29,9 32.4 30,5 30,1 32.1 35,2 10.0 20.6 28,6 30.5 38,0 33,0 29.4 37.1 28.6
Al eliminar el valor de Mentor Merger, la media aritmética aumenta de 29.86 a 31.11. Calcule la mediana.

SOLUCI6N
El diagrama de puntos Com:spondiente se prescnta en la figura 3.2. El arreglo ordenado es
10,020,628.628.629.429.529,930,1 '30.5 30,5 32,1 32,232.4 33,0 35,2 37.1 38,0
i
Mediana
! • Observación ordenada i
5 JO 15
!
20
!
25 !8e~y r 234 567 8 '9' 10 11 12 13 14 15 16 17
35 40
Mediana :: 30.5
Para estos dalaS, la posición es la novena observación (es decir, (n + 1)/2 = (17 + 1)12 =
X=31.'11 9J. Por tanto, la mediana es 30.5.

F'GU~ 3.2 Diogromo d? puntos que represento el porcentaje de rendimientos tolales o un año logrados por 16 fondos
de aCCionesgenerales nOCIonalescon corgos de venia pogodos por 10.$odivos de los fondos Como puede verse en el arreglo ordenado del ejemplo 3.3, las observaciones ex.tremas no
afcctan a la mediana. No importa si el menor porcentaje de rendimiento total a un año es 1.0,
10.0 o 20.0. la mediana sigue sicndo 30.5.
• Mediana .La mediana es el .valor medio de un arreglo ordenado de datos. Si no hay Además. al calcular la mediana se ignora que pueden existir datos repetidos. En el ejem-
empates, la mitad d.c las observaCIones será menor y la mitad, mayor. Ninguna observaci6n plo 3.3, dos de los fondos (Robcrtson Stephens ValGrow y Wright Yacktman) alcanzaron el
extrema ~n un conjunto de datos afecta a la mediana. En consecuencia, siempre quc una mismo porcentaje de 28.6 en cl rendimiento total a un año. Sin embargo, esta cantidad no tu-
observaCIón extrema esté presentc, es adecuado usar la mediana en lugar de la media para vo impacto en el valor real de la mediana. Por otra parte, otros dos fondos (Dodge & Cox
describir el conjunto de datos. DominiSo y SSgA S&P500Idx) lograron el mismo rendimiento porcentual de 30.5 en un
Para calcular la medi~na de un conjunlo de datos, primero se organizan en un arreglo or- año, que es igual al valor de la mediana. Entonces, para esta muestra de tamaño impar, la po-
denado. Entonces la me(liana puede oblcnerre COmo: sición de la media~a es la observación (n + I)n. = 9 en el arreglo ordenado, y la mediana es

106 RESUMEN y DESCRIPCiÓN DE DATOS NUMl':;RICOS MEDIDAS DE TENDENOA CF.l'/TRAL, VARIACiÓN y FOR.!.{A 107
I 30.5. el valor que está en la mitad de la secuencia ordenada, aun cuando la observad6n en la
posición 10 lambitn es 30.5. El ejemplo 3.4 ilustra el cálculo de la mediana para una mues-
tra de tamaño par.

- . -~--~----------,
• Moda La moda es el valor que aparece con mayor frecuencia en un conjunto de da-
tos. A diferencia de la media aritmética, la ocurrencia de algún valor extremo no afecta a
la moda. Sin embargo, la moda se usa sólo para fineS descriptivos, porque varia más entre
muestras que otras medidas de tendencia central. El ejemplo 3.5 ilustra el cálculo de la moda.

¡Ejemplo 3.4 Cálculo de la.mediana a partir I


de una muestra de lamOlIO par I Ejemplo 3.5 Obtención de la moda
~--- --- ---~-- _ ...•
Suponga que la muestra eslá integmda por los valores netos de los activos de 14 fondos de Utilice el arreglo ordenado de los rendimientos totales a un año que obtuvieron las acciones
acciones generales nacionales. que están clasificados como fondos mixtos de capitalización de los fondos generales nacionales con cargos de venta pagados por activos de los fondos
pequeña. Los datos sin procesar, que presentan los valores netos de activos (en dólares) para (véase el ejemplo 3.3 en la página 107) para obtener la moda.
estos fondos. son los siguientes.
XI = 7.35 en Baron Funds BanRosSC SOLUCiÓN
X2 = 17.30 en Citizens Trust C10verEqV El arreglo ordenado de estos datos es
X, = 11.62.n DFA US9-IOSm 10.020.6,28.628.6.29.4 29.5 29.9 30.1 30.5 30.5 32.132.232.433.035.237.138.0
X. = 26.10 en FPA Fasciano Se observa que hay dos valores "que aparecen más", o dos modas: 28.6 y 30.5. Estos datos
X~ = 21.69 en GTGlobal Equity AmerGroA se describen como bimodafts.
X6 = 21.17 en GTGlobal Equity AmerGroB
X7 = 14.07 en Galaxy Retail SmCapVal
Un conjunto de datos puede no tener moda si ninguno dc los valores "aparece con mayor
XI = 14.09 en Galaxy Trust SmCapVal frecuencia". Esto se ilustra en cI ejemplo 3.6. .
X9 = 24.01 en Heritage SmCapStkA
XIO = 20.34 en HighMarkFid HomePAGr
XII = 18.26enTRowePriceOTCSec Ejemplo 3.6 Datos sin moda
Xl2 = 37.61 en PrincorEmgGroA Ulilice el arreglo ordenado de valores netos de activos (en dólare.'l) de 14 fondos de acciones
Xl3 = 18.60 en SSgA SmallCap generales nacionales [que están clasificados como fondos mixtos de capitalización pequeña)
XI4 = 16.95 en Wasatch Growth (véase el ejemplo 3.4 en la página 108) para obtener la moda.

Calcule la mediana.
SOI.UCIÓN
SOLUCIÓN
El arreglo ordenado para estos datos es
El arreglo ordenado es
7.35 11.62 14.07 14.09 16.95 17.30 18.26 18.60 20.34 21.17 21.69 24.01 26.10 37.61
7.35116214071409 16.95 17.30 18261'18.60 2034 21.17 21.69 24.0126.10 37.61
No hay moda en estos datos. Ninguno de los valores netos de los activos es el que "aparece
ObservaCión ordenada con mayor frecuencia".
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Mediana = 18.43
Para estos datos. el lugar de la mediana es (n + 1)12 = (14 + 1)12 = 7.5. Por L1nto.la me- • Rango medio El rango medio es cI promedio de la observación mds pequeña )' la ob.
diana se obtiene con el promedio de l:ts observaciones en las posiciones 7 y 8 del arreglo or. servación más grande en un conjunto de datos. Esto puedc escribirse como sigue:
denado:
18.26 + 18.60 • 8
2 =,1 .43 Rango medio
El rango medio se obtiene con la suma del valor más pequeño y el valor más gran-
de divida entre 2.
Para resumir, el número de observaciones que afecta al cálculo del valor de la mediana.
no así a la magnitud de cualquiera de los extremos. Si se ignora la posibilidad de igualdad en
los valores de los datos. que por lo común puede atribuirse a mediciones imprecisas. cual- (J.J)
quier observación seleccionada al él1.ares tan susceptible de exceder a la mediana como de
ser excedida por ella.
El ejemplo 3.7 ilustIl el cálculo del rango medio.

108 CArtnn.o 3 RESUMEN y DESCRIPCiÓN DE DATOS NUMÉRICOS MEDIDAS DE TENDE.•••CIA CENrRA(., VARIACiÓN y FORM:A 109
lEJé"}pio. 3,1 '""C?truí,,"""d;Y7ango medio 1 Tercer cuartil, Q3
Utilice el arreglo ordenado de los rendimientos totales a un año que obtuvieron los fondos El tercer cual1i1, Q). es un valor tal 'que 75.0% de la<;observaciones sao menores y
generales nacionales -cuyos cargos de venta se pagan con los activos de los fondos- (véa- 25.0% son mayores.
se el ejemplo 3.3 en)a página 107) y calcule el rango medio.
Ql = 3(n: 1) observación ordenada en la posición (3.5)
SOLUCiÓN

El arreglo ordenado para estos datos es


ilo.o:20.6 28.6 28.6 29.4 29.5 29.9 30.1 30.530.532.1 32.232.4 33.035.237.1 [)8.Q.
Se utilizan tres reglas para obtener los valores de los cuartiles:
REGlA 1 Si la posición obtenida es un número enlero, se elige como cuartilla observación
El rango medio se calcula mediante la ecuación (3.3),
numérica específica en ese lugar.
REGLA 2 Si la posición obtenida se encuentra en el justo medio de dos números enteros,
Xmh peqllefto + Xmü mnde
Rango
medio""
-----2----- se selecciona el promedio de sus valores correspondientes.
REGLA 3 Si la posición obtenida no es un número entero o el valor medio enlre dos núme-
10.0 + 38.0 = 24 O ros enteros, una regla sencilla para aproximar el cuartil específico consiste en redondear
2 .
hacia arriba o hacia abajo a la posición entera más cercana y elegir el valor numérico de esa
~--.. ~---... ...--.----------- observación.
El cálculo de los cuartiles se ilustrn.en el ejemplo 3.8.
Con cierta frecuencia el rango medio sc utiliza como una medida de resumen tanto para
aná!isis financieros como para reportes meteorológicos, porque puede proporcionar una me.
dida adecuada, rápida y sencilla que caracteriza a todo el conjunto de datos. Sin embargo, a EJemplo 3.8 ObtencióII de cllartUes
pesar de estas ventajas, el rango medio debe utilizarse con cuidado.
Utilice el arreglo ordenado de los rendimientos totales a un año que obtuvieron los fondos de
acciones generales con cargos de venta pagados por los activos de los fondos (véase el ejem-
plo 3.3 en la página 107) para calcular los cuartiles.
COMENTARIO: Cllándo Ilsar el rango medio
SOLUCiÓN
Cuando se manejan datos tales como precios diarios de acciones al cierre o lecturas de
temperatura cada hora. es dificil que aparezca un valor extremo. No obstante, en la ma- El arreglo ordcnado es
yor parte de las aplicaciones, a pesar de su sencille~ el rango medio se debe utilizar con 10.020.628.628.629.4 29.5 29.9 30.1 30.530.532.1 32.232.4 33.0 35.2 37.1 38.0
cuidado. Como sólo incluye la observación más pequeña y la más grande en un conjun- Para estos datos se ¡iene
to de datos. el rango medio es una medida modificada (de resumen) de tendencia central
si está presente un valor extremo (véase el ejemplo 3.7). En estas situaciones, el rango QI = -4-
n + I
observación en la . 'ó
POSICI n
medio no es apropiado.
= 11 + 1 = observación ordenada en la posición 4.5
4
Los CUBrtiles son las medidas de posición "no central" que se utilizan con mayor fre.
Entonces. si se usa la regla 2, QI puede aproximarse mediante el promedio de las observa.
cuencia (Iambién se llaman cuantiles) '1 se emplean sobre todo para resumir o describir las
ciones 4 y 5..
propiedades de conjuntos grandes de datos numéricos. Mientras que la mediana es un valor
que parte el arreglo ordenado por la mitad (50.0% de las observaciones son menores, y 50.0% Q, = 28.6 + 29.4 _ 290
2 .
son mayores), los cuan.iles son medidas descriptivas que parten los datos ordenados en cua-
tro cuartos. Otros cuantiles que se utiliz."lna menudo son los d~ciles,que separan los datos Además,
ordenados en diez partes, y los percenlj/~s, que los dividen en cien partes.
Los cuartiles pueden definirse por las ecuaciones (3.4) y (3.5). Ql = ~ 4 .1 en a POSICI
observaCión .. 6n

= + = observación
- _. - ~ o ~

3(17 1) en la posición 13.5


Primer cuartil, Ql 4

El primer cuartil, Ql, es un valor tal que 25.0% de las observaciones son menores Por tanto, al aplicar la regla 2, Ql se puede aproximar por el promedio de las observaciones
y 75.0% son mayores. 13 y 14.
_ 32.4 + 33.0 _ 327
__ (n + 1) Q'---2--- .
Q, 4 observación ordenada en la posición (l.4)
"

110 REsUMEN y DESCRiPCION DE O..••TOS rlUMEUCOS MEDID ..••S DE TEt-'DENCI ..••CENTRAL, VARIACION y FORMA 111
1,
il • Eje medio El .eje medio es una medida de resumen que se usa para superar posibles
problemas que intn:xluctn los valores extremos en los datos. El eje medio se calcula al rea-
FtGURA 3.3
Oo~ d¡~lribuciones ~imélriccs
i lizar el promedio del primer y ltrur cuarti/ de un conjunto de datos. en formo de campano que
1 di~eren sólo en lo tendencia
central
Eje medio
El eje medio se obtiene con la suma del primer y tcrcer cuartil dividida entre 2.
.• , " Q +' .
Eje medio = -~ (J,6) .

donde

Ql ::: primer cuartil FIGURA 3.4


005 di~tribucione~ simétrica~
Ql = tercer cua~il en forma de campano que
difieren 5610en variación

Paro calcular el eje medio, es necesnrio calcular primero QI y QJ. Esto se mueSlrn en el
ejemplo 3.9.

Ejemplo 3.9 Cálculo del eje medio


Utilice el arreglo ordenado de los rendimientos lolales a un año que obtuvieron los fondos
generales nacionales cuyos cargos de venIa se pagan COnlos activos de los fondos (véase el
ejemplo 3.3 en la página 107) para calcular el eje medio.

SOLUCiÓN

En el ejemplo 3.8 en la página 1ti se determinó que Ql = 29.0 Y Ql = 32.7. De nuevo con
la ecuación (3.6), ahora se calcula el eje medio como
• Rango El rango es la diferencia entre la observación más grande y la mds pl!queña
Eje medio = Ql + Ql de un conjunto de dalas.
2
_ 29,0 + 32,7 ~ 3085 Rango
2 '
El rango es igual al valor más grande menos el más pequeño.
Rango';' Xrmls~ - Xnds ~udla (J,7)

Es importante indicar que los valores extremos potenciales no afeclan al eje medio o al
promedio de Ql y Ql, ya que ambas son medidas de posición no central, porque no se consi. La ecuación (3.7) se aplica en el ejemplo 3.10.
dera ninguna observación menor que Ql o mayor que Ql' Las medidas de resumen como el
eje medio y la mediana. que no dependen de valores extremos, se llaman medidas rohu.<;tas.
Ejemplo 3.10 Cálculo del rango
Medidas de variación Utilice el arreglo ordenado de los rendimientos totales a un año que obtuvieron los fondos
Una segunda propiedad importante para describir un conjunto de datos numéricos es la va- generales nacionales -cuyos cargos de venta se pagan con los activos de los fondos- (véa.
riación. L:l \'ariación es la canlidad de dispersión. o "separación", que presentan los dntos. se el ejemplo 3.3 en la página 107) para calcular el rango.
Dos conjuntos de datos pueden diferir tanto en la tendencia central como en la variación; o
bien, como se muestra en los polígonos de la figura 3.3 en la página 113. dos conjunios de SOLUCiÓN
datos pueden lener las mismas medidas de tendencia central pero diferir en términos de va. El arreglo ordenado pnra estos datos es
riación. El conjunio de datos descrito por el polígono e de la figura 3.4 e.<;mucho menos
10,020,628,628.629,429.5 29,9 30,1 30,5 30.5 32,1 32.232.4 33.0 35,2 37,1:38:6
variable que el del polígono A.
Cinco medidas de variación incluyen el recorrido, el rango ¡mucuarlil, la varianza, la Para estos datos, el rango es 38.0 - 10.0 = 28.0.
desviación estc1"dar y el coeficieme de variación.

112 CArfTIJI.o 3 RESUMEN y DESCRIPCIÓN DE DATOS NUMÉRICOS MEDIDAS DE 1F.NDENCIA CENTRAL, VARIACiÓN Y FORMA 11:
El rango mide la dispersión total en el conjunto de dalos. Aunque es una medida sencilla SOLUCl6N
de la variación total en los datos. su debilidad característica consiste en que no loma en 'E1 arreglo ordenado es
Cuenta cómo se distribuyen los datos entre los valores más grande y más pequeño. Esto pue-
10.020.628.628.629.429.5 29.9 30.1 30.530.5 32.1 32.232.4 33.0 35.2 37.1 38.0
de observarse en la figura 3.5. Como se muestra en la balanUl C. sería inadecuado utilizar el
rango como medida de variación cuando al menos uno de sus elementos es una observación En el ejemplo 3.8 de la página 111, se detc"nnin6 que Ql = 29.0 Y Q3 = 32.7, para estos da-
extrema. tos. De nuevo con la ecuación (3.8),
Rango intercuartil = 32.7 - 29.0 = 3.7
El intervalo 29.0 a 32.7 suele recibir el nombre de mitad central. Esta es la dispersión media
f'GURA 3.5
o rango inlcrcuartil de los rendimientos totales a un año que obtuvo la mitad untra/ de los
Comparación de tres O
conjuntos de dolos O
17 fondos de acciones generales nacionales con cargos de venta pagados por los activos de
los fondos.
que tienen rengas iguales
O
O
O
8
O
O
O O
7 8 9 11 12 13
• Varianza y dl'n'iaci6n estándar Aunque el rango cs una medida dc la dispersión to-
Balanza A lal y el rango intcrcuartil es una medida de la dispersión media, ninguna de estas medidas
de variación toma en cuenta cómo se distribuyen o se agrupan las observaciones. Dos me-
O didas de variación de uso común que sí (oman en cuenta la distribución dc los valore." de
O
O los datos son la varianza y su raíz cuadrada, la desviaci6n est6ndar. Estas medidas evalúan
O
O O O O O 8 8, la mancra en que fluctúan los valores respecto a la media. La varianza de la muestra es ca.

"ZÚ
, , si el promedio de los cuadrados dc las difcrencias ~ntre cada observación en un conjunto
¡ 8 9 13
de datos y la media.
Entonces, para una muestra que contiene n observaciones. Xl>X2• X) •..• X". la varianza
Balanza B
de la muestra (representada por S2) puede escribirse como
O , (X, - K¡' +
S = --------------
(X, - K¡' + (X, - X¡' + ... + (X. - X¡'
O O
O O 0-1
O O
O O Si se usa la notación de suma. esta fórmula se puede expresar como sigue.
O O O
7 8 9 10
Varianzo de la muestro
Balanza e La vlIriam.3 de la muestra es la suma de los cuadrados de las diferencias con rela-
ción a la media aritmética dividida entre el tamaño de la muestra menos 1.

• Rango intercuartil El rango intercuartil (también llamado dispersión media) es la I(x, - K¡'
diferencia entre el primu y tuur cuartilen un conjumo de dalaS. S- - ;-. (3.9)
0-1
donde
Rango intercuartil x = media aritmética de la mue.')tra
n = tamaño de la muestra
El rango intercuartil se obiiene al restar el primer cuartil del tercer euartil.
X¡ = j-ésima observación de la variablc alcatoria X
Rango intercuartil = Q3 - Ql (3.&)
i
¡•••
,
(XI - 'X)2 = suma ~ los cuadrados de las diferencias entre los valores Xi y la
media X
Esta medida considera la dispersión de la mitad (parte cenlJ'al) de los datos; por tanto. los va-
lores extremos no influyen en ella. El ejemplo 3.11 ilustra el cálculo del rango intercuartil. Si el denominador fuera n en lugar de n - 1, se obtendrfa el promedio de los cuadrados
de las diferencias con respecto a la media. Sin embargo. se utiliza n - I debido a ciertas
propiedades matemáticas deseadas que ticne el estadístico 52. las cuales lo hacen apropia-
. Ejemplo 3. j j CálCl/lo del ral/go ¡nterc'l/aria do para hacer inferencias estadísticas (que se estudiarán en el capítulo 5). Al aumentar el
tamaño de la muestra. la diferencia entre n y n - 1 disminuye cada vez más.
Utilice el arreglo ordenado de los rendimientos totales a un año de los fondos de valores ge- Ahora enfocaremos nuestm atención en la medida más práctica, la desviación están-
nerales nacionales con cargos de venta pagados por los activos de los fondos (véase el ejem- dar de la muestra. Esta medida, representada por el símbolo 5. es la raíz cuadrada de la
plo 3.3 en la página 107) para calcular el rango intercuartil. varianza de la muestra. Se expresa de la siguiente manen!.

114 CAI'ITULO 3 RESUMEN y DESCRIPCIÓN DE DATOS NUM~RICOS MEDIDAS DE TENDENOA CENTRAL, VARIA06N y FORMA I1S
Desviación estándar de la muestra Rendimientos totales a un año
fo1o<1>OSm: ACCIO:"F.S
La desvinción estándar de la muestra es la raíz cuadrada de la suma' del cúadmdo de las G~:NERAI.F.s NAClONo\CES X, X (X, - X) (Xi - x"i
diferencias con relación a la media aritmética. dividida entre el tamaño de la muestra'
Amcore Vinlage Equity XI = 32.2 29.86 +2.34 5.4756
menos l.
Baron Funds Asset Xl = 29.5 29.86 -0.36 0.1296

.l.'2: (X, - "X¡' Berger SmCoGrow


Chicago Trust Growlnc
X)::: 29.9
X. = 32.4
29.86
29.86
+0.04
+2.54
0,0016
6.4516
s= (3.10)
Dodgc: & Cox DominiSo Xj = 30.5 29.86 +0.64 0.4096
n - 1
Federated Instilul MaxCapSvc Xli= 30,1 29.86 +0.24 0,0576
Fir.;1Funds Orolne III X, = 32.1 29.86 +2.24 5.0176
Los pasos para calcular la varianza y la desviación estándar de la muestra se presentan en Harris Insighl ¡nSI Haven Ka::: ]5.2 29.86 +5.34 28.5156
el cuadro 3.1. Mentor Merger X9 = 10.0 29.86 -19.86 394.41%
Rainler Reich Tang Km = 20.6 29.86 -9.26 85.7476
r-'y Robertson Stcphens ValGrnw XII =28.6 29.86 -1.26 1.5876
)..' Cuadro 3.1 Cálculo de 52 y S SSgA S&P500Idx Xl2 = 30.5 29.86 +0.64 0.4D96
Poro calcular 52, lo varianza de lo muesfro, realice lo siguiente: SSgA SmallCap Xu = 38.0 29.86 +8.14 66.2596
,¡ 1. Obtengo lo diferencio entre codo observación y lo' medio. 1784 Growlnc XI. = 33.0 29.86 +3.14 9.8596
.1 2. Eleve codo diferencio 01 cuadrado. SUlgecoach CorpStk XIS = 29.4 29.86 -0.46 0.2116

4/' 3. Sume lodos los cuod~odos de los diferencias.


Westwood Eq R XI6 = 37.1 29.86 +7.24 52.4116
Wright Yacktman Xl7 = 28.6 29.86 -1.26 1.5876
,¡ 4. Divido el total entre n-l.
TOlal O" 658.5592
Paro cokulor S, lo desviación estóndar de lo muestro, ob!engo lo raíz cuadrada de lo
varianza. ¿(X, -l.') ¿(X, -l.')'
l.' ,.,
"El rtsuf/ado d[fit;t dt O por tI rtdondto.
Estos pasos se aplicarán a los datos de los fondos de acciones generales nacionales del ejem-
plo 3.12.
658.5592
=-1-6-

= 41.15995
Ejemplo 3.12 Cálcnlo dc la varianza J la desviación
estándar de la muestra De la ecuación (3.10), la desviación estándar de la muestra S se calcula como
Para la muestra que contiene 17 fondos de acciones generales -con cargos de venta paga-
dos por los activos de los fondos-, los dalaS sin procesar de los rendimientos totales a un t(X I- "X¡'
año son los siguientes. s=vs-= ,.,
n - 1
= \/41.15995 = 6.42
32.229.529.932.4 30.5 30.1 32.1 35.2 10.020.628.630.538.0.33.029.4 37.1 28.6
La media aritmética de estos datos se calcula como X = 29.86. Calcule la varianza de la
muestra S2 y la desviación estándar de la muestra S. Al realizar los cálculos del ejemplo 3.12, las diferencias entre cada observación y la me-
SOLUCIÓN
dia se elevaron al cuadrado; por tanto, la varianz.ay la d~sviación estdndar no pueden su
ntgalivas. Para que S2 y S fueran iguales a cero no debena existir ninguna variación en los
Siga el procedimiento de cuatro pasos para calcular la varianza S2 con base en la tabla pre- datos, es decir, lodas las observaciones en la muestra debenan ser exaClamente iguales. En
sentada cn la página 117. este improbable caso, el rango y el rango imercuartil (intervalo entre cuartiles) también se-
A partir de la ecuación (3.9), la varian7.ade la muestra es nan iguales a cero.
Pero los datos numéricos, por naturaleza, son variables no constantes. Cualquier fenóme-

S2 =
2:(X¡ -
~¡.~, _
"XJ' no alcatorio de interés puede adquirir una amplia variedad de valores. Por ejemplo, diferen-
tes fondos d~ acciones generales obtienen distimos rendimientos a un año, y además presen-
n-I tan diferentes valores de activos y tasas de gaslos. Entonces. la importancia dc estudiar, no
sólo las medidas de tendencia central que resumen los datos, sino también las medidas de
= (32.2 - 29.86)' + (29.5 - 29.86)' + (29.9 - 29.86)' + ... + (28.6 - 29.86)'
variación que reflejan la dispersión de los datos numéricos. se debe a esa variación intrínseca
IJ - 1
de los datos.

116 C,ulTln.o 3 RESUMEN y DESCRIPCIÓN DE DATOS NUMÉRICOS MEDIDAS DE TENDENCIA CENTRAL, VARIACiÓN Y FORMA lli
Los cuadrados de las desviaciones respectivas de los 17 fondos de acciones generales se
COMENTARIO: JnlerpT~/nci6n d~ la variallZtl y d~sviaci6n l!stándar
. presentan en la última columna de la tabla del ejemplo 3.12 de la página 116. Note que la
La varian7.8 y la desviación estándar miden la dispersión "promedio" alrededor de la me- observación en la posición 9, X9 = 10.0, lograda por Mentor Merger, es 19.86 menor que
dia: cómo fluclúan las observacione.~ mayores arriba de ella y las observaciones menores la medida del rendimiento medio de 29.86 y observación 10, XLO = 20.6, que obtuvo Rainler
abajo de ella. La varianza posee ciertas propiedades matemáticas útiles. Sin embargo, su Reich Tang, es 9.26 más baja. En el proceso de elevar al cuadrado, ambos valores, junto con
cálculo se expresa en unidades al cuadrado, porcentajes cuadrados, dólares al cuadrado, las observaciones 13 y 16 (SSgA SmallCap y Westwood Eq R), contribuyen mucho más en
pulgadas cuadradas, etc. Por tanto, la medida principal de la variación será la desviación el cálculo de SZ y S de lo que contribuyen otras observaciones en la muestra que están más
e.~tándar, cuyos valores se expresan en las unidades originales de los datos, tales como cercn de la media. Por tanlo, es posible hacer la generalización presentada en el cuadro 3.2.
rendimientos, dólares o pulgadas.

La desviación estándar indica cómo se agrupa o distribuye un conjunto de datos alrededor Cuadro 3.2 Camprensión de la variación en las datos
de la media. Para la mayor parte de los conjuntos de datos, la mayoría de los valores obser- ./ 1. Cuanto más dispersos estén los datos, mós aumenfaró el rango, el rango inter.
vados C<'lendentro de un intervalo que corresponde a la media arit,!!ética más/menos una cuartil, lo varianza y lo desviación estóndar.
desviación estándar. Esto implica que el intervalo comprendido entre X:t IS, por lo general, ./ 2. Cuanto mós concenlrodos, u homogéneos, seon los dolos, disminuiró el rango,
incluye al menos una mayoría de los valores de los datos. POr consiguiente, el conocimiento el rango infercuartil, la varianza y lo desviación esfándar.
de la media aritmética y la desviación estándar ayuda a definir en d6nde se agrupan la mayor
./ 3. Si los observaciones son todos iguales (de manero que no hoy variación en los
parte de los dalas.
dalas), el rango, el rango inferclIOrtil, lo varianza y lo desviación esfóndor se-
rón iguales o cero .
./ 4. las medidos de variación (rango, rango intercuartil, varionza y desviación es-
.COMBNTAHIO: Qué indica la desviación esJándar
fóndar) nunca son negafivos.
En la muestra que contiene 17 fondos de acciones generales (con cargos de venta paga.
dos por los activos de los fondos) la desviación estándar de los rendimientos totales a un
año es 6.42. Esto indica que los rendimientos totales a un año para la mayor parte de las • Coeficiente de PQriación A diferencia de las medidas que hemos estudiado hasta aho-
acciones de los fondos en esta muestra se agrupan dentro de 6.42 alrededor de la media ra, el coeficiente de variación es una indicación Telatipa de la variación. Siempre se ex-
de 29.86 (es decir, se agrupan entre X - IS == 23.44 Y X + IS:; 36.28). De hecho, se presa como porcentaje, no en ténninos de las unidades de los dalas específicos.
observa que 76.5% de los rendimientos letales a un año de los fondos (13 de los 17) se El coeficiente de variación, denotado por el símbolo ev, mide la dispersión en los datos
encuentran en eSle intervalo.
con relación a la media y se calcula como se indica a continuación.

Cabe indicar que las fónnulas para la varianza y desviación estándar [ecuaciones (3.9) y Coeficiente de variación
/
(lIO)} no se pueden ulilizar
El coeficiente de variación es igual a la desviación estándar dividida entre la inedia
" aritmética, multiplicada por 100 por ciento.
¿(X, - Xl
'o,
como numerador porque, como se recordará, la media actúa como punto de balance para ob. CV = (~)\OO% (3.11)

'Vloft lo prudxl ti' tt servaciones mayores y menores que ella. Asr, la suma de las desviaciones respecto a la me.
apim/iu B. dia siempre es cero; I es decir, donde

s = desviación eslándar de un conjunto de datos numéricos


X = media aritmética de un conjunto de datos numéricos

Para demostrareslo, recuerde de nuevo el ejemplo 3.12 en la página 116. En la cuarta co-
lumna de la tabla se observa que la suma de las diferencias entre cada valor y la media [es El ejemplo 3.13 ilustra el cálculo del coeficiente de variación.

decir, :¿" (XI


,., - X)} es igual a cero, excepto para el error de redondeo. La suma de los cuadra.

dos de las desviaciones permite estudiar la variación en los datos. Entonces se usa la fórmula
: Ejemplo 3.13 Cálculo del coeficiente de variación
Para la muestra que contiene los 17 fondos de acciones generales nacionales (con cargos de
venta pagados con los activos de los fondos), los dalos sin procesar de las tasas de rendi-
miento total a un año (en porcentaje) son
para calcular la varian7.a y la desviación estándar. En el proceso de elevar al cuadrado, las 32.229.5 29.9 32.4 30.5 30.\ 32.1 35.2 10.020.628.630.538.033.029.437.\ 28.6
observaciones que se encuentron más lejos de la media adquieren más peso que las más cer- Calcule el cocficie~te de variaci6n.
canas.

118 C"rfTUJ..o3 RESUMEN y DESCRtPCIÓN DF.. DATOS NUMÉRICOS


MEorOAS DE TENDENCIA CENTRAL, V•.••RIACI6s y R)RMA 119
f

SOLUCiÓN SOLUCI6N
En estos dalos. la tasa media de rendimiento total a un año X es 29.86, y la desviación están- "En lénninos de las desviaciones estánd:lr, el precio de las acciones de A parece más volátil
dar S es 6.42. Al aplicar la ecuación (3.11) se liene que el coeficiente de variación es que el de las acciones de B. Sin embargo. como los precios promedio por acción de las dos
compañías son tan diferentes, seria más conveniente que el inversionista potencial conside.
Cv = (i)100% ~ (;;~~)IOO%~ 21.5% rara la variabilidad en precio respecto al promedio a fin de examinar la volatilidad/estabili-
dad de ambas acciones.
Paro este ejemplo, el tamaño relativo de "la dispersión media alrededor de la media" con re- Para la compañía A, el coeficiente de variación es CVA = ($101$50)100% = 20.0%; para
lación a la media es 21.5 por ciento. la compañía B, el coeficiente de variación es CVB = ($41$12)100% = 33.3%. Entonces, en
relación con la media, el precio de las acciones B es mucho más variable que .el de la~ acciQ-
nes A.
Como medida relaliva. el coeficiente de variación resulta especialmentc útil cuando se
compara la variabilidad de dos o más conjuntos de datos, que se expresan en diferentes uni-
dadcs de medida. Esto se mucstra en el ejemplo 3.14.
Forma
- - ----" La lercera propiedad importante de un conjunto de dalOs es su fonna, es decir, la manera Cll
Ejemplo 3.14 Comparación de dos coeficientes de variación que se distribuyen los datos. La distribución de los dalas es simélrica o no lo es. Si no es si-
métrica, recibe el nombre de distribución asimllrica o sesgada.
Suponga que el gerente de operaciones de un servicio de paquetería desea adquirir una nue- Para describir la fonna. solamente se deben comparar la media y la mediana. Si ambas
va flotilla de vehículos. Cuando los paquetes se guardan con eficiencia en el interior de los medidas son iguales. por lo general se considera.que los datos son simétricos (o con usgQ
vehículos -durante la preparación de [as entregas-, se deben considerar dos restricciones aro). Por el contrario, si la media excede a la medinna, los dalas se describen como sesga-
principales: el peso (en libras) y el volumen (en pies cúbicos) de cada paquete. dos a la derecha. o con sesgo positivo. Si la mediana excede a la mcdia. los datos suelcn lla-
Ahora suponga que en una muestra de 200 paquetes, el peso promedio es 26.0 libras con marse sesgados ala i7.quierda, o con sesgo negoti\,o. Es decir,
una desviación estándar de 19 libras. Además. suponga que el volumen promedio de cada
paquete es 8.8 pies cúbicos con una desviación eslánd3r de 2.2 pies cúbicos. ¿Cómo se pue- media> mediana: sesgo positivo o a la derecha
de comparar la variación del peso y el volumen? media = mediana: simetría o sesgo cero

SOWCIÓN
media < mediana: sesgo negativo o a la izquierda

Como las unidades de medida difieren para las restricciones de peso y volumen. si el gerente El sesgo posilivo surge cuando la media aumenta debido a algunos valores grandes y po.
de operaciones desea comparar las fluctuaciones en estas medidas, debe considerar la varia- ca usuales; el sesgo negativo ocurre cuando la media se reduce debido a algunos valores
bilidad relativa en ambos tipos de medidas. Para el peso, el coeficiente de variación es muy pequeños. Los datos son simélricos cuando en realidad no hay valores extremos en nin-
CVw = (3.9126.0)100% = 15.0%; para el volumen. el coeficienle de variación es CVv guna dirección. de tal manera que los valores grandes y pequeños se equilibran.
= (2.218.8)100% = 25.0%. Entonces. con relación a la media, el volumen de un paquete es La figura 3.6 muestra la fonna de tres conjuntos de datos. Los datos en el cuadro (a) tienen
mucho más variable que su peso. sesgo negativo o a la i7.quierda. Se observa una cola larga y una distorsión hacia la izquier-
da. causada por valores en extremo pequeños. Estos valores tan pequeños jalan la media ha-
cia anajo y resulta menor que la mediana.
El coeficiente de variación es muy útil cuando se eomparan dos o más conjuntos de dalas
que se miden con las mismas unidades. pero son tan diferentes que una comparación directa
de las desviaciones estándar respectivas no ayuda mucho. Esl0 se ilustra en el ejemplo 3.15.

,,
Ejemplo 3.15 Comparación de dos coeficientes de variación ,,
Suponga que un inversionista potencial piensa adquirir acciones en una de dos compañfas, A
,,
o B.listadas en la Bolsa de Valores de Nueva York. Si ninguna de las compañías ofreee di.
,,
videndos a sus clientes y ambas lienen igual clasificación (según varios servicios de inver-
, ~ ,
(JlI Sesgo negativo o a la izquierda \ lb) Simétrico
sión) en téoninos de crecimiento potencial. el posible inversionista quizá considere la volati.
Iidad (variabilidad) de ambas acciones para ayudar en la decisión de inversión.
Ahora suponga que cada acción en la compañía A ha promediado 50 dólares en los últi. FIGURA 3.6 . Comparación de tres conjuntos de dolos cuyo f~mo difiere
mas meses, con una desviación estándar de 10 dólares. Además. suponga que durante el
mismo periodo el precio promedio de las acciones en la compañía B fue de 12 dólares con
Los dalas en el cuadro (b) son simétricos; cada mitad de la curva es la imagen de espejo
una desviación estándar de 4 dólares. ¿Cómo puede delenninar el inversionista cuáles acciQ-
de la otra mitad. Los valores grandes y pequeños se compensan y la media es igual a la me-
nes son más variables?
diana. Los datos en el cuadro (c) tienen un sesgo positivo o a la derecha. Se observa una cola

120 CAl1nsl.O 3 RESUMf ••'Il y DESCRIPCiÓN I)EOATOS NUM£RICOS MEDIDAS DE TE."mENCIA CENTRAL. VARIACiÓN Y FORMA 121
larga hacia la derecha de la distribución y una distorsión hacia I~ dere:ha, e.ausada por valo~ • Salida de Microsoft Ercel La figura 3.7 representa la infonnación de salida que se ob-
res muy grandes. Estos valores en extremo grandes jalan la medlll hac~a amba y resulta ma- tuvo con la opción "estadística descriptiva" de la 'herramienta de análisis de datos de
yor que la mediana. En el ejemplo siguiente se analiza cómo se detenmnan estas foonas. Microsoft Excel.
El ejemplo 3.16 ilustra cómo determinar la forma de un conjunto de datos. Excel proporciona la media (aritmética), la mediana, la moda, la desviación estándar, la
varianza. el fango (mínimo, máximo) y el conteo (tamaño de la muestra), que se analizaron
en esta sección, Además, Excel calcula el error estándar (indicado como error típico), junto
Ejemplo 3.16 Determinación de la forma de ~m'conjunto con los estadísticos de curtosis y sesgo. El error estándar es la desviación estándar dividida
de dalos . entre la raíz cuadrada del tamaño de la muestra y se estudiará en el capítulo 5. El sesgo es
una medida de falta de simetóa en los datos y se basa en un estadístico que es una función
Para la muestra que contiene Jos 17 fondos de acciones generales con cargos de ventas pag_a- del cubo de las diferencias alrededor de la media aritmética. El curlosis es una medida de la
dos con los activos de los fondos, los datos sin procesar de los rendimientos totales a un ano concentración relativa de valores en el centro de la distribución comparado con las colas, y
son se basa en las diferencias alrededor de la media aritmética elevadas a la cuarta potencia. Esta
32.229.5 29.9 32.4 30.5 30.1 321 35.2 10.020.628.630.5 38.033.029.437.1 28.6 medida no se estudia en este libro (véase la referencia 4).
Y los datos se presentan en el diagrama de puntos de la figura 3.1 en la página 106. ¿Qué se
puede decir de la forma de estos datos? Salida de Minitab La figura 3.8 representa las estadísticas descriptivas (que se obtuvieron
con Minitab) para los rendimientos totales a un año de los fondos de acciones generales na-
SOLUCIÓN cionales, que se clasificaron de acuerdo con la lista de cargos.
Observe que hay un valor extremo en este conjunto de datos, y las 17 observaciones no se
agrupan en fomla simétrica alrededor de la media aritmética. El rendimi~nt? porcentual total
Descriptive Statistics
a un año (10.0) que obtuvo Mentor Merger es mucho menor que el rendimiento de todos los
fondos restantes de la muestra. En el ejemplo 3.1 de la página 105, la mediana calculada fue
29.86. En el ejemplo 3.3 de la página 107 la mediana fue 30.5. Por ta.nto, debido a ~ue la Variable GI:OUP 11 Mean 'ledian TrUean StDev
lYr~Ret 1 17
media es menor que la mediana este conjunto de datos puede ser descnto como negativo, O 29.86 30.50 30.65 6. '12
2 S 31.22 30. '10 31.22 2. '12
sesgado a la izquierda. 3 19 32 .'18 30.50 32 .oe 5.97
4
S "
107
32.035
31.111
31.'100
30.500
31.929
30.93'1
6. '1'15
5.065

Val:ÍsIJ le GI:OUP SE 'leen HlnlmUlll HaxiroUI~


Interpretación de las estadísticas descriptivas que se obtienen 1 Yr%R~t 1 1. 56 10.00 38.00
"
"
DO
03
32 .70
con Microsoft Excel y Minitob 2 1. OS 29.60 35. SO SS 33.00
Ahora que hemos analizado las características de la tendencia central, variación y f~rma, po- 3 1. 37 23.80 '18.00 "
28.70 3'1.70
4 0.950 19.200 '16.600 27.875 34.625
demos examinar las estadísticas descriptivas de los rendimÍentos totales a un ano que se S O. '190 17.700 '18.600 28.800 32.900
obtuvieron (para la muestra de 17 fondos de acciones generales nacionales) con Microsoft
Excel. FIGURA 3.8 Estadisticas descriptivas de Minitob para los rendimientos totales a un año
(en porcentaje) que obtuvieron los fondos de acciones generales clasificados según lo
lista de cargos
FIGURA3.7
Estadísticas descriptivas de
los rendimientos totales a un Las cinco clasificaciones respectivas de la lista de cargos son: cargos pagados por los ac-
año de una muestro de l7 tivos de los fondos, cargos diferidos, cargos de venta directa, cargos múltiples y fondos sin
fondos de acciones generales
cargo. Se observa que para cada clasificaci6n de la lista de cargos, Minitab calcula el tamaiío
nacionales, la cual se obtuvo
con Microsoft Excel
de muestra n, la media (aritmética), la mediana, la desviación estándar (abreviada como St-
Dev), el mínimo, el máximo y los cuartiles primero y tercero, que se estudiaron en esta sec-
ción. Además, Minitab calcula la media truncada (abreviada como TrMean), que recorta
posibles valores extremos con la eliminación del 5% mayor y menor de las observaciones y
promedia los valores restantes. Además, Minitab calcula el error estándar de la media
(abreviado SE Mean), que es igual a la desviación estándar dividida entre la raíz cuadrada
del tamaño de la muestra. Esto se estudiará en el capítulo 5.
En la figura 3.8 parece haber muy poca diferencia entre la medIa, la mediana, el primer
cuartil y el tercero de los rendimientos totales a un año para los diferentes tipos de cargos,
con excepción de la media para los cargos pagados con activos de los fondos. La desviación
estándar de los fondos con cargos diferidos es bastante menor que la desviación de los otros
grupos.

122 CAPÍTULO 3 RESUMEN y DESCRIPCIÓN DE DATOS NUMÉRICOS


MEDIDAS DE TENDENCIA CENTRAL, VARIACIÓN Y FORMA 123
'n
¡ti


Aplicación de conceptos
Problemas para la sección 3.2
3.7 El gerente de operaciones de una planta que fabrica llantas desea comparar el diámetro
Aprendizaje de conceptos básicos interno real de dos clases de llantas, los cuales se espera que sean de 575 milímetros. Se
seleccionó una muestra de cinco llantas de cada clase, y los resullados que representan el
3.. De acuerdo con el siguiente conjunto de datos de tina muestra de tamaño 11::= S:
diámetro interno de las llantas, ordenados de menor a mayor, son:
7 4 9 2 Clase X Clase Y
(a) Calcule la media, la mediana, la moda, el rango medio y eje medio. 568 570 575 578 584 573 574 575 577 578
(b) Calcule el rango, rango intercuartil. v.arianza, desviación estándar y coeficiente de va- (a) Para cada clase de llantas, calcule
riación. (1) la media aritmética (2) la mediana (3) la desviaciónestándar
(c) Describa la fOlma. (b) ¿Qué clase de llanta proporciona la mejor calidad? Explique.
• 3.2 De acuerdo con el siguiente conjunto de datos de una muestra de tamaño 11 = 6: (e) ¿Cuál sería el efecto en las respuestas de (a) y {b) si el último valor para la clase Y
fuera 588 en lugar de 578? Explique.
7 4 9 12
3.8 Cada mes el gobierno federal reporta la mediana de los precios de Ins casas que se ven-
(a) Calcule la media, la mediana, la moda, el rango medio y eje medio. den en Estados Unidos. Los economistas consideran esta estadística como un indicador
(b) Calcule el rango, el rango intercuartil, la varianza, la desviación estándar y el coefi- económico importante.
I ciente de variación. (a) ¿Cuál cree que es mayor, la mediana o la media aritmética?
I (b) La distribución de Jos nuevos precios de las casas ¿es sesgada o aproximadamente
(e) Describa la forma.
• 3.3 Con base en el siguiente conjunto de datos de una muestra de tamaño Il = 7: simétrica?
(e) ¿Por qué cree usted que se reporta la mediana y no la media aritmética?
12 7 4 9 o 3.9 La siguiente tabla contiene una muestra aleatoria de 30 fondos mutuos -que se tomaron
(a) Calcule la media, la mediana, la moda, el rango medio y el eje medio de 6,858 fondos mutuos--- publicados en el diario USA Today el 2 de febrero -de 1999.
(b) Calcule el rango, el rango intercuartil, la varianza, la desviación estándar y el coefi- Para cada fondo, el rendimiento anual se da como porcentaje.
ciente de variación.
RENDIMIENTO RENDIMIENTO
(c) Describa la forma.
FONDO MUTUO ANUAL{%) FONDO MUTUO ANUAL (%)
3.4 Dado el siguiente conjunto de datos de una muestra de tamaiio n = 5:
Advuntus Bond 0.2 Federated CAMunA 08
7 -s -8 9
Aim Funds HYJdC 1.4 Federated MtgFdSS 0.5
(a) Calcule la media, la mediana, la moda. el rango medio y el eje medio Amer Advant StrMod 1.0 Fide1ity Chemical -4.3
(h) Calcule el rango, el rango intercuartil,}a varianza, la desviación estándar y el coefi- Artision Funds SmCap -5.2 FirstAmerican LgCap 5.5
ciente de variaciÓn.
CalifTnrst S&P500 J.8 Firth Third Balanced 1.7
(e) Describa la forma.
3.5 Dado el siguiente conjunto de datos de una muestra de tamaño Il = 7: Colonial Balance 2.5 Kemper AggGrB 1.4
,,. Colonial Income 06 Merrill Lynch CaMA 1.1
J J J
Delaware Tx USA 0.9 Nicholas Group Nich -0.7
(a) Calcule la media, la mediana, la moda, el rango medio y el eje medio. Dimension EmgMkt -1.1 North Amer GIEqB -1.1
(b) Calcule el rango, el rango intercuartiJ, la varianza, la desviación estándar y el coefi- Dodge&Cox Stock ~O.l One Group AstAJ 1.0
ciente de variación.
Dreyfus FMLA 06 Prudential Eqincm 0.6
(e) ¿Qué hay de raro acerca de este conjunto de datos?
• 3.6 Con base en los siguientes conjuntos de datos, cada uno con muestras de tamafio !l = 7: Dreyfus OHMA 1.0 Putnam Income 0.5
Eaton CIMB 0.9 SoGen Funds Gold JO
Conjunto 1: 10 2 J 2 4 2 S
Empire TfBond
liI
ARCHIVO
09 ren-IPleton GIBdA -0.5
Conjunto 2: 20 12 13 12 14 12 15 DE DATOS
Evergreen GLLeadB -1.0 Van Kamp EGB 9.6 YTD
(a) Para cada conjunto, calcule la media, la mediana, la moda, el rango medio y el eje F¡¡ellle: USA roday. 2 de febrero de 1999 Copyright @ 1999 por USA Today. Reproducido COllpermiso.
medio.
(b) Compare sus resultados y resuma sus hallazgos. (a) Calcule la media aritmética, la mediana, el.rango y la desviación estándar para el
(e) Compare el primer elemento muestreado en cada conjunto, compare el segundo ele- rendimiento anual. Interprete estas medidas de tendencia central y de variabilidad.
mento muestreado en cada conjunto, y así sucesivamente. Describa en forma breve (b) ¿Cree que los primeros 32 días dé 1999 fueron días buenos, malos o indiferentes
lo que encuentre aquí tomando en cuenta su resumen en (b). para los fondos mutuos? Justifique su respuesta.
(d) Para cada conjunto, calcule el rango, el rango intercuartil, la varianza, la desviación 3.10 Suponga que, por error, un conjunto de datos que.contienen la razón precio-ganancia
estándar y el coeficiente de variación (PG)'de nueve compañías que fueron negociadas en el American Stock Exchange se re-
(e) Describa la forma de cada conjunto. gistraron como 13, 15, 14, 17, 13, 16, 15, '16 Y,61, donde el último valor debió ser 16 en
(f) Compare sus resultados en (d) y (e) y dé sus conclusiones. lugar de 61.
(g) Con base en sus respuestas de (a) a (f), ¿qué puede generalizar acerca de las propie- (a) Muestre cómo afectó este error a la media, la mediana y el rango medio (es decir,
I dades de "la tendencia central, la variación y la forma? calcule estos estadísticos para los conjuntos de datos ''buenos'' y "malos", y compare los

I
li
resultados que se obtienen cuando se utilizan otros estimadores de tendencia central).

"

124 CAl'iTULO 3 ResUMEN y DESCRIPCIÓN DE DATOS NUMÉRICOS


MEDIDAS DE TENDENCIA CENTRAL, VARIACIÓN Y FORMA 125
'~
~

(b) Calcule el rango, e! rango inlercuartil, la varianza, la desviación estándar y el coefi- más de cinco minutos". Evalúe esta afirmación según los resultados obtenidos en el
inciso (a) .
. ciente de variación para el conjunto de datos con eITor (61); luego calcule de nuevo
los estadísticos con la corrección de la razón PO a 16. (d) Suponga que el gerente de la sucursal desea' garantizar cierto nivel de servicio duran-
(e) Analice las diferencias en los resultados del inciso (b) para cada medida de variación. te la hora pico de! ~Imuerzo, Un mal servicio durante un periodo específico redunda-
(d) ¿Qué medida en (b) parece más afectada por el error? ría en un pequeño pago monetario o un regalo para el cliente. ¿Qué tiempo de espera
(e) ¿Cómo describiría la fonna de! conjunto de datos con y sin el error? debería usarse como límite para pagar una pequeña cantidad o dar un regalo si la es-
• 3.11 Un fabricante de baterías para linterna tomó una muestra de 13 baterías en un día de pro- pera es mayor? E:w;pliquesu respuesta.
ducción y las usó hasta que se agotaron. Las horas que funcionaron hasta fallar son 3.14 Suponga que aIra SUCursal bancaria de una zQna residencial se preocupa por brindar la
AIl.CHIVO atención adecuada los viernes en la tarde, de 5 p.m, a 7 p.m. Se registró el tiempo de es-
lJE lJATOS 342 426 317 545 264 451 1,049 631 512 266 492 562 298
pera en minutos (definido como el tiempo desde que el cliente se forma en la cola hasta
BATlERIES
(a) Calcule la media, la mediana, la moda, el rango medio y el eje medio. Al observar que lo atienden) para todos los clientes en esta hora durante una semana. Se seleccionó

liI
la distribución de tiempos de falla, ¿qué medidas de ubicación cree usted que son una muestra aleatoria de 15 clientes y los resultados fueron: ARCIllVO
IlEDATOS
mejores y cuáles peores? ¿Por qué? BANK2
9.66 5.90 8.02 5.79 8.73 3.82 8.01 8.35 10.49 6.68 5.64 4.08 6,17 9.9] 5.47
(b) ¿De qué manera le sería útil esta infonnación al fabricante? Explique.
(e) Calcule e! rango, la varianza y la desviación estándar. (a) Calcule
(d) Para muchos conjuntos de datos el rango es aproximadamente seis veces la desvia- (1) la media aritmética (7) el rango
ción estándar. ¿Es cierto esto? (De no ser asÍ, indique la razón.) (2) la mediana (8) el rango intercuartil
(e) Si utiliza la información anterior, ¿qué consejo daría al fabricante para poder anun- (3) e! rango medio (9) la varianza
ciar que estas baterías "deben durar 400 horas"? (Nola: No hay respuesta correcta a (4) el primer cuartil (lO) la desviación estándar
esta pregunta; se trata de lograr que esta afinnación sea más precisa.) (5) el tercer cuartil (11) el coeficiente de variación
• ¿QUtSUCF.DESl?
(f) Suponga que el primer valor es 1,342 en lugar de 342. Repita el inciso (a) con este (6) el eje medio
valor. Comente las diferencias en los resultados. (b) ¿Están los datos sesgados? Si es aSÍ, ¿cómo?
(g) Repita los incisos (cHe) si el primer valor es igual a 1,342 en vez de 342. Comente (c) Un cliente que llega a la Sucursal a la hora del almuerzo, pregunta al gerente cuánto
• ¿QUÉ SUCEDE SI?
las diferencias en los resultados. tiempo tendrá que esperar. El gerente de la sucursal responde: "casi con certeza no
(h) ¿Cómo describiría la forma del conjunto de datos si el primer valor fuera 342? más de cinco minutos". Con base en los resultados del inciso (a), evalúe esta afirma-
(i) ¿Cómo describiría la forma del conjunto de datos si el primer valor fuera 1,342? ción.
3.12 Los siguientes datos son precios de renta mensual (en dólares) para una muestra de (d) Suponga que el gerente de una SUCursal bancaria desea garantizar cierto nivel de ser-
10 departamentos sin amueblar en el centro de una ciudad grande, y una muestra de 10 vicio durante las horas de la tarde del viernes. El hecho de no proporcionarlo dentro
departamentos sin amueblar en un suburbio: de un periodo específico significaría un pequeño pago monetario o un regalo para el
cliente. ¿Qué tiempo de espera cree que debería usarse como límite para pagar la pe-
Centro de la ciudad
queña cantidad o dar el regalo si Laespera es mayor? Explique su respuesta.
AllcHlvo
$955 $1,000 $985 $980 $940 $975 $965 $999 $1,247 $1,119
(e) ¿Qué argumentos se pueden dar que hicieran inapropiado comparar los tiempos de
IlE DATOS Suburbio
S'rUDlO espera en el problema 3.13 con los de este problema?
$750 $775 $725 $705 $694 $725 $690 $745 $575 $800
3.15 Durante los últimos 10 días de Junio, el tren "Especial Playa" llegó tarde a su destino de
(a) Para cada conjunto de datos, calcule la media, la mediana, el eje medio, el rango, el acuerdo con los siguientes retrasos (en minutos). (Un número negativo significa que el
rango intercuartil, la desviación estándar y el coeficiente de variación tren llegó antes, esa cantidad de minutos.) ARCHIVO
(b) ¿Qué puede decirse acerca de los departamentos no amueblados que se rentan en el DE DATOS

centro de la ciudad y los que se rentan en los suburbios? Compare las rentas en estas - 3 6 4 10 -4 124 2 -1 4 TRAIN

dos áreas. (a) Si e! ferrocamllo contrata a usted para demostrar que proporciona un buen servicio,
• 3.13 Una sucursal bancaria que se localiza en la zona comercial de una ciudad desarrolló un
¿qué medidas (de resumen para la tendencia central) usaría?
proceso para atender a sus clientes durante la hOra pico del almuerzo, dc 12:00 p.m. a
(b) Si lo contratara una estación de televisión que produce un documental para mostrar
1:00 p.m. Se registró el tiempo de espera en minutos (definido como el tiempo desde que
que el ferrocarril proporciona mal servicio, ¿qué medidas de resumen para la tenden-
el cliente se forma en la cola hasta que lo atienden) para todos los clientes que asisten en cia central utilizaría?
esta hora durante ulla semana, Se seleccionó una muestra aleatoria de 15 clientes y los
AIl.ClIlVO
(c) Si intentara juzgar en forma objetiva y sin prejuicios el desempeño de! ferrocarril,
resultados fueron: ¿qué medidas de resumen para tendencia central usaria? (Ésta es la parte más difícil
DE DATOS
BANKI porque no puede responder sin realizar suposiciones adicionales acerca de los costos
4.21 5.553.025.13 4.77 2.34 3.54 3.20 4.50 6,10 0.18 5.12 6.46 6.19 3.79
relativos de llegar con diversos retrasos.)
(a) Calcule (d) Calcule e! rango, el rango intercuartil, la varianza, la desviación estándar y el coefi-
(1) la media aritmética (7) el rango ciente de variación para "la demora" (en minutos).
(2) la mediana (8) el rango intercuartil (e) Analice la propiedad de variación de estos dalas.
(3) el rango medio (9) la varianza (f) ¿Cuál sería e! efecto en,sus conclusiones de los incisos (a) a (e) si el valor de 124
(4) el primer cuartil
(5) el tercer cuanil
(6) el eje medio
(10) la desviación estándar
(JI) e! coeficiente de variación
fuera incorrecto y debiera ser 12?
(g) Describa la forma de Los datos.
(h) Describa la fonna de los datos si el valor 124 se sustituye por 12.
III! ¿QUÉ SUCEDE SI?

(b) ¿Están los datos sesgados? Si es así, ¿cómo?


(c) Una clienta entra en la sucursal a la hora del almuerzo y pregunta al gerente cuánto
tiempo tendrá que esperar, Éste responde: "es casi seguro que no tendrá que esperar

126 CAPÍTULO 3 RESUMEN y DESCRIPCtÓN DE DATOS NU~ERICOS MEDIDAS DE TENDENCIA CENTRAL, VARIACiÓN Y FORMA 127
¡

SOl.UCIÓN
•• ANÁLISIS EXPLORATORIO DE DATOS En el ejemplo 3.3 de la página 107 la mediana fue 30.5. En el ejemplo 3.8 de la página 111
se calculó el primer cuartil en 29.0 y el tercero en 32.7. Por tanto, el resumen de cinco nú-
Una vez que hemos estudiado las tres propiedades más importantes de los datos numéricos
meros es
(tendencia central, variación y fonna), es importante identificar y describir las carnclensticas
principales de los dalos en fonna resumida. Un enfoque a este "análisis exploratorio de da- 10.0 29.0 30.5 32.7 38.0
tos" consiste en desarrollar un resumen de cinco lIúmtros y construir una gráfica de caja y Ahora utilizaremos el rcsumén de cinco números para estudiar la fonna de esta distribución.
bigoU's (referencias 6 y 7). De los lineamientos que se presentaron en los cuadros 3.3 y 3.4 es claro que los rendimien-
tos totales a un año -para la mueslra analizada- están sesgados a la izquierda porque la
Resumen de cinco números distancia de XlMrlOf a Ql (es decir, 19.0) supera en forma considerable a la dislancia de Q3 a
Un resumen de cinco números consiste en Xmuyor (esto es, 5.3). Ademá.<;,si se compara la mediana (30.5), el eje medio (30.85) y el ran-
X"",nnr QI Mediana Q3 Xmayor
go medio (24.0), se observa que el rango medio se mueve debido al valor extremo 10.0, yes
por mucho la más pequeña de estas medidas de resumen. El eje medio y la mediana. que son
A partir del resumen de cinco números se pueden obtener tres medidas de tendencia centrnl
resistentes a los valores extremos, tienen valores muy cercanos.
(la mediana, el eje medio y el rango medio) y dos medidas de variación (el rango intercuartil
y el rango) parn tener una mejor idea de la fonna de la distribución.
Si los datos son perfectamente simétricos, la relación entre las diveni3s medidas de locali.
zación puede eXpre5.1rsecomo se ve en el cuadro 3.3.
Diagrama de caja y bigotes
~ En su fonna más simple, un diagrama de caja }' higotes proporciona una rcpresemación
I
gráfica de los datos mediante el resumen de cinco números. El diagrama de caja y bigotes se
Cuadro 3.3 Uso del resumen de cinco números para describe en la figurn 3.9 para los rendimientos a un año que obtuvo la muestra de 17 fondos
reconocer la simetria de los da~s de acciones genernles nacionales con cargos de venta pagados por los aClivos de los fondos .
.1. 1, Lo distancio de 01 o lo mediano es igualo lo distancio de lo mediano o OJ. La línea vertical que está en el interior de la caja representa la ubicación del valor de la
./ 2. Lo distancio de ~ o 01 es igualo lo distancio de ~ o Xmay.;... mediana en los dalas. Observe que la línea vertical que está al lado izquierdo de la caja re-
./ 3. Lo mediol'lO,el eie medio y el rango medio son lodos iguales. (Estos inedidos presenta la ubicación de QI> y la línea vertical que está a la derecha de la caja representa la
también 50n iguales o lo medio de los dotas.} ubicacion de Q3' Sin embarga. podemos observar que la caja contiene un 50% de lns obstr-
vaciones que están en la mitad de la distribución. El 25% menor de los datos se representa
Por olra parte, si se trata de distribuciones no simétricas, la relación entre ambos tipos de por In línea punteada (un bigote) que conecta el lado izquierdo de la caja con el valor más
medidas se puede expresar como se indica en el cuadro 3.4. pequeño, Xmcnor. De manera similar, el 25% más alto de los datos se representa con una lí.
,. nea punleada que conecta el lado derecho de la caja con XmaYQr

Cuadro 3.4 Uso del resumen de cinco números para


reconocer a 105 datos no simétricos
./ 1. En distribuciones con sesgo o lo derecho, lo distancio de OJ o ~ excede
lo distancio de X_ o Q1 •
./ 2. En distribuciones con sesgo o [o derecho, lo mediano y el eje medio son meno-
(es que el rango medio. o ,o 15 20 25 30 35 40

./ 3. En distribuciones con sesgo o 10 izquierdo, lo distancio de x.-..or 0,01 excede Rendimientos totales a un año (~l
lo distancio de ~ o ~ .
./ 4. En distribuciones con 5CSgoo la izquierdo, el rango medio es menor que lo me- FIGURA 3.9 Diagrama de coio y bigotes que represento los rendimientos totales o un oño
diano y el eje medio. que obtuvieron los 17 fondos de acciones generales nocionales con cargos de ventas
pagados por los activos de los landos
Se determinará el resumen de cinco números en el ejemplo 3.17.

CO,"WNTARJO: lrllerpretaci6n del diagrama de caja y bigotes


Ejemplo 3.17 Determinación del resumen de cinco nlÍmeros La representación visual de los rendimientos totales a un año que se observa en la
Para la mueSlra que representa los rendimientos totales a un año que obtuvieron los 17 fon- figura 3.9 indica que la fonna de estos datos está sesgada a la izquierda. Aunque se
dos de inversión (con cargos de venta pagados por los activos de los fondos), el arreglo or- observa que la línea vertical de la mediana se encuentra inesperadamente cerca del
denado es lado izquierdo de la caja, también se ve que la longitud del bigote izquierdo es mu-
cho mayor que la longitud del bigote derecho. Esto ocurre debido al valor extremo
10.020.628.628.629.429.529.930.1 30.530.532.1 32.2 32.4 33.0 35.2 37.1 38.0
del rendimienlo total de 10.0 para Mentor Merger.
Establezca el resumen de cinco números para estos datos.
I•
128 CArlTUt.O 3 REsUMEN y DESCRIPCIÓN OF. DATOS NUMI!:RICOS 12'

l-
ANÁLISIS EXPLORATORIO DE DATOS
Para resumir lo antes expuesto sobre la representación gráfica de datos, la figura 3.10 Si el conjunto de dalas está sesgado a la derecha como en la figura 3.1O(c},las pocas ob-
muestra la relación entre los métodos de análisis exploratorio de dalas (el diagrama de caja y . ~rvaciones grandes desplazan el mngo medio y la media hacia la cola derecha. En tales ca-
bigotes) y las representaciones gráficas (los poHgonos). Se presentan cuatro tipos de dislri- sos. se esperaria tener la siguiente secuencia en las cinco medidas de tendencia central:
buciones con gráficas de cajalbigotes y los polígonos oorrcspondiente.c¡.
moda < mediana < eje medio < media < rango medio
Cuando un conjunto dc dalas es perfectamente simélrico, como en la figura 110(a) y (d),
la media. la mediana. el rango medio y el eje medio son iguales. Además, la longilud del bi. Pam el conjunto sesgado a la derecha en la figura 1O.3(c)la coneentraci6n de dalas está en el
gote izquierdo será igual a la longitud del bigote derecho. y la línea de la mediana dividirá a exlremo bajo de la escala (es decir, en el lado izquierdo del diagrama de caja y bigotes).
la caja en la mitad. En la práctica, resulta poco probable encontrar un conjunlo de datos per- Aquí, el 75% de los valores de los datos se encuentra entre el inicio del bigote izquierdo
fectamente simélrico. Sin embargo, se puede afinnar que un conjunto de dalaS es aproxima- (Xmenor) y el borde derecho de In caja (Q)), el 25% restante de las observaciones está disper-
damente simélrico si la••longiludes de ambos bigoles son casi idénticas y la línca mediana so entre el bigole derecho y el extremo superior de la escala.
divide a la caja casi a la mitad. En lugar de describir un diagrama horizontal de caja y bigotes de izquierda (pequeño) a
Por otro lado, cuando el conjunto de datos está sesgado a la i7.quierda como sucede en la derecha (grande). como en la figura 3.9 de la página 129, la salida del complemento PH$tat
figura 3.1O(b), las pocas observaciones pequeñas despla7.an el rango medio y la media hacia para Microson Excel presenta un diagrama vertical de abajo (pequeño) a arriba (grande). La
la cola izquierda. En estos casos, se esperana tener la secuencia siguiente entre las cinco me- figura 3.11 muestra el diagrama de caja y bigotes para los rendimientos totales a un año de
didas de tendencia ceniral: los 17 fondos dc acciones generales nacionales. el cual se generó con este complemento.
mngo medio < media < eje medio < mediana < moda
Pam esta dislribución hipotética con sesgo a la izquierda, se observa en la figurn 3.IO(b) que Bo. PI'" looOotneatic6_~ Slod.. Funds ~~

la naluraleza sesgada (es decir, distorsionada) del conjunto de datos indica que exisle una
densa aglomeración de observaciones en el extremo alto de la escala (o en el lado derecho); ~ ,

75% de los valores de los datos se encuentran entre el lado izquierdo de la caja (QI) y el ex- .. --- -- .. --
tremo del bigole derecho (Xmayor). Así. el bigote izquierdo de mayor longitud solamenle ~
contiene la distribución del 25% de las observaciones más pequeña ••; esto muestra la distor-
sión de la simetria en este conjunto de datos. ~ .

FIGURA 3. 'O Cuatro


distribuciones hipotéticos
~
examinados mediante sus I
ro
diagramas de cojo y
bigotes y los polígonos I
correspondientes. Nota: " I
el área boja cada polí- ..... -. .. .. I..y,~
gono esfó dividida en " I
cuorli/es que corresponden
01 resumen de cinco ~-------~-------j , I
ncimeros pora el diagrama (al Distribución en forma de campana
respectivo de caio y o
bigotes
FIGURA 3." Diagrama de cojo y bigotes de los rendimientos lotales o un año (en por-
centoies) poro 17 fondos de acciones generales nocionales, se obtuvo con el complemento
PHStot poro Microsoft Excel

Se observa que el complemento PHStal parn Microsoft Exceltraza un diagrama vertical


de caja y bigotes, en lugar del diagrama horizontal de la figura 3.9. La figura 3.11 contiene
una línea que conceL.1los valores mínimo y máximo.
~-----------~----I I----~-----------~ La figura 3.12 representa el diagrama de caja y bigotes lado a lado para los rendimientos
lbl Distribución sesgada a la izquierda (el Distribución sesgada a la derecha porcenluales a un año, que eslán clasificados por la lista de cargos. El diagrama se genero
con Minitab. La gráfica lado a lado es muy valiosa porque proporeiona una comparación en-
tre varios grupos. Aunque las medianas de los cinco grupos de pago de cargos parecen simi-

J i L lares, se observa que existen ciertas diferencias en los cuarliles primero y tercero, y diferen-
cias nmorias en los valores extremos. Además, parece claro que los grupos difieren, tanlo en
la variabilidad medida por el rango y el rango intercuartil, como en la foOlla. Observe que
~-----~-----j los asteriscos (*) en los grupos de la lista de cargos I (cargos pagados por los activos de los
(dI Distribución rectangular fondos), 3 (cargos de venta directa), 4 (cargos múltiples) y 5 (fondos sin cargo) indican la
presencia de valores extremos.

130 CAPITUI.Q 3 RESUMEN y DESCRIPCiÓN DE DATOS NUM~ICOS 131


ANÁtJSIS EXPt.ORATORIO DE DATOS
¡i FIGURA 3. J.2 Diagrama de Diagrama de caja de porcentaje de • (a) Proporcione el resumen de cinco números .
caja y bigotes lado o .Iado o rendimiento por grupo a un año (b) Construya el diagrama de caja y bigotes y d.escriba la forma.
I
: para los rendimientos totoles o
un año (en porcentajesl para ',. e ro'1-----------------c:,---, (e) Compare la respuesta del inciso (b) con la de! problema 3.11(h) en la página 126.
Analice.
• 3.22 Los siguientes datos representan los .rendimientos porcentuales anuales en cuentas de

1:
los fondos de acciones
mercado de dinero de una muestra de 15 bancos comerciales en el área metropolitana de

e¡ $.i
generales nacionales

~ ~ ó ~ ~ ,~
clasificados de según la listas Nueva York al 12 de febrero de 1997, un día antes de que el promedio indUstrial Dow
de cargos, que se obtuvo con J(mes pasara de 7,000 por primera vez:
Minitab NOMBREDELBANCO REND.CMD NOMRREDELBANCO REND.'CMD
.~ Banco Popular 3.10 Aeet Bank 2.28
E BankofN,Y. 2.63
•15 10,'-_~---~--~---~-_--,--.J
Key Bank ofN.Y. 101
Bank of Tokyo-Mitsubishi 3.05 Marine Midland 2.73
Q.."Grupo
Chase Manhattan 2.79 North Fork Bank 2.53
, Citibank 3.25 PNCBank(N.J.) 2,00

!, Problemas para la secClOn 3.3 CoreStates NJ National Bank 1.90 Republic Nationa1 3.05
I ARCHIVO
Aprendizaje de conceptos básicos EAB 2.79 $ummit Bank 2.02 Dl': DATOS
First Unían 2.90 MONEY MARKET
3.t6 Dado el siguiente conjunto de datos de un muestra de tamaño n = 5:
(a) Proporcione el resumen de cinco números
7 4 9 2
(b) Construya el diagrama de caja y bigotes y describa la forma.
(a) Proporcione el resumen de cinco números. (c) Si alguien le dijera: "]OSTendimientos del mercado de dinero no varían mucho de un
(b) ConstTUyael diagrama de caja y bigotes y describa la forma. banco a otro", con base en estos datos, ¿qué diría?
(c) Compare la respuesla del inciso (b) con la del problema 3.1(c) en la página 124. 3.23 Los siguientes datos representan los precios de renta mensual (en dólares) para una
Analice. muestra de 10 departamentos sin amueblar en el centro de una ciudad grande, y
• 3.11 Dado el siguiente conjunto de datos de un muestra de tamaño n = 6: una muesira de 10 departamentos sin amueblar en un suburbio:
l' 7 4 9 7 12 Centro de la ciudad

liI
AR.CHIVO
"

I (a) Proporcione el resumen de cinco números. $955 $1,000 $985 $980 $940 $975 $965 $999 $1,247 $1,119 DE DATOS

(b) Construya el diagrama de caja y bigotes y describa la forma. Suburbio STUDIO

(e) Compare su respuesta del inciso (b) con la del problema 3.2(c) en la página 124. $750 $775 $725 $705 $694 $725 $690 $745 $575 $800
Analice. Para cada una de las zonas:
• 3.18 Dado el siguiente conjunto de datos de un muestra de tamaño n = 7: (a) Proporcione e! resumen de cinco números.
12 7 4 9 7 (b) Construya el diagrama de caja y bigotes y describa la forma.
(a) Proporcione el resumen de cinco números.° 3.24
(e) ¿Diría que las distribuciones de las rentas en las dos áreas son similares? Explique.
Durante los últimos 10 días de junio, el tren "Especial Playa" llegó tarde a su destino
(b) Construya el diagrama de caja y bigotes y describa]a forma.
con los retrasos (en minutos) que se indican a continuación. (Un número negativo signifi-
(c) Compare la respuesta del inciso (b) con la del problema 3.3(c) en la página 124.
ca que el tren llegó antes esos minutos.) ARCHIVO
Analice.
3.19 Dado el siguiente conjunto de datos de un muestra de tamaño n = 5:
7 -5 -8 7 9
-3 6 4 10 -4 124 2 -1 4
(a) Proporcione el resumen de cinco números.
liI DE DATOS

TRAIN

(b) Construya el diagrama de caja y bigotes y describa la forma.


(a) Proporciones el resumen de cinco números. (c) Compare su respuesta del inciso (b) con la del problema 3.15(g) de la página 127.
(b) Construya el diagrama de caja y bigotes y describa la forma.


Analice.
(e) Compare la respuesta del inciso (b) con la del problema 3.4(e) en la página 124.
Analice.
OBTENCiÓN DE MEDIDAS DESCRIPTIVAS DE RESUMEN
3.20 Dado el siguiente conjunto de datos de un muestra de tamaño n = 7:
A PARTIR DE UNA POBLACiÓN
333
(a) Proporcione e! resumen de cinco números. En la sección 3.2 se examinaron varios estadísticos que resumen o describen información
(b) ¿Por qué no se puede construir un diagrama de caja y bigotes? numérica a partir de una muestra. En particular, estos estadísticos se utilizaron para describir
las propiedades de tendencia central, variación y forma.

11
AIlCHlVO
DE O"TOS Aplicación de conceptos Suponga, sin embargo, que el conjunto de datos al que se tiene acceso na es una muestra
BATTERIES
sino una colección de medidas numéricas de toda una población ..Por ejemplo, suponga .que
• 3.21 Un fabricante de baterías para linternas lomó una muestra de 13 baterías de un día de
una compañía proveedora de artículos de piorneda al mayoreo tiene 'una población de 50
producción y las usó hasta que se agotaron. Las horas que funcionaron hasta fallar son
facturas de venta en un día específico. La cantidad (en dólares) de esas facturas se ilustra en
342 426 317 545 264 451 1,049 631 512 266 492 562 298
-la tabla 3.2.

CAPÍTULO 3 RESUMEN y DESGRIPCIÓN DE DATOS NUMÉRICOS OBTENCiÓN DE MEDJDAS DESCRIPTIVAS DE RESUMEN A PARTIR DE UNA POBLACIÓN 133
Tabla 3.2 Cantidades para una poblaci61J de 50 facturas de venta • Vorianzo y desviación estóndor de la población
'La varianza de la población se representa por el símbolo ci. la letra griega minúscula sig-
127.43 372.68 349.03 213.45 326.55 148.93 213.54 409.61 211.01 290.87
ma al cuadrado. y la desviación estándar de la población se representa por el símbolo 0".
219.76 429.05 328.44 215.62 462.45 389.04 234.65 543.67 176.43
Eslas medidas se obtienen de la manera siguiente.
435.32
430.32
liiI
278.93 436.72 327.80 354.11 265.76 216.87 65432 345.45 213.65
ÁIICfIl\'n
399.05 324.55 451.23 287.60 219.06 214.54 278.96 378.90 368.02 319.06 Varianza de la población
lJEDU'OS
' VOUOlER 267.90 265.78 345.11 379.01 417.89 267.91 210.32 277.62 321.81 334.22
La varianl.a de la población es igual a la suma de los cuadrados dc las diferencias al-
rededor de la media de población. dividida entre el lamaño de la población.
Cuando se maneja un conjunlo de datos que conslituye una población completa. se calcu-
lan los parámetros de la población para la media aritmélica. la varianza y la desviación es- N

lándar. ¿(X, - ~)'


0"2 = "'-~l _ (3.13)
N
Media de población
La media de población se represenla por el símbolo J.L. la lelra griega minúscula muo y se donde
obtiene de la siguiente manera. N = tamaño de la población
Xi = i-ésimo valor de la variable aleatoria X
Media de población
La media de pohlación es igual a la suma de todos los valores de la población dividi.
da entre el tamaño de la población.
~.
i (X,, - pi = suma de los cuadrados de las dife,rencias entre los valores Xi y"J.l..
.

y la desviación estándar de la población es la miz cuadrada de la varianza de la pobla-


N
ción.
i_1
¿X,
~=--
N
(3.12)
Desviación estándar de la población
donde
N
N = lamaño de la población ¿(X, - ~)'
Xi = i-ésimo valor de la variable aleatoria X u= 1-' (3.14)
N
N
¿ Xi = suma de todos los'valores Xi en la población
l.' Se observa que las fórmulas pam la varianza y la desviación estándar de la población
difieren de las fórmulas de varianza y desviación estándar de la muestra en que (n - 1) del
El ejemplo 3.18 ilustra cómo se calcula una media de población. denominador de S2 y S [véase las ecuaciones (3.9) y (3. t O)en las páginas 115 y 116] se sus-
lituye por N en el denominador de O" y 0'2. El ejemplo 3.19 muestra cómo calcular la varian-
za y la desviación estándar de la población.
Elemplo 3.18 Cálculo de la media de población
Calcule la media de población de las cantidades de venias de artículos de plomería con los datos Ejemplo 3. (9
de la tabla 3.2.
Cálculo de varianza y desviación estándar
de la poblacióll
SOLUCiÓN
Calcule la varianza y la desviación estándar de la población para las ventas de 3I1fculosde
La media de la población se calcula con la ecuación (3.12) como sigue: plomeña con los datos de la tabla 3.2.
N
SOLUCiÓN
I~,xl 127.43 + 372 68 + 34903 + .. + 334 22 15950 La varianza ~e la población se calcula con la ecuación (3.13) como sigue.
~=N= 50 =-t>=$31900
N
¿(X,- ~)'
Entonces. la cantidad promedio de las facturas de venta en esta población es 319 dólares. (72_i-.
N

134 CAPITULO 3 RESUMEN y DESCRIPCiÓN DE DATOS NUMffircos OBTENCIÓN DE MEDIDAS DF.SCRIPTIVAS DE RESUMEN A PARTIR DE UNA POBlACIÓN 135
r I
(127.43 - 319)'

51&,00&.2 60 6
+ (372.6g - 319)' + (349.03
SO
- 319)' + .. ' + (334.22 - 319)'
• (a) Calcule la media. la mediana. la moda. el mngo medio y el eje medio.
(b) Calcule el mngo. el rango intercuartil. la va~anza, la desviación estándar y el coefi-
ciente de variación.
(e) ¿Están sesgados estOS datos? Si es asf. ¿cómo?
= -5-0- = 10.3 .1 (en dólaresal cuadrado)
3.26 Dado el siguiente conjunto de datos para una población de tamaño N = 10;
La desvi;lci6n estándar de la población es la raíz cuadrada de la varianza de la población. Al 7566648693
U5<1rla ecuación (3.14) se tiene
(a) Calcule la media. la mediana. la moda. el rango medio y el eje medio.
H (b) Calcule el rango, el nmgo inlercuartil. la varian7.a y la desviación cstándar.
¿(X; - .)' (e) ¿Están sesgados estos datos? Si es así. ¿cómo?
0= ;-, N = V 10,360. 16 = $101.7& (d) Compare estas medidas de lendenci.ll central con las medidas del problema 3.25(a).
\ Analice.
(e) Compare estas medidas de tendencia central con las del problema 3.25(b). Analice.

Uso de la desviación estándar: la regla empírica Aplicadón de conceptos


En la mayor parte de los conjuntos de datos, una porción considerable de las observaciones • 3.27 Los siguientes dalaS representan los recibos de impuestos sobre ventas trimestrales (en

liI
ARCHIVO
tienden a agruparse, más o menos cerca de la mediana. En los conjuntos de datos con sesgo miles de dólares) que fueron presentados al contralor del Gmoscrvitle Township para el o.: Il~TOS
a la derecha. la agrupación ocurre a la izquierda (o abajo) de la mediana, en los conjuntos de periodo que lermina en marzo de 1999 por los 50 negocios de la localidad: TAX
datos ccn sesgo a la izquierda ticnden a agruparse a la derecha (o arriba) de la mediana. En
10.3 11.1 9.6 9.0 14.5
conjuntos de datos simétricos, donde la media}' la mediana son iguales. con frecuencia las
13.0 6.7 11.0 &.' 10.3
observaciones tienden a agruparse en tomo a estas medidas de tendencia centra!. Cuando no
13.0 11.2 7.3 5.3 125
existe un sesgo extremo y se observa este tipo de agrupación en un conjunto de datos. se &.0 11.8 .8.7 10.6 9.5
puede utilizar la llamada regla empírica para examinar la propiedad de variabilidad de los 11.1 10.2 11.1 9.9 9.8
datos y adquirir una idea más clara de lo que mide la desviación estándar. 11.6 15.1 12.5 6.5 7.5
10.0 12.9 9.2 10.0 12.8
12.5 9.3 10.4 12.7 10.5
. Reglo empírico 9.3 11.5 10.7 11.6 7.&
10.5 7.6 10.1 &.9 &.6
La regla empírica establece que para la mayoría de los conjuntos de datos, aproxima-
damente cada dos de tres observaciones (esto es, 67%) se encuentran dentro de: una (a) Organice los datos en un arreglo ordenado o en un diagrama de tailo y hoja.
distancia de I desviación estándar alrededor de la m~ia, y entre 90 y 95% de las ob. (b) Calcule la media aritmética para esta poblnción.
servaciones se encuentran dentro de una distancia de 2 desviaciones. estándar alrede- (e) Calcule la varianza y la desviación estándar para esta población.
dor de la media. (d) ¿Qué proporción de ntgocios tiene recibos de impuestos sobre ventllS trime.~lrales;
(1) dentro de:tl desviación estándar de la media?
(2) dentro de :t2 desviaciones estándar de la media?
En consecuencia, la desviación estándar, como medida del promedio de variación en tomo a (3) dentro de :t3 desviaciones estándar de la media?
la media, ayuda a comprender la distribución de las observaciones arriba o abajo de la media (e) ¿Le sorprenden los resultados del inciso (d)? (Sugu~ncia: compare sus resultados
y a detectar observaciones poco usuales (es decir, valores extremos) cuando se analiza un con lo que se esperaría obtener de ar:uctdo con la regla empírica.)
conjunto de datos numéricos.
3.28 Suponga que se obtuvo la población de 1,024 fondos de acciones generales domésticos,
De los datos de la tabla 3.2 en la página 134, para la población de 50 facturas de venta. la y se determinó que la media del rendimiento porcentual a un año logrado por todos los
media j.L es 319 dólares y la desviación estándar a es 101.78 dólares. En la tabla 3.2 se ob- fondos Jl.. es 28.20, y que la desviación estándar 0", es 6.75. Además suponga que se de-
serva que 31 facturas de venta (62%) se encuentran entre j.L - la y V. + la (es decir, entre terminó que el recorrido en los rendimientos totales a un año es de 0.3 a 60.3. y que los
217.22 y 420.78 dólares). También se observa que 48 facturas de venta (96%) se hallan en. cuartile..~respectivos son 23.9 (QI) y 32.3 (Q). De acuerdo con la regla empírica. ¿quf
tre IJ. - 2(1"Y j.L + 2(1"(es decir, entre 115.44 y 522.56 dólares). Además, todas excepto una proporción de estos fondos se espem que estén
de las facturas de venta (98%) se encuentran entre JL - 3(1"Y V. + 3a (o sea, entre 13.66 y (a) dentro de :t I desviación estándar de la media?
624.34 d6Iarc,). (b) dentro de :t2 desviaciones estándar de la media?
3.29 Los siguientes datos intentan mosuar la diferencia entre las familias con ingmos más
elevados y las familias con ingresos m!s reducidos en cada uno de los 50 estados y el
Problemas para la sección 3.4 Distrito de Columbia en Estados Unidos (medida por el promedio dd 20% más bajo y
el 20% más elevado de familias con niños, entre 1994 y 1996). En la siguiente página se
Aprendizaje de conceptos básicos
muestran los resultados clasificados por estados.
3.25 Dado el siguiente conjunto de datos p:lm una población de tamaño N = 10:

I
I 136
75118362198

RESUMEN y DESCRIPCIÓN DE DATOS NUMmICOS QRTENOÓN DE MEDIDAS DESCRIPTIVAS DE RESUMEN A PARTIR DE UNA POBLACIÓN 137

L
NOMBRE YTD NOMBRE 'YTD NOMBRE YID
20% MÁS RAJO 20% MÁS ALTO 20% MÁS BAJO 20% MÁS ALTO • ASN 4.6 HMT -5.9 PSA -0.2
ESTADO (MILES DE DLS) _ (MILES DE DLS) EsTAOO (MILES DE DLS) (MILES DE DLS)
CDX 5.8 HOT 49,9 . RSE -11.6
Nueva York 6.787 132.390 Kansas 10.790 110.341
CEl 7.3 HRP 8.0 SPG 0.2
Louisiana 6.430 102.339 Oregón 9.627 97.589 ~'

f' EOP 12.8 KlM -1.1 SPK 12.8


Nuevo México 6.408 91.741 Nueva Jersey 14.211 143.010
EQR 12.1 MT -13.3 VNO 16.2
Arizona 7.273 103.392 Indiana 11.115 110.876 .
FRT ~4.8 NHL 2.4 WRI -80
Connecticut 10.415 147.594 Montana 9.051 89.902
HCP J.7 PLD -0.3 AllcllJVO
California 9.033 127.719 Dakota del Sur . 9.474 93.822 DI;: OATOS

Fuente: reimpreso con permiso de Do\\' iOlles & Campan)'. lllc .. de The WaH Street Joumal, 2/ de RElTS
Florida 7.705 107.811 ¡daho 10.721 104.725 abril de /999. Permiso obtenido a lravés de TIle Copyright Cleal'ance Cell/a. lllc
Kentucky 7.364 99.210 Delaware 12.041 116.965
(a) Calcule la media aritmética para esta población. Interprete las cifras.
Alabama 7.531 99.062 Arkansas 8.995 83.434
(b) Calcule la varianza y la desviación estándar de la población. Interprete las cifras.
Virginia del Occ. 6.439 84.479 Colorado 14.326 131368 (e) ¿Existe mucha variabilidad en los rendimientos YTD de los REIT en el grupo de
Tennessee 8.156 106.966 Hawaii 12.735 116.060 inversión DJ-US?
Texas 8.642 113.149 Missoun 11.090 100.837 3.3. Los fondos del mercado de dinero proporcionan a los inversionistas un riesgo de inver-
Mississippí 6.257 80980 Alaska 14.868 129.065 sión relativamente reducido. Por otro lado, estos fondos no producen altos rendimientos.
Michigan 9.257 117.107 Wyoming La sigllÍente tabla proporciona el rendimiento anual, en porcentaje, para los diez fondos
1\.174 94.845
del mercado de dinero de mayor importancia. para el periodo que terminó el 31 de marzo
Oklahoma 7.483 94.380 Minnesota 14.655 120.344 de 1999.
Massachusctts 10.694 132.962 Nebraska 12.546 102.992
Oeorgia 9.978 123.837 NOMBRE DEL FONDO RENDIMIENTO ANUAL
Maine 11.275 92.457
fIIinois 10.002 123.233 New Hampshire 14.299 116.018 MerrilJ Lynch CMA Money Fund 4.95
Ohio 9.346 111.894 Nevada 12.276 98.693 Srñith Bamey Cash PortlCI A 4.92
Carolina del Sur 8.146 96.712 Iowa 13.148 104.253 Vanguard Prime MMF/Retail 5.23
Pennsy!vania 10.5 12 124.537 Wisconsin 13.398 103.55 I Fidelity Cash Reserves 5.16
Carolina del Norte 9.363 107.490 Vermont 13.107 97.898 Schwab Money Market Fund 4.84
Rhode [sland 9.914 111.015 Dakota del Norte 12.424 91.041 Schwab Value Advantage MF 5.21
Washington 10.116 I J2.501 Utah 15.709 110.938 Centennial Money Market Trust 4.92

iI
ARCfHVO
DE UATOS Maryland 13.346 147.971 Distrito de Columbia 5.293 149.508 Margan Stanley DeanWitterlLiquid Asset 5.00
STANTEINC
Virginia 10.816 116.202 Dean Witter/Active Assets MI 5.11 ARcmvo

F!leIIle' Unired States Cell.fUSBureau. Paine Webber RMA MFIMM Port 4.93
Fuente: Reimpreso con permiso de Dow JO/les & Company, fllc.. de The Wall Strl':et JoumaL 5 de
liiI OE [}ATOS
MM

Para estas dos variables numéricas abril de /999. Penniso obtenido a través de The Copyright Clearallce Cell/er, lllc.
(a) organice los datos en un arreglo ordenado o en un diagrama de tallo y hoja.
(b) calcule la media aritmética de la población. (a) Calcule la media aritmética para esta población de diez fondos del mercado de dine-
(c) calcule la varianza y la desviació[\ estándar de la población. ro de mayor importancia. Interprete esta cifra.
(d) ¿qué proporción de estos estados tiene ingresos promedio (b) Calcule la varianza y la desviación estándar. Interprete las cifras. ¿Existe mucha va-
(1) dentro de 1:1 desviación estándar de la media? riabilidad en los rendimientos anuales de los diez fondos?
(2) dentro de 1:2 desviaciones estándar de la media?
(3) dentro de 1:3 desviaciones estándar de la media? RECONOCIMIENTO y PRÁCTICA DE RESÚMENES DESCRIPTIVOS
(e) ¿Le sorprenden los resultados del inciso (d)? (Sugerencia: compare sus resultados ADECUADOS Y CONSIDERACiÓN DE ASPECTOS ÉTICOS
11I ¿QUÉ SUCEI)£ SI?
CO[\ lo que se esperaría según la regla empírica.)

(O Resuelva los incisos (a)-Ce) sin el dato del Distrito de Columbia. ¿Qué cambio tuvie- En este capítulo hemos analizado cómo se puede caracterizar un conjunto de datos numéri-
ron los resultados? cos con algunos estadísticos que miden las propiedades de tendencia central, variación y for-
ma. El siguiente paso implica analizar e interpretar los datos; el análisis es objetivo, la inter-
3.30 Los fondos de inversiones inmobiliarias [Real Estate lnvestment Trusts (REITs)] funcio-,
nan de manera semejante a los fondos mutuos. Los clientes individuales invierten dinero pretación es subjetiva. Deben evilarse errores que pueden surgir ya sea en la objetividad de
en un REIT, y el REIT lo invierte en diferentes bienes raíces, Algunos REIT se centran en lo que se analiza o en la subjetividad de 10 que se interpreta (referencias l y 3).
oportunidades de inversión muy bien definidas, mientras que otros invierten en una
amplia variedad de propi-edades. El grupo de inversión en bienes raíces DI-US es una Prevención de errores durante el análisis y la interpretación
colección de 20 REIT que están a la vanguardia. La siguiente tabla proporcionil el rendi- Recuerde que en la sección 3.1 se examinó y describió un conjunto de datos numéricos de
miento anual a la fecha (YTD), en porcentajes, para el periodo que terminó el 20 de abril los rendimientos totales a un año que obtuvieron 17 fondos de acciones generales nacionales
de 1999. con cargos de venias pagados por los activos de los fondos. Sin el conocimiento del conteni.
do de este capítulo, batamos de analizar e interpretar lo que los datos transmitían.

138 CAPíTULO 3 RESUMEN y DESCRIPCtÓN DE DATOS NUMÉRICOS RECONOCIMIENTO y PRÁCTICA DE RESÚMENES DESCRIPTIVOS ADECUADOS Y CONSIDERACiÓN DE ASPECTOS ÉTtCOS 139
rI
I •
1: El análisis de datos fue objetivo; todos estuvimos de acuerdo con los haUazgos visuales de resumen para algunas variables Iluméricas de una encuesta sobre la vida de los estu-
limitados: los valores modales o típicos de los rendimientos totales a un. año fueron 28.6 y diantes en el campus. Su amigo dice: "Me pidieron un informe y la preparación de una
30.5; la dispersión del indicador del rendimiento total a un año varió de 10,0% a 38.0%, presentación de cinco minutos en_clase acerca d~ la vida de los estudiantes en el campus.
'1 y hubo un mlor extremo en los datos, la tasa de 10.0% que obtuvo Mentor Merger, y un va- Tengo la impresión de que mi computadora contiene todas estas medidas de resumen pa-
ra cada una de las siete variables numéricas. Hay tanla infonnación aquí que no puedo ni
lor extremo pOlencial, el rendimiento de 20.6% que alcanzó Rainler Reich Tang.
comenzar. ¿Tienes algunas sugerencias?" Usted reflexiona unos momentos, y responde.
Una vez que el estudiante ha leído el capítulo y ha obtenido mayor conocimiento de las
3.33 Se pide a un árbitro que examine una disputa sobre los salarios que se pagaron a jugado-
medidas' descriptivas de resumen, tanto de sus ventajas como sus debilidades, ¿cómo podóa res profesionales de béisbol. El dueño de uno de los equipos afirma que el promedio
mejorar el análisis objetivo anterior? Debido a que los datos se distribuyen con una asimetría anual de salarios es demasiado elevado. El agente de los jugadores argumenta que el pro-
ligera, ¿debe considerarse la mediana o el eje medio en lugar de la media? ¿La desviación medio salarial para los jugadores de esle equipo es demasiado bajo. ¿Cómo debe evaluar
estándar proporciona más información acerca de la variación que el rango? ¿Debeóa descri- el árbitro ambas afirmaciones que están en conflicto? (Sugerencia: ¿A cuál promedio
birse la forma de los datos como con un sesgo negativo o a la izquierda? La objetividad en el piensa que se refiere el agente, y a cuál se refiere el dueño?)
análisis de datos implica presentar las medidas de resumen más adecuadas para un conjunto
de datos determinado, es decir, las que mejor se ajustan a las suposiciones sobre ese conjun-
to de datos. • RESUMEN
Por otro lado, la interpretación de datos fue subjetiva; se pueden obtener conclusiones di-
ferentes en la interpretación analílÍca. Todas las personas ven el mundo desde diferentes Como puede verse en el siguiente diagrama, este capítulo analiza el resumen y la descrip-
perspectivas. Algunas ven el arreglo ordenado de los rendimientos a un año (10.0, 20.6, ción de los datos. En éste y en los dos capítulos anteriores, se estudió el tema de la estadístí-
28.6,28.6,29.4,29.5,29.9,30.1,30.5,30.5,32.1,32.2, 32.4, 33.0, 35.2, 37.1 Y 38.0) Y que-
dan satisfechas con los rendimienlos que obtuvieron los fondos de acciones generales con
cargos de venta pagados por los activos de los fondos; otros, en especial aquellos que invir-
.tieron en Mentor Merger (con tasa de 10.0%) o Rainler Reich Tang (con rendimiento de Propiedades de los
datos numéricos
20.6%). o quienes sólo esperan un rendimiento mayor para compensar los riesgos de inver-
sión, ven los mismos datos y concluyen que el rendimiento fue demasiado bajo. Así, como
la interpretación de datos es subjetiva, debe hacerse de manera honesta, neutral y clara.

Aspectos éticos
Los a~pectos éticos son de vital importancia en todos los análisis de datos. Como consumi-
dores habituales de información, los individuos deben cuestionar lo que leen en periódicos y
revistas, lo que escuchan en radio o televisión, y lo que ven en la red (Internet). Conforme
pasa el tiempo, se ha expresado mucho escepticismo en cuanto al propósito, le enfoque y la
objetividad de los estudios publicados. Tal vez ningún comentario sobre este tema ha sido
más claro que el comentario sarcástico que con frecuencia se atribuye al famoso estadístico
británico del siglo XIX Benjamin Disraelí: "Existen tres tipos de mentiras: mentiras, mentiras
malditas y estadísticas".
De nuevo, como se mencionó en la sección 1.9, los aspectos éticos surgen cuando se tiene
que decidir cuáles resultados se deben presentar y cuáles no. Es de gran importancia docu-
mentar tanto los buenos como Jos malos resul¡ados ..Además, al hacer presentaciones orales e
informes escritos, es esencial ser honesto, objetivo y neutral. Por tanto, debe intentarse distin-
guir entre una presentación de resultados deficiente y una no ética. Una vez más, como en las
presentaciones anteriores de Jos aspectos éticos, la clave es la intención. La omisión de infor-
mación pertinente, suele deberse simplemente a ignorancia. Sin embargo, la conducta no ética
surge cuando se elige a propósito una medida de resumen inadecuada (por ejemplo, la media
o el rango medio para un conjunto de datos muy sesgado) a fin de distorsionar los hechos para
apoyar una postura determinada. Además la conducta no ética también ocurre cuando no se
informan ciertos hechos pertinentes porque perjudican el apoyo de una postura específica.

Problemas para la sec.ción 3.5


Aplicación de c.onceptos
3.32 Suponga que recibe una llamada telefónica de un amigo que también estudia estadística
Diagrama de resum7n del capítulo 3
este semestre. Su amigo acaba de usar Microsoft Excel para obtener medidas descriptivas

140 CAPÍTULO 3 RESUMEN y DESCRIPCiÓN DE DATOS NUMt:RICOS RESUMEN 141


ca descriptiva: cómo se recopilan los datos, su presentación en forma de tabla o gráfica y có- PLAN TASA PLAN TASA
mo se resumen, describen, analizan e interpretan. En el siguiente capítulo se estudiarán los
principios básicos de la probabilidad con el fin de franquear la brecha entre la estadística AT&TDial-1 Standard 74.68 Malrix SBN Flat Rate 54.03
descriptiva y la inferencia estadística. Frontier Dial-] 76.41 Matrix Smartworld Flat 49.46
LCI Basic 71.50 Sprint Sense 55.50
Matrix Dial-l 59.58 Worldcom Borne Advantage 49.10
Términos clave MC! Dial-l Standard 74.29 AT&T True Reach Savings 56.01
Sprint Dial-l Standard 74.68 AT&T True Savings 55.21
análisis de datos 102 extremo 103 rango medio 109 Worldcom MTS 63.92 Malrix Smartworld Basie 55.76
coeficiente de variación 1]9 forma 121 regla empírica 136 AT&TOneRate 58.35 MC! Friends and Family 60.98
cuantiles 110 . rango intercuartil 114 resumen de cinco nlÍmeros 128 AT&T One Rate Plus 47.90 MC! Friends and Family Free 58.09
cuartiles 110 media 104 sesgado a la derecha 121 LC! Single Rate 53.97 Sprint Sense With Most Option 53.70
datos simétricos 121 media aritmética 104 sesgado a la izquierda 121 Matrix Fiat Rate 1 51.85 Sprint the Most II 60.31
desviación estándar de la muestra 115 media de población 134 tendencia cenlral 104 MCIOne 47.57 Matrix Smartworld Basic With Discount 52.78
desviación estándar de la población 135 mediana 106 ubicación 104 Sprint Sense Day 56.05 Sprint Sense With Cash Back 49.95
diagrama de caja y bigotes 129 medidas robustas 112 valor alejado 103 AY &T Simple Rate 56.55 Sprint Sense With Most and Cash Back 48.33
diagrama de puntos 105 moda 109 variación 112 Frontier Homesaver 49.36 AT&T One Rate With True Rewards 57.18

líiI
ARCHIVO
dispersión 112 QI: primer cuartil 110 varianza de la muestra 115 LCI All-American 52.71 AT&T True Reach With True Rewards 54.89 DE L>~TOS
dispersión media I t4 QJ: tercer cuartil 111 varianza de la población 135 Le1 Two-Rate 53.10 AT&T True Savings With True Rewards 54,11 PHONRATE

eje medio 112 rango 113 Fuente: Reimpreso COIIpemliso de The New York Times. Teiecommunicaliolls Reuarch and Actiorl
Cemu: The New York Times, 2 de /llano de 1997, £5 ..

(a) Calcule todas las medidas de ubicación adecuadas


Verificación de los c.onoclmlentos adquiridos (b) Calcule todas las medidas de variación adecuadas.
(e) Construya un diagrama de caja y bigotes.
3.34 ¿Qué debe buscarse cuando se intenta caracterizar y describir las propiedades de un con-
(d) Con base cn los resultados de los incisos (a) y (e), ¿cómo describiría la forma de la
junto de datos numéricos?
distribución? Explique.
3.35 ¿Qué significa la propiedad de ubicación o tendencia central?
(e) Con base en los resultados de los incisos (a) y (e), si resumiera los resultados por
3.36 ¿Cuáles son las diferencias entre las diversas medidas de tendencia central: media, me-
escrito, ¿qué medidas de ubicación proporcionaría? Explique.
diana, moda, rango medio y eje medio?, ¿cuáles son las ventajas y desventajas de cada
una? 3.45 Una característica de calidad interesante en el proceso de llenado de bolsas de té es el
3.37 ¿Cuál es la diferencia entre medidas de tendencia central y medidas de tendencia no cen- peso de cada una. Si las bolsas tienen menos de lo que deben, surgen dos problemas.
tral? Primero, es posible que los clientes no puedan preparar un té tan fuerte como lo deseen.
3.38 ¿Qué significa la propiedad de variación? Segundo, tal vez la compañía viole las leyes de veracidad en las etiquetas. En este ejem-
3.39 ¿Cuáles son las diferencias entre las diversas medidas de variación como rango, rango in- plo, la etiqueta de peso en el paquete indica que, en promedio, hay 5.5 gramos de té en
tercuartil, varianza, desviación estándar y coeficiente de variación?, ¿cuáles son las venta- una bolsa. Por otro lado, si la cantidad promedio de té en la bolsa excede el peso indica-
jas y desventajas de cada una? do, la compañía regala parte del producto. Llenar las bolsas con la cantidad exacta de té
3.40 ¿Cómo ayuda la regla empírica para explicar la forma en la que se agrupan o distribuyen es difícil debido 11 la.'ivariaciones de temperatura y humedad en el inlcrior de la fábrica,
las observaciones en un conjunto de datos? las diferencias en la densidad del té y la alta velocidad con que trabaja la máquina de
3.41 ¿Qué siglllfica la propiedad de la forma? llenado (cerca de 170 bolsas por minuto). La siguiente tabla (datos reales que recopiló
3.42 ¿Por qué son útiles las siguientes técnicas de análisis exploratorio de datos: resumen de uno de los autores) proporciona el peso en gramos de una muestra de 50 bolsas de té
cinco números y diagrama de caja y bigotes? producidas en una hora por una sola máquina.
3.43 ¿Cuáles son algunos aspectos éticos que están presentes cuando se hace la distinción en-
tre el uso apropiado e inapropiado de medidas descriptivas de resumen que se publican
en periódicos y revistas? Pl!.SO DE LAS BOLSAS DE TI; EN GRAMOS

5.65 544 5.42 5.40 5.53 5.34 5.54 5.45 5.52 5.41
5.57 5.40 5.53 5.54 5.55 5.62 5.56 5.46 544 5.51
5.47 5.40 5.47 5.61 5.53 5.32 5.67 5.29 5.49 5.55
Problemas de repaso ARCHIVO
5.77 5.57 5.42 5.58 5.58 5.50 5.32 5.50 5.53 5.58 llEIlHOS
• 3.44 Los siguientes datos representan las tasas mensuales de llamadas de larga distancia para 5.61 5.45 5.44 5.25 5.56 5.63 5.50 5.57 5.67 5.36 TEABAGS
dientes residenciales en Estados Unidos, de una muestra de 34 planes diferentes (ba~ada
en 36 llamadas por mes y un total de 318 minutos repartidos durante el día):

142 CAPÍTULO 3 RESUMEN y DESCRIPCt6N DE DATOS NUMÉRICOS PROBLEMAS DE REPASO 143


r I
(a) Calcule
(1) la media aritmética
(2) la mediana
(3) el rango medio
(7)
(8)
(9)
el
el
la
rango
rango intercuartil
varianza
..
(e) ¿Cuál seria el efecto en los resultados y conclusiones si el primer valor para la cen-
tralll se hubiera registrado (por error) como.27.55 en vez de 7.55?
3.48 En muchos procesos de manufactura hay un término llamado "trabajo en proceso" (abre-
viado WIP, por sus siglas en inglés de work-j¡¡-process). En una planta manufacturera de
11I ¿Qut SUCEOF. SI?

(4) el _primer cuartil (lO) la desviación estándar libros esto representa ei tiempo que sé necesita para doblar, unir, coser, proteger con
.(5) el tercer cuartil (11) el coeficiente de variación guardas, y encuadernar las hojas que salen de la prensa. Los siguientes datos representan
(6) el eje medio muestras de 20 libros en dos plantas de producción y el tiempo de procesamiento (defi-
(h) interprete las medidas de tendencia central en el contexto del problema. ¿Por qué es nido como el tiempo en días contado desde que el libro llega a las prensas .hasta que se
importante que el fabricante de bolsas de té se preocupe por la tendencia central? empaca en cajas) para estas actividades.
(e) Interprete las medidas' de variación en el contexto del problema. ¿Por qué es impor- Planta A
tante que el fabricante de holsas de té se preocupe por la variación? 5.62 5.29 16.25 10.92 Jl.46 21.62 8.45 8.58 5.4l 11.42
(d) Construya un diagrama de caja y bigotes. 11.62 7.29 7.50 7.96 4.42 10.50 7.58 9.29 7.54 8.92
(e) ¿Están sesgados los datos? Si es así, indique cómo. Planta B AI/.ClllVO
(f) ¿Cumple la compañí<l con los requerimientos establecidos en la etiqueta que, en pro- 9.54 11.46 16.62 12.62 25.75 15.41 14.29 13.13 13.71 10.04 DE l>ATOS
medio, hay 5.5 gramos de té en una bolsa? 5.75 12.46 9.17 13.21 WlP
6.00 2.33 14.25 5.37 6.25 9.71
, (g) Si usted estuviera a cargo del proceso, ¿qué cambios implementaría con relación a la
Para cada una de las plantas,
"
distribución de peso en las bolsas individuales de té?
, (a) Calcule
3.46 Los ejecutivos de mercadotecnia de clubes de béisbol de las grandes ligas consideran que
(1) la media aritmética (7) el rango
las promociones el "día de la gorra" o el "día de 8eanie Baby" son herramienlas que
(2) la mediana (8) el rango intercuartil
ayudan a incrementar la asistencia pagada. Boyd y Krehbiel examinaron la efectividad de
(3) el rango medio (9) la varianza
cstas promociones ('¡he Effect of Promolion Timing on Majar League Baseball Atten-
(4) el primer cuartil (lO) la desviación estándar
dance", Sport Marketi/¡g Quemaly, otoño de 1999). El archivo de datos METS contiene
(5) eltereer cuartil (11) el coeficiente de variación
dos variables:
ARCHIVO (6) el eje medio

liI DE

MClS
DATOS
Asistencia: asistencia pagada para cada juego en 1997
Promoción: sí "" se hizo promoción; NO "" no se hizo promoción
(Los autores recopilaron los datos a partir de registros públicos.)
(b) Construya un diagrama de caja y bigotes
(e) ¿Están sesgados los datos? Si es así, indique cómo.
(d) Con base en los resultados de los .incisos (a)-(c), ¿hay diferencias entre las dos
(a) ¿Estos datos son representativos de una muestra o población? plantas? Explique.
(b) Calcule las medidas descriptivas apropiadas de asistencia pagada para los 19 juegos 3.49 En ei estado de Nueva York, las cajas de ahorro están autorizadas para vender una espe-
con promociones y los 61 juegos sin promociones. cie de seguro de vida llamado Savings 8ank Life Insurance (S8U). El proceso de apro-
(c) Analice la efectividad de las promociones que se realizaron para los Mets de Nueva bación está integrado por los siguientes puntos: revisión de la solicitud, verificación por
York en 1997. parte de una agencia de información médica, una posible petición de información y la
(d) ¿Qué factores generaron la variación que se refleja en la asistencia pagada? realización de exámenes médicos adicionales, además se incluye la etapa de compilación
• 3.47 Un problema con una línea telefónica que impide al cliente recibir o hacer llamadas es de la póliza para generar las páginas de la misma y enviarlas al banco para su entrega.
desconcertante tanto para el cliente como para la compañía telefónica. Estos problemas La entrega oportuna de las pólizas aprobadas a los clientes es crítica para la rentabilidad
pueden ser de dos tipos: ya sea que se localicen en el interior de la central telefónica o de este servicio de la caja de ahorros, Durante un mes, se seleccionó una muestra aleato-
en las líneas que van de la central hasta el equipo del cliente. Los datos siguientes repre- ria de 27 pólizas aprobadas y el tiempo total de procesamiento en días Los resultados
sentan muestras de 20 problemas que reportaron los clientes en dos oficinas diferentes de fueron los siguientes:
una compañía telefónica, y el tiempo que lomó resolverlos (en minutos)'
73 19 16 64 28 28 31 90 60 56 31 56 22 18
Tiempo para resolver problemas (en minutos) en la central / 45 48 17 17 17 91 92 63 50 51 69 16 17

liilI
ARCIUVO
1.48 1.75 0.78 2.85 0.52 "1.60 4.15 3.97 1.48 3_10
DE DATOS (a) Calcule
PHONE 1.02 0.53 0.93 1.60 0.80 l.05 632 3.93 5.45 0.97
(1) la media aritmética (7) el rango
Tiempo para resolver problemas (1:'11 minutos) en la central IJ
(2) la mediana (8) el rango intercuartil
7.55 3.75 0.10 1.l0 0.60 0.52 3.30 2.10 0.58 4.02
(3) el rango medio (9) la varianza
3.75 0.65 1.92 0.60 1.53 4.23 0.08 1.48 1.65 0,72
(4) el primer cuartil (lO) la desviación estándar
Para cada una de las oficinas de la central telefónica: (5) el tercer cuartil (11) el coeficiente de variación
(a) Calcule (6) el eje medio
(1) 'la media aritmética (7) el rango (b) Construya un diagrama de caja y bigotes.
(2) la mediana (8) el rango intercuartil (e) ¿Están sesgados los datos? Si es así, indique cómo
(3) el rango medio (9) la varianza (d) ¿Qué le contestaría al cliente que llega al banco para comprar este tipo de póliza de
(4) el primer cuartil (0) la desviación estándar seguro y pregunta cuánto tiempo toma el proceso de aprobación?
(5) el tercer cuartil (11) el coeficiente de variación 3.50 Uno de los principales indicadores de la calidad del servicio que proporciona una organi-
(6) el eje medio zación es la rapidez con la que se atienden las quejas de los clientes. Una tienda departa-
(b) Construya un diagrama de caja y bigotes. mental muy grande, de administración familiar, que vende muebles y revestimiento para
(e) ¿Están sesgados los datos? Si es así, indique cómo pisos, incluyendo alfombras, ha tenido una gran expansión en los últimos años. En par-
(d) Con base en los resultados de los incisos (a)-(c), ¿existen diferencias entre las dos ticular, el personal del departamento de revestimiento para pisos ha crecido de 2 brigadas
oficinas? Explique. de instalador'es, a un supervisor de instalación, un medidor y 15.brigadas de instaladores.

,- 144 CAPÍTULO 3 RESUMEN y DESCRIPCIÓN DE DATOS NUMÉRICOS PR08LEMAS DE REPASO 145

L
Durante un año reciente se seleccionó una muestra de 50 quejas referentes a la instala- (d) ¿Están sesgados los datos? Si es así,' indique cómo.
ción de alfombras. Los siguientes datos representan el número de días que pasan entre la (e) Considere solamente los 60 fondos sin cargo en el conjunto de datos, es decir, los
recepción de la queja y la solución de la misma. fondos mutuos con Sales Clwrge = N. Repita los incisos (a)-(d).
(f) Considere solamente los 80 fondos con cargo en el conjunto de datos, es decir, los
54 53513731 27152 2 ]23 81 7427 11 19126 llO 110 29 6] 3594 31 26 5 «2
fondos mutuos con Sales Charge'= y. Repita los incisos (a)-(d).
4 l65 32 2928 29 2625 1 1413 13 10 5 27 4 523022362620 23 33 68
3.53 Para los datos de fondos mutuos del problema 3.5[, se quiere saber si los distintos tipos
(a) Calcule de fondos mutuos producen el mismo resultado para los inversionistas.
(I) la media aritmética (7) el rango (a) Constmya una tabla que incluya la media aritmética, la mediana, el rango y la des-
(2) la mediana (8) el rango intercuartil viación estándar para los cinco objetivos, use la variable QlIarreriy Retum.
(3) el rango medio (9) la varianza (b) Construya una tabla que incluya la media aritmética, la mediana, el rango y la des-
(4) el primer cuartil (10) la desviación estándar viación estándar para los cinco ubjetivos, use la variable Ammal Re/llrll.
ARCHIVO (5) el tercer cuartil (11) el coeficiente de variación (e) Analice la tasa de inversiones para Ia.s cinco categorías de objetivos.
[lE B,ITOS (6) el eje medio 3.54 Para los dalos de fondos mutuos del problema 3.51, se desea hacer un análisis detallado
FURNITURE
(b) Construya un diagrama de caja y bigotes. de los fondos de tecnología (Objec/ive = TK). Considere 111v1lriable Annual Re/l/fIl.
(e) ¿Est5n sesgados los datos? Si es así, indique cómo. (a) Construya una tabla que incluya la media aritmética, la mediana, el rango y la des-
(d) Con base en los resultados de los incisos (a)-(c), si tuviera que informar al presiden- viación estándar para los 17 fondos de tecnología.
te de la compañía cuánto tiempo en promedio tiene que esperar un cliente para que (b) Construya una tabla que incluya la media aritmética, la mediana, el rango y la des-
su queja se solucione, ¿cu'ál sería su respuesta? Explique. viación estándar para los 6 fondos de tecnología sin cargos de ventas.
3.51 TIJe Wa/l Srreer JOllrnal informa cada día acerca de más de 6,000 fondos mutuos. El ar- (e) Construya una tabla que incluya la media aritm€tica, la mediana, el rango y la des-
chivo de datos FUNDS contiene información de una muestra de 140 fondus mutuos to- viación estándar para los II fondos de tecnología con cargos de ventas.
mada del Walf S/reet J()llnw!, el 5 de abril de 1999, El archivo contiene seis variables: (d) Repita los incisos (a)-(c), utilice la variable Quar/erly Relllfll.
Fund' nombre del fondo mutuo. (e) Repita los incisos (aHc), utijice la variable Expenses.
(f) Escriba un resumen breve del análisis detallado que realizó en los incisos (a)-(e).
Objec/íl'e: tipo de acciones que componen el fondo mutuo. GI = crecimiento e ingreso;
JL = internacional; Me = compañías medianas; se = compañías pequeñas; TK =
3.55 Como ilustración del mal uso de la estadística, un artículo de Glenn Kramon ("CoaKing
the Stanford E[ephant to Dance", The New York Times Sunday Business Seclion, 11 de
tecnología.
Sales Cllarge: y = sí; N = no, noviembre de 1990) insinuaba que los costos en el Stanford Medical Center se habían
elevado más que los de otras instituciones competidoras, porque era más probable que el
Quar/erfy Re/um: rendimiento tOlOldel primer trimestre de 1999 (%).
Stanford Medical cenler tratara pacientes indigentes, de Medicare, de Medicaid, más en-
AII/wal Relllrn: rendimiento a doce meses (%).
£rpeflses: gastos causados por el fondo mutuo (% del valor neto promedio de los activos). fennos y más complejos. Para ilustrar esto, se presentó una gráfica con una comparación
del promedio de cargos de hospital entre 1989 y 1990 para tres procedimientos médicos
F"ellle: The Wall St"",t Joumal. 5 de ,.hri/ ele /999.
(marcapasos coronarios, parto normal y reemplazo de articulación de cadera) en tres ins-
(a) Para la variable QlIarterly Re/Un!, calcule tituciones competidoras (El Camino, Sequoia y Stanford).
(1) la media aritmética (7) el rango
(2) la mediana (8) el rango inlercuartil
(3) el rango medio (9) la varianza
(4) el primer cuartil (10) la desviación estándar
Costos del cuidado de la satud
(5) el tercer cuartil (11) el coefictente de variación Comparación del promedio de cargos de hospital entre 1989 y 1990
(6) el eje medio en California por diversas operaciones. Los hospitales Sequoia y
(b) Interprete la media aritmética, la mediana y la desviación estándar. El Camino son la competencia local más importante del Stanlord
50,000 Medical Center.
(c) Constmya un diagrama de caja y bigotes.
(d) ¿Están sesgados [os datos? Si es así, indique cómo.
ll'i'EI El Camino
40,000
(e) Repita las partes (a)-(d) para la variable Allflllal Re/unJ. D Sequoia
(f) ¿Qué conclusiones puede deducir con relación al rendimiento trimestral y el rendi- 30,000 D Stanlord
miento anual de los fondos mutuos? ~
~
Q
3.52 Considere la variable Expemes para los datos de los fondos mutuos que se describen en 20,000
el problema 3.51. Cada fondo cobra a sus inversionistas cargos por gastos, expresados
como porcentaje de los activos netos promedio. 10,000

(a) Para la variable Expense,l, calcule N/A


(1) la media aritmética (7) el rango Marcapasos coronario Parto no~m"t Reemplazo de articulación
(2) la mediana (8) el rango intereuarti[ I de cadera
Los <:ostosen El Camino son el prom.dlo de los oostos mas .I(os y más bajos por parto norm.1 con
(3) el rango medio (9) la varianza ~ do. di•• d. h""pH.II,.dón y rnmplOlo de articulación de r:ador~<:onnuo', dj•• d. hospitali,.ción.
(4) el primer euartil (10) la desviación estándar
(5) el tercer cuartil (11) el coeficiente de variación
D deL""todos
'OSl~" do Sequoi. son pmm.diosdel5(l1o m.dio
los o.rgos por operación.
cada
>

(6) el eje medto D L", dot", d. 5t.nford SO".1 oo,to prom.dio d. lodo. 1•• op<rlciones.
(b) Discula las medidas de tendencia central y la variación que se obtuvieron en el inci- Fuenle; Stanford Medicat Centar, Sequo;. Hospii.t y El Camino Hospital.

so (a).
(e) Construya un diagrama de caja y bigotes. Reimpreso ron penuiso d~ Tite New York Times.

146 CAPiTULO 3 RESUMEN y DESCRIPCtÓN DE DATOS NUMÉR]COS PROBLEMAS DE REPASO 147


Suponga que usted trabaja en un centro médico. Su jefe snbe que está tomando un curso
de estadística y lo llama para analizar esto. Le comenta que el artículo se presentó en un
grupo de discusión -como parte de una reunión regional de jefes ejecutivos de centr~
médicos- la noche anterior y que uno de ellos mencionó que esa gráfica carecía por
completo de sentido y le pidió su opinión, Le pide que le prepare su respuesta. Usted
sonríe, respira profundo y responde.
Caso de estudio - 5TATE ALCOHOUC
BOARD.

Dan Cates, director de investigación del State Al-


coholic Bevenlges Oversight Board [Consejo Es-
tatal para la Supervisión de Bebidas Alcohólicas]
BEVERAGES OVERS/GHT
ESTUDIO SOBRE CERVEZAS

comunicar sus hallazgos al Sr. Rabb en dos se-


manas, El Dr. Matlin solicitó la ayuda de un es-

3.56 Usted está pensando estudiar para el examen de estadística con un grupo de compañeros, tudiante.
y desea impresionar a uno de ellos. Esta persona ha aceptado utilizar un paquete de soft- sostUVO una rcunión con Manos Rabb, el nuevo El Dr. Matlin lo ha contratado para ayudarlo
ware para obtener la información necesaria de resumen, las tablas y gráficas para un con- gerente de la división de cervezas, y el Dr. Ar- en este estudio y le ha proporcionado los datos
junto de datos que contiene varias variables numéricas y categóricas asignadas por el no)d Matlin. profesor de nutrición en la universi- del COl/sumer Report.~ sobre 69 cervezas distin-
profesor con fines de estudio. Esta persona viene a verlo con la impresión del programa dad estatal y líder consultor en la investigación tas, desglosadas por tipo y OIigen de producto.
y exclama: "Tengo todo lo necesario: medias, median¡¡s, desviaciones estándar, diagramas sobrc bebidas. ¡¡ quien el Sr. Rabb acaba de con- Los datos, encontrados en el archivo BEER y
de tallo y hoja, diagfllmas de caj¡¡ y bigotes, diagramas circulares, para todas las varia- tratar. "Ahora tcnemos acceso <1 los datos del parcialmente reproducidos ¡¡quí, representan el
bles. El problema es que una parte de la información de salida se ve rara. Por ejemplo, estudio sobre CerVe7-<lS dd COIJS!lmer Repons de precio de una caja de seis botellas de 12 onzas,
los diagramas de tallo y hoja; los diagramas de caja y bigotes para el género, especiali- junio de ]996". comentó el Sr. Oates mientras las calorías por 12 onzas, el porcentaje de conte-
dad y los diagramas circulares para el índice de calificaciones y alturas. Tampoco puedo distribuía copias dd artículo y de los datos. "Co- nido de alcohol por 12 onzas, el tipo de ccrvezn
entender por qué el profesor Krehbiel dijo que no podíamos obtener las estadísticas des- mo le dije hace poco al Sr. Rabb, es importante (Iager artesanal, clara artesanal, lager importada,
criptivas para algunas variables. ¡Yo las obtuve para todas! Mira, la media para la altura que el Consejo evalúc los datos)' publique infor- c~rveza nonm.l y helada, y cerveza baja en calo-
es 68.23, la media para el índice de calificaciones es 2.76, la media para el sexo es 1.50, mación de intel'és y útil para los consumidores. rías y sin alcohol) y el país de origen (EU o im-
la media para la especialidad es 4.33". Usted ve a su futuro amigo, respira profundo y El Consejo no ha hecho un estudio como este du- portada), para las 69 cervezas muestreadas.
responde rante mi gestión (la última evaluación se hizo en Su tarea es escribir un informe basado en una
1990). De acuerdo con el informe del Consume,. evaluación descriptiva completa de cada variable
ReporlS (la de junlo de 1996), cada semana se numérica -precio, calorías y contenido de alco-
vendell mil millones de dólares en cerveza, yen hol- sin importar el tipo de producto o el ori-
....,. PROYECTO DE EQUIPO
'.'\:------ la década pasada hubo un incremento de nueve
veces en el número de cervecerías en operación
gen. Luego debe realizar una evaluación similar
comparando cada variable numérica seglÍn el ti-
en Estados Unidos. Como la popularidad de los po de producto -lager artesanal, clara artesanal,
PE3.1 Refiérase al proyecto PE2.1 en la página 89. Su grupo, la Corporación ha sido variantes de esta bebida ha UlIment:ldo, es impor- lager impOllada, cerveza nonna! y helada, y cer-
contratado por el vicepresidente para que realice una investigación en una empresa de inversión fi- tante que el consumidor conozca las característi- veza baja en calorías y sin alcohol. Además, de-
nanciera, con el fin de analizar las características de los fondos de acciones generales nacionales que cas del producto." "Estoy de acuerdo con usted", be realizar una evaluación similar para comparar
se negocian en la actualidad. La empresa de inversión está interesada en evaluar la lista de fondos de dijo el Sr. Rabb. "El Consejo me designó hace cada variable numéJica seglín el origen de la cer-
acciones generales nacionales con el fin de hacer recomendaciones de compra a los inversionistas po- sólo tres semanas, y desde entonces he leído los veza, las fJbricadas en Estados Unidos contra las
tenciales. En especial, el vicepresidente está interesado en la comparación de algunas características cuademos de los e~tudios dirigidos por mi prede- importJdas. Su informe debe incluir todas las tJ-
de estos fondos con base en la estructura de cargos (sin cargo o pago de cargos), el objetivo (fondos de cesor, David Valinski, que estuvo al frente de es- bIas y gráficas pertinentes y la jnformación esta- ARCIH~(I
crecimiento o fondos mixtos) y ellamaño de capitalización de las compañías que fonnan una carte- ta división durante casi 40 años." El Sr. Dates pi- dística descriptiva obtenida a partir de los resul- 1J~ DATfI~
ARCIllVO
ra de fondos (grande, mediana o pequeña). Una vez que se han preparado las tablas y las gráficas BEER
DE OATOS dió entonces al Dr. Mat1in dirigir el estudio y tados de la investigación.
MUTUAL adecuadas (véase PE2.\), la Corporación está lista para realizar el análisis preliminar.
Con Jos datos fI.1UTUAL de varias características de una muestra de 194 fondos de acciones genera-
les nacionales que obtuvieron altas calificaciones duales de 4 o 5 con Momingstar Inc.:
(a) Describa cómo procederán los miembros del equipo para realizar sus tareas.
(b) Ohlenga diversas medidas descriptivas de resumen del valor neto de los activos (en dóla-
res) y la tasa total anual a la fecha (en porcentaje) para los 107 fondos sin cargo contra PrWOUCTO PRECIO CALORíAS ALCOHOL TIpo OIHGEN
los 87 fondos con pago de cargos.
(c) Obtenga diversas medidas descriptivas de resumen para el valor neto de los activos (en
Brooklyn Brnnd 6.24 159 5.2 Lager artesanal EU
dólares) y la tasa total anual a la fecha (en porcentaje) para los 59 fondos de crecimien-
Leinenkugel's Red 4.79 160 5.0 Lager nrtesanal EU
to contra los 135 fondos mixtos. Samuel Aclams Bastan 5.96 160 49 Lager artesanal EU
(d) Obtenga diversas medidas descriptivas de resumen del valor neto de los activos (en dóla- Georg~ Killian's lrish Red 4.70 162 4.9 Lager artesanal EU
res) y la tasa tata] anual a la fecha (en porcentaje) para los 119 fondos grandes, Jos 44 Filen!," "BeeiS". Copyright /996 por Consumen UmOIl (!r U.S Ine YOllkas. NY 1070.1-1057. Adupllldo con
fondos medianos y los 31 fondos pequeños. permi.m de CONSUMER REPORTS, junio de /996. Aunque I'/muurillr origin<i/ apareció 1'11 CONSUMER
(e) Escriba y entregue un resumen ejecutivo de los resultados. REPORTS. la OdOPlllciún se/u/im y las Cfmclmianes pl'esetllodas Slln dI' los autores y 110esllm sallcionadllS
(f)
Prepare y exponga una presentación oral de 10 minutos ante el vicepresidente de investi- 11re./Jend"d(Js de llingww numeru pur COlIsumas Ullil)lI, edilOl' de CON$UMER REPORTS .•
gación de esta empresa de inversión financiera.
Nota: Se puedcn encontrar proyectos de equipo adicionales en el sitio de lntemet WWW de este li-
bro:
hUp://www.prenhaJl.com/levine
Estos proyectos de equipo manejan características de 80 universidades y colegios (véase el archivo
UNIV&COL.XLS) y de 89 modelos de automóviles (véase el arcbivo AUTP96.xLS).

148 CAPÍTULO 3 RESUMEN y DESCRIPCiÓN DE DATOS NUMÉRtCOS CASO DE f'STtIf)[f)-STATE ALCOHOLlC BF:VFRAGES OVF.RSI(;IIT BOARD. ESTUDIO SOBRE CERVEZAS 14\
cuadros de K-ésimo mayor y K-ésimo menor y escriba I en sus cuadros de edición. Selec-
"',
'"
'::.'. CASO SPRINGVILlE HERALO cione la opción En una hoja nue,'a y escriba el nomb~ de Descriptiva en su cuadro de edi-
• ción. Active el cuadro de Resumen de estadísticas. Oprima el botón Aceptar.
Waller Fairfax, jefe del departamento de servicios rían vnrias medidas descripti\'a.~ de resumen relati-
deeómpulo, notó que además de la gran cantidad de vas a ubicación, vnriación y sesgo para que los in- Uso del complemento PHStot para obtener un diagrama
tablas y g.r.ificas preparndas con base en la tabla fonnes proporcionados a la administraci6n fueran de caja y bigotes
SH2.4 (vúse la página 93), con relación a la can- más útiles. Para obtener un diagrama de caja y bigotes con PHStat, mantenga abierto el libro de MU-
tidad de cartuchos que son aecesados, se necesita- TUAL.Xl.S, seleccione PHStall Box-and-Whisker Plol. En el cuadro de edición de "Data
Variable CeU Rangc" escriba D1:018. Active el cuadro de First cell contains labeL Elija la
Ejercicio
opción Single Group Variahle. Haga click en OK. Si se desea un diagrama lado a lado para
A~cltlvo 3.1 (a) Obtenga todas las medidas descriptivas de re.~umt:n, diagramas de tallo y hoja y grnficas dt: varios grupos, deberá selcccionarse una de las opciones de "Multiple goups".
II£D<l.T():I;
cajn y bigote.••relativos 11 la cantidad de cartm:hos de datos qut: son acct:sados durante las
SH2
actividades, que usted considere sean de utilidad para la preparación de un infonne parn la
administraci6n.
(b) Escriba un informe para la administr.aci6n que resuma los resullados obtenidos a partir de
+ ApÉNDICE 3.2 USO DE MINITAB EN LA ESTADisTICA
las rnedida.••descriptivas de resumen, los diagr<lmlls de 1.1110 y hoja y las grnlieas de caja y DESCRIPTIVA
bigotes desarrolladas en el inciso (a).
Obtención de la estadística descriptiva y un díagrama
de caja y bigotes
Referendas Obtenci6n de estadfstieas descriptivas para los 17 fondos de acciones generales nacionales
con cargos por ventas con los otros grupos dc códigos (véase la figura 3.8 en la página 123),
lo Huf(, O., HolI' 10 Li~ 11';111 Stalistics (New York: Nonon, abra el archivo MUTUAL.MnV. Seleccione Stall Ha,sic Statistics I Display Oescriptive
5. Minilab Version 12 (State Cal1ege. PA: Minitnblnc.,
1954). Slatistics. En el cuadro de diálogo de Display Descriptive Statislics en el cuadro de Varia-
1998).
2. Kendall, M. O., nnd A. Stuan, 1ñ~ Adl'flllad Th~ory o/ 6. Tub:y, 1., Expforatory Dala Analysis (Rt:ading. MA: Ad- bles escriba 'Rcnd a 1 año' o C4. Activc el cuadro Ry variable y escriba 'Grupo' o CS.
Statistics, vol. 1 (Londan: Chnrles W. Oriffin, 1958).
dison-Wesley,1977). Seleccione Graphs. Active el cuadro de Boxplot of data. Oprima el botón OK. Oprima el
3. Kimble, G. A., 1I01i' lo US~(tmd Misus~)Statistics (F..ngle- 7. Vencman, P. F., and D. C. Hoaglin, Applications, Btuics, botón OK de nuevo.
wood Cliffs, NI: Prentiee Hall, (978). nnd Computing o/ &pforarory Dala Anafysis (Boslon,
4. Microsoft Exal 97 (Redmond, WA: Microsoft Corporn-
MA: Duxbury Prcss, 1981).
tion, 1997).

+ ApÉNDICE 3.1 USO DE MICROSOFT EXCEl EN LA ESTADíSTICA


DESCRIPTIVA

Uso de la herramienta Análisis de datos


Aunque se pueden usar varias funciones de Microsoft Excel, como PROMEDIO, MEDIA-
NA y DESVEST. para calcular los estadísticos individuales, la herramienta Análisis de da-
tos puede obtener en forma simultánea un conjunto de estadísticas descriptivas como el con.
junIO que se muestra en la figura 3.7 de la página 122. La herramienla de análisis de datos se
llama desde el menú Herramientas. con la selección de Herramientas 1 Análisis de datos,
después se puede seleccionar la opción Estadística descriptiva en cl cuadro de diálogo de
Análisis de datos.
Para obtener las estadísticas descriptivas para los 17 fondos de acciones generales nacio-
nales con cargos pagados por los activos de los fondos (grupo = 1). abra el libro MU.
11JAL,XLS y ordene los datos por grupo. Seleccione Herramientas 1 Análisis de datos.
Elija Estadística descripth'a del cuadto de diálogo de análisis de datos y haga click en
Aceptar. En el cuadro de edición de "Rango de entrada" escriba DI :018, porque los rendi-
mientos porcentuales a un año de los 17 fondos generales con cargos se encuentran en las fi-
las 2 a 18 y la etiqueta de la variable está en la fila 1. Selecciones la opción Agrupado por
columnas. Active el cuadro de Rótulos en la primera lila. Deje desactivado el cuadro dc
"Nivcl de confianza pal1l.la media". Para obtener los valores mínimo y máximo. active los

ISO CAPfnJl.o3 RESU~EN y OESCRIPCIO:-l DE DATOS NUM~.RICOS 1, A~..NDtCE3.2 151


!
L ¡

Anda mungkin juga menyukai