L ------+
OBJETlVOS,DEl CAPíTULO .Tabla 3.' Rendimien~o total a un año para acciones
de fondos cuya estructura de cargos consiste
.1 Describí;' l~ tendencia central de los datos numéricos
en cargos de ventas pagados por los
./ Describir la variación de los datos numéricos activos de los fondos
./ Describir la fonna de una distribución
RENDIMIENTO PORCENTUAL
./ Introducir la gráfica de caja y bigotes [box~and-whiskerl como una herramienta para describir
FONDOS TOTAL A UN AÑO
las características de los datos numéricos
./ Calcular medidas descriptivas de resumen a partir de una población Amcore Vinlage Equity 32.2
Baron Funds Asset 29.5
Introducción Berger SmCoGrow 29.9
En el capítulo anterior analizamos la presentación de 9at05 numéricos y categóricos en forma Chicago Trust Growlnc 32.4
tabular y gráfica. ¿Cómo podemos interpretar esa información? Aunque la presentación de Dodge & Cox DomíniSo 30.5
los datos es una componente esencial de la estadística descriptiva, la tarea no termina ahí. Federated lnstítul MaxCapSve 30.1
Dentro del manejo de la información numérica, un buen análisis de datos no se limita a la First Funds OroIne III 32.1
presentación de datos y la observación de lo que estos tratan de transmitir, también abarca Harris Insighl lnst Haven 35.2
los cálculos y el resumen de las características importantes y el análisis de lo que contienen. Mentor Merger 10.0
En este capítulo se examinan los datos numéricos y sus propiedades. En primer lugar se Rainler Reich Tang 20.6
estudian las medidas de tendencia central, variación y forma. Enseguida se explora el análi-
Robertson Stephens ValGrow 28.6
sis de datos y el cálculo de las medidas descriplivas de resumen a partir de una población.
SSgA S&P500Idx 30.5
Por último, analiza cómo reconocer y realizar resúmenes descriptivos adecuados, además de
SSgA SmallCap 38.0
considerar los aspectos éticos pertinentes.
1784 OrowIne 33.0
Stagecoach CorpStk 29.4
liI
ARCHIVO
Westwood Eq R 37.1 DE DATOS
• EXPLORACiÓN DE DATOS NUMÉRICOS Y SUS PROPIEDADES Acomodados en un arreglo ordenado, los rendimientos totales a un año de estos fondos
de acciones nacionales (en porcentaje) son:
10.020.628.6 28.6 29.4 29.5 29.9 30.1 30.5 30.5 32.1 32.2 32.4 33.0 35.2 37.1 38.0
• CÓMO UTILIZAR LA ESTADíSTICA: Evaluación del rendimiento de fondos mutuos
Aquí, 10.0 Y quizás 20.6 podrían considerarse valores alejados o extremos.
Para introducir las ideas más relevantes de este capítulo, cabe recordar el estudio del rendi-
miento de fondos generales nacionales. Al determinar una estrategia de inversión, será útil Quizá sería interesante analizar las causas que hacen que el rendimiento total a un año de
comparar el porcentaje de rendimiento total a un año de los fondos con base en sus estructu- Mentor Merger fuera tan inferior al alcanzado por los otros fondos cuyos cargos de ventas se
ras dc cargos. Para ilustrar este tipo de evaluación, primero se estudian los 17 fondos cuya pagan con los activos de los fondos. Una comparación del informe de este fondo con los re-
estructura de cargos consiste en gastos de venta pagados con los activos del fondo y luego se portes de los fondos con rendimientos superiores podría proporcionar cierta visión útil para
comparan los rendimientos de las cinco estructuras de cargos. • el análisis de inversiones futuras.
Sin embargo, si nos pidieran examiri.ar los datos y presentar un resumen breve, todo lo
Las tasas de rendimiento total a un año se presentan en la tabla 3.1. Observe que los 17 fon- que se podría esperar sería la formulación de tres afinnaciones que son similares a las ante-
dos se presentan en orden alfabético con los rendimientos totales a un año (en porcentajes). riores, sin un mayor conocimiento de la estadística.
¿Qué podemos aprender de esos datos con el fin de evaluar posibles inversiones futuras? Es posible incrementar la comprensión de lo que significan los datos con un examen más
Con base en esta muestra se pueden hacer las tres observaciones siguientes: formal de las tres propiedades principales que describen un conjunto de datos numéricos:
1. Dos de los fondos obtuvieron un rendimiento total anual de 28.6%, y otros dos fondos tendencia central, variación y foma. I
obtuvieron un rendimiento total a un año de 30.5%. Estos son los valores que ocurren
con mayor frecuencia o valores modales, se considera que este conjunto de datos es
bimodal. Los rendimientos anuales logrados por cada uno de los demás fondos difie- • MEDIDAS DE TENDENCIA CENTRAL, VARIACiÓN Y FORMA
ren entre sí.
2. La dispersión de los rendimientos totales a un año va de 10.0 a 38.0 por ciento. En cualquier análisis o interpretación, se pueden usar muchas medidas descriptivas que re-
3. Parece existir al menos'un rendimiento total a un año inusual o bajo en extremo en es- presentan las propiedades de tendencia central, variación y forma para resumir las caracterís-
te conjunto de datos: el alcanzado por Mentor Merger. ticas importantes de,un conjunto de datos. Si se calculan estas medidas descriptivas globales
102 CAPÍTULO 3 RESUMEN y DESCRIPCIÓN DE DATOS NUMÉRICOS MEDIDAS DE TENDENClA CENTRAL, .'1 ARIACIÓN y FORMA 103
a partir de una muestra de datos. se denominan ~srad{sticos; en cambio. si se calculan para
toda la población de los datos se denominan parámetros. Como los especialistas en estadísti- . I Ejemplo 3.1 Cálculo de la media ariimélica
ca suelen usar muestras en lugar de toda la población, este libro dedicará una mayor aten-
I _'_' ~~ _
---~
Calcule la media aritmética de los rendimicnlos porcentuales totales a un año de los 17 fon-
ción a los estadísticos que a los parámclros, al describir las propiedades de tendencia central,
variación y forma. dos de acciones generales nacionales presentados en la tabla 3.1 de la página 103.
SOLUCiÓN
Medidas de lendencio central
La mayor parte de los conjuntos de datos muestra una tendencia bien determinada a agruparse Primero se asignan los valores XI a los 17 fondos ..
o aglomerarse:alrededor de cierto punto central. Así. para cualquier conjunto específico de da. XI == 32.2 en Arncore Vintagc Equity
tos. casi siempre se puede seleccionar algún valor típico. o promedio, para describir todo el X2 == 29.5 en Baron Fund Assets
conjunto. Este valor Ifpico descriptivo es una medida de tendencia central o uhicación.
XJ = 29.9 en Beeger SmCoGrow
Los cinco tipos de promedios que se utilizan con frecuencia como medidas de tendencia
central son la media aritmética. la mediana. la moda. el rango medio (o centro de recorrido) X4 == 32.4 en Chicago Trust Growlnc
y el eje m('dio. X.s = 30.5 en Dodgc & Cox DominiSo
• Media aritmética La media aritmélica (también llamada media) es el promedio O me- X6 = 30.1 en Federnled Institut MaxCapSvc
dida de tendencia central que se utiliza con mayor frecuencia. Se calcula con la suma de X7 = 32.1 en First Funds Grolnc III
todas las observaciones en un conjunto de datos. dividida entre el número de elementos in- Xg = 35.2 en Harris Insighllnst Haven
volucrados. Así, para una muestra que contiene n observaciones. X" Xl, X), ... , XII' la me. X9 = 10.0 en Mentor Merger
dia aritmética [representada por el símbolo X (llamada "X barra")) puede escribirse como Xro = 20.6 en Rainler Reich Tang
X_ XI + X2 + Xl + ... + X" XJ 1 = 28.6 en Robertson Stephens ValGrow
n X12 = 30.5 en SSgA S&P500ldx
Para simplificar la notación. elténnino XI) = 38.0 en SSgA SmallCap
Media aritmética Se observa que la media de los rendimientos porcentuales totales a un año se calcula en
La media aritmética 'es la suma de los valore~ dividida entre el núme'ro de valores. 29.86. aun cuando ningún fondo específico de la muestra tiene ese valor. Además. se ve en el
diagrama de puntos de la figura 3.1 en la págioa 106 que para este conjunto de datos. seis
observaciones son menores que la media y II son mayores. La media actúa como un punto
de balance de manera que las observaciones más pequeñas 'compensan a las más grandes.
(3.1) Observe que el cálculo de la media se basa en todas las observaciones (XI>X2, X) •... , XII)
del conjunto de datos. Ninguna otra medida de tendencia central de uso común posee esta
donde característica.
x = media aritmética de la muestra
n = tamaño de la muestra COMENTARIO: Cuándo usar la media aritmética
X~ = i-tsima observación de la variable aleatoria X Debido a que su cálculo se basa en todas las observaciones. cualquier valor extremo afec-
ta mucho a la media aritmética. En ese caso, la media aritmética es una representación
fx¡ = suma de todos los valores Xi en la muestra (véase el apéndice B) distof5ionada de lo que transmiten los datos; entonces, la media no es el mejor promedio
~.l
para describir o resumir un conjunto de datos que tiene valores extremos. Esto es lo que
sucede en el ejemplo 3.1.
El cálculo de la media aritmética se ilustra en el ejemplo 3.1.
r/G%RA 3. J D¡ogra~o de puntos que represento los rendimienfos porcentuales lotoles o un año que obtuvieron 17
on os generales nOCIonalescon cargos de venIa pagodas par los activos del fondo La ccuación (3.2) se usa paro encontrnr el lugar correspondiente a la mediana en el arreglo
ordenado, según una de dos reglas:
REGlA 1 Si el tamaño de la muestra es un número impar, entonces la mediana está repre-
Pa.ra mostrar. cl efecto que pueden tencr los valores extremos cuando se resume y se sentada por el valor numérico que corresponde a la p:>sici6n (n + 1)/2 de las observaciones
descnbe la propIedad de la tendencia central, suponga que se elimina el valor extremo de ordenadas.
Mentor Merger. En el ejemplo 3.2 se explora el cambio de la media aritmética de los rendi- REGlA 2 Si el tamaño de la muestra es un número par, entonces la posición se encuentra
mientos porcentuales totales a un año. .
entre las dos observaciones que e.c;tána la mitad del arreglo ordenado. La mediana es el pro-
medio de los valores numéricos de estas dos observaciones.
'Ejemplo 3.2 Cálculo de la media arit;nélic~ El ejemplo 3.3 ilustra el cálculo de la mediana.
Calcule la media aritmética para los rendimientos porcentuales a un año después de elimi~ar
el valor cxtremo Mentan Merger.
Ejemplo 3.3 álculo Úla' mediana 0- partir
SOLUCiÓN de una m'lles/ra de tamaño impar
La media aritmética de esta muestra de 16 fondos se calcula como siguc: Del ejemplo del porcentaje de rendimientos a un año que obtuvieron los fondos de acciones
h
X = ~ = 32,2 + 29,5 + 29,9 + ' , , + 28,6
gen.erales (con cargos de venta pagados por los activos de los fondos), los datos sin procesar
(en bruto) son los siguientcs.
n 16 31.11 32.2 29,5 29,9 32.4 30,5 30,1 32.1 35,2 10.0 20.6 28,6 30.5 38,0 33,0 29.4 37.1 28.6
Al eliminar el valor de Mentor Merger, la media aritmética aumenta de 29.86 a 31.11. Calcule la mediana.
SOLUCI6N
El diagrama de puntos Com:spondiente se prescnta en la figura 3.2. El arreglo ordenado es
10,020,628.628.629.429.529,930,1 '30.5 30,5 32,1 32,232.4 33,0 35,2 37.1 38,0
i
Mediana
! • Observación ordenada i
5 JO 15
!
20
!
25 !8e~y r 234 567 8 '9' 10 11 12 13 14 15 16 17
35 40
Mediana :: 30.5
Para estos dalaS, la posición es la novena observación (es decir, (n + 1)/2 = (17 + 1)12 =
X=31.'11 9J. Por tanto, la mediana es 30.5.
F'GU~ 3.2 Diogromo d? puntos que represento el porcentaje de rendimientos tolales o un año logrados por 16 fondos
de aCCionesgenerales nOCIonalescon corgos de venia pogodos por 10.$odivos de los fondos Como puede verse en el arreglo ordenado del ejemplo 3.3, las observaciones ex.tremas no
afcctan a la mediana. No importa si el menor porcentaje de rendimiento total a un año es 1.0,
10.0 o 20.0. la mediana sigue sicndo 30.5.
• Mediana .La mediana es el .valor medio de un arreglo ordenado de datos. Si no hay Además. al calcular la mediana se ignora que pueden existir datos repetidos. En el ejem-
empates, la mitad d.c las observaCIones será menor y la mitad, mayor. Ninguna observaci6n plo 3.3, dos de los fondos (Robcrtson Stephens ValGrow y Wright Yacktman) alcanzaron el
extrema ~n un conjunto de datos afecta a la mediana. En consecuencia, siempre quc una mismo porcentaje de 28.6 en cl rendimiento total a un año. Sin embargo, esta cantidad no tu-
observaCIón extrema esté presentc, es adecuado usar la mediana en lugar de la media para vo impacto en el valor real de la mediana. Por otra parte, otros dos fondos (Dodge & Cox
describir el conjunto de datos. DominiSo y SSgA S&P500Idx) lograron el mismo rendimiento porcentual de 30.5 en un
Para calcular la medi~na de un conjunlo de datos, primero se organizan en un arreglo or- año, que es igual al valor de la mediana. Entonces, para esta muestra de tamaño impar, la po-
denado. Entonces la me(liana puede oblcnerre COmo: sición de la media~a es la observación (n + I)n. = 9 en el arreglo ordenado, y la mediana es
106 RESUMEN y DESCRIPCiÓN DE DATOS NUMl':;RICOS MEDIDAS DE TENDENOA CF.l'/TRAL, VARIACiÓN y FOR.!.{A 107
I 30.5. el valor que está en la mitad de la secuencia ordenada, aun cuando la observad6n en la
posición 10 lambitn es 30.5. El ejemplo 3.4 ilustra el cálculo de la mediana para una mues-
tra de tamaño par.
- . -~--~----------,
• Moda La moda es el valor que aparece con mayor frecuencia en un conjunto de da-
tos. A diferencia de la media aritmética, la ocurrencia de algún valor extremo no afecta a
la moda. Sin embargo, la moda se usa sólo para fineS descriptivos, porque varia más entre
muestras que otras medidas de tendencia central. El ejemplo 3.5 ilustra el cálculo de la moda.
Calcule la mediana.
SOI.UCIÓN
SOLUCIÓN
El arreglo ordenado para estos datos es
El arreglo ordenado es
7.35 11.62 14.07 14.09 16.95 17.30 18.26 18.60 20.34 21.17 21.69 24.01 26.10 37.61
7.35116214071409 16.95 17.30 18261'18.60 2034 21.17 21.69 24.0126.10 37.61
No hay moda en estos datos. Ninguno de los valores netos de los activos es el que "aparece
ObservaCión ordenada con mayor frecuencia".
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Mediana = 18.43
Para estos datos. el lugar de la mediana es (n + 1)12 = (14 + 1)12 = 7.5. Por L1nto.la me- • Rango medio El rango medio es cI promedio de la observación mds pequeña )' la ob.
diana se obtiene con el promedio de l:ts observaciones en las posiciones 7 y 8 del arreglo or. servación más grande en un conjunto de datos. Esto puedc escribirse como sigue:
denado:
18.26 + 18.60 • 8
2 =,1 .43 Rango medio
El rango medio se obtiene con la suma del valor más pequeño y el valor más gran-
de divida entre 2.
Para resumir, el número de observaciones que afecta al cálculo del valor de la mediana.
no así a la magnitud de cualquiera de los extremos. Si se ignora la posibilidad de igualdad en
los valores de los datos. que por lo común puede atribuirse a mediciones imprecisas. cual- (J.J)
quier observación seleccionada al él1.ares tan susceptible de exceder a la mediana como de
ser excedida por ella.
El ejemplo 3.7 ilustIl el cálculo del rango medio.
108 CArtnn.o 3 RESUMEN y DESCRIPCiÓN DE DATOS NUMÉRICOS MEDIDAS DE TENDE.•••CIA CENrRA(., VARIACiÓN y FORM:A 109
lEJé"}pio. 3,1 '""C?truí,,"""d;Y7ango medio 1 Tercer cuartil, Q3
Utilice el arreglo ordenado de los rendimientos totales a un año que obtuvieron los fondos El tercer cual1i1, Q). es un valor tal 'que 75.0% de la<;observaciones sao menores y
generales nacionales -cuyos cargos de venta se pagan con los activos de los fondos- (véa- 25.0% son mayores.
se el ejemplo 3.3 en)a página 107) y calcule el rango medio.
Ql = 3(n: 1) observación ordenada en la posición (3.5)
SOLUCiÓN
= + = observación
- _. - ~ o ~
El primer cuartil, Ql, es un valor tal que 25.0% de las observaciones son menores Por tanto, al aplicar la regla 2, Ql se puede aproximar por el promedio de las observaciones
y 75.0% son mayores. 13 y 14.
_ 32.4 + 33.0 _ 327
__ (n + 1) Q'---2--- .
Q, 4 observación ordenada en la posición (l.4)
"
110 REsUMEN y DESCRiPCION DE O..••TOS rlUMEUCOS MEDID ..••S DE TEt-'DENCI ..••CENTRAL, VARIACION y FORMA 111
1,
il • Eje medio El .eje medio es una medida de resumen que se usa para superar posibles
problemas que intn:xluctn los valores extremos en los datos. El eje medio se calcula al rea-
FtGURA 3.3
Oo~ d¡~lribuciones ~imélriccs
i lizar el promedio del primer y ltrur cuarti/ de un conjunto de datos. en formo de campano que
1 di~eren sólo en lo tendencia
central
Eje medio
El eje medio se obtiene con la suma del primer y tcrcer cuartil dividida entre 2.
.• , " Q +' .
Eje medio = -~ (J,6) .
donde
Paro calcular el eje medio, es necesnrio calcular primero QI y QJ. Esto se mueSlrn en el
ejemplo 3.9.
SOLUCiÓN
En el ejemplo 3.8 en la página 1ti se determinó que Ql = 29.0 Y Ql = 32.7. De nuevo con
la ecuación (3.6), ahora se calcula el eje medio como
• Rango El rango es la diferencia entre la observación más grande y la mds pl!queña
Eje medio = Ql + Ql de un conjunto de dalas.
2
_ 29,0 + 32,7 ~ 3085 Rango
2 '
El rango es igual al valor más grande menos el más pequeño.
Rango';' Xrmls~ - Xnds ~udla (J,7)
Es importante indicar que los valores extremos potenciales no afeclan al eje medio o al
promedio de Ql y Ql, ya que ambas son medidas de posición no central, porque no se consi. La ecuación (3.7) se aplica en el ejemplo 3.10.
dera ninguna observación menor que Ql o mayor que Ql' Las medidas de resumen como el
eje medio y la mediana. que no dependen de valores extremos, se llaman medidas rohu.<;tas.
Ejemplo 3.10 Cálculo del rango
Medidas de variación Utilice el arreglo ordenado de los rendimientos totales a un año que obtuvieron los fondos
Una segunda propiedad importante para describir un conjunto de datos numéricos es la va- generales nacionales -cuyos cargos de venta se pagan con los activos de los fondos- (véa.
riación. L:l \'ariación es la canlidad de dispersión. o "separación", que presentan los dntos. se el ejemplo 3.3 en la página 107) para calcular el rango.
Dos conjuntos de datos pueden diferir tanto en la tendencia central como en la variación; o
bien, como se muestra en los polígonos de la figura 3.3 en la página 113. dos conjunios de SOLUCiÓN
datos pueden lener las mismas medidas de tendencia central pero diferir en términos de va. El arreglo ordenado pnra estos datos es
riación. El conjunio de datos descrito por el polígono e de la figura 3.4 e.<;mucho menos
10,020,628,628.629,429.5 29,9 30,1 30,5 30.5 32,1 32.232.4 33.0 35,2 37,1:38:6
variable que el del polígono A.
Cinco medidas de variación incluyen el recorrido, el rango ¡mucuarlil, la varianza, la Para estos datos, el rango es 38.0 - 10.0 = 28.0.
desviación estc1"dar y el coeficieme de variación.
112 CArfTIJI.o 3 RESUMEN y DESCRIPCIÓN DE DATOS NUMÉRICOS MEDIDAS DE 1F.NDENCIA CENTRAL, VARIACiÓN Y FORMA 11:
El rango mide la dispersión total en el conjunto de dalos. Aunque es una medida sencilla SOLUCl6N
de la variación total en los datos. su debilidad característica consiste en que no loma en 'E1 arreglo ordenado es
Cuenta cómo se distribuyen los datos entre los valores más grande y más pequeño. Esto pue-
10.020.628.628.629.429.5 29.9 30.1 30.530.5 32.1 32.232.4 33.0 35.2 37.1 38.0
de observarse en la figura 3.5. Como se muestra en la balanUl C. sería inadecuado utilizar el
rango como medida de variación cuando al menos uno de sus elementos es una observación En el ejemplo 3.8 de la página 111, se detc"nnin6 que Ql = 29.0 Y Q3 = 32.7, para estos da-
extrema. tos. De nuevo con la ecuación (3.8),
Rango intercuartil = 32.7 - 29.0 = 3.7
El intervalo 29.0 a 32.7 suele recibir el nombre de mitad central. Esta es la dispersión media
f'GURA 3.5
o rango inlcrcuartil de los rendimientos totales a un año que obtuvo la mitad untra/ de los
Comparación de tres O
conjuntos de dolos O
17 fondos de acciones generales nacionales con cargos de venta pagados por los activos de
los fondos.
que tienen rengas iguales
O
O
O
8
O
O
O O
7 8 9 11 12 13
• Varianza y dl'n'iaci6n estándar Aunque el rango cs una medida dc la dispersión to-
Balanza A lal y el rango intcrcuartil es una medida de la dispersión media, ninguna de estas medidas
de variación toma en cuenta cómo se distribuyen o se agrupan las observaciones. Dos me-
O didas de variación de uso común que sí (oman en cuenta la distribución dc los valore." de
O
O los datos son la varianza y su raíz cuadrada, la desviaci6n est6ndar. Estas medidas evalúan
O
O O O O O 8 8, la mancra en que fluctúan los valores respecto a la media. La varianza de la muestra es ca.
"ZÚ
, , si el promedio de los cuadrados dc las difcrencias ~ntre cada observación en un conjunto
¡ 8 9 13
de datos y la media.
Entonces, para una muestra que contiene n observaciones. Xl>X2• X) •..• X". la varianza
Balanza B
de la muestra (representada por S2) puede escribirse como
O , (X, - K¡' +
S = --------------
(X, - K¡' + (X, - X¡' + ... + (X. - X¡'
O O
O O 0-1
O O
O O Si se usa la notación de suma. esta fórmula se puede expresar como sigue.
O O O
7 8 9 10
Varianzo de la muestro
Balanza e La vlIriam.3 de la muestra es la suma de los cuadrados de las diferencias con rela-
ción a la media aritmética dividida entre el tamaño de la muestra menos 1.
• Rango intercuartil El rango intercuartil (también llamado dispersión media) es la I(x, - K¡'
diferencia entre el primu y tuur cuartilen un conjumo de dalaS. S- - ;-. (3.9)
0-1
donde
Rango intercuartil x = media aritmética de la mue.')tra
n = tamaño de la muestra
El rango intercuartil se obiiene al restar el primer cuartil del tercer euartil.
X¡ = j-ésima observación de la variablc alcatoria X
Rango intercuartil = Q3 - Ql (3.&)
i
¡•••
,
(XI - 'X)2 = suma ~ los cuadrados de las diferencias entre los valores Xi y la
media X
Esta medida considera la dispersión de la mitad (parte cenlJ'al) de los datos; por tanto. los va-
lores extremos no influyen en ella. El ejemplo 3.11 ilustra el cálculo del rango intercuartil. Si el denominador fuera n en lugar de n - 1, se obtendrfa el promedio de los cuadrados
de las diferencias con respecto a la media. Sin embargo. se utiliza n - I debido a ciertas
propiedades matemáticas deseadas que ticne el estadístico 52. las cuales lo hacen apropia-
. Ejemplo 3. j j CálCl/lo del ral/go ¡nterc'l/aria do para hacer inferencias estadísticas (que se estudiarán en el capítulo 5). Al aumentar el
tamaño de la muestra. la diferencia entre n y n - 1 disminuye cada vez más.
Utilice el arreglo ordenado de los rendimientos totales a un año de los fondos de valores ge- Ahora enfocaremos nuestm atención en la medida más práctica, la desviación están-
nerales nacionales con cargos de venta pagados por los activos de los fondos (véase el ejem- dar de la muestra. Esta medida, representada por el símbolo 5. es la raíz cuadrada de la
plo 3.3 en la página 107) para calcular el rango intercuartil. varianza de la muestra. Se expresa de la siguiente manen!.
114 CAI'ITULO 3 RESUMEN y DESCRIPCIÓN DE DATOS NUM~RICOS MEDIDAS DE TENDENOA CENTRAL, VARIA06N y FORMA I1S
Desviación estándar de la muestra Rendimientos totales a un año
fo1o<1>OSm: ACCIO:"F.S
La desvinción estándar de la muestra es la raíz cuadrada de la suma' del cúadmdo de las G~:NERAI.F.s NAClONo\CES X, X (X, - X) (Xi - x"i
diferencias con relación a la media aritmética. dividida entre el tamaño de la muestra'
Amcore Vinlage Equity XI = 32.2 29.86 +2.34 5.4756
menos l.
Baron Funds Asset Xl = 29.5 29.86 -0.36 0.1296
= 41.15995
Ejemplo 3.12 Cálcnlo dc la varianza J la desviación
estándar de la muestra De la ecuación (3.10), la desviación estándar de la muestra S se calcula como
Para la muestra que contiene 17 fondos de acciones generales -con cargos de venta paga-
dos por los activos de los fondos-, los dalaS sin procesar de los rendimientos totales a un t(X I- "X¡'
año son los siguientes. s=vs-= ,.,
n - 1
= \/41.15995 = 6.42
32.229.529.932.4 30.5 30.1 32.1 35.2 10.020.628.630.538.0.33.029.4 37.1 28.6
La media aritmética de estos datos se calcula como X = 29.86. Calcule la varianza de la
muestra S2 y la desviación estándar de la muestra S. Al realizar los cálculos del ejemplo 3.12, las diferencias entre cada observación y la me-
SOLUCIÓN
dia se elevaron al cuadrado; por tanto, la varianz.ay la d~sviación estdndar no pueden su
ntgalivas. Para que S2 y S fueran iguales a cero no debena existir ninguna variación en los
Siga el procedimiento de cuatro pasos para calcular la varianza S2 con base en la tabla pre- datos, es decir, lodas las observaciones en la muestra debenan ser exaClamente iguales. En
sentada cn la página 117. este improbable caso, el rango y el rango imercuartil (intervalo entre cuartiles) también se-
A partir de la ecuación (3.9), la varian7.ade la muestra es nan iguales a cero.
Pero los datos numéricos, por naturaleza, son variables no constantes. Cualquier fenóme-
S2 =
2:(X¡ -
~¡.~, _
"XJ' no alcatorio de interés puede adquirir una amplia variedad de valores. Por ejemplo, diferen-
tes fondos d~ acciones generales obtienen distimos rendimientos a un año, y además presen-
n-I tan diferentes valores de activos y tasas de gaslos. Entonces. la importancia dc estudiar, no
sólo las medidas de tendencia central que resumen los datos, sino también las medidas de
= (32.2 - 29.86)' + (29.5 - 29.86)' + (29.9 - 29.86)' + ... + (28.6 - 29.86)'
variación que reflejan la dispersión de los datos numéricos. se debe a esa variación intrínseca
IJ - 1
de los datos.
116 C,ulTln.o 3 RESUMEN y DESCRIPCIÓN DE DATOS NUMÉRICOS MEDIDAS DE TENDENCIA CENTRAL, VARIACiÓN Y FORMA lli
Los cuadrados de las desviaciones respectivas de los 17 fondos de acciones generales se
COMENTARIO: JnlerpT~/nci6n d~ la variallZtl y d~sviaci6n l!stándar
. presentan en la última columna de la tabla del ejemplo 3.12 de la página 116. Note que la
La varian7.8 y la desviación estándar miden la dispersión "promedio" alrededor de la me- observación en la posición 9, X9 = 10.0, lograda por Mentor Merger, es 19.86 menor que
dia: cómo fluclúan las observacione.~ mayores arriba de ella y las observaciones menores la medida del rendimiento medio de 29.86 y observación 10, XLO = 20.6, que obtuvo Rainler
abajo de ella. La varianza posee ciertas propiedades matemáticas útiles. Sin embargo, su Reich Tang, es 9.26 más baja. En el proceso de elevar al cuadrado, ambos valores, junto con
cálculo se expresa en unidades al cuadrado, porcentajes cuadrados, dólares al cuadrado, las observaciones 13 y 16 (SSgA SmallCap y Westwood Eq R), contribuyen mucho más en
pulgadas cuadradas, etc. Por tanto, la medida principal de la variación será la desviación el cálculo de SZ y S de lo que contribuyen otras observaciones en la muestra que están más
e.~tándar, cuyos valores se expresan en las unidades originales de los datos, tales como cercn de la media. Por tanlo, es posible hacer la generalización presentada en el cuadro 3.2.
rendimientos, dólares o pulgadas.
La desviación estándar indica cómo se agrupa o distribuye un conjunto de datos alrededor Cuadro 3.2 Camprensión de la variación en las datos
de la media. Para la mayor parte de los conjuntos de datos, la mayoría de los valores obser- ./ 1. Cuanto más dispersos estén los datos, mós aumenfaró el rango, el rango inter.
vados C<'lendentro de un intervalo que corresponde a la media arit,!!ética más/menos una cuartil, lo varianza y lo desviación estóndar.
desviación estándar. Esto implica que el intervalo comprendido entre X:t IS, por lo general, ./ 2. Cuanto mós concenlrodos, u homogéneos, seon los dolos, disminuiró el rango,
incluye al menos una mayoría de los valores de los datos. POr consiguiente, el conocimiento el rango infercuartil, la varianza y lo desviación esfándar.
de la media aritmética y la desviación estándar ayuda a definir en d6nde se agrupan la mayor
./ 3. Si los observaciones son todos iguales (de manero que no hoy variación en los
parte de los dalas.
dalas), el rango, el rango inferclIOrtil, lo varianza y lo desviación esfóndor se-
rón iguales o cero .
./ 4. las medidos de variación (rango, rango intercuartil, varionza y desviación es-
.COMBNTAHIO: Qué indica la desviación esJándar
fóndar) nunca son negafivos.
En la muestra que contiene 17 fondos de acciones generales (con cargos de venta paga.
dos por los activos de los fondos) la desviación estándar de los rendimientos totales a un
año es 6.42. Esto indica que los rendimientos totales a un año para la mayor parte de las • Coeficiente de PQriación A diferencia de las medidas que hemos estudiado hasta aho-
acciones de los fondos en esta muestra se agrupan dentro de 6.42 alrededor de la media ra, el coeficiente de variación es una indicación Telatipa de la variación. Siempre se ex-
de 29.86 (es decir, se agrupan entre X - IS == 23.44 Y X + IS:; 36.28). De hecho, se presa como porcentaje, no en ténninos de las unidades de los dalas específicos.
observa que 76.5% de los rendimientos letales a un año de los fondos (13 de los 17) se El coeficiente de variación, denotado por el símbolo ev, mide la dispersión en los datos
encuentran en eSle intervalo.
con relación a la media y se calcula como se indica a continuación.
Cabe indicar que las fónnulas para la varianza y desviación estándar [ecuaciones (3.9) y Coeficiente de variación
/
(lIO)} no se pueden ulilizar
El coeficiente de variación es igual a la desviación estándar dividida entre la inedia
" aritmética, multiplicada por 100 por ciento.
¿(X, - Xl
'o,
como numerador porque, como se recordará, la media actúa como punto de balance para ob. CV = (~)\OO% (3.11)
'Vloft lo prudxl ti' tt servaciones mayores y menores que ella. Asr, la suma de las desviaciones respecto a la me.
apim/iu B. dia siempre es cero; I es decir, donde
Para demostrareslo, recuerde de nuevo el ejemplo 3.12 en la página 116. En la cuarta co-
lumna de la tabla se observa que la suma de las diferencias entre cada valor y la media [es El ejemplo 3.13 ilustra el cálculo del coeficiente de variación.
dos de las desviaciones permite estudiar la variación en los datos. Entonces se usa la fórmula
: Ejemplo 3.13 Cálculo del coeficiente de variación
Para la muestra que contiene los 17 fondos de acciones generales nacionales (con cargos de
venta pagados con los activos de los fondos), los dalos sin procesar de las tasas de rendi-
miento total a un año (en porcentaje) son
para calcular la varian7.a y la desviación estándar. En el proceso de elevar al cuadrado, las 32.229.5 29.9 32.4 30.5 30.\ 32.1 35.2 10.020.628.630.538.033.029.437.\ 28.6
observaciones que se encuentron más lejos de la media adquieren más peso que las más cer- Calcule el cocficie~te de variaci6n.
canas.
SOLUCiÓN SOLUCI6N
En estos dalos. la tasa media de rendimiento total a un año X es 29.86, y la desviación están- "En lénninos de las desviaciones estánd:lr, el precio de las acciones de A parece más volátil
dar S es 6.42. Al aplicar la ecuación (3.11) se liene que el coeficiente de variación es que el de las acciones de B. Sin embargo. como los precios promedio por acción de las dos
compañías son tan diferentes, seria más conveniente que el inversionista potencial conside.
Cv = (i)100% ~ (;;~~)IOO%~ 21.5% rara la variabilidad en precio respecto al promedio a fin de examinar la volatilidad/estabili-
dad de ambas acciones.
Paro este ejemplo, el tamaño relativo de "la dispersión media alrededor de la media" con re- Para la compañía A, el coeficiente de variación es CVA = ($101$50)100% = 20.0%; para
lación a la media es 21.5 por ciento. la compañía B, el coeficiente de variación es CVB = ($41$12)100% = 33.3%. Entonces, en
relación con la media, el precio de las acciones B es mucho más variable que .el de la~ acciQ-
nes A.
Como medida relaliva. el coeficiente de variación resulta especialmentc útil cuando se
compara la variabilidad de dos o más conjuntos de datos, que se expresan en diferentes uni-
dadcs de medida. Esto se mucstra en el ejemplo 3.14.
Forma
- - ----" La lercera propiedad importante de un conjunto de dalOs es su fonna, es decir, la manera Cll
Ejemplo 3.14 Comparación de dos coeficientes de variación que se distribuyen los datos. La distribución de los dalas es simélrica o no lo es. Si no es si-
métrica, recibe el nombre de distribución asimllrica o sesgada.
Suponga que el gerente de operaciones de un servicio de paquetería desea adquirir una nue- Para describir la fonna. solamente se deben comparar la media y la mediana. Si ambas
va flotilla de vehículos. Cuando los paquetes se guardan con eficiencia en el interior de los medidas son iguales. por lo general se considera.que los datos son simétricos (o con usgQ
vehículos -durante la preparación de [as entregas-, se deben considerar dos restricciones aro). Por el contrario, si la media excede a la medinna, los dalas se describen como sesga-
principales: el peso (en libras) y el volumen (en pies cúbicos) de cada paquete. dos a la derecha. o con sesgo positivo. Si la mediana excede a la mcdia. los datos suelcn lla-
Ahora suponga que en una muestra de 200 paquetes, el peso promedio es 26.0 libras con marse sesgados ala i7.quierda, o con sesgo negoti\,o. Es decir,
una desviación estándar de 19 libras. Además. suponga que el volumen promedio de cada
paquete es 8.8 pies cúbicos con una desviación eslánd3r de 2.2 pies cúbicos. ¿Cómo se pue- media> mediana: sesgo positivo o a la derecha
de comparar la variación del peso y el volumen? media = mediana: simetría o sesgo cero
SOWCIÓN
media < mediana: sesgo negativo o a la izquierda
Como las unidades de medida difieren para las restricciones de peso y volumen. si el gerente El sesgo posilivo surge cuando la media aumenta debido a algunos valores grandes y po.
de operaciones desea comparar las fluctuaciones en estas medidas, debe considerar la varia- ca usuales; el sesgo negativo ocurre cuando la media se reduce debido a algunos valores
bilidad relativa en ambos tipos de medidas. Para el peso, el coeficiente de variación es muy pequeños. Los datos son simélricos cuando en realidad no hay valores extremos en nin-
CVw = (3.9126.0)100% = 15.0%; para el volumen. el coeficienle de variación es CVv guna dirección. de tal manera que los valores grandes y pequeños se equilibran.
= (2.218.8)100% = 25.0%. Entonces. con relación a la media, el volumen de un paquete es La figura 3.6 muestra la fonna de tres conjuntos de datos. Los datos en el cuadro (a) tienen
mucho más variable que su peso. sesgo negativo o a la i7.quierda. Se observa una cola larga y una distorsión hacia la izquier-
da. causada por valores en extremo pequeños. Estos valores tan pequeños jalan la media ha-
cia anajo y resulta menor que la mediana.
El coeficiente de variación es muy útil cuando se eomparan dos o más conjuntos de dalas
que se miden con las mismas unidades. pero son tan diferentes que una comparación directa
de las desviaciones estándar respectivas no ayuda mucho. Esl0 se ilustra en el ejemplo 3.15.
,,
Ejemplo 3.15 Comparación de dos coeficientes de variación ,,
Suponga que un inversionista potencial piensa adquirir acciones en una de dos compañfas, A
,,
o B.listadas en la Bolsa de Valores de Nueva York. Si ninguna de las compañías ofreee di.
,,
videndos a sus clientes y ambas lienen igual clasificación (según varios servicios de inver-
, ~ ,
(JlI Sesgo negativo o a la izquierda \ lb) Simétrico
sión) en téoninos de crecimiento potencial. el posible inversionista quizá considere la volati.
Iidad (variabilidad) de ambas acciones para ayudar en la decisión de inversión.
Ahora suponga que cada acción en la compañía A ha promediado 50 dólares en los últi. FIGURA 3.6 . Comparación de tres conjuntos de dolos cuyo f~mo difiere
mas meses, con una desviación estándar de 10 dólares. Además. suponga que durante el
mismo periodo el precio promedio de las acciones en la compañía B fue de 12 dólares con
Los dalas en el cuadro (b) son simétricos; cada mitad de la curva es la imagen de espejo
una desviación estándar de 4 dólares. ¿Cómo puede delenninar el inversionista cuáles acciQ-
de la otra mitad. Los valores grandes y pequeños se compensan y la media es igual a la me-
nes son más variables?
diana. Los datos en el cuadro (c) tienen un sesgo positivo o a la derecha. Se observa una cola
120 CAl1nsl.O 3 RESUMf ••'Il y DESCRIPCiÓN I)EOATOS NUM£RICOS MEDIDAS DE TE."mENCIA CENTRAL. VARIACiÓN Y FORMA 121
larga hacia la derecha de la distribución y una distorsión hacia I~ dere:ha, e.ausada por valo~ • Salida de Microsoft Ercel La figura 3.7 representa la infonnación de salida que se ob-
res muy grandes. Estos valores en extremo grandes jalan la medlll hac~a amba y resulta ma- tuvo con la opción "estadística descriptiva" de la 'herramienta de análisis de datos de
yor que la mediana. En el ejemplo siguiente se analiza cómo se detenmnan estas foonas. Microsoft Excel.
El ejemplo 3.16 ilustra cómo determinar la forma de un conjunto de datos. Excel proporciona la media (aritmética), la mediana, la moda, la desviación estándar, la
varianza. el fango (mínimo, máximo) y el conteo (tamaño de la muestra), que se analizaron
en esta sección, Además, Excel calcula el error estándar (indicado como error típico), junto
Ejemplo 3.16 Determinación de la forma de ~m'conjunto con los estadísticos de curtosis y sesgo. El error estándar es la desviación estándar dividida
de dalos . entre la raíz cuadrada del tamaño de la muestra y se estudiará en el capítulo 5. El sesgo es
una medida de falta de simetóa en los datos y se basa en un estadístico que es una función
Para la muestra que contiene Jos 17 fondos de acciones generales con cargos de ventas pag_a- del cubo de las diferencias alrededor de la media aritmética. El curlosis es una medida de la
dos con los activos de los fondos, los datos sin procesar de los rendimientos totales a un ano concentración relativa de valores en el centro de la distribución comparado con las colas, y
son se basa en las diferencias alrededor de la media aritmética elevadas a la cuarta potencia. Esta
32.229.5 29.9 32.4 30.5 30.1 321 35.2 10.020.628.630.5 38.033.029.437.1 28.6 medida no se estudia en este libro (véase la referencia 4).
Y los datos se presentan en el diagrama de puntos de la figura 3.1 en la página 106. ¿Qué se
puede decir de la forma de estos datos? Salida de Minitab La figura 3.8 representa las estadísticas descriptivas (que se obtuvieron
con Minitab) para los rendimientos totales a un año de los fondos de acciones generales na-
SOLUCIÓN cionales, que se clasificaron de acuerdo con la lista de cargos.
Observe que hay un valor extremo en este conjunto de datos, y las 17 observaciones no se
agrupan en fomla simétrica alrededor de la media aritmética. El rendimi~nt? porcentual total
Descriptive Statistics
a un año (10.0) que obtuvo Mentor Merger es mucho menor que el rendimiento de todos los
fondos restantes de la muestra. En el ejemplo 3.1 de la página 105, la mediana calculada fue
29.86. En el ejemplo 3.3 de la página 107 la mediana fue 30.5. Por ta.nto, debido a ~ue la Variable GI:OUP 11 Mean 'ledian TrUean StDev
lYr~Ret 1 17
media es menor que la mediana este conjunto de datos puede ser descnto como negativo, O 29.86 30.50 30.65 6. '12
2 S 31.22 30. '10 31.22 2. '12
sesgado a la izquierda. 3 19 32 .'18 30.50 32 .oe 5.97
4
S "
107
32.035
31.111
31.'100
30.500
31.929
30.93'1
6. '1'15
5.065
•
Aplicación de conceptos
Problemas para la sección 3.2
3.7 El gerente de operaciones de una planta que fabrica llantas desea comparar el diámetro
Aprendizaje de conceptos básicos interno real de dos clases de llantas, los cuales se espera que sean de 575 milímetros. Se
seleccionó una muestra de cinco llantas de cada clase, y los resullados que representan el
3.. De acuerdo con el siguiente conjunto de datos de tina muestra de tamaño 11::= S:
diámetro interno de las llantas, ordenados de menor a mayor, son:
7 4 9 2 Clase X Clase Y
(a) Calcule la media, la mediana, la moda, el rango medio y eje medio. 568 570 575 578 584 573 574 575 577 578
(b) Calcule el rango, rango intercuartil. v.arianza, desviación estándar y coeficiente de va- (a) Para cada clase de llantas, calcule
riación. (1) la media aritmética (2) la mediana (3) la desviaciónestándar
(c) Describa la fOlma. (b) ¿Qué clase de llanta proporciona la mejor calidad? Explique.
• 3.2 De acuerdo con el siguiente conjunto de datos de una muestra de tamaño 11 = 6: (e) ¿Cuál sería el efecto en las respuestas de (a) y {b) si el último valor para la clase Y
fuera 588 en lugar de 578? Explique.
7 4 9 12
3.8 Cada mes el gobierno federal reporta la mediana de los precios de Ins casas que se ven-
(a) Calcule la media, la mediana, la moda, el rango medio y eje medio. den en Estados Unidos. Los economistas consideran esta estadística como un indicador
(b) Calcule el rango, el rango intercuartil, la varianza, la desviación estándar y el coefi- económico importante.
I ciente de variación. (a) ¿Cuál cree que es mayor, la mediana o la media aritmética?
I (b) La distribución de Jos nuevos precios de las casas ¿es sesgada o aproximadamente
(e) Describa la forma.
• 3.3 Con base en el siguiente conjunto de datos de una muestra de tamaño Il = 7: simétrica?
(e) ¿Por qué cree usted que se reporta la mediana y no la media aritmética?
12 7 4 9 o 3.9 La siguiente tabla contiene una muestra aleatoria de 30 fondos mutuos -que se tomaron
(a) Calcule la media, la mediana, la moda, el rango medio y el eje medio de 6,858 fondos mutuos--- publicados en el diario USA Today el 2 de febrero -de 1999.
(b) Calcule el rango, el rango intercuartil, la varianza, la desviación estándar y el coefi- Para cada fondo, el rendimiento anual se da como porcentaje.
ciente de variación.
RENDIMIENTO RENDIMIENTO
(c) Describa la forma.
FONDO MUTUO ANUAL{%) FONDO MUTUO ANUAL (%)
3.4 Dado el siguiente conjunto de datos de una muestra de tamaiio n = 5:
Advuntus Bond 0.2 Federated CAMunA 08
7 -s -8 9
Aim Funds HYJdC 1.4 Federated MtgFdSS 0.5
(a) Calcule la media, la mediana, la moda. el rango medio y el eje medio Amer Advant StrMod 1.0 Fide1ity Chemical -4.3
(h) Calcule el rango, el rango intercuartil,}a varianza, la desviación estándar y el coefi- Artision Funds SmCap -5.2 FirstAmerican LgCap 5.5
ciente de variaciÓn.
CalifTnrst S&P500 J.8 Firth Third Balanced 1.7
(e) Describa la forma.
3.5 Dado el siguiente conjunto de datos de una muestra de tamaño Il = 7: Colonial Balance 2.5 Kemper AggGrB 1.4
,,. Colonial Income 06 Merrill Lynch CaMA 1.1
J J J
Delaware Tx USA 0.9 Nicholas Group Nich -0.7
(a) Calcule la media, la mediana, la moda, el rango medio y el eje medio. Dimension EmgMkt -1.1 North Amer GIEqB -1.1
(b) Calcule el rango, el rango intercuartiJ, la varianza, la desviación estándar y el coefi- Dodge&Cox Stock ~O.l One Group AstAJ 1.0
ciente de variación.
Dreyfus FMLA 06 Prudential Eqincm 0.6
(e) ¿Qué hay de raro acerca de este conjunto de datos?
• 3.6 Con base en los siguientes conjuntos de datos, cada uno con muestras de tamafio !l = 7: Dreyfus OHMA 1.0 Putnam Income 0.5
Eaton CIMB 0.9 SoGen Funds Gold JO
Conjunto 1: 10 2 J 2 4 2 S
Empire TfBond
liI
ARCHIVO
09 ren-IPleton GIBdA -0.5
Conjunto 2: 20 12 13 12 14 12 15 DE DATOS
Evergreen GLLeadB -1.0 Van Kamp EGB 9.6 YTD
(a) Para cada conjunto, calcule la media, la mediana, la moda, el rango medio y el eje F¡¡ellle: USA roday. 2 de febrero de 1999 Copyright @ 1999 por USA Today. Reproducido COllpermiso.
medio.
(b) Compare sus resultados y resuma sus hallazgos. (a) Calcule la media aritmética, la mediana, el.rango y la desviación estándar para el
(e) Compare el primer elemento muestreado en cada conjunto, compare el segundo ele- rendimiento anual. Interprete estas medidas de tendencia central y de variabilidad.
mento muestreado en cada conjunto, y así sucesivamente. Describa en forma breve (b) ¿Cree que los primeros 32 días dé 1999 fueron días buenos, malos o indiferentes
lo que encuentre aquí tomando en cuenta su resumen en (b). para los fondos mutuos? Justifique su respuesta.
(d) Para cada conjunto, calcule el rango, el rango intercuartil, la varianza, la desviación 3.10 Suponga que, por error, un conjunto de datos que.contienen la razón precio-ganancia
estándar y el coeficiente de variación (PG)'de nueve compañías que fueron negociadas en el American Stock Exchange se re-
(e) Describa la forma de cada conjunto. gistraron como 13, 15, 14, 17, 13, 16, 15, '16 Y,61, donde el último valor debió ser 16 en
(f) Compare sus resultados en (d) y (e) y dé sus conclusiones. lugar de 61.
(g) Con base en sus respuestas de (a) a (f), ¿qué puede generalizar acerca de las propie- (a) Muestre cómo afectó este error a la media, la mediana y el rango medio (es decir,
I dades de "la tendencia central, la variación y la forma? calcule estos estadísticos para los conjuntos de datos ''buenos'' y "malos", y compare los
I
li
resultados que se obtienen cuando se utilizan otros estimadores de tendencia central).
"
(b) Calcule el rango, e! rango inlercuartil, la varianza, la desviación estándar y el coefi- más de cinco minutos". Evalúe esta afirmación según los resultados obtenidos en el
inciso (a) .
. ciente de variación para el conjunto de datos con eITor (61); luego calcule de nuevo
los estadísticos con la corrección de la razón PO a 16. (d) Suponga que el gerente de la sucursal desea' garantizar cierto nivel de servicio duran-
(e) Analice las diferencias en los resultados del inciso (b) para cada medida de variación. te la hora pico de! ~Imuerzo, Un mal servicio durante un periodo específico redunda-
(d) ¿Qué medida en (b) parece más afectada por el error? ría en un pequeño pago monetario o un regalo para el cliente. ¿Qué tiempo de espera
(e) ¿Cómo describiría la fonna de! conjunto de datos con y sin el error? debería usarse como límite para pagar una pequeña cantidad o dar un regalo si la es-
• 3.11 Un fabricante de baterías para linterna tomó una muestra de 13 baterías en un día de pro- pera es mayor? E:w;pliquesu respuesta.
ducción y las usó hasta que se agotaron. Las horas que funcionaron hasta fallar son 3.14 Suponga que aIra SUCursal bancaria de una zQna residencial se preocupa por brindar la
AIl.CHIVO atención adecuada los viernes en la tarde, de 5 p.m, a 7 p.m. Se registró el tiempo de es-
lJE lJATOS 342 426 317 545 264 451 1,049 631 512 266 492 562 298
pera en minutos (definido como el tiempo desde que el cliente se forma en la cola hasta
BATlERIES
(a) Calcule la media, la mediana, la moda, el rango medio y el eje medio. Al observar que lo atienden) para todos los clientes en esta hora durante una semana. Se seleccionó
liI
la distribución de tiempos de falla, ¿qué medidas de ubicación cree usted que son una muestra aleatoria de 15 clientes y los resultados fueron: ARCIllVO
IlEDATOS
mejores y cuáles peores? ¿Por qué? BANK2
9.66 5.90 8.02 5.79 8.73 3.82 8.01 8.35 10.49 6.68 5.64 4.08 6,17 9.9] 5.47
(b) ¿De qué manera le sería útil esta infonnación al fabricante? Explique.
(e) Calcule e! rango, la varianza y la desviación estándar. (a) Calcule
(d) Para muchos conjuntos de datos el rango es aproximadamente seis veces la desvia- (1) la media aritmética (7) el rango
ción estándar. ¿Es cierto esto? (De no ser asÍ, indique la razón.) (2) la mediana (8) el rango intercuartil
(e) Si utiliza la información anterior, ¿qué consejo daría al fabricante para poder anun- (3) e! rango medio (9) la varianza
ciar que estas baterías "deben durar 400 horas"? (Nola: No hay respuesta correcta a (4) el primer cuartil (lO) la desviación estándar
esta pregunta; se trata de lograr que esta afinnación sea más precisa.) (5) el tercer cuartil (11) el coeficiente de variación
• ¿QUtSUCF.DESl?
(f) Suponga que el primer valor es 1,342 en lugar de 342. Repita el inciso (a) con este (6) el eje medio
valor. Comente las diferencias en los resultados. (b) ¿Están los datos sesgados? Si es aSÍ, ¿cómo?
(g) Repita los incisos (cHe) si el primer valor es igual a 1,342 en vez de 342. Comente (c) Un cliente que llega a la Sucursal a la hora del almuerzo, pregunta al gerente cuánto
• ¿QUÉ SUCEDE SI?
las diferencias en los resultados. tiempo tendrá que esperar. El gerente de la sucursal responde: "casi con certeza no
(h) ¿Cómo describiría la forma del conjunto de datos si el primer valor fuera 342? más de cinco minutos". Con base en los resultados del inciso (a), evalúe esta afirma-
(i) ¿Cómo describiría la forma del conjunto de datos si el primer valor fuera 1,342? ción.
3.12 Los siguientes datos son precios de renta mensual (en dólares) para una muestra de (d) Suponga que el gerente de una SUCursal bancaria desea garantizar cierto nivel de ser-
10 departamentos sin amueblar en el centro de una ciudad grande, y una muestra de 10 vicio durante las horas de la tarde del viernes. El hecho de no proporcionarlo dentro
departamentos sin amueblar en un suburbio: de un periodo específico significaría un pequeño pago monetario o un regalo para el
cliente. ¿Qué tiempo de espera cree que debería usarse como límite para pagar la pe-
Centro de la ciudad
queña cantidad o dar el regalo si Laespera es mayor? Explique su respuesta.
AllcHlvo
$955 $1,000 $985 $980 $940 $975 $965 $999 $1,247 $1,119
(e) ¿Qué argumentos se pueden dar que hicieran inapropiado comparar los tiempos de
IlE DATOS Suburbio
S'rUDlO espera en el problema 3.13 con los de este problema?
$750 $775 $725 $705 $694 $725 $690 $745 $575 $800
3.15 Durante los últimos 10 días de Junio, el tren "Especial Playa" llegó tarde a su destino de
(a) Para cada conjunto de datos, calcule la media, la mediana, el eje medio, el rango, el acuerdo con los siguientes retrasos (en minutos). (Un número negativo significa que el
rango intercuartil, la desviación estándar y el coeficiente de variación tren llegó antes, esa cantidad de minutos.) ARCHIVO
(b) ¿Qué puede decirse acerca de los departamentos no amueblados que se rentan en el DE DATOS
centro de la ciudad y los que se rentan en los suburbios? Compare las rentas en estas - 3 6 4 10 -4 124 2 -1 4 TRAIN
dos áreas. (a) Si e! ferrocamllo contrata a usted para demostrar que proporciona un buen servicio,
• 3.13 Una sucursal bancaria que se localiza en la zona comercial de una ciudad desarrolló un
¿qué medidas (de resumen para la tendencia central) usaría?
proceso para atender a sus clientes durante la hOra pico del almuerzo, dc 12:00 p.m. a
(b) Si lo contratara una estación de televisión que produce un documental para mostrar
1:00 p.m. Se registró el tiempo de espera en minutos (definido como el tiempo desde que
que el ferrocarril proporciona mal servicio, ¿qué medidas de resumen para la tenden-
el cliente se forma en la cola hasta que lo atienden) para todos los clientes que asisten en cia central utilizaría?
esta hora durante ulla semana, Se seleccionó una muestra aleatoria de 15 clientes y los
AIl.ClIlVO
(c) Si intentara juzgar en forma objetiva y sin prejuicios el desempeño de! ferrocarril,
resultados fueron: ¿qué medidas de resumen para tendencia central usaria? (Ésta es la parte más difícil
DE DATOS
BANKI porque no puede responder sin realizar suposiciones adicionales acerca de los costos
4.21 5.553.025.13 4.77 2.34 3.54 3.20 4.50 6,10 0.18 5.12 6.46 6.19 3.79
relativos de llegar con diversos retrasos.)
(a) Calcule (d) Calcule e! rango, el rango intercuartil, la varianza, la desviación estándar y el coefi-
(1) la media aritmética (7) el rango ciente de variación para "la demora" (en minutos).
(2) la mediana (8) el rango intercuartil (e) Analice la propiedad de variación de estos dalas.
(3) el rango medio (9) la varianza (f) ¿Cuál sería e! efecto en,sus conclusiones de los incisos (a) a (e) si el valor de 124
(4) el primer cuartil
(5) el tercer cuanil
(6) el eje medio
(10) la desviación estándar
(JI) e! coeficiente de variación
fuera incorrecto y debiera ser 12?
(g) Describa la forma de Los datos.
(h) Describa la fonna de los datos si el valor 124 se sustituye por 12.
III! ¿QUÉ SUCEDE SI?
126 CAPÍTULO 3 RESUMEN y DESCRIPCtÓN DE DATOS NU~ERICOS MEDIDAS DE TENDENCIA CENTRAL, VARIACiÓN Y FORMA 127
¡
SOl.UCIÓN
•• ANÁLISIS EXPLORATORIO DE DATOS En el ejemplo 3.3 de la página 107 la mediana fue 30.5. En el ejemplo 3.8 de la página 111
se calculó el primer cuartil en 29.0 y el tercero en 32.7. Por tanto, el resumen de cinco nú-
Una vez que hemos estudiado las tres propiedades más importantes de los datos numéricos
meros es
(tendencia central, variación y fonna), es importante identificar y describir las carnclensticas
principales de los dalos en fonna resumida. Un enfoque a este "análisis exploratorio de da- 10.0 29.0 30.5 32.7 38.0
tos" consiste en desarrollar un resumen de cinco lIúmtros y construir una gráfica de caja y Ahora utilizaremos el rcsumén de cinco números para estudiar la fonna de esta distribución.
bigoU's (referencias 6 y 7). De los lineamientos que se presentaron en los cuadros 3.3 y 3.4 es claro que los rendimien-
tos totales a un año -para la mueslra analizada- están sesgados a la izquierda porque la
Resumen de cinco números distancia de XlMrlOf a Ql (es decir, 19.0) supera en forma considerable a la dislancia de Q3 a
Un resumen de cinco números consiste en Xmuyor (esto es, 5.3). Ademá.<;,si se compara la mediana (30.5), el eje medio (30.85) y el ran-
X"",nnr QI Mediana Q3 Xmayor
go medio (24.0), se observa que el rango medio se mueve debido al valor extremo 10.0, yes
por mucho la más pequeña de estas medidas de resumen. El eje medio y la mediana. que son
A partir del resumen de cinco números se pueden obtener tres medidas de tendencia centrnl
resistentes a los valores extremos, tienen valores muy cercanos.
(la mediana, el eje medio y el rango medio) y dos medidas de variación (el rango intercuartil
y el rango) parn tener una mejor idea de la fonna de la distribución.
Si los datos son perfectamente simétricos, la relación entre las diveni3s medidas de locali.
zación puede eXpre5.1rsecomo se ve en el cuadro 3.3.
Diagrama de caja y bigotes
~ En su fonna más simple, un diagrama de caja }' higotes proporciona una rcpresemación
I
gráfica de los datos mediante el resumen de cinco números. El diagrama de caja y bigotes se
Cuadro 3.3 Uso del resumen de cinco números para describe en la figurn 3.9 para los rendimientos a un año que obtuvo la muestra de 17 fondos
reconocer la simetria de los da~s de acciones genernles nacionales con cargos de venta pagados por los aClivos de los fondos .
.1. 1, Lo distancio de 01 o lo mediano es igualo lo distancio de lo mediano o OJ. La línea vertical que está en el interior de la caja representa la ubicación del valor de la
./ 2. Lo distancio de ~ o 01 es igualo lo distancio de ~ o Xmay.;... mediana en los dalas. Observe que la línea vertical que está al lado izquierdo de la caja re-
./ 3. Lo mediol'lO,el eie medio y el rango medio son lodos iguales. (Estos inedidos presenta la ubicación de QI> y la línea vertical que está a la derecha de la caja representa la
también 50n iguales o lo medio de los dotas.} ubicacion de Q3' Sin embarga. podemos observar que la caja contiene un 50% de lns obstr-
vaciones que están en la mitad de la distribución. El 25% menor de los datos se representa
Por olra parte, si se trata de distribuciones no simétricas, la relación entre ambos tipos de por In línea punteada (un bigote) que conecta el lado izquierdo de la caja con el valor más
medidas se puede expresar como se indica en el cuadro 3.4. pequeño, Xmcnor. De manera similar, el 25% más alto de los datos se representa con una lí.
,. nea punleada que conecta el lado derecho de la caja con XmaYQr
./ 3. En distribuciones con sesgo o 10 izquierdo, lo distancio de x.-..or 0,01 excede Rendimientos totales a un año (~l
lo distancio de ~ o ~ .
./ 4. En distribuciones con 5CSgoo la izquierdo, el rango medio es menor que lo me- FIGURA 3.9 Diagrama de coio y bigotes que represento los rendimientos totales o un oño
diano y el eje medio. que obtuvieron los 17 fondos de acciones generales nocionales con cargos de ventas
pagados por los activos de los landos
Se determinará el resumen de cinco números en el ejemplo 3.17.
l-
ANÁLISIS EXPLORATORIO DE DATOS
Para resumir lo antes expuesto sobre la representación gráfica de datos, la figura 3.10 Si el conjunto de dalas está sesgado a la derecha como en la figura 3.1O(c},las pocas ob-
muestra la relación entre los métodos de análisis exploratorio de dalas (el diagrama de caja y . ~rvaciones grandes desplazan el mngo medio y la media hacia la cola derecha. En tales ca-
bigotes) y las representaciones gráficas (los poHgonos). Se presentan cuatro tipos de dislri- sos. se esperaria tener la siguiente secuencia en las cinco medidas de tendencia central:
buciones con gráficas de cajalbigotes y los polígonos oorrcspondiente.c¡.
moda < mediana < eje medio < media < rango medio
Cuando un conjunto dc dalas es perfectamente simélrico, como en la figura 110(a) y (d),
la media. la mediana. el rango medio y el eje medio son iguales. Además, la longilud del bi. Pam el conjunto sesgado a la derecha en la figura 1O.3(c)la coneentraci6n de dalas está en el
gote izquierdo será igual a la longitud del bigote derecho. y la línea de la mediana dividirá a exlremo bajo de la escala (es decir, en el lado izquierdo del diagrama de caja y bigotes).
la caja en la mitad. En la práctica, resulta poco probable encontrar un conjunlo de datos per- Aquí, el 75% de los valores de los datos se encuentra entre el inicio del bigote izquierdo
fectamente simélrico. Sin embargo, se puede afinnar que un conjunto de dalaS es aproxima- (Xmenor) y el borde derecho de In caja (Q)), el 25% restante de las observaciones está disper-
damente simélrico si la••longiludes de ambos bigoles son casi idénticas y la línca mediana so entre el bigole derecho y el extremo superior de la escala.
divide a la caja casi a la mitad. En lugar de describir un diagrama horizontal de caja y bigotes de izquierda (pequeño) a
Por otro lado, cuando el conjunto de datos está sesgado a la i7.quierda como sucede en la derecha (grande). como en la figura 3.9 de la página 129, la salida del complemento PH$tat
figura 3.1O(b), las pocas observaciones pequeñas despla7.an el rango medio y la media hacia para Microson Excel presenta un diagrama vertical de abajo (pequeño) a arriba (grande). La
la cola izquierda. En estos casos, se esperana tener la secuencia siguiente entre las cinco me- figura 3.11 muestra el diagrama de caja y bigotes para los rendimientos totales a un año de
didas de tendencia ceniral: los 17 fondos dc acciones generales nacionales. el cual se generó con este complemento.
mngo medio < media < eje medio < mediana < moda
Pam esta dislribución hipotética con sesgo a la izquierda, se observa en la figurn 3.IO(b) que Bo. PI'" looOotneatic6_~ Slod.. Funds ~~
la naluraleza sesgada (es decir, distorsionada) del conjunto de datos indica que exisle una
densa aglomeración de observaciones en el extremo alto de la escala (o en el lado derecho); ~ ,
75% de los valores de los datos se encuentran entre el lado izquierdo de la caja (QI) y el ex- .. --- -- .. --
tremo del bigole derecho (Xmayor). Así. el bigote izquierdo de mayor longitud solamenle ~
contiene la distribución del 25% de las observaciones más pequeña ••; esto muestra la distor-
sión de la simetria en este conjunto de datos. ~ .
J i L lares, se observa que existen ciertas diferencias en los cuarliles primero y tercero, y diferen-
cias nmorias en los valores extremos. Además, parece claro que los grupos difieren, tanlo en
la variabilidad medida por el rango y el rango intercuartil, como en la foOlla. Observe que
~-----~-----j los asteriscos (*) en los grupos de la lista de cargos I (cargos pagados por los activos de los
(dI Distribución rectangular fondos), 3 (cargos de venta directa), 4 (cargos múltiples) y 5 (fondos sin cargo) indican la
presencia de valores extremos.
1:
los fondos de acciones
mercado de dinero de una muestra de 15 bancos comerciales en el área metropolitana de
e¡ $.i
generales nacionales
~ ~ ó ~ ~ ,~
clasificados de según la listas Nueva York al 12 de febrero de 1997, un día antes de que el promedio indUstrial Dow
de cargos, que se obtuvo con J(mes pasara de 7,000 por primera vez:
Minitab NOMBREDELBANCO REND.CMD NOMRREDELBANCO REND.'CMD
.~ Banco Popular 3.10 Aeet Bank 2.28
E BankofN,Y. 2.63
•15 10,'-_~---~--~---~-_--,--.J
Key Bank ofN.Y. 101
Bank of Tokyo-Mitsubishi 3.05 Marine Midland 2.73
Q.."Grupo
Chase Manhattan 2.79 North Fork Bank 2.53
, Citibank 3.25 PNCBank(N.J.) 2,00
!, Problemas para la secClOn 3.3 CoreStates NJ National Bank 1.90 Republic Nationa1 3.05
I ARCHIVO
Aprendizaje de conceptos básicos EAB 2.79 $ummit Bank 2.02 Dl': DATOS
First Unían 2.90 MONEY MARKET
3.t6 Dado el siguiente conjunto de datos de un muestra de tamaño n = 5:
(a) Proporcione el resumen de cinco números
7 4 9 2
(b) Construya el diagrama de caja y bigotes y describa la forma.
(a) Proporcione el resumen de cinco números. (c) Si alguien le dijera: "]OSTendimientos del mercado de dinero no varían mucho de un
(b) ConstTUyael diagrama de caja y bigotes y describa la forma. banco a otro", con base en estos datos, ¿qué diría?
(c) Compare la respuesla del inciso (b) con la del problema 3.1(c) en la página 124. 3.23 Los siguientes datos representan los precios de renta mensual (en dólares) para una
Analice. muestra de 10 departamentos sin amueblar en el centro de una ciudad grande, y
• 3.11 Dado el siguiente conjunto de datos de un muestra de tamaño n = 6: una muesira de 10 departamentos sin amueblar en un suburbio:
l' 7 4 9 7 12 Centro de la ciudad
liI
AR.CHIVO
"
I (a) Proporcione el resumen de cinco números. $955 $1,000 $985 $980 $940 $975 $965 $999 $1,247 $1,119 DE DATOS
(e) Compare su respuesta del inciso (b) con la del problema 3.2(c) en la página 124. $750 $775 $725 $705 $694 $725 $690 $745 $575 $800
Analice. Para cada una de las zonas:
• 3.18 Dado el siguiente conjunto de datos de un muestra de tamaño n = 7: (a) Proporcione e! resumen de cinco números.
12 7 4 9 7 (b) Construya el diagrama de caja y bigotes y describa la forma.
(a) Proporcione el resumen de cinco números.° 3.24
(e) ¿Diría que las distribuciones de las rentas en las dos áreas son similares? Explique.
Durante los últimos 10 días de junio, el tren "Especial Playa" llegó tarde a su destino
(b) Construya el diagrama de caja y bigotes y describa]a forma.
con los retrasos (en minutos) que se indican a continuación. (Un número negativo signifi-
(c) Compare la respuesta del inciso (b) con la del problema 3.3(c) en la página 124.
ca que el tren llegó antes esos minutos.) ARCHIVO
Analice.
3.19 Dado el siguiente conjunto de datos de un muestra de tamaño n = 5:
7 -5 -8 7 9
-3 6 4 10 -4 124 2 -1 4
(a) Proporcione el resumen de cinco números.
liI DE DATOS
TRAIN
•
Analice.
(e) Compare la respuesta del inciso (b) con la del problema 3.4(e) en la página 124.
Analice.
OBTENCiÓN DE MEDIDAS DESCRIPTIVAS DE RESUMEN
3.20 Dado el siguiente conjunto de datos de un muestra de tamaño n = 7:
A PARTIR DE UNA POBLACiÓN
333
(a) Proporcione e! resumen de cinco números. En la sección 3.2 se examinaron varios estadísticos que resumen o describen información
(b) ¿Por qué no se puede construir un diagrama de caja y bigotes? numérica a partir de una muestra. En particular, estos estadísticos se utilizaron para describir
las propiedades de tendencia central, variación y forma.
11
AIlCHlVO
DE O"TOS Aplicación de conceptos Suponga, sin embargo, que el conjunto de datos al que se tiene acceso na es una muestra
BATTERIES
sino una colección de medidas numéricas de toda una población ..Por ejemplo, suponga .que
• 3.21 Un fabricante de baterías para linternas lomó una muestra de 13 baterías de un día de
una compañía proveedora de artículos de piorneda al mayoreo tiene 'una población de 50
producción y las usó hasta que se agotaron. Las horas que funcionaron hasta fallar son
facturas de venta en un día específico. La cantidad (en dólares) de esas facturas se ilustra en
342 426 317 545 264 451 1,049 631 512 266 492 562 298
-la tabla 3.2.
CAPÍTULO 3 RESUMEN y DESGRIPCIÓN DE DATOS NUMÉRICOS OBTENCiÓN DE MEDJDAS DESCRIPTIVAS DE RESUMEN A PARTIR DE UNA POBLACIÓN 133
Tabla 3.2 Cantidades para una poblaci61J de 50 facturas de venta • Vorianzo y desviación estóndor de la población
'La varianza de la población se representa por el símbolo ci. la letra griega minúscula sig-
127.43 372.68 349.03 213.45 326.55 148.93 213.54 409.61 211.01 290.87
ma al cuadrado. y la desviación estándar de la población se representa por el símbolo 0".
219.76 429.05 328.44 215.62 462.45 389.04 234.65 543.67 176.43
Eslas medidas se obtienen de la manera siguiente.
435.32
430.32
liiI
278.93 436.72 327.80 354.11 265.76 216.87 65432 345.45 213.65
ÁIICfIl\'n
399.05 324.55 451.23 287.60 219.06 214.54 278.96 378.90 368.02 319.06 Varianza de la población
lJEDU'OS
' VOUOlER 267.90 265.78 345.11 379.01 417.89 267.91 210.32 277.62 321.81 334.22
La varianl.a de la población es igual a la suma de los cuadrados dc las diferencias al-
rededor de la media de población. dividida entre el lamaño de la población.
Cuando se maneja un conjunlo de datos que conslituye una población completa. se calcu-
lan los parámetros de la población para la media aritmélica. la varianza y la desviación es- N
134 CAPITULO 3 RESUMEN y DESCRIPCiÓN DE DATOS NUMffircos OBTENCIÓN DE MEDIDAS DF.SCRIPTIVAS DE RESUMEN A PARTIR DE UNA POBlACIÓN 135
r I
(127.43 - 319)'
51&,00&.2 60 6
+ (372.6g - 319)' + (349.03
SO
- 319)' + .. ' + (334.22 - 319)'
• (a) Calcule la media. la mediana. la moda. el mngo medio y el eje medio.
(b) Calcule el mngo. el rango intercuartil. la va~anza, la desviación estándar y el coefi-
ciente de variación.
(e) ¿Están sesgados estOS datos? Si es asf. ¿cómo?
= -5-0- = 10.3 .1 (en dólaresal cuadrado)
3.26 Dado el siguiente conjunto de datos para una población de tamaño N = 10;
La desvi;lci6n estándar de la población es la raíz cuadrada de la varianza de la población. Al 7566648693
U5<1rla ecuación (3.14) se tiene
(a) Calcule la media. la mediana. la moda. el rango medio y el eje medio.
H (b) Calcule el rango, el nmgo inlercuartil. la varian7.a y la desviación cstándar.
¿(X; - .)' (e) ¿Están sesgados estos datos? Si es así. ¿cómo?
0= ;-, N = V 10,360. 16 = $101.7& (d) Compare estas medidas de lendenci.ll central con las medidas del problema 3.25(a).
\ Analice.
(e) Compare estas medidas de tendencia central con las del problema 3.25(b). Analice.
liI
ARCHIVO
tienden a agruparse, más o menos cerca de la mediana. En los conjuntos de datos con sesgo miles de dólares) que fueron presentados al contralor del Gmoscrvitle Township para el o.: Il~TOS
a la derecha. la agrupación ocurre a la izquierda (o abajo) de la mediana, en los conjuntos de periodo que lermina en marzo de 1999 por los 50 negocios de la localidad: TAX
datos ccn sesgo a la izquierda ticnden a agruparse a la derecha (o arriba) de la mediana. En
10.3 11.1 9.6 9.0 14.5
conjuntos de datos simétricos, donde la media}' la mediana son iguales. con frecuencia las
13.0 6.7 11.0 &.' 10.3
observaciones tienden a agruparse en tomo a estas medidas de tendencia centra!. Cuando no
13.0 11.2 7.3 5.3 125
existe un sesgo extremo y se observa este tipo de agrupación en un conjunto de datos. se &.0 11.8 .8.7 10.6 9.5
puede utilizar la llamada regla empírica para examinar la propiedad de variabilidad de los 11.1 10.2 11.1 9.9 9.8
datos y adquirir una idea más clara de lo que mide la desviación estándar. 11.6 15.1 12.5 6.5 7.5
10.0 12.9 9.2 10.0 12.8
12.5 9.3 10.4 12.7 10.5
. Reglo empírico 9.3 11.5 10.7 11.6 7.&
10.5 7.6 10.1 &.9 &.6
La regla empírica establece que para la mayoría de los conjuntos de datos, aproxima-
damente cada dos de tres observaciones (esto es, 67%) se encuentran dentro de: una (a) Organice los datos en un arreglo ordenado o en un diagrama de tailo y hoja.
distancia de I desviación estándar alrededor de la m~ia, y entre 90 y 95% de las ob. (b) Calcule la media aritmética para esta poblnción.
servaciones se encuentran dentro de una distancia de 2 desviaciones. estándar alrede- (e) Calcule la varianza y la desviación estándar para esta población.
dor de la media. (d) ¿Qué proporción de ntgocios tiene recibos de impuestos sobre ventllS trime.~lrales;
(1) dentro de:tl desviación estándar de la media?
(2) dentro de :t2 desviaciones estándar de la media?
En consecuencia, la desviación estándar, como medida del promedio de variación en tomo a (3) dentro de :t3 desviaciones estándar de la media?
la media, ayuda a comprender la distribución de las observaciones arriba o abajo de la media (e) ¿Le sorprenden los resultados del inciso (d)? (Sugu~ncia: compare sus resultados
y a detectar observaciones poco usuales (es decir, valores extremos) cuando se analiza un con lo que se esperaría obtener de ar:uctdo con la regla empírica.)
conjunto de datos numéricos.
3.28 Suponga que se obtuvo la población de 1,024 fondos de acciones generales domésticos,
De los datos de la tabla 3.2 en la página 134, para la población de 50 facturas de venta. la y se determinó que la media del rendimiento porcentual a un año logrado por todos los
media j.L es 319 dólares y la desviación estándar a es 101.78 dólares. En la tabla 3.2 se ob- fondos Jl.. es 28.20, y que la desviación estándar 0", es 6.75. Además suponga que se de-
serva que 31 facturas de venta (62%) se encuentran entre j.L - la y V. + la (es decir, entre terminó que el recorrido en los rendimientos totales a un año es de 0.3 a 60.3. y que los
217.22 y 420.78 dólares). También se observa que 48 facturas de venta (96%) se hallan en. cuartile..~respectivos son 23.9 (QI) y 32.3 (Q). De acuerdo con la regla empírica. ¿quf
tre IJ. - 2(1"Y j.L + 2(1"(es decir, entre 115.44 y 522.56 dólares). Además, todas excepto una proporción de estos fondos se espem que estén
de las facturas de venta (98%) se encuentran entre JL - 3(1"Y V. + 3a (o sea, entre 13.66 y (a) dentro de :t I desviación estándar de la media?
624.34 d6Iarc,). (b) dentro de :t2 desviaciones estándar de la media?
3.29 Los siguientes datos intentan mosuar la diferencia entre las familias con ingmos más
elevados y las familias con ingresos m!s reducidos en cada uno de los 50 estados y el
Problemas para la sección 3.4 Distrito de Columbia en Estados Unidos (medida por el promedio dd 20% más bajo y
el 20% más elevado de familias con niños, entre 1994 y 1996). En la siguiente página se
Aprendizaje de conceptos básicos
muestran los resultados clasificados por estados.
3.25 Dado el siguiente conjunto de datos p:lm una población de tamaño N = 10:
•
I
I 136
75118362198
RESUMEN y DESCRIPCIÓN DE DATOS NUMmICOS QRTENOÓN DE MEDIDAS DESCRIPTIVAS DE RESUMEN A PARTIR DE UNA POBLACIÓN 137
L
NOMBRE YTD NOMBRE 'YTD NOMBRE YID
20% MÁS RAJO 20% MÁS ALTO 20% MÁS BAJO 20% MÁS ALTO • ASN 4.6 HMT -5.9 PSA -0.2
ESTADO (MILES DE DLS) _ (MILES DE DLS) EsTAOO (MILES DE DLS) (MILES DE DLS)
CDX 5.8 HOT 49,9 . RSE -11.6
Nueva York 6.787 132.390 Kansas 10.790 110.341
CEl 7.3 HRP 8.0 SPG 0.2
Louisiana 6.430 102.339 Oregón 9.627 97.589 ~'
Fuente: reimpreso con permiso de Do\\' iOlles & Campan)'. lllc .. de The WaH Street Joumal, 2/ de RElTS
Florida 7.705 107.811 ¡daho 10.721 104.725 abril de /999. Permiso obtenido a lravés de TIle Copyright Cleal'ance Cell/a. lllc
Kentucky 7.364 99.210 Delaware 12.041 116.965
(a) Calcule la media aritmética para esta población. Interprete las cifras.
Alabama 7.531 99.062 Arkansas 8.995 83.434
(b) Calcule la varianza y la desviación estándar de la población. Interprete las cifras.
Virginia del Occ. 6.439 84.479 Colorado 14.326 131368 (e) ¿Existe mucha variabilidad en los rendimientos YTD de los REIT en el grupo de
Tennessee 8.156 106.966 Hawaii 12.735 116.060 inversión DJ-US?
Texas 8.642 113.149 Missoun 11.090 100.837 3.3. Los fondos del mercado de dinero proporcionan a los inversionistas un riesgo de inver-
Mississippí 6.257 80980 Alaska 14.868 129.065 sión relativamente reducido. Por otro lado, estos fondos no producen altos rendimientos.
Michigan 9.257 117.107 Wyoming La sigllÍente tabla proporciona el rendimiento anual, en porcentaje, para los diez fondos
1\.174 94.845
del mercado de dinero de mayor importancia. para el periodo que terminó el 31 de marzo
Oklahoma 7.483 94.380 Minnesota 14.655 120.344 de 1999.
Massachusctts 10.694 132.962 Nebraska 12.546 102.992
Oeorgia 9.978 123.837 NOMBRE DEL FONDO RENDIMIENTO ANUAL
Maine 11.275 92.457
fIIinois 10.002 123.233 New Hampshire 14.299 116.018 MerrilJ Lynch CMA Money Fund 4.95
Ohio 9.346 111.894 Nevada 12.276 98.693 Srñith Bamey Cash PortlCI A 4.92
Carolina del Sur 8.146 96.712 Iowa 13.148 104.253 Vanguard Prime MMF/Retail 5.23
Pennsy!vania 10.5 12 124.537 Wisconsin 13.398 103.55 I Fidelity Cash Reserves 5.16
Carolina del Norte 9.363 107.490 Vermont 13.107 97.898 Schwab Money Market Fund 4.84
Rhode [sland 9.914 111.015 Dakota del Norte 12.424 91.041 Schwab Value Advantage MF 5.21
Washington 10.116 I J2.501 Utah 15.709 110.938 Centennial Money Market Trust 4.92
iI
ARCfHVO
DE UATOS Maryland 13.346 147.971 Distrito de Columbia 5.293 149.508 Margan Stanley DeanWitterlLiquid Asset 5.00
STANTEINC
Virginia 10.816 116.202 Dean Witter/Active Assets MI 5.11 ARcmvo
F!leIIle' Unired States Cell.fUSBureau. Paine Webber RMA MFIMM Port 4.93
Fuente: Reimpreso con permiso de Dow JO/les & Company, fllc.. de The Wall Strl':et JoumaL 5 de
liiI OE [}ATOS
MM
Para estas dos variables numéricas abril de /999. Penniso obtenido a través de The Copyright Clearallce Cell/er, lllc.
(a) organice los datos en un arreglo ordenado o en un diagrama de tallo y hoja.
(b) calcule la media aritmética de la población. (a) Calcule la media aritmética para esta población de diez fondos del mercado de dine-
(c) calcule la varianza y la desviació[\ estándar de la población. ro de mayor importancia. Interprete esta cifra.
(d) ¿qué proporción de estos estados tiene ingresos promedio (b) Calcule la varianza y la desviación estándar. Interprete las cifras. ¿Existe mucha va-
(1) dentro de 1:1 desviación estándar de la media? riabilidad en los rendimientos anuales de los diez fondos?
(2) dentro de 1:2 desviaciones estándar de la media?
(3) dentro de 1:3 desviaciones estándar de la media? RECONOCIMIENTO y PRÁCTICA DE RESÚMENES DESCRIPTIVOS
(e) ¿Le sorprenden los resultados del inciso (d)? (Sugerencia: compare sus resultados ADECUADOS Y CONSIDERACiÓN DE ASPECTOS ÉTICOS
11I ¿QUÉ SUCEI)£ SI?
CO[\ lo que se esperaría según la regla empírica.)
(O Resuelva los incisos (a)-Ce) sin el dato del Distrito de Columbia. ¿Qué cambio tuvie- En este capítulo hemos analizado cómo se puede caracterizar un conjunto de datos numéri-
ron los resultados? cos con algunos estadísticos que miden las propiedades de tendencia central, variación y for-
ma. El siguiente paso implica analizar e interpretar los datos; el análisis es objetivo, la inter-
3.30 Los fondos de inversiones inmobiliarias [Real Estate lnvestment Trusts (REITs)] funcio-,
nan de manera semejante a los fondos mutuos. Los clientes individuales invierten dinero pretación es subjetiva. Deben evilarse errores que pueden surgir ya sea en la objetividad de
en un REIT, y el REIT lo invierte en diferentes bienes raíces, Algunos REIT se centran en lo que se analiza o en la subjetividad de 10 que se interpreta (referencias l y 3).
oportunidades de inversión muy bien definidas, mientras que otros invierten en una
amplia variedad de propi-edades. El grupo de inversión en bienes raíces DI-US es una Prevención de errores durante el análisis y la interpretación
colección de 20 REIT que están a la vanguardia. La siguiente tabla proporcionil el rendi- Recuerde que en la sección 3.1 se examinó y describió un conjunto de datos numéricos de
miento anual a la fecha (YTD), en porcentajes, para el periodo que terminó el 20 de abril los rendimientos totales a un año que obtuvieron 17 fondos de acciones generales nacionales
de 1999. con cargos de venias pagados por los activos de los fondos. Sin el conocimiento del conteni.
do de este capítulo, batamos de analizar e interpretar lo que los datos transmitían.
138 CAPíTULO 3 RESUMEN y DESCRIPCtÓN DE DATOS NUMÉRICOS RECONOCIMIENTO y PRÁCTICA DE RESÚMENES DESCRIPTIVOS ADECUADOS Y CONSIDERACiÓN DE ASPECTOS ÉTtCOS 139
rI
I •
1: El análisis de datos fue objetivo; todos estuvimos de acuerdo con los haUazgos visuales de resumen para algunas variables Iluméricas de una encuesta sobre la vida de los estu-
limitados: los valores modales o típicos de los rendimientos totales a un. año fueron 28.6 y diantes en el campus. Su amigo dice: "Me pidieron un informe y la preparación de una
30.5; la dispersión del indicador del rendimiento total a un año varió de 10,0% a 38.0%, presentación de cinco minutos en_clase acerca d~ la vida de los estudiantes en el campus.
'1 y hubo un mlor extremo en los datos, la tasa de 10.0% que obtuvo Mentor Merger, y un va- Tengo la impresión de que mi computadora contiene todas estas medidas de resumen pa-
ra cada una de las siete variables numéricas. Hay tanla infonnación aquí que no puedo ni
lor extremo pOlencial, el rendimiento de 20.6% que alcanzó Rainler Reich Tang.
comenzar. ¿Tienes algunas sugerencias?" Usted reflexiona unos momentos, y responde.
Una vez que el estudiante ha leído el capítulo y ha obtenido mayor conocimiento de las
3.33 Se pide a un árbitro que examine una disputa sobre los salarios que se pagaron a jugado-
medidas' descriptivas de resumen, tanto de sus ventajas como sus debilidades, ¿cómo podóa res profesionales de béisbol. El dueño de uno de los equipos afirma que el promedio
mejorar el análisis objetivo anterior? Debido a que los datos se distribuyen con una asimetría anual de salarios es demasiado elevado. El agente de los jugadores argumenta que el pro-
ligera, ¿debe considerarse la mediana o el eje medio en lugar de la media? ¿La desviación medio salarial para los jugadores de esle equipo es demasiado bajo. ¿Cómo debe evaluar
estándar proporciona más información acerca de la variación que el rango? ¿Debeóa descri- el árbitro ambas afirmaciones que están en conflicto? (Sugerencia: ¿A cuál promedio
birse la forma de los datos como con un sesgo negativo o a la izquierda? La objetividad en el piensa que se refiere el agente, y a cuál se refiere el dueño?)
análisis de datos implica presentar las medidas de resumen más adecuadas para un conjunto
de datos determinado, es decir, las que mejor se ajustan a las suposiciones sobre ese conjun-
to de datos. • RESUMEN
Por otro lado, la interpretación de datos fue subjetiva; se pueden obtener conclusiones di-
ferentes en la interpretación analílÍca. Todas las personas ven el mundo desde diferentes Como puede verse en el siguiente diagrama, este capítulo analiza el resumen y la descrip-
perspectivas. Algunas ven el arreglo ordenado de los rendimientos a un año (10.0, 20.6, ción de los datos. En éste y en los dos capítulos anteriores, se estudió el tema de la estadístí-
28.6,28.6,29.4,29.5,29.9,30.1,30.5,30.5,32.1,32.2, 32.4, 33.0, 35.2, 37.1 Y 38.0) Y que-
dan satisfechas con los rendimienlos que obtuvieron los fondos de acciones generales con
cargos de venta pagados por los activos de los fondos; otros, en especial aquellos que invir-
.tieron en Mentor Merger (con tasa de 10.0%) o Rainler Reich Tang (con rendimiento de Propiedades de los
datos numéricos
20.6%). o quienes sólo esperan un rendimiento mayor para compensar los riesgos de inver-
sión, ven los mismos datos y concluyen que el rendimiento fue demasiado bajo. Así, como
la interpretación de datos es subjetiva, debe hacerse de manera honesta, neutral y clara.
Aspectos éticos
Los a~pectos éticos son de vital importancia en todos los análisis de datos. Como consumi-
dores habituales de información, los individuos deben cuestionar lo que leen en periódicos y
revistas, lo que escuchan en radio o televisión, y lo que ven en la red (Internet). Conforme
pasa el tiempo, se ha expresado mucho escepticismo en cuanto al propósito, le enfoque y la
objetividad de los estudios publicados. Tal vez ningún comentario sobre este tema ha sido
más claro que el comentario sarcástico que con frecuencia se atribuye al famoso estadístico
británico del siglo XIX Benjamin Disraelí: "Existen tres tipos de mentiras: mentiras, mentiras
malditas y estadísticas".
De nuevo, como se mencionó en la sección 1.9, los aspectos éticos surgen cuando se tiene
que decidir cuáles resultados se deben presentar y cuáles no. Es de gran importancia docu-
mentar tanto los buenos como Jos malos resul¡ados ..Además, al hacer presentaciones orales e
informes escritos, es esencial ser honesto, objetivo y neutral. Por tanto, debe intentarse distin-
guir entre una presentación de resultados deficiente y una no ética. Una vez más, como en las
presentaciones anteriores de Jos aspectos éticos, la clave es la intención. La omisión de infor-
mación pertinente, suele deberse simplemente a ignorancia. Sin embargo, la conducta no ética
surge cuando se elige a propósito una medida de resumen inadecuada (por ejemplo, la media
o el rango medio para un conjunto de datos muy sesgado) a fin de distorsionar los hechos para
apoyar una postura determinada. Además la conducta no ética también ocurre cuando no se
informan ciertos hechos pertinentes porque perjudican el apoyo de una postura específica.
líiI
ARCHIVO
dispersión 112 QI: primer cuartil 110 varianza de la muestra 115 LCI All-American 52.71 AT&T True Reach With True Rewards 54.89 DE L>~TOS
dispersión media I t4 QJ: tercer cuartil 111 varianza de la población 135 Le1 Two-Rate 53.10 AT&T True Savings With True Rewards 54,11 PHONRATE
eje medio 112 rango 113 Fuente: Reimpreso COIIpemliso de The New York Times. Teiecommunicaliolls Reuarch and Actiorl
Cemu: The New York Times, 2 de /llano de 1997, £5 ..
5.65 544 5.42 5.40 5.53 5.34 5.54 5.45 5.52 5.41
5.57 5.40 5.53 5.54 5.55 5.62 5.56 5.46 544 5.51
5.47 5.40 5.47 5.61 5.53 5.32 5.67 5.29 5.49 5.55
Problemas de repaso ARCHIVO
5.77 5.57 5.42 5.58 5.58 5.50 5.32 5.50 5.53 5.58 llEIlHOS
• 3.44 Los siguientes datos representan las tasas mensuales de llamadas de larga distancia para 5.61 5.45 5.44 5.25 5.56 5.63 5.50 5.57 5.67 5.36 TEABAGS
dientes residenciales en Estados Unidos, de una muestra de 34 planes diferentes (ba~ada
en 36 llamadas por mes y un total de 318 minutos repartidos durante el día):
(4) el _primer cuartil (lO) la desviación estándar libros esto representa ei tiempo que sé necesita para doblar, unir, coser, proteger con
.(5) el tercer cuartil (11) el coeficiente de variación guardas, y encuadernar las hojas que salen de la prensa. Los siguientes datos representan
(6) el eje medio muestras de 20 libros en dos plantas de producción y el tiempo de procesamiento (defi-
(h) interprete las medidas de tendencia central en el contexto del problema. ¿Por qué es nido como el tiempo en días contado desde que el libro llega a las prensas .hasta que se
importante que el fabricante de bolsas de té se preocupe por la tendencia central? empaca en cajas) para estas actividades.
(e) Interprete las medidas' de variación en el contexto del problema. ¿Por qué es impor- Planta A
tante que el fabricante de holsas de té se preocupe por la variación? 5.62 5.29 16.25 10.92 Jl.46 21.62 8.45 8.58 5.4l 11.42
(d) Construya un diagrama de caja y bigotes. 11.62 7.29 7.50 7.96 4.42 10.50 7.58 9.29 7.54 8.92
(e) ¿Están sesgados los datos? Si es así, indique cómo. Planta B AI/.ClllVO
(f) ¿Cumple la compañí<l con los requerimientos establecidos en la etiqueta que, en pro- 9.54 11.46 16.62 12.62 25.75 15.41 14.29 13.13 13.71 10.04 DE l>ATOS
medio, hay 5.5 gramos de té en una bolsa? 5.75 12.46 9.17 13.21 WlP
6.00 2.33 14.25 5.37 6.25 9.71
, (g) Si usted estuviera a cargo del proceso, ¿qué cambios implementaría con relación a la
Para cada una de las plantas,
"
distribución de peso en las bolsas individuales de té?
, (a) Calcule
3.46 Los ejecutivos de mercadotecnia de clubes de béisbol de las grandes ligas consideran que
(1) la media aritmética (7) el rango
las promociones el "día de la gorra" o el "día de 8eanie Baby" son herramienlas que
(2) la mediana (8) el rango intercuartil
ayudan a incrementar la asistencia pagada. Boyd y Krehbiel examinaron la efectividad de
(3) el rango medio (9) la varianza
cstas promociones ('¡he Effect of Promolion Timing on Majar League Baseball Atten-
(4) el primer cuartil (lO) la desviación estándar
dance", Sport Marketi/¡g Quemaly, otoño de 1999). El archivo de datos METS contiene
(5) eltereer cuartil (11) el coeficiente de variación
dos variables:
ARCHIVO (6) el eje medio
liI DE
MClS
DATOS
Asistencia: asistencia pagada para cada juego en 1997
Promoción: sí "" se hizo promoción; NO "" no se hizo promoción
(Los autores recopilaron los datos a partir de registros públicos.)
(b) Construya un diagrama de caja y bigotes
(e) ¿Están sesgados los datos? Si es así, indique cómo.
(d) Con base en los resultados de los .incisos (a)-(c), ¿hay diferencias entre las dos
(a) ¿Estos datos son representativos de una muestra o población? plantas? Explique.
(b) Calcule las medidas descriptivas apropiadas de asistencia pagada para los 19 juegos 3.49 En ei estado de Nueva York, las cajas de ahorro están autorizadas para vender una espe-
con promociones y los 61 juegos sin promociones. cie de seguro de vida llamado Savings 8ank Life Insurance (S8U). El proceso de apro-
(c) Analice la efectividad de las promociones que se realizaron para los Mets de Nueva bación está integrado por los siguientes puntos: revisión de la solicitud, verificación por
York en 1997. parte de una agencia de información médica, una posible petición de información y la
(d) ¿Qué factores generaron la variación que se refleja en la asistencia pagada? realización de exámenes médicos adicionales, además se incluye la etapa de compilación
• 3.47 Un problema con una línea telefónica que impide al cliente recibir o hacer llamadas es de la póliza para generar las páginas de la misma y enviarlas al banco para su entrega.
desconcertante tanto para el cliente como para la compañía telefónica. Estos problemas La entrega oportuna de las pólizas aprobadas a los clientes es crítica para la rentabilidad
pueden ser de dos tipos: ya sea que se localicen en el interior de la central telefónica o de este servicio de la caja de ahorros, Durante un mes, se seleccionó una muestra aleato-
en las líneas que van de la central hasta el equipo del cliente. Los datos siguientes repre- ria de 27 pólizas aprobadas y el tiempo total de procesamiento en días Los resultados
sentan muestras de 20 problemas que reportaron los clientes en dos oficinas diferentes de fueron los siguientes:
una compañía telefónica, y el tiempo que lomó resolverlos (en minutos)'
73 19 16 64 28 28 31 90 60 56 31 56 22 18
Tiempo para resolver problemas (en minutos) en la central / 45 48 17 17 17 91 92 63 50 51 69 16 17
liilI
ARCIUVO
1.48 1.75 0.78 2.85 0.52 "1.60 4.15 3.97 1.48 3_10
DE DATOS (a) Calcule
PHONE 1.02 0.53 0.93 1.60 0.80 l.05 632 3.93 5.45 0.97
(1) la media aritmética (7) el rango
Tiempo para resolver problemas (1:'11 minutos) en la central IJ
(2) la mediana (8) el rango intercuartil
7.55 3.75 0.10 1.l0 0.60 0.52 3.30 2.10 0.58 4.02
(3) el rango medio (9) la varianza
3.75 0.65 1.92 0.60 1.53 4.23 0.08 1.48 1.65 0,72
(4) el primer cuartil (lO) la desviación estándar
Para cada una de las oficinas de la central telefónica: (5) el tercer cuartil (11) el coeficiente de variación
(a) Calcule (6) el eje medio
(1) 'la media aritmética (7) el rango (b) Construya un diagrama de caja y bigotes.
(2) la mediana (8) el rango intercuartil (e) ¿Están sesgados los datos? Si es así, indique cómo
(3) el rango medio (9) la varianza (d) ¿Qué le contestaría al cliente que llega al banco para comprar este tipo de póliza de
(4) el primer cuartil (0) la desviación estándar seguro y pregunta cuánto tiempo toma el proceso de aprobación?
(5) el tercer cuartil (11) el coeficiente de variación 3.50 Uno de los principales indicadores de la calidad del servicio que proporciona una organi-
(6) el eje medio zación es la rapidez con la que se atienden las quejas de los clientes. Una tienda departa-
(b) Construya un diagrama de caja y bigotes. mental muy grande, de administración familiar, que vende muebles y revestimiento para
(e) ¿Están sesgados los datos? Si es así, indique cómo pisos, incluyendo alfombras, ha tenido una gran expansión en los últimos años. En par-
(d) Con base en los resultados de los incisos (a)-(c), ¿existen diferencias entre las dos ticular, el personal del departamento de revestimiento para pisos ha crecido de 2 brigadas
oficinas? Explique. de instalador'es, a un supervisor de instalación, un medidor y 15.brigadas de instaladores.
L
Durante un año reciente se seleccionó una muestra de 50 quejas referentes a la instala- (d) ¿Están sesgados los datos? Si es así,' indique cómo.
ción de alfombras. Los siguientes datos representan el número de días que pasan entre la (e) Considere solamente los 60 fondos sin cargo en el conjunto de datos, es decir, los
recepción de la queja y la solución de la misma. fondos mutuos con Sales Clwrge = N. Repita los incisos (a)-(d).
(f) Considere solamente los 80 fondos con cargo en el conjunto de datos, es decir, los
54 53513731 27152 2 ]23 81 7427 11 19126 llO 110 29 6] 3594 31 26 5 «2
fondos mutuos con Sales Charge'= y. Repita los incisos (a)-(d).
4 l65 32 2928 29 2625 1 1413 13 10 5 27 4 523022362620 23 33 68
3.53 Para los datos de fondos mutuos del problema 3.5[, se quiere saber si los distintos tipos
(a) Calcule de fondos mutuos producen el mismo resultado para los inversionistas.
(I) la media aritmética (7) el rango (a) Constmya una tabla que incluya la media aritmética, la mediana, el rango y la des-
(2) la mediana (8) el rango intercuartil viación estándar para los cinco objetivos, use la variable QlIarreriy Retum.
(3) el rango medio (9) la varianza (b) Construya una tabla que incluya la media aritmética, la mediana, el rango y la des-
(4) el primer cuartil (10) la desviación estándar viación estándar para los cinco ubjetivos, use la variable Ammal Re/llrll.
ARCHIVO (5) el tercer cuartil (11) el coeficiente de variación (e) Analice la tasa de inversiones para Ia.s cinco categorías de objetivos.
[lE B,ITOS (6) el eje medio 3.54 Para los dalos de fondos mutuos del problema 3.51, se desea hacer un análisis detallado
FURNITURE
(b) Construya un diagrama de caja y bigotes. de los fondos de tecnología (Objec/ive = TK). Considere 111v1lriable Annual Re/l/fIl.
(e) ¿Est5n sesgados los datos? Si es así, indique cómo. (a) Construya una tabla que incluya la media aritmética, la mediana, el rango y la des-
(d) Con base en los resultados de los incisos (a)-(c), si tuviera que informar al presiden- viación estándar para los 17 fondos de tecnología.
te de la compañía cuánto tiempo en promedio tiene que esperar un cliente para que (b) Construya una tabla que incluya la media aritmética, la mediana, el rango y la des-
su queja se solucione, ¿cu'ál sería su respuesta? Explique. viación estándar para los 6 fondos de tecnología sin cargos de ventas.
3.51 TIJe Wa/l Srreer JOllrnal informa cada día acerca de más de 6,000 fondos mutuos. El ar- (e) Construya una tabla que incluya la media aritm€tica, la mediana, el rango y la des-
chivo de datos FUNDS contiene información de una muestra de 140 fondus mutuos to- viación estándar para los II fondos de tecnología con cargos de ventas.
mada del Walf S/reet J()llnw!, el 5 de abril de 1999, El archivo contiene seis variables: (d) Repita los incisos (a)-(c), utilice la variable Quar/erly Relllfll.
Fund' nombre del fondo mutuo. (e) Repita los incisos (aHc), utijice la variable Expenses.
(f) Escriba un resumen breve del análisis detallado que realizó en los incisos (a)-(e).
Objec/íl'e: tipo de acciones que componen el fondo mutuo. GI = crecimiento e ingreso;
JL = internacional; Me = compañías medianas; se = compañías pequeñas; TK =
3.55 Como ilustración del mal uso de la estadística, un artículo de Glenn Kramon ("CoaKing
the Stanford E[ephant to Dance", The New York Times Sunday Business Seclion, 11 de
tecnología.
Sales Cllarge: y = sí; N = no, noviembre de 1990) insinuaba que los costos en el Stanford Medical Center se habían
elevado más que los de otras instituciones competidoras, porque era más probable que el
Quar/erfy Re/um: rendimiento tOlOldel primer trimestre de 1999 (%).
Stanford Medical cenler tratara pacientes indigentes, de Medicare, de Medicaid, más en-
AII/wal Relllrn: rendimiento a doce meses (%).
£rpeflses: gastos causados por el fondo mutuo (% del valor neto promedio de los activos). fennos y más complejos. Para ilustrar esto, se presentó una gráfica con una comparación
del promedio de cargos de hospital entre 1989 y 1990 para tres procedimientos médicos
F"ellle: The Wall St"",t Joumal. 5 de ,.hri/ ele /999.
(marcapasos coronarios, parto normal y reemplazo de articulación de cadera) en tres ins-
(a) Para la variable QlIarterly Re/Un!, calcule tituciones competidoras (El Camino, Sequoia y Stanford).
(1) la media aritmética (7) el rango
(2) la mediana (8) el rango inlercuartil
(3) el rango medio (9) la varianza
(4) el primer cuartil (10) la desviación estándar
Costos del cuidado de la satud
(5) el tercer cuartil (11) el coefictente de variación Comparación del promedio de cargos de hospital entre 1989 y 1990
(6) el eje medio en California por diversas operaciones. Los hospitales Sequoia y
(b) Interprete la media aritmética, la mediana y la desviación estándar. El Camino son la competencia local más importante del Stanlord
50,000 Medical Center.
(c) Constmya un diagrama de caja y bigotes.
(d) ¿Están sesgados [os datos? Si es así, indique cómo.
ll'i'EI El Camino
40,000
(e) Repita las partes (a)-(d) para la variable Allflllal Re/unJ. D Sequoia
(f) ¿Qué conclusiones puede deducir con relación al rendimiento trimestral y el rendi- 30,000 D Stanlord
miento anual de los fondos mutuos? ~
~
Q
3.52 Considere la variable Expemes para los datos de los fondos mutuos que se describen en 20,000
el problema 3.51. Cada fondo cobra a sus inversionistas cargos por gastos, expresados
como porcentaje de los activos netos promedio. 10,000
(6) el eje medto D L", dot", d. 5t.nford SO".1 oo,to prom.dio d. lodo. 1•• op<rlciones.
(b) Discula las medidas de tendencia central y la variación que se obtuvieron en el inci- Fuenle; Stanford Medicat Centar, Sequo;. Hospii.t y El Camino Hospital.
so (a).
(e) Construya un diagrama de caja y bigotes. Reimpreso ron penuiso d~ Tite New York Times.
148 CAPÍTULO 3 RESUMEN y DESCRIPCiÓN DE DATOS NUMÉRtCOS CASO DE f'STtIf)[f)-STATE ALCOHOLlC BF:VFRAGES OVF.RSI(;IIT BOARD. ESTUDIO SOBRE CERVEZAS 14\
cuadros de K-ésimo mayor y K-ésimo menor y escriba I en sus cuadros de edición. Selec-
"',
'"
'::.'. CASO SPRINGVILlE HERALO cione la opción En una hoja nue,'a y escriba el nomb~ de Descriptiva en su cuadro de edi-
• ción. Active el cuadro de Resumen de estadísticas. Oprima el botón Aceptar.
Waller Fairfax, jefe del departamento de servicios rían vnrias medidas descripti\'a.~ de resumen relati-
deeómpulo, notó que además de la gran cantidad de vas a ubicación, vnriación y sesgo para que los in- Uso del complemento PHStot para obtener un diagrama
tablas y g.r.ificas preparndas con base en la tabla fonnes proporcionados a la administraci6n fueran de caja y bigotes
SH2.4 (vúse la página 93), con relación a la can- más útiles. Para obtener un diagrama de caja y bigotes con PHStat, mantenga abierto el libro de MU-
tidad de cartuchos que son aecesados, se necesita- TUAL.Xl.S, seleccione PHStall Box-and-Whisker Plol. En el cuadro de edición de "Data
Variable CeU Rangc" escriba D1:018. Active el cuadro de First cell contains labeL Elija la
Ejercicio
opción Single Group Variahle. Haga click en OK. Si se desea un diagrama lado a lado para
A~cltlvo 3.1 (a) Obtenga todas las medidas descriptivas de re.~umt:n, diagramas de tallo y hoja y grnficas dt: varios grupos, deberá selcccionarse una de las opciones de "Multiple goups".
II£D<l.T():I;
cajn y bigote.••relativos 11 la cantidad de cartm:hos de datos qut: son acct:sados durante las
SH2
actividades, que usted considere sean de utilidad para la preparación de un infonne parn la
administraci6n.
(b) Escriba un informe para la administr.aci6n que resuma los resullados obtenidos a partir de
+ ApÉNDICE 3.2 USO DE MINITAB EN LA ESTADisTICA
las rnedida.••descriptivas de resumen, los diagr<lmlls de 1.1110 y hoja y las grnlieas de caja y DESCRIPTIVA
bigotes desarrolladas en el inciso (a).
Obtención de la estadística descriptiva y un díagrama
de caja y bigotes
Referendas Obtenci6n de estadfstieas descriptivas para los 17 fondos de acciones generales nacionales
con cargos por ventas con los otros grupos dc códigos (véase la figura 3.8 en la página 123),
lo Huf(, O., HolI' 10 Li~ 11';111 Stalistics (New York: Nonon, abra el archivo MUTUAL.MnV. Seleccione Stall Ha,sic Statistics I Display Oescriptive
5. Minilab Version 12 (State Cal1ege. PA: Minitnblnc.,
1954). Slatistics. En el cuadro de diálogo de Display Descriptive Statislics en el cuadro de Varia-
1998).
2. Kendall, M. O., nnd A. Stuan, 1ñ~ Adl'flllad Th~ory o/ 6. Tub:y, 1., Expforatory Dala Analysis (Rt:ading. MA: Ad- bles escriba 'Rcnd a 1 año' o C4. Activc el cuadro Ry variable y escriba 'Grupo' o CS.
Statistics, vol. 1 (Londan: Chnrles W. Oriffin, 1958).
dison-Wesley,1977). Seleccione Graphs. Active el cuadro de Boxplot of data. Oprima el botón OK. Oprima el
3. Kimble, G. A., 1I01i' lo US~(tmd Misus~)Statistics (F..ngle- 7. Vencman, P. F., and D. C. Hoaglin, Applications, Btuics, botón OK de nuevo.
wood Cliffs, NI: Prentiee Hall, (978). nnd Computing o/ &pforarory Dala Anafysis (Boslon,
4. Microsoft Exal 97 (Redmond, WA: Microsoft Corporn-
MA: Duxbury Prcss, 1981).
tion, 1997).