Anda di halaman 1dari 19

DESCRIPCIÓN BREVE

Aquí solo se dará una explicación breve a la solución


de ejercicios seleccionados del libro de estadística
Mario Triola primera edición.

Morales Pluma Gerardo


Instituto Tecnológico de Tijuana

ESTADISTICA
INFERENCIAL 1
Capítulo 1, 2, 3
INSTITUTO TECNOLOGICO DE TIJUANA
Ingeniería Industrial

Materia: Estadística Inferencial


Grupo: 3Z
Profesor: Juan Morales
Alumno: Morales Pluma Gerardo
No. Control: B09210262
Capitulo #1, #2, #3
Tarea #1
Resolver los ejercicios propuestos

Tijuana B.C a 4 de febrero del 2018


Capítulo 1 Introducción a la Estadística (Paginas 1-42)
1-2 Pensamiento Estadístico
Ejercicios Páginas 9-11 Ejercicios 1, 3, 7, 9, 19, 23,27

1.- ¿Qué es una muestra de respuesta voluntaria?


R= Es aquella donde los propios sujetos deciden incorporarse. Los sujetos deciden si responden o
no.
3.- ¿Qué diferencia existe entre la significancia estadística y la significancia práctica?
R= En la significancia estadística se utilizan métodos estadísticos para determinar una conclusión y
en la significancia practica se usa el sentido común para determinar una conclusión.
En los ejercicios 7 a 14, utilice el sentido común para determinar si el acontecimiento descrito es a) imposible,
b) posible, pero muy improbable, c) posible y probable.

7. Súper Bowl Los Gigantes de Nueva York derrotaron a los Broncos de Denver en el Súper Bowl
con un marcador de 120 a 98.
R= En base a información de juegos de la NFL no se encontraron resultados con esos puntos. Por
lo tanto considero que los resultados son posibles, pero muy improbables.
9.- Semáforos Mientras conducía por la ciudad, Mario Andretti se encontró con tres semáforos
consecutivos y todos estaban en verde.
R= Posible y probable

En los ejercicios 19 a 22, utilice los datos de la siguiente tabla. Los valores x son los pesos (en libras) de
automóviles; los valores y son las cantidades correspondientes de combustible consumido en carretera (en
millas/gal). (Los valores se obtuvieron del conjunto de datos 16 del apéndice B)

19.- Contexto de los datos Remítase a la tabla con las medidas de los automóviles. ¿Cada valor x
está pareado con el valor y correspondiente, como en la tabla 1-1 de la página 5? Es decir, ¿cada
valor x está asociado con el correspondiente valor y de alguna forma significativa? Si los valores x y
y están pareados, ¿tiene sentido utilizar la diferencia entre cada valor x y el valor y ubicado en la
misma columna? ¿Por qué?
R= Los valores x no están pareados con los de y, ya que no podemos comparar pesos de vehículos
con gasto de combustible.
Los datos carecen de contexto. No se especifican algunos datos importantes como el uso de motor,
eficiencia etc.
No tiene sentido utilizar la diferencia de valores de x con y, ya que no se puede relacionar el peso
con el combustible.
En los ejercicios 23 a 26, dé una conclusión sobre la significancia estadística. No realice ningún cálculo formal.
Utilice los resultados presentados o haga juicios subjetivos acerca de estos.
23.- Significancia estadística En un estudio del programa Ornish para la pérdida de peso, 40
sujetos perdieron un promedio de 3.3 lb después de 12 meses (con base en datos de “Comparison
of the Atkins, Ornish, Weight Watchers, and Zone Diets for Weight Loss and Heart Disease 1-3 Tipos
de datos 11 Risk Reduction”, de Dansinger et al., Journal of the American Medical Association, vol.
293, núm. 1). Es posible utilizar métodos estadísticos para demostrar que, si esta dieta no tiene
efecto alguno, la probabilidad de obtener esos resultados es de aproximadamente 3 en 1000. ¿El
programa Ornish para la pérdida de peso tiene significancia estadística? ¿Tiene significancia
práctica? ¿Por qué?
R= Como las probabilidades son muy pocas es significativo. Por sentido común esa cantidad de peso
perdida, para la mayoría de las personas es irrelevante. Existen otras formas de perder mas peso.

Más allá de lo básico


27.- Conclusiones Remítase a las cantidades de combustible consumido en la ciudad y en carretera
por los diferentes automóviles del conjunto de datos 16 del apéndice B. Compare las cantidades de
combustible consumido en la ciudad con las cantidades consumidas en carretera; después responda
las siguientes preguntas sin efectuar cálculos.
a) ¿La conclusión de que las cantidades consumidas en carretera son mayores que las cantidades
consumidas en la ciudad parecen estar sustentadas por una significancia estadística?
R= No, porque los resultados están basados en una situación idealizada. Considero que se debe
tomar encuentra factores como la calidad de los caminos, relieves, cantidad de semafors. Cada
ciudad es distinta.

b) ¿La conclusión de que las cantidades consumidas en carretera son mayores que las cantidades
consumidas en la ciudad parecen estar sustentadas por una significancia práctica?
R= Sí, ya que toda persona con automóvil tiene una idea sobre su gasto de combustible en los
trayectos que recorre durante una semana. Cuando se conduce distancias más largas se puede
apreciar el incremento del gasto de combustible.

c) ¿Cuál sería una de las implicaciones prácticas de una diferencia sustancial entre las cantidades
de combustible consumidas en la ciudad y en carretera?
R= Posiblemente seria las velocidades en que se conduce, la hora en que se conduce, el tipo de
terreno.
1-3 Tipos de Datos
Ejercicios Paginas 16-17 Ejercicios 2, 6, 10, 12, 32, 34

2.- Datos cuantitativos y categóricos ¿Cuál es la diferencia entre los datos cuantitativos y los datos
categóricos?
R= Datos cuantitativos: consiste en números que representan conteos o mediciones y los datos
categóricos consiste en nombres o etiquetas, que no representan conteos ni mediciones.

En los ejercicios 5 a 12, determine si el valor dado es un estadístico o un parámetro.


6.- Política De los senadores que conforman el Congreso estadounidense actual, el 44% son
demócratas.
R= El valor se considera como parámetro, ya que se toma en cuenta a todos los senadores que
conforman el congreso.

10.- Tabla periódica El peso atómico promedio (o la media del peso atómico) de todos los elementos
de la tabla periódica es de 134.355 unidades de masa atómica unificada.
R= El valor se considera como parámetro. Se están tomando en consideración todos los elementos
de la tabla periódica.

12.- Ganancias de películas El autor eligió al azar 35 películas y calculó la cantidad de dinero que
obtuvieron por las ventas de boletos. El promedio (o la media) es de $123.7 millones.
R= Estadístico

En los ejercicios 29 a 32 identifique a) la muestra y b) la población. Además, determine si la muestra parece ser
representativa de la población.
32.- Encuesta de AOL América Online pidió a los suscriptores que respondieran la siguiente
pregunta: “¿Qué frase publicitaria le disgusta más?”. Se presentó a los participantes una lista con
varias frases publicitarias utilizadas para alentar las ventas de automóviles, y la de Volkswagen
recibió el 55% de las 33,160 respuestas. Su frase era “Alivia el sufrimiento producido por el gas”.
R= Muestra, la muestra es representativa de la población, ya que los individuos seleccionaron la
frase que más les disgustaba de una serie de varias frases.
Más allá de lo básico
34.- Interpretación de encuesta política Para la encuesta descrita en el problema del capítulo,
suponga que se preguntó a los participantes por el partido político de su preferencia y que las
respuestas se codificaron como 0 (para los demócratas), 1 (para los republicanos), 2 (para los
independientes) o 3 (para cualquier otra respuesta). Si se calcula el promedio (o la media) de las
cifras y se obtiene 0.95, ¿cómo se interpreta este valor?
R= que el 5 por ciento restante de las personas prefieren a los demócratas..

1-4 Pensamiento Crítico


Ejercicios Páginas 23-26 Ejercicios 3, 5, 9, 21, 23,27

3.- Correlación y causalidad Con el uso de datos del FBI y de la Oficina de Alcohol, Tabaco y Armas
de Fuego (Bureau of Alcohol, Tobacco, and Firearms), métodos estadísticos demostraron que para
los diferentes estados de EUA existe una correlación (o asociación) entre el número de armas
automáticas registradas y la tasa de homicidios. ¿Podemos concluir que un incremento en el número
de armas automáticas registradas causa un aumento de la tasa de homicidios? ¿Podríamos reducir
la tasa de homicidios disminuyendo el número de armas automáticas registradas?
R= Puede existir una correlación entre el incremento de armas y los homicidios, pero no se puede
decir que el incremento de armas sea la causa de los homicidios, ya que no se considera el estado
mental de las personas.
En los ejercicios 5 a 8, utilice el pensamiento crítico para elaborar una conclusión alternativa o correcta. Por
ejemplo, considere un informe de los medios de comunicación masiva de que los automóviles BMW causan que
las personas estén más saludables. Veamos una conclusión alternativa: Los conductores de automóviles
BMW tienden a ser más adinerados que otros adultos, y una mayor riqueza está relacionada con un mejor
estado de la salud.
5.- Las personas que se gradúan de la universidad viven más tiempo Con base en un estudio
que revela que las personas que se gradúan de la universidad viven más tiempo que quienes no lo
logran, un investigador concluye que el hecho de estudiar provoca que la gente viva más tiempo.
R= Las personas que cuentan con un título profesional, incrementan la posibilidad de tener mayores
oportunidades laborales, económicas y, por tales razones mejora su calidad de vida.
En los ejercicios 9 a 20, utilice el pensamiento crítico para indicar lo que se le pide.
9.- Discrepancia entre resultados reportados y observados Cuando Harris Interactive encuestó
a 1013 adultos, el 91% dijo que se lavaba las manos después de utilizar un baño público. Sin
embargo, cuando se hizo una observación de 6336 adultos, se encontró que en realidad el 82% se
lavaba las manos. ¿Cómo se puede explicar esta discrepancia? ¿Qué porcentaje es más probable
que indique con exactitud la tasa real de las personas que se lavan las manos en un baño público?
R= Que quizá el grupo de los 1013 adultos no dijo la verdad por vergüenza. Las observaciones
aseguran el estudio y la cantidad de personas observadas son mayores.

Porcentajes. En los ejercicios 21 a 28, responda las preguntas relacionadas con los porcentajes.
21.- Porcentajes
a) Convierta la fracción 5/8 a un porcentaje equivalente.
R= 0.625*100=62.6%

b) Convierta 23.4% a su equivalente decimal.


23.4
R= 23.4% = = 𝟎. 𝟐𝟑𝟒
100

c) ¿Cuál es el 37% de 500?


37
R= 37% 𝑑𝑒 500 = × 500 = 𝟏𝟖𝟓
100

d) Convierta 0.127 a un porcentaje equivalente.


R= 0.127 × 100% = 𝟏𝟐. 𝟕%

23.- Porcentajes en una encuesta Gallup


a) En una encuesta Gallup, aplicada a 734 usuarios de Internet, el 49% reveló que de manera
frecuente u ocasional realiza compras en línea. ¿Cuál es el número real de usuarios de Internet que
afirmaron que compran en línea de manera frecuente u ocasional?
R= procederemos a realizar un equivalente de datos
Usuarios Porcentaje (49)(734)
X= = 359.66 ≈ 360
734 100% 100
x= __? 49% ∴ 𝑒𝑙 49% 𝑒𝑞𝑢𝑖𝑣𝑎𝑙𝑒𝑛 𝑎 360 𝑢𝑠𝑢𝑎𝑟𝑖𝑜𝑠

b) De los 734 usuarios de Internet encuestados por Gallup, 323 dijeron que de manera frecuente u
ocasional realizan planes de viaje consultando información en línea. ¿Cuál es el porcentaje de
personas que afirmaron que de manera frecuente u ocasional realizan planes de viaje consultando
información en línea?
R= procederemos a realizar un equivalente de datos
Usuarios Porcentaje (323)(100)
X= = 44%
734 100% 734
323 x= __? ∴ 𝑙𝑜𝑠 323 𝑢𝑠𝑢𝑎𝑟𝑖𝑜𝑠 𝑒𝑞𝑢𝑣𝑎𝑙𝑒𝑛 𝑎𝑙 44 %

27.- Porcentajes en los medios de comunicación En el New York Times Magazine, un reporte
acerca de la disminución de inversión occidental en Kenia incluyó la siguiente afirmación: “Después
De años de vuelos diarios, Lufthansa y Air France suspendieron el servicio a los pasajeros. La
inversión extranjera cayó 500% durante la década de 1990”. ¿Qué es incorrecto en esta afirmación?
R= El 100% hace referencia a la totalidad. No se justifica hacer referencia a porcentajes mayores de
100

1-5 Recolección de Datos Muéstrales


Ejercicios Páginas 34-37 Ejercicios 4, 6, 10, 22, 24, 26,32

4.- Muestra de conveniencia El autor realizó una encuesta entre los estudiantes de sus clases; les
pidió que indicaran si eran zurdos o diestros. ¿Es probable que esta muestra de conveniencia arroje
resultados que sean típicos de la población? ¿Es probable que los resultados sean buenos o malos?
¿La calidad de los resultados de esta encuesta refleja la calidad de las muestras de conveniencia en
general?
R= Si es probable, es probable ya que no especifica que está estudiando, si, ya que se podrán
identificar los estudiantes zurdos y diestros.

En los ejercicios 5 a 8, determine si la descripción dada corresponde a un estudio observacional o a un


experimento.
6.- Encuesta sobre tabaquismo Gallup realizó una encuesta telefónica a 1018 adultos, y el 22%
de ellos admitieron haber fumado cigarrillos durante la semana anterior.
R= Experimento

En los ejercicios 9 a 20 identifique el tipo de muestreo que se utilizó: aleatorio, sistemático, de conveniencia,
estratificado o por conglomerados.
10.- Prueba de la equinácea Un estudio sobre la eficacia de la equinácea incluyó infecciones del
tracto respiratorio superior. Un grupo de infecciones fue tratado con equinácea, y otro grupo fue
tratado con placebos. Los grupos de tratamiento con equinácea y de placebo se determinaron
mediante un proceso de asignación aleatoria (según datos de “Efficacy and Safety of Echinacea in
Treating Upper Respiratory Tract Infections in Children”, de Taylor et al., Journal of the American
Medical Association, vol. 290, núm. 21).
R= Muestreo estratificado

Muestras aleatorias y muestras aleatorias simples. Los ejercicios 21 a 26 se refieren a muestras aleatorias y a
muestras aleatorias simples.
22.- Muestra sistemática Un ingeniero de control de calidad selecciona cada diezmilésimo dulce
M&M que se produce. ¿Este plan de muestreo da como resultado una muestra aleatoria? ¿Una
muestra aleatoria simple? Explique.
R= No .Al seleccionar cada diezmilésimo dulce, queda claro que pertenece a un muestreo
sistemático.

24.- Muestra estratificada Con la finalidad de realizar una prueba de la brecha de género en la
forma en que los ciudadanos perciben al presidente actual, Tomkins Company encuesta
exactamente a 500 hombres y 500 mujeres seleccionados al azar entre todos los adultos que viven
en Estados Unidos. Suponga que el número de hombres y mujeres adultos es el mismo. ¿Este plan
de muestreo da como resultado una muestra aleatoria? ¿Una muestra aleatoria simple? Explique.
R= Suponiendo que el número de mujeres y hombres es el mismo, la muestra puede ser aleatoria
ya que cada persona tiene la misma posibilidad de ser seleccionado.

26.- Muestreo de estudiantes Un salón de clases alberga a 36 estudiantes sentados en seis filas
diferentes, con seis estudiantes en cada fila. El profesor arroja un dado para elegir una fila, y luego
lo arroja nuevamente para elegir un estudiante específico de la fila. El proceso se repite hasta
completar una muestra de 6 estudiantes. ¿Este plan de muestreo da como resultado una muestra
aleatoria? ¿Una muestra aleatoria simple? Explique.
R= Aleatoria simple, ya que las posibilidades de un dado son las mismas que las 6 filas y los 6
alumnos a seleccionar.

Más allá de lo básico

32.- Diseño de muestreo Usted es el encargado de realizar una encuesta laboral a los estudiantes
graduados de su universidad. Describa los procedimientos para obtener una muestra de cada tipo:
aleatoria, sistemática, de conveniencia, estratificada y por conglomerados.
R=
Aleatoria: seleccionando un hombre y una mujer de cada licenciatura.
Aleatoria simple: seleccionando 4 hombre y 4 mujeres de cada licenciatura y después seleccionaría
a 2 hombres y mujeres aleatoriamente.
Estratificada y por conglomerados, ya que de esta forma se puede ver de una manera y por
parámetros la muestra seleccionada de forma coherente.

Capítulo 2 Resumen y Gráficas de Datos (Páginas 43-80)


2-2 Distribuciones de Frecuencia
Bajar archivo de plataforma buscar video y resolver todos los ejercicios del archivo
1.- Pulsos de mujeres Utilice los pulsos de las mujeres de la tabla 2-1 y siga el procedimiento anterior
para construir la distribución de frecuencias de la tabla 2-2. Incluya 7 clases.

distribucion de frecuencia"pulso de mujeres" distribucion de frecuencia vs porcentaje"pulso de muejeres"


14 40
14
35
12
12
11 30
30
27.5
10
Frequency

Percent
8
20

4
10

2
1 1 1 2.5 2.5 2.5
0 0
0 0
64.5 74.5 84.5 94.5 104.5 114.5 124.5 60 70 80 90 100 110 120
mujeres mujeres

2.- Pulsos de Hombres Utilice los pulsos de los hombres para construir la distribución de
frecuencias. Incluya 10 clases.

distribucion de frecuencia "pulso de hombres" distribucion de frecuencia vs porcentaje "pulso de hombres"


14 35
13 32.5

12 30

10 25
Frequency

8 20
Percent

7 17.5

6 15
6 15

4 4 10 10
4 10
3 7.5

2 5
2 5
1 2.5

0 0 0 0
0 0
58 68 78 88 98 58 68 78 88 98
hombre hombre

3.- Radiación en dientes de leche A continuación se presenta una lista con las cantidades de
estroncio-90 (en milibecquereles) que hay en una muestra aleatoria simple de dientes de leche; la
muestra se obtuvo de los residentes de Pensilvania nacidos después de 1979 (con base en datos
de “An Unexpected Rise in Strontium-90 in U.S. Deciduous Teeth in the 1990s”, de Mangano et al.,
Science of the Total Environment). Construya una distribución de frecuencias con ocho clases.

distribucion de frecuencia "dientess"


14
distribucion de frecuencia vs "dientess"
14 40

35
12

10 30
Frequency

8
8
Percent

20
6 20
6
5
15
4 12.5
4
10
2
10
2
1 5
0 2.5
0 0
118.5 128.5 138.5 148.5 158.5 168.5 178.5 188.5 0
118.5 128.5 138.5 148.5 158.5 168.5 178.5 188.5
dientes
dientes

2-3 Histogramas
Bajar archivo de plataforma buscar video y resolver todos los ejercicios del archivo

1.- Los datos son del Departamento de Salud y Servicios Humanos de Estados Unidos (National
Center for Health Statistics, Third National Health and Nutrition Examination Survey). La EDAD está
dada en años, EST es estatura (en pulgadas), PE es peso (en libras), CINT es circunferencia de la
cintura (en cm), PULSO es frecuencia del pulso (en latidos por minuto), SIST es presión sanguínea
sistólica (en mm Hg), DIAS es presión sanguínea diastólica (en mm Hg), COL es colesterol (en mg),
IMC es índice de masa corporal, MUS es longitud del muslo (en cm), CODO es anchura del codo (en
cm), MUÑ es anchura de la muñeca (en cm) y BRA es circunferencia del brazo (en cm).
Realizar los Histogramas de La Edad, Estatura (en pulgadas), Peso (en libras), Pulso e IMC es
índice de masa corporal.
R=
Edad EST(Inche)
Summary Report for Edad Summary Report for EST(Inche)
Anderson-Darling Normality Test
Anderson-Darling Normality Test
A-Squared 0.35
A-Squared 0.77
P-Value 0.467
P-Value 0.041
Mean 68.385
Mean 35.475 StDev 3.003
StDev 13.927 Variance 9.020
Variance 193.948 Skewness 0.000038
Skewness 0.635477 Kurtosis 0.582349
Kurtosis -0.252642 N 40
N 40 Minimum 61.300
1st Quartile 66.350
Minimum 17.000
Median 68.300
1st Quartile 25.250 3rd Quartile 70.225
Median 32.500 Maximum 76.200
3rd Quartile 45.500
95% Confidence Interval for Mean
Maximum 73.000
64 68 72 76 67.425 69.345
95% Confidence Interval for Mean
95% Confidence Interval for Median
24 36 48 60 72 31.021 39.929 67.823 69.200
95% Confidence Interval for Median 95% Confidence Interval for StDev
28.000 40.589 2.460 3.856
95% Confidence Interval for StDev
11.408 17.882
95% Confidence Intervals

Mean
95% Confidence Intervals
Median
Mean
67.5 68.0 68.5 69.0 69.5

Median

30 33 36 39 42

PE(lb) Pulso
Summary Report for PE(lb) Summary Report for Pulso
Anderson-Darling Normality Test Anderson-Darling Normality Test
A-Squared 0.31 A-Squared 1.41
P-Value 0.552 P-Value <0.005
Mean 172.55 Mean 69.400
StDev 26.33 StDev 11.297
Variance 693.12 Variance 127.631
Skewness 0.370375 Skewness 0.680024
Kurtosis -0.166416 Kurtosis -0.639518
N 40 N 40
Minimum 119.50 Minimum 56.000
1st Quartile 152.00 1st Quartile 60.000
Median 169.95 Median 66.000
3rd Quartile 190.60 3rd Quartile 76.000
Maximum 237.10 Maximum 96.000
95% Confidence Interval for Mean 95% Confidence Interval for Mean
120 150 180 210 240 164.13 180.97 60 70 80 90 65.787 73.013
95% Confidence Interval for Median 95% Confidence Interval for Median
163.14 176.33 64.000 72.000
95% Confidence Interval for StDev 95% Confidence Interval for StDev
21.57 33.81 9.254 14.506

95% Confidence Intervals 95% Confidence Intervals

Mean Mean

Median Median

165 170 175 180 64 66 68 70 72 74

IMC
Summary Report for IMC
Anderson-Darling Normality Test
A-Squared 0.45
P-Value 0.261
Mean 25.998
StDev 3.431
Variance 11.770
Skewness 0.356785
Kurtosis -0.136448
N 40
Minimum 19.600
1st Quartile 23.575
Median 26.200
3rd Quartile 27.700
Maximum 33.200
95% Confidence Interval for Mean
20 24 28 32 24.900 27.095
95% Confidence Interval for Median
24.541 26.818
95% Confidence Interval for StDev
2.810 4.405

95% Confidence Intervals

Mean

Median

24.5 25.0 25.5 26.0 26.5 27.0

2.- Realizar los Histogramas de CINT es circunferencia de la cintura (en cm), MUS es longitud del
muslo (en cm), CODO es anchura del codo (en cm), MUÑ es anchura de la muñeca (en cm) y BRA
es circunferencia del brazo (en cm).
R=
Cint (cm) Mus(cm)
Summary Report for Cint (cm) Summary Report for Mus(cm)
Anderson-Darling Normality Test Anderson-Darling Normality Test
A-Squared 0.52 A-Squared 0.20
P-Value 0.174 P-Value 0.871
Mean 91.285 Mean 42.573
StDev 9.862 StDev 2.908
Variance 97.256 Variance 8.455
Skewness 0.03696 Skewness -0.004234
Kurtosis -1.05808 Kurtosis -0.113705
N 40 N 40

Minimum 75.200 Minimum 36.000


1st Quartile 83.125 1st Quartile 40.575
Median 91.200 Median 42.650
3rd Quartile 101.900 3rd Quartile 44.475
Maximum 108.700 Maximum 48.400
95% Confidence Interval for Mean 95% Confidence Interval for Mean
88.131 94.439 36 38 40 42 44 46 48 41.643 43.502
80 88 96 104
95% Confidence Interval for Median 95% Confidence Interval for Median
87.346 94.959 41.041 43.754

95% Confidence Interval for StDev 95% Confidence Interval for StDev
2.382 3.734
8.078 12.663

95% Confidence Intervals


95% Confidence Intervals
Mean
Mean

Median
Median
41.0 41.5 42.0 42.5 43.0 43.5 44.0
88 90 92 94 96

Codo(cm) Muñ(cm)
Summary Report for Codo(cm) Summary Report for Muñ(cm)
Anderson-Darling Normality Test Anderson-Darling Normality Test
A-Squared 0.34 A-Squared 0.50
P-Value 0.492 P-Value 0.203
Mean 5.8000
Mean 7.2950
StDev 0.3545
StDev 0.4517
Variance 0.1256
Variance 0.2041 Skewness 0.298181
Skewness 0.355825 Kurtosis 0.316960
Kurtosis -0.404497 N 40
N 40
Minimum 5.2000
Minimum 6.5000 1st Quartile 5.6000
1st Quartile 7.0000 Median 5.8000
Median 7.3000 3rd Quartile 6.0000
3rd Quartile 7.5000 Maximum 6.7000
Maximum 8.3000 95% Confidence Interval for Mean
95% Confidence Interval for Mean 5.2 5.6 6.0 6.4 6.8 5.6866 5.9134
6.5 7.0 7.5 8.0 7.1505 7.4395 95% Confidence Interval for Median
95% Confidence Interval for Median 5.7000 5.9589
7.1000 7.5000 95% Confidence Interval for StDev
95% Confidence Interval for StDev 0.2904 0.4551
0.3701 0.5801

95% Confidence Intervals


95% Confidence Intervals Mean

Mean
Median

Median 5.70 5.75 5.80 5.85 5.90 5.95

7.1 7.2 7.3 7.4 7.5


Bra(cm)
Summary Report for Bra(cm)
Anderson-Darling Normality Test
A-Squared 0.47
P-Value 0.232
Mean 32.388
StDev 3.015
Variance 9.088
Skewness 0.45057
Kurtosis 1.11061
N 40
Minimum 25.900
1st Quartile 30.700
Median 32.050
3rd Quartile 33.925
Maximum 41.100
95% Confidence Interval for Mean
28 32 36 40 31.423 33.352
95% Confidence Interval for Median
31.082 33.277
95% Confidence Interval for StDev
2.469 3.871

95% Confidence Intervals

Mean

Median

31.0 31.5 32.0 32.5 33.0 33.5

2-4 Gráficas Estadísticas


Ejercicios Páginas 67-70 Ejercicios 1, 3, 5, 9, 21, 23,27

1.- Polígono de frecuencias y gráfica de puntos En el ejemplo 1 se incluye un polígono de


frecuencias que describe los pulsos de mujeres, y el ejemplo 4 presenta una gráfica de puntos del
mismo conjunto de datos. ¿Cuáles son las principales ventajas de la gráfica de puntos sobre el
polígono de frecuencias?
R= La gráfica de puntos permite identificar todos los datos originales. La gráfica de puntos es más
sencilla y más fácil de construir

3.- Polígono de frecuencias relativas En la figura 2-6 se presentan polígonos de frecuencias


relativas para los pulsos de hombres y mujeres. Cuando se comparan dos conjuntos de datos como
Estos, ¿por qué generalmente es mejor utilizar polígonos de frecuencias relativas en lugar de
polígonos de frecuencias?

R= Si se utilizan frecuencias relativas que consisten en proporciones o porcentajes, ambos


conjuntos de datos utilizan medidas que pueden compararse. Si se construyen polígonos de
frecuencias con dos muestras que tienen números de elementos muy diferentes, la comparación es
difícil porque las frecuencias serán muy diferentes.

En los ejercicios 5 a 8, utilice las cantidades de estroncio-90 (en milibecquereles) en una muestra aleatoria
simple de dientes de leche; los datos se obtuvieron de residentes de Pensilvania nacidos después de 1979
(según datos de “An Unexpected Rise in Strontium-90 in U.S. Deciduous Teeth in the 1990s”, de Mangano, et
al., Science of the Total Environment).
155 142 149 130 151 163 151 142 156 133 138 161 128 144 172 137 151 166 147 163
145 116 136 158 114 165 169 145 150 150 150 158 151 145 152 140 170 129 188 156
5.- Gráfica de puntos Construya una gráfica de puntos de las cantidades de estroncio-90. ¿Qué
sugiere la gráfica de puntos acerca de la distribución de esas cantidades?
R= La gráfica de puntos sugiere que las cantidades tienen una distribución aproximadamente normal,
y se distribuye alrededor de 150 milibecquereles

En los ejercicios 9 a 12, utilice los 62 pesos del plástico desechado, que aparecen en el conjunto de datos 22
en el apéndice B.
9.- Gráfica de tallo y hojas Utilice los pesos para construir una gráfica de tallo y hojas. ¿Qué
sugiere esta gráfica acerca de la distribución de los pesos?
R= La gráfica de tallo y hojas sugiere que los pesos del plástico desechado tienen una distribución
sesgada hacia la derecha, aunque no se aleja mucho de una distribución normal

En los ejercicios 21 y 22, utilice los datos pareados del apéndice B para construir un diagrama de dispersión.
21.- Alquitrán y monóxido de carbono en cigarrillos En el conjunto de datos 4, represente el
alquitrán de los cigarrillos tamaño grande para el eje horizontal, y la cantidad de monóxido de carbono
(CO) de los mismos cigarrillos tamaño grande en el eje vertical. Determine si, al parecer, existe una
relación entre el alquitrán y el monóxido de carbono de los cigarrillos tamaño grande. De ser así,
describa la relación.
R= En los cigarrillos tamaño grande no parece haber una relación entre el alquitrán y el monóxido
de carbono.

23.- Gráfica de series de tiempo para la ley de Moore En 1965 Gordon Moore, uno de los
fundadores de Intel propuso lo que ahora se conoce como la ley de Moore: el número de transistores
por pulgada cuadrada en los circuitos integrados se duplica aproximadamente cada 18 meses. La
siguiente tabla lista el número de transistores por pulgada cuadrada (en miles) para varios años
diferentes. Construya una gráfica de series de tiempo con los datos.
R=
Más allá de lo básico

27.- Gráficas de tallo y hojas contiguas Al margen encontrará un formato para las gráficas de tallo
y hojas contiguas, donde aparecen los pulsos de hombres y mujeres de la tabla 2-1 (en la página
47). Complete las gráficas contiguas y luego compare los resultados.
R= En general, parece que los pulsos de los hombres son más bajos que los pulsos de las mujeres

2-5 Pensamiento Crítico: Graficas Inadecuadas


Ejercicios Paginas 73-75 Ejercicios 2, 4,10

2.- Resultados de encuesta América Online (AOL) ocasionalmente realiza encuestas en línea, en
las que los usuarios de Internet pueden responder a una pregunta. Si se construye una gráfica para
ilustrar los resultados de una encuesta como estas, y la gráfica se diseña de forma objetiva y con
técnicas adecuadas, ¿la gráfica ayudará a comprender mejor la población general? ¿Por qué?
R= Si ayuda a comprender mejor , por que presenta la información de forma sencilla, clara, precisa
y facilita la comparación de datos, destaca las tendencias y las diferencias sin exageración de las
diferencia.

4.- Superficies de países Para construir una gráfica que compare el territorio de los cinco países
más extensos, usted decide describir las cinco áreas con cuadrados de diferentes tamaños. Si se
dibujan los cuadrados de modo que las áreas sean proporcionales a las áreas de los países
correspondientes, ¿la gráfica resultante será confusa? ¿Por qué?
R=si se construye la gráfica con los cuadros de diferentes tamaños proporcionales a lo extenso que
es el país, entiendo que no sería confusa al contrario le daría una idea de lo extenso o grande que
es el territorio
En los ejercicios 5 a 10, responda las preguntas acerca de las gráficas.
10.- Adopciones de niños chinos La siguiente gráfica de barras indica la cantidad de adopciones
de niños chinos por parte de estadounidenses en los años 2000 y 2005. ¿Qué es incorrecto en esta
gráfica? Dibuje una gráfica que describa los datos de forma imparcial y objetiva.
R= Es confusa dado que los ejes no inicia en cero. La gráfica no tiene el punto (0,0) y el eje Y inicia
en 4000 lo cual es incorrecto dado que debería iniciar en 0. Además en el eje X (año) hay un salto
del año 2000 al 2005.

Capítulo 3 Estadísticos para Describir, Explorar y Comparar (Paginas 81-134)


3-2 Medidas de Tendencia Central
Ejercicios Paginas 94-99 Ejercicios 1,5,7,11,27,29,31,33,37
Ejercicio #1
1.- Medidas de tendencia central ¿En qué sentido la media, mediana, moda y mitad del rango son
medidas de “tendencia central”?
R= Utilizan diferentes métodos para proporcionar un valor (o valores) centrales o intermedios de un
conjunto de datos.

En los ejercicios 5 a 20, calcule a) la media, b) la mediana, c) la moda y d) la mitad del rango de los datos
muestrales listados. También responda las preguntas que se plantean.

5.- Número de palabras inglesas Se obtuvo una muestra aleatoria simple de páginas del diccionario
Merriam-Webster’s Collegiate Dictionary, decimoprimera edición. A continuación, se indica el número
de palabras definidas en esas páginas. Puesto que este diccionario tiene 1459 páginas con palabras
definidas, estime el número total de palabras definidas en el diccionario. ¿Es probable que se trate
de una estimación precisa del número de palabras en el idioma inglés?
51 63 36 43 34 62 73 39 53 79
R= x(media)= 53.3
mediana = 52.0
moda = no hay
mitad del rango = 56.5
Si utilizamos la media de 53.3 palabras por página, la estimación del número total de palabras es
77,765. Como la media se basa en una muestra pequeña y como parece que los números de las
palabras definidas en las páginas varían por una gran cantidad, lo más probable es que la estimación
no sea muy precisa.

7.- Costos de choques de automóviles El Insurance Institute for Highway Safety realizó pruebas
con choques de automóviles nuevos que viajaban a 6 mi/h. Se obtuvo el costo total de los daños
para una muestra aleatoria simple de los automóviles probados, lo cual se presenta a continuación.
¿Hay una gran diferencia entre las distintas medidas de tendencia central?
$7448 $4911 $9051 $6374 $4277
R= x(media)= $6412.2
mediana = $6374.0
moda = no hay
mitad del rango = $6664.0
Las diferentes medidas de tendencia central no difieren en grandes cantidades.

11.- Vuelos de transbordador espacial A continuación se presentan las duraciones (en horas) de
una muestra aleatoria simple de todos los vuelos (hasta el momento en que se escribió este libro)
del Space Transport System (transbordador espacial) de la NASA. Los datos corresponden al
conjunto de datos 10 del apéndice B. ¿Hay alguna duración que sea muy poco común? ¿Cómo
podría explicarse?
73 95 235 192 165 262 191 376 259 235 381 331 221 244 0
R= X(media)= 217.3 horas
mediana = 235.0 horas
moda = 235.0 horas
mitad del rango = 190.5 horas.

La duración de 0 horas es muy inusual, y podría representar un vuelo cancelado. (En realidad,
representa la duración del vuelo del Challenger que resultó en una explosión catastrófica casi
inmediatamente después del despegue).

Conjuntos grandes de datos del apéndice B. Para los ejercicios 25 a 28, remítase al conjunto de datos indicado
del apéndice B. Con un programa de cómputo o una calculadora, obtenga las medias y las medianas.
Ejercicio #5
27.- Voltaje de una casa Remítase al conjunto de datos 13 del apéndice B y compare las medias y
las medianas de los tres conjuntos diferentes de niveles de voltaje medidos.

R= x(media)Casa: = 123.66 volts x(media)= 124.66 volts x(media)= 123.59 volts


mediana = 123.70 volts. Gen mediana = 124.70 volts. UPS mediana = 123.70 volts

En los 3 casos su media varia por muy pocas décimas, por otro lado la medina resulta en los 3
casos igual

En los ejercicios 29 a 32, calcule la media de los datos que se resumen en la distribución de frecuencias
indicada. Además, compare las medias calculadas con las medias reales que se obtuvieron al utilizar la lista
original de datos, que es la siguiente: (ejercicio 29) 21.1 mg; (ejercicio 30) 76.3 latidos por minuto; (ejercicio 31)
46.7 mi/h; (ejercicio 32) 1.911 lb.

29.- x(media)= 20.9 mg.

La media de la tabla de
frecuencias se aproxima a la
media de 21.1 mg para la lista
original de datos.
31.- Multas por exceso de velocidad La distribución de frecuencias dada describe
la velocidad de los conductores multados por la policía de la ciudad en
Poughkeepsie. Estos conductores viajaban por una zona de Creek Road, que pasa
por la universidad del autor y tiene un límite de velocidad de 30 mi/h. ¿Qué
diferencia existe entre la media y la velocidad límite de 30 mi/h?
R= 46.8 mi/h, que es muy cercano al valor obtenido con la lista original de valores.
Las velocidades están muy por arriba del límite de 30 mi/h (probablemente porque
la policía multó solo a aquellos que viajaban muy por arriba de la velocidad límite
publicada).

33.- Media ponderada Un alumno del autor obtuvo las siguientes calificaciones: B, C, B, A y D.
Los cursos tenían las siguientes horas de crédito: 3, 3, 4, 4 y 1. El sistema de calificación asigna
estos puntos de calidad a las calificaciones con letras: A = 4; B = 3; C = 2; D = 1; F = 0. Calcule el
promedio de las calificaciones (GPA) y redondee el resultado a dos posiciones decimales. Si la lista
del rector requiere de un promedio de 3.00 o mayor, ¿podrá ingresar este estudiante a la lista del
rector?
R= 2.93; no

Más allá de lo básico

37.- Media recortada Ya que la media es muy sensible a los valores extremos, decimos que no es
una medida de tendencia central resistente. La media recortada es más resistente. Para calcular la
media recortada del 10% de un conjunto de datos, primero se acomodan los datos en orden, después
se elimina el 10% de los valores inferiores y el 10% de los valores superiores y luego se calcula la
media de los valores restantes. Para las calificaciones de crédito que otorga la empresa FICO,
incluidas en el conjunto de datos 24 del apéndice B, calcule lo siguiente. ¿Qué diferencias hay en
los resultados?
a) La media
R= 703.1

b) La media recortada del 10%


R= 709.7

c) La media recortada del 20%


R= 713.7

Por lo tanto los resultados no difieren de manera drástica, al parecer indican la tendencia de un
incremento en los valores conforme aumenta el porcentaje de recorte, de manera que parece que la
distribución de los datos está sesgada hacia la izquierda.

3-3 Medidas de Variación


Ejercicios Páginas 109-114 Ejercicios 2, 6, 28, 32,36

2.- ¿Enunciado correcto? En el libro How to Lie with Charts, se afirma que “la desviación estándar
suele definirse como más o menos la diferencia entre la puntuación más alta y la media, y la
puntuación más baja y la media. Por ejemplo, si la media es 1, el valor más alto es 3 y el valor más
bajo es -1, la desviación estándar es ±2”. ¿Es correcto este enunciado? ¿Por qué?
R= No, porque si aplicamos la formula “[media] ± 2(desviación estándar)” en base a los datos dado,
Obtenemos:

Media 1 Valor Min. -3


Desv. Estd 2 Valor Max. 5

En los ejercicios 5 a 20, calcule el rango, la varianza y la desviación estándar de los datos muestrales. Utilice
las unidades adecuadas (por ejemplo, “minuto”) en sus resultados. (Se usarán los mismos datos de la sección
3-2, donde se calcularon medidas de tendencia central. Aquí se calculan las medidas de variación). Asimismo,
responda las preguntas que se plantean

6.- Pruebas de asientos de seguridad para niños La National Highway Traffic Safety
Administration realizó pruebas de choque con los asientos de seguridad para niños que se utilizan
en los automóviles. A continuación, se incluyen los resultados de esas pruebas, con las medidas
expresadas en hics (unidades estándar de lesiones de cabeza). Según los requisitos de seguridad,
la medida debe ser menor de 1000 hics. ¿Existe una gran variación en las medidas de las pruebas
de los asientos de seguridad para niños?
774 649 1210 546 431 612
R=

Datos 6 x1 X x-X (x-X)²


Rango 1149 774 611.83 162.17 26298.03
hics max. 1210 649 611.83 37.17 1381.36
hics min 61 1210 611.83 598.17 357803.36
Media (x 1) 611.83 546 611.83 -65.83 4334.03
n-1 5 431 611.83 -180.83 32700.69
S² 145186.97 61 611.83 -550.83 303417.36
S1 381.03 Suma Total 725934.83

Conjuntos grandes de datos del apéndice B. Para los ejercicios 25 a 28, remítase al conjunto de datos indicado
del apéndice B. Con un programa de cómputo o una calculadora, obtenga el rango, la varianza y la desviación
estándar.

28.- Películas Remítase al conjunto de datos 9 del apéndice B y considere los montos de ganancias
de dos categorías diferentes de películas: películas con clasificación R y películas con clasificaciones
PG o PG-13. Utilice los coeficientes de variación para determinar si pareciera que las dos categorías
varían en la misma cantidad.
R=
Clasificacion R

Datos 3 x1 X x-X (x-X)²


Rango 112 117 74.00 43.00 1849.00
Ganan. max. 117 5 74.00 -69.00 4761.00
Ganan. min 5 100 74.00 26.00 676.00
Media (x 1) 74.00 Suma Total 7286.00
n-1 2
S² 3643.00
Clasificación Ganancias en millones
Titulo
S1 60.36 de la MPA (de $)
8 millas R 117
Solo en la oscuridadR 5
Colateral R 100

CV 1 8.16%
Clasificacion PG

Datos 3 x2 X x-X (x-X)²


Rango 92 104 0.00 104.00 10816.00
Ganan. Max 104 12 0.00 12.00 144.00
Ganan. min 12 17 0.00 17.00 289.00
Media (x 2) 44.33 Suma Total 11249.00
n-1 2
S² 5624.50
Clasificació Ganancias en millones
Titulo
S2 75.00 n de la MPA (de $)
La guardería de papá
PG 104
From Justin to Kelly
PG 12
El hijo de la máscara
PG 17

CV 2 16.92%

Las Ganancias la peliculas con clasificaion PG tienen


una variación considerablemente mayor a las ganancias de las peliculas clasificacion R

32.- Regla práctica de las desviaciones Utilice la regla práctica de las desviaciones para estimar
la desviación estándar de las edades de todos los profesores de su universidad.
Datos 9 x X x-X (x-X)²
Rango 31 30 34.78 -4.78 22.83
Edad max. 55 24 34.78 -10.78 116.16
Edad min 24 25 34.78 -9.78 95.60
Media 34.78 27 34.78 -7.78 60.49
n-1 8 53 34.78 18.22 332.05
S² 136.94 55 34.78 20.22 408.94
S 11.70 28 34.78 -6.78 45.94
38 34.78 3.22 10.38
33 34.78 -1.78 3.16
Suma Total 1095.56
R=

36.- Teorema de Chebyshev El generador Generac del autor produce voltajes con una media de
125.0 volts y una desviación estándar de 0.3 volts. Por medio del teorema de Chebyshev, ¿qué
sabemos acerca del porcentaje de voltajes que están dentro de tres desviaciones estándar de la
media? ¿Cuáles son los voltajes mínimo y máximo que están dentro de tres desviaciones estándar
de la media?
R=

Media 125
s 0.3 1. ¿qué sabemos acerca del porcentaje de voltajes que están dentro de tres desviaciones estándar de la media?
K 3 R: Por tanto, 89 % es el porcentaje de Volts que esta dentro de 3 desviaciones estándar alrededor de 125
S*K 0.9
% voltaje 88.89% 2. ¿Cuáles son los voltajes mínimo y máximo que están dentro de tres desviaciones estándar de la media?
Volt. Min 124.1 R: Al menos 89 % tiene un voltaje de entre 124.1 y 125.9
Volt. Max 125.9

%V=

3-4 Medidas de Posición Relativa y Gráficas de Caja


Ejercicios Páginas 126-129 Ejercicios 3, 7, 13, 29, 33,35

3.- Gráficas de caja A continuación se presenta una gráfica de la caja, generada por STATDISK, de
las duraciones (en horas) de vuelos de naves espaciales de la NASA. ¿Qué nos indican los valores
de 0, 166, 215, 269 y 423?
R= 0 horas es la duración del vuelo más corto, el primer cuartil Q1 es 166 horas, el segundo cuartil
Q2 (o mediana) es 215 horas, el tercer cuartil Q3 es 269 horas, y el máximo es 423 horas.

Puntuaciones z En los ejercicios 5 a 14, exprese todas las puntuaciones z con dos decimales.
7.- Puntuación z del géiser Old Faithful Las duraciones de las erupciones del géiser Old Faithful
tienen una media de 245.0 segundos y una desviación estándar de 36.4 segundos (de acuerdo con
el conjunto de datos 15 del apéndice B). Una erupción dura 110 segundos.

a) ¿Qué diferencia hay entre la duración de 110 segundos y la media?


R= 135 seco
b) ¿A cuántas desviaciones estándar corresponde [la diferencia obtenida en el inciso a)]?
R= 3.71
c) Convierta la duración de 110 segundos a una puntuación z.
R=-3.71
d) Si consideramos que las duraciones “comunes” son aquellas que corresponden a puntuaciones z
entre -2 y 2, ¿la duración de 110 segundos es común o inusual?
R= Inusual

13.- Comparación de calificaciones de pruebas Las calificaciones en la prueba SAT tienen una
media de 1518 y una desviación estándar de 325. Las calificaciones de la prueba ACT tienen una
media de 21.1 y una desviación estándar de 4.8. ¿Cuál es relativamente mejor: una calificación de
1840 en la prueba SAT o una calificación de 26?0 en la prueba ACT? ¿Por qué?
R= La puntuación de 1840 se convierte a z = 0.99, y la puntuación de 26.0 se convierte a z = 1.02,
de manera que la puntuación de 26.0 es relativamente mejor porque tiene la puntuación z más
grande.

29.- Gráfica de la caja de calificaciones FICO Se obtuvo una muestra aleatoria simple de
calificaciones de crédito otorgadas por la empresa FICO, y los datos ordenados se presentan a
continuación. Construya una gráfica de la caja que incluya los valores del resumen de los 5 números.
664 693 698 714 751 753 779 789 802 818 834 836

R=
Gráficas de caja de los conjuntos más grandes de datos del apéndice B. En los ejercicios 31 a 34, utilice los
conjuntos de datos del apéndice B.
33.- Gráficas de caja para los pesos de monedas de 25 centavos Utilice la misma escala para
construir gráficas de caja para los pesos de monedas de plata de 25 centavos anteriores a 1964 y
posteriores a 1964, a partir del conjunto de datos 20 del apéndice B. Utilice gráficas de caja para
comparar los dos conjuntos de datos.
R= Parece que los pesos de las monedas de 25 centavos acuñadas antes de 1964 son mucho más
altos que los de las monedas acuñadas después de ese año.

Más allá de lo básico

35.- Valores atípicos y gráfica de la caja modificada Utilice las 40 longitudes del muslo (en
centímetros) de mujeres que se incluyen en el conjunto de datos 1 del apéndice B. Construya una
gráfica de caja modificada e identifique cualquier valor atípico, tal como se definió en la parte 2 de
esta sección.
R= Valores atípicos: 27.0 cm, 31.1 cm, 32.1 cm, 48.6 cm.

Anda mungkin juga menyukai