Departamento: Ciencias
Área: Estadística
2014
1
Contenido
1. Procedimientos básicos…………………………………………………………………………4
2. Tutorial Ejemplos………...........................................................................................................13
2
Introducción a MegaStat
MegaStat12 es un complemento de Excel que realiza los análisis estadísticos dentro de un libro de
Excel. Una vez instalado aparece en el menú de Excel y funciona como cualquier otra opción
Excel. El propósito de este documento es presentar cómo funciona MegaStat. En el primer capítulo
se describen los procedimientos generales de operación y convenciones que son comunes en toda
MegaStat. En el segundo capítulo se trabajará a través de un par de tutoriales. La sección de
referencia muestra los cuadros de diálogo de todas las opciones y señala brevemente lo que se
espera de datos / entrada y los aspectos únicos de cada opción.
Mientras MegaStat es una excelente herramienta para el aprendizaje de las estadísticas, este
documento se centra en el uso de MegaStat y no está diseñado para enseñar estadística. De hecho,
se supone que sabe lo que hacen los distintos procedimientos y está familiarizado con la
terminología. También asume que usted tiene un conocimiento básico de trabajo de Excel.
1
MegaStat tiene derechos de autor y es una marca comercial registrada de JB Orris.
2
Este documento es escrito para la versión 10 de MegaStat, sin embargo, la mayor parte serán relevantes para otras
versiones.
3
1. Procedimientos Básicos
Cuando hacemos clic sobre MegaStat del menú principal de Excel (Figura 1). La mayoría de las
opciones de menú muestran sub-menús. Si un elemento del menú es seguido de puntos suspensivos
(...) de hacer clic mostrará el cuadro de diálogo para esa opción.
Un cuadro de diálogo le permite especificar los datos que se utilizarán y otros insumos y opciones.
La Figura 2 muestra un cuadro de diálogo típico. Una vez que haya seleccionado los datos y las
opciones que hace clic en Aceptar, el cuadro de diálogo desaparece y MegaStat realiza el análisis.
Antes de ver los cuadros de diálogo específicos tomemos un minuto para mirar a algunos
problemas que son comunes a todas las opciones. Uso MegaStat es intuitivo y muy parecido a otras
operaciones de Excel, sin embargo, hay algunas características únicas para MegaStat y algunas
maneras de hacer uso más eficiente por lo que valdrá la pena su tiempo para ver el siguiente
material.
4
Figura 2. Caja de diálogo MegaStat
Botones
OK Este botón también puede ser etiquetado como "Calculate", "Go", "Execute" o "Do it". Le
decimos a MegaStat que se ha terminado de especificar las entradas y que se tiene el
control sobre las cosas que se hacen. En primer lugar, los valores ingresados son validados
y luego desaparece el cuadro de diálogo y se muestra la hoja de trabajo de salida. Cuando
desaparece la caja de diálogo, está todavía en memoria y contendrá las mismas entradas si
recordó más tarde.
Clear Este botón elimina todos los valores de entrada y restablece todas las opciones por defecto
de forma.
Cancel Este botón podría ser etiquetado como "Never mind". Simplemente oculta el cuadro de
diálogo. El cuadro de diálogo no se borra o elimina de la memoria. Los formularios de uso
no toman la cantidad de memoria y no hay problema con tener varios de ellos en la
memoria. Sin embargo, si usted realmente desea descargar el formulario, haga clic en la
"X" en la esquina superior derecha del formulario.
Help Este botón muestra la ayuda contextual para el formulario de uso activo. Si desea ver el
sistema de ayuda completo, utilice la selección Help en el menú principal.
5
Selección de datos
La mayoría de los cuadros de diálogo MegaStat tienen campos donde se selecciona rangos de
entrada que contienen los datos que se utilizarán. Los rangos de entrada se pueden seleccionar
cuatro formas:
1. Señalar y arrastrar con el ratón (el método más común).
Desde la caja de diálogo “pops-up” en la pantalla se puede bloquear algunos de sus datos.
Puede mover los cuadros de diálogo por la pantalla colocando el puntero del ratón sobre la
barra de título (el área de color en la parte superior), haciendo clic y manteniendo pulsado el
botón izquierdo del ratón mientras arrastra el cuadro de diálogo para una nueva ubicación.
Incluso puede arrastrar parcialmente fuera de la pantalla.
También se dará cuenta de que cuando se inicia la selección de datos arrastrando el puntero
del ratón, el cuadro de diálogo se transformará en un tamaño más pequeño para ayudarle a
ver los datos subyacentes. Se volverá automáticamente a tamaño completo cuando se suelta
el botón del ratón. También puede colapsar y no colapsar el cuadro de diálogo de forma
manual haciendo clic en el botón Cerrar en el extremo derecho del campo. Al hacer clic en
el botón de nuevo no se colapsa el formulario. (No utilice el botón "X" para no colapsar un
formulario).
Señalar y arrastrar para seleccionar los datos puede ser tedioso, si usted tiene una gran
cantidad de datos. Cuando se arrastra el ratón hacia abajo es fácil la selección y entonces
tienes que arrastrar el ratón hacia atrás hasta llegar al área seleccionada correctamente.
AutoExpand permite la selección rápida de datos sin tener que arrastrar a través de toda la
columna de datos. He aquí cómo funciona:
Asegúrese de que la caja de entrada tenga el foco. (Haga Click en ella o Tab en ella).
La caja de entrada tiene el foco cuando el puntero de inserción parpadea en ella.
Seleccione una fila de datos haciendo clic en una celda de la columna que desee. Si
se selecciona más de una columna, arrastre el ratón a través de las columnas.
El rango de datos se ampliará para incluir todas las filas de la región en la que ha
seleccionado una fila cuando se cumpla una de las siguientes:
o Doble click sobre el campo de entrada
o Click derecho sobre el campo de entrada
o Click izquierdo en la etiqueta junto al cuadro de entrada.
Con un poco de práctica se dará cuenta de que es una forma muy eficiente para seleccionar
datos. La única vez que no se puede utilizar es cuando desea utilizar una columna parcial de
los datos. También debe ser consciente de que la AutoExpand se detiene cuando encuentra
una celda en blanco; así cualquier suma u otros cálculos en la parte inferior de una columna
serían seleccionados. Es una buena práctica dejar una celda en blanco en la parte inferior de
cada columna antes de insertar fórmulas.
6
Nota: Al utilizar los métodos anteriores de selección de datos, puede seleccionar variables
en una secuencia alterna manteniendo pulsada la tecla CTRL mientras realiza varias
selecciones.
Introducción de valores
Si un cuadro de entrada requiere un valor único, puede hacer uno de lo siguiente (asegúrese de que
el cursor de inserción parpadea en el cuadro):
Escriba un valor en la caja.
Haga click en cualquier celda de Excel que contiene un valor. Al hacer clic en una celda, la
dirección de la celda se muestra en el cuadro de entrada. Si hace doble-click en el cuadro de
entrada de la dirección va a cambiar con el valor en la celda.
Escriba cualquier fórmula que usted pueda introducir en una celda. Usted no tiene que escribir
el signo ' = ' como lo haría en una celda de Excel.
Escriba una dirección de celda, por ejemplo, B6, o el nombre de una celda nombrada.
Etiquetas de datos
Para la mayoría de los procedimientos de la primera celda en cada rango de entrada puede ser una
etiqueta. Si la primera celda de un rango es texto se considera una etiqueta; si la primera celda es un
valor numérico que es datos que se consideran. Si desea utilizar números como etiquetas de
variable debe introducir los números como texto por ellos precede con una simple comilla, por
ejemplo '2. A pesar de que Excel almacena horas y fechas como números, MegaStat reconocerán
como etiquetas si están formateados como valores de hora / fecha.
Si las etiquetas de datos no son parte de la gama de entrada, el programa utiliza automáticamente la
celda inmediatamente por encima del rango de datos como una etiqueta si contiene un valor de
texto.
Si una opción puede considerar toda la primera fila (o columna) de un rango de entrada como
etiquetas, cualquier valor numérico en la fila hará que toda la fila sea tratada como datos.
7
Si el programa detecta enteros secuenciales (1, 2, 3, ...) en un lugar donde es posible que desee
etiquetas se mostrará un mensaje de advertencia de lo contrario, la regla es: celdas de texto son las
etiquetas, las celdas numéricos son datos3.
Salida
Al hacer clic en OK en el cuadro de diálogo MegaStat se realiza un análisis estadístico y necesita
un lugar para poner su salida. Busca una hoja de cálculo denominada output. Si encuentra uno que
va al final de la misma y añade su salida; si no encuentra una hoja Output crea uno. MegaStat
nunca hará ningún cambio en las hojas de trabajo del usuario, sólo se envía la salida a su hoja de
Output.
MegaStat hace un buen intento de dar formato a la salida, pero es importante recordar que la hoja
Output es sólo una hoja de cálculo estándar de Excel y puede ser modificado de ninguna manera
por el usuario. Usted puede ajustar los anchos de columna y cambiar cualquier formato que usted
piensa que necesita mejorar. Puede insertar, eliminar y modificar las células. Puede copiar todo o
parte de la producción a otra hoja de cálculo o de otra aplicación, como un procesador de textos.
Gráficos MegaStat obtienen sus valores de celdas de la hoja Output (o una de las hojas de cálculo
en el caso del Diagrama de dispersión). Puede hacer clic en un gráfico y seleccione " Source Data"
para ver que valores son mostrados.
Al hacer click en un gráfico de la opción del menú MegaStat desaparecerá de la barra de menú
principal desde el menú gráfico se activa. Haga click fuera de la tabla para traer de vuelta al menú
principal que contiene el elemento del menú MegaStat.
Cuando el programa genera una salida que se ajusta ancho de las columnas para la salida corriente.
Si usted tiene salida previa a partir de una opción diferente ya en la hoja Output, los anchos de
columna para la salida anterior pueden quedar en mal estado. Usted puede tratar de solucionar este
problema ajustando manualmente los anchos de columnas o por siempre a partir de una nueva hoja
de salida.
El menú Utilities tiene opciones para borrar la hoja Output o hacer una copia de ella y comenzar
una nueva.
3 Una excepción es la opción Tabla de contingencia (Crosstabulation) que pueden contar con los datos de
texto.
8
Utilities
El menú Utilities contiene algunos elementos que realizan funciones útiles.
La línea de la fuente de datos mostrará el nombre y la ubicación del libro activo y la hoja de
trabajo accedido más recientemente. La entrada de tiempo con espectáculo de la fecha actual /
hora y la versión de MegaStat.
Esta opción no se limita a las hojas de salida MegaStat - puede ser utilizado en cualquier hoja
de cálculo de Excel.
ChartDataSheet utilities
Con el fin de mostrar una salida gráfica (por ejemplo, un gráfico) Excel debe hacer referencia a
los valores en una hoja de cálculo. Si los valores no están disponibles como una parte de la
hoja de salida, MegaStat los almacena en una hoja de cálculo oculto llamado
"ChartDataSheet_". Si MegaStat necesita un ChartDataSheet crea uno menos que ya existe, en
cuyo caso se añade sus valores hasta el final.
En general, usted no necesita preocuparse por ChartDataSheets; sin embargo, existen las
siguientes utilidades para los usuarios avanzados.
View
Existen ChartDataSheets sólo como valores de las cartas y por lo tanto la salida no está
etiquetado. Sin embargo, en la parte superior de cada sección de salida es una etiqueta
diciendo qué tipo de gráfico es usado para un sello de fecha / hora. En el gráfico
correspondiente también hay una marca de fecha / hora para que pueda asociar los datos
con un gráfico.
Hide
Usted podría utilizar esta opción si desea eliminar un ChartDataSheet que ya no tiene
gráficos asociados. Si se elimina un ChartDataSheet que tiene un gráfico existente, seguirá
existiendo la tabla, pero no tendrá ningún valor graficado. No se puede deshacer, así que
asegúrate antes de hacer clic en OK.
Deactivate MegaStat
Esta opción se utiliza para eliminar el elemento 'MegaStat' desde el menú principal. No
elimina los archivos o desinstalar MegaStat. Para restaurar el elemento de menú 'MegaStat'
click en Archivo | Opciones | Complementos | Ir en la barra de menú principal del Excel y
luego marque la opción MegaStat que podrás ver en la lista de complementos disponibles.
Uninstall MegaStat
Este elemento de menú en realidad no desinstalar MegaStat. Se muestra un cuadro de diálogo
que le pide sobre cómo iniciar el proceso de desinstalación se describe a continuación.
Help/Information
Help System
Esta opción muestra el programa completo de ayuda MegaStat.
10
La sección '¿Cómo funciona? (Procedimientos generales de funcionamiento)’ contiene toda la
información en este tutorial. Puede hacer clic en los temas específicos o buscar un elemento
en particular, haga clic en Índice.
Esta opción muestra información corriente de la versión. Hay también links para el sitio web
MegaStat y e_mail para soporte técnico. Estos links sólo funcionarán si usted tiene una conexión a
Internet activa y su sistema está configurado para responder adecuadamente a Internet y correo
electrónico enlaces.
El formulario también contiene un botón System Information, lo que hace que la forma de ampliar
y mostrar algo de información técnica sobre los parámetros del sistema y las ubicaciones de los
archivos. Si hace click en el botón Insert, la información se colocará en la hoja Output actual. Si
hace click en Hide System Information, el formulario volverá a su tamaño original.
11
2. Ejemplos Tutorial
Aunque MegaStat realiza muchas opciones estadísticos diferentes los diversos cuadros de diálogo
de todas funcionan de la misma manera y tienen objetos estándar de Excel (cuadros de entrada,
botones, casillas de verificación, etc.). Por lo tanto, no es necesario para mostrar ejemplos gráficos
de cada opción MegaStat. En este capítulo se trabajará a través de algunos ejemplos detallados y se
señalan algunas cosas que son únicas para MegaStat. El siguiente capítulo proporcionará una fuente
de referencia para las distintas opciones.
1. Ir al aula virtual del curso y guardar el archivo: MegaStat (saber dónde se guardó el archivo, solo
guardar y no abrir)
2. Abrir una hoja de Excel.
12
13
14
TEMA 2: CUADROS DE DISTRIBUCIÓN DE FRECUENCIAS Y ESTADÍSTICA
GRÁFICA
15
Se presenta el siguiente cuadro:
Donde:
Input Range: datos de origen
Specification range: modalidades de la variable de estudio
Paso4: Seleccionamos los datos a estudiar y clic en OK
Obtenemos una nueva hoja llamada Output, donde se presenta un CDF (Cuadro de Distribución de
Frecuencias) resumido y un gráfico de barras.
16
Paso5: Completar el CDF, agregando número de cuadro, título, fuente, elaboración, hi%, Pi.
Paso6: Completar el gráfico de barras agregando número de gráfico, título, fuente, elaboración.
Paso7: Dado que es una variable cualitativa, también se puede realizar un gráfico circular, agregar dicho
gráfico, usando los gráficos de Excel.
Primero: Seleccionamos las modalidades del Tipo de Metal y los datos de Pi.
17
3. Trabajar con el Ejemplo 2,
VARIABLE CUANTITATIVA DISCRETA (se siguen los mismos pasos que para una VARIABLE CUALITATIVA)
Paso1. Identificar la variable de estudio: números de imperfecciones observadas en los componentes de
computadoras
Paso2. Escribir las modalidades de la variable de estudio (posibles respuestas)
18
Paso4: Seleccionamos los datos a estudiar y clic en OK
Se ingresan los
datos
considerando
la primera fila
de “La
etiqueta de la
variable”
Obtenemos una nueva hoja llamada Output, donde se presenta un CDF (Cuadro de Distribución de
Frecuencias) resumido y un gráfico de barras.
Paso5: Completar el CDF, agregando número de cuadro, título, fuente, elaboración, Fi, Hi%.
19
Paso6: Completar el gráfico de barras agregando número de gráfico, título, fuente, elaboración.
Paso7: Dado que es una variable cuantitativa discreta, se puede realizar un gráfico de bastones, agregar
dicho gráfico, usando los gráficos de Excel.
Primero: Seleccionamos los datos fi o hi%
20
Quinto: Modificar las modalidades del eje X: nro de imperfecciones
Click en el gráfico, Seleccionar datos
En la segunda columna clic en Editar, seleccionar las modalidades del nro de imperfecciones,
Aceptar, Aceptar
21
Hacer clic en el gráfico, ir a la pestaña Herramientas de gráficos, Presentación, Análisis, Líneas,
Líneas de Unión
Hacer clic en la línea azul, anticlic, dar formato a serie de datos, Color de línea, Sin línea.
22
1
2
23
Paso3. Ir a la pestaña COMPLEMENTOS, clic en MEGASTAT, seleccionar Frecuency Distributions, clic en
Quantitative
Donde:
Input Range: datos de origen
En Equal width intervals
Interval width: amplitud
Lower boundary of first interval: valor mínimo
En Options
24
Obtenemos una nueva hoja llamada Output, donde se presenta un CDF (Cuadro de Distribución de
Frecuencias), un histograma, un polígono y el gráfico de la Ojiva.
25
Paso5: Completar el CDF, agregando número de cuadro, título, fuente, elaboración.
Histograma de Frecuencia
Ojiva
Ogive
100.0
75.0
50.0
25.0
0.0
169 182 195 208 221 234 247 260
Fuerza de Tirantez
20.0
15.0
10.0
5.0
0.0
169182195208221234247260
Fuerza de Tirantez
Paso6: Completar los gráficos agregando número de gráfico, título, fuente, elaboración.
26
TEMA 3: CALCULO DE MEDIDAS DE RESUMEN – TENDENCIA CENTRAL
1. Descargar el archivo Base de Datos_Lab2 – Microsoft Excel del aula virtual y guardar el archivo en el
escritorio.
2. Trabajar con el Ejercicio 1:
Ingresamos a la siguiente ventana de diálogo, que me permite seleccionar las opciones para determinar las
medidas de resumen
27
En la opción Input Range: Ingresar los datos de origen
Paso 2. Seleccionamos los datos a estudiar, activamos la opción Median, quartiles, mode, outliers
y click en OK
28
Obtenemos una nueva hoja llamada Output, donde se presentan un conjunto de resultados
Nº de datos=
Promedio
Valor mínimo=
Valor máximo=
Rango
Mediana
Moda
Ingresamos a la siguiente ventana de diálogo, que me permite seleccionar las opciones para determinar las
medidas de resumen
29
En la opción Input Range: Ingresar los datos de origen
Paso 2. Seleccionamos los datos a estudiar, activamos la opción Median, quartiles, mode, outliers
y clic en OK
Obtenemos una nueva hoja llamada Output, donde se presentan un conjunto de resultados
30
Nº de datos=
Varianza
Desv. Estándar
Valor mínimo=
Valor máximo=
Rango
31
TEMA 5: VARIABLE ALEATORIA Y DISTRIBUCIONES DE PROBABILIDAD
DISCRETA
Seguimos utilizando MEGASTAT que es un complemento avanzado de funciones estadísticas,
DISTRIBUCION BINOMIAL
Ejercicio 1:
Un almacenero de laboratorio, reporta que el 25% de puntas de un dosificador electrónico
están malogradas. Si se extrae una muestra aleatoria de cinco de estas puntas.
Solución 1:
Seleccionamos la
opción de
Distribuciones de
Probabilidades Discreta
32
Luego de ello accedemos a la siguiente ventana de diálogo, donde seleccionamos a
la Distribución Binomial
n = número de ensayos
2
p = probabilidad de
éxitos o de ocurrencia
33
Como resultado tenemos las siguientes probabilidades
Probabilidades acumuladas (≤)
de la Distribución Binomial
Probabilidades puntuales de
la Distribución Binomial
Soluciòn
P (X = 0) = 0.2373
34
b) Exactamente una esté malograda. P (X = 1)
Solución
P (X = 1) = 0.3955
Solución
P ( X < 2) = P ( X ≤ 1) = P ( X = 0) + P ( X = 1)
su resultado será:
P (X < 2) = P ( X ≤ 1) =0.6328
35
2. Un estudiante se presenta a un examen de selección múltiple que contiene 8
preguntas, cada una con tres respuestas opcionales. Sí, el estudiante está
adivinando al responder cada pregunta y además se sabe que para aprobar el
examen debe responder correctamente 6 o más preguntas. ¿Cuál es la
probabilidad de aprobar el examen?
Solución 2:
P(X≥6)= 1-P(X≤5) =
Como resultado
obtenemos las
siguientes
probabilidades. P(X≤5)
36
DISTRIBUCION POISSON
Ejercicio 1:
Si como promedio un tablero electrónico recibe 0.05 llamadas por segundo, ¿Cuál
es la probabilidad de que en un determinado minuto:
Solución de Ejercicio 1:
37
Paso 3. Asignar el valor de lambda
Ejercicio 2:
Supongamos que estamos investigando la seguridad de una peligrosa área de trabajo, los registros indican
una media de 5 accidentes mensuales.
a) El departamento de seguridad desea que calculemos la probabilidad de que en cualquier mes ocurran
38
exactamente 3 accidentes.
Solución 2:
X = Nº de accidentes mensuales
Se tiene que λ = 5 accidentes en un mes Utilizando MegaStat, se obtienen las siguientes probabilidades
P ( x ≤ 2 ) = P( x= 0) + P( x= 1) + P( x= 2)
P ( x ≤ 2 ) =0.1247
39
TEMA 6: DISTRIBUCION DE PROBABILIDAD CONTÍNUA UTILIZANDO MEGASTAT
DISTRIBUCION NORMAL
Ejercicio 1:
La calificaciones de los 500 aspirantes presentados a un examen para contratación laboral, se distribuye
normalmente con media 7 y varianza de 4
Encuentre:
a) La probabilidad de que un aspirante obtenga 8 puntos o más.
b) El porcentaje de aspirantes con calificaciones inferiores o iguales a 5
puntos.
c) Cuántos aspirantes obtuvieron calificaciones comprendidas entre 5 y 8
puntos
Solución 1:
Se procede a desarrollar el ejercicio en una hoja de cálculo de Excel donde ya se tiene disponible el complemento
megastat.
Seleccionamos la opción
de Distribuciones de
Probabilidad Continua
Luego de ello accedemos a la siguiente ventana de diálogo, donde seleccionamos a la Distribución Continua
40
Ahora procedemos a encontrar las probabilidades.
41
b) El porcentaje de aspirantes con calificaciones inferiores o iguales a 5 puntos.
P (X ≤ 5) =
Luego como nos piden cuantos aspirantes se encuentran en este intervalo multiplicamos la probabilidad por el total de
aspirantes: 500 * 0.5328=266.40 aproximadamente 267 aspirantes.
42
TEMA 7: MUESTREO Y TAMAÑO DE MUESTRA
MUESTREO ALEATORIO SIMPLE:
Se debe disponer en una columna los números asignados a cada observación, luego
Ejemplo:
Se tienen 45 bolillas enumeradas, seleccionar 6 bolillas aleatoriamente y determinar sus medidas resumen. Interpretar
Solución:
43
Click en Muestra, luego Aceptar:
44
Seleccionar los datos:
Seleccionar la
muestra aleatoria.
Seleccionar medidas
de resumen.
VARIABLE CUANTITATIVA:
45
Ejemplo:
Se desea estimar el peso promedio de los sacos que son llenados por un nuevo instrumento en una industria.
Se conoce que el peso de un saco que se llena con este instrumento es una variable aleatoria con distribución
normal. Si se supone que la desviación estándar del peso es de 0.5 kg. Determine el tamaño de muestra
aleatoria necesaria con un nivel de confianza del 95% y el error máximo permitido en menos de 0.1 kg.
Solución:
Datos:
E=0.1
S=0.5
Nivel de Confianza: 95%
VARIABLE CUALITATIVA:
Ejemplo:
Se desea estimar la proporción de trabajadores de una empresa minera está de acuerdo con la actual gestión del nuevo
superintendente, con un error máximo de 0.5% y con una confianza del 95%. Por estudios similares, se cree que la
proporción será cerca al 1%. ¿Cuál será el tamaño de muestra requerido?
46
Solución:
Datos:
E=0.005
p=0.01
Nivel de Confianza: 95%
Seleccionar: Sample size – p, Ingresar los datos:
Ejemplo:
Una muestra aleatoria de 120 cigarrillos de una marca determinada dio un contenido promedio de nicotina de 4
miligramos. Suponga que el contenido de nicotina de estos cigarrillos sigue una distribución normal con una desviación
estándar de 1.6 miligramos. Obtenga e interprete un intervalo de confianza del 95% para el verdadero contenido
promedio de nicotina en estos cigarrillos.
47
Solución:
Se tienen los siguientes datos:
n = 120
𝑋̅ = 4
= 1.6
Nivel de confianza: 95%
Ingresar el promedio: 4
Seleccionar: intervalo
para la media
Finalmente OK
Seleccionar la estimación z
Interpretación:
El verdadero contenido promedio de nicotina en estos cigarrillos se encuentra entre 3.714 y 4.286 miligramos con un
nivel de confianza del 95%.
Ejemplo:
Un fabricante de llantas desea investigar la durabilidad de sus productos. Una muestra de 10 llantas para recorrer
50000 millas reveló una media muestral de 0.32 pulgadas de cuerda restante con una desviación estándar de 0.09
pulgadas. Construya un intervalo de confianza de 99% para la media poblacional.
Solución:
Se tienen los siguientes datos:
n = 10
𝑋̅ = 0.32
s = 0.09
Nivel de confianza: 99%
48
Ingresando los datos en MEGASTAT:
Ingresar el promedio: 0.32
Seleccionar: intervalo
para la media
Finalmente OK
𝜖
Interpretación:
La verdadera durabilidad promedio de cuerda restante de las llantas se encuentra entre 0.228 y 0.412 pulgadas
con un nivel de confianza del 99%.
Solución:
Se tienen los siguientes datos:
n = 100
p = a/n = 24/100 = 0.24
Nivel de confianza: 97%
49
Ingresando los datos en MEGASTAT:
Finalmente OK
Interpretación:
La proporción de estudiantes que padecen este trastorno sanguíneo se encuentra entre 14.7% y 33.3% con un nivel de
confianza del 97%.
Se llevan a cabo pruebas de resistencia a la tensión sobre dos diferentes clases de largueros de
aluminio utilizados en la fabricación de alas de aeroplanos comerciales. De la experiencia pasada
con el proceso de fabricación de largueros y del procedimiento de prueba, se supone que las
desviaciones estándar de las resistencias a la tensión son conocidas. Los datos obtenidos se
presentan en la siguiente tabla:
Media muestral de la
Clase de Tamaño de
resistencia a la Desviación Estándar
larguero la muestra
tensión
1 n1 =10 𝑥1
̅̅̅=87.6 (kg/mm 2) 𝜎1 = 1 (kg/mm2)
2 n2=12 𝑥2
̅̅̅=74.5 (kg/mm 2) 𝜎2 = 1.5(kg/mm2)
Si µ1 y µ2 indican los verdaderos promedios de las resistencias a la tensión para las dos clases de
largueros, hallar un intervalo del 90% de confianza para la diferencia de las medias µ1 y µ2.
50
Solución Ejemplo 1:
Indicar que se ingresaran la identificación de grupo, medidas de resumen como media, desviación estándar y
además n
Se selecciona la prueba Z (Distribución Normal), dado que se conocen las varianzas de las poblaciones.
Resultados
Interpretación:
Con un nivel de confianza del 90%, se tiene que la resistencia a la tensión del larguero 1 es mayor que la resistencia a
la tensión del larguero 2, en una cantidad que oscila entre 12,22 y 13,98 kg/mm 2.
51
CASO B: INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS CON VARIANZAS POBLACIONALES
DESCONOCIDAS PERO HOMOGÉNEAS (𝝈12 = 𝝈 22 )
Ejemplo 2:
Una empresa fabrica un mismo producto en dos máquinas. Una muestra aleatoria de 9 productos de la máquina 1, ha
dado los siguientes tiempos de fabricación en segundos:
12, 28, 10, 25, 24, 19, 22, 33, 17
Mientras que una muestra aleatoria de 8 productos de la máquina 2, ha dado los siguientes tiempos de fabricación en
segundos:
16, 20, 16, 20, 16, 17, 15, 21
Construir un intervalo al 95% de confianza para la diferencia de los tiempos de fabricación para todos los productos de
la fábrica 1 y 2.
Suponga que las varianzas poblacionales son homogéneas pero se desconocen.
Solución Ejemplo 2:
Si X1 y X2 son los tiempos empleados para las máquinas 1 y 2 respectivamente, de las muestras se tiene:
52
Indicar que se ingresaran los datos sin agrupar, luego insertar los datos en el detalle siguiente:
Se selecciona la prueba t (Distribución t de Student) ( t –test (pooled variance), dado Ingresar el nivel de confianza
que no se conocen las varianzas de la población, pero se sabe que son homogéneas. que se requiere el intervalo
Resultados
𝜖 < -2.365, 9.337 >
Interpretación:
Como el intervalo incluye al cero, entonces los tiempos medios de fabricación de ambas máquinas son iguales.
Ejemplo 3:
El jefe de planta de una fábrica ensambladora de camiones, realiza un estudio comparativo de la eficacia de dos
métodos de ensamblaje, el jefe piensa que el primer método es menos eficaz, dado que reporta un mayor tiempo para
ensamblar los camiones.
Para ello tomó el tiempo en horas empleado en ensamblar 12 camiones con el método A y 12 camiones con el método
B. Los datos son:
¿Los datos apoyan la postura del jefe de planta?.
Método A Método B
Hallar un intervalo al 98% de confianza, para la diferencia de los
Media 128.34167 42.64167 tiempos de ensamblado para todos los camiones ensamblados
Desv. Estándar 25.396848 6.7398806 con el método A y B. Supóngase que las varianzas
n= 12 12 poblacionales son desconocidas y diferentes.
Solución Ejemplo 3:
Ingresando los datos en MEGASTAT:
53
Indicar que se ingresaran la identificación de grupo, medidas de resumen como media, desviación estándar y
además n
Se selecciona la prueba t (Distribución t de Student) (t –test (unequal variance)), dado que no se conocen las varianzas
de la población, pero se sabe que son heterogéneas.
Resultados
SOLUCION:
Los datos ingresados:
Como los datos que se tienen son para cada variable, seleccionar: “data input”
Finalmente click en
OK
Seleccionar intervalo
de confianza
55
Salida:
El intervalo es:
D 1 2 1.662; 7838
Interpretación:
Con un nivel de confianza del 95% se concluye que el proceso actual es mejor que el proceso propuesto.
56
CASO E: INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES
Ejemplo 3:
Una firma distribuye dos marcas de cerveza. En una reciente encuesta se encontró que 60 de 120 prefieren la marca A
y 50 de 80 prefieren la marca B. obtenga un intervalo de confianza para la diferencia de las proporciones poblacionales,
con una confianza del 99%, para determinar si ambas marcas tienen la misma preferencia.
Solución Ejemplo 3:
Ingresando los datos en MEGASTAT:
Ingresar los
datos para la
marca B,
Ingresar los p = 0.625 y
datos para la n=120
marca A,
p = 0.5 y n=120
Resultados
57
TEMA 11: PRUEBA DE HIPÓTESIS PARA LA MEDIA Y PROPORCIÓN POBLACIONAL
Finalmente OK
Seleccionar la
Escribir el valor de
Ho: = 22 H1: Not equal: ≠
Indicar prueba Z si
Escribir el nivel de
n es grande y
confianza dado.
conocida.
58
Decisión:
Ejemplo 2:
El gerente del laboratorio químico Britishs S.A. quiere determinar si cierto producto aumenta la velocidad de
sedimentación de partículas en una solución. Para este fin, selecciona aleatoriamente una muestra de 10 soluciones y
registra la velocidad de sedimentación de las partículas (mm/s) ganadas al aplicar el producto. Los resultados fueron
los siguientes:
Solución 1 2 3 4 5 6 7 8 9 10
Velocidad de Sedimentación 1.2 1.3 1.7 0.9 1.4 0.8 1.0 1.8 1.0 1.1
Suponiendo que la velocidad de sedimentación de partículas ganadas con el producto en cada una de las soluciones
es una variable aleatoria con distribución normal.
Con un α del 1% hay prueba de que el producto aumenta la velocidad de sedimentación?
Solución Ejemplo 2:
1. Velocidad de sedimentación de partículas ganadas con el producto.
2. Ho: µ = 0 (el producto no aumenta la velocidad de sedimentación)
3. H1: µ > 0 (el producto aumenta la velocidad de sedimentación)
4. El nivel de significancia: α = 0.01
5. Estadístico de prueba: T
6. Regla de decisión: rechazar Ho si T > t1-α/2,n-1 o p-value < 0.01
Ingresando los datos en MEGASTAT:
59
Seleccionar si hay datos
sin agrupar de la
muestra
Finalmente OK
Seleccionar el
rango de datos
Seleccionar la
Decisión:
Ejemplo 3:
El consumidor de cierto tipo de producto, acusó al fabricante, diciendo que más de 20% de las unidades que fabrica
son defectuosos. Para confirmar su acusación, el consumidor uso una muestra aleatoria de tamaño 50, donde 27% de
las unidades eran defectuosos. Qué conclusión puede extraer usted? Use un nivel de confianza del 10%
Solución Ejemplo 3:
1. Unidades defectuosas.
2. Ho: p ≤ 0.20 (la producción defectuosa es inferior al 20%)
3. H1: p > 0.20 (la producción defectuosa es más de 20%)
4. El nivel de significancia: α = 0.10
5. Estadístico de prueba: Z
6. Regla de decisión: rechazar Ho si Z > Z o p-value < 0.10
60
Escribir el valor de la Escribir el valor
muestra: proporción Ho: p = 0.2
Escribir la muestra: n
Finalmente OK
Escribir el nivel de
confianza dado. Seleccionar la H1:
Greather than: >
61
Decisión:
62
Ingresando los datos en MEGASTAT:
Fabricante A Fabricante B
Medidas estadísticas
resumidas
Prueba
Resultados Estadística: Z
Valor de confianza: 1-=0.95
63
CASO B: PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS CON VARIANZAS POBLACIONALES
DESCONOCIDAS PERO IGUALES (HOMOGENEAS)
Ejemplo 2:
Se realizó un experimento para comparar la dureza de lingotes de dos tipos de acero, obteniéndose los siguientes resultados:
Pruebe con 5% de significancia que la dureza de los lingotes del tipo de Acero
1 excede a la dureza del tipo 2 en dos unidades .
Solución Ejemplo 2:
1. Dureza de lingotes de dos tipos de Acero.
2. Ho: µ1 - µ2=0 (La dureza de los lingotes del tipo de Acero 1 es igual a la dureza del tipo de Acero 2)
3. H1: µ1 - µ2 >2 (La dureza de los lingotes del tipo de Acero 1 excede a la dureza del tipo 2 en dos unidades).
4. El nivel de significancia: α = 0.05
5. Estadístico de prueba: T
6. Regla de decisión: rechazar Ho, si p < 0.05
Ingresando los datos en MEGASTAT:
64
Medidas estadísticas
resumidas
Acero 1 Acero 2
Valor de la H1:1-2>2
Signo de la desigualdad
de la H1:1-2 > 2
Prueba Estadística:
T-student con varianzas
desconocidas e iguales Valor de confianza: 1-=0.95
Resultados
Conclusión: Como el p-value es mayor a 0.05, no existe suficiente evidencia estadística para rechazar la hipótesis
nula, es decir, con un 5% de significancia no existe suficiente evidencia estadística para rechazar la hipótesis nula, es
decir, la dureza promedio del Acero 1 es igual al del Acero 2.
65
CASO C: PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS CON VARIANZAS POBLACIONALES
DESCONOCIDAS PERO DIFERENTES (HETEROGÉNEAS)
Ejemplo 3:
Se realizó un experimento para comparar la resistencia de dos materiales, obteniéndose los siguientes resultados:
Material 1 Material 2
Medidas estadísticas
resumidas
Signo de la desigualdad
de la H1:1-2 < 0
Valor de confianza:
1-=0.95
Prueba Estadística: T-student con
varianzas desconocidas y diferentes
66
Conclusión: Como el p-value es mayor a 0.05, no existe suficiente evidencia estadística para rechazar la
hipótesis nula, es decir, con un nivel de confianza del 95% la resistencia promedio del material 1 es mayor que
la resistencia promedio del material 2.
“Nunca es demasiado tarde para ser la persona que querías haber sido”-
George Eliot
67
TEMA 13: PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE PROPORCIONES
CASO A: PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE PROPORCIONES
Ejemplo 1:
Una muestra aleatoria de 300 tornillos de la Marca A y otra de 400 tornillos de la marca B, de
una determinada producción, reveló que 120 tornillos cumplían con las normas de calidad en la
marca A y 120 tornillos en la marca B. ¿Se puede concluir a un nivel de significación del 5% que
la proporción de tornillos que cumplen con las normas de calidad en la marca A es mayor que la
proporción de la marca B?
Solución Ejemplo 1:
Valor de la H1:p1-p2>0
Signo de la desigualdad
de la H1:p1-p2 > 0
Valor de confianza:
1-=0.95
68
Resultados
Conclusión: Como el p-value es menor a 0.05, existe suficiente evidencia estadística para rechazar la
hipótesis nula, es decir, la proporción de tornillos en la Marca A que cumplen con las normas de calidad
es mayor a la proporción de los de la marca B.
“Nunca es demasiado tarde para ser la persona que querías haber sido”-
George Eliot
69
TEMA 14: REGRESIÓN LINEAL SIMPLE. ESTIMACIÓN DEL MODELO DE REGRESIÓN
LINEAL SIMPLE.
Ejemplo 1:
El procesamiento de carbón sin tratar implica el "lavado", en donde se elimina la ceniza de carbón (no
orgánico, material incombustible).
Una revista proporciona los datos relacionados con los porcentajes de ceniza y el volumen de una partícula de
carbón. Se midieron los porcentajes promedio de ceniza para diez volúmenes de partículas de carbón. Los
datos son los siguientes:
Solución Ejemplo 1:
70
Resultados
b) La ecuación de regresión lineal simple del Porcentaje de Ceniza, en función del volumen
del carbón.
71
72
Resultados
Coeficientes del
Modelo de
Regresión.
c) Utilizando el modelo pronostique el porcentaje de ceniza para partículas con un volumen de 5,0
cm3
73
TEMA 15: APLICACIÓN CHI-CUADRADO
Pi Oi Ei=n*Pi
0.6 293 300
0.3 144 150
0.1 63 50
Total = 1 Total n = 500 Total = 500
Solución:
Ho: p<4 = 0.6; p5-14 = 0.3; p 15 a+= 0.1
H1: Tiempo de permanencia no sigue la distribución en mención.
74
Conclusión:
75
Conclusión:
76