I NVESTI GACI N 1: MI NI TAB 16 I NVESTI GACI ON 2 : EJ ERCI CI OS Srta: Cindy Banchn Lzaro Aula: saln 7 Horario: 15:00 a 17:00 pm Docente: Msc. Mara Magdalena Rosado lvarez.
MINITAB VERSION 16 INVESTIGACION 1 CONCEPTO IMPORTANCIA DEFINICION DE VARIABLES IMPORTAR DATOS .- PASOS ESTADISTICAS DESCRIPTIVA MODA Mediana Cuartil Percentil Promedio Desviacin TIPOS DE GRAFICOS CONCEPTO MODELOS QUE HAY EN CADA GRAFICO Y PARA QUE SIRVE Columnas Histogramas Circular Lneas Cajas Dispersin
INVESTIGACION 2 Grficos Desarrollar dos tipos de grficos diferentes por cada grafico
Concepto: Minitab es un programa de computadora diseado para ejecutar funciones estadsticas bsicas y avanzadas. Combina lo amigable del uso de Microsoft Excel con la capacidad de ejecucin de anlisis estadsticos. Toda la informacin sobre su trabajo est contenida en un archivo de Proyecto de Minitab.
El archivo de proyecto contiene:
Hojas de trabajo que contienen sus datos. Usted puede tener mltiples hojas de trabajo en un proyecto.
Una o ms ventanas Datos que muestran cualquier archivo de hoja de trabajo. Sus datos se mostrarn como columnas. Hay una ventana Datos por cada hoja de trabajo en el proyecto. Usted puede ingresar y editar datos directamente en la ventana Datos. Una ventana Sesin que muestra sus resultados.
Grficas que usted puede crear con comandos de grficas de Minitab.
Un Project Manager, el cual contiene:
Una carpeta Sesin para administrar la salida de la ventana sesin.
Una carpeta Historial que indica los comandos que usted ha utilizado en su sesin. Para volver a ejecutar comandos, cpielos de la carpeta Historial y pguelos en el Editor de lnea de comandos.
Una carpeta Grficas para administrar, organizar y asignar nombre a sus grficas.
Una carpeta Reportad para crear, organizar y editar informes de su trabajo.
Una carpeta Documentos relacionados para acceder rpidamente a archivos relacionados con el proyecto que no sean de Minitab para una consulta fcil. Una carpeta Hojas de trabajo que contiene carpetas individuales para cualquier hoja de trabajo abierta. Cada carpeta de hojas de trabajo muestra un resumen de las columnas, constantes almacenadas, matrices y los diseos utilizados en la hoja de trabajo.
Mltiples Barras de herramientas para emitir comandos y una Barra de estado. IMPORTANCIA Una de las disciplinas directamente relacionadas con la Administracin es la Estadstica, fundamental a la hora de tomar decisiones en base a la recoleccin de datos, su estudio y anlisis y su posterior procesamiento y clasificacin. En esta tarea el clculo estadstico adquiere gran importancia, y programas como Minitab pueden ser de gran ayuda. Minitab es un completo conjunto de herramientas dedicadas al clculo estadstico en todas sus variantes. CARACTERSTICAS: Software de clculo de estadsticas asequible para toda clase de usuarios: permite el uso de macros e incluye datos de muestra y ejemplo as como un glosario de terminologa estadstica. Incluye gran variedad de herramientas y funciones para la edicin y administracin de datos: funciones de copiar, cortar y pegar, varios niveles de Deshacer y Rehacer, funciones de importacin y exportacin de datos desde Excel, texto, archivos HTML, hojas de clculo CSV (delimitadas por comas), archivos XML... Realiza estadstica descriptiva, pruebas de varianza o pruebas de tasa de Poisson. Permite utilizar una gran cantidad de grficos. Prueba diferentes tipos de anlisis tanto de regresin (lineal, polinomial, logstica, etc.) como de varianza (ANOVA, GLM, MANOVA) DEFICION DE VARIABLES :
Una variable aleatoria se define como una funcin que hace corresponder nmeros reales a elementos del Espacio Muestral. Una variable aleatoria puede ser discreta o continua. Dependiendo del tipo de experimento o fenmeno podemos hablar de modelos de probabilidad, algunos de los cuales son muy comunes.
Ejemplos de variables aleatorias: X: La suma que aparece al lanzar un par de dados. Y: El nmero de caras que aparecen al lanzar una moneda tres veces. Z: El nmero de errores que se encuentran en la pgina de un libro. T: El tiempo de vida de la componente de un sistema W: El tiempo de espera para ser atendido en un banco
VARIABLE ALEATORIA DISCRETA Se denomina variable aleatoria discreta aquella que slo puede tomar un nmero finito de valores dentro de un intervalo. Por ejemplo, el nmero de componentes de una manada de lobos, pude ser 4 5 6 individuos pero nunca 5,75 5,87. Otros ejemplos de variable discreta seran el nmero de pollos de gorrin que llegan a volar del nido o el sexo de los componentes de un grupo familiar de babuinos. Densidad Se denomina densidad discreta a la probabilidad de que una variable aleatoria discreta X tome un valor numrico determinado (x). Se representa: f(x) = P[X=x] La suma de todas las densidades ser igual a 1
VARIABLE ALEATORIA CONTINUA
Una variable aleatoria continua es una funcin X que asigna a cada resultado posible de un experimento un nmero real. Si X puede asumir cualquier valor en algn intervalo I (el intervalo puede ser acotado o desacotado), se llama una variable aleatoria continua
.Importacin de datos En muchos casos, la persona que recolecta los datos no es quien los analiza en Minitab. Por este motivo, los datos suelen recolectarse utilizando la herramienta que est al alcance de la mano, ya sea una hoja de clculo o un archivo de texto. Afortunadamente, importar datos de un archivo que no sea de Minitab generalmente es tan simple como abrir una hoja de trabajo estndar de Minitab. A continuacin, presentamos un ejemplo. Importacin de una hoja de clculo de Excel
Supongamos que usted tiene un libro de Excel con tres hojas y desea importar todas las hojas en la ventana Datos de Minitab para realizar anlisis.
1. Elija Archivo > Abrir hoja de trabajo. 2. En Tipo, elija Excel. 3. Navegue hasta el archivo de Excel y seleccinelo. 4. Haga clic en Vista preliminar para asegurarse de que la hoja de clculo se importa correctamente en Minitab. 5. Haga clic en Opciones para realizar ajustes en la manera en que se importa la hoja de clculo. 6. Haga clic en Aceptar en cada cuadro de dilogo. Como puede ver en el ejemplo anterior, importar incluso el ms complejo de los archivos en la ventana Datos no es difcil. De hecho, puede seguir exactamente el mismo procedimiento para importar archivos en una amplia gama de formatos. Manipulacin de datos Una vez que sus datos estn en Minitab, puede cambiar la manera en que estn organizados. Minitab es muy flexible en cuanto a la manera en que se puede dar formato a sus datos, as que la reorganizacin suele ser un asunto de preferencia personal. Generalmente, el diseo ms fcil de usar para la recoleccin de datos no es con el que despus se trabaja ms fcilmente. A continuacin, presentamos un ejemplo. APILAR DATOS
Supongamos que usted recolect datos sobre tres elementos de su lnea de productos en un formato desapilado (se muestra a la derecha). Sin embargo, a medida que explora los datos, usted descubre que un formato desapilado sera ms sencillo de analizar.
1. Elija Datos > Apilar > Columnas. 2. En Apilar las siguientes columnas, ingrese las columnas que desee apilar. 3. Haga clic en Aceptar. Bien sea que usted desee apilar, desapilar, combinar o crear subconjuntos de sus datos, Minitab ofrece varias herramientas sencillas para reestructurar su ventana Datos rpida y fcilmente. ESTADSTICA DESCRIPTIVA La ruta Stat/Basis Statistics/Display Descriptive Statistics permite obtener una tabla que contiene las caractersticas y funciones estadsticas ms simples de las variables que se elijan. Pulsando sobre el botn Statistics se muestran los tipos disponibles. Se detallan los que ms se utilizarn en la asignatura de estadstica:
ndices de posicin ( valores percentiles)
First quartile: Calcula el valor que deja a la izquierda el 25% de los valores (Q1) Median: Calcula el valor que deja a la izquierda el 50% de los valores (Q2 o mediana) Third quartile: Calcula el valor que deja a la izquierda el 75% de los valores (Q1) Interquartile range: Indica la diferencia entre el primer y tercer cuartil.
ndices de tendencia central
Mean: Media aritmtica. Median: Calcula el valor que deja a la izquierda el 50% de los valores (Q2 o mediana) Sum: Suma de todos los valores
ndices de dispersin (Dispersin)
SE of mean: Error tipo de la media. Estimacin de la variabilidad muestral de la media. Standard deviation: Variabilidad de los valores con respecto a la media, expresada en las mismas unidades que los datos. Variance: Variabilidad de los valores con respecto a la media, expresada en unidades al cuadrado. Minimum: Valor ms pequeo. Maximum: Valor ms grande. Range: Diferencia entre los valores mximo y mnimo. N nonmissing: Nmero de entradas que no faltan. N missing: Nmero de entradas que faltan, (*).
ndices de distribucin
Skewness: Coeficiente de asimetra. Kurtosis: Coeficiente de curtosis.
El resultado aparece en una tabla en la ventana Session. No se pueden modificar las propiedades de la tabla, slo su tipo de letra y similares. Por eso ser importante elegir correctamente las variables y cuidar su disposicin.
TIPOS DE GRFICOS
Tambin puede usar grficas para resumir los datos y para interpretar mejor los resultados estadsticos. Puede acceder a las grficas de Minitab desde los mens Grfica y Estadsticas. Las grficas incorporadas, que ayudan a interpretar los resultados y a evaluar la validez de los supuestos estadsticos, tambin estn disponibles con muchos comandos estadsticos.
Las grficas de Minitab incluyen las siguientes caractersticas: Galeras de imgenes para ayudarle a elegir un tipo de grfica Flexibilidad en la personalizacin de las grficas Elementos de la grfica que se pueden modificar Opcin de actualizacin automtica
GRFICA DE BARRAS Utilice esta opcin para comparar alguna medida de categoras de datos. Cada barra puede representar un conteo de una categora, una funcin de una categora (como la media, suma o desviacin estndar) o valores de resumen de una tabla.
Elementos del cuadro de dilogo Las barras representan Conteos de valores nicos: Elija esta opcin si tiene una o ms columnas de datos categricos y desea graficar la frecuencia de cada categora. Una funcin de una variable: Elija esta opcin si tiene una o ms columnas de datos cuantitativos y desea graficar una funcin de los datos de medicin, como la media. Valores de una tabla: Elija esta opcin si tiene una o ms columnas de datos de resumen y desea graficar el valor de resumen para cada categora. Conteos de valores nicos
Una funcin de una variable
Valores de una tabla
HISTOGRAMAS
Se utilizan para representar la variabilidad de un conjunto de datos, utilizando como valores representativos del conjunto de datos, su valor medio y su desviacin tpica. Representan, por tanto, la frecuencia de los datos de una variable dividida en diferentes intervalos.
Utilice para examinar la forma y dispersin de los datos de muestra. Los histogramas dividen los valores de las muestras en muchos intervalos denominados secciones. Las barras representan el nmero de observaciones que se ubican dentro de cada seccin (su frecuencia). En el histograma que se muestra a continuacin, por ejemplo, hay dos observaciones con valores entre 2.5 y 7.5, tres observaciones con valores entre 7.5 y 12.5 y as sucesivamente.
Las observaciones que se ubican exactamente sobre el lmite del intervalo se incluyen en el intervalo a la derecha (o a la izquierda, si es la ltima seccin). Nota: Si desea graficar barras que representen estadsticas de resumen para grupos diferentes, utilice Grfica > Grfica de barras. Despus de crear un histograma, usted puede personalizar el nmero y la ubicacin de las secciones utilizando Seleccionar escala > Editor > Editar > Seccionamiento. Elementos del cuadro de dilogo
Simple:
En la caja de texto de la izquierda se muestran las variables entre las que se puede elegir. Hay que rellenar la caja Graph Variables; tras seleccionarla, se clica dos veces sobre las variables de las que se quiera su histograma. Despus de personalizarlo con las mltiples opciones existentes, se pulsa ok. En este caso, para visulizar el histograma de la variable Days, se obtiene:
With Fit: Se sigue el proceso similar al anterior. La nica diferencia es que aparecer la curva normal de distribucin sobreimpreso en el histograma.. Lnea de distribucin ajustada Utilcese para determinar en qu medida los datos de una muestra siguen una distribucin especfica. Minitab genera una lnea de distribucin ajustada utilizando estimaciones de parmetros obtenidos a partir de una muestra, o de valores histricos introducidos por el usuario. Por lo general, estas lneas de distribucin se superponen a los datos reales, de manera que usted pueda comparar directamente los datos empricos con la distribucin hipottica. Las lneas de distribucin ajustadas pueden aparecer en Grficas de Histogramas, Probabilidad y de CDF empricas. Por ejemplo, usted est investigando la resistencia del producto que confecciona su compaa. Como paso inicial, usted desea determinar si los datos de respuesta siguen una distribucin normal. Para este cometido, usted genera el siguiente histograma con una distribucin normal ajustada. Una inspeccin visual revela que la distribucin normal ajustada no exhibe un ajuste perfecto. Hay ms datos que los esperados a la izquierda del valor mximo y en la cola derecha. La tabla muestra las estimaciones de parmetro que se utilizan para generar la curva. Si intenta ajustar otra distribucin a los datos, la tabla muestra las estimaciones de parmetros especficos para esa distribucin. Tambin puede utilizar el estadstico de Anderson Darling en Grficas de probabilidad para probar cuantitativamente en qu medida los datos siguen una distribucin particular. Con grupos o Con ajuste y grupos Grfica > Histograma >elija Con grupos > Aceptar Utilice esta opcin para mostrar mltiples histogramas o mltiples curvas ajustadas (funciones de densidad de probabilidad, pdfs) en la misma grfica. Elementos del cuadro de dilogo Variables de grficas: Ingrese una o ms columnas de datos para graficar. Por opcin predeterminada, Minitab dibuja cada columna en la misma grfica. Variables categricas para agrupacin (0 a 3): Si las columnas de las variables de grficas contienen grupos mltiples, ingrese hasta tres columnas de variables categricas para agrupacin. (Para mostrar en paneles de una o ms variables, utilice Por Variables. Las variables de grficas forman grupos: Marque esta opcin para mostrar histogramas de todas las variables de grficas en la misma grfica. (Para mostrar todas las grficas en la misma pgina, utilice Variables mltiples). La diferencia con los casos anteriores, es que se puede agrupar las variables utilizadas segn alguna otra. Por ejemplo, si vamos a representar el nmero de das que tarda en realizarse un envo, as como la distancia al punto de envo, se pueden agrupar dichas variables en funcin del centro desde donde se enven (en este caso Eastern, Western y Central). El resultado es el siguiente:
With Fit and Groups:
La idea es la misma que en el caso anterior, pero en vez de un diagrama de barras, obtenemos la curva de distribucin normal.
GRFICA > GRFICA CIRCULAR Utilice para mostrar la proporcin de cada categora de datos con respecto a todo el conjunto de datos.
Elementos del cuadro de dilogo Representar grficamente los conteos de valores nicos: Elija esta opcin cuando cada fila en una columna represente una observacin individual. Cada divisin de la grfica circular es proporcional al nmero de ocurrencias de un valor en una columna. Variables categricas: Ingrese una o ms columnas de datos categricos a la grfica. Minitab muestra una grfica circular separada para cada columna en la misma grfica. Representar grficamente los valores de una tabla: Elija esta opcin cuando los nombres de categora estn en una columna y los datos de resumen estn otra columna. Variable categrica: Ingrese la columna de categoras. Variables de resumen:Ingrese una o ms columnas de datos de resumen para cada categora. Minitab muestra una grfica circular separada para cada columna en la misma grfica. GRFICA DE> LNEAS AJUSTADA Utilcela para comparar grficamente patrones de respuesta de dos o ms grupos. La grfica de lneas es nica en el sentido de que se puede utilizar para producir dos tipos de grficas relacionadas y al mismo tiempo bastante diferente: Cuando se utiliza para comparar valores de resumen de un diseo de dos factores, la grfica de lneas produce una grfica de interaccin. Para crear este tipo de grfica de lneas, elija una de las opciones Sin smbolos descritas abajo.
GRFICA > GRFICA DE CAJA Utilice las grficas de caja (tambin denominadas grficas de caja y bigotes) para evaluar y comparar las distribuciones de la muestra. La figura siguiente ilustra los componentes de una grfica de caja predeterminada.
Elementos del cuadro de dilogo Una Y: Elija una de estas opciones para mostrar una grfica separada para cada columna.
Mltiples Y: Elija una de estas opciones para mostrar mltiples columnas de datos en la misma grfica.
GRFICA > GRFICA DE DISPERSIN Utilice para ilustrar la relacin entre dos variables al graficar una en funcin de la otra. Las grficas de dispersin tambin son tiles para graficar una variable en el tiempo. A diferencia de una Grfica de serie de tiempo, usted debe indicar una variable de tiempo de la hoja de trabajo. Esto es particularmente til cuando se trata de datos que no se ingresan en orden cronolgico o que se recolectan a intervalos irregulares. Elementos del cuadro de dilogo
Grfica > Grfica de dispersin > elija Simple o Con regresin o Con lnea de conexin > Aceptar Utilice esta opcin para mostrar una grfica de dispersin simple, grfica de dispersin con lnea de regresin o grfica de dispersin con lnea de conexin para cada par de variables especificadas. Elementos del cuadro de dilogo Variables Y: Ingrese una columna de valores Y para cada grfica. Variables X: Ingrese una columna de valores X para cada grfica. Grfica > Grfica de dispersin > elija Con grupos o Con regresin y grupos o Con conexin y grupos > Aceptar Utilice para mostrar grficas de dispersin que incluyan datos de mltiples grupos denotados por diferentes smbolos.
Elementos del cuadro de dilogo Variables Y: Ingrese una columna de valores Y para cada par. Variables X: Ingrese una columna de valores X para cada par. Variables categricas para agrupacin (0 a 3): Si las columnas X y Y contienen mltiples grupos, ingrese hasta tres columnas de variables categricas de agrupacin. (Para mostrar en paneles de una o ms variables, utilice Por Variables. Los pares de X-Y forman grupos: Marque esta opcin para mostrar todos los pares x-y como grupos separados en la misma grfica.