Ingeniera
2012
Estadstica Descriptiva
Introduccin
Qu es la Estadstica: La estadstica es una ciencia que tiene como finalidad facilitar la solucin de problemas en los cuales es necesario conocer algunas caractersticas sobre el comportamiento de algn suceso o evento. conocer o mejorar el conocimiento de ese suceso predecir el comportamiento de sucesos iguales o similares sin que estos ocurran
La Estadstica posee un conjunto de tcnicas que se emplean para la recopilacin, organizacin, presentacin, anlisis e interpretacin de los datos para tomar decisiones y resolver problemas. Por qu hay que estudiar Estadstica? Si se revisan las mallas curriculares de las distintas carreras profesionales, veremos que en la mayora existe por lo menos una asignatura de Estadstica. Bsicamente los contenidos de un primer curso de Estadstica en diferentes carreras son los mimos, la mayor diferencia radica en los ejemplos utilizados. La principal razn es que el rol ms destacado de la Estadstica es la recopilacin, presentacin, anlisis de un conjunto de datos, a partir de los cuales se obtienen conclusiones y se toman decisiones.
Saber Estadstica es de gran utilidad en cualquier rea del conocimiento y en particular en Ingeniera. Ejemplos: - Diseo y desarrollo y mejora en los proceso productivos como control de calidad, control de la variabilidad del proceso, Estudios de materiales en cuanto a duracin, dureza, elasticidad, . Control de inventarios, con la estadstica se analiza la tendencia de flujo de ciertos materiales y ciertos productos. Comparar los tiempos de ejecucin de 3 algoritmos de ordenacin (algoritmo de la burbuja, de seleccin, de insercin, quicksort, treesort)
Cecilia Larran R.
Estadstica Descriptiva
Pgina 2
La mayor contribucin de la Estadstica en la resolucin de problemas en ingeniera es su utilizacin como herramienta de aprendizaje. El aprendizaje que se obtiene mediante la estadstica forma parte del denominado Mtodo Cientfico El mtodo cientfico es la estrategia de la investigacin cientfica: afecta a todo ciclo completo de investigacin y es independiente del tema en estudio. Al ser la Ingeniera la aplicacin del conocimiento cientfico, todo proyecto en ingeniera debe contener los rasgos del mtodo cientfico.
Estadstica Inferencial
Cecilia Larran R.
Estadstica Descriptiva
Pgina 3
Defectos en lnea de armado A12 (150 productos examinados) Defecto del producto Abollado Astillado Doblado Manchado Otros Rayado Total Frecuencia 8 23 12 56 6 45 150 Porcentaje 5,3 15,3 8,0 37,3 4,0 30,0 100,0
Manchado
45
40
30
23
20
Rayado Rayado Astillado Manchado Rayado Rayado Rayado Rayado Manchado Rayado Manchado Rayado Rayado Astillado Defectos en lnea de armado A12 (150 productos examinados)
0 Abollado Astillado Doblado Manchado Rayado Otro 10
8 6 12
Cecilia Larran R.
Estadstica Descriptiva
Pgina 4
Tabla de frecuencias
Porcentaje acumulado 32,5 65,0 85,0 97,5 100,0
Frecuencia 13 13 8 5 1 40
Grfico
14
N de averas n Media Mediana Moda Desv. tp. Asimetra Error tp. de asimetra Curtosis Error tp. de curtosis Mnimo Mximo Percentiles
1
13
13
Vlidos Perdidos
12
10
8
Recuento
25 50 75
40 0 1,20 1,00 0a 1,114 ,637 ,374 -,445 ,733 0 4 ,00 1,00 2,00
0 0 1 2
N de averas
Cecilia Larran R.
Estadstica Descriptiva
Pgina 5
Nota de Estadstica
400 alumnos Semestre 2 - 2011
Tabla de frecuencias
Nota de Estadstica Frecuencia 30 53 74 96 86 61 400 Porcentaje 7,5 13,3 18,5 24,0 21,5 15,3 100,0 Porcentaje acum ulado 7,5 20,8 39,3 63,3 84,8 100,0
Vlidos
1- 2 2- 3 3- 4 4- 5 5- 6 6- 7 Total
Semestre 2 - 2012
Grficos
Nota de Estadstica
Semestre 2 - 2011
Histograma
100
96 86
80
74 61
Frecuencia
60
53
40
Medidas de resumen
20
30
Nota
Nota de Estadstica
Semestre 2 - 2011
Cecilia Larran R.
Estadstica Descriptiva
Pgina 6
Para realizar cualquier estudio estadstico, hay que tener en cuenta: Cmo y de donde se recolect la informacin Qu se midi atributos o cantidades?
TRMINOS BSICOS
Poblacin y Muestra Poblacin es el conjunto de individuos (personas, animales o cosas) sobre el que estamos interesados en obtener conclusiones (hacer inferencia). Normalmente es demasiado grande para poder abarcarlo. (Tamao poblacin: N) Censo: estudio completo de la poblacin A las medidas de resmenes poblacionales como la media poblacional , desviacin estndar poblacional , , se les denominan parmetros. Muestra: subconjunto de la poblacin al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones). (Tamao muestra: n) Debera ser representativo Est formado por miembros seleccionados de la poblacin (individuos, unidades experimentales). A las medidas de resmenes muestrales como la media de la muestra x , desviacin estndar de la muestra s, se les denomina estadsticos.
De una poblacin existen muchas muestras posibles, pero slo observamos una!
Cecilia Larran R.
Estadstica Descriptiva
Pgina 7
Nota: A la hora de decidir sobre la forma de recoger la informacin de la muestra se utilizan distintos criterios, originando distintos tipos de muestreos. (Anexo 2)
Encuesta: Tcnica de investigacin para obtener informacin de grupos de personas mediante el uso de instrumentos como cuestionarios diseados en forma previa. Diseo de experimentos: Metodologa estadstica destinada a la planificacin y anlisis de un experimento. El objetivo del diseo de experimento es estudiar si utilizar un determinado tratamiento produce mejora en el proceso o no.
Variable: una variable es una caracterstica observable que vara entre los
diferentes individuos de una poblacin. La informacin que disponemos de cada individuo es resumida en variables. En la poblacin de alumnos de Ingeniera de una universidad, es variable: - El gnero: {Femenino, Masculino}
-
var. cualitativa dicotmica var. cualitativa politmica var. cuantitativa discreta var. cuantitativa continua var. cuantitativa continua
- El nmero de asignatura aprobadas: {0,1,2,3,...} - La altura (en cm.): {162 , 156, 170 ...} - Edad (aos):
. . .
- Nivel de Educ. del padre: {Bsica, Media Superior} var. cualitativa ordinal {17, 18, 19, }
HAY QUE CONOCER EL TIPO DE VARIABLE PARA UTILIZAR LA HERRAMIENTA ESTADSTICA ADECUADA
Cecilia Larran R.
Estadstica Descriptiva
Pgina 8
Edad (X2) 21 22 31
. . .
01 02 03
. . .
observacin 1
La primera observacin indica que el sujeto es de sexo masculino, tiene 21 aos y estudia Ingeniera Industrial. Cada una de estas tres mediciones es un dato para cada una de las variables medidas para el sujeto 1.
El alumno de Ingeniera es la unidad de observacin Datos primarios Son aquellos que el investigador obtiene directamente de la realidad, recolectndolos con sus propios instrumentos. Datos secundarios Son registros escritos que proceden tambin de un contacto con la prctica, pero que ya han sido elegidos y procesados por otros investigadores. Las fuentes son informacin de datos secundarios deben ser fidedignas. Los datos primarios y secundarios no son dos clases esencialmente diferentes de informacin, sino partes de una misma secuencia: todo dato secundario ha sido primario en sus orgenes, y todo dato primario, a partir del momento en que el investigador concluye su trabajo, se convierte en dato secundario para los dems.
Cecilia Larran R.
Estadstica Descriptiva
Pgina 9
Clasificacin de variables
Para realizar un anlisis de datos, es indispensable saber cmo es la variable que consideramos, pues ello determina el tipo de mtodo estadstico que se debe utilizar. Las variables se clasifican como:
Segn su naturaleza
Cualitativas o atributos
No toman valores y numricos describen
Cuantitativas
Sus valores son numricos (tiene sentido hacer operaciones
(modalidades)
cualidades. (no se pueden hacer operaciones algebraicas con ellos). Ejemplos: Estado Civil Profesin
Dicotmicas
Toman uno de dos valores. Ejem.: Sexo
Discretas
Corresponden en general a contar el nmero de veces que ocurre un suceso.
Continuas
Entre dos valores, son posibles infinitos valores intermedios Ejemplos: Altura Edad
Tienen un recorrido contable Ejem.: Nmero de cargas familiares. Nmero de fallas en un centro de cmputo.
Cecilia Larran R.
Estadstica Descriptiva
Pgina 10
E ES SC CA AL LA AS SD DE EM ME ED DI IC CI I N N
Ejemplos
nicamente permiten establecer relaciones de igualdad/desigualdad entre los objetos que se estn midiendo.
NO INDICA ORDEN O JERARQUA
Cecilia Larran R.
Estadstica Descriptiva
Pgina 11
E ES SC CA AL LA AS SD DE EM ME ED DI IC CI I N N
Adems de permitir relaciones de igualdad /desigualdad, permite establecer relaciones de orden (mayor o menor que) entre los objetos que se estn midiendo.
EXISTE UN ORDEN O JERARQUA
Ejemplo
NIVEL EDUCACIONAL: Univ. con doctorado Univ. con Magister Superior Media Bsica (5) (4) (3) (2) (1)
Cecilia Larran R.
Estadstica Descriptiva
Pgina 12
E ES SC CA AL LA AS SD DE EM ME ED DI IC CI I N N
RAZN IIN NT TE ER RV VA AL LA AR R ORDINAL NOMINAL
Al igual que los dos tipos de escalas anteriores (nominal u ordinal), esta escala permite establecer relaciones de igualdad /desigualdad y de orden entre los objetos que se miden. Los intervalos entre los nmeros de la escala son iguales, por lo tanto se puede realizar las operaciones suma y resta. Este tipo de escala carece de un cero absoluto, por lo que no estn permitidas ni la multiplicacin ni la divisin entre los nmeros de la escala. Una escala de intervalo es, por ejemplo, la utilizada para medir la temperatura. Como los intervalos de la escala son iguales, se puede afirmar que la diferencia de temperatura que existe entre 25 y 28 grados es la misma que existe entre 30 y 33 grados. Sin embargo, dado que el punto 0 de la escala es arbitrario -no existe ausencia de temperatura- no se puede afirmar,
Cecilia Larran R.
Estadstica Descriptiva
Pgina 13
E ES SC CA AL LA AS SD DE EM ME ED DI IC CI I N N
R RA AZ Z N N INTERVALAR ORDINAL NOMINAL
Es la escala que permite el nivel ms alto de medicin. Adems de las operaciones que permiten las escalas anteriores, en una escala de razn existe el cero (0) emprico, por lo cual se puede efectuar cualquier operacin aritmtica con los nmeros de la escala. El tiempo de reaccin, por ejemplo es una variable medida en escala de razn. No slo se puede afirmar que la diferencia entre 3 y 6 segundos es la misma que entre 6 y 9 segundos (afirmacin vlida tambin en la escala de intervalos), sino, adems, que 6 s es el doble de 3 s Afirmacin que es posible establecer gracias a que en la escala de tiempo de reaccin existe el cero absoluto: cero significa ausencia de tiempo de reaccin.
Cecilia Larran R.
Estadstica Descriptiva
Pgina 14
VI Independiente
Introduce o manipula el investigador
VD Dependiente
Se observa y se miden los cambios
Interviniente
Es la que puede mediar en la relacin entre VI y VD y que puede influir en los resultados
Ejemplo: Los hbitos de estudios influyen en el rendimiento acadmico de los Estudiantes VI = hbitos de estudio VD = Rendimiento acadmico V interv. = Aptitud personal Nivel nutricional .
Ejercicios I
Ejercicio I-1 Determine en cada caso, si se trata o no de una variable. La edad mnima para poder votar por primera vez en Chile. Nmero de errores diarios en una central telefnica. Tiempo (en aos) de experiencia laboral. Profesin de los clientes de un banco. Sueldo de los Ingenieros.
Cecilia Larran R.
Estadstica Descriptiva
Pgina 15
Ejercicio I-2 Se quiere analizar el nmero de horas de estudio semanal que dedican los alumnos postgrado del rea Ingeniera de esta Universidad. Para ello se selecciona a 35 alumnos que estn participando en postgrado. Indique cual es la: Poblacin: Variable: Muestra: Ejercicio I-3 El coeficiente intelectual (CI) promedio en la poblacin adulta chilena es 100 puntos. Un investigador educacional est interesado en probar que las personas adultas que hablan ms de un idioma tienen un CI superior a la media poblacional. En una muestra de 250 personas que hablan ms de un idioma se obtuvo un promedio (CI medio) de 102.
Complete:
Clasificacin de la variable Variable de inters (nombre) X
Naturaleza
Recorrido
Medicin
Promedio poblacional
Promedio muestral
Ejercicio I-4
Qu situaciones se representan estadsticamente con una variable discreta y cules con una variable continua?
a. b. c. d. e. f. g.
El nmero de defectuosos en la fabricacin Los tipos de defectos encontrados El tiempo de vida de las unidades que se fabrican El costo de fabricacin El nivel de satisfaccin de los clientes N de pedidos que se hacen al mes El tiempo que transcurre desde que llega un pedido hasta que llega el siguiente
Cecilia Larran R.
Estadstica Descriptiva
Pgina 16
Ejercicio I-5
En el departamento de personal de una empresa con 10.000 trabajadores se quiere estimar los gastos familiares en salud de sus empleados para determinar la posibilidad de proporcionarles un plan de seguro mdico.
Indique: Poblacin: _______________________ Tamao N = Unidad de observacin: Variable: X = Muestra: _________________________ Tamao: n =
n n
Interprete
i 1
xi
Calcule
i 1
x i2
FMS 1Estadstica
Descriptiva Univariada
Cecilia Larran R.
Estadstica Descriptiva
Pgina 17
Ejemplo 1 (ArmadoA12.xls): El reporte de la inspeccin final de defectos de 150 productos para la lnea de armado A12 se muestra en la tabla siguiente:
Producto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Defecto Rayado Abollado Astillado Astillado Otros Manchado Rayado Astillado Doblado Rayado Rayado Manchado Manchado Otros Abollado Manchado Rayado Manchado Otros Rayado Doblado Doblado Rayado Manchado Manchado Rayado Abollado Manchado Rayado Rayado Producto 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Defecto Manchado Rayado Rayado Manchado Manchado Doblado Manchado Manchado Manchado Rayado Astillado Rayado Otros Astillado Rayado Rayado Rayado Doblado Manchado Manchado Manchado Rayado Otros Rayado Doblado Manchado Rayado Rayado Doblado Rayado Producto 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 Defecto Manchado Astillado Rayado Astillado Astillado Manchado Rayado Rayado Manchado Manchado Manchado Manchado Manchado Otros Rayado Manchado Manchado Rayado Astillado Rayado Astillado Manchado Manchado Doblado Manchado Astillado Manchado Manchado Manchado Astillado Producto 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 Defecto Manchado Doblado Manchado Manchado Astillado Rayado Manchado Abollado Manchado Manchado Doblado Astillado Astillado Rayado Manchado Astillado Rayado Manchado Manchado Abollado Manchado Abollado Rayado Manchado Manchado Astillado Rayado Rayado Manchado Astillado Producto 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 Defecto Manchado Manchado Rayado Manchado Abollado Astillado Manchado Manchado Astillado Doblado Abollado Manchado Rayado Doblado Astillado Manchado Rayado Rayado Astillado Manchado Rayado Rayado Rayado Rayado Manchado Rayado Manchado Rayado Rayado Astillado
Ejemplo 2: :
en Febrero.2012 de 40
1 1 4 2 0 0 2 2
Cecilia Larran R.
Estadstica Descriptiva
Pgina 18
Grficos
Tabla o distribucin de frecuencias Es una tabla que constituye el resumen bsico de los datos
La presentacin grfica puede revelar de un vistazo las principales caractersticas de un conjunto de datos
Cecilia Larran R.
Estadstica Descriptiva
Pgina 19
Ejemplo 1: (p 18) El reporte de la inspeccin final de defectos para la lnea de armado A12 se muestra en la tabla siguiente:
Defectos_Linea A12 Defectos del producto Abollado Astillado Doblado Manchado Rayado Otros Total Frecuencia absoluta ni 8 23 56 Frecuencia Relativa n fi = i n 0,05 0,15 Porcentaje % 5,33 15,33 37,33
150
1,00
Complete la tabla de frecuencias
100%
Frecuencia absoluta (ni): Nmero de veces que ocurre la modalidad i. i = 1,2, ,k Frecuencia relativa (fi): Es la proporcin de la categora o modalidad respecto del total de datos. 0 < fi < 1 ; i = 1,2, ,k
Grfico sectorial: Crculo dividido en porciones que representan las frecuencias relativas o porcentajes de una poblacin o muestra perteneciente a diferentes categoras.
Como sabemos, un crculo contiene 360 grados. Para construir un grfico sectorial, se multiplica por 360 la frecuencia relativa de cada categora, para obtener la medida del ngulo correspondiente
Otros 4,00%
Abollado 5,33%
Rayado 30,00%
Manchado 37,33%
Cecilia Larran R.
Estadstica Descriptiva
Pgina 20
50
45
40
Frecuencia
30
23
20
10
8
12
Diagrama de Pareto
Herramienta bsica de la mejora de calidad. Muy til para priorizar los problemas o las causas que los generan. Su fundamento parte de considerar que un pequeo porcentaje de las causas producen la mayora de los efectos. Se tratar de identificar ese pequeo porcentaje de causas vitales para actuar prioritariamente sobre l.
Centrales elctricas (40). Febrero 2011
Cecilia Larran R.
Estadstica Descriptiva
Pgina 21
frecuencia 56 45 23 12 8 6 150
Si las observaciones en un conjunto de datos cuantitativos son discretos (contables) o si los valores de la variable asumen slo unos pocos valores distintos, puede ser apropiado armar tablas de frecuencia con valores nicos. La distribucin de frecuencias (tabla) - La distribucin de frecuencias para variables cuantitativas discretas es similar a la de variables cualitativas. Los valores que toma la variable se ordenan de de menor a mayor lo que permite registrar en la tabla las frecuencias acumuladas. La representacin grfica que se utiliza para este tipo de variables es barras separadas Distribucin de frecuencias de la variable X
Nombre de la variable X x1 x2 x3 . . . xk Total
Frec. Absoluta ni Frec. Relativa
fi =
ni n
F= i
Ni n
n1 n2 n3 . . . nk n
f1 f2 f3 . . . fk 1
N1 = n1 N2 = n1 + n2 N3 = n1 + n2 + n3 . . . Nk = n
F1 F2 F3 . . . Fk = 1
Cecilia Larran R.
Estadstica Descriptiva
Pgina 22
Ejemplo 2: (p 18) Datos sobre el nmero de averas de 40 centrales elctricas en Feb.2012 se resumen en la tabla siguiente:
N de averas 0 1 2 3 4 Total
Frec. Absoluta ni Frec. Relativa fi Frec. Abs. Acumulada Ni Frec. Relat. Acumulada Fi
13 13 5 1 40
13 26
0,325
40 1,000
GRFICO DE BARRAS SEPARADA
Cuntas centrales tienen menos de 2 averas? Qu porcentajes de centrales tienen 3 o menos averas? Qu porcentaje de centrales tienen ms de 3 averas? Interprete: n2 f3 N4 F4
N de centrales
12
13
13
10
1
0 0 1 2 3 4
N de averas
Cecilia Larran R.
Estadstica Descriptiva
Pgina 23
Cuando la variable es continua o el nmero de valores posibles de una variable discreta sea grande, para construir la tabla de frecuencias,
conviene agrupar los datos intervalos reales. stos agrupan todos aquellos casos contenidos entre dos valores, conocidos como el lmite superior e inferior.
Ejemplo: (p 19) En abril. 2011 se recolect informacin sobre la edad (en aos) de 50
estudiantes seleccionados de una casa de estudio superior. El valor de los datos, en el orden en que fueron recolectados se presenta a continuacin. (Este es un ejemplo de datos cuantitativos en bruto)
21 18 25 22 25 19 20 19 28 23 24 19 31 21 18 25 22 19 20 36 29 19 23 22 27 34 19 18 22 23 26 25 23 21 21 27 22 19 20 25 36 25 23 19 21 33 23 26 21 24
Construyendo tablas de frecuencias Al construir tablas de frecuencias es necesario tomar las siguientes 3 decisiones: i) Nmero de clases (intervalos)
Usualmente el nmero de intervalos de una distribucin de frecuencias vara entre 5 y 20, dependiendo principalmente del nmero de casos con los cuales se cuente. La decisin del nmero de clases es decidida arbitrariamente por quien organiza la informacin. Reglas que puede ayudar a decidir el nmero de clases o intervalos: - Nmero de intervalos =
n
; n = nmero de datos, o
Cecilia Larran R.
Aunque
no es comn
amplitud, la mayora del tiempo es preferible tener la misma amplitud de intervalo en todos ellos. Para determinar esta amplitud cuando las clases o intervalos tienen el mismo tamao, primero se debe encontrar la diferencia entre el mayor y el menor de los datos en los datos. Luego, la amplitud aproximada es obtenida dividiendo esta diferencia por el nmero deseado de clases o intervalos.
Amplitud del intervalo = valor mximo - valor mnimo nmero de intervalos
iii)
Cualquier nmero que sea igual o menor que el ms bajo de los valores del conjunto de datos ser conveniente para ser usado como el lmite inferior del primer intervalo.
En el ejemplo (Edad): n = 50 mx = 36
mn = 18
Amplitud =
36 18 =3 6
Se lee
14 alumnos con edades entre 18 y menos de 21 aos 17 alumnos con edades entre 21 y menos de 24 aos
Edad 18 21 21 24 24 27 27 30 30 33 33 36
n de alumnos 14 17 10 4 1 4 Total = 50
Cecilia Larran R.
Estadstica Descriptiva
Pgina 25
xi
18 21 21 24 24 27 27 30 30 33 33 36 19,5 22,5 25,5
ni
14 17 10
fi
0,28 0,34 0,20 28 34 20
Total = 50
Tambin se pueden registrar las frecuencias acumuladas
1,00
100%
marca de clase =
Representacin grfica de distribuciones de frecuencias con datos en intervalos Las representaciones grficas ms frecuentes de una tabla de frecuencias donde los datos han sido agrupados en intervalos son el histograma o el polgono de frecuencias.
Edad en aos
Histograma
Donde cada rectngulo corresponde con una clase y la altura es proporcional a la frecuencia de dicha clase o intervalo.
Cecilia Larran R. Estadstica Descriptiva Pgina 26
N estudiantes
20
17
15
14
10
10
0 15 18 21 24 27 30 33 36 39
Edad
Formas de histogramas
Un histograma puede asumir diferentes formas. Las ms comunes son: simtricos, asimtricos y uniforme o rectangular.
Simtrico
10
10
Asimetra Positiva
10
Asimetra Negativa
Simtrica
8
Interprete los tres histogramas Observacin: Describir datos utilizando grficos puede ayudar a iluminarnos acerca de las caractersticas principales de la informacin. Desafortunadamente, tambin pueden ser utilizados, casual o intencionadamente, para distorsionar informacin y desorientar a quien la recibe. Las siguientes son dos formas de hacerlo: 1. Cambiar la escala en uno o en ambos ejes (esto es alargando o acortando los ejes) 2. Truncando las frecuencias, es decir, comenzando el eje en un nmero mayor que cero.
Polgono de frecuencias
Grfico alternativo al histograma
Los polgonos de frecuencias se realizan trazando los puntos formados por las marcas de clase y las frecuencias, y unindolos mediante segmentos.
17
15
14
10
10
5
4 4
0 15,0
16,5
18,0
19,5
21,0
22,5
24,0
25,5
27,0
28,5
30,0
31,5
33,0
34,5
36,0
37,5
39,0
Edad
Cecilia Larran R.
Estadstica Descriptiva
Pgina 27
Grafico de tendencia
Consumo humano de leche de cabra en Espaa. (millones de litro)
Ao Consumo Ao Consumo 1990 62,5 1999 16,2 1991 29,9 2000 17,1 1992 31,3 2001 15,5 1993 25,2 2002 17,6 1994 20,8 2003 11,9 1995 16,1 2004 11,8 1996 15,8 2005 12,3 1997 15,9 2006 13,1 1998 16,6
- El consumo anual de leche de cabra en el ao 1991 disminuy en 52,16% con respecto al consumo del ao 1990 (variacin porcentual) - Determine la variacin porcentual entre los aos 2001 y 2002.
Variacin porcentual =
Cecilia Larran R.
Estadstica Descriptiva
Pgina 28
Ejercicios II
En cada uno de los siguientes ejercicios debe indicar cul es la variable de inters y clasificarla segn naturaleza, T_recorrido y nivel de medicin.
Ejercicio II-1 El Ingeniero a cargo del control de calidad del agua de una ciudad, es responsable del nivel de cloracin del agua. Dicho nivel debe acercarse bastante al que exige el Departamento de Sanidad. Para vigilar el cloro, sin necesidad de verificar cada galn de agua que sale de la planta, el Ingeniero muestrea diariamente algunos galones, mide el contenido de cloro y saca una conclusin sobre el nivel promedio de cloracin que tiene el agua tratada ese da. La tabla anexa exhibe las concentraciones de cloro correspondiente a 30 galones seleccionados como muestra de un da. A partir de esta muestra diaria el Ingeniero obtiene sus conclusiones respecto a la poblacin total a la que se le aplic la cloracin. Diagrama de tallo-hojas Tabla de Concentraciones de Cloro en partes por milln (ppm)
16.2 15.7 16.1 16.9 15.7 16.6 15.9 15.6 16.4 15.8 16.0 16.0 15.4 16.2 15.6 16.8 16.4 15.9 16.3 16.0 15.8 16.0 15.2 15.9 15.6 15.8 16.8 15.9 16.3 16.3
Stem-and-Leaf Plot Frequency ,00 1,00 1,00 5,00 7,00 5,00 5,00 2,00 1,00 3,00 Stem width: Each leaf: Stem & 15 15 15 15 15 16 16 16 16 16 . . . . . . . . . . Leaf 2 4 66677 8889999 00001 22333 44 6 889
1,0 1 case(s)
Construya una tabla de distribucin de frecuencias y un grfico adecuado. Ejercicio II-2 En un centro de computacin, el nmero de veces que el computador se detiene, por error de mquina, diariamente, fue recolectado por un perodo de 70 das. Los datos obtenidos fueron los siguientes. 0 1 0 2 0
-
0 8 3 2 1
2 5 1 0 6
0 2 2 5 0
0 3 1 2 0
0 0 0 1 4
Tabule y grafique los datos adecuadamente. - Cul es la proporcin de das en que ocurren ms de 3 detenciones?
Cecilia Larran R.
Estadstica Descriptiva
Pgina 29
Ejercicio II-3 Un fabricante de envases de plstico desea analizar cules son las causas que generan los envases defectuosos que se producen. Se observan 248 envases defectuosos obteniendo:
Diagrama de Pareto
99,60% 100,00%
100
97,18% 92,34%
100%
80
76,61%
80%
Frecuencia
60,48%
60 60%
Porcentaje
40
40%
20
20%
0%
Defectos
Cecilia Larran R.
Estadstica Descriptiva
Pgina 30
Ejercicio II-5
Al responsable en control de industrial de una empresa, debe analizar informacin entregada en un histograma de la duracin (tiempo hasta fallo en horas) de un test de fiabilidad 150 dispositivos electrnicos idnticos.
Histograma
N de dispositivos
60
51
50
40
30
27 21 21 18
20
10
6 3
0 0 200 400 600 800 1000 1200 1400 1600 1800 2000
Duracion
a. b. c. d. e. f.
Aproximadamente, cul es la duracin ms frecuente? Qu porcentaje de dispositivos duraron entre 600 y menos de 1400 horas? Qu porcentaje de dispositivos duraron menos de 900 horas? (aprox.) Qu porcentaje de dispositivos duraron entre 400 y 1500 horas? (aprox.) Determine entre que valores de duracin se encuentran el 50% de los dispositivos con mayor duracin.
|
0
50%
50%
|
1600
Duracin (hrs)
Mn g.
Mx
150
100
Cecilia Larran R.
Estadstica Descriptiva
Pgina 31
Ejercicio II-6 Se seleccionaron de un proceso de fabricacin, aleatoriamente 270 ladrillos y se llev a cabo una prueba para determinar la resistencia transversal de stos. Se obtuvieron los siguientes datos: Resistencia (MN/m2) X 1.5 3.5 3.5 4.5 4.5 5.5 5.5 6.5 6.5 7.5 7.5 8.5 8.5 9.5 9.5 10.5 10.5 11.5 11.5 14.5 Construya un grfico adecuado
El histograma es especialmente adecuado para representar tablas de frecuencias en el caso de variables de de nivel por lo menos intervalar (o discretas con un gran nmero de valores observados distintos). Este grfico consiste en una serie de barras adyacentes cuyas superficies son proporcionales a la frecuencia del intervalo sobre el cual se levantan. Si los intervalos son de igual amplitud, los rectngulos sern de altura proporcional a la frecuencia correspondiente. Es decir, si la amplitud del i-simo intervalo es ai y su frecuencia ni la barra deber tener una altura hi que satisfaga:
ni 2 4 24 81 78 51 18 9 2 1
ai hi = kni n hi = k i ai
donde k es cualquier constante, aunque la misma para cada intervalo. ni frecuencia absoluta del intervalo i; hi frecuencia absoluta corregida
Se corrige la frecuencia solamente para graficar el histograma, cuando existen intervalos de distinta amplitud (no es usual intervalos de distinta amplitud) Determine el porcentaje de ladrillos con resistencia inferior a 8,5 MN/m2 Determine el porcentaje de ladrillos con resistencia superior a 5 MN/m2
Cecilia Larran R.
Estadstica Descriptiva
Pgina 32
Ejercicio II-7 1. En un estudio sobre el nivel de ruido en un concierto de rock se toma una muestra de 60 valores, medidos en decibelios y en distintos momentos del concierto. Los datos obtenidos se encuentran el el diagrama tallo-hojas siguiente
NIVEL DE RUIDO Frequency 1,00 3,00 22,00 21,00 11,00 2,00 Stem & 8 8 9 9 10 10 . . . . . . Leaf 3 789 0000111123333334444444 555566677777777889999 00001122234 57
Encuentre: Valor mnimo Valor mximo El % de mediciones inferior a 91 db. El % de mediciones superior a 100 db. Ejercicio II-8
Con el propsito de mejorar el tiempo de entrega desde una embotelladora de refrescos a mquinas vendedoras de una universidad, se ha obtenido 40 datos. 9,45 17,08 44,88 24,45 24,45 37,00 54,12 33,66 31,75 41,95 56,63 37,10 X:Tiempo de entrega en minutos 35,00 25,02 16,86 14,38 11,66 21,65 17,89 69,45 22,13 21,15 10,02 14,88 39,73 44,29 55,12 56,63 9,60 10,30 16,97 29,41 24,35 34,93 17,73 24,45 37,50 46,59 21,84 9,45
Organice los datos en una tabla de frecuencias con igual amplitud y confecciones un grfico adecuado
Tiempo de entrega (min) 9,45 - 19,45 xi 14,45 Frecuencia Absoluta ni 13 Porcentaje
32,5
64,45
1 40
2,5 100,0
Cecilia Larran R.
Estadstica Descriptiva
Pgina 33