Anda di halaman 1dari 33

PROBABILIDAD Y ESTADSTICA

Ingeniera
2012

Profesora: Cecilia Larran R.

Estadstica Descriptiva

Introduccin
Qu es la Estadstica: La estadstica es una ciencia que tiene como finalidad facilitar la solucin de problemas en los cuales es necesario conocer algunas caractersticas sobre el comportamiento de algn suceso o evento. conocer o mejorar el conocimiento de ese suceso predecir el comportamiento de sucesos iguales o similares sin que estos ocurran

La Estadstica posee un conjunto de tcnicas que se emplean para la recopilacin, organizacin, presentacin, anlisis e interpretacin de los datos para tomar decisiones y resolver problemas. Por qu hay que estudiar Estadstica? Si se revisan las mallas curriculares de las distintas carreras profesionales, veremos que en la mayora existe por lo menos una asignatura de Estadstica. Bsicamente los contenidos de un primer curso de Estadstica en diferentes carreras son los mimos, la mayor diferencia radica en los ejemplos utilizados. La principal razn es que el rol ms destacado de la Estadstica es la recopilacin, presentacin, anlisis de un conjunto de datos, a partir de los cuales se obtienen conclusiones y se toman decisiones.

Saber Estadstica es de gran utilidad en cualquier rea del conocimiento y en particular en Ingeniera. Ejemplos: - Diseo y desarrollo y mejora en los proceso productivos como control de calidad, control de la variabilidad del proceso, Estudios de materiales en cuanto a duracin, dureza, elasticidad, . Control de inventarios, con la estadstica se analiza la tendencia de flujo de ciertos materiales y ciertos productos. Comparar los tiempos de ejecucin de 3 algoritmos de ordenacin (algoritmo de la burbuja, de seleccin, de insercin, quicksort, treesort)

Cecilia Larran R.

Estadstica Descriptiva

Pgina 2

La mayor contribucin de la Estadstica en la resolucin de problemas en ingeniera es su utilizacin como herramienta de aprendizaje. El aprendizaje que se obtiene mediante la estadstica forma parte del denominado Mtodo Cientfico El mtodo cientfico es la estrategia de la investigacin cientfica: afecta a todo ciclo completo de investigacin y es independiente del tema en estudio. Al ser la Ingeniera la aplicacin del conocimiento cientfico, todo proyecto en ingeniera debe contener los rasgos del mtodo cientfico.

La estadstica se puede clasificar como:


Estadstica descriptiva Probabilidad
Tiene como objetivo caracterizar, describir y extraer conclusiones sobre una muestra de datos o de la poblacin de inters. Mide la incertidumbre, deduce las leyes que rigen a los fenmenos que se investigan. Es la herramienta a partir de la que se desarrolla la inferencia estadstica Implica realizar inferencias acerca de la de la poblacin a partir de datos muestrales y requiere clculo de probabilidades.
La inferencia de conclusiones generales a partir de datos de muestrales es siempre incierta Uno de los objetivos principales de la estadstica es medir esa incertidumbre

Estadstica Inferencial

Cecilia Larran R.

Estadstica Descriptiva

Pgina 3

Estadstica descriptiva (ejemplos)


Reporte de la inspeccin final de defectos de 150 productos para la lnea de armado A12.
Rayado Abollado Astillado Astillado Otros Manchado Rayado Astillado Doblado Rayado Rayado Manchado Manchado Otros Abollado Manchado Rayado Manchado Otros Rayado Doblado Doblado Rayado Manchado Manchado Rayado Abollado Manchado Rayado Rayado Manchado Astillado Rayado Astillado Astillado Manchado Rayado Rayado Manchado Manchado Manchado Manchado Manchado Otros Rayado Manchado Manchado Rayado Astillado Rayado Astillado Manchado Manchado Doblado Manchado Astillado Manchado Manchado Manchado Astillado Manchado Doblado Manchado Manchado Astillado Rayado Manchado Abollado Manchado Manchado Doblado Astillado Astillado Rayado Manchado Astillado Rayado Manchado Manchado Abollado Manchado Abollado Rayado Manchado Manchado Astillado Rayado Rayado Manchado Astillado Manchado Manchado Rayado Manchado Abollado Astillado Manchado Manchado Astillado Doblado Abollado
50 60
56

Defectos en lnea de armado A12 (150 productos examinados) Defecto del producto Abollado Astillado Doblado Manchado Otros Rayado Total Frecuencia 8 23 12 56 6 45 150 Porcentaje 5,3 15,3 8,0 37,3 4,0 30,0 100,0

Manchado
45

Rayado Doblado Astillado Manchado


Frecuencia

40

30

23

20

Rayado Rayado Astillado Manchado Rayado Rayado Rayado Rayado Manchado Rayado Manchado Rayado Rayado Astillado Defectos en lnea de armado A12 (150 productos examinados)
0 Abollado Astillado Doblado Manchado Rayado Otro 10
8 6 12

Defecto del producto

El defecto ms frecuente en la lnea de armado es Manchado Moda = manchado

Cecilia Larran R.

Estadstica Descriptiva

Pgina 4

Nmeros de averas en Febrero.2012 de 40 centrales Elctricas.


0 2 0 2 0 3 0 2 1 1 1 0 0 1 2 0 0 3 1 0 1 1 3 3 0 1 3 0 1 1 4 2 2 1 1 1 0 0 2 2
N de averas 0 1 2 3 4 Total

Tabla de frecuencias
Porcentaje acumulado 32,5 65,0 85,0 97,5 100,0

Frecuencia 13 13 8 5 1 40

Porcentaje 32,5 32,5 20,0 12,5 2,5 100,0

Centrales elctricas (40). Febrero 2012

Estads ticos (Medidas de res ume n)

Grfico
14

N de averas n Media Mediana Moda Desv. tp. Asimetra Error tp. de asimetra Curtosis Error tp. de curtosis Mnimo Mximo Percentiles
1

13

13

Vlidos Perdidos

12

10

8
Recuento

25 50 75

40 0 1,20 1,00 0a 1,114 ,637 ,374 -,445 ,733 0 4 ,00 1,00 2,00

0 0 1 2
N de averas

a. Existen varias modas. Se mostrar el menor de los valores.


Centrales elctricas (40). Febrero 2012

Centrales elctricas (40). Febrero 2012

Cecilia Larran R.

Estadstica Descriptiva

Pgina 5

Nota de Estadstica
400 alumnos Semestre 2 - 2011

Tabla de frecuencias
Nota de Estadstica Frecuencia 30 53 74 96 86 61 400 Porcentaje 7,5 13,3 18,5 24,0 21,5 15,3 100,0 Porcentaje acum ulado 7,5 20,8 39,3 63,3 84,8 100,0

Vlidos

1- 2 2- 3 3- 4 4- 5 5- 6 6- 7 Total

Semestre 2 - 2012

Grficos
Nota de Estadstica
Semestre 2 - 2011

Histograma

100

96 86

80

74 61

Frecuencia

60

53

40

Medidas de resumen
20

30

0 1,0 2,0 3,0 4,0 5,0 6,0 7,0

Nota

Nota de Estadstica
Semestre 2 - 2011

Cecilia Larran R.

Estadstica Descriptiva

Pgina 6

La Estadstica Descriptiva utiliza, tablas, grficos y resmenes numricos

Para realizar cualquier estudio estadstico, hay que tener en cuenta: Cmo y de donde se recolect la informacin Qu se midi atributos o cantidades?

TRMINOS BSICOS
Poblacin y Muestra Poblacin es el conjunto de individuos (personas, animales o cosas) sobre el que estamos interesados en obtener conclusiones (hacer inferencia). Normalmente es demasiado grande para poder abarcarlo. (Tamao poblacin: N) Censo: estudio completo de la poblacin A las medidas de resmenes poblacionales como la media poblacional , desviacin estndar poblacional , , se les denominan parmetros. Muestra: subconjunto de la poblacin al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones). (Tamao muestra: n) Debera ser representativo Est formado por miembros seleccionados de la poblacin (individuos, unidades experimentales). A las medidas de resmenes muestrales como la media de la muestra x , desviacin estndar de la muestra s, se les denomina estadsticos.
De una poblacin existen muchas muestras posibles, pero slo observamos una!

Cecilia Larran R.

Estadstica Descriptiva

Pgina 7

Nota: A la hora de decidir sobre la forma de recoger la informacin de la muestra se utilizan distintos criterios, originando distintos tipos de muestreos. (Anexo 2)

Encuesta: Tcnica de investigacin para obtener informacin de grupos de personas mediante el uso de instrumentos como cuestionarios diseados en forma previa. Diseo de experimentos: Metodologa estadstica destinada a la planificacin y anlisis de un experimento. El objetivo del diseo de experimento es estudiar si utilizar un determinado tratamiento produce mejora en el proceso o no.

Variable: una variable es una caracterstica observable que vara entre los
diferentes individuos de una poblacin. La informacin que disponemos de cada individuo es resumida en variables. En la poblacin de alumnos de Ingeniera de una universidad, es variable: - El gnero: {Femenino, Masculino}
-

var. cualitativa dicotmica var. cualitativa politmica var. cuantitativa discreta var. cuantitativa continua var. cuantitativa continua

Especialidad :{Informtica, Industrial, Obras Civiles, }

- El nmero de asignatura aprobadas: {0,1,2,3,...} - La altura (en cm.): {162 , 156, 170 ...} - Edad (aos):
. . .

- Nivel de Educ. del padre: {Bsica, Media Superior} var. cualitativa ordinal {17, 18, 19, }

HAY QUE CONOCER EL TIPO DE VARIABLE PARA UTILIZAR LA HERRAMIENTA ESTADSTICA ADECUADA

Obs.: Se acostumbra denotar a las variables con letras maysculas. X, Y, Z

Cecilia Larran R.

Estadstica Descriptiva

Pgina 8

Dato: valor de la variable asociado a un elemento de la poblacin o muestra.


(los valores de las variables se denotan con letras minsculas)

Ejemplo: (archivo de datos) Sujeto Sexo (X1) M M F


. . .

Edad (X2) 21 22 31
. . .

Especialidad (X3) IND INF OC


. . .

01 02 03
. . .

observacin 1

La primera observacin indica que el sujeto es de sexo masculino, tiene 21 aos y estudia Ingeniera Industrial. Cada una de estas tres mediciones es un dato para cada una de las variables medidas para el sujeto 1.

El alumno de Ingeniera es la unidad de observacin Datos primarios Son aquellos que el investigador obtiene directamente de la realidad, recolectndolos con sus propios instrumentos. Datos secundarios Son registros escritos que proceden tambin de un contacto con la prctica, pero que ya han sido elegidos y procesados por otros investigadores. Las fuentes son informacin de datos secundarios deben ser fidedignas. Los datos primarios y secundarios no son dos clases esencialmente diferentes de informacin, sino partes de una misma secuencia: todo dato secundario ha sido primario en sus orgenes, y todo dato primario, a partir del momento en que el investigador concluye su trabajo, se convierte en dato secundario para los dems.

Cecilia Larran R.

Estadstica Descriptiva

Pgina 9

Clasificacin de variables
Para realizar un anlisis de datos, es indispensable saber cmo es la variable que consideramos, pues ello determina el tipo de mtodo estadstico que se debe utilizar. Las variables se clasifican como:

Segn su naturaleza

Cualitativas o atributos
No toman valores y numricos describen

Cuantitativas
Sus valores son numricos (tiene sentido hacer operaciones

(modalidades)

cualidades. (no se pueden hacer operaciones algebraicas con ellos). Ejemplos: Estado Civil Profesin

algebraicas con ellos). Ejemplos: Estatura Nmero de errores

Segn tamao del recorrido

Dicotmicas
Toman uno de dos valores. Ejem.: Sexo

Discretas
Corresponden en general a contar el nmero de veces que ocurre un suceso.

Continuas
Entre dos valores, son posibles infinitos valores intermedios Ejemplos: Altura Edad

Tienen un recorrido contable Ejem.: Nmero de cargas familiares. Nmero de fallas en un centro de cmputo.

Cecilia Larran R.

Estadstica Descriptiva

Pgina 10

Segn el nivel de medicin


La medicin es el proceso mediante el cual se les asignan valores numricos a objetos siguiendo unas determinadas reglas. Los instrumentos que se utilizan para llevar a cabo tal medicin se les denominan escalas de medicin. El criterio utilizado convencionalmente para clasificar las escalas de medida es el propuesto por Stevens (1946), quien establece cuatro tipos de escala: nominal, ordinal, de intervalo y de razn.

E ES SC CA AL LA AS SD DE EM ME ED DI IC CI I N N
Ejemplos

nicamente permiten establecer relaciones de igualdad/desigualdad entre los objetos que se estn midiendo.
NO INDICA ORDEN O JERARQUA

SEXO: Masculino Femenino (1) (2)

PROFESIN: Ingeniero Profesor Mdico (1) (2) (3)

RAZN INTERVALAR ORDINAL N NO OM MIIN NA AL L

Cecilia Larran R.

Estadstica Descriptiva

Pgina 11

E ES SC CA AL LA AS SD DE EM ME ED DI IC CI I N N
Adems de permitir relaciones de igualdad /desigualdad, permite establecer relaciones de orden (mayor o menor que) entre los objetos que se estn midiendo.
EXISTE UN ORDEN O JERARQUA
Ejemplo

NIVEL EDUCACIONAL: Univ. con doctorado Univ. con Magister Superior Media Bsica (5) (4) (3) (2) (1)

RAZN INTERVALAR O OR RD DIIN NA AL L NOMINAL

Cecilia Larran R.

Estadstica Descriptiva

Pgina 12

E ES SC CA AL LA AS SD DE EM ME ED DI IC CI I N N
RAZN IIN NT TE ER RV VA AL LA AR R ORDINAL NOMINAL
Al igual que los dos tipos de escalas anteriores (nominal u ordinal), esta escala permite establecer relaciones de igualdad /desigualdad y de orden entre los objetos que se miden. Los intervalos entre los nmeros de la escala son iguales, por lo tanto se puede realizar las operaciones suma y resta. Este tipo de escala carece de un cero absoluto, por lo que no estn permitidas ni la multiplicacin ni la divisin entre los nmeros de la escala. Una escala de intervalo es, por ejemplo, la utilizada para medir la temperatura. Como los intervalos de la escala son iguales, se puede afirmar que la diferencia de temperatura que existe entre 25 y 28 grados es la misma que existe entre 30 y 33 grados. Sin embargo, dado que el punto 0 de la escala es arbitrario -no existe ausencia de temperatura- no se puede afirmar,

por ejemplo, que 20 grados es exactamente la mitad de 40 grados.

Cecilia Larran R.

Estadstica Descriptiva

Pgina 13

E ES SC CA AL LA AS SD DE EM ME ED DI IC CI I N N
R RA AZ Z N N INTERVALAR ORDINAL NOMINAL
Es la escala que permite el nivel ms alto de medicin. Adems de las operaciones que permiten las escalas anteriores, en una escala de razn existe el cero (0) emprico, por lo cual se puede efectuar cualquier operacin aritmtica con los nmeros de la escala. El tiempo de reaccin, por ejemplo es una variable medida en escala de razn. No slo se puede afirmar que la diferencia entre 3 y 6 segundos es la misma que entre 6 y 9 segundos (afirmacin vlida tambin en la escala de intervalos), sino, adems, que 6 s es el doble de 3 s Afirmacin que es posible establecer gracias a que en la escala de tiempo de reaccin existe el cero absoluto: cero significa ausencia de tiempo de reaccin.

Cecilia Larran R.

Estadstica Descriptiva

Pgina 14

Clasificacin de variables segn su funcin

VI Independiente
Introduce o manipula el investigador

VD Dependiente
Se observa y se miden los cambios

Interviniente
Es la que puede mediar en la relacin entre VI y VD y que puede influir en los resultados

Ejemplo: Los hbitos de estudios influyen en el rendimiento acadmico de los Estudiantes VI = hbitos de estudio VD = Rendimiento acadmico V interv. = Aptitud personal Nivel nutricional .

Ejercicios I
Ejercicio I-1 Determine en cada caso, si se trata o no de una variable. La edad mnima para poder votar por primera vez en Chile. Nmero de errores diarios en una central telefnica. Tiempo (en aos) de experiencia laboral. Profesin de los clientes de un banco. Sueldo de los Ingenieros.

Cecilia Larran R.

Estadstica Descriptiva

Pgina 15

Ejercicio I-2 Se quiere analizar el nmero de horas de estudio semanal que dedican los alumnos postgrado del rea Ingeniera de esta Universidad. Para ello se selecciona a 35 alumnos que estn participando en postgrado. Indique cual es la: Poblacin: Variable: Muestra: Ejercicio I-3 El coeficiente intelectual (CI) promedio en la poblacin adulta chilena es 100 puntos. Un investigador educacional est interesado en probar que las personas adultas que hablan ms de un idioma tienen un CI superior a la media poblacional. En una muestra de 250 personas que hablan ms de un idioma se obtuvo un promedio (CI medio) de 102.

Complete:
Clasificacin de la variable Variable de inters (nombre) X

Naturaleza

Recorrido

Medicin

Promedio poblacional

Promedio muestral

Ejercicio I-4
Qu situaciones se representan estadsticamente con una variable discreta y cules con una variable continua?

a. b. c. d. e. f. g.

El nmero de defectuosos en la fabricacin Los tipos de defectos encontrados El tiempo de vida de las unidades que se fabrican El costo de fabricacin El nivel de satisfaccin de los clientes N de pedidos que se hacen al mes El tiempo que transcurre desde que llega un pedido hasta que llega el siguiente

Cecilia Larran R.

Estadstica Descriptiva

Pgina 16

Ejercicio I-5
En el departamento de personal de una empresa con 10.000 trabajadores se quiere estimar los gastos familiares en salud de sus empleados para determinar la posibilidad de proporcionarles un plan de seguro mdico.

Si el gasto mensual ($) en salud de 10 empleados elegidos al azar fue:


71.060 233.852 158.916 54.910 329.460 134.368 111.758 274.550 204.136 115.634

Indique: Poblacin: _______________________ Tamao N = Unidad de observacin: Variable: X = Muestra: _________________________ Tamao: n =
n n

Interprete
i 1

xi

Calcule
i 1

x i2

FMS 1Estadstica

Descriptiva Univariada

Organizacin de los datos


La estadstica descriptiva, entrega las tcnicas que permiten condensar grandes grupos de datos mediante el uso de tablas de frecuencias, grficos y medidas de resumen como media, desviacin estndar, correlacin.
Nota: Para resumir los datos siempre hay que tener en cuenta de que tipo es la variable que queremos analizar

Datos en bruto o directos


Cuando la informacin es recolectada, sea de una muestra o de una poblacin, esta se organiza en la secuencia en que fue obtenida. Esta secuencia de datos registrados se encuentra desorganizada, lo que no permite extraer informacin fcilmente, siendo difcil detectar cualquier patrn de variabilidad o estructura de los datos. Datos en bruto: Datos registrados en la secuencia en que fueron recolectados, antes de ser procesados u ordenados.

Cecilia Larran R.

Estadstica Descriptiva

Pgina 17

Ejemplo 1 (ArmadoA12.xls): El reporte de la inspeccin final de defectos de 150 productos para la lnea de armado A12 se muestra en la tabla siguiente:
Producto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Defecto Rayado Abollado Astillado Astillado Otros Manchado Rayado Astillado Doblado Rayado Rayado Manchado Manchado Otros Abollado Manchado Rayado Manchado Otros Rayado Doblado Doblado Rayado Manchado Manchado Rayado Abollado Manchado Rayado Rayado Producto 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Defecto Manchado Rayado Rayado Manchado Manchado Doblado Manchado Manchado Manchado Rayado Astillado Rayado Otros Astillado Rayado Rayado Rayado Doblado Manchado Manchado Manchado Rayado Otros Rayado Doblado Manchado Rayado Rayado Doblado Rayado Producto 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 Defecto Manchado Astillado Rayado Astillado Astillado Manchado Rayado Rayado Manchado Manchado Manchado Manchado Manchado Otros Rayado Manchado Manchado Rayado Astillado Rayado Astillado Manchado Manchado Doblado Manchado Astillado Manchado Manchado Manchado Astillado Producto 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 Defecto Manchado Doblado Manchado Manchado Astillado Rayado Manchado Abollado Manchado Manchado Doblado Astillado Astillado Rayado Manchado Astillado Rayado Manchado Manchado Abollado Manchado Abollado Rayado Manchado Manchado Astillado Rayado Rayado Manchado Astillado Producto 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 Defecto Manchado Manchado Rayado Manchado Abollado Astillado Manchado Manchado Astillado Doblado Abollado Manchado Rayado Doblado Astillado Manchado Rayado Rayado Astillado Manchado Rayado Rayado Rayado Rayado Manchado Rayado Manchado Rayado Rayado Astillado

Ejemplo 2: :

Datos sobre el nmeros de averas centrales Elctricas.


0 2 0 2 1 1 1 0 0 3 1 0 0 1 3 0 2 1 1 1 0 3 0 2 0 1 2 0 1 1 3 3

en Febrero.2012 de 40
1 1 4 2 0 0 2 2

Cecilia Larran R.

Estadstica Descriptiva

Pgina 18

Ejemplo 3: En abril. 2011 se recolect informacin sobre la edad (en aos) de 50


estudiantes diurnos seleccionados de una universidad. El valor de los datos, en el orden en que fueron recolectados se presenta a continuacin. (Este es un ejemplo de datos cuantitativos en bruto)
21 18 25 22 25 19 20 19 28 23 24 19 31 21 18 25 22 19 20 36 29 19 23 22 27 34 19 18 22 23 26 25 23 21 21 27 22 19 20 25 36 25 23 19 21 33 23 26 21 24

Descripcin estadstica de una variable cualitativa

Grficos

Sectorial Barras Separadas - Diagrama de Pareto - Pictograma -

Medida de resumen Moda: es el dato o modalidad de mayor frecuencia dato ms representativo

Tabla o distribucin de frecuencias Es una tabla que constituye el resumen bsico de los datos

La presentacin grfica puede revelar de un vistazo las principales caractersticas de un conjunto de datos

Cecilia Larran R.

Estadstica Descriptiva

Pgina 19

Ejemplo 1: (p 18) El reporte de la inspeccin final de defectos para la lnea de armado A12 se muestra en la tabla siguiente:
Defectos_Linea A12 Defectos del producto Abollado Astillado Doblado Manchado Rayado Otros Total Frecuencia absoluta ni 8 23 56 Frecuencia Relativa n fi = i n 0,05 0,15 Porcentaje % 5,33 15,33 37,33

150

1,00
Complete la tabla de frecuencias

100%

Frecuencia absoluta (ni): Nmero de veces que ocurre la modalidad i. i = 1,2, ,k Frecuencia relativa (fi): Es la proporcin de la categora o modalidad respecto del total de datos. 0 < fi < 1 ; i = 1,2, ,k

Grfico sectorial: Crculo dividido en porciones que representan las frecuencias relativas o porcentajes de una poblacin o muestra perteneciente a diferentes categoras.
Como sabemos, un crculo contiene 360 grados. Para construir un grfico sectorial, se multiplica por 360 la frecuencia relativa de cada categora, para obtener la medida del ngulo correspondiente
Otros 4,00%

Defectos en lnea de armado A12 (150 productos examinados)

Abollado 5,33%

Astillado 15,33% Doblado 8,00%

Rayado 30,00%

Manchado 37,33%

Defectos del producto

Cul es Defecto ms frecuente?


Cunto mide el
de sector Defecto Manchado?

Cecilia Larran R.

Estadstica Descriptiva

Pgina 20

Grfico de Barras Separadas


60
56

50

45

40

Frecuencia

30

23

20

10
8

12

0 Abollado Astillado Doblado Manchado Rayado Otro

Defecto del producto

Defectos en lnea de armado A12 (150 productos examinados)

Diagrama de Pareto
Herramienta bsica de la mejora de calidad. Muy til para priorizar los problemas o las causas que los generan. Su fundamento parte de considerar que un pequeo porcentaje de las causas producen la mayora de los efectos. Se tratar de identificar ese pequeo porcentaje de causas vitales para actuar prioritariamente sobre l.
Centrales elctricas (40). Febrero 2011

Cecilia Larran R.

Estadstica Descriptiva

Pgina 21

Defecto Manchado Rayado Astillado Doblado Abollado Otros TOTAL

frecuencia 56 45 23 12 8 6 150

% 37,33 30,00 15,33 8,00 5,33 4,00 100,0%

frec. Acum. 56 101 124 136 144 150

% acumulado 37,33 67,33 82,67 90,67 96,00 100

Se calculan solamente para el diagrama Pareto (en este tipo de variable)

Descripcin estadstica de una variable cuantitativa


TABLAS Y GRFICOS

Si las observaciones en un conjunto de datos cuantitativos son discretos (contables) o si los valores de la variable asumen slo unos pocos valores distintos, puede ser apropiado armar tablas de frecuencia con valores nicos. La distribucin de frecuencias (tabla) - La distribucin de frecuencias para variables cuantitativas discretas es similar a la de variables cualitativas. Los valores que toma la variable se ordenan de de menor a mayor lo que permite registrar en la tabla las frecuencias acumuladas. La representacin grfica que se utiliza para este tipo de variables es barras separadas Distribucin de frecuencias de la variable X
Nombre de la variable X x1 x2 x3 . . . xk Total
Frec. Absoluta ni Frec. Relativa

fi =

ni n

Frec. Abs. Acumulada Ni

Frec. Relat. Acumulada

F= i

Ni n

n1 n2 n3 . . . nk n

f1 f2 f3 . . . fk 1

N1 = n1 N2 = n1 + n2 N3 = n1 + n2 + n3 . . . Nk = n

F1 F2 F3 . . . Fk = 1

xi= valor que toma la variable. i= 1,2, ,k

Cecilia Larran R.

Estadstica Descriptiva

Pgina 22

Ejemplo 2: (p 18) Datos sobre el nmero de averas de 40 centrales elctricas en Feb.2012 se resumen en la tabla siguiente:
N de averas 0 1 2 3 4 Total
Frec. Absoluta ni Frec. Relativa fi Frec. Abs. Acumulada Ni Frec. Relat. Acumulada Fi

13 13 5 1 40

13 26

0,325

40 1,000
GRFICO DE BARRAS SEPARADA

Cuntas centrales tienen menos de 2 averas? Qu porcentajes de centrales tienen 3 o menos averas? Qu porcentaje de centrales tienen ms de 3 averas? Interprete: n2 f3 N4 F4
N de centrales

12

13

13

10

1
0 0 1 2 3 4

N de averas

Cecilia Larran R.

Estadstica Descriptiva

Pgina 23

Cuando la variable es continua o el nmero de valores posibles de una variable discreta sea grande, para construir la tabla de frecuencias,

conviene agrupar los datos intervalos reales. stos agrupan todos aquellos casos contenidos entre dos valores, conocidos como el lmite superior e inferior.

Ejemplo: (p 19) En abril. 2011 se recolect informacin sobre la edad (en aos) de 50
estudiantes seleccionados de una casa de estudio superior. El valor de los datos, en el orden en que fueron recolectados se presenta a continuacin. (Este es un ejemplo de datos cuantitativos en bruto)
21 18 25 22 25 19 20 19 28 23 24 19 31 21 18 25 22 19 20 36 29 19 23 22 27 34 19 18 22 23 26 25 23 21 21 27 22 19 20 25 36 25 23 19 21 33 23 26 21 24

Construyendo tablas de frecuencias Al construir tablas de frecuencias es necesario tomar las siguientes 3 decisiones: i) Nmero de clases (intervalos)

Usualmente el nmero de intervalos de una distribucin de frecuencias vara entre 5 y 20, dependiendo principalmente del nmero de casos con los cuales se cuente. La decisin del nmero de clases es decidida arbitrariamente por quien organiza la informacin. Reglas que puede ayudar a decidir el nmero de clases o intervalos: - Nmero de intervalos =
n

; n = nmero de datos, o

- Nmero de intervalos = [1 + 3,3 log n] (frmula de Sturge) ii) Amplitud de intervalo


Estadstica Descriptiva Pgina 24

Cecilia Larran R.

Aunque

no es comn

tener clases o intervalos de diferentes tamaos o

amplitud, la mayora del tiempo es preferible tener la misma amplitud de intervalo en todos ellos. Para determinar esta amplitud cuando las clases o intervalos tienen el mismo tamao, primero se debe encontrar la diferencia entre el mayor y el menor de los datos en los datos. Luego, la amplitud aproximada es obtenida dividiendo esta diferencia por el nmero deseado de clases o intervalos.
Amplitud del intervalo = valor mximo - valor mnimo nmero de intervalos

iii)

Lmite inferior de la primera clase o punto de partida

Cualquier nmero que sea igual o menor que el ms bajo de los valores del conjunto de datos ser conveniente para ser usado como el lmite inferior del primer intervalo.

En el ejemplo (Edad): n = 50 mx = 36

mn = 18

Si utilizamos nmero de intervalos = [1 + 3,3 log (50)] = 6

Amplitud =

36 18 =3 6
Se lee

14 alumnos con edades entre 18 y menos de 21 aos 17 alumnos con edades entre 21 y menos de 24 aos

4 alumnos con edades entre 33 y 36 aos

Edad 18 21 21 24 24 27 27 30 30 33 33 36

n de alumnos 14 17 10 4 1 4 Total = 50

Cecilia Larran R.

Estadstica Descriptiva

Pgina 25

Frecuencias relativas y porcentaje


Es posible calcular la frecuencia relativa y el porcentaje de las distribuciones cuantitativas del la misma forma que en las distribuciones cualitativas o discretas. Edad Marca de clase Frec. Absoluta Frec. Relativa Porcentaje

xi
18 21 21 24 24 27 27 30 30 33 33 36 19,5 22,5 25,5

ni
14 17 10

fi
0,28 0,34 0,20 28 34 20

Total = 50
Tambin se pueden registrar las frecuencias acumuladas

1,00

100%

marca de clase =

limite inferior + limite superior 2

Representacin grfica de distribuciones de frecuencias con datos en intervalos Las representaciones grficas ms frecuentes de una tabla de frecuencias donde los datos han sido agrupados en intervalos son el histograma o el polgono de frecuencias.
Edad en aos

Histograma

Donde cada rectngulo corresponde con una clase y la altura es proporcional a la frecuencia de dicha clase o intervalo.
Cecilia Larran R. Estadstica Descriptiva Pgina 26

N estudiantes

20

17

15

14

10

10

0 15 18 21 24 27 30 33 36 39

Edad

Muestra de 50 estudiantes de una universidad (abril 2011)

Formas de histogramas
Un histograma puede asumir diferentes formas. Las ms comunes son: simtricos, asimtricos y uniforme o rectangular.
Simtrico
10
10

Asimetra Positiva
10

Asimetra Negativa

Simtrica
8

0 2.5 7.5 12.5 17.5 22.5 27.5 32.5

0 2.5 7.5 12.5 17.5 22.5 27.5 32.5

0 2.5 7.5 12.5 17.5 22.5 27.5 32.5

Interprete los tres histogramas Observacin: Describir datos utilizando grficos puede ayudar a iluminarnos acerca de las caractersticas principales de la informacin. Desafortunadamente, tambin pueden ser utilizados, casual o intencionadamente, para distorsionar informacin y desorientar a quien la recibe. Las siguientes son dos formas de hacerlo: 1. Cambiar la escala en uno o en ambos ejes (esto es alargando o acortando los ejes) 2. Truncando las frecuencias, es decir, comenzando el eje en un nmero mayor que cero.

Polgono de frecuencias
Grfico alternativo al histograma
Los polgonos de frecuencias se realizan trazando los puntos formados por las marcas de clase y las frecuencias, y unindolos mediante segmentos.

Polgono de frecuencias (Edad en aos)


N alumnos
20

17

15
14

10

10

5
4 4

0 15,0

16,5

18,0

19,5

21,0

22,5

24,0

25,5

27,0

28,5

30,0

31,5

33,0

34,5

36,0

37,5

39,0

Edad

Muestra de 50 estudiantes de una universidad (abril 2011)

Cecilia Larran R.

Estadstica Descriptiva

Pgina 27

Grafico de tendencia
Consumo humano de leche de cabra en Espaa. (millones de litro)
Ao Consumo Ao Consumo 1990 62,5 1999 16,2 1991 29,9 2000 17,1 1992 31,3 2001 15,5 1993 25,2 2002 17,6 1994 20,8 2003 11,9 1995 16,1 2004 11,8 1996 15,8 2005 12,3 1997 15,9 2006 13,1 1998 16,6

- El consumo anual de leche de cabra en el ao 1991 disminuy en 52,16% con respecto al consumo del ao 1990 (variacin porcentual) - Determine la variacin porcentual entre los aos 2001 y 2002.

Variacin porcentual =

Final - 1 100 Inicial

Cecilia Larran R.

Estadstica Descriptiva

Pgina 28

Ejercicios II
En cada uno de los siguientes ejercicios debe indicar cul es la variable de inters y clasificarla segn naturaleza, T_recorrido y nivel de medicin.

Ejercicio II-1 El Ingeniero a cargo del control de calidad del agua de una ciudad, es responsable del nivel de cloracin del agua. Dicho nivel debe acercarse bastante al que exige el Departamento de Sanidad. Para vigilar el cloro, sin necesidad de verificar cada galn de agua que sale de la planta, el Ingeniero muestrea diariamente algunos galones, mide el contenido de cloro y saca una conclusin sobre el nivel promedio de cloracin que tiene el agua tratada ese da. La tabla anexa exhibe las concentraciones de cloro correspondiente a 30 galones seleccionados como muestra de un da. A partir de esta muestra diaria el Ingeniero obtiene sus conclusiones respecto a la poblacin total a la que se le aplic la cloracin. Diagrama de tallo-hojas Tabla de Concentraciones de Cloro en partes por milln (ppm)
16.2 15.7 16.1 16.9 15.7 16.6 15.9 15.6 16.4 15.8 16.0 16.0 15.4 16.2 15.6 16.8 16.4 15.9 16.3 16.0 15.8 16.0 15.2 15.9 15.6 15.8 16.8 15.9 16.3 16.3
Stem-and-Leaf Plot Frequency ,00 1,00 1,00 5,00 7,00 5,00 5,00 2,00 1,00 3,00 Stem width: Each leaf: Stem & 15 15 15 15 15 16 16 16 16 16 . . . . . . . . . . Leaf 2 4 66677 8889999 00001 22333 44 6 889

(Utilice una amplitud de 0.3 ppm).

1,0 1 case(s)

Construya una tabla de distribucin de frecuencias y un grfico adecuado. Ejercicio II-2 En un centro de computacin, el nmero de veces que el computador se detiene, por error de mquina, diariamente, fue recolectado por un perodo de 70 das. Los datos obtenidos fueron los siguientes. 0 1 0 2 0
-

0 8 3 2 1

2 5 1 0 6

N de detenciones del computador por da. 0 0 0 3 3 0 0 1 0 0 4 3 0 6 2 0 1 0 1 0 1 1 0 2 0 0 1 2 1 2 0 0 4 3 3 1 2 4 0 2

0 2 2 5 0

0 3 1 2 0

0 0 0 1 4

Tabule y grafique los datos adecuadamente. - Cul es la proporcin de das en que ocurren ms de 3 detenciones?

Cecilia Larran R.

Estadstica Descriptiva

Pgina 29

Ejercicio II-3 Un fabricante de envases de plstico desea analizar cules son las causas que generan los envases defectuosos que se producen. Se observan 248 envases defectuosos obteniendo:

Diagrama de Pareto
99,60% 100,00%

100

97,18% 92,34%

100%

80

76,61%

80%

Frecuencia

60,48%
60 60%

Porcentaje

40

40%

20

20%

0 Aplastamiento Desbalanceo Rotura Rosca Fuera de medida Color

0%

Defectos

Coloque los ni en las barras. Interprete el grfico Ejercicio II-4


En un proceso de fabricacin de circuitos integrados las causas ms comunes de fallas son: la contaminacin (1), xido(2), metalizacin (3), la corrosin(4), doping (5) ,los defectos del silicio (6) y varios (7). En un proceso de control de calidad de estos circuitos las causas de falla de 31 de ellos han resultado las siguientes:
corrosin xido metalizacin xido corrosin contaminacin contaminacin metalizacin xido varios xido contaminacin silicio contaminacin doping contaminacin contaminacin xido contaminacin contaminacin varios varios xido contaminacin xido contaminacin contaminacin contaminacin contaminacin contaminacin, xido

Se pide: Construir una distribucin de frecuencias y confeccione dos grficos adecuados.

Cecilia Larran R.

Estadstica Descriptiva

Pgina 30

Ejercicio II-5
Al responsable en control de industrial de una empresa, debe analizar informacin entregada en un histograma de la duracin (tiempo hasta fallo en horas) de un test de fiabilidad 150 dispositivos electrnicos idnticos.

Histograma

N de dispositivos

60

51
50

40

30

27 21 21 18

20

10

6 3
0 0 200 400 600 800 1000 1200 1400 1600 1800 2000

Duracion

a. b. c. d. e. f.

Construya la tabla de frecuencias (absolutas, relativas, absolutas acumulada y relativas


acumulada)

Aproximadamente, cul es la duracin ms frecuente? Qu porcentaje de dispositivos duraron entre 600 y menos de 1400 horas? Qu porcentaje de dispositivos duraron menos de 900 horas? (aprox.) Qu porcentaje de dispositivos duraron entre 400 y 1500 horas? (aprox.) Determine entre que valores de duracin se encuentran el 50% de los dispositivos con mayor duracin.

|
0

50%

50%

|
1600

Duracin (hrs)

Mn g.

Mx

Complete la tabla siguiente y realice un grfico adecuado:


Duracin Poca ( < 400 h) Media (400 y menos de 1000 h) Bastante ( > 1000 h) Total Frecuencia Porcentaje

150

100

Cecilia Larran R.

Estadstica Descriptiva

Pgina 31

Ejercicio II-6 Se seleccionaron de un proceso de fabricacin, aleatoriamente 270 ladrillos y se llev a cabo una prueba para determinar la resistencia transversal de stos. Se obtuvieron los siguientes datos: Resistencia (MN/m2) X 1.5 3.5 3.5 4.5 4.5 5.5 5.5 6.5 6.5 7.5 7.5 8.5 8.5 9.5 9.5 10.5 10.5 11.5 11.5 14.5 Construya un grfico adecuado
El histograma es especialmente adecuado para representar tablas de frecuencias en el caso de variables de de nivel por lo menos intervalar (o discretas con un gran nmero de valores observados distintos). Este grfico consiste en una serie de barras adyacentes cuyas superficies son proporcionales a la frecuencia del intervalo sobre el cual se levantan. Si los intervalos son de igual amplitud, los rectngulos sern de altura proporcional a la frecuencia correspondiente. Es decir, si la amplitud del i-simo intervalo es ai y su frecuencia ni la barra deber tener una altura hi que satisfaga:

ni 2 4 24 81 78 51 18 9 2 1

ai hi = kni n hi = k i ai
donde k es cualquier constante, aunque la misma para cada intervalo. ni frecuencia absoluta del intervalo i; hi frecuencia absoluta corregida

Se corrige la frecuencia solamente para graficar el histograma, cuando existen intervalos de distinta amplitud (no es usual intervalos de distinta amplitud) Determine el porcentaje de ladrillos con resistencia inferior a 8,5 MN/m2 Determine el porcentaje de ladrillos con resistencia superior a 5 MN/m2

Cecilia Larran R.

Estadstica Descriptiva

Pgina 32

Ejercicio II-7 1. En un estudio sobre el nivel de ruido en un concierto de rock se toma una muestra de 60 valores, medidos en decibelios y en distintos momentos del concierto. Los datos obtenidos se encuentran el el diagrama tallo-hojas siguiente
NIVEL DE RUIDO Frequency 1,00 3,00 22,00 21,00 11,00 2,00 Stem & 8 8 9 9 10 10 . . . . . . Leaf 3 789 0000111123333334444444 555566677777777889999 00001122234 57

Encuentre: Valor mnimo Valor mximo El % de mediciones inferior a 91 db. El % de mediciones superior a 100 db. Ejercicio II-8
Con el propsito de mejorar el tiempo de entrega desde una embotelladora de refrescos a mquinas vendedoras de una universidad, se ha obtenido 40 datos. 9,45 17,08 44,88 24,45 24,45 37,00 54,12 33,66 31,75 41,95 56,63 37,10 X:Tiempo de entrega en minutos 35,00 25,02 16,86 14,38 11,66 21,65 17,89 69,45 22,13 21,15 10,02 14,88 39,73 44,29 55,12 56,63 9,60 10,30 16,97 29,41 24,35 34,93 17,73 24,45 37,50 46,59 21,84 9,45

Organice los datos en una tabla de frecuencias con igual amplitud y confecciones un grfico adecuado
Tiempo de entrega (min) 9,45 - 19,45 xi 14,45 Frecuencia Absoluta ni 13 Porcentaje

32,5

59,45 - 69,45 Total

64,45

1 40

2,5 100,0

Cecilia Larran R.

Estadstica Descriptiva

Pgina 33

Anda mungkin juga menyukai