C1
Observation
Number of runs about median: Expected number of runs: Longest run about median: Approx P-Value for Clustering: Approx P-Value for Mixtures: 17,0000 15,9333 3,0000 0,6548 0,3452 Number of runs up or down: Expected number of runs: Longest run up or down: Approx P-Value for Trends: Approx P-Value for Oscillation: 17,0000 19,6667 3,0000 0,1168 0,8832
I-1
Control Estadstico de la Calidad con MINITAB Los dos primeros tests de aleatoriedad que se muestran en el grfico anterior se basan en el nmero de rachas localizadas a cada lado de la lnea que representa la mediana. En este contexto, una racha es un conjunto de puntos consecutivos situados a un lado de la mediana. Si los puntos estn unidos por una lnea, una racha termina y otra empieza cuando dicha lnea cruza la mediana. Estos contrastes son sensibles a dos tipos de comportamientos no aleatorios: las mezclas y las estratificaciones. As, si el nmero de rachas es significativamente superior al esperado bajo la hiptesis nula, tendremos indicios de que las observaciones estn mezcladas (provienen de poblaciones diferentes), mientras que si el nmero de rachas es significativamente inferior al esperado tendremos indicios de estratificacin (o agrupamiento) en los datos. Los p-valores que nos muestra el grfico anterior son mayores de 0,05 para ambos tests, por lo que no hay motivos para pensar que los datos estn mezclados o estratificados. A continuacin se muestran otros dos grficos caractersticos de datos con problemas de mezclas y estratificaciones respectivamente:
Datos M ezclados
7 ,2
C2
10
20
30
O bs ervation
N um ber of runs about m edian: Expected num ber of runs: Longest run about m edian: Appr ox P-Value for C luster ing: Appr ox P-Value for M ixtures: 23,0000 16,4839 2,0000 0,9914 0,0086 N um ber of runs up or dow n: Expected num ber of r uns: Longest r un up or dow n: Appr ox P-Value for T rends: Appr ox P-Value for Oscillation: 22,0000 20,3333 3,0000 0,7678 0,2322
D atos E stratificados
7 ,2 8 7 ,1 8 7 ,0 8 g ru p o s d e p u n to s e n u n re a
C3
6 ,9 8 6 ,8 8 6 ,7 8 6 ,6 8 10 20 30
O bs ervation
N um ber of r uns about m edian: Expected num ber of r uns: Longest r un about m edian: Approx P-Value for C luster ing: Approx P-Value for M ixtures: 9,0000 16,0000 6,0000 0,0046 0,9954 N um ber of r uns up or dow n: Expected num ber of r uns: Longest r un up or dow n: Approx P-Value for T r ends: Approx P-Value for Oscillation: 19,0000 19,6667 4,0000 0,3829 0,6171
I-2
Los dos tests restantes se basan en el nmero de rachas crecientes y decrecientes. En este caso, una racha es un conjunto de puntos consecutivos situados en la misma direccin (formando un tramo creciente o decreciente). As, una nueva racha comenzar cada vez que la lnea que une los puntos pase de ser creciente a decreciente o viceversa. Estos contrastes son sensibles a dos tipos de comportamientos no aleatorios: las oscilaciones y las tendencias. Si el nmero de rachas observadas es significativamente mayor que las esperadas (bajo la hiptesis nula), entonces habr indicios de la existencia de oscilaciones en los datos. Si el nmero de rachas observadas es significativamente menor que el esperado, habr indicios de tendencias. Ninguno de los grficos anteriores presentaban indicios de que los datos sufriesen oscilaciones ni que siguiesen tendencias determinadas. A continuacin se muestran dos casos tpicos de datos con problemas de oscilaciones y tendencias:
Demasiadas rachas: la lnea negra oscila arriba y abajo con mucha frecuencia
C4
Observati on
N umber of runs abo ut median: Ex pec ted numbe r of r uns : Longes t ru n a bout med ian : Appr ox P-Value for C lus tering: Appr ox P-Value for Mix tures : 16,0000 16,0000 4,000 0 0,500 0 0,500 0 N umber of runs up or dow n: Ex pec ted nu mb er of r uns : Longes t r un up or dow n: Appr ox P-Va lue for Tr ends : Appr ox P-Va lue for Os c illation: 25,0000 19,6667 3,000 0 0,991 4 0,008 6
C5
Observation
Num ber of runs about median: Expected number of runs: Longest run about median: Approx P-Value for Clustering: Approx P-Value for M ixtures: 12,0000 15,4828 7,0000 0,0936 0,9064 Num ber of runs up or down: Expected num ber of runs: Longest run up or down: Approx P-Value for Trends: Approx P-Value for Oscillation: 16,0000 19,0000 5,0000 0,0862 0,9138
I-3
Control Estadstico de la Calidad con MINITAB Ejemplo Grfico de Rachas: Supongamos que trabajamos para una empresa que produce un tipo de dispositivos capaz de medir los niveles de radiacin en el ambiente. Queremos analizar los datos, obtenidos en un test realizado sobre 20 dispositivos (en grupos de 2), referentes a los niveles de radiacin que cada aparato registr. Los datos estn contenidos en el fichero aleatorio.mtw . Seleccionar Stat > Quality Tools > Run Chart :
I-4
Radiacin
35
25
10
Subgroup Number
Number of runs about median: Expected number of runs: Longest run about median: Approx P-Value for Clustering: Approx P-Value for Mixtures: 3,00000 6,00000 5,00000 0,02209 0,97791 Number of runs up or down: Expected number of runs: Longest run up or down: Approx P-Value for Trends: Approx P-Value for Oscillation: 5,00000 6,33333 3,00000 0,13455 0,86545
El test para la estratificacin es significativo al nivel 0,05 (el p-valor asociado es de 0,02). Por tanto, hemos de concluir que hay indicios de que nuestro proceso se est viendo afectado por causas especiales, las cuales deberamos investigar antes de seguir. La estratificacin de los datos suele ser sntoma de problemas en el muestreo o en los procesos de medicin.
GRFICOS DE PARETO_____________________________________________
Un grfico de Pareto es un diagrama de barras en el que el eje horizontal representa categoras de inters, generalmente causas de fallos o defectos (los cuales pretendemos eliminar). Las barras se ordenan de mayor a menor, lo que nos permite diferenciar aquellas pocas causas importantes de las muchas causas intranscendentes. El grfico contiene tambin una lnea de porcentajes acumulativos, la cual nos ayuda a determinar la contribucin de cada categora al nmero total de fallos o defectos. Este tipo de grficos resulta muy til en la identificacin de aquellas causas cuya eliminacin es prioritaria por suponer un elevado porcentaje del total de fallos o defectos. Ejemplo Pareto: Supongamos que nuestra empresa fabrica estanteras con componentes metlicos y de madera. Realizamos un control final en el cual algunas estanteras son retiradas antes de comercializarse debido a araazos, astillas, dobleces, o abolladuras. Nuestra intencin es realizar un grfico de Pareto que nos permita identificar cul de los defectos anteriores es el principal causante de estanteras retiradas. Usaremos los datos contenidos en el archivo controlfinal.mtw . Seleccionar Stat > Quality Tools > Pareto Chart : Rellenamos los campos como se indica a continuacin: I-5
100
4 3 2 1 0
D efec t
Count Pe rce n t Cum %
4 5 0 ,0 5 0 ,0
2 2 5 ,0 7 5 ,0
1 1 2 ,5 8 7 ,5
1 1 2 ,5 1 0 0 ,0
A partir del grfico anterior podemos concluir que un 75% de las estanteras retiradas muestran defectos o bien de araazos o bien de astillas, mientras que slo un 25% de las estanteras son retiradas a causa de dobleces o abolladuras. Ello nos da una pista sobre qu tipos de defectos cabe evitar de forma prioritaria: deberemos centrar nuestros esfuerzos en eliminar las posibles causas de araazos y astillas.
Percent
I-6
Count
D ia g ra m a C a u s a -E fe c to p a ra E n c u e s ta s P ro fe s o ra d o
Me a s u re m e n ts
E x a c t it u d
Ma te ria ls
F o rm u la rio s
Me n
E s t u d ia n t e s
L p ic e s Tie m p o
E n c u e s t a d o re s
H o ja s re s u m e n
P ro f e s o re s
P ro ce s o n o a d e cu a d o
H um edad I m p re s o ra s P ro c e s a m ie n t o P ro g ra m a s C a lu ro s o O rd e n a d o re s R u id o s o I n s t ru c c io n e s Es c ner
E n viro n m e n t
Me th o d s
Ma c h in e s
I-7
M u lti-V a ri C h a rt fo r R e s is te n c ia B y T ie m p o P ro c e - T ip o A le a c i
T ie m p o P ro c e
100 23,5 150 200 22,5
Resistencia
21,5
20,5
19,5
18,5
17,5
15
18
21
T ip o Ale a c i
A partir del grfico anterior se observa que hay indicios de interaccin entre el tipo de aleacin y la duracin temporal del proceso: en el caso de la aleacin de tipo 15, la mayor resistencia se obtiene para procesos de 100 minutos; en el caso de la aleacin de tipo 18, la obtendremos para procesos de 150 minutos; finalmente, en el caso de aleaciones de tipo 21, los procesos de 200 minutos son los que posibilitan una mayor resistencia. I-8
GRFICOS DE SIMETRA____________________________________________
Los grficos de simetra nos servirn para determinar si las observaciones muestrales obtenidas provienen o no de una distribucin simtrica. Varios mtodos estadsticos suponen que los datos provienen de una distribucin normal, aunque en muchos casos este supuesto no es imprescindible siempre que la distribucin poblacional sea simtrica. Tambin es usual el supuesto de simetra en los mtodos no paramtricos. Para construir un grfico de simetra se forman pares ordenados de observaciones: el primer par estar formado por las dos observaciones, una superior a la mediana y la otra inferior, ms cercanas a la mediana; el segundo par consistir de las dos observaciones, una superior a la mediana y la otra inferior, ms cercanas a la mediana de entre las restantes (exceptuando las ya consideradas); etc. Para cada par de observaciones consideramos un punto cuya primera coordenada ser la distancia entre la observacin superior a la mediana y la mediana, y cuya segunda coordenada ser la distancia entre la observacin inferior a la mediana y la mediana. Obtendremos as una nube de puntos. Si los datos siguen una distribucin simtrica, las coordenadas X e Y sern aproximadamente igual para todos los puntos, por lo que stos deberan seguir una lnea recta de 45. As, cuanto ms simtrica sea la distribucin, tanto ms se aproximarn los puntos a la mencionada lnea. Notar que, incluso para observaciones que se distribuyan de forma normal, es de esperar encontrar puntos que se siten por encima y por debajo de la recta. Lo importante, pues, es comprobar si los puntos divergen sustancialmente o no de dicha recta. Observando estos grficos ser posible detectar distintos tipos de asimetras: si los puntos divergen por encima de la lnea (coordenada Y mayor que la X), la distribucin estar sesgada a la izquierda; por otro lado, si los puntos divergen por debajo de la lnea (coordenada X mayor que la Y), la distribucin estar sesgada a la derecha. Finalmente, la existencia de puntos divergentes en el extremo superior derecho del grfico (donde las distancias son grandes) denotar cierto grado de asimetra en las colas de la distribucin. Conviene recordar que, para poder extraer conclusiones sobre la simetra o asimetra de una distribucin, ser necesario disponer de un nmero suficientemente grande de observaciones (al menos 25 o 30). Ejemplo Grfico de Simetra: Queremos comprobar si los datos del archivo simetra.mtw siguen una distribucin aproximadamente simtrica: Seleccionar Stat > Quality Tools > Symmetry Plot: Rellenamos los campos como se indica a continuacin:
I-9
S y m m e try P lo t fo r F a llo s
20
10
0 0 1 2
-1 ,5
0 ,0
1 ,5
3 ,0
U p p e r D is ta n ce to Me d ia n
El grfico anterior nos muestra una distribucin bastante simtrica. Observar la existencia de puntos por encima de la lnea en la esquina superior derecha, lo que nos indica que la cola izquierda es ligeramente ms larga que la derecha. Los puntos del grfico no divergen de la lnea, por lo que el sesgo a la izquierda no es muy acentuado (como se observa en el histograma adjunto).
I - 10