Metodos Alternativos de Controle Estatistico de Processos Univariados

Mtodos alternativos de controle estatstico de processos univariados
Jos Ivo Ribeiro Jnior (UFV) jivo@dpi.ufv.br Thiago da Costa Gonalves (FINOM) tcostagoncalves@gmail.com
Jos Ivo Ribeiro Jnior e Thiago da Costa Gonalves
No controle estatstico de processos, os grficos de controle de Shewhart, EWMA e CUSUM tabular se destacam como os principais mtodos do monitoramento de variveis. Porm, o sucesso de sua utilizao est diretamente relacionado s escolhas corretas dos valores das constantes envolvidas nas suas construes, que esto diretamente relacionadas s estimativas dos limites de controle e das incidncias dos alarmes falso e verdadeiro. Desse modo, com o objetivo de propor a utilizao dos mtodos rede neural artificial e regresso logstica em substituio aos grficos de controle, foram simulados quatro conjuntos de dados normalmente distribudos, cada um formado por 544 amostras com observaes individuais, mdia 0=1.000 e desvio-padro 0 = 100. Um com observaes independentes ou sem a presena da autocorrelao de primeira ordem (1 = 0) e trs com os seguintes valores de 1: 0,3; 0,6; e 0,9. Neles, foram realizadas diferentes imposies, com o objetivo de obter, alm dos pontos sob controle estatstico (0 = 1.000 e 0 = 100), pontos fora de controle (1 = 0+0 e 0 = 100), com valores de iguais a 1, 2 e 3, inseridos no meio e final de cada um deles. As redes neurais artificiais e a regresso logstica substituem, de forma eficiente, os melhores tipos de grficos de controle, na sinalizao de alarmes verdadeiros dos pontos fora de controle estatstico situados no meio ou no final do conjunto de dados, em diferentes distncias da mdia de controle e distribudos de forma independente ou no, mantendo em nveis baixos, as incidncias dos falsos alarmes. Palavras-chave: Rede neural artificial, regresso logstica e grficos de controle.
RESUMO
Alternative methods for the statistical control of univariate processes

The statistical control of a process is mainly conducted with the use of Shewhart, EWMA and CUSUM tabular control charts. Hence, a successful implementation of such methods is directly related to correct choice of constant values used in these methods, which in turn relates directly to the estimation of control limits and also to false and true alarm incidence rates. We conducted a simulation study to propose the use of neural networks and logistic regression as alternatives methods to control charts. We simulated four data sets, each one with n = 544 individual sample points from the normal distribution with mean 0 = 1.000 and standard-deviation 0 = 100. For one data set had we considered independent and identically distributed observations with no first order autocorrelation (1 = 0), and for the other three we simulated autocorrelations such that 1: 0,3; 0,6; e 0,9. We imposed constraints to these data sets such that some observations were under control (0 = 1.000 e 0 = 100), and others were not under control (1 = 0+0 e 0 = 100), for values equal to 1, 2 and 3. Observations out of control were randomly inserted at the middle and end of the process. We concluded that both, the artificial neural networks and the logistic regression, showed to be efficient alternatives to the most used control charts. They both yielded true alarms for out of control points located in the middle and at the end of the process, as well as resulted in low incidence rates of false alarms. Such results were observed for simulated data points at different distances from the control mean value and for data points under independence or we first order autocorrelations. Keywords: Artificial neural network, logistic regression and control charts.
ABSTRACT
Revista Eletrnica Produo & Engenharia, v. 2, n. 1, p. 85-95, jan./jul. 2009
85
1. Introduo
O controle estatstico de processos (CEP) propicia o monitoramento destes e sinaliza a necessidade de atuar ou no sobre eles, a fim de garantir que os resultados possam estar de acordo com os padres preestabelecidos. Para esse monitoramento, destacamse os grficos de controle (GC). Quando causas especiais de variao, alm das aleatrias, estiverem presentes no processo, pelo menos um ponto referente aos dados coletados ser plotado fora dos limites nos GCs. J quando apenas causas aleatrias estiverem atuando, todos os pontos se encontraro aleatoriamente dispersos entre os dois limites (MONTGOMERY, 2004). De acordo com Costa et al. (2004), a simplicidade para a construo dos GCs implicou, muitas vezes, aplicaes no coerentes com um monitoramento adequado ao processo. Eles relataram que a eficincia dos GCs est relacionada rapidez de deteco das causas especiais, mas detectadas de acordo com estimativas precisas dos limites de controle obtidos em funo das estimativas da mdia e do desvio-padro do processo. As redes neurais artificiais (RNAs) e a regresso logstica (RL) tambm podem ser utilizadas para classificar se o processo, naquele exato momento em que ocorreu a coleta do dado, estar ou no sob controle estatstico, porm sem que haja a necessidade de serem estimados os limites de controle. Essa estratgia de anlise estatstica abre a possibilidade de monitorar o processo com base em um padro de qualidade definido, que pode ser estipulado a partir de dados histricos que acarretaram resultados satisfatrios ou a partir de dados simulados em funo de uma especificao estabelecida no processo. Portanto, o trabalho teve por objetivo comparar trs mtodos (GCs, RNAs e RL), por meio de um estudo por simulao de dados, com base nas incidncias dos alarmes falso e verdadeiro e na eficincia do monitoramento de uma caracterstica de qualidade que se apresenta com pontos sob e fora de controle estatstico, em processos independentes e autocorrelacionados.
2. Reviso de literatura 2.1. Grficos de controle

O GC permite visualizar o comportamento de uma caracterstica de qualidade e suas flutuaes em torno
de um valor mdio e distinguir entre os dois tipos de causas de variao. Basicamente, uma representao de determinado estimador, que consiste de uma linha mdia (LM) e dos limites inferior (LIC) e superior de controle (LSC), em funo das diversas estratificaes temporais ou espaciais possveis de serem estabelecidas (MONTGOMERY; RUNGER, 2003). Quando a distribuio dos pontos aleatria e ocorre entre os limites, o processo estar sob controle estatstico, ou seja, somente causas aleatrias de variao estaro atuando. Consequentemente, a mdia (0) e o desvio-padro (0) de controles se mantero estveis ao longo do tempo, cuja caracterstica de qualidade apresentar variabilidade que poder ser representada por uma distribuio de probabilidades. Caso contrrio se houver pontos alm dos limites de controle ou se padres no aleatrios forem identificados, o processo ter a influncia de causas especiais, alm das aleatrias, que o tornam de comportamento no previsvel ou fora de controle estatstico. Isso acarretar alteraes significativas na mdia e, ou, no desvio-padro, e, portanto, uma ao imediata dever ser realizada para retornar o processo condio desejada (MONTGOMERY, 2004). Os GCs por variveis so utilizados para caractersticas de qualidade que podem apresentar infinitos valores dentro de um intervalo contnuo. Entre eles so citados os de Shewhart, mdia mvel exponencialmente ponderada (EWMA) e somas acumuladas (CUSUM tabular). Independente do tipo de GC, algumas pressuposies devem ser satisfeitas para validar a sua utilizao e os seus resultados. De acordo com Alwan e Roberts (1995), as observaes de uma varivel normal devem ser idd independentes e identicamente distribudas. Atienza (1997), Faltin et al. (1997) e Montgomery (2004) sugeriram ajustar aos dados autocorrelacionados um modelo de sries temporais do tipo ARIMA (mdia mvel autorregressiva integrada) e aplicar os grficos de controle aos resduos aproximadamente independentes (rudos brancos) gerados pelo modelo. O GC da medida individual de Shewhart utilizado para monitorar uma caracterstica de qualidade Y, com mdia ( 0) e desvio-padro de controles ( 0), apresenta as seguintes equaes: LIC = 0 k0; LM = 0; e LSC = 0 + k0, em que k = nmero de desviospadro de afastamento em relao LM.
86
Os valores de k so iguais a z/2, ou seja, aos valores de Z da distribuio normal padronizada que deixam uma probabilidade de /2 nas extremidades das duas caudas. Portanto, as probabilidades (1) de ocorrerem valores aleatrios da caracterstica de qualidade dentro dos intervalos compreendidos pelos LIC e LSC calculados em funo dos valores de k iguais a 3, 2 e 1, so iguais a 0,9973 ( = 0,0027), 0,9545 ( = 0,0455) e 0,6827 ( = 0,3173), respectivamente. O GC EWMA uma boa alternativa de Shewhart, quando se est interessado em detectar pequenas mudanas na mdia do processo. Nele, a deciso sobre o processo baseada na informao de cada amostra com percentual de peso das anteriores, conforme as revises apresentadas por King (1995), Costa et al. (2004), Montgomery (2004) e Ribeiro Jnior et al. (2006). Os valores da estatstica Wi plotados no GC EWMA da medida individual so calculados atravs da seguinte expresso: Wi = yi + (1)Wi-1, para i = 1, 2, ..., m, em que: m = nmero de amostras; = peso da amostra (0<1); yi = valor da caracterstica de qualidade Y na amostra i; e W0 = 0. medida que tende para 1, o GC EWMA se aproxima do de Shewhart, em que, para =1, tem-se Wi=yi. A LM e os limites de controle de cada amostra i, de acordo com a mdia ( 0) e o desvio-padro de controles ( 0), so dados por: LICi = 0 kWi; LM = 0; e LSCi = 0 + kWi, em que: k = deslocamento aleatrio em torno da LM em nmero de desvios-padro; ; e i = nmero da amostra i. Se os valores da estatstica W i plotados permanecerem entre os limites inferior e superior de controle e de forma aleatria, ento se tem o processo sob controle estatstico. Caso contrrio, o processo ser considerado como fora.
O GC CUSUM tabular tambm utiliza informaes de diversas amostras para decidir sobre o estado do processo. Ao plotar a soma acumulada dos desvios dos valores da caracterstica de qualidade em relao mdia de controle nas sucessivas amostras, ser possvel conseguir maior rapidez na sinalizao de pequenos desajustes. Na literatura, so apresentadas algumas revises que relatam a importncia do GC CUSUM tabular dentro do CEP, como: King (1995), Montgomery e Runger (2003), Costa et al. (2004), Montgomery (2004) e Ribeiro Jnior et al. (2006). Na CUSUM tabular so estabelecidas a SH(i) (CUSUM unilateral superior) e a SL(i) (CUSUM unilateral inferior) at a amostra i. Assim, aps o clculo da LM e dos limites de controle, devem-se representar os m valores de SH(i) e SL(i) no grfico e verificar se o processo pode ser considerado sob controle ou se existem pontos fora dos limites. Se o processo permanecer sob controle, ento os valores das CUSUMs tabulares ficaro em torno de zero. Caso contrrio, se eles deslocarem para cima ou para baixo, ento ocorrero valores cada vez mais positivos ou negativos, com tendncia deteco de causas especiais. Os valores de SH(i) e SL(i) acumulam desvios que so maiores do que K (valor de referncia), com ambas as quantidades reajustadas para zero, caso se tornarem negativos, sendo os valores iniciais de SH(0) e SL(0) iguais a zero. Se pelo menos um SH(i) ou SL(i) exceder o valor de H (intervalo de deciso), ento o processo ser considerado como fora de controle, sendo LIC = H, LM = 0 e LSC = H. Para a construo do GC CUSUM tabular, os valores de SH(i) recebem sinais positivos e os de SL(i), negativos. As CUSUMs tabulares da medida individual em relao mdia de controle (0) so calculadas por meio das seguintes expresses: SH(i) = mximo [0; yi (0 + K) + SH(i1)], para i = 1, 2, ..., m; e SL(i) = mximo [0; (0 K) yi + SL(i1)], para i = 1, 2, ..., m. Os valores de K e H obtidos em funo do desviopadro de controle (0) so dados por: K = k*0; H = h*0, em que: k* =
= valor padronizado de K; 2
= deslocamento especial em torno da LM em nmero de desvios-padro; e h* = valor padronizado de H.
87
Os valores mais usuais de k* esto entre 0,25 (=0,5) e 1,5 (=3), e os de h* encontram-se entre 3 e 6. Para o monitoramento da mdia pelos GCs de Shewhart, EWMA e CUSUM tabular, considere as seguintes hipteses H0 e H1 mutuamente exclusivas: H0: Y = 0 (processo sob controle estatstico); H1: Y 0 (processo fora de controle estatstico). Se a hiptese H 0 for verdadeira e rejeitada, comete-se o erro (alarme falso). No entanto, se H0 for falsa e aceita, comete-se o erro (falta de deteco). O representa a probabilidade de erroneamente considerar-se o processo fora de controle quando, na verdade, ele est (H0 verdadeira). A consequncia prtica de intervir no processo quando ele esta isento de causas especiais. J o a probabilidade de erroneamente considerar-se o processo sob controle quando ele est fora (H1 verdadeira). Isso implica em no intervir no processo quando ele est sob influncia de causas especiais. Entretanto, o alarme verdadeiro ou poder do grfico (Pd = 1) definido como a probabilidade de deteco, ou seja, de rejeitar H0 falsa. De acordo com Costa et al. (2004), pode-se verificar a eficincia de um GC com base nas incidncias dos alarmes falso e verdadeiro. Quando a hiptese H1 verdadeira (processo fora de controle), o ideal seria que o primeiro ponto plotado se situasse fora dos limites de controle. Contudo isso nem sempre ocorre, principalmente se o deslocamento () sofrido pela mdia de controle (0) for pequeno. Essa variao especial em nmero de desvios-padro (0) implicar mdia, acima (1 = 0+0) ou abaixo (2 = 00) da de controle, que se quer sinalizar como fora de controle. Se 1 e 2 apresentarem a mesma diferena em relao a 0 para uma varivel que segue distribuio normal, ento o deslocamento pode ser definido por:
NMA
>0
1 = nmero mdio de amostras at Pd
o sinal verdadeiro. Assim, um grfico de controle bem planejado aquele que apresenta, em termos tericos, baixo alarme falso, alto poder, alto NMA=0 e baixo NMA>0, em funo do valor de preestabelecido. Nesse caso, recomendase escolher valores de maiores do que 2,5, no incio do controle da qualidade, entre 1,5 e 2,5 nas fases intermedirias e, menores do que 1,5 quando o controle se encontrar numa fase mais adiantada, em termos de reduo da variabilidade do processo. Assim, no incio so controladas grandes variaes devidas s causas especiais e, com o passar do tempo, busca-se detectar efeitos cada vez menores dessas possveis causas, quando houver necessidade. Portanto, a primeira escolha de um grfico de controle com baixa incidncia de alarme falso, que trar confiabilidade no monitoramento do processo, j que os pontos fora de controle no sero, na grande maioria das vezes, devidos s causas aleatrias. Caso haja necessidade de aumentar a qualidade do processo e, consequentemente, de diminuir a sua variabilidade, ser importante aumentar a sensibilidade do grfico pelo incremento do seu poder em detectar novas causas especiais que eram anteriormente detectadas como aleatrias. No entanto, o aumento do Pd no poder acontecer em funo do aumento do , mas mantendoo em nveis baixos e aceitveis.
2.2. Rede neural artificial

De acordo com Mello (2004), RNA uma tcnica de inteligncia artificial utilizada para simular, de maneira simplificada, o funcionamento do crebro humano, sendo capaz de reconhecer padres, extrair regularidades e detectar relaes em um conjunto de dados aparentemente complexo. J para Haykin (2001) ela um processador distribudo de forma paralela que tem a funo de armazenar conhecimento experimental e de torn-lo disponvel para o uso. A RNA formada pela combinao de diversos neurnios organizados nas camadas de entrada, intermediria e de sada. As entradas simulam uma rea de captao de estmulos que pode ser conectada por muitos neurnios e resultar em uma srie de sadas. Na camada intermediria feita a maior parte do processamento por meio de conexes, que tm a funo
1 0 0 .
De acordo com os alarmes falso e verdadeiro, possvel obter o nmero mdio de amostras at o sinal (NMA), que segue uma distribuio geomtrica de parmetro p. Se a hiptese H0 for verdadeira (=0), ento p=. Caso contrrio, se H1 for verdadeira (>0), ento p = Pd. Como a mdia da distribuio geomtrica de parmetro p igual a 1/p, ento se tm:
NMA
=0
= nmero mdio de amostras at
o sinal falso; e
88
de transformar um sinal de sada de um neurnio em um sinal de entrada do outro ou em sinal de sada da rede (TAFNER, 2008). De acordo com Haykin (2001), o neurnio artificial representa uma regio onde as informaes so processadas, sendo constitudo por trs elementos bsicos: pesos sinpticos e as funes de soma e de ativao. As conexes entre os neurnios, denominadas pesos sinpticos, so responsveis pelo armazenamento das informaes e pela definio do efeito que a sada de um neurnio exerce sobre a entrada do seguinte. A funo de soma processa os estmulos ponderados pelos respectivos pesos sinpticos. J a de ativao, tambm chamada de funo de transferncia ou restritiva, limitada amplitude do intervalo do sinal de sada do neurnio, geralmente no intervalo de 0 a 1 ou de -1 a 1. As funes do tipo sigmide so as mais utilizadas, por serem contnuas, monotnicas, no lineares e facilmente diferenciveis. A RNA deve ter a capacidade de generalizao, ou seja, ela deve ser capaz no apenas de classificar as entradas para as quais ela recebeu treinamento, mas tambm de generalizar e classificar as entradas que no foram apresentadas. Isso devido a um processo de aprendizagem, que propicia a esta o encontro de respostas mesmo quando os dados disponveis para as entradas estiverem incompletos. Portanto, a habilidade de aprender em seu ambiente de treinamento, por meio de um processo iterativo de ajustes aplicados aos seus pesos sinpticos, a sua propriedade mais importante (TAFNER, 2008). De acordo com Haykin (2001), a aprendizagem supervisionada caracterizada pela utilizao de um agente externo que indica RNA a resposta desejada para o padro de entrada. O ajuste dos pesos sinpticos ocorre quando o sistema compara a sada com a resposta desejada e previamente conhecida, cujo modelo se caracteriza pela disponibilidade de um conjunto de treinamento composto por dados de entrada previamente classificados. O perceptron um modelo de RNA utilizado para a classificao de padres, sendo constitudo por apenas uma camada de neurnios. Ele adota uma soma ponderada das suas entradas ou sinapses, enviando o resultado de uma unidade positiva se a soma for superior a determinado limiar. Caso contrrio, o valor ser igual a zero ou a uma unidade negativa, dependendo da funo de ativao escolhida na modelagem da rede. J o perceptron multicamada (backpropagation) possui uma ou mais camadas de neurnios intermedirios entre as camadas
de entrada e sada e um conjunto de equaes bem definidas e utilizadas para a correo dos pesos sinpticos, por meio da retropropagao do erro estimado pela diferena entre os resultados da sada e desejado (FAUSETT, 1994). De acordo com Frana (2005), as RNAs podem ser utilizadas em reas relacionadas manufatura, como: planejamento e controle de processos, dimensionamento de sistemas, tomada de deciso operacional e gerenciamento de robs.
2.3. Regresso logstica

Quando a varivel dependente Y binria, ou seja, quando apresenta apenas dois nveis (Y = 1 ou Y = 0) e estudada em funo de uma varivel independente e quantitativa X, a equao de regresso definida por: g(pi) = 0 + 1xi + ei, para i = 1, 2, ..., n, em que: g(pi) = funo de ligao; pi = probabilidade de Y=1 na observao i; 0 = constante da regresso; 1 = coeficiente de regresso; x i = valor da varivel independente X na observao i; e ei = erro associado observao i. A funo de ligao g(pi) garante que a resposta seja expressa em termos de probabilidade no intervalo entre zero e 1, sendo a do modelo logit definida por:
i logit (pi) = ln 1 p . i
Assim, na regresso logstica aplica-se a estimao por mxima verossimilhana depois de a varivel dependente Y ter sido transformada em uma varivel logit. Dessa forma, a regresso logstica estima a probabilidade de certo evento ocorrer com base nas mudanas na razo dos logaritmos das variveis dependentes, em vez de se basear nas mudanas da varivel dependente por si s, como ocorre na regresso linear simples. No modelo de regresso logstica binria com uma nica varivel independente e com funo de distribuio logstica, a probabilidade de um elemento amostral pertencer ao primeiro grupo obtida por:
P(Y = 1/x i ) =
e 0 + 1x i . 1 + e 0 + 1x i
89
Consequentemente, a probabilidade de pertencer ao segundo obtida por: P(Y=0/xi) = 1 P(Y=1/xi). A regresso logstica binria pode ser aplicada quando o principal objetivo for identificar o grupo ao qual um elemento amostral pertence, como: prever o sucesso ou o fracasso de um novo produto, determinar a categoria de risco de crdito de uma pessoa ou prever se uma empresa ter sucesso ou no. Em cada caso, os elementos amostrais so classificados em dois grupos, cujas incluses podem ser previstas ou explicadas por um conjunto de variveis independentes. Se P(Y = 1/xi) for igual ou superior a 0,5, ento o elemento amostral pertencer ao grupo 1; caso contrrio, pertencer ao grupo 2 (HAIR JUNIOR et al., 2005). O teste de Hosmer-Lemeshow avalia a qualidade de ajuste, comparando as frequncias observadas com as esperadas, por meio da distribuio de qui-quadrado (HOSMER; LEMESHOW, 1989).
Para p=0, as primeiras 144 amostras das 436 utilizadas no treinamento da RNA estavam sob controle estatstico (0 = 1.000 e 0 = 100), seguidas de 144 amostras fora de controle (1 = 0+0 e 0 = 100) e de mais 144 sob controle (Figura 1).
Figura 1 - As primeiras observaes foram simuladas com mdia 0, seguidas de verificaes com mdias 1 e 0. Para p = 1, foram 288 amostras sob controle estatstico, seguidas de 144 fora (Figura 2).
3. Material e mtodos 3.1. Simulao dos dados

Os dados de uma varivel aleatria normal Y foram simulados para 544 amostras com observaes individuais e com parmetros de mdia (0 = 1.000) e desvio-padro ( 0 = 100), para processos independentes e autocorrelacionados com o auxlio do software estatstico R. No total, foram realizadas quatro simulaes de 544 dados: uma com observaes independentes ou sem a presena da autocorrelao de primeira ordem (1=0) e trs com os seguintes valores de 1: 0,3; 0,6; e 0,9. Das 544 amostras, 436 foram utilizadas para o treinamento da RNA, j as 108 restantes o foram para realizar as comparaes entre os GCs de Shewhart, EWMA e CUSUM tabular, RNA e RL. Em cada conjunto de dados simulado, foram realizadas diferentes imposies, com o objetivo de obter, alm dos pontos sob controle estatstico com mdia 0 = 1.000 e desvio-padro 0 = 100, pontos fora de controle com mdia 1 = 0+0 e desvio-padro 0 = 100, para valores de iguais a 1, 2 e 3, inseridos no meio e no final de cada um deles, sendo as duas posies (p) definidas como 0 e 1, respectivamente. Portanto, foram gerados 24 conjuntos com 544 amostras de observaes individuais oriundas do fatorial 4x3x2, cujos nveis correspondem, respectivamente, aos seguintes fatores: 1, e p.
Figura 2 - As primeiras observaes foram simuladas com mdia 0, seguidas de verificaes com mdia 1. Do mesmo modo, as 108 amostras destinadas s comparaes dos mtodos apresentaram, para p = 0, 36, amostras sob controle estatstico seguidas de 36 fora e de 36 sob e, para p = 1, 72 amostras sob controle seguidas de 36 fora.
3.2. Grficos de controle

Nas construes dos GCs de Shewhart, EWMA e CUSUM tabular, foram utilizados valores das constantes relacionados com as melhores eficincias, de acordo com Souza et al. (2008). Em todos eles, os parmetros de mdia e desvio-padro foram iguais a 1.000 e 100, respectivamente. Para o GC da medida individual de Shewhart, os limites de controle foram situados a 1,96 (k) desvios-padro da LM, cujo intervalo est associado a 100(10,05)% de confiana. Para o EWMA, foram construdos dois grficos: EWMA1 (k = 1,96 e = 0,20)
90
e EWMA2 (k = 1,96 e = 0,40). J para o CUSUM tabular utilizou-se k* = 1 e h* = 5. De acordo com o estudo de simulao realizado por Souza et al. (2008), k = 1,96 proporciona estimativa do alarme falso igual a aproximadamente 0,05 para os GCs de Shewhart e EWMA. J as estimativas dos alarmes verdadeiros para n = 1 e k = 1,96 dos GCs de Shewhart so iguais a 0,38 ( = 1), 0,51 ( = 2) e 0,77 ( = 3). O EWMA1 tem as seguintes estimativas: 0,80 ( = 1) e 1 (2), enquanto o EWMA2, 0,69 ( = 1) e 1 (2). J as estimativas dos alarmes falso e verdadeiro do GC CUSUM tabular so, respectivamente, iguais a 0,0002 e 0,97 (1). Nos conjuntos de dados com a presena de autocorrelao, foram ajustados modelos de sries temporais do tipo ARIMA de acordo com a metodologia de Box e Jenkins revisada por Moretin e Toloi (2006), cujos GCs foram construdos com os rudos brancos aproximadamente independentes. Todos os GCs e os ajustes dos modelos de sries temporais ARIMA foram feitos no software Minitab para os 24 conjuntos de dados, com observaes individuais.
O nmero de ciclos de treinamento foi fixado em 1.250 pocas, para que o nmero de vezes que o conjunto de treinamento fosse apresentado RNA no se tornasse excessivo, o que poderia levar perda do poder de generalizao (overfitting). No entanto, no deve ser demasiadamente reduzido, a fim de no atingir o seu melhor desempenho (underfitting).
3.4. Regresso logstica

A regresso logstica binria foi utilizada para verificar a relao entre a classificao do processo sob (Y = 0) ou fora (Y = 1) de controle estatstico, em funo dos valores observados da caracterstica de qualidade simulada, aqui denominada varivel independente X. Para avaliar a qualidade do ajuste do modelo logit foi aplicado o teste de Hosmer-Lemeshow, no nvel de 5% de significncia. O modelo logit foi realizado no software Minitab 14, cujas amostras com probabilidades menores do que 0,5 foram classificadas como pertencentes ao grupo 1 (sob controle estatstico) e as com probabilidades superiores ou iguais a 0,5, como pertencente ao grupo 2 (fora).
3.3. Rede neural artificial

A RNA escolhida para o treinamento e validao dos dados deste trabalho foi a perceptron de mltiplas camadas (algoritmo backpropagation), que possibilita boa classificao de padres e vrias funes de treinamento j implementadas no software MatLab. Neste trabalho foram testadas 64 diferentes arquiteturas de RNA, oriundas das combinaes entre quatro funes de treinamento (traingdx, traingda, trainlm e trainbr), dois tamanhos de camadas intermedirias (3 e 4) e oito tamanhos de neurnios por camada (1, 5, 7, 11, 14, 17, 20 e 27). Para a escolha de apenas uma das arquiteturas testadas, foi avaliado o desempenho de acordo com o menor erro mdio quadrtico (MSE), definido por: em que: yobs = valor observado na sada da RNA; e yesp = valor esperado na sada da RNA. A funo de ativao (transferncia) entre as camadas foi a sigmide, uma vez que os dados de entrada e sada da rede foram normalizados entre os valores 0 e 1. No MatLab, a funo de transferncia tansig implementa essa funo de ativao.
3.5. Medidas de comparao

Aps aplicar cada um dos seis mtodos (m) propostos (quatro GCs, RNA e RL) aos 24 conjuntos de dados, foram realizadas comparaes baseadas nas incidncias dos alarmes falso e verdadeiro sobre a classificao dos valores observados sob ou fora de controle estatstico. Para a estimativa do alarme falso, foi contabilizada a razo entre o nmero de pontos fora de controle estatstico para = 0 (NPFC = 0) em relao ao nmero total de pontos sob controle estatstico (NTP=0) em cada conjunto de dados, sendo dada por:
NPFC =0 NTP =0
Para a estimativa do alarme verdadeiro, foi, no entanto, contabilizada a razo entre o nmero de pontos fora de controle estatstico para >0 (NPFC>0) em relao ao nmero total de pontos fora de controle estatstico (NTP>0) em cada conjunto de dados, sendo dada por:
91
NPFC >0 Pd = NTP >0

Ao final, foi realizada a anlise de varincia de um experimento com quatro fatores (1, , p e m), segundo o delineamento inteiramente casualizado com trs repeties por tratamento, cujo teste F foi aplicado aos efeitos principais e s interaes duplas do fatorial 4x3x2x6 referentes aos respectivos nveis dos fatores estudados. Posteriormente, de acordo com as significncias das interaes, foi aplicado o teste de Duncan aos mtodos, para os alarmes falso e verdadeiro. A anlise de regresso em funo de 1 (0; 0,3; 0,6; e 0,9), (1, 2 e 3) e p (0 e 1) foi realizada somente no alarme verdadeiro, cujos coeficientes foram testados pelo teste t. Todas essas anlises foram feitas no software Mintab a 5% de significncia.
necessitam de correes difceis, caras e demoradas, situadas no meio ou no final do processo. Tabela 1 - Mdias dos alarmes falsos dos mtodos dos pontos fora de controle estatstico situados no meio (p=0) e no final (p=1) do conjunto de dados Mtodo GC de Shewhart EWMA1 EWMA2 CUSUM tabular RNA RL p=0 0,0067 c 0,0858 b 0,0228 c 0,5493 a 0,0321 c 0,0218 c p=1 0,0054 b 0,0243 b 0,0124 b 0,0643 a 0,0281 b 0,0240 b
Mdias seguidas pela mesma letra na coluna no diferem entre si, pelo teste de Duncan (P>0,05).
4. Resultados e discusso
A menor estimativa do MSE (0,33) ocorreu na arquitetura de RNA com trs camadas, sendo uma intermediria, e funo de ativao traingdx. Portanto, esta foi a utilizada na comparao com os demais mtodos propostos.
Para = 1, os mtodos GC de Shewhart, EWMA1, EWMA2, RNA e RL apresentaram as menores (P<0,05) mdias dos alarmes falsos. Entre eles, somente GC de Shewhart, EWMA2, RNA e RL apresentaram as menores (P<0,05) mdias para = 2 e = 3 (Tabela 2). Tabela 2 - Mdias dos alarmes falsos dos mtodos dos pontos fora de controle estatstico, inseridos com valores de deltas iguais a 1, 2 e 3 nos conjuntos de dados Mtodo GC de Shewhart EWMA1 EWMA2 CUSUM tabular RNA RL =1 0,0075 b 0,0404 b 0,0180 b 0,3006 a 0,0407 b 0,0351 b =2 0,0050 c 0,0605 b 0,0178 c 0,3160 a 0,0232 c 0,0232 c =3 0,0057 c 0,0642 b 0,0169 c 0,3039 a 0,0094 c 0,0105 c
4.1. Alarme falso

O alarme falso sofreu efeito (P<0,05) de todos os quatro fatores (1, , p e m) e das seguintes interaes duplas: 1m, p, m e pm. Portanto, com o objetivo de comparar as mdias dos alarmes falsos entre os mtodos, procedeu-se aos desdobramentos das interaes duplas significativas, por meio da aplicao do teste de Duncan dentro de cada nvel de 1, e p. Para pontos fora de controle estatstico situados no meio (p = 0) do conjunto de dados, os mtodos GC de Shewhart, EWMA2, RNA e RL apresentaram as menores (P<0,05) mdias, sendo, portanto, indicados nessa condio. J naqueles situados no final (p = 1), os melhores (P<0,05) mtodos foram os quatro anteriores e o EWMA1 (Tabela 1). Em ambas as posies, destacaram-se os seguintes mtodos: GC de Shewhart, EWMA2 ( = 0,40), RNA e RL. Isso significa que o aumento do valor do no GC EWMA promoveu como nos mtodos GC de Shewhart, RNA e RL, baixa incidncia do alarme falso, o que possibilita us-los no monitoramento de processos que
Novamente, os mtodos GC de Shewhart, EWMA2 ( = 0,40), RNA e RL se apresentaram eficientes em minimizar as estimativas dos alarmes falsos, nos conjuntos de dados com valores de que variam entre 1 e 3. Portanto, a RNA e RL se mostraram eficientes e capazes de substiturem os melhores GCs no monitoramento de processos que visam detectar pequenas ou grandes diferenas em relao mdia de controle, em termos das incidncias dos alarmes falsos.
92
Para o conjunto de dados com observaes independentes ou sem a presena da primeira autocorrelao ( 1 = 0), apenas o mtodo GC de Shewhart apresentou a menor (P<0,05) mdia do alarme falso. Para a presena da primeira autocorrelao ( 1 igual a 0,3; 0,6; e 0,9), foram includos os mtodos EWMA1, EWMA2, RNA e RL, alm do primeiro, como os melhores (Tabela 3). Na ausncia da primeira autocorrelao (1=0) ocorreram mais alarmes falsos em relao sua presena (0,3; 0,6; e 0,9). Dessa forma, o ajuste do modelo de srie temporal do tipo autorregressivo de primeira ordem [AR(1)], de acordo com a metodologia de Box e Jenkins, foi eficiente em minimizar o prejuzo provocado pela violao da pressuposio de independncia para a construo dos grficos de controle. Do mesmo modo, ela favoreceu o monitoramento do processo pelos mtodos RNA e RL, que se mostraram eficientes e capazes de substiturem os melhores GCs, na presena ou no da primeira autocorrelao, em termos das incidncias dos alarmes falsos. Tabela 3 - Mdias dos alarmes falsos dos mtodos dos conjuntos de dados com autocorrelaes de primeira ordem iguais a 0; 0,3; 0,6; e 0,9
Mtodo GC de Shewhart EWMA1 EWMA2 CUSUM tabular RNA RL 1 = 0 0,0243 d 0,1583 b 0,0703 c 0,4331 a 0,0865 c 0,0868 c 1 = 0,3 0,0001 b 0,0201 b 0,0001 b 0,2647 a 0,0054 b 0,0001 b 1 = 0,6 0,0001 b 0,0206 b 0,0001 b 0,2647 a 0,0051 b 0,0001 b 1 = 0,9 0,0001 b 0,0211 b 0,0001 b 0,2647 a 0,0233 b 0,0001 b
dos alarmes verdadeiros. J para = 2 foi includo o EWMA2 e, para = 3, todos os mtodos apresentaram o mesmo (P>0,05) desempenho (Tabela 4). Novamente, os mtodos RNA e RL se apresentaram eficientes em maximizar as estimativas dos alarmes verdadeiros, nos conjuntos de dados com valores de que variam entre 1 e 3 e, portanto, capazes de substituir os melhores GCs no monitoramento de processos que visam detectar pequenas ou grandes diferenas em relao mdia de controle, em termos das incidncias dos alarmes verdadeiros. Tabela 4 - Mdias dos alarmes verdadeiros dos mtodos dos pontos fora de controle estatstico inseridos com valores de deltas iguais a 1, 2 e 3 nos conjuntos de dados
Mtodo GC de Shewhart EWMA1 EWMA2 CUSUM tabular RNA RL =1 0,0549 c 0,9104 a 0,7469 b 0,9174 a 0,9090 a 0,8517 a =2 0,7024 b 0,9944 a 0,9941 a 0,9740 a 0,9632 a 0,9396 a =3 0,9611 a 0,9983 a 0,9983 a 0,9979 a 0,9806 a 0,9757 a
Mdias seguidas pela mesma letra na coluna no diferem entre si, pelo teste de Duncan (P>0,05). Aps terem sido escolhidos como os melhores mtodos para minimizar a incidncia do alarme falso (GC de Shewhart, EWMA2, RNA e RL), apenas os dois ltimos foram considerados como os melhores em maximizar a incidncia do alarme verdadeiro, para valores de iguais a 1, 2 e 3. Alm deles, foram indicados os dois primeiros para =2 e =3. J o CUSUM (k* = 1 e h* = 5) no foi indicado para nenhum valor de . Esse mtodo, apesar dos seus timos resultados em maximizar o alarme verdadeiro, promove grande incidncia do falso. No conjunto de dados com observaes independentes ou sem a presena da primeira autocorrelao (1 = 0), apenas os mtodos EWMA1 e CUSUM tabular apresentaram as maiores (P<0,05) mdias do alarme verdadeiro. Na presena da primeira autocorrelao (1 igual a 0,3; 0,6; e 0,9) foram includos os mtodos EWMA2, RNA e RL, alm dos dois anteriores, como os melhores (Tabela 5).
4.2. Alarme verdadeiro

O alarme verdadeiro sofreu efeito (P<0,05) dos fatores 1, e m e das seguintes interaes duplas: 1, 1m e m. Portanto, com o objetivo de comparar as mdias dos alarmes verdadeiros entre os mtodos, procedeu-se aos desdobramentos das interaes duplas significativas, por meio da aplicao do teste de Duncan dentro de cada nvel de 1 e . Para = 1, os mtodos EWMA1, CUSUM tabular, RNA e RL apresentaram as maiores (P<0,05) mdias
93
Tabela 5 - Mdias dos alarmes verdadeiros dos mtodos dos conjuntos de dados com autocorrelaes de primeira ordem iguais a 0; 0,3; 0,6; e 0,9
Mtodo GC de Shewhart EWMA1 EWMA2 CUSUM tabular RNA RL 1 = 0 0,5111 d 0,9546 a 0,8662 b 0,9713 a 0,8648 b 0,6977 c 1 = 0,3 0,5898 b 0,9727 a 0,9370 a 0,9625 a 0,9824 a 0,9999 a 1 = 0,6 0,5949 b 0,9727 a 0,9356 a 0,9593 a 0,9787 a 0,9999 a 1 = 0,9 0,5954 b 0,9704 a 0,9139 a 0,9593 a 0,9978 a 0,9917 a
Na ausncia da primeira autocorrelao (1=0) ocorreram menos alarmes verdadeiros em relao sua presena (0,3; 0,6; e 0,9). Dessa forma, confirma-se que o ajuste do modelo de srie temporal do tipo AR(1), de acordo com a metodologia de Box e Jenkins, foi realmente eficiente em minimizar o prejuzo provocado pela violao da pressuposio de independncia para a construo dos grficos de controle. Do mesmo modo, ela favoreceu o monitoramento do processo pelos mtodos RNA e RL, que se mostraram eficientes e capazes de substituir os melhores GCs, na presena da primeira autocorrelao, em termos das incidncias dos alarmes verdadeiros. Para 1 = 0, foram indicados os mtodos intermedirios em relao ao alarme verdadeiro (EWMA2 e RNA), pelo fato de os melhores (CUSUM tabular e EWMA1) provocarem alta incidncia do falso. J na sua presena (1 igual a 0,3; 0,6; e 0,9) os melhores mtodos em minimizar e maximizar os alarmes falso e verdadeiro, respectivamente, foram EWMA2, RNA e RL.
Os resultados esto de acordo com os de outros trabalhos. Gonalves (2005) concluiu tambm que os resultados obtidos pelos modelos de RL e RNA foram satisfatrios e bastante prximos, sendo o primeiro ligeiramente superior. No entanto, Santos (2005) obteve melhor resultado com a RNA em relao RL na predio da hepatite A. J Santos (2008) concluiu que as RNAs foram bastante eficientes em classificar cermica arqueolgica com base na composio qumica. Balestrassi (2000) destacou que a RNA evita confuso em determinar o padro, o que pode ocorrer nos GCs. Para verificar os efeitos de 1 e sobre a incidncia do alarme verdadeiro em cada mtodo, foram ajustadas as equaes de regresso apresentadas na Tabela 6. O alarme verdadeiro dos mtodos CUSUM tabular, RNA e RL depende (P<0,05) de 1, e e da interao entre eles. J o dos demais tem relao positiva (P<0,05) apenas em funo de . Resultados semelhantes foram obtidos por Souza et al. (2008).
5. Concluses
Os mtodos das redes neurais artificiais e da regresso logstica substituem, de forma eficiente, os melhores tipos de grficos de controle em sinalizar pontos fora de controle estatstico situados no meio ou no final do conjunto de dados, em diferentes distncias da mdia de controle e distribudos de forma independente ou no, mantendo em nveis baixos a incidncia do alarme falso. Portanto, so mtodos alternativos dos grficos de controle, que podem ser recomendados para o controle estatstico de processo. O grfico de controle CUSUM tabular muito sensvel em detectar alarmes falso e verdadeiro, principalmente quando os pontos fora de controle se situam
Tabela 6 - Estimativas das incidncias dos alarmes verdadeiros em funo de 1 e dos diferentes mtodos estudados Mtodo GC de Shewhart EWMA1 EWMA2 CUSUM tabular RNA RL Equao de Regresso = -0,333 + 0,453* = 0,88 + 0,0439* = 0,662 + 0,126* R2 0,90 0,75 0,65 0,89 0,60 0,60
Pd = 0,911 0,00622*1 + 0,0292* + 0,00245*1
Pd = 0,72 + 0,0353*1 + 0,0901* 0,0121*1 Pd = 0,465 + 0,0740*1 + 0,162* 0,0223*1
*Significativo pelo teste t (P<0,05), 13, 010,9.
94
no meio do conjunto de dados. J o de Shewhart menos sensvel deteco destes. E a diminuio do no grfico de controle EWMA proporciona aumento das incidncias dos alarmes falso e verdadeiro.
HAYKIN, S. Redes neurais, princpios e prtica. 2. ed. Porto Alegre: Bookman, 2001. 900 p. HOSMER, D.W.; LEMESHOW, S. Applied logistic regression. 2. ed. New York: John Wiley & Sons, 1989. 307 p. KING, D.W. Statistical quality control using the SAS system. Noth Carolina: SAS Institut Inc., 1995. 383 p. MELLO, M.T. Aplicao de redes neurais artificiais no processo de precificao de aes. 2004. 48 f. Monografia (Cincias da Computao) Universidade Federal de Pelotas, Pelotas, 2004. MONTGOMERY, D.C. Introduo ao controle estatstico da qualidade. 4. ed. Rio de Janeiro: Editora LTC, 2004. 532 p. MONTGOMERY, D.C.; RUNGER, G.C. Estatstica aplicada e probabilidade para engenheiros. Rio de Janeiro: Editora LTC, 2003. 476 p. MORETIN, P.A.; TOLOI, C.M. Anlise de sries temporais. 2. ed. So Paulo: Edgar Blucher, 2006. 538 p. RIBEIRO JNIOR, J.I.; FARIA, R.O.; TERRA, N.S. Ferramentas estatsticas bsicas da qualidade Guia prtico do SAS. Viosa, MG: Editora UFV, 2006. 157 p. (Caderno Didtico). SANTOS, A.M. Usando redes neurais artificiais e regresso logstica na predio da hepatite A. Revista Brasileira de Epidemiologia, v. 8, p. 117, 2005. SANTOS, J.O. Aplicao da anlise discriminante linear e redes neurais artificiais para classificao de cermicas arqueolgicas com base na composio qumica. In: CONGRESSO DE PESQUISA E INOVAO DA REDE NORTE NORDESTE DE EDUCAO TECNOLGICA, 3., 2008. Anais... [S.l. : s.n.], 2008.10 p. SOUZA, L.M.; RIBEIRO JNIOR, J.I.; REIS, G.M.; IDE, M.S. Eficincia dos grficos de controle Xbarra, EWMA e CUSUM. Rev. Eletrnica Produo & Engenharia, v.1, p. 81-94, 2008. TAFNER, M.A. O que so redes neurais artificiais. Disponvel em: <http://www.cerebromente.org.br/n05/tecnologia/rna.htm>. Acesso em: 16 jun. 2008.
Referncias
ALWAN, C.L.; ROBERTS, H.V. The Problem of misplaced control limits. Applied Statistics, v. 44, n. 3, p. 269-278, 1995. ATIENZA, O.O.; ANG, B.W.; TANG, L.C. Statistical process control and forecasting. Journal of Quality Science, v. 2, p. 3751, 1997. BALESTRASSI, P.P. Identificao de padres em grficos de controle estatstico de processos, em tempo real, utilizando sries temporais e redes neurais artificiais. 2000. 170 f. Tese (Doutorado em Engenharia de Produo) Universidade Federal de Santa Catarina, Florianpolis, 2000. COSTA, A.F.B.; EPPRECHT, E.K.; CARPINETTI, L.C.R. Controle estatstico de qualidade. So Paulo: Atlas, 2004. 334 p. FALTIN, F.W.; MASTRANGELO, C.M.; RUNGER, G.C.; RYAN, T.P. Considerations in the Monitoring of Autocorrelated and Independent Data. Journal of Quality Technology, v. 29, p. 131-133, 1997. FAUSETT, L.V. Fundamentals of neural networks: architecture, algorithms, and applications. New Jersey: Prentice Hall International, 1994. 461 p. FRANA, T.V. Estudo da predio da circularidade e rugosidade de peas retificadas utilizando as redes neurais artificiais. 2005. 171 f. Dissertao (Mestrado em Engenharia Industrial) Universidade Estadual Paulista, Bauru, 2005. HAIR JUNIOR, J.F.; ANDERSON, R.E.; TATHAN, R.L.; BLAC, W.C. Anlise multivariada de dados. 5. ed. Porto Alegre: Bookman, 2005. 600 p.
Recebido em 03/02/2009 Publicado em 02/10/2009

Revista Eletrnica Produo & Engenharia, v. 2, n. 1, p. 85-95, jan./jul. 2009 95

Metodos Alternativos de Controle Estatistico de Processos Univariados

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Metodos Alternativos de Controle Estatistico de Processos Univariados

Diunggah oleh

Hak Cipta:

Format Tersedia

Mtodos alternativos de controle estatstico de processos univariados

Jos Ivo Ribeiro Jnior e Thiago da Costa Gonalves

Alternative methods for the statistical control of univariate processes

Revista Eletrnica Produo & Engenharia, v. 2, n. 1, p. 85-95, jan./jul. 2009

Mtodos alternativos de controle estatstico de processos univariados

2. Reviso de literatura 2.1. Grficos de controle

Revista Eletrnica Produo & Engenharia, v. 2, n. 1, p. 85-95, jan./jul. 2009

Jos Ivo Ribeiro Jnior e Thiago da Costa Gonalves

= deslocamento especial em torno da LM em nmero de desvios-padro; e h* = valor padronizado de H.

Revista Eletrnica Produo & Engenharia, v. 2, n. 1, p. 85-95, jan./jul. 2009

Mtodos alternativos de controle estatstico de processos univariados

1 = nmero mdio de amostras at Pd

2.2. Rede neural artificial

= nmero mdio de amostras at

Revista Eletrnica Produo & Engenharia, v. 2, n. 1, p. 85-95, jan./jul. 2009

Jos Ivo Ribeiro Jnior e Thiago da Costa Gonalves

2.3. Regresso logstica

Revista Eletrnica Produo & Engenharia, v. 2, n. 1, p. 85-95, jan./jul. 2009

Mtodos alternativos de controle estatstico de processos univariados

3. Material e mtodos 3.1. Simulao dos dados

3.2. Grficos de controle

Revista Eletrnica Produo & Engenharia, v. 2, n. 1, p. 85-95, jan./jul. 2009

Jos Ivo Ribeiro Jnior e Thiago da Costa Gonalves

3.4. Regresso logstica

3.3. Rede neural artificial

3.5. Medidas de comparao

Revista Eletrnica Produo & Engenharia, v. 2, n. 1, p. 85-95, jan./jul. 2009

Mtodos alternativos de controle estatstico de processos univariados

NPFC >0 Pd = NTP >0

4.1. Alarme falso

Revista Eletrnica Produo & Engenharia, v. 2, n. 1, p. 85-95, jan./jul. 2009

Jos Ivo Ribeiro Jnior e Thiago da Costa Gonalves

4.2. Alarme verdadeiro

Revista Eletrnica Produo & Engenharia, v. 2, n. 1, p. 85-95, jan./jul. 2009

Mtodos alternativos de controle estatstico de processos univariados

Pd = 0,911 0,00622*1 + 0,0292* + 0,00245*1

Pd = 0,72 + 0,0353*1 + 0,0901* 0,0121*1 Pd = 0,465 + 0,0740*1 + 0,162* 0,0223*1

*Significativo pelo teste t (P<0,05), 13, 010,9.

Revista Eletrnica Produo & Engenharia, v. 2, n. 1, p. 85-95, jan./jul. 2009

Jos Ivo Ribeiro Jnior e Thiago da Costa Gonalves

Recebido em 03/02/2009 Publicado em 02/10/2009

Anda mungkin juga menyukai

Pd = 0,911 0,006221 + 0,0292 + 0,00245*1

Pd = 0,72 + 0,03531 + 0,0901 0,01211 Pd = 0,465 + 0,07401 + 0,162* 0,0223*1