Jos Ivo Ribeiro Jnior (UFV) jivo@dpi.ufv.br Thiago da Costa Gonalves (FINOM) tcostagoncalves@gmail.com
No controle estatstico de processos, os grficos de controle de Shewhart, EWMA e CUSUM tabular se destacam como os principais mtodos do monitoramento de variveis. Porm, o sucesso de sua utilizao est diretamente relacionado s escolhas corretas dos valores das constantes envolvidas nas suas construes, que esto diretamente relacionadas s estimativas dos limites de controle e das incidncias dos alarmes falso e verdadeiro. Desse modo, com o objetivo de propor a utilizao dos mtodos rede neural artificial e regresso logstica em substituio aos grficos de controle, foram simulados quatro conjuntos de dados normalmente distribudos, cada um formado por 544 amostras com observaes individuais, mdia 0=1.000 e desvio-padro 0 = 100. Um com observaes independentes ou sem a presena da autocorrelao de primeira ordem (1 = 0) e trs com os seguintes valores de 1: 0,3; 0,6; e 0,9. Neles, foram realizadas diferentes imposies, com o objetivo de obter, alm dos pontos sob controle estatstico (0 = 1.000 e 0 = 100), pontos fora de controle (1 = 0+0 e 0 = 100), com valores de iguais a 1, 2 e 3, inseridos no meio e final de cada um deles. As redes neurais artificiais e a regresso logstica substituem, de forma eficiente, os melhores tipos de grficos de controle, na sinalizao de alarmes verdadeiros dos pontos fora de controle estatstico situados no meio ou no final do conjunto de dados, em diferentes distncias da mdia de controle e distribudos de forma independente ou no, mantendo em nveis baixos, as incidncias dos falsos alarmes. Palavras-chave: Rede neural artificial, regresso logstica e grficos de controle.
RESUMO
ABSTRACT
85
1. Introduo
O controle estatstico de processos (CEP) propicia o monitoramento destes e sinaliza a necessidade de atuar ou no sobre eles, a fim de garantir que os resultados possam estar de acordo com os padres preestabelecidos. Para esse monitoramento, destacamse os grficos de controle (GC). Quando causas especiais de variao, alm das aleatrias, estiverem presentes no processo, pelo menos um ponto referente aos dados coletados ser plotado fora dos limites nos GCs. J quando apenas causas aleatrias estiverem atuando, todos os pontos se encontraro aleatoriamente dispersos entre os dois limites (MONTGOMERY, 2004). De acordo com Costa et al. (2004), a simplicidade para a construo dos GCs implicou, muitas vezes, aplicaes no coerentes com um monitoramento adequado ao processo. Eles relataram que a eficincia dos GCs est relacionada rapidez de deteco das causas especiais, mas detectadas de acordo com estimativas precisas dos limites de controle obtidos em funo das estimativas da mdia e do desvio-padro do processo. As redes neurais artificiais (RNAs) e a regresso logstica (RL) tambm podem ser utilizadas para classificar se o processo, naquele exato momento em que ocorreu a coleta do dado, estar ou no sob controle estatstico, porm sem que haja a necessidade de serem estimados os limites de controle. Essa estratgia de anlise estatstica abre a possibilidade de monitorar o processo com base em um padro de qualidade definido, que pode ser estipulado a partir de dados histricos que acarretaram resultados satisfatrios ou a partir de dados simulados em funo de uma especificao estabelecida no processo. Portanto, o trabalho teve por objetivo comparar trs mtodos (GCs, RNAs e RL), por meio de um estudo por simulao de dados, com base nas incidncias dos alarmes falso e verdadeiro e na eficincia do monitoramento de uma caracterstica de qualidade que se apresenta com pontos sob e fora de controle estatstico, em processos independentes e autocorrelacionados.
de um valor mdio e distinguir entre os dois tipos de causas de variao. Basicamente, uma representao de determinado estimador, que consiste de uma linha mdia (LM) e dos limites inferior (LIC) e superior de controle (LSC), em funo das diversas estratificaes temporais ou espaciais possveis de serem estabelecidas (MONTGOMERY; RUNGER, 2003). Quando a distribuio dos pontos aleatria e ocorre entre os limites, o processo estar sob controle estatstico, ou seja, somente causas aleatrias de variao estaro atuando. Consequentemente, a mdia (0) e o desvio-padro (0) de controles se mantero estveis ao longo do tempo, cuja caracterstica de qualidade apresentar variabilidade que poder ser representada por uma distribuio de probabilidades. Caso contrrio se houver pontos alm dos limites de controle ou se padres no aleatrios forem identificados, o processo ter a influncia de causas especiais, alm das aleatrias, que o tornam de comportamento no previsvel ou fora de controle estatstico. Isso acarretar alteraes significativas na mdia e, ou, no desvio-padro, e, portanto, uma ao imediata dever ser realizada para retornar o processo condio desejada (MONTGOMERY, 2004). Os GCs por variveis so utilizados para caractersticas de qualidade que podem apresentar infinitos valores dentro de um intervalo contnuo. Entre eles so citados os de Shewhart, mdia mvel exponencialmente ponderada (EWMA) e somas acumuladas (CUSUM tabular). Independente do tipo de GC, algumas pressuposies devem ser satisfeitas para validar a sua utilizao e os seus resultados. De acordo com Alwan e Roberts (1995), as observaes de uma varivel normal devem ser idd independentes e identicamente distribudas. Atienza (1997), Faltin et al. (1997) e Montgomery (2004) sugeriram ajustar aos dados autocorrelacionados um modelo de sries temporais do tipo ARIMA (mdia mvel autorregressiva integrada) e aplicar os grficos de controle aos resduos aproximadamente independentes (rudos brancos) gerados pelo modelo. O GC da medida individual de Shewhart utilizado para monitorar uma caracterstica de qualidade Y, com mdia ( 0) e desvio-padro de controles ( 0), apresenta as seguintes equaes: LIC = 0 k0; LM = 0; e LSC = 0 + k0, em que k = nmero de desviospadro de afastamento em relao LM.
86
Os valores de k so iguais a z/2, ou seja, aos valores de Z da distribuio normal padronizada que deixam uma probabilidade de /2 nas extremidades das duas caudas. Portanto, as probabilidades (1) de ocorrerem valores aleatrios da caracterstica de qualidade dentro dos intervalos compreendidos pelos LIC e LSC calculados em funo dos valores de k iguais a 3, 2 e 1, so iguais a 0,9973 ( = 0,0027), 0,9545 ( = 0,0455) e 0,6827 ( = 0,3173), respectivamente. O GC EWMA uma boa alternativa de Shewhart, quando se est interessado em detectar pequenas mudanas na mdia do processo. Nele, a deciso sobre o processo baseada na informao de cada amostra com percentual de peso das anteriores, conforme as revises apresentadas por King (1995), Costa et al. (2004), Montgomery (2004) e Ribeiro Jnior et al. (2006). Os valores da estatstica Wi plotados no GC EWMA da medida individual so calculados atravs da seguinte expresso: Wi = yi + (1)Wi-1, para i = 1, 2, ..., m, em que: m = nmero de amostras; = peso da amostra (0<1); yi = valor da caracterstica de qualidade Y na amostra i; e W0 = 0. medida que tende para 1, o GC EWMA se aproxima do de Shewhart, em que, para =1, tem-se Wi=yi. A LM e os limites de controle de cada amostra i, de acordo com a mdia ( 0) e o desvio-padro de controles ( 0), so dados por: LICi = 0 kWi; LM = 0; e LSCi = 0 + kWi, em que: k = deslocamento aleatrio em torno da LM em nmero de desvios-padro; ; e i = nmero da amostra i. Se os valores da estatstica W i plotados permanecerem entre os limites inferior e superior de controle e de forma aleatria, ento se tem o processo sob controle estatstico. Caso contrrio, o processo ser considerado como fora.
O GC CUSUM tabular tambm utiliza informaes de diversas amostras para decidir sobre o estado do processo. Ao plotar a soma acumulada dos desvios dos valores da caracterstica de qualidade em relao mdia de controle nas sucessivas amostras, ser possvel conseguir maior rapidez na sinalizao de pequenos desajustes. Na literatura, so apresentadas algumas revises que relatam a importncia do GC CUSUM tabular dentro do CEP, como: King (1995), Montgomery e Runger (2003), Costa et al. (2004), Montgomery (2004) e Ribeiro Jnior et al. (2006). Na CUSUM tabular so estabelecidas a SH(i) (CUSUM unilateral superior) e a SL(i) (CUSUM unilateral inferior) at a amostra i. Assim, aps o clculo da LM e dos limites de controle, devem-se representar os m valores de SH(i) e SL(i) no grfico e verificar se o processo pode ser considerado sob controle ou se existem pontos fora dos limites. Se o processo permanecer sob controle, ento os valores das CUSUMs tabulares ficaro em torno de zero. Caso contrrio, se eles deslocarem para cima ou para baixo, ento ocorrero valores cada vez mais positivos ou negativos, com tendncia deteco de causas especiais. Os valores de SH(i) e SL(i) acumulam desvios que so maiores do que K (valor de referncia), com ambas as quantidades reajustadas para zero, caso se tornarem negativos, sendo os valores iniciais de SH(0) e SL(0) iguais a zero. Se pelo menos um SH(i) ou SL(i) exceder o valor de H (intervalo de deciso), ento o processo ser considerado como fora de controle, sendo LIC = H, LM = 0 e LSC = H. Para a construo do GC CUSUM tabular, os valores de SH(i) recebem sinais positivos e os de SL(i), negativos. As CUSUMs tabulares da medida individual em relao mdia de controle (0) so calculadas por meio das seguintes expresses: SH(i) = mximo [0; yi (0 + K) + SH(i1)], para i = 1, 2, ..., m; e SL(i) = mximo [0; (0 K) yi + SL(i1)], para i = 1, 2, ..., m. Os valores de K e H obtidos em funo do desviopadro de controle (0) so dados por: K = k*0; H = h*0, em que: k* =
= valor padronizado de K; 2
87
Os valores mais usuais de k* esto entre 0,25 (=0,5) e 1,5 (=3), e os de h* encontram-se entre 3 e 6. Para o monitoramento da mdia pelos GCs de Shewhart, EWMA e CUSUM tabular, considere as seguintes hipteses H0 e H1 mutuamente exclusivas: H0: Y = 0 (processo sob controle estatstico); H1: Y 0 (processo fora de controle estatstico). Se a hiptese H 0 for verdadeira e rejeitada, comete-se o erro (alarme falso). No entanto, se H0 for falsa e aceita, comete-se o erro (falta de deteco). O representa a probabilidade de erroneamente considerar-se o processo fora de controle quando, na verdade, ele est (H0 verdadeira). A consequncia prtica de intervir no processo quando ele esta isento de causas especiais. J o a probabilidade de erroneamente considerar-se o processo sob controle quando ele est fora (H1 verdadeira). Isso implica em no intervir no processo quando ele est sob influncia de causas especiais. Entretanto, o alarme verdadeiro ou poder do grfico (Pd = 1) definido como a probabilidade de deteco, ou seja, de rejeitar H0 falsa. De acordo com Costa et al. (2004), pode-se verificar a eficincia de um GC com base nas incidncias dos alarmes falso e verdadeiro. Quando a hiptese H1 verdadeira (processo fora de controle), o ideal seria que o primeiro ponto plotado se situasse fora dos limites de controle. Contudo isso nem sempre ocorre, principalmente se o deslocamento () sofrido pela mdia de controle (0) for pequeno. Essa variao especial em nmero de desvios-padro (0) implicar mdia, acima (1 = 0+0) ou abaixo (2 = 00) da de controle, que se quer sinalizar como fora de controle. Se 1 e 2 apresentarem a mesma diferena em relao a 0 para uma varivel que segue distribuio normal, ento o deslocamento pode ser definido por:
NMA
>0
o sinal verdadeiro. Assim, um grfico de controle bem planejado aquele que apresenta, em termos tericos, baixo alarme falso, alto poder, alto NMA=0 e baixo NMA>0, em funo do valor de preestabelecido. Nesse caso, recomendase escolher valores de maiores do que 2,5, no incio do controle da qualidade, entre 1,5 e 2,5 nas fases intermedirias e, menores do que 1,5 quando o controle se encontrar numa fase mais adiantada, em termos de reduo da variabilidade do processo. Assim, no incio so controladas grandes variaes devidas s causas especiais e, com o passar do tempo, busca-se detectar efeitos cada vez menores dessas possveis causas, quando houver necessidade. Portanto, a primeira escolha de um grfico de controle com baixa incidncia de alarme falso, que trar confiabilidade no monitoramento do processo, j que os pontos fora de controle no sero, na grande maioria das vezes, devidos s causas aleatrias. Caso haja necessidade de aumentar a qualidade do processo e, consequentemente, de diminuir a sua variabilidade, ser importante aumentar a sensibilidade do grfico pelo incremento do seu poder em detectar novas causas especiais que eram anteriormente detectadas como aleatrias. No entanto, o aumento do Pd no poder acontecer em funo do aumento do , mas mantendoo em nveis baixos e aceitveis.
1 0 0 .
De acordo com os alarmes falso e verdadeiro, possvel obter o nmero mdio de amostras at o sinal (NMA), que segue uma distribuio geomtrica de parmetro p. Se a hiptese H0 for verdadeira (=0), ento p=. Caso contrrio, se H1 for verdadeira (>0), ento p = Pd. Como a mdia da distribuio geomtrica de parmetro p igual a 1/p, ento se tm:
NMA
=0
o sinal falso; e
88
de transformar um sinal de sada de um neurnio em um sinal de entrada do outro ou em sinal de sada da rede (TAFNER, 2008). De acordo com Haykin (2001), o neurnio artificial representa uma regio onde as informaes so processadas, sendo constitudo por trs elementos bsicos: pesos sinpticos e as funes de soma e de ativao. As conexes entre os neurnios, denominadas pesos sinpticos, so responsveis pelo armazenamento das informaes e pela definio do efeito que a sada de um neurnio exerce sobre a entrada do seguinte. A funo de soma processa os estmulos ponderados pelos respectivos pesos sinpticos. J a de ativao, tambm chamada de funo de transferncia ou restritiva, limitada amplitude do intervalo do sinal de sada do neurnio, geralmente no intervalo de 0 a 1 ou de -1 a 1. As funes do tipo sigmide so as mais utilizadas, por serem contnuas, monotnicas, no lineares e facilmente diferenciveis. A RNA deve ter a capacidade de generalizao, ou seja, ela deve ser capaz no apenas de classificar as entradas para as quais ela recebeu treinamento, mas tambm de generalizar e classificar as entradas que no foram apresentadas. Isso devido a um processo de aprendizagem, que propicia a esta o encontro de respostas mesmo quando os dados disponveis para as entradas estiverem incompletos. Portanto, a habilidade de aprender em seu ambiente de treinamento, por meio de um processo iterativo de ajustes aplicados aos seus pesos sinpticos, a sua propriedade mais importante (TAFNER, 2008). De acordo com Haykin (2001), a aprendizagem supervisionada caracterizada pela utilizao de um agente externo que indica RNA a resposta desejada para o padro de entrada. O ajuste dos pesos sinpticos ocorre quando o sistema compara a sada com a resposta desejada e previamente conhecida, cujo modelo se caracteriza pela disponibilidade de um conjunto de treinamento composto por dados de entrada previamente classificados. O perceptron um modelo de RNA utilizado para a classificao de padres, sendo constitudo por apenas uma camada de neurnios. Ele adota uma soma ponderada das suas entradas ou sinapses, enviando o resultado de uma unidade positiva se a soma for superior a determinado limiar. Caso contrrio, o valor ser igual a zero ou a uma unidade negativa, dependendo da funo de ativao escolhida na modelagem da rede. J o perceptron multicamada (backpropagation) possui uma ou mais camadas de neurnios intermedirios entre as camadas
de entrada e sada e um conjunto de equaes bem definidas e utilizadas para a correo dos pesos sinpticos, por meio da retropropagao do erro estimado pela diferena entre os resultados da sada e desejado (FAUSETT, 1994). De acordo com Frana (2005), as RNAs podem ser utilizadas em reas relacionadas manufatura, como: planejamento e controle de processos, dimensionamento de sistemas, tomada de deciso operacional e gerenciamento de robs.
Assim, na regresso logstica aplica-se a estimao por mxima verossimilhana depois de a varivel dependente Y ter sido transformada em uma varivel logit. Dessa forma, a regresso logstica estima a probabilidade de certo evento ocorrer com base nas mudanas na razo dos logaritmos das variveis dependentes, em vez de se basear nas mudanas da varivel dependente por si s, como ocorre na regresso linear simples. No modelo de regresso logstica binria com uma nica varivel independente e com funo de distribuio logstica, a probabilidade de um elemento amostral pertencer ao primeiro grupo obtida por:
P(Y = 1/x i ) =
e 0 + 1x i . 1 + e 0 + 1x i
89
Consequentemente, a probabilidade de pertencer ao segundo obtida por: P(Y=0/xi) = 1 P(Y=1/xi). A regresso logstica binria pode ser aplicada quando o principal objetivo for identificar o grupo ao qual um elemento amostral pertence, como: prever o sucesso ou o fracasso de um novo produto, determinar a categoria de risco de crdito de uma pessoa ou prever se uma empresa ter sucesso ou no. Em cada caso, os elementos amostrais so classificados em dois grupos, cujas incluses podem ser previstas ou explicadas por um conjunto de variveis independentes. Se P(Y = 1/xi) for igual ou superior a 0,5, ento o elemento amostral pertencer ao grupo 1; caso contrrio, pertencer ao grupo 2 (HAIR JUNIOR et al., 2005). O teste de Hosmer-Lemeshow avalia a qualidade de ajuste, comparando as frequncias observadas com as esperadas, por meio da distribuio de qui-quadrado (HOSMER; LEMESHOW, 1989).
Para p=0, as primeiras 144 amostras das 436 utilizadas no treinamento da RNA estavam sob controle estatstico (0 = 1.000 e 0 = 100), seguidas de 144 amostras fora de controle (1 = 0+0 e 0 = 100) e de mais 144 sob controle (Figura 1).
Figura 1 - As primeiras observaes foram simuladas com mdia 0, seguidas de verificaes com mdias 1 e 0. Para p = 1, foram 288 amostras sob controle estatstico, seguidas de 144 fora (Figura 2).
Figura 2 - As primeiras observaes foram simuladas com mdia 0, seguidas de verificaes com mdia 1. Do mesmo modo, as 108 amostras destinadas s comparaes dos mtodos apresentaram, para p = 0, 36, amostras sob controle estatstico seguidas de 36 fora e de 36 sob e, para p = 1, 72 amostras sob controle seguidas de 36 fora.
90
e EWMA2 (k = 1,96 e = 0,40). J para o CUSUM tabular utilizou-se k* = 1 e h* = 5. De acordo com o estudo de simulao realizado por Souza et al. (2008), k = 1,96 proporciona estimativa do alarme falso igual a aproximadamente 0,05 para os GCs de Shewhart e EWMA. J as estimativas dos alarmes verdadeiros para n = 1 e k = 1,96 dos GCs de Shewhart so iguais a 0,38 ( = 1), 0,51 ( = 2) e 0,77 ( = 3). O EWMA1 tem as seguintes estimativas: 0,80 ( = 1) e 1 (2), enquanto o EWMA2, 0,69 ( = 1) e 1 (2). J as estimativas dos alarmes falso e verdadeiro do GC CUSUM tabular so, respectivamente, iguais a 0,0002 e 0,97 (1). Nos conjuntos de dados com a presena de autocorrelao, foram ajustados modelos de sries temporais do tipo ARIMA de acordo com a metodologia de Box e Jenkins revisada por Moretin e Toloi (2006), cujos GCs foram construdos com os rudos brancos aproximadamente independentes. Todos os GCs e os ajustes dos modelos de sries temporais ARIMA foram feitos no software Minitab para os 24 conjuntos de dados, com observaes individuais.
O nmero de ciclos de treinamento foi fixado em 1.250 pocas, para que o nmero de vezes que o conjunto de treinamento fosse apresentado RNA no se tornasse excessivo, o que poderia levar perda do poder de generalizao (overfitting). No entanto, no deve ser demasiadamente reduzido, a fim de no atingir o seu melhor desempenho (underfitting).
NPFC =0 NTP =0
Para a estimativa do alarme verdadeiro, foi, no entanto, contabilizada a razo entre o nmero de pontos fora de controle estatstico para >0 (NPFC>0) em relao ao nmero total de pontos fora de controle estatstico (NTP>0) em cada conjunto de dados, sendo dada por:
91
necessitam de correes difceis, caras e demoradas, situadas no meio ou no final do processo. Tabela 1 - Mdias dos alarmes falsos dos mtodos dos pontos fora de controle estatstico situados no meio (p=0) e no final (p=1) do conjunto de dados Mtodo GC de Shewhart EWMA1 EWMA2 CUSUM tabular RNA RL p=0 0,0067 c 0,0858 b 0,0228 c 0,5493 a 0,0321 c 0,0218 c p=1 0,0054 b 0,0243 b 0,0124 b 0,0643 a 0,0281 b 0,0240 b
Mdias seguidas pela mesma letra na coluna no diferem entre si, pelo teste de Duncan (P>0,05).
4. Resultados e discusso
A menor estimativa do MSE (0,33) ocorreu na arquitetura de RNA com trs camadas, sendo uma intermediria, e funo de ativao traingdx. Portanto, esta foi a utilizada na comparao com os demais mtodos propostos.
Para = 1, os mtodos GC de Shewhart, EWMA1, EWMA2, RNA e RL apresentaram as menores (P<0,05) mdias dos alarmes falsos. Entre eles, somente GC de Shewhart, EWMA2, RNA e RL apresentaram as menores (P<0,05) mdias para = 2 e = 3 (Tabela 2). Tabela 2 - Mdias dos alarmes falsos dos mtodos dos pontos fora de controle estatstico, inseridos com valores de deltas iguais a 1, 2 e 3 nos conjuntos de dados Mtodo GC de Shewhart EWMA1 EWMA2 CUSUM tabular RNA RL =1 0,0075 b 0,0404 b 0,0180 b 0,3006 a 0,0407 b 0,0351 b =2 0,0050 c 0,0605 b 0,0178 c 0,3160 a 0,0232 c 0,0232 c =3 0,0057 c 0,0642 b 0,0169 c 0,3039 a 0,0094 c 0,0105 c
Mdias seguidas pela mesma letra na coluna no diferem entre si, pelo teste de Duncan (P>0,05).
Novamente, os mtodos GC de Shewhart, EWMA2 ( = 0,40), RNA e RL se apresentaram eficientes em minimizar as estimativas dos alarmes falsos, nos conjuntos de dados com valores de que variam entre 1 e 3. Portanto, a RNA e RL se mostraram eficientes e capazes de substiturem os melhores GCs no monitoramento de processos que visam detectar pequenas ou grandes diferenas em relao mdia de controle, em termos das incidncias dos alarmes falsos.
92
Para o conjunto de dados com observaes independentes ou sem a presena da primeira autocorrelao ( 1 = 0), apenas o mtodo GC de Shewhart apresentou a menor (P<0,05) mdia do alarme falso. Para a presena da primeira autocorrelao ( 1 igual a 0,3; 0,6; e 0,9), foram includos os mtodos EWMA1, EWMA2, RNA e RL, alm do primeiro, como os melhores (Tabela 3). Na ausncia da primeira autocorrelao (1=0) ocorreram mais alarmes falsos em relao sua presena (0,3; 0,6; e 0,9). Dessa forma, o ajuste do modelo de srie temporal do tipo autorregressivo de primeira ordem [AR(1)], de acordo com a metodologia de Box e Jenkins, foi eficiente em minimizar o prejuzo provocado pela violao da pressuposio de independncia para a construo dos grficos de controle. Do mesmo modo, ela favoreceu o monitoramento do processo pelos mtodos RNA e RL, que se mostraram eficientes e capazes de substiturem os melhores GCs, na presena ou no da primeira autocorrelao, em termos das incidncias dos alarmes falsos. Tabela 3 - Mdias dos alarmes falsos dos mtodos dos conjuntos de dados com autocorrelaes de primeira ordem iguais a 0; 0,3; 0,6; e 0,9
Mtodo GC de Shewhart EWMA1 EWMA2 CUSUM tabular RNA RL 1 = 0 0,0243 d 0,1583 b 0,0703 c 0,4331 a 0,0865 c 0,0868 c 1 = 0,3 0,0001 b 0,0201 b 0,0001 b 0,2647 a 0,0054 b 0,0001 b 1 = 0,6 0,0001 b 0,0206 b 0,0001 b 0,2647 a 0,0051 b 0,0001 b 1 = 0,9 0,0001 b 0,0211 b 0,0001 b 0,2647 a 0,0233 b 0,0001 b
dos alarmes verdadeiros. J para = 2 foi includo o EWMA2 e, para = 3, todos os mtodos apresentaram o mesmo (P>0,05) desempenho (Tabela 4). Novamente, os mtodos RNA e RL se apresentaram eficientes em maximizar as estimativas dos alarmes verdadeiros, nos conjuntos de dados com valores de que variam entre 1 e 3 e, portanto, capazes de substituir os melhores GCs no monitoramento de processos que visam detectar pequenas ou grandes diferenas em relao mdia de controle, em termos das incidncias dos alarmes verdadeiros. Tabela 4 - Mdias dos alarmes verdadeiros dos mtodos dos pontos fora de controle estatstico inseridos com valores de deltas iguais a 1, 2 e 3 nos conjuntos de dados
Mtodo GC de Shewhart EWMA1 EWMA2 CUSUM tabular RNA RL =1 0,0549 c 0,9104 a 0,7469 b 0,9174 a 0,9090 a 0,8517 a =2 0,7024 b 0,9944 a 0,9941 a 0,9740 a 0,9632 a 0,9396 a =3 0,9611 a 0,9983 a 0,9983 a 0,9979 a 0,9806 a 0,9757 a
Mdias seguidas pela mesma letra na coluna no diferem entre si, pelo teste de Duncan (P>0,05). Aps terem sido escolhidos como os melhores mtodos para minimizar a incidncia do alarme falso (GC de Shewhart, EWMA2, RNA e RL), apenas os dois ltimos foram considerados como os melhores em maximizar a incidncia do alarme verdadeiro, para valores de iguais a 1, 2 e 3. Alm deles, foram indicados os dois primeiros para =2 e =3. J o CUSUM (k* = 1 e h* = 5) no foi indicado para nenhum valor de . Esse mtodo, apesar dos seus timos resultados em maximizar o alarme verdadeiro, promove grande incidncia do falso. No conjunto de dados com observaes independentes ou sem a presena da primeira autocorrelao (1 = 0), apenas os mtodos EWMA1 e CUSUM tabular apresentaram as maiores (P<0,05) mdias do alarme verdadeiro. Na presena da primeira autocorrelao (1 igual a 0,3; 0,6; e 0,9) foram includos os mtodos EWMA2, RNA e RL, alm dos dois anteriores, como os melhores (Tabela 5).
Mdias seguidas pela mesma letra na coluna no diferem entre si, pelo teste de Duncan (P>0,05).
93
Tabela 5 - Mdias dos alarmes verdadeiros dos mtodos dos conjuntos de dados com autocorrelaes de primeira ordem iguais a 0; 0,3; 0,6; e 0,9
Mtodo GC de Shewhart EWMA1 EWMA2 CUSUM tabular RNA RL 1 = 0 0,5111 d 0,9546 a 0,8662 b 0,9713 a 0,8648 b 0,6977 c 1 = 0,3 0,5898 b 0,9727 a 0,9370 a 0,9625 a 0,9824 a 0,9999 a 1 = 0,6 0,5949 b 0,9727 a 0,9356 a 0,9593 a 0,9787 a 0,9999 a 1 = 0,9 0,5954 b 0,9704 a 0,9139 a 0,9593 a 0,9978 a 0,9917 a
Mdias seguidas pela mesma letra na coluna no diferem entre si, pelo teste de Duncan (P>0,05).
Na ausncia da primeira autocorrelao (1=0) ocorreram menos alarmes verdadeiros em relao sua presena (0,3; 0,6; e 0,9). Dessa forma, confirma-se que o ajuste do modelo de srie temporal do tipo AR(1), de acordo com a metodologia de Box e Jenkins, foi realmente eficiente em minimizar o prejuzo provocado pela violao da pressuposio de independncia para a construo dos grficos de controle. Do mesmo modo, ela favoreceu o monitoramento do processo pelos mtodos RNA e RL, que se mostraram eficientes e capazes de substituir os melhores GCs, na presena da primeira autocorrelao, em termos das incidncias dos alarmes verdadeiros. Para 1 = 0, foram indicados os mtodos intermedirios em relao ao alarme verdadeiro (EWMA2 e RNA), pelo fato de os melhores (CUSUM tabular e EWMA1) provocarem alta incidncia do falso. J na sua presena (1 igual a 0,3; 0,6; e 0,9) os melhores mtodos em minimizar e maximizar os alarmes falso e verdadeiro, respectivamente, foram EWMA2, RNA e RL.
Os resultados esto de acordo com os de outros trabalhos. Gonalves (2005) concluiu tambm que os resultados obtidos pelos modelos de RL e RNA foram satisfatrios e bastante prximos, sendo o primeiro ligeiramente superior. No entanto, Santos (2005) obteve melhor resultado com a RNA em relao RL na predio da hepatite A. J Santos (2008) concluiu que as RNAs foram bastante eficientes em classificar cermica arqueolgica com base na composio qumica. Balestrassi (2000) destacou que a RNA evita confuso em determinar o padro, o que pode ocorrer nos GCs. Para verificar os efeitos de 1 e sobre a incidncia do alarme verdadeiro em cada mtodo, foram ajustadas as equaes de regresso apresentadas na Tabela 6. O alarme verdadeiro dos mtodos CUSUM tabular, RNA e RL depende (P<0,05) de 1, e e da interao entre eles. J o dos demais tem relao positiva (P<0,05) apenas em funo de . Resultados semelhantes foram obtidos por Souza et al. (2008).
5. Concluses
Os mtodos das redes neurais artificiais e da regresso logstica substituem, de forma eficiente, os melhores tipos de grficos de controle em sinalizar pontos fora de controle estatstico situados no meio ou no final do conjunto de dados, em diferentes distncias da mdia de controle e distribudos de forma independente ou no, mantendo em nveis baixos a incidncia do alarme falso. Portanto, so mtodos alternativos dos grficos de controle, que podem ser recomendados para o controle estatstico de processo. O grfico de controle CUSUM tabular muito sensvel em detectar alarmes falso e verdadeiro, principalmente quando os pontos fora de controle se situam
Tabela 6 - Estimativas das incidncias dos alarmes verdadeiros em funo de 1 e dos diferentes mtodos estudados Mtodo GC de Shewhart EWMA1 EWMA2 CUSUM tabular RNA RL Equao de Regresso = -0,333 + 0,453* = 0,88 + 0,0439* = 0,662 + 0,126* R2 0,90 0,75 0,65 0,89 0,60 0,60
94
no meio do conjunto de dados. J o de Shewhart menos sensvel deteco destes. E a diminuio do no grfico de controle EWMA proporciona aumento das incidncias dos alarmes falso e verdadeiro.
HAYKIN, S. Redes neurais, princpios e prtica. 2. ed. Porto Alegre: Bookman, 2001. 900 p. HOSMER, D.W.; LEMESHOW, S. Applied logistic regression. 2. ed. New York: John Wiley & Sons, 1989. 307 p. KING, D.W. Statistical quality control using the SAS system. Noth Carolina: SAS Institut Inc., 1995. 383 p. MELLO, M.T. Aplicao de redes neurais artificiais no processo de precificao de aes. 2004. 48 f. Monografia (Cincias da Computao) Universidade Federal de Pelotas, Pelotas, 2004. MONTGOMERY, D.C. Introduo ao controle estatstico da qualidade. 4. ed. Rio de Janeiro: Editora LTC, 2004. 532 p. MONTGOMERY, D.C.; RUNGER, G.C. Estatstica aplicada e probabilidade para engenheiros. Rio de Janeiro: Editora LTC, 2003. 476 p. MORETIN, P.A.; TOLOI, C.M. Anlise de sries temporais. 2. ed. So Paulo: Edgar Blucher, 2006. 538 p. RIBEIRO JNIOR, J.I.; FARIA, R.O.; TERRA, N.S. Ferramentas estatsticas bsicas da qualidade Guia prtico do SAS. Viosa, MG: Editora UFV, 2006. 157 p. (Caderno Didtico). SANTOS, A.M. Usando redes neurais artificiais e regresso logstica na predio da hepatite A. Revista Brasileira de Epidemiologia, v. 8, p. 117, 2005. SANTOS, J.O. Aplicao da anlise discriminante linear e redes neurais artificiais para classificao de cermicas arqueolgicas com base na composio qumica. In: CONGRESSO DE PESQUISA E INOVAO DA REDE NORTE NORDESTE DE EDUCAO TECNOLGICA, 3., 2008. Anais... [S.l. : s.n.], 2008.10 p. SOUZA, L.M.; RIBEIRO JNIOR, J.I.; REIS, G.M.; IDE, M.S. Eficincia dos grficos de controle Xbarra, EWMA e CUSUM. Rev. Eletrnica Produo & Engenharia, v.1, p. 81-94, 2008. TAFNER, M.A. O que so redes neurais artificiais. Disponvel em: <http://www.cerebromente.org.br/n05/tecnologia/rna.htm>. Acesso em: 16 jun. 2008.
Referncias
ALWAN, C.L.; ROBERTS, H.V. The Problem of misplaced control limits. Applied Statistics, v. 44, n. 3, p. 269-278, 1995. ATIENZA, O.O.; ANG, B.W.; TANG, L.C. Statistical process control and forecasting. Journal of Quality Science, v. 2, p. 3751, 1997. BALESTRASSI, P.P. Identificao de padres em grficos de controle estatstico de processos, em tempo real, utilizando sries temporais e redes neurais artificiais. 2000. 170 f. Tese (Doutorado em Engenharia de Produo) Universidade Federal de Santa Catarina, Florianpolis, 2000. COSTA, A.F.B.; EPPRECHT, E.K.; CARPINETTI, L.C.R. Controle estatstico de qualidade. So Paulo: Atlas, 2004. 334 p. FALTIN, F.W.; MASTRANGELO, C.M.; RUNGER, G.C.; RYAN, T.P. Considerations in the Monitoring of Autocorrelated and Independent Data. Journal of Quality Technology, v. 29, p. 131-133, 1997. FAUSETT, L.V. Fundamentals of neural networks: architecture, algorithms, and applications. New Jersey: Prentice Hall International, 1994. 461 p. FRANA, T.V. Estudo da predio da circularidade e rugosidade de peas retificadas utilizando as redes neurais artificiais. 2005. 171 f. Dissertao (Mestrado em Engenharia Industrial) Universidade Estadual Paulista, Bauru, 2005. HAIR JUNIOR, J.F.; ANDERSON, R.E.; TATHAN, R.L.; BLAC, W.C. Anlise multivariada de dados. 5. ed. Porto Alegre: Bookman, 2005. 600 p.