Anda di halaman 1dari 6

UMA ABORDAGEM PI-NEURAL APLICADO AO CONTROLE DE UM

SERVO-MECANISMO

Vlademir Aparecido Freire Junior, Alessandro do Nascimento Vargas, Alessandro


Goedtel
Laboratório de Controle e Automação de Sistemas, Universidade Tecnológica Federal do Paraná
Avenida Alberto Carazzai, 1640 - Centro - Cornélio Procópio, Paraná, Brasil

Email: vlad_freire@hotmail.com, avargas@utfpr.edu.br, agoedtel@utfpr.edu.br

Abstract— PI controllers are widely used in industrial control. However, these controllers have difficulties in
control systems with long time delay and obtaining optimal gains. This strategy requires mathematical models
and have compromised their robustness with respect to variations in process parameters. This paper proposes
a comparative study between a conventional PI and PI-Neural through a strategy of tuning without the need
for system modeling applied to control a servo mechanism. Experimental results are presented to validate the
proposal.

Keywords— Artificial Neural Networks, PI Controller, Identification Systems, Tuning Method, Servo-
Mechanism.

Resumo— Controladores PI são vastamente utilizados no controle industrial. Entretanto, estes controladores
apresentam dificuldades no controle de sistemas com longo atraso de tempo e na obtenção de ganhos ideais.
Tal estratégia necessita de modelos matemáticos e tem sua robustez comprometida em relação a variações dos
parâmetros dos processo. Este trabalho propõe um estudo comparativo entre um PI convencional e um PI-Neural
através de uma estratégia de sintonia sem a necessidade da modelagem do sistema aplicado ao controle de um
servo-mecanismo. Resultados experimentais são apresentados para validar a proposta.

Keywords— Redes Neurais Artificiais, Controlador PI, Identificação de Sistemas, Método de Sintonia, Servo-
Mecanismo.

1 Introdução dos de controle clássicos. Estas estratégias são


aplicáveis a uma grande variedade de aplicações
O controle em malha fechada do tipo PI trata-se e não necessitam de um modelo matemático do
de um método de controle tradicional no qual são processo, (Wong, 1998). Controladores utilizando
estipulados os ganhos proporcional e integrativo, estratégias de redes neurais têm sido o foco de
com finalidade de permitir que o sistema opere vários estudos atualmente, devido sua facilidade
dentro de uma dinâmica aceitável. de implementação e demonstração de bons resul-
O ajuste dos parâmetros do controle PI devem tados, conforme Tajne (2012).
ser baseados nas caracterı́sticas do processo a ser O artigo de Sujatha (2010) apresenta bons re-
controlado e para tanto um modelo matemático sultados em estratégias de controle utilizando re-
nem sempre está disponı́vel ou é conhecido. des neurais no controle de um motor DC (brush-
O procedimento geral, nestes casos, é a uti- less) tendo melhora na resposta de velocidade e
lização de modelos aproximados, que possuam reduzindo ondulações de torque.
parâmetros significativos para a dinâmica do sis- Ainda o artigo de Yu (2006) mostra que o
tema permitindo assim a sintonia dos contro- PID-Neural tem recebido uma maior atenção nas
ladores. A sintonia ideal para controladores PI aplicações industriais. O artigo evidencia os resul-
pode ser obtida quando são conhecidas todas as tados que o PID-Neural é menos sensı́vel a vari-
caracterı́sticas dos processos a serem controlados, ações do sistema, em relação ao controlador PID
(Carmo, 2006). convencional.
Apesar de sua vasta aplicação, segundo Este trabalho propõe o desenvolvimento de
(Wong, 1998), os controladores PI possuem po- uma estratégia aplicado ao controle de velocidade
bre resposta transiente e não fornece robustez su- de um servo-mecanismo utilizando as redes neu-
ficiente em relação às variações dos parâmetros rais artificiais, considerando como variáveis de en-
do processo. De acordo com, (Ji, 2009), o PID trada os valores de saı́da e a referência de uma en-
tradicional já não pode satisfazer os requisitos de trada degrau aplicada a um PI convencional. Com
estabilidade, rapidez e robustez para sistemas de objetivo de validar a metodologia proposta, resul-
controle de velocidade de um motor DC sem esco- tados experimentais são apresentados e compara-
vas (brushless). Ainda, (Dorf, 1998), afirma que dos com os resultados obtidos através do controle
o principal problema na escolha dos coeficientes PI convencional sintonizado por métodos tradi-
é que esta composição nem sempre reflete direta- cionais.
mente o desempenho desejado. O trabalho está organizado da seguinte forma:
Métodos de controle com redes neurais artifi- A Seção 2 trata dos aspectos do controlador PI
ciais (RNA’s) têm sido uma alternativa aos méto- convencional. Na Seção 3 são descritos os princı́-
pios das Redes Neurais Artificiais e na Seção  
4 é proposto o controle PI-Neural do servo- Xm
mecanismo. Finalmente na Seção 5 as conclusões y = ϕ wj xj + b (7)
do artigo são apresentadas. j=1

onde:
2 Controlador PI Convencional
j é o número de entradas do neurônio;
A ação de controle PI reúne as caracterı́sticas do wj é o peso associado com a j -ésima entrada;
controle proporcional e integral em um mesmo b é o limiar de ativação associado ao neurônio;
controlador. Visto que, a ação do controlador PI xj é a j -ésima entrada do neurônio;
é definida por: ϕ(.) é a função de ativação do neurônio;
y é a saı́da do neurônio.
Zt
Kp
u (t) = Kp e (t) + e (t) dt (1) Desta forma, as RNAs possuem capacidade de
Ti
0 aquisição e retenção do conhecimento baseado na
experiência, podendo ser definidas como um con-
onde:
junto de unidades de processamento denominados
u(t) é a saı́da do controlador; neurônios artificiais. Estas redes dispõem ainda
Kp é o ganho proporcional; da capacidade de generalização. E podem respon-
e(t) é o erro; der apropriadamente a estı́mulos para os quais não
Ti é o tempo integrativo; foram treinadas.
O processo de treinamento consiste num al-
De acordo com (Y. Zhang, 2011), a função de goritmo de aprendizagem em que os pesos são
transferência do controlador PI é dada como: ajustados de forma a mapear o comportamento
  entre as variáveis de entrada e saı́da de um
U(s) 1
= Kp 1 + (2) sistema. Conforme (Rezende, 2005), as RNAs
E(s) Ti s caracterizam-se pelo aprendizado por meio de ex-
Esta equação pode ser representada na forma emplos, ficando o algoritmo de aprendizado re-
discreta aplicando-se uma aproximação trape- sponsável pela adaptação dos parâmetros da rede
zoidal para o termo integrativo. Com isso, obtém- de maneira que, em um número finito de iterações,
se: há convergência para uma solução. Visto que o
objetivo principal do aprendizado das RNAs é a
! obtenção de modelos com capacidade de general-
U (z) Ts 1 + z −1 ização tendo como base o conjunto de dados.
= Kp 1+ (3)
E(z) 2Ti (1 − z −1 )
4 Controle PI-Neural de um
Chegando na seguinte equação de diferenças. Servomecanismo
b
u[n] = u[n − 1] + a (e[n] − e[n − 1]) + e[n] + e[n − 1]
2 Servo-mecanismos são encontrados em processos e
(4)
equipamentos industriais. A aplicação deste dis-
onde: positivo ocorre no controle de posição e/ou ve-
a = Kp (5) locidade angular como, por exemplo, em controles
numéricos computadorizados (CNC’s), braços
robóticos e correias transpostadoras, (Carmo,
Ts
b = Kp (6) 2006).
Ti Neste artigo foi utilizado um módulo de en-
sendo Ts o perı́odo de amostragem. sino desenvolvido pela Datapool Eletrônica Ltda,
modelo 2208 conforme a Figura 1.
3 Redes Neurais Artificiais O mesmo é constituı́do por um servo-
potenciômetro como trandustor de deslocamento
As redes neurais artificiais, são modelos matemáti- angular. Para a aferição da rotação utiliza-se um
cos inspirados no sistema nervoso de seres vivos tacômetro que fornece um sinal de tensão propor-
(Silva, 2010). A semelhança entre as redes neu- cional à velocidade na faixa de 0 a 5V. O módulo
rais artificiais e os sistemas biológicos é que am- possui também um servomotor de corrente con-
bas possuem alta capacidade computacional por tı́nua de imã permanente acoplado a um conjunto
meio de um grande número de elementos simples mecânico que aciona o conjunto braço/ponteiro do
de processamento com alto grau de conectividade sistema de rotação e/ou posicionador. A tensão
entre si (Haykin, 2001). de armadura é alterada por um driver de aciona-
O neurônio artificial é descrito matematica- mento linear a partir do borne de acesso Vu na
mente por: faixa de -5 a 5V.
Figura 2: Curva de reação de sistema de primeira
Figura 1: Módulo Datapool Servo - Mecanismo ordem sobre a de ordem superior

4.1 Identificação de Sistema e Método de Sinto- No caso dos controladores PI, trata-se de cal-
nia cular os valores dos parâmetros Kp e Ti , que rep-
Identificação de um sistema trata-se da deter- resentam o ganho proporcional e o tempo de inte-
minação do modelo matemático que represente gral.
os seus aspectos essenciais de forma adequada Métodos de sintonia para controlador PI são
para uma utilização particular: diagnóstico, su- muito utilizados em processos industriais. Os
pervisão, otimização e controle (Coelho, 2004). mais aplicados são baseados na resposta ao de-
Tais modelos representam a dinâmica do sis- grau, como Cohen-Coon, o qual foi utilizado no
tema seja um processo ou uma planta, podendo a trabalho, (Cohen, 1953). Tal método baseia-se
maioria dos processos industriais ser modelada por também na constante de tempo do processo, no
funções de transferência de primeira ou de segunda tempo de atraso e no ganho estático do processo.
ordem com atraso de transporte (Morari and Cohen e Coon utilizaram essa relação na deter-
Zafirou, 1989). Neste trabalho, o modelo estimado minação dos valores teóricos dos parâmetros do
do processo é representado segundo (Ogata, 2000) controladores. Este método é resumido conforme
pela seguinte expressão: a Tabela 1.

Ke−Ls
G (s) = (8) Tabela 1: Tabela de Sintonia do Controlador PI,
Ts + 1 método de Cohen-Coon
onde: Controlador  Kp  Ti Td
K é o ganho estático do processo; PI 0,9T 0,92τ
1 + 1−τ 3,3−3τ
0
KL 1+1,2τ
L é o atraso de transporte;
Fonte:(Åström and HÅgglund, 1934)
T é a constante de tempo;

No presente trabaho o método de identifi- Onde o parâmetro τ varia entre 0 e 1 e é


cação aplicado no sistema foi o de Broı́da, (Hamiti, definido como τ = L/(L + T ).
1996), o qual traça a resposta do sistema de Nestes parâmetros a medida que τ aumenta,
primeira ordem sobre a curva de ordem superior mais difı́cil se torna o controle, pois são processos
obtida experimentalmente. Verifica-se que há um com tempo morto dominante. Tal método tam-
intervalo comum entre elas: um ponto A situado bém é baseado em uma resposta com taxa de de-
a 28% de ∆ y e um ponto B situado a 40% de ∆ caimento de 1/4 na resposta, quando o atraso de
y, conforme na Figura 2. transporte é pequeno comparado à constante de
Sendo os valores de L e T calculados da tempo.
seguinte forma:
4.2 Controlador PI Neural
T = 5, 5(t2 − t1 ) (9)
A rede proposta é constituı́da por 3 camadas: a
camada de entrada onde são apresentados os val-
L = 2, 8t1 − 1, 8t2 (10)
ores de referência e velocidade real, a camada
A sintonia de um algoritmo de controle con- oculta contendo 5 neurônios e a camada de saı́da
siste em selecionar valores adequados de seus na qual tem-se a ação de controle. A arquitetura
parâmetros que atendam as condições de projeto, do controlador PI-Neural é apresentado na Figura
(Carmo, 2005). 3.
Tabela 2: Parâmetros da rede neural artificial pro-
posta
Arquitetura da rede Perceptron multicamadas
Tipo de treinamento Supervisionado
Número de camadas 2
Neurônios da 5
camada escondida
Algoritmo de treinamento Levenberg-Marquardt
backpropagation
Taxa de aprendizagem 0.001
Figura 3: Arquitetura do controlador PI-Neural Épocas 5000
Erro quadrático requerido 1.10−6
Função de ativação das Tangente hiperbólica
onde: camadas intermediárias
Função de ativação na Linear
r(t) é a referência de velocidade; camada de saı́da
u(t) é a ação de controle; Quantidade de amostras 5400 amostras
y(t) é o valor real de velocidade. de treinamento
Quantidade de amostras 1800 amostras
de teste
O treinamento utilizado neste trabalho é
o supervisionado implementado no MatLab
(R2010a) em um computador Pentium Dual-Core curva aplicado um degrau de 3,5 rad/s, conforme
(1,73GHz), 1GB RAM com Windows 7 Profes- Figura 5. Desse modo pode-se concluir que o con-
sional, no qual são apresentados os dados de en- trolador PI-Neural demonstrou boa capacidade de
trada e saı́da que descrevam de forma satisfatória generalização, alcançando resultados satisfatórios.
o comportamento do sistema afim de obter o
ajuste dos parâmetros internos ideais para a rede.
As amostras utilizadas para o treinamento da
RNA são referentes a um controlador PI conven-
cional sintonizado de forma empı́rica (baseado so-
mente na experiência e observação do sistema)
adotando como parâmetros aceitáveis Kp = 0,186;
Ti = 0,099. A Figura 4 apresenta a curva de re-
sposta do sistema aplicado a um degrau de 3,5
rad/s. Foram adquiridas 24 curvas através do
controlador PI convencional sendo 18 utilizadas
no treinamento e 6 utilizadas para a validação da
rede, onde cada curva apresenta 300 amostras.

Figura 5: Curva de resposta PI Neural


A Figura 6 mostra as curvas de resposta do
controlador PI convencional e PI-Neural aplicado
um degrau de 3,5 rad/s.
Pode-se observar na Tabela 3, que o contro-
lador PI-Neural apresentou melhor desempenho
em relação ao controlador PI convencional, en-
trando em regime sem apresentar máximo so-
bresinal, atingindo menor tempo de assentamento
e menor erro estacionário.

Tabela 3: Desempenho dos sistemas


Figura 4: Curva de resposta do sistema Especificações PI PI
Convencional Neural
A Tabela 2 apresenta os diversos parâmetros Máximo sobresinal (%) 12,45 —–
utilizados no treinamento da rede neural proposta. Tempo de assentamento (s) 3,25 1,21
Erro em Regime (rad/s) -0,0112 0,0044
4.3 Resultados Experimentais
Afim de demonstrar a robustez do sistema foi
A partir do treinamento e validação do contro- aplicado um degrau de 1 rad/s, e após 5 segundos
lador PI-Neural o sistema apresentou a seguinte foi inserido um distúrbio de 2 rad/s.
Figura 8: Curva de identificação do sistema.
Figura 6: Curva de comparação PI convencional
e PI Neural.
A Figura 9 apresenta uma comparação entre
Neste caso o PI-Neural também apresentou as curvas de resposta do controlador PI Identifi-
melhor resposta em relação ao PI convencional cado e PI-Neural aplicado um degrau de 3 rad/s.
com maior tempo de subida após aplicação do dis-
túrbio, como visto na Figura 7.

Figura 9: Curva de comparação PI Identificado e


PI Neural.
Figura 7: Curva PI-Convencional e PI-Neural O controlador PI-Neural demonstrou menor
aplicado distúrbio. tempo de estabilização e menor sobresinal quando
Com o intuito de demonstrar uma maior efi- comparado ao controlador PI convencional sin-
ciência do controlador PI-Neural, foi realizada a tonizado utilizando métodos tradicionais.
identificação e sintonia do sistema utilizando os
métodos tradicionais da literatura apresentados 5 Conclusão
na subseção 4.1. Aplicando um degrau de 3 rad/s
em malha aberta o sistema apresentou a curva de O presente artigo apresenta um estudo compara-
identificação e estimação de parâmetros, conforme tivo entre o controlador PI convencional e o con-
a Figura 8. trolador PI-Neural aplicado ao controle de um
Chegando na função de transferência e servo-mecanismo visando o controle de sua veloci-
parâmetros a seguir: dade.
O sistema proposto teve por base os dados
gerados num processo o qual foi sintonizado por
1, 378 métodos convencionais. A aplicação de degrau
G (s) = .e−3,17e−5.s (11)
0, 0001451.s + 1 ao servo-mecanismo produz uma sequência de da-
dos relativos ao processo. Através do método de
Kp = 3, 2222 treinamento há o ajuste dos pesos sinápticos dos
(12) neurônios da rede com o objetivo de otimizar a
Ti = 2, 2740 resposta do controle.
O controlador PI-Neural demonstrou maior Ogata, K. (2000). Engenharia de Controle Mod-
eficiência em ambas as comparações, isto é, tanto erno, 3 edn, LTC, Rio de Janeiro.
para o controlador PI convencional sintonizado de
forma empı́rica quanto para o controlador PI iden- Rezende, S. O. (2005). Sistemas Inteligentes Fun-
tificado e sintonizado por métodos convencionais damentos e Aplicações, 1 edn, Manole.
da literatura, atendendo aos objetivos propostos Silva, I. N. da, S. D. H. e. F. R. A. (2010). Redes
neste artigo. Cabe ainda ressaltar os resulta- neurais artificiais para engenharia e ciências
dos satisfatórios, não apresentando máximo so- aplicadas, Artliber, USP, São Carlos.
bresinal, demonstrando menor tempo de subida
após aplicação de distúrbio, menor tempo de as- Sujatha, K. N.; Vaisakh, K. A. G. (2010). Artifi-
sentamento e menor erro estacionário. cial intelligence based speed control of brush-
Demonstrou-se assim que sistemas in- less dc motor, Power and Energy Society
teligentes baseados nas redes neurais são uma General Meeting, 2010 IEEE pp. 1 – 6.
alternativa para sistemas de controle para os
quais não é possı́vel a obtenção da função Tajne, S. K.; Srivastava, S. P. (2012). Compara-
de transferência que descreve precisamente o tive performance analysis of vector controlled
comportamento do sistema. induction motor drive for neural controller
and dsp implemented pi controller, Inter-
national Conference on Communication Sys-
Referências tems and Network Technologies pp. 274 – 281.
Åström, K. J. and HÅgglund, T. (1934). PID Wong, C.F.; Shippen, J. J. B. (1998). Neural net-
Controllers: theory, design and tuning, 2 edn, work control strategies for low specification
Instrument Society of America. servo actuators, International Journal of Ma-
chine Tools & Manufacture p. 11091124.
Carmo, M. J. (2006). Ambiente educacional multi-
funcional integrado para sintonia e avaliação Y. Zhang, X. Yu, M. B. S. X. (2011). An adap-
do desempenho de malhas industriais de con- tive neural pid controller for torque control of
trole, Master’s thesis, Centro Federal de Edu- hybrid electric vehicle, The 6th International
cação Tecnológica de Minas Gerais - CEFET- Conference on Computer Science & Educa-
MG. tion (ICCSE 2011) pp. 901–903.

Carmo, M. J.; Gomes, F. J. (2005). Sintonia de Yu, Z.; Xie Y.; Jing, Y. L. X. (2006). Applying
controladores e análise funcional de malhas neural networks to pid controllers for time-
industriais em ambiente multifuncional inte- delay systems, Proceedings of the Fifth In-
grado, XXXIII Cobenge . ternational Conference on Machine Learning
and Cybernetics pp. 3173 – 3176.
Coelho, A. A. R.; Coelho, L. d. S. (2004). Identi-
ficação de Sistemas Dinâmicos Lineares, Ed.
UFSC, Florianópolis.

Cohen, G. H.; Coon, G. A. (1953). Theoreti-


cal considerations of retarded control, ASME
Transactions 75: 827–834.

Dorf, R. C. ;Bishop, R. H. (1998). Sistemas de


Controle Moderno, 8 edn, LTC.

Hamiti, K. (1996). Position control of a pneu-


matic actuator under the influence of siction,
Elsevier Science Ltd pp. 1079–1088.

Haykin, S. (2001). Redes neurais Princı́pios e


prática, Bookman.

Ji, H.; Li, Z. (2009). Design of neural network


pid controller based on brushless dc motor,
Second International Conference on Intelli-
gent Computation Technology and Automa-
tion pp. 46 – 49.

Morari, M. and Zafirou, E. (1989). Robust Process


Control, Prentice-Hall, Englewood Cliffs, NJ.