Modulo 9

Módulo 9
Controle LQR
Os métodos de projeto estudados nas experiências anteriores estão baseados na loca-

lização dos pólos que é fixada pelo projetista. Em muitos casos no entanto o desempenho
da resposta do sistema é fortemente degradado pela presença de zeros na função de
transferência. Nesses casos uma escolha adequada dos pólos de malha fechada não é
trivial. O método que veremos nesta seção ficou conhecido na literatura com ”regulador
linear-quadrático”(LQR) pois ao invés de utilizar a localização dos pólos como critério de
projeto, o LQR está baseado na minimização de um critério quadrático que está associado
à energia das variáveis de estado e dos sinais de controle a serem projetados.
A energia de um sinal escalar s(t) : [0, ∞) 7→ R é definida por
Z ∞
s(t)2 dt
0
Se s(t) é a tensão aplicada num resistor unitário a integral acima expressa a energia
dissipada nesse resistor por esse sinal. Defini-se L2 o espaço dos sinais que possuem
energia finita.
A energia de um sinal vetorial x(t) : [0, ∞) 7→ Rn é definida por
Z ∞ n
X Z ∞
2
xi (t) dt = x(t)0 x(t) dt
0 i=1 0
e corresponde à soma das energias de todas as componentes do sinal1 . Assim quanto

maior a amplitude e duração do sinal no tempo, maior será sua energia.
1 Cálculo da energia pela equação de Lyapunov

Considere um sistema
ẋ(t) = Ax(t) x(0) = x0
(1)
y(t) = Cx(t)
onde x(t) ∈ Rn é o estado e y(t) ∈ Rny é o vetor de variáveis do sistema cuja energia
queremos calcular. Para esse fim vamos assumir que o sistema é exponencialmente estável,
caso contrário a energia será infinita.
Considere a equação de Lyapunov
A0 P + P A + C 0 C = 0 (2)
1
Pn
Note que z(t)0 z(t) = 2
i=1 zi (t) .
1
De resultados anteriores sabemos que se A, C for observável a solução P da equação
acima será positiva definida. Se não for observável ela será positiva semi-definida e o par
A, C será detectável pois estamos assumindo que A é estável.
Defina a função v(x) = x0 P x e calcule sua derivada temporal para as trajetórias do
sistema (1). Isto resulta em
v̇(x) = x0 P ẋ + ẋ0 P x = x0 P Ax + (Ax)0 P x = x0 (A0 P + P A)x = −x0 C 0 Cx = −y 0 y (3)
Integrando no tempo a relação v̇(x) = −y 0 y de zero à infinito obtemos

Z ∞
v(x(∞)) − v(x(0)) = − y 0 y dt (4)
t=0
Como o sistema é estável teremos limt→∞ x(t) = 0 e portanto chegamos a conclusão de

que a energia do sinal y(t), obtida como resposta do sistema (1) para a condição inicial
x(0) é dada por
Z ∞
y 0 y dt = v(x(0)) = x(0)0 P x(0) (5)
t=0
Esta idéia de calcular a energia da resposta de um sistema através da equação de Lyapu-

nov pode ser estendida para o projeto de controladores. Nesse caso busca-se encontrar um
controlador que minimize a energia de um dado sinal de saı́da escolhido pelo projetista.
A seguir apresenta-se um resultado que foi proposto na década de 1960 e ficou conhecido
como LQR.
2 Controle LQR
Considere o sistema de controle
ẋ(t) = Ax(t) + Bu(t) x(0) = x0 (6)
onde x(t) ∈ Rn é o estado e u(t) ∈ Rnu é o controle. Baseado R ∞nas interpretações acima
podemos afirmar que quanto maior for a energia do estado t=0 x(t)0 x(t) dt mais osci-
latório
R∞ e/ou lento é o sistema. Por outro lado, quanto maior for a energia do controle
t=0
u(t)0 u(t) dt maior o esforço dos atuadores no sentido de que o vetor de controle
possui maiores amplitudes e/ou os atuadores são excitados em regime transitório durante
um tempo maior. Idealmente deverı́amos ter pequena energia do estado e de controle mas
isso não é possı́vel pois o sistema se torna mais rápido (pólos mais à esquerda) graças a
um esforço maior de controle. A filosofia de projeto do controlador LQR é estabelecer
um compromisso entre as energias de estado e controle através do seguinte função custo
a ser minimizada
Z ∞
J = min z(t)0 z(t)dt (7)
u(t) 0
· ¸0 · ¸· ¸
0 x(t) Q N x(t)
z(t) z(t) = (8)
u(t) N0 R u(t)
onde Q, R, N são matrizes de ponderação que definem o sinal z(t) escolhido pelo projetista
para representar o compromisso desejado. Tipicamente Q, R são escolhidas diagonais e
2
P P u
N nula. Nesse caso x(t)0 Qx(t) = ni=1 qi xi (t)2 e u(t)0 Ru(t) = ni=1 ri ui (t)2 onde qi , ri
são os elementos positivos nas diagonais das matrizes Q, R. Como o sinal de controle
a ser projetado deve minimizar a função custo acima, o elemento qi deve ser escolhido
maior que qj quando a minimização da energia da variável xi é prioritária em relação à
minimização da energia de xj . Os elementos ri de ponderação do controle são escolhidos
de forma análoga. Uma técnica para a escolha dessas matrizes de ponderação pode ser
encontrada em [6].
O sinal z(t), que representa a variável cuja energia deve ser minimizada, pode ser
interpretado por exemplo, como uma variável que representa o consumo de energia do
sistema. Razão pela qual se deseja minimizá-la. Através da linearização dessa variável
de consumo podemos representar o sinal linearizado z(t) na forma
z(t) = Cz x(t) + Dz u(t) (9)
então temos
· ¸0 · ¸· ¸
0 x(t) Cz0 Cz Cz0 Dz x(t)
z(t) z(t) = (10)
u(t) Dz0 Cz Dz0 Dz u(t)
de onde tiramos as matrizes Q, N, R por comparação.
Teorema 1 Suponha que o sistema (6) seja estabilizável2 e considere o critério quadrático
(7) com Q > 0, R > 0 dadas e N = 0. A lei de controle que estabiliza o sistema e mini-
miza o critério (7) é u(t) = −Kx(t) onde K = R−1 B 0 P e P é a única solução positiva
definida da equação de Riccati abaixo.
A0 P + P A − P BR−1 B 0 P + Q = 0 (11)
Prova: Defina v(x(t)) = x(t)0 P x(t) onde P > 0 é a solução da equação de Riccati acima.
Como o sistema deve ser estável em malha fechada devemos ter limt7→∞ x(t) = 0. Logo
v(x(∞)) = 0 e podemos reescrever o critério (7) na forma
Z ∞
J = min [x(t)0 Qx(t) + u(t)0 Ru(t) + v̇(x(t))] dt + v(x(0))
u(t) 0
1 1
Defina ξ(t) = R 2 u(t) + R− 2 B 0 P x(t) e reescreva o critério acima como
Z ∞
£ £ ¤ ¤
J = min x(t)0 A0 P + P A − P BR−1 B 0 P + Q x(t) + ξ(t)0 ξ(t) dt + v(x(0)) (12)
u(t) 0
Para a lei de controle proposta no teorema temos J = v(x(0)) = x(0)0 P x(0) pois A0 P +
P A − P BR−1 B 0 P + Q = 0 e u(t) = −R−1 B 0 P x(t) que implica ξ(t) = 0. Para qualquer
outra lei de controle teremos um valor maior da função custo pois ξ(t) será não nulo.
Para mostrar que o sistema em malha fechada é exponencialmente estável note que a
equação de Riccati (11) pode ser reescrita na forma
(A − BK)0 P + P (A − BK) + K 0 RK + Q = 0 (13)
Como P > 0 e K 0 RK + Q > 0, pois Q > 0, concluı́mos que o sistema é exponencialmente

estável pois v(x(t)) é uma função de Lyapunov para o sistema de malha fechada. Para
2
Um sistema é estabilizável se os modos não controláveis, quando existirem, forem estáveis.
3
completar a prova note que os pólos não controláveis, se existirem, também estarão
presentes na malha fechada pois o controle não afeta esses pólos. Assim, para que o
sistema de malha fechada seja estável é preciso que o sistema seja estabilizável. 2
Podemos confirmar que o valor ótimo do critério (7) é J = x(0)0 P x(0) comparando
as equações (13) e (2) e usando o resultado (5) que fornece
Z ∞ Z ∞ Z ∞
0 0 0
z z dt = (x (Q + K RK)x dt = (x0 Qx + u0 Ru) dt = v(x(0)) = x(0)0 P x(0)
t=0 t=0 t=0
(14)
Lembre que em malha fechada o sistema é dado por ẋ = (A − BK)x, o controle por
u = −Kx e a função de Lyapunov para a malha fechada por v(x) = x0 P x onde P > 0 é
a solução da equação de Ricatti (11).
No teorema acima a matriz Q é positiva definida. Podemos relaxar essa hipótese para
Q positiva semi-definida desde que possamos decompor Q = C00 C0 com o par (A, C0 )
observável (para obter P > 0) ou com o par (A, C0 ) detectável (para obter P ≥ 0). Veja
experiência 8 para detalhes.
O controlador LQR possui propriedades interessantes. Essas listadas abaixo foram
tiradas dos livros [4],[3],[5].
Por exemplo, o LQR possui margem de ganho infinita e pode ser reduzido pela metade
que o sistema continua estável. Além disso o LQR apresenta uma margem de fase de pelo
menos 60 graus. Para sistemas MIMO com R = I as mesmas propriedades se aplicam
canal por canal no sinal de controle. No caso SISO o LQR apresenta uma atenuação de
−20 db/década nas altas frequências o que em muitos casos é insuficiente para uma boa
supressão de ruı́dos e dinâmicas não modeladas de altas frequências.
3 Notas
A determinação dos ganhos de um sistema de controle SISO pode ser efetuada com
o auxı́lio de funções disponı́veis nas bibliotecas (toolboxes) do Matlab. Por exemplo,
é possı́vel utilizar o bloco Signal Constraint da biblioteca Simulink Design Optimiza-
tion para efetuar o ajuste iterativo dos ganhos da malha de controle. Estes ajustes são
efetuados para que a resposta temporal de um determinado sinal siga as restrições defi-
nidas pelo usuário. Maiores informações sobre esta ferramenta podem ser obtidas em [7],
para acessar um arquivo de demostração basta digitar na linha de comando do Matlab
”lqg demo”. Outra ferramenta do Matlab que pode ser utilizada é a função SISO Design
Tool da biblioteca Control System Toolbox. Através de uma interface gráfica, é possı́vel
efetuar análises, projetar e sintonizar automaticamente controladores. Um exemplo sobre
o uso desta ferramenta para o projeto e sintonia de um controlador empregando a sı́ntese
LQG pode ser vista em [8]. Deve-ser observar que ambas ferramentas citadas possuem
como restrição o seu uso exclusivamente em sistemas SISO.
Exercı́cios
1 Considere o sistema de 4 tanques linearizado num ponto de equilı́brio e suponha
que podemos medir todos os estados e que as condições iniciais do sistema são
nulas. Suponha ainda que o sinal de referência seja um degrau unitário (r(t)) nos
4
dois canais de entrada e defina a lei de controle u(t) = −Kx(t) + r(t). Projete um
controlador LQR para atingir os seguintes requisitos na resposta:
[i] A duração do transitório do sistema linearizado não deve exceder 120 segun-
dos em nenhum dos tanques e o erro de regime permanente seja nulo.
[ii] A tensão nas bombas não deve exceder 5 volts nem o nı́vel dos tanques
ultrapassar 20 cm.
[iii] Utilize o modelo linearizado e o não linear e lembre que o nı́vel dos tanques
(h(t)) e a tensão nas bombas (v(t)) obedecem a relação h(t) = x(t) + h̄ e v(t) =
u(t) + v̄, onde (h̄, v̄) é o ponto de equilı́brio usado na linearização.
2 Repita o item anterior usando apenas as variáveis medidas na ponderação dos esta-
dos, isto é, a matriz de ponderação dos estados é tal que x0 Qx = x0 C 0 Q0 Cx = y 0 Q0 y
onde Q0 é a matriz de ponderação do vetor y que deve ser ser escolhida. Considere
dois casos para a matriz C. Primeiro considere que y = Cx representa as medidas
feitas nos tanques 1 e 2 e no segundo caso nos tanques 1 e 4.
Referências
[1] Karl Henrik Johansson, The Quadruple-Tank Process: A Multivariable Laboratory Process
with an Adjustable Zero,IEEE TRANSACTIONS ON CONTROL SYSTEMS TECHNO-
LOGY, VOL. 8, NO. 3, MAY 2000.
[2] K.Ogata, ”Engenharia de controle moderno”, Prentice Hall do Brasil, 2a edição, 1990.
¯
[3] U. Mackenroth, ”Robust Control Systems”, Springer Verlag, Berlin, 2004.
[4] R.T.Stefani, C.J.Savant, B.Shahian, ”Design of Feedback Control Systems”, Saunders Col-
lege Publishing, 1994.
[5] B.Friedland, ”Control System design: An introduction to state space methods”, McGraw-
Hill, 1986.
[6] Johnson MJ, Grimble MA, ”Recent trends in linear optimal quadratic multivariable control
system design”, IEE Proceedings Part D Control Theory and Applications, 134 (1), pp.
53-71, 1987
[7] Mathworks, ”Simulink Design Optimization 1.1”, http://www.mathworks.com/pl_

sloptim.
[8] Mathworks, ”Automated LQG Tracker Design for SISO LTI Model ”, http://www.
mathworks.com/products/control/demos.html.

Modulo 9

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Modulo 9

Diunggah oleh

Hak Cipta:

Format Tersedia

Módulo 9

Os métodos de projeto estudados nas experiências anteriores estão baseados na loca-

e corresponde à soma das energias de todas as componentes do sinal1 . Assim quanto

1 Cálculo da energia pela equação de Lyapunov

v̇(x) = x0 P ẋ + ẋ0 P x = x0 P Ax + (Ax)0 P x = x0 (A0 P + P A)x = −x0 C 0 Cx = −y 0 y (3)

Integrando no tempo a relação v̇(x) = −y 0 y de zero à infinito obtemos

Como o sistema é estável teremos limt→∞ x(t) = 0 e portanto chegamos a conclusão de

Esta idéia de calcular a energia da resposta de um sistema através da equação de Lyapu-

ẋ(t) = Ax(t) + Bu(t) x(0) = x0 (6)

z(t) = Cz x(t) + Dz u(t) (9)

de onde tiramos as matrizes Q, N, R por comparação.

(A − BK)0 P + P (A − BK) + K 0 RK + Q = 0 (13)

Como P > 0 e K 0 RK + Q > 0, pois Q > 0, concluı́mos que o sistema é exponencialmente

[7] Mathworks, ”Simulink Design Optimization 1.1”, http://www.mathworks.com/pl_

Anda mungkin juga menyukai