Pierre Rouchon
MINES ParisTech
CAS - Centre Automatique et Systmes
Unit Mathmatiques et Systmes
Fvrier 2011
Les
mcanismes de rgulation et d'adaptation, largement rpandus dans la nature, sont aussi la base du fonctionnement des systmes crs et utiliss
par l'homme. Depuis trs longtemps, on les retrouve dans diverses machines
et inventions. Avec la rvolution industrielle et le rgulateur de Watt, on a
vu apparatre les premires formalisations modernes : modlisation (avec les
quations direntielles inventes par Newton) et stabilit. Le point de dpart de la thorie mathmatique des systmes remonte ainsi aux travaux du
mathmaticien et astronome anglais G. Airy. Il fut le premier tenter une
analyse du rgulateur de Watt. Ce n'est qu'en 1868, que le physicien cossais J. C. Maxwell publia une premire analyse mathmatique convaincante
et expliqua certains comportements erratiques observs parmi les nombreux
rgulateurs en service cet poque. Ses travaux furent le point de dpart de
nombreux autres sur la stabilit, notion marque par le travail de H. Poincar
et A. M. Lyapounov, sa caractrisation ayant t obtenue indpendamment
par les mathmaticiens A. Hurwitz et E. J. Routh. Durant les annes 1930,
les recherches aux Bell Telephone Laboratories sur les amplicateurs ont
t l'origine de notions encore enseignes aujourd'hui. Citons par exemple
les travaux de Nyquist et de Bode caractrisant partir de la rponse frquentielle en boucle ouverte celle de la boucle ferme.
Tous ces dveloppements ont vu le jour dans le cadre des systmes linaires ayant une seule commande et une seule sortie. On disposait d'une
mesure sous la forme d'un signal lectrique. Cette dernire tait alors entre dans un amplicateur qui restituait en sortie un autre signal lectrique
qu'on utilisait comme signal de contrle. Ce n'est qu'aprs les annes 1950
que les dveloppements thoriques et technologiques (avec l'invention des calculateurs numriques) permirent le traitement des systmes multi-variables
linaires et non linaires ayant plusieurs entres et plusieurs sorties. Citons
comme contributions importantes dans les annes 1960 celles de R. Bellmann
avec la programmation dynamique, celles de R. Kalman avec la commandabilit, le ltrage et la commande linaire quadratique ; celles de L. Pontryagin
avec la commande optimale. Ces contributions continuent encore aujourd'hui
alimenter les recherches en thorie des systmes. Le champ d'application
s'est considrablement tendu. Alors qu'aujourd'hui l'Automatique est omniprsente dans les domaines industriels tels que l'aronautique, l'arospatiale,
l'automobile, ou le gnie des procds, certaines recherches actuelles s'appuyant sur des notions cls prsentes dans ce cours concernent la construction d'un premier calculateur quantique.
Objectif de ce cours
de vos critiques et des erreurs que vous auriez dcouvertes par un message
explicatif
nicolas.petit@mines-paristech.fr ou
pierre.rouchon@mines-paristech.fr
1.2
7
. . . . . . . . . . . . . . .
. . . . . . . . . . . .
11
1.1.2
14
1.1.3
. . . . . . . . . .
15
18
1.2.1
18
1.2.2
1.2.3
22
1.2.4
Polynme caractristique . . . . . . . . . . . . . . . . .
24
1.2.5
27
1.2.6
. . . . . . . . . . . . . .
. . . . . .
. . . . . . . . . . . .
Lyapounov . . . . . . . . . . . . . . . . . . . . . . . . .
1.3
1.4
1.5
1.1.1
19
28
. . . . . . . . . . . . . . .
29
1.3.1
29
1.3.2
Fonctions de Lyapounov
. . . . . . . . . . . . . . . . .
31
1.3.3
Robustesse paramtrique . . . . . . . . . . . . . . . . .
36
1.3.4
37
1.3.5
38
. . . . . . . . . . . . . .
45
1.4.1
Perturbations singulires . . . . . . . . . . . . . . . . .
46
1.4.2
51
1.4.3
. . . . . .
52
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
55
Cas d'tude
1.5.1
Prsentation du systme
1.5.2
Un rgulateur PI
. . . . . . . . . . . . . . . . .
55
. . . . . . . . . . . . . . . . . . . . .
56
1.5.3
1.5.4
1.5.5
. . . . . . . . . . . . . . .
58
. . . . . . . . . . . . . . . .
59
60
1.5.6
1.5.7
68
1.5.8
70
1.5.9
1.6
Cas d'tude
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 Fonctions de transfert
2.1
2.2
2.3
2.4
74
79
. . . . . . . . . . . . . . . .
80
Questions de robustesse
. . . . . . . . . . . . . . . . .
80
2.1.2
81
2.1.3
83
2.1.4
Simplications ples-zros
. . . . . . . . . . . . . . . .
84
2.1.5
Formalisme
. . . . . . . . . . . . . . . . . . . . . . . .
85
2.1.6
87
. . . . . . . . . . . . .
90
2.2.1
. . . . . . . . . . .
90
2.2.2
92
Marge de robustesse
. . . . . . . . . . . . . . . . . . . . . . .
Critre de Nyquist
2.3.2
2.3.3
2.3.4
2.3.5
Complments
. . . . . . . . . . . . . . . . . . . .
94
2.3.1
94
. . . . . . . . . . . . . . . . . . . . . . . . . . . 108
Calcul de tous les contrleurs PID stabilisant un systme du premier ordre retard
. . . . . . . . . . . . . 108
2.4.2
2.4.3
Prdicteur de Smith
2.4.4
. . . . . . . . . . . . . . . . . . . 114
. . . . . . . . . . . 116
3 Commandabilit, stabilisation
3.2
72
2.1.1
2.4.1
3.1
63
119
3.1.2
Planication de trajectoires
. . . . . 120
3.1.3
3.1.4
. . . . . . . . . . . . . . . 121
3.2.1
3.3
3.4
3.5
Commandabilit linaire
. . . . . . . . . . . . . . . . . . . . . 131
3.3.1
3.3.2
Invariance . . . . . . . . . . . . . . . . . . . . . . . . . 134
3.3.3
3.3.4
. . . . . . . 135
3.4.2
3.4.3
Planication de trajectoires
3.4.4
Rgulateur LQR
Complments
. . . . . . . . . . . . . . . 153
. . . . . . . . . . . . . . . . . . . . . 155
. . . . . . . . . . . . . . . . . . . . . . . . . . . 163
3.5.1
3.5.2
4.2
4.3
4.4
4.5
4.6
Un exemple
173
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
4.1.1
4.1.2
4.1.3
4.1.4
. . . . 175
. . . . . . . . . . . . . . . 178
. . . . . . . . . . . . . . . . . . . . 179
4.2.1
Dnition
. . . . . . . . . . . . . . . . . . . . . . . . . 179
4.2.2
Critre . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
4.2.3
4.3.2
4.3.3
Observateur-contrleur . . . . . . . . . . . . . . . . . . . . . . 187
4.4.1
4.4.2
Filtre de Kalman
Formalisme
4.5.2
4.6.1
. . 189
. . . . . . . . . . . . . . . . . . . . . . . . . 190
4.5.1
Complments
. . . . 187
. . . . . . . . . . . . . . . . . . . . . . . . 191
. . . . . . . . . . . . 192
. . . . . . . . . . . . . . . . . . . . . . . . . . . 199
. . 199
4.6.2
4.6.3
Contraction
. . . . . . . . . . . . . . . . . . . . . . . . 202
207
215
C Moyennisation
221
C.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
C.2
Le rsultat de base
C.3
C.4
C.5
. . . . . . . . . . . . . . . . . . . . . . . . 222
229
D.1
D.2
D.3
. . . . . . . . . . . . 231
. . . . . . . . . . . . . 234
. . 236
D.3.1
Transforme en
. . . . . . . . . . . . . . . . . . . . . 237
D.3.2
D.4
D.5
D.5.2
D.5.3
D.5.4
. . . . . . . . . . 239
. . . . . . 241
. . . . . . . . . . . . . . 242
242
Rfrences
246
Index
253
Chapitre 1
Systmes dynamiques et
rgulateurs
d
x1 = v1 (x1 , ..., xn , u1 , ..., um , t)
dt
d
x2 = v2 (x1 , ..., xn , u1 , ..., um , t)
dt
.
.
.
o
les
d
xn = vn (x1 , ..., xn , u1 , ..., um , t)
dt
les grandeurs x1 ,...,xn sont appeles tats, les grandeurs u1 ,...,um sont
entres (ou commandes), et n et m sont des entiers. Le temps t est ici
(vi )i=1,...,n
peut tre trs faible, mme si, comme on le verra par la suite, de nombreuses
proprits fondamentales proviennent justement de leur rgularit.
Il est commode d'crire le systme direntiel prcdent sous la forme
vectorielle (appele forme d'tat)
d
x = v(x, u, t)
dt
(1.1)
Pour calculer l'volution future d'un tel systme, il faut connatre les grandeurs
t 7 u(t)
CHAPITRE 1.
y = h(x, u, t) Rq
o
(1.2)
n 1.
Le formalisme (1.1) (1.2) que nous venons de prsenter est trs gnral.
On trouve un vaste choix d'exemples dans les domaines de la mcanique
(les quations d'Euler-Lagrange, voir [44] par exemple, exprimant le principe de moindre action sont des quations d'ordre 2 dans les variables de
congurations (positions gnralises), l'tat est alors constitu des positions
gnralises et leur vitesses), les machines lectriques (voir [46]), l'aronautique (voir l'Exemple 1), la robotique (voir [58]), la chimie, la biochimie, les
sciences du vivant (voir
[37]) .
u.
x en choiu = k(t, x)
d
x = v(x, k(t, x), t)
dt
En pratique, on sera souvent limit l'utilisation de la mesure dnie en (1.2).
Dans ce contexte, les rtro-actions envisageables sont de la forme
u = k(t, y).
x.
1.1.
Que ce soit parce qu'on a choisi une loi de rtroaction particulire ou parce
que le systme considr ne possde pas de commande, il est important de
comprendre comment tudier les systmes libres de la forme
d
x = v(x, t)
dt
(1.3)
On dira qu'un tel systme est stationnaire (par opposition au cas (1.3) ins-
tationnaire) lorsque
l'quation s'crit
d
x = v(x)
dt
Un des concepts cls dans l'tude des systmes dynamiques est la notion
de point d'quilibre (appel galement point stationnaire )
x. On appelle point
d'quilibre, un point
point, c.--d.
Dans le cas d'un systme stationnaire, les points d'quilibre sont simplement
caractriss par l'quation
v(
x) = 0.
d
x = A(t)x + B(t)u
dt
y = C(t)x + D(t)u
(1.4)
(1.5)
Comme nous le verrons (notamment la Section 1.3), cette approche est intressante car elle fournit souvent une information locale sur le comportement
de (1.3) autour de
x.
10
CHAPITRE 1.
[40] pour une discussion plus dtaille). Les systmes non linaires peuvent
diverger en temps ni alors que c'est seulement en temps inni qu'un systme
linaire peut diverger (c.--d. que son tat tend vers l'inni). Un systme non
linaire peut avoir de multiples points d'quilibre isols. L'unicit des points
d'quilibre n'est pas non plus garantie dans le cas des systmes linaires, mais
elle apparat sous la forme de sous espaces vectoriels de points d'quilibre.
Enn, et c'est un des faits les plus marquants, un systme non linaire peut
possder un ou plusieurs cycles limites. C'est une des particularit les plus
importantes et aussi l'une des plus frquemment observes en pratique. Alors
que les systmes linaires peuvent avoir des trajectoires oscillantes, l'amplitude de celles-ci dpendent de la condition initiale. Dans le cas non linaire il
est possible d'observer des trajectoires oscillantes dont l'amplitude ne dpend pas de la condition initiale. C'est en exploitant cette proprit qu'on
a construit les premiers circuits lectriques oscillants qui sont la base de
l'lectronique (et de la synthse sonore notamment). titre d'illustration,
on pourra se reporter l'onde de densit observe dans les puits de ptrole
prsents dans l'Exemple 10.
ym
xm
et
Vm est sa
m , m et m correspondent des angles, et on utilise deux variables
intermdiaires A et T pour exprimer les seconds membres de la dynamique
correspondent aux coordonnes du centre de gravit de l'engin,
vitesse,
x m = Vm cos m
y m = Vm sin m
1
1
T cos T SVm CD (T )
Vm =
m
2
o sin T =
1
2
2
1 + tan m + tan m
g
m = tan A
Vm
tan
o 1 + tan A =
tan m
m = 0.3(c m )
m = 0.3(c m )
Les deux commandes sont
c , c ,
tandis que
m(t)
et
T (t)
(1.6)
1.1.
11
CD (.)
et
sont des
x(0) = x0 ,
d
x(t) = v(x(t), t)
dt
(1.7)
Face ce problme, on est en droit d'esprer que les proprits suivantes sont
satisfaites
1. qu'une solution avec ces conditions initiales existe
2. que cette solution soit unique
3. que les solutions dpendent continment des conditions initiales
On trouvera une dmonstration lmentaire du thorme de Cauchy-Lipschitz
( partir du schma d'Euler explicite et de la notion de solution approchante)
dans l'Annexe A. Ce thorme dont une version un peu plus gnrale est
donne ci-dessous garantie l'existence et l'unicit pour des temps courts. En
12
CHAPITRE 1.
plus dlicate. On peut la garantir sous des hypothses fortes (voir Lemme 1).
Enn, la continuit de la solution par rapport sa condition initiale peut tre
garantie, mais sous une hypothse plus forte. C'est l'objet du Thorme 2.
(x, t) 7 v(x, t) R
Rn R
x)
pour tout
il existe
t 7 v(x, t)
Soit
t)
pour tout
(x, t) Rn R,
y Rn vriant
x Rn ,
l'application
x(0) = x0 ,
d
x(t) = v(x(t), t),
dt
rapport
x0 Rn et pour
] a, b[3 t 7 x(t) Rn
a, b > 0
0,
x(t) =
x=0
l'unique solution
1
(t + 2 l)2 .
4
d
toute solution de
x = 1/t n'est pas dnie en t = 0 car 1/t n'est pas
dt
p
d
localement intgrable autour de 0 alors que
x = 1/ |t| admet des
dt
solutions parfaitement dnies en 0.
4. +
x, chacune de ses composantes est une fonction mesurable du temps dont
l'intgrale de la valeur absolue sur tout intervalle born est borne, voir [52].
1.1.
13
10
9
8
7
6
5
4
3
2
1
Figure
0.2
0.4
0.6
0.8
1
t
1.2
1.4
1.6
1.8
Soit
Rn R (x, t) 7
v
continues par
v(x, t) Rn une fonction continue drives partielles x
i
0
n
rapport x. Soit x R une condition initiale, il existe une unique solution
t 7 x(t) telle que x(0) = x0 . Cette solution, considre comme une foncxi (x0 ,t)
0
tion de la condition initiale x , admet des direntielles partielles
x0
j
x0
et
t.
Ce thorme est dmontr dans [36, page 29]. Il est illustr par la Figure 1.2 o on a reprsent trois solutions de la mme quation direntielle
1
scalaire ( second membre C ) obtenues en faisant varier la condition initiale. On remarque que les courbes ne se croisent pas (cela est interdit par la
proprit d'unicit). Elles semblent s'carter lorsque
L'existence pour tout temps
croit.
t>0
Lemme 1 (existence globale en temps). En plus des hypothses du ThoM0 (t), M1 (t) > 0 fonctions localement inn
tgrables telles que pour tout x R , kv(x, t)k M0 (t) + M1 (t)kxk, alors la
solution (unique) au problme de Cauchy est dnie pour t ] , +[.
14
CHAPITRE 1.
Noter que ce lemme ne dit pas que les trajectoires restent bornes. A
d
x = x : elles peuvent
priori, elles ne le sont pas comme le montre l'exemple
dt
tendre vers l'inni mais en temps inni.
d
x(t) = f (x(t), u(t), p),
dt
C 1 de x, u et p (n, m, r N).
m
On suppose ici que la fonction R 3 t 7 u(t) R est continue par morceaux.
Ainsi, les hypothses du thorme 1 sont satisfaites et donc la solution t 7
x(t) existe pour t autour de 0 et est unique. On regarde sa dpendance des
petites variations de l'entre u, du paramtre p ou de sa condition initiale
x0 . Nous ne prsentons pas de faon rigoureuse les rsultats de drivabilit
0
de x par rapport u, p et x . Ils dcoulent du thorme 2 et du fait que
f est C 1 . Nous prsentons simplement la faon de calculer directement les
0
drives partielles de x par rapport aux composantes de x et p, ainsi que la
direntielle de x par rapport u.
o
x Rn , u Rm , p Rr , f
x(0) = x0
d
(x)(t) =
dt
f
x
x +
f
u
u(t) +
f
p
p
t
f
0
avec comme condition initiale x(0) = x . Les matrices Jacobiennes
,
x
f
f
et
sont values le long de la trajectoire (x(t), u(t), p). C'est pourquoi
u
p
f
f
f
nous les notons
,
et
. Ainsi, x est solution d'une quation
x t
u t
p
t
direntielle ane coecients dpendant a priori du temps :
d
(x)(t) = A(t)x + b(t), x(0) = x0 ,
dt
f
f
A(t) = x t et b(t) = u t u(t) + f
p.
p
t
Supposons que l'on souhaite calculer la drive partielle de
pk ,
le
k -ime
paramtre scalaire (k
{1, . . . , r}).
On
x par rapport
n
note W (t) R
1.1.
15
t.
est la
d
W =
dt
f
x
W+
f
pk
t
d
V =
dt
f
x
V
t
si
o ici
jk
est le symbole de
uk
uk
t.
par rap-
On parle alors
Dnition 1 (Stabilit (au sens de Lyapounov) et instabilit). On reprend les notations et hypothses du Thorme 1 de Cauchy Lipchitz. On suppose de plus qu'il existe un point d'quilibre x
Rn caractris par v(
x, t) = 0
t R.
L'quilibre x
Rn est dit stable (au sens de Lyapounov) si et seulement
0
si pour tout > 0, il existe > 0 tel que pour toute condition initiale x
0
vriant kx x
k , la solution de dtd x = v(x, t) issue de x0 t = 0, est
dnie pour tout temps positif et vrie kx(t) x
k pour tout temps t 0.
pour tout
ment s'il est stable et si, de plus, il existe > 0 tel que toutes les solud
0
tions x(t) de dt x = v(x, t), partant en t = 0 de conditions initiales x telles
0
que kx x
k , convergent vers x lorsque t tend vers +.
16
CHAPITRE 1.
est
x.
Exemple 2
(Oscillateur harmonique)
>0
est la pulsation)
d
x2 = 2 x1
dt
(1.8)
d
x2 = 2 x1 2 x2
dt
(1.9)
d
x1 = x2 ,
dt
Le rajout d'un amortissement
d
x1 = x 2 ,
dt
rend alors l'quilibre
mension
> 0
(0, 0)
]0, 1[ le
pour 1,
retour
le retour
l'quilibre se fait quasiment sans oscillation, i.e., avec un trs petit nombre
de changements de signe pour
x1
et
x2 .
la Section 1.2 consacre aux systmes linaires, cela vient du fait bien connu
que les racines
du polynme caractristique
s2 + 2 s + 2 = 0
de l'quation du second ordre
d
d2
x1 + 2 x1 + 2 x1 = 0
2
dt
dt
1.1.
17
Figure
> 1 et complexes conjugues avec une partie relle ngative si 0 < < 1. Noter enn
qu'aucun des quilibres du double intgrateur, (1.8) avec = 0, n'est stable.
Exemple 3
5
linaris tangent ) . Avant d'noncer un rsultat fondamental dans ce cadre
5. Ce calcul l'ordre
spectrale
18
CHAPITRE 1.
d
x(t) = Ax(t)
(1.10)
dt
n
avec x(t) R et A une matrice n n coecients constants. Une des principales spcicits des systmes linaires est que, par homothtie, les proprits locales sont galement globales. C'est en particulier vrai pour la stabilit
asymptotique qui peut s'tablir, comme nous le verrons au Thorme 4, en
tudiant les valeurs propres de
A.
exp(tA)
ment convergente
t2
tk
exp(tA) = I + tA + A2 + . . . + Ak + . . .
2!
k!
(1.11)
matrice
x(t) = exp(tA) x0
Proposition 1
L' exponentielle
= exp(tA) A = A exp(tA)
exp(P AP 1 ) = P exp(A)P 1
exp(A) = limm+ I +
A m
m
det(exp(A)) = exp(tr(A))
o
et
1.2.
19
A,
lorsque
matrice de Jordan (voir par exemple [34]). Le rsultat suivant prcise les
notations.
Thorme 3
(Rduction de Jordan)
det(sI A) =
Soit
une matrice
nn
dont le
q
Y
(s i )i ,
(i 6= j ,
si
i 6= j)
i=1
A = T 1 JT
o
J1
0
J2
J =
..
0
avec pour
Jq
i = 1, ..., q ,
i vi,1
0
.
Ji =
..
.
..
0
o pour tout
i, j , vi,j
vaut
ou
vi,2
..
..
..
... ...
...
..
..
.
..
i
0
vi,i1
i
1.
Thorme 4 (CNS de stabilit asymptotique d'un systme linaire stationnaire). Soit le problme de Cauchy pour le systme linaire stationnaire
d
x = Ax, x(0) = x0 o A est une matrice n n et x0 Rn . Ce systme
dt
0
possde la proprit que limt x(t) = 0 quel que soit x (c.--d. que le point
d'quilibre
20
CHAPITRE 1.
Considrons
pour tout
exp(tA)v =
i
X
t
i=0
i!
Av=
(t)i v = exp(t)v
i=0
limt x(t) = 0
associ. Il vient,
faut que toutes les valeurs propres aient une partie relle
<(i )
strictement
ngative.
exp(At) = T exp(tJ)T 1
Les matrice
et
D = diag(i )
o les
A.
On obtient directement
exp t1
exp t2
exp(tD) =
..
0
kM k =
kexp(tD)k =
exp tn
Notons
M = (mi,j )
matrice
n n.
On
|exp(ti )| n exp(t)
i=1,...,n
D'autre part,
exp(tN ) = I + tN +
t > 0,
t2 2
tn1
N + ... +
N n1
2
(n 1)!
exp(tN ) p(t)
par le polynme
n1
t
p(t) , 1 + t kN k + t2 kN 2 k + ... + (n1)!
kN n1 k. Il vient alors
limt kexp(tA)k = 0,
d'o la conclusion.
1.2.
21
Dans le cas o le systme linaire est eectivement (globalement) asymptotiquement stable, on a en fait convergence exponentielle vers zro de toutes
les trajectoires. Le rsultat suivant prcise ce point, on peut utiliser n'importe quel minorant strict (en valeur absolue) des parties relles des valeurs
propres comme constante
dans [12].
K>0
et
>0
tel
t0
kexp(tA)k K exp (t)
et donc
kx(t)k K
x0
exp (t)
Le point
d
d'quilibre x = 0 du systme linaire dt x = Ax est stable si et seulement si
toutes les valeurs propres de A ont une partie relle ngative ou nulle et si
toute valeur propre ayant une partie relle nulle et une multiplicit suprieure
ou gale
1.
L'ide de la dmonstration du Thorme 5 repose sur le calcul de l'exponentielle d'une matrice de Jordan d'ordre suprieur
1
..
Jp =
0
.
..
..
0
Dans ce cas, l'exponentielle de matrice
0 ...
exp(tJp ) = exp(t)
..
.
0 ...
Considrons le cas
et d'ordre
exp(tJp )
1.
vaut
...
..
..
tp1
(p1)!
.
.
.
t
1
Les termes polynomiaux n'apparaissent que dans ce cas. Dans le cas d'une
valeur propre partie relle nulle, le terme exponentiel ne procure pas d'amortissement et par consquent, ne domine pas les termes polynomiaux. Ensuite,
22
CHAPITRE 1.
t croit. On en dduit
met en vidence un couplage entre les tats, qui rsultent en une instabilit.
Exemple 4.
partie relle ou nulle. Si les valeurs propres partie relle nulle sont toutes
nulle et de multiplicit
0
1
A1 =
0
0
1 0
0 0
0 0
0 1
0
0
,
1
0
0
1
A2 =
0
0
1 0
0 1
0 0
0 1
0
0
1
0
A),
n=2
et
n = 3.
Dimension n = 2
Les principaux cas sont illustrs sur les Figures 1.5, et 1.6. On a not
et
conjugues),
Dimension n = 3
La Figure 1.7, montre sur un exemple comment, partir des portraits de
phases en dimension 2, on construit, dans les cas gnriques, le portrait de
3
phases en dimension 3 : il sut de dcomposer R en somme d'espaces propres
1.2.
23
Figure 1.5 Portraits de phases plans et linaires lorsque les valeurs propres
de
A, 1
et
2 ,
d
x = Ax, lorsque les
dt
valeurs propres de A, 1 et 2 , sont relles (1 et 2 vecteurs propres de A,
lorsqu'ils existent).
plans et linaires,
24
CHAPITRE 1.
trajectoire
valeurs propres
A.
A (son
P (s)
P (s) = det(sI A) = s
n1
X
s = 0
=0
partir des coecients de la matrice
nme
P (s)
les coecients
de ce poly-
se calculent simplement.
Exemple 5
Soit
t 7 y(t) R
solution de
d
d
dt x = Ax, l'oprateur dt par s la variable
C pour le systme linaire de n quations
s
sx = Ax admette des solutions x non triviales. Ce qui quivaut dire que
la matrice sI A n'est pas inversible, c'est dire que son dterminant P (s), un polynme
de degr n, est nul
de Laplace et en cherchant les conditions sur
inconnues
1.2.
25
avec pour
la matrice suivante
0 1
0 ... ...
0
0 0
1
0
...
0
.
..
. ... ... ... ...
.
.
A=
.
0 . . . .. 0
1
0
Puisque la matrice
sn y = 0 y + 1 sy + . . . + n1 sn1 y
La condition pour que cette quation linaire en
donne
P (s)
P (s) = sn 0 1 s . . . n1 sn1 = 0
propres sont partie relle strictement ngative, i.e., les zros du polynme
P (s)
que
d'quilibre
P (s)
toutes les racines rsident dans le demi plan complexe ouvert gauche (i.e.
sont partie relle strictement ngative) est un polynme Hurwitz.
Les polynmes Hurwitz sont caractriss par la condition ncessaire et
susante dtaille dans le thorme suivant.
et impaires de
P (s),
si bien que
Hurwitz si et seulement si
1. tous les zros de
w 7 Pp (w2 )
et de
w 7 Pi (w2 )
tincts
2.
an
et
an1
w 7 Pi (w2 )
(no-
tes
0 < wp1 < we1 < wp2 < we2 < ...
26
CHAPITRE 1.
Exemple 6.
2
3
Considrons le polynme P (s) = 36 + 34s + 61s + 36s +
29s4 + 11s5 + 4s6 + s7 . On a alors Pp (s2 ) = 36 + 61s2 + 29s4 + 4s6 et Pi (s2 ) =
34 + 36s2 + 11s4 + s6 . Les racines positives ranges en ordre croissant des
polynmes
3/2
2]
[1.2873
et
1.8786
vrier numriquement.
De manire gnrale, ce n'est pas en calculant les racines du polynme
caractristique qu'on peut vrier que les parties relles des valeurs propres
sont ngatives, mais en analysant ses coecients. C'est l'objet du critre de
Routh explicit dans le Thorme 7. On sait d'ailleurs depuis Galois, qu'il
n'existe pas de formule gnrale utilisant des radicaux donnant les racines
d'un polynme partir de ses coecients pour un degr
Thorme 7
(Critre de Routh)
polynme de degr
Soit
n 5.
P (s) = a0 + a1 s + ... + an sn
un
sn
sn1
sn2
sn3
.
.
.
s0
an
an1
bn1
cn1
.
.
.
gn1
an2
an3
bn3
cn3
.
.
.
.
an4 ...
an5
bn5
cn5
.
.
.
.
bn1
1 an an2
=
an1 an1 an3
Le nombre de
1 an an4
bn3 =
, ...
an1 an1 an5
1 an1 an3
cn1 =
...
bn1 bn1 bn3
racines de P (s) ayant une partie relle positive est gal
au
P (s)
1.2.
27
0 = det(A) < 0
pour
n=3
et
1 = tr(A) < 0.
et
(1.12)
P (s) = s3 2 s2 1 s 0 ,
0 < 0,
1 < 0,
2 < 0
0 < 1 2 .
et
(1.13)
b(t)
d
x = Ax + b(t),
dt
x Rn ,
b(t) Rn
s'crit
x(t) = exp(tA)x(0) +
(1.14)
0
Si
dpend du temps
A(t1 ) et A(t2 ) commutent, c.--d. A(t1 )A(t2 ) = A(t2 )A(t1 ) pour tout couple
(t1 , t2 ).
Ainsi cette quadrature instationnaire, fausse en gnrale pour n > 1, n'est
valide qu'essentiellement en dimension 1 (o la commutation est trivialement
si
d
x = a(t)x + b(t),
dt
xR
est
Z
x(t) = exp
a( ) d
0
partir de la dimension
Z
x(0) +
Z
exp
2,
a() d b( ) d
28
CHAPITRE 1.
d2
x = (a + bt)x qui n'admet pas
dt2
de quadrature simple avec des fonctions usuelles (exponentielle, logarithme,
Un exemple est l'quation d'Airy [1] :
...) et qui dnit les fonctions d'Airy, une classe particulire de fonctions
spciales .
Il est faux en gnral de dire que, si chaque instant t,
0.
1 + 1.5 cos2 t
1 1.5 sin t cos t
A(t) =
1 1.5 sin t cos t 1 + 1.5 sin2 t
Pour tout t, les valeurs propres de A(t) sont 0.25 0.25 7i. Or, le systme
d
x(t) = A(t)x(t) a pour solution
dt
0.5t
e cos t et sin t
x(t) =
x0
e0.5t sin t et cos t
qui, pour des conditions initiales
diverge lorsque
t +.
x0
aussi proches de
qu'on le souhaite,
par la matrice
A(t) =
0
1
(1 + k(t)) 0.2
correspondant un systme masse-ressort dont le ressort a une raideur variable dans le temps. Si on choisit
stable, alors que pour tout temps
k(t) = cos(2t)/2,
A(t),
t.
A(t)
de dimension
dont les
1.3.
29
Thorme 8 (Sylvester).
Mn (R)
Thorme 9
(quation de Lyapounov)
Soit
une matrice et
une ma-
AT P + P A = Q
(1.15)
et
Exemple 7.
Le systme suivant
d
x1 = a1 x1 x2 x1 + a2
dt
d
x2 = x2 + x21
dt
possde, suivant les valeurs des paramtres
a1 , a2 ,
intressant. Il est tudi en dtail dans [54]. Il s'agit en fait d'un simple sysd
tme linaire dt x = a1 x+u+a2 o on choisit une commande proportionnelle
30
CHAPITRE 1.
Cycle limite
3
Foyer
Foyer
Point selle
0
4
Figure 1.8 Portrait de phase d'un systme avec deux foyers stables, un
point selle et un cycle limite instable.
8
dont le gain k varie (de manire adaptative ) selon l'quation difd
2
frentielle dt k = k + x . L'ide est que tant que le x n'a pas converg vers
zro, le gain k augmente de telle sorte que la commande entrane eective-
u = kx
tant exponentielle,
la croissance de
si le paramtre
du systme
ces valeurs, le systme possde deux foyers stables, un cycle limite instable et
un point selle. Lorsque le systme converge, ce n'est pas vers zro.
D'aprs le thorme suivant, il est possible de dduire la stabilit asymptotique locale d'un point d'quilibre hyperbolique d'aprs son linaris tangent.
= v(x)
v
(
x) =
x
vi
xj
1i,jn
Thorme 10
commande adaptative
1.3.
31
et
x Rn
tel que
v(
x) = 0.
Le point
de
d
x = v(x)
dt
est localement asymptotiquement stable (c.f. Dnition 1) si les valeurs
propres de la matrice Jacobienne
v
(
x) =
x
vi
xj
1i,jn
est
d
d
v
x = (x x) = v(x) = v(
x) +
(
x)(x x) + (x x)
dt
dt
x
(x x) rassemble les termes d'ordres suprieurs. On ne considre que les
1 en = x x pour en dduire le systme direntiel linaire
coecients constants (A ne dpend pas du temps) suivant
termes d'ordre
d
= A
dt
v
(
x) la matrice Jacobienne de v en x. On sait,
x
d'aprs le Thorme 4, que toutes ses solutions convergent vers 0 lorsque
avec
(t) Rn
et
A =
Thorme 10 nonce que, si le systme linaire du premier ordre est asymptotiquement stable, alors les termes d'ordre suprieur ne peuvent pas tre
dstabilisateurs pour des conditions initiales proches de l'quilibre. La preuve
de ce rsultat est reproduite un peu plus loin. Elle utilise la seconde mthode
de Lyapounov, un autre outil pour montrer la stabilit d'un point d'quilibre
qui s'inspire la notion d'nergie et de dissipation. Nous dveloppons cette
mthode maintenant.
V (x1 , x2 ) =
1
2
(x1 )2 + (x2 )2
2
2
32
CHAPITRE 1.
qui n'est autre que son nergie totale. Un calcul simple montre que pour
solution de (1.9), on a
V d
V d
d
(V (x1 (t), x2 (t))) =
x1 +
x2
dt
x1 dt
x2 dt
Or
d
x
dt 1
= x2
et
d
x
dt 2
= 2x2 2 x1 .
Donc
d
V = 2(x2 )2 0
dt
Ainsi,
sitive, elle converge vers une valeur positive. Il est intuitif de penser que
d
V converge vers 0 et donc que x2 converge vers 0. Mais si x2 converge
dt
vers 0, il est aussi intuitif de penser que sa drive converge aussi vers 0.
d
x = 2x2 2 x1 et donc x1 tend vers 0 aussi. Le raisonnement
Or,
dt 2
ci-dessus n'est pas trs rigoureux mais il est correct car on a aaire des
V
(0)
=
V , dtd 2 V converge aussi vers 0. Ce qui nous donne
dt
dt
0 dt2
que x2 et x1 convergent vers 0. En fait, nous aurions pu faire le raisonne-
Comme
ment l'identique pour un systme gnral pour peu que nous disposions
d'une fonction
V,
t 7 x1 (t)
et
t 7 x2 (t).
C'est la
9. Une fonction
il existe
1.3.
33
Thorme 11
(Invariance de LaSalle)
n
Soit
Rn
V dcrot
x Vc ,
2. que
d
le long des trajectoires de dt x
= v(x),
| V (x) c}
de
X V
d
V (x) = V (x) v(x) =
(x) vi (x) 0
dt
xi
i=1
x0 Vc , la solution de dtd x = v(x) reste
temps t > 0 (pas d'explosion en temps ni) et
Vc ,
d
x Vc | V (x) = 0 .
dt
Une fonction
n+1
quations
d
1 = v1 ()
dt
.
.
.
d
n = vn ()
dt
n
X
V
i=1
xi
() vi () = 0
n inconnues (1 (t), . . . , n (t)) Vc qui sont des fonctions continment drivables de t. Pour rsoudre ce systme, i.e., obtenir les quations de l'ensemble
et
Vc
34
CHAPITRE 1.
Dans le cas o
que
(t) = x
x Vc
v(
x) = 0 ,
il est clair
Vc
dmarrent dans
x.
quand
kxk
cR
tend vers
Exemple 8.
dim(x) = 1,
de la forme
d
x = v(x(t))
dt
o
2.
R +
0
x 6= 0
xv(x) < 0
R0
v(x)dx = , et v(x)dx = +
1. pour tout
La forme gnrale de
on a
Z
V (x) =
v( )d
0
continue. On a
d
V (x) = v(x)2
dt
d
Donc, pour tout x, dt V (x) 0. Enn, d'aprs le point 2, V (x) + lorsque
|x| +. D'aprs le Thorme 11, on peut prendre pour c n'importe quelle
d
valeur positive. Comme dt V = 0 implique x = 0, on en dduit que 0 est
globalement asymptotiquement stable. titre d'exemple, on obtient, par ce
raisonnement, la stabilit asymptotique de l'origine pour le systme
d
x = x sinh x
dt
alors qu'en considrant le linaris tangent autour de
conclure (le point d'quilibre
0,
on ne peut pas
1.3.
35
x.
A=
vi
(
x)
xj
sont
1i,j,n
toutes partie relle strictement ngative. Il nous faut construire une fonc-
autour de
On pose
exp(sAT ) exp(sA) ds
P =
0
o
est la transpose de
A.
Z
V (x) =
0
On a en drivant par rapport au temps sous le signe somme
d
V (x) =
dt
Z +
T
T
[exp(sA)(x x)] exp(sA)v(x) + [exp(sA)v(x)] exp(sA)(x x) ds
0
d
x
dt
car
36
CHAPITRE 1.
Ainsi,
avec la matrice
d
V (x) = (x x)T Q(x x) + o(kx xk2 )
dt
symtrique Q, dnie par l'intgrale
Q=
[exp(sA)A] exp(sA) + [exp(sA)] exp(sA)A ds
T
0
Comme
d
ds
exp(sA) = exp(sA)A
d
(exp(sA))T exp(sA) = [exp(sA)A]T exp(sA) + [exp(sA)]T exp(sA)A
ds
et donc l'intgrale dnissant
plement
s=+
Q = (exp(sA))T exp(sA) s=0 = I
n.
Ainsi, on a
d
V (x) = kx xk2 + o(kx xk2 )
dt
d
V 0 pour
dt
Thorme 11 avec c
Donc
d'quilibre
d
x = v(x)
dt
sont toutes partie relle ngative, des petits carts l'quilibre sont natuAinsi, lorsque les valeurs propres au point d'quilibre
de
x.
nominale du paramtre
et que les valeurs
toutes partie relle strictement ngative. Qu'en est-il des systmes voisins
obtenus pour des valeurs de p proche de p
? En fait, pour p proche de p, dtd x =
v(x, p) admet aussi un point d'quilibre (p) qui dpend continment de p,
v((p), p), (
p) = x.
(p)
1.3.
37
x,
proche de
x.
(p)
pour p = p
on
vi
x, p) est
a une solution x
; pour cette solution x, la matrice Jacobienne xj (
v(x, p) = 0 ;
inversible (pas de valeur propre nulle puisqu'elles sont toutes par hypothse
partie relle strictement ngative) ;
les valeurs propres en
(p)
dpend continment de
p. Le fait que
du fait que les valeurs propres d'une matrice dpendent de faon continue de
ses coecients
10
variables
cations inverses l'une de l'autre. Par exemple, pour reprer un point dans la
plan on doit dnir un jeu de deux nombres. On peut prendre les coordonnes cartsiennes avec l'abscisse et l'ordonne mais on peut aussi prendre les
coordonnes polaires avec un angle et la distance l'origine. Il est vident
que les rsultats de nature qualitative ne doivent pas dpendre du choix des
variables. C'est bien le cas de la proprit de stabilit.
d
Si dans les variables x, la dynamique s'crit
x = v(x) et qu'elle admet
dt
un point d'quilibre x
asymptotiquement stable, alors dans les variables z ,
x aura son
z sera bientransformations et
et
et
0
10. Onn'a pas en gnral de dpendance plus rgulire que C
0 1
avec p proche de 0 ; les valeurs propres sont p.
p 0
par un simple
38
CHAPITRE 1.
d
d
x = (z) =
dt
dt
d
z = v((z))
dt
Ainsi,
1
d
z = w(z) =
v((z))
dt
z
Comme
de
en
v(
x) = 0, w(
z ) = 0. Un calcul montre alors que la matrice Jacobienne
x est semblable celle de w en z
w
v
(
z)
(
z) =
(
x) (
z)
z
z
x
z
(
z ) est une matrice inversible. Il sut de driver par rapport
z
relation
car
la
Thorme 12
d
Le systme autonome plan dt x = v(x) avec x
R2 , ne peut admettre que quelques types de rgimes asymptotiques possibles.
0
2
tant donne une condition initiale x R , considrons t 7 x(t) la solution
d
0
de dt x = v(x) qui dmarre en t = 0 en x . Alors, pour des temps t 0, on ne
peut avoir que les cas de gure suivants (voir illustrations sur la Figure 1.10) :
(Poincar)
1.3.
39
x(t) ne reste pas born, alors soit x(t) explose en temps ni, soit x(t)
n'explose pas en temps ni mais alors x(t) est dni pour tout t > 0 et
limt7+ kx(t)k = +. En rsum : si la trajectoire n'est pas borne
1. Si
pour les temps positifs, elle converge vers l'inni en temps ni ou en
temps inni.
x(t) reste born pour les temps positifs alors elle est dnie pour tout
temps t > 0 et on distingue trois cas :
0
(a) soit x(t) converge vers un point d'quilibre (en temps inni si x
2. Si
x(t)
(c) soit
x(t)
t = +
t =
de vecteurs
v(x).
Ainsi en dimension
2,
v(x, t + 2)
v(x, t)
40
CHAPITRE 1.
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0.2
0.4
0.6
0.8
3 : (x1 , x2 , ) R2 S1
et
f f f .
avec
d
d
d
x1 = v1 (x1 , x2 , ),
x2 = v2 (x1 , x2 , ),
= 1.
dt
dt
dt
Ce n'est plus vrai non plus avec les systmes discrets mme de dimension
un. Par exemple les solutions de l'quation logistique
xk+1 = 4xk (1 xk )
qui
dmarrent en
denses dans
grands sont
complexes.
Sous une hypothse supplmentaire, on peut spcier la nature de la
limite.
v
v
continue et drivable. On suppose que div(v)(x) = x1 (x) + x2 (x) < 0 pour
1
2
d
2
presque tout x R . Soit t 7 x(t) une solution de dt x = v(x) qui reste
t tend
0.
vers
est
1.3.
41
45
40
35
30
25
20
15
10
5
10
0
10
10
20
10
20
avec
s = 10, r = 28
et
dx1
dt
dx2
dt
dx3
dt
= s(x1 + x2 )
= rx1 x2 x1 x3
= bx3 + x1 x2 ,
b = 8/3.
s 1 b < 0,
Thorme 14
Soit
42
CHAPITRE 1.
Figure
invariant et qui ne comporte qu'un seul point d'quilibre type foyer instable
ou nud instable .
soit
contient un unique
point d'quilibre dont toutes les valeurs propres sont partie relle strictement positive.
alors
L'ide derrire cet nonc est que les trajectoires bornes dans le plan
doivent approcher des orbites priodiques ou des points d'quilibre lorsque
le temps tend vers l'inni. Si
d'quilibre
Exemple 10
Un exemple de
cycle limite observ en pratique sur site industriel est donn par l'onde de
densit. Ce phnomne apparat sur les puits de ptrole activs par gas-lift.
La technique d'activation par gas-lift des puits de ptrole (reliant un rservoir situ en profondeur aux installations de surface) permet de produire des
hydrocarbures partir de champs matures. Au dbut de la production d'un
puits la pression du rservoir sut frquemment propulser les hydrocarbures
jusqu' la surface o le ptrole est rcupr. C'est une phase de production
1.3.
43
vanne de production
E
fond de l'ocan
production
de gaz et d'huile
arrive
de gaz
tubing
D
casing
B
vanne C
d'injection
rservoir
d'hydrocarbures
rservoir
F
dbit d'huile du rservoir
44
CHAPITRE 1.
0.5
0
0
0.5
1.5
2.5
3.5
0.5
1.5
2.5
3.5
0.5
0
0
Figure 1.15 Onde de densit dans un puits activ en gas-lift. On peut clairement observer un cycle limite suivi par la pression en tte de tubing (courbe
du haut) et une production par bouchons (courbe du bas) trs dommageable
pour le dbit d'huile produit (donnes normalises TOTAL 2006).
Exemple 11
On appelle
d2
d
x
+
f
(x)
x + g(x) = 0
dt2
dt
o
et
1.
est paire et
C1
2. La primitive de
intervalle
tend vers
R+
Rx
Ces systmes possdent une unique solution priodique. Ce rsultat est connu
sous le nom de thorme de Linard (on pourra se rfrer [12]). Un exemple
de tel systme est l'oscillateur de Van der Pol
d2
d
2
x
+
(x
1)
x+x=0
dt2
dt
Ces quations reprsentent un circuit lectrique oscillant rsistance ngative (telle qu'on peut les reproduire avec des lampes de puissance). Ce circuit
1.4.
45
5
4
3
2
1
0
-1
-2
-3
-4
-5
-2
augmente naturellement l'amplitude des faibles oscillations tandis qu'elle attnue celle des oscillations trop fortes. On a reprsent sur la Figure 1.16
le portrait de phases d'un oscillateur de Van der Pol. Pour
> 0,
le cycle
limite prvu par le thorme de Linard est attractif, tandis que l'origine est
un point d'quilibre instable. Plus
rapidement vers ce cycle limite. La priode laquelle est parcourue de manire asymptotique le cycle limite est approximativement gale pour
grand
(3 2 ln(2)).
46
CHAPITRE 1.
assez facile et ne mne pas trs loin dans la comprhension des phnomnes.
Par exemple, on ne peut pas en gnral mener d'analyse thorique de stabilit comme nous l'avons fait sur un systme de grande dimension. Il est en
revanche nettement plus dicile de proposer un modle de complexit minimale compte tenu des phnomnes que l'on souhaite comprendre et contrler.
Le but de cette section est de donner quelques rsultats gnraux sur les systmes multi-chelles et leur approximation, sous certaines hypothses, par
des systmes moins complexes et ne comportant essentiellement qu'une
seule chelle de temps. C'est une des voies possibles pour justier la pertinence de modles rduits sur lesquels on sait prouver mathmatiquement
des rsultats de stabilit et de robustesse. Les modles plus compliqus, plus
proches en quelque sorte de la ralit au sens platonicien du terme et trs
utile comme modles de simulation, sont alors vu comme des perturbations,
prenant en compte des dynamiques rapides et donc des phnomnes hautes
frquences, de modles plus simples, de petites dimensions et trs souvent
utiliss en contrle.
1.4.
47
systme lent-rapide
systme lent
perturbations
singulires
0
x
0
x
moyennisation
t ,
t 1 (0 < 1).
pour obtenir la dynamique lente en prenant des moyennes faisant intervenir la mesure asymptotique du rapide : la dynamique rapide est alors vue
comme un bruit haute frquence dont il faut connatre la loi de probabilit
(la mesure asymptotique) qui dpend en gnral des variables lentes.
On considre les systmes continus du type
( )
dx
dt = f (x, z, )
dz = g(x, z, )
dt
avec
x Rn , z Rp ,
de temps rapide et
de l'ordre de
t1
).
On dit que
correspond l'chelle
48
CHAPITRE 1.
Figure 1.18 Le champs des vitesses est quasi-vertical pour la forme nor
male de Tikhonov ( ).
11
x=z
dt
d z = x z
dt
avec 0 < 1. Intuitivement, on voit que x est une variable lente (sa vitesse
est petite et d'ordre 1), tandis que z est une variable rapide (sa vitesse est
d'ordre 1/). On a donc envie de dire que z atteint rapidement son point
d
x = x. Cette ide est
d'quilibre z = x et que, par suite, x volue selon
dt
fondamentalement correcte ds que les eets rapides sont asymptotiquement
stables.
La situation gomtrique est donne par la Figure 1.18 : pour
petit et localement autour de
g(x, z, 0) = 0,
> 0 assez
en
par l'quation
g(x, z, 0) = 0.
( )
dx
dt
= f (x, z, 0)
0 = g(x, z, 0)
11. Comme autre exemple caractristique citons la cintique chimique o les constantes
de vitesses de certaines ractions peuvent tre nettement plus grandes que d'autres (cintiques lentes et cintiques trs rapides).
1.4.
49
On nglige ainsi les convergences rapides vers la sous-varit donne approximativement par les quations statiques g(x, z, 0) = 0. Toute trajectoire du
g(x, z, 0) = 0.
On a le premier rsultat g-
fonction
g
(x, (x), 0)
z
est une matrice dont toutes les valeurs propres sont partie relle strictement ngative (Hurwitz) ; on dit alors que le systme est sous forme
standard ;
H2
le systme rduit
dx
dt
= f (x, (x), 0)
x(t=0) = x0
x0 (t)
susamment proche de
pour
0,
(1.16)
admet une
0
unique solution (x (t), z (t)) sur [0, T ] ds que la condition initiale z appar0
tient au bassin d'attraction du point d'quilibre (x ) du sous-systme rapide
le systme complet
d
= g(x0 , , 0).
dt
De plus on a
et
d
= g(x, , 0).
dt
50
CHAPITRE 1.
(0 )
(x).
s'crit ainsi
d
x = f (x, (x), 0)
dt
avec
0.
Sans hypothses supplmentaires, l'approximation du Thorme 15 n'est
valable, en gnral, que sur des intervalles de temps
de longueur borne
T.
Thorme 16
(Prservation de la stabilit)
x : f (
x, (
x), 0) = 0
f
f
+
x z x
(
x,(
x),0)
sont partie relle strictement ngative. Alors, pour tout 0 assez proche
Preuve
g=0
et ensuite pour
f (0, 0, ) = 0,
g(0, 0, ) = 0
Notons, pour
0.
d
x = F (x, w, ),
dt
d
w = G(x, w, )
dt
1.4.
51
avec
J =
(0, 0)
F (x, w, ).
x
F
(0, 0, )
x
1 G
(0, 0, )
x
F
(0, 0, )
w
1 G
(0, 0, )
w
=
A
C A
B
1
D + E
A =
f
f
(0, 0, ) +
(0, 0, )
(0), B =
(0, 0, ), C =
(0),
x
z
x
z
x
f
g
(0, 0, ), E =
(0) (0, 0, )
D =
z
x
z
en
(X , W )
A X + B W =
C A X +
On a alors
1
D
+ E W =
W .
W0 6= 0
X ,
(x, w).
est alors
positifs, ds que
indpendant de
(
x, (
x))
et pour tous
52
CHAPITRE 1.
commande
valables. Ainsi
dx
dt
= f (x, z, u, )
(1.17)
dz = g(x, z, u, )
dt
avec (x, u) le point d'quilibre asymptotiquement stable de la partie rapide
d
= g(x, , u, 0). Le systme lent est alors dx
= f (x, (x, u), u, 0).
dt
dt
Supposons que nous ayons un retour d'tat lent u = k(x) tel que le
systme lent boucl soit asymptotiquement stable autour du point d'quilibre
(
x, u = k(
x)).
>0
u = k(x, z)
x.
Un bouclage
de
dynamique rapide
d
= g(x, , k(x, ), 0)
dt
ne dpend pas de
g
u
= 0.
u = k(x)
de prendre par
d
x = f (x, (x, u), u, 0).
dt
Pour la simulation, il peut cependant tre utile de vrier que le feedback
u = k(x)
d
x = f (x, (x, k(x)), k(x), 0)
dt
Cela permet de vrier si
1.4.
53
mique rapide et celles de la dynamique lente donne bien souvent une bonne
approximation. Cela veut dire que
= 1/2
est dj petit.
le modle d'tat
d
x = f (x, u, w, p), y = h(x)
dt
dpendant des paramtres p. On labore partir de ce modle de contrle et
pour une valeur nominale des paramtres p
, une loi de contrle sous la forme
d'un retour dynamique de sortie (comme l'est un contrleur PI )
d
=a
(y, , v),
dt
o
, v)
u = k(y,
x = f (x, k(h(x),
, v), w, p),
dt
d
=a
(h(x), v)
dt
et le nouveau contrle
pour vrier que nous ne nous sommes pas tromps dans les choix de
et
a
. On peut aussi, dans une seconde tape, simuler le systme prcdent mais
avec un paramtre p dirent de p
, pour vrier que notre contrleur n'est pas
trop sensible aux erreurs de paramtres et surtout pour quantier les erreurs
paramtriques au del desquelles le contrleur conduit des comportements
non acceptables. On quantie en simulation la robustesse paramtrique du
contrleur . On voit donc ici que nous avons encore deux modles : le modle
de contrle de paramtre
p et
p,
p.
Les
assez proche de
au
del desquelles le systme change de comportement. C'est l'objet de la thorie des bifurcations et des catastrophes, thories mathmatiquement assez
techniques (on pourra se reporter [30]).
Il convient aussi de faire quelques simulations pour quantier la robustesse
du contrleur par rapport des dynamiques ngliges. Le but est en autre de
vrier que les gains ne sont pas irralistes (en gnral trop grands) : pour
54
CHAPITRE 1.
et
a
,
il y
y;
celles lies au
u;
et des capteurs.
la rponse des capteurs n'est pas instantane et que les actionneurs ne sont
pas parfaits. On simule alors le systme tendu
d
x = f (x, um , w, p)
dt
d
=a
(y m , v)
dt
d
y y m = h(x) y m
dt
u d um = k(y
m , , v) um
dt
et
13
nglige au dpart, est en fait trop grande compte tenu des performances
demandes au contrleur, alors il nous faut changer le modle de contrle et
l'enrichir avec une partie de la dynamique du capteur. Cela signie qu'on a
pris comme modle de contrle de dpart, un modle trop grossier, compte
tenu des objectifs.
Il ne faudrait pas en conclure qu'il faille ds le dpart prendre le modle
le plus complet possible comme modle de contrle. Comme en physique,
il est en fait bien plus ecace de partir d'une vision trop synthtique qui
s'appuie sur des a priori trs forts mais dont on est conscient
14
. D'en dduire
13. Une autre faon de prendre en compte des dynamiques rapides ngliges consiste
introduire un petit retard de l'ordre de
Comme
ym = e dt y
>0
ym (t) = y(t ).
d
dt ) mais cette fois en dimension innie
d
dt
, ym = e
y devient ym = 1+1 d y et on
d
dt
1
d
1+ dt
dt
d
y = ym + dt
ym .
14. Citons l'exemple des calculs perturbatifs de trajectoires spatiales pour lesquels on
remet en cause les hypothses simplicatrices au fur et mesure : trajectoire plane puis
1.5.
55
CAS D'TUDE
pr-compensation (feedforward ) pour anticiper et ainsi mieux grer des transitoires importants en particulier ceux lis aux changements de consignes.
(librement choisie par un habitant) et d'une mesure en temps rel de la temprature ambiante
56
CHAPITRE 1.
u [0, 1].
de l'augmenter. An d'aranchir l'habitant des incessants ajustements ncessaires pour que la temprature
et able ?
1.5.2 Un rgulateur PI
Comme l'illustre la Figure 1.19, l'algorithme usuellement utilis avec une
vanne proportionnelle 3 voies est le suivant. La marche de la chaudire est directement relie la position de la vanne trois voies note
u : pour u = 0, l'eau
qui arrive des radiateurs ne passe pas par la chaudire et repart directement
avec la mme temprature ; pour
u = 1,
ch (tem ; pour
prature constante), temprature bien sr nettement plus haute que
les valeurs intermdiaires de u ]0, 1[, l'eau qui arrive des radiateurs n'est
passe par la chaudire et ressort la temprature de la chaudire
u.
1.5.
57
CAS D'TUDE
t > 0,
uk+1 = Kp ( k ) + Ik
uk+1
en fonction de la temprature
intgral
(k + 1)t,
Ik
kt.
l'instant
k ,
de la consigne
Ik
Kp
calcule
La priode d'chantillonnage
terme intgral
et
est de l'ordre
Ik+1 = Ik + t Ki ( k )
o
Ki
u,
le terme
mmoire entre deux calculs successifs. C'est une valeur interne au contrleur
(tat).
En somme, la commande
uk+1 = Kp ( k ) + Ik
Ik+1 = Ik + t Ki ( k )
o, en mme temps qu'on calcule
uk+1 ,
Ik+1
uk+1 = S at Kp ( k ) + Ik
Ik+1 = Ik + t Ki ( k )
o
S at (x) = x
si
pour
x<0
et
S at (x) = 1
pour
x > 1.
Un tel algorithme ne marche pas non plus. La raison est en plus sophistique.
Imaginons que nous soyons l't par temps de canicule. Dans ce cas
toujours nettement suprieur
donc le terme intgral
(une
S at
0.
sera
u restera
Kp ( )
remonte au dessus de
toujours zro.
pour avoir enn
I.
On va rajouter un
uk+1
ne sature pas,
58
CHAPITRE 1.
uk+1 = S at Kp ( k ) + Ik
Ik+1 = Ik + t Ki ( k ) + Ks (uk+1 Kp ( k ) Ik )
avec un gain
Ks
Ks Kp > Ki .
(1.18)
Tout rgu-
u.
uk+1 = S at (Kp ( k ))
Comme on pourrait le voir par exemple avec des simulations (et conformment l'intuition) un tel algorithme a tendance limiter les variations de
temprature
que
contraintes 0 et 1 (et o et restent eux aussi constants) on voit trs simplement que I ne peut tre que constant. En eet, la seconde quation de (1.18)
. Comme on le voit, le terme I garantit que,
implique ncessairement =
. Le terme I annule l'erreur statique.
si on atteint un quilibre, c'est =
le PI, en rgime stabilis o
t 7 u(t)
et
t 7 (t)
assez longue (par exemple une journe), on s'aperoit qu'ils sont fortement
corrls. La modlisation consiste tablir ces corrlations. On peut partir de telles mesures identier un modle. On peut aussi utiliser les lois de
conservation de la physique. Bien sr, il n'est pas question ici d'crire un modle dtaill prenant en compte un maximum de phnomnes. Notre objectif
consiste rguler une temprature moyenne, telle que mesure par une seule
sonde, en utilisant un seul actionneur (la chaudire). Si, en revanche, on s'intresse la temprature en dirents points, son inhomognit spatiale,
1.5.
59
CAS D'TUDE
on aura recours des modles plus sophistiqus tels que ceux utiliss pour
la simulation ne des transferts thermiques.
Dans notre situation, nous avons besoin d'un modle minimal nous permettant de comprendre pourquoi un rgulateur PI fonctionne
avoir besoin de rgler de faon trs pointue les gains
Kp
et
15
Ki .
, et ce sans
Ce modle
(1.19)
d I(t) = Ki ( (t)) + Ks (u(t) Kp ( (t)) I(t)).
dt
Pour construire un modle reliant la position de la vanne u et la temprature , nous allons faire, en accord avec notre choix des chelles de temps
et d'espace, les hypothses simplicatrices illustres sur la Figure 1.20.
ext .
En notant
rad
M Cp
o
d
= rad (rad ) + ext (ext )
dt
Kp
et
Ki
60
CHAPITRE 1.
ext et avec les radiateurs de temprature rad dont une fraction de l'eau
u [0, 1] passe par la chaudire et ressort la temprature sortie chaudire
ch .
supposant que le ux de chaleur perdue par les radiateurs
rad (rad )
est
ch . Cela
>0
rad
u
d
urad
=
(ch ) + ext (ext )
dt
u + rad
(1.20)
rad =
comme barycentre de
ch
et
rad
u
ch +
u + rad
u + rad
M Cp
direntielles. Ici
y = h(x)
x = .
y = x,
on
1.5.
61
CAS D'TUDE
w = ext (t).
p est un ensemble de paramtres constants apparaissant dans le modle
(ce sont des entres particulires qui sont des constantes) : ici p =
(, rad , ext , M Cp ).
d
x = f (x, u, w, p),
dt
o
et
y = h(x)
f (x, u, w, p) =
ext
urad
(ch ) +
(ext ),
(M Cp )(u + rad )
M Cp
h(x) = x
p.
t 7 u(t), on parle
u est au contraire calcul
ou de
I,
I.
I0
consigne de temprature
t 7 (t)
Kp , Ki
et
Ks
de rglage du rgulateur.
Considrons une simulation en boucle ferme. Le modle correspondant
est
d
(t)
dt
d
I(t)
dt
avec u(t)
ext
rad
= (M Cpu(t)
( (t)) + M
( (t))
)(u(t)+rad ) ch
Cp ext
avec
gains
(1.21)
Kp > 0, Ki > 0 et
t 7 ((t), I(t))
trajectoires
u(t)
ncessairement la limite de
(t)
dans
[0, 1].
De plus, si
est la consigne
0 < u < 1
alors
62
CHAPITRE 1.
Avec ces rglages, on n'a pas besoin de connatre prcisment les valeurs
des coecients d'changes thermiques ni celles de l'inertie thermique du btiment ni la valeur de la temprature extrieure. Par ces simulations, on se
rend donc compte qu'avec un algorithme de contrle lmentaire de type
PI, il est possible de contrler la temprature d'une trs large gamme de
btiments dont les transitoires thermiques peuvent tre dcrits de faon approximative par une quation bilan du type de celle construite ci-dessus. En
fait, nous allons voir que cette constatation exprimentale correspond un
rsultat gnral.
d
x=
dt
et croissante de u pour
f (x, u, w, p)
x=
1.5.
63
CAS D'TUDE
d
x = f (x, u)
(1.22)
dt
d'tat x(t) R avec le contrle scalaire u(t) R soumis aux contraintes
u [umin , umax ] (umin < umax ). On suppose que R [umin , umax ] 3 (x, u) 7
f (x, u) R est une fonction continue et drivable par morceaux. Les seules
informations que nous avons sur notre modle, i.e. sur f , sont de nature
min
qualitative : pour tout (x, u) R [u
, umax ],
f
(x, u) 0
x
et
f
(x, u) > 0
u
On suppose en outre qu'il existe un rgime stationnaire respectant strictement les contraintes sur le contrle : il existe
(
x, u) R]umin , umax [
tel que
f (
x, u) = 0.
Nous allons montrer que le rgulateur PI avec anti-emballement
u = S at [Kp (
x x) + I] ,
o la fonction saturation
d
I = Ki (
x x)+Ks (u Kp (
x x) I)
dt
S at
(1.23)
min
u ,
u,
R 3 u 7 S at (u) =
max
u ,
si
si
si
u umin ;
umin u umax ;
umax u.
(1.24)
(
x, u) globalement asymptotiquement stable pour le
(x, I) ds que ses gains, Kp le gain proportionnel, Ki
Ks
Kp > 0,
Ki > 0,
Ks > 0,
et
Ks Kp Ki
Dynamique tudier
Nous cherchons montrer la stabilit asymptotique globale du point
(
x, u). Nous cherchons donc tablir que,
(x , I 0 ), la solution t 7 (x(t), I(t)) du systme
d'quilibre
0
initiale
d
x = f (x, S at [Kp (
x x) + I])
dt
d
I = Ki (
x x) + Ks (S at [Kp (
x x) + I] Kp (
x x) I)
dt
(1.25)
64
CHAPITRE 1.
X 7 F (X)
R .
X = (x, I)
parcourt le
t > 0.
de phases
t>
X = (x, I) et construire
une famille de rectangles embots les uns dans les autres. Chacun de ces
rectangles est positivement invariant par la dynamique (voir Dnition 22) :
si la condition initiale appartient l'intrieur d'un de ces rectangles alors il
est impossible la trajectoire d'en sortir. Pour tablir ce point, il sut de
Ks Kp Ki , f
La fonction
S at
(x, I)
Kp (
x
1.5.
65
CAS D'TUDE
x [
x /Kp , x + /Kp ],
[
x /Kp , x] on a
}|
{z }| {
}|
{
z
z
x x) +Ks (umax u ) 0;
F =(Ki Ks Kp )(
I
si
x [
x, x + (
u + umax )/Kp ]
on a
z }| {
z
}|
{
F I = Ki (
x x) +Ks (umax u Kp (
x x)) 0;
si
x [
x + (
u + umax )/Kp , x + /Kp ]
on a
z }| {
F = Ki (
x x) 0
x
F
F =
pointe vers le bas
FI
I
Ainsi, le vecteur
zontal suprieur.
(cot vertical droit) pour
x = x + /Kp
et
I [
u , u + ] on voit que
F x (
x + /Kp , I) 0;
en eet si
I [
u , umin + ]
on a
F x = f (
x + /Kp , umin ) f (
x, umin ) f (
x, u) = 0
car
f
x
et
f
u
> 0;
si
I [umin + , u + ]
on a de mme
F x = f (
x + /Kp , I ) f (
x, I ) f (
x, u) = 0
Ainsi, le vecteur
66
CHAPITRE 1.
L,
R .
F (X)
invariant.
0
Prenons maintenant une condition initiale X
= (x0 , I 0 ) arbitraire. Il
0
existe toujours au moins un (il sut de le prendre assez grand en fait)
d
0
X = F (X) avec
pour que X soit l'intrieur de R0 . Ainsi, la solution de
dt
X(0) = X 0 reste dans R0 pour tout temps positif : elle est donc dnie pour
tout temps
t>0
et reste borne.
Stabilit asymptotique
Nous cherchons maintenant tudier la convergence des trajectoires. On
suppose que l'quilibre
(
x, I)
c.--d.
(x, I)
autour de
,
(
x, I)
le systme s'crit
x = f (x, Kp (
x x) + I)
dt
d I = Ki (
x x)
dt
(1.26)
f
x (
x,
u)
Kp f
u (
x,
u)
Ki
f
u (
x,
u)
!
(1.27)
Kp > 0 et Ki > 0, le
(
x, I = u) dont on
est
contraintes. En eet, (
x, I)
1.5.
67
CAS D'TUDE
l'unique solution de
f (x, S at [Kp (
x x) + I]) = 0
Ki (
x x) + Ks (S at [Kp (
x x) + I] Kp (
x x) I) = 0
umin Kp (
x x) + I umax ,
on a
x = x
comme solution de
f (
x, I) = 0.
Or,
l'intrieur
F
. Cette intgrale est gale l'intgrale sur le bord
16
sortant . Avec < ., . > le produit scalaire usuel, il vient
Z Z
I
divF =
< F, n > ds
(1.25)
F =
f (x, S at [Kp (
x x) + I])
at
Ki (
x x) + Ks (S [Kp (
x x) + I] Kp (
x x) I)
de
f
f
Kp (S at )0 + Ks ((S at )0 1) < 0
x
u
16. Il s'agit du thorme de Gauss souvent utilis en lectrostatique.
68
CHAPITRE 1.
car
Kp , Ki > 0, Ks Kp > Ki
d
I = Ki (
x x) + Ks (u Kp (
x x) I)
dt
et
Alors on a
1. soit il existe
min
soit [u
, umax ], f (
x, ) < 0 (resp. > 0) alors limt7+ u(t) =
max
min
u
(resp. u
) et limt7+ x(t) existe, est ventuellement innie
[, x[ (resp. ]
x, +])
max
soit f (
x, u ) = 0 (resp. f (
x, umin ) = 0) alors limt7+ u(t) = umax
min
(resp. u
) et limt7+ x(t) existe, est nie dans ] , x
[ (resp.
]
x, +[).
dans
x.
de sa
et
rad ,
les
1.5.
69
CAS D'TUDE
Kp , Ki
et
Ks
positifs vriant
Ks Kp > Ki ,
(
x, I)
moins une des valeurs propres de cette matrice tend vers l'inni (en module)
quand
Kp
et/ou
Ki
tendent vers
+.
Ti = Kp /Ki
d'chantillonnage t. On va
le temps intgral
Kp
et
Ki
tels que
70
CHAPITRE 1.
> 0
d m m
=
dt
Cette dynamique supplmentaire complte le modle en boucle ferme tudier. Celui-ci est alors
d
(t)
dt
d
I(t)
dt
d m
dt (t)
avec u(t)
En posant
ext
rad
= (M Cpu(t)
( (t)) + M
( (t))
)(u(t)+rad ) ch
Cp ext
m
= Ki ( (t)) + Ks (u(t) Kp ( m (t)) I(t))
= (t) m (t)
= S at (Kp ( m (t) + I(t))
X = (, I)
et
Z = m ,
(1.28)
d
X = F (X, Z),
dt
d
Z = G(X, Z),
dt
d
X = F (X, Z),
dt
=0
0 = G(X, Z).
G
(X, Z)
Z
sont toutes partie relle ngative (ce qui
> 0
Kp
dt
d
sous la forme
X = F (X, Z) avec dtd Z = G(X, Z) n'est plus valable et
dt
l'approximation prcdente peut tre mise en dfaut. On ne sait plus dduire
et/ou
1.5.
71
CAS D'TUDE
la temprature intrieure
est
rponse de notre systme n'est pas instantane ; notre modle (1.20) implique
que est une
max > 0 cette
fonction drivable de
borne
d
(t) max
dt
pour la transformer en
(t)
est constante,
une fonction continue drivable par morceaux r (t) : l o
r est aussi constante ; l o admet un saut, alors r est la fonction ane
max
par morceau de pente infrieure en module
( 1) qui remplace le
saut par une rampe comme illustr sur la Figure (1.22). Ainsi, r (t) est une
, drivable par morceaux et dont la drive
approximation continue de (t)
max
reste toujours plus petite que
en valeur absolue. En quelque sorte, r (t)
tout en
est une consigne de temprature variable dans le temps, proche de
Il est naturel de modier localement la fonction
brute (t).
, on rajoute alors au PI (1.19) la drive r
Avec r (t) au lieu de (t)
72
CHAPITRE 1.
Figure
,
t 7 (t)
fonction
t 7 r (t),
t = 0.
Alors, le terme en
contrle
r ,
en
r , r
retourne
et alors, le contrle
aura un saut vers le bas, une sorte de freinage pour viter que
en n de monte la valeur de
ne dpasse
anticipation suivant
h
i
u(t) =S at Kp (r (t) (t)) + I(t) + Kr r (t) Kext ext
d
I(t) =Ki (r (t) (t))
dt
h
i
1.5.
73
CAS D'TUDE
de la forme
dt
u, ext ) = 0.
f (,
= f (, u, ext )
avec
par
y , u
par
et
ext
par
d
y = ay + bu + dw
dt
f
f
f
, b=
, d=
a=
,
u ,
ext ,
u,ext
u,ext
u,ext
avec
On remarque que
a > 0, b > 0
et
d > 0.
w.
(1.30)
y comme
= 1/a, excit
(bu + dw)
en notant
d
1
y = ( bu + dw y)
dt
umin =
et
umax = +.
t 7 yr (t) continue
et
drivable par morceaux tout en connaissant chaque instant la perturbation w(t). On dnit le contrle de rfrence comme tant la fonction
t 7 ur (t) continue par morceaux et telle que dtd yr = ayr + bur + dw, c'est
dire
ur (t) =
u, on rajoute
e = y yr
Pour obtenir
de suivi,
d
I(t) = Ki (yr (t) y(t))
dt
ur
: elle compense, de
faon cohrente avec le modle, les eets transitoires dus aux variations de
yr
et
w.
e = y yr
et
d
e = (bKp + a) e + bI,
dt
d
I = Ki e
dt
d2
d
e = 20 e (0 )2 e
2
dt
dt
avec les notations usuelles
20 = (bKp + a) ,
(0 )2 = bKi
(1.31)
74
CHAPITRE 1.
0 > 0
> 0,
le facteur d'amortisse-
d
d2
e = 20 e (0 )2 e + b u r + d w + a y r
2
dt
dt
En absence de terme de feedforward, le simple contrleur PI
u = Kp (yr y) + I,
d
I = Ki (yr y)
dt
e = y yr
d
d2
d2
2
e
=
2
e
(
)
e
yr + dw + ay r
0
0
dt2
dt
dt2
mais avec un terme source
que
b u r + d w + a y r
dtd 2 yr + dw ay r
(1.32)
ur
plus prs de
reste
0.
En l'absence de feedforward, on voit que la partie rtro-action, le feedback, doit alors corriger aprs coup les variations de la rfrence
perturbations
rfrence
yr
w.
yr
et les
compenser non seulement les erreurs de modle, ce qui est son rle premier,
mais aussi les variations de
feedforward
yr
et
w,
ur .
1.6.
75
CAS D'TUDE
est non trivial car il s'agit d'un systme du second ordre avec dynamique
inconnue et des contraintes la fois sur l'tat et sur le contrle. La synthse
d'un contrleur prenant explicitement les contraintes d'tat est un problme
largement ouvert et pour lequel on ne dispose pas, l'heure actuelle, de solution systmatique et simple. Des solutions plus numriques fondes sur les
techniques de commande prdictive peuvent tre considres mais elles sont
coteuses en temps de calculs et peuvent poser problme en particulier en
ce qui concerne l'existence de solutions et la convergence numrique
17
. Le
contrleur que nous proposons ci-dessus s'appuie sur le paradigme des systmes lents/rapides, sa structure est facile comprendre. Le rglage des gains
est simple et s'eectue partir des contraintes. Nous donnons des formules
explicites qui peuvent tre utilises.
Considrons un systme du second ordre de la forme suivante
d
d2
x
=
f
(x,
x) + u
dt2
dt
o
u.
v.
Comme nous
allons le voir, il est assez ais de prendre en compte des contraintes sur la
vitesse
et le contrle
u.
17. La technique MPC (Model Predictive Control) propose une slection optimale, au
sens d'un critre choisi par l'utilisateur, parmi des trajectoires satisfaisant des contraintes.
Elle suppose l'existence de telles trajectoires et l'unicit d'un optimum caractrisable numriquement. Ce sont ces hypothses qui sont bien souvent diciles garantir sur des
exemples concrets gnraux. Si ces hypothses sont vries, la technique MPC consiste
en la rsolution itre du problme d'optimisation avec mise jour chaque nouvelle
priode d'chantillonnage de la condition initiale. La fonction cot optimal est alors une
fonction de Lyapounov, elle garantit la stabilit.
76
CHAPITRE 1.
x=v
dt
d v = f (x, v) + u
dt
(1.33)
qui domine
f (x, v)
(x, v),
essentielle.
La cascade de deux rgulateurs, voque ci-dessus, donne l'algorithme de
contrle suivant
x x) + Ks (
v Kp (
x x) I)
dt I = Ki (
v = Svat [Kp (
x x) + I]
at
u = Su [Kp (
v v)/]
(1.35)
avec
fonctions
La dynamique en boucle ferme est le systme de trois quations direntielles non linaires suivant
x=v
dt
d
x x) + I] v)/]
v = f (x, v) + Suat [Kp (Svat [Kp (
dt
d I = Ki (
x x) + Ks (Svat [Kp (
x x) + I] Kp (
x x) I)
dt
1.6.
77
CAS D'TUDE
Pour
(x, v, I)
proche de
at
Sv et
ci-dessus devient
les fonctions
at
Su
(
x, 0, u),
x=v
dt
d
x x) + I) v)
v = f (x, v) + Kp (Kp (
dt
d I = Ki (
x x)
dt
Ce systme est bien sous la forme standard du thorme 15 de Tikhonov :
l'tat lent est
(x, I),
l'tat rapide
v,
d
x = v,
dt
d
I = Ki (
x x)
dt
est bien asymptotiquement stable. On conclut la stabilit via le thorme 16. En l'absence de contraintes, la preuve de la stabilit repose uniquement sur le fait que
Pour garantir la stabilit avec la prise en compte des eets non linaires
dus aux fonctions de saturation
et
Ki
Suat
et
Svat ,
Kp
de temps est correct, il faut que le systme rapide soit en mesure de suivre
sa consigne
v = Svat [Kp (
x x) + I]
Kp =
v max
,
(1 )umax
Ki =
Kp2
,
5
Ks =
2Kp
,
5
= 3,
le contrleur (1.35) est bien stabilisant tout en respectant les contraintes sur
v.
Ce qui prcde n'est pas une preuve formelle mais plutt une illustration
de la dmarche fonde sur la thorie des perturbations pour concevoir un
rgulateur simple pour un systme du second ordre dont le modle comporte
d'importantes incertitudes que l'on peut dominer par un contrle born. De
plus ce rgulateur (1.35) prend en compte la contrainte d'tat
|v| v max .
78
CHAPITRE 1.
Chapitre 2
Fonctions de transfert
soit susamment petit. Dans ces conditions, on peut alors raisonner sur un
systme simpli (nominal). La question de la robustesse a t traite de
manire perturbative : si le systme nominal en boucle ferme ou en boucle
ouverte admet un quilibre asymptotiquement stable , alors le systme perturb
(rgulirement et/ou singulirement)
de
il y a perte
marges de robustesse que nous allons dnir. On notera que, d'un point de
vue formel, l'tude des changements qualitatifs de comportement d'un systme dynamique en fonction de paramtres intervenant dans les quations
est l'objet de la thorie des bifurcations et des catastrophes [21]. Cette thorie
dpasse largement le cadre de ce cours.
Les marges de robustesse sont des notions diciles aborder de faon
gnrale pour un systme non linaire. Cependant, il est possible, une fois de
plus, d'obtenir des informations prcieuses en considrant le systme linaris
0 = g(x, z, 0))
79
80
CHAPITRE 2.
FONCTIONS DE TRANSFERT
(note aussi
et
d
y(t) = ay(t) + bu(t) + dw(t)
dt
(2.1)
avec
qu'un simple
rgulateur PI
d
I = Ki (yr y)
dt
u = Kp (yr y) + I,
avec
(2.2)
(rfrence)
tante. Rappelons qu'on n'a pas besoin de connatre cette constante pour
prouver que de manire asymptotique
y = yr .
2. Le calcul symbolique est aussi dnomm calcul oprationnel [73, 22] en rfrence
la thorie des oprateurs linaires [43].
3. Nous laissons de ct les problmes de convergence des transformes de Laplace qui
sont relativement hors-sujet ici et qui sont abords dans les cours [52, 53]. On pourra aussi
se reporter [15] pour un expos mettant en lumire le rle des bandes de convergence
dans le plan complexe.
4. Nous ne prenons pas en compte les contraintes sur
ici.
2.1.
81
imputable la dynamique du capteur, la chane informatique tempsrel, des dlais d'chantillonnage de certains capteurs, ou des dlais
de communication de l'information.
tion de transfert d'un systme. Le principe des calculs est trs simple : il
d
par s. Par abus de notation et soucis de
sut de remplacer l'oprateur
dt
yr
et
variables et un retard
sur
dt
u(t) = Kp (yr (t) y(t )) + I(t)
0
o
es( +) y( )d = es y(s)
()k (k)
(t). Comme y (k) =
k=0
k! y
k
P
k
+
()
d
y = sk y , on voit naturellement apparatre la srie k=0 k! sk qui n'est autre que
dtk
s
e
. Ainsi, en calcul symbolique, l'oprateur qui la fonction y associe la fonction y
s
retarde de n'est autre qu'une multiplication par e
. On trouvera toutes les formules
le justier) le dveloppement en srie
y(t ) =
P+
82
CHAPITRE 2.
FONCTIONS DE TRANSFERT
sy = ay + bu + dw
u = Kp (yr es y) + I
sI = Ki (yr es y)
On peut alors calculer algbriquement
y , u,
et
en fonction de
yr
et
w .
Il
fractions rationnelles en
y=
sd
b(Ki + sKp )
yr +
w
s
s(s + a) + b(Ki + sKp )e
s(s + a) + b(Ki + sKp )es
La stabilit se dduit des zros des dnominateurs (nomms ples ), i.e., les
valeurs
> 0,
la variable complexe (c'est une fonction dite entire car elle est dnie pour
toute valeur de
s C)
D(s) = s(s + a) + b(Ki + sKp )es
<(s) ,
(2.3)
alors le systme est
y(t)
t +.
A)
transforme de Laplace de
initiales nulles)
x = (sI A)1 A
x
n'est pas dnie pour les valeurs de
det(sI A)
appartenant au spectre de
A.
Comme
l'existence de
> 0.
D(s),
2.1.
83
est un problme ardu et non compltement rsolu l'heure actuelle (voir [29]
pour un expos complet et la Section 2.4.1 pour un exemple de rsultats
qu'on peut obtenir).
Pour
Kp , Ki , b > 0 et a 0).
partir
D(s)
w = exp(t)
w = cos(t),
et on cherche la solution
on passe en complexes en
(y, u, I),
pour
yr = 0,
des
quations
dt
u(t) = Kp (yr (t) y(t )) + I(t)
Y=
sd
s
s(s + a) + b(Ki + sKp )e
s=
sd
= G() exp(())
s
s(s + a) + b(Ki + sKp )e
s=
o
G() 0
est le gain et
() [, [,
84
CHAPITRE 2.
FONCTIONS DE TRANSFERT
y . La solution
w = cos(t), est
yr = 0
et
G()
en fonction de
variation locale de
H(s). Ainsi, H(s) peut ne possder que des ples stables alors
d
d2
yy = uu
2
dt
dt
(2.4)
y=
s1
1
u=
u
2
s 1
s+1
s = 1 partie relle
ngative. Ceci est faux : le systme est du second ordre, il admet une autre
valeur propre. Cette dernire est instable et vaut
()
en fonction de
log10 ().
log10 () (log10
2.1.
85
y0 = 0, y 0 = 0
et
u(s)
= su(s) u0 .
R +
et en supposant que y
(t) et u(t)
y0 , y 0
et
u0
t=0
de
y,
d
y et
dt
u.
En eet on a
y(s) =
1
sy0 + y 0 u0
u+
s+1
s2 1
disparat plus.
Dans la suite du chapitre, nous supposerons qu'il n'y a pas de canular de ce
type. En pratique, ce genre de simplication se voit trs vite en inspectant les
quations. Il sut de modier un tout petit peu les coecients, par exemple
prendre
u 0.999u
ple instable qui avait disparu. Ce type de simplication est surtout gnant
quand des ples instables sont en jeu. Pour des ples stables, c'est moins
embtant et ce d'autant plus s'ils ont des parties relles fortement ngatives.
Les termes correspondants convergent de toutes faons trs rapidement vers
zro lorsque
t +.
2.1.5 Formalisme
Dans ce qui suit, on s'attache donner des lments prcis (dnitions et
proprits) concernant les fonctions de transfert que nous avons introduites
86
CHAPITRE 2.
FONCTIONS DE TRANSFERT
partir d'exemples simples dans les Sections 2.1.2, 2.1.3 et 2.1.4. On considre
un systme avec
m1
entres
et
p1
sorties
d
x = Ax + Bu, y = Cx
dt
n n coecients constants, B
(2.5)
est une matrice (dans
nm
pn
coecients constants.
La notion de stabilit dont nous avons parl pour les fonctions de transfert
correspond en fait la dnition suivante.
Un systme de
t 7 u(t)
la sortie
t 7 y(t)
reste borne.
On appelle matrice de
p=m=1
propres. Lorsque
s et on parle alors de
fonction de transfert.
P (s)
est dite causale ou propre quand le degr du
Une fraction rationnelle
Q(s)
numrateur P (s) est plus petit que (ou gal ) celui du dnominateur Q(s).
Lorsque l'ingalit est stricte on dit que la fraction rationnelle est strictement
H(s)
On appelle
b(t) = Bu(t)).
Proposition 3.
systme o
n=2
et
m=p=1
d
x1 = x1 + u,
dt
d
x2 = x2 + u,
dt
y = x2 .
2.1.
87
de transfert
(cf
thorme 23)
On a, de manire gnrale, la proprit suivante qui permet de caractriser
la rponse asymptotique d'un systme stable EBSB une entre sinusodale.
Proposition 4
entre sinusodale)
m=p=1
et suppo-
constantes,
converge vers
H()
H(s)
R 3 7
forme d'tat canonique minimale que nous allons dnir. C'est ce qu'on appelle la ralisation sous forme d'tat d'un transfert rationnel .
De manire prliminaire, nous allons traiter un cas particulier qui permet
de comprendre l'algorithme gnral de construction du systme d'tat.
y(s) =
o
(a0 , a1 , b0 , b1 )
s2
et
b1 s + b0
u(s)
+ a1 s + a0
d2
d
d
y + a1 y + a0 y = b 1 u + b 0 u
2
dt
dt
dt
88
CHAPITRE 2.
On pose
FONCTIONS DE TRANSFERT
pour obtenir
d
d
z2 = a0 z1 a1 z2 + b1 u + b0 u
dt
dt
d
x2 = a0 x1 a1 x2 + (b0 a1 b1 )u,
dt
d
x1 = x2 + b1 u,
dt
x2 =
y = x1
A=
0
1
a0 a1
,
B=
b1
b 0 a1 b 1
,
C = (1 0)
(2.6)
On voit que l'astuce est de faire disparatre par des changements astucieux
sur l'tat, les drives de
u.
y(s) =
b2 s 2 + b1 s + b0
u(s)
s2 + a1 s + a0
d
z1 = z2 ,
dt
z = (y, dtd y)
d
d2
d
z2 = a0 z1 a1 z2 + b2 2 u + b1 u + b0 u
dt
dt
dt
On pose z
2 = z2 b2 dtd u. Avec les variables
2
u, dtd 2 u, disparat
d
d
z1 = z2 + b2 u,
dt
dt
(z1 , z2 ),
d
d
z2 = a0 z1 a1 z2 + (b1 a1 b2 ) u + b0 u
dt
dt
x1 = z1 b2 u,
x2 = z2 (b1 a1 b2 )u
On obtient alors la forme d'tat souhaite (avec une loi de sortie qui dpend
directement de
u)
d
x1 = x2 + (b1 a1 b2 )u,
dt
car
y = x 1 + b2 u .
d
x2 = a0 x1 a1 x2 + (b0 a0 b2 a1 (b1 a1 b2 ))u
dt
2.1.
89
rationnelle
y(s)/u(s) = G(s)
d
x = Ax + Bu,
dt
o
dim(x)
y = Cx + Du
G(s)
m > 1
entres
et
p > 1
sorties
y,
le transfert entre
et
tant donn
(en accord avec la Dnition 6), par une matrice dont les lments sont des
fractions rationnelles en
s.
x = Ax + Bu,
1.
(A1 , B1 , C1 )
avec
0
1
0
0
0
1
...
...
A1 =
0
... 0
a0 a1 ...
C1 = b0 ... bn1
2.
(A2 , B2 , C2 )
y = Cx
...
0
...
...
...
...
0
1
... an1
, B1 = 0
...
avec
0 a0
b
0
...
...
, B = ...
...
... 2
bn1
1 an1
0 ... 0 1
0
1
A2 =
...
0
C2 =
...
0
...
...
90
CHAPITRE 2.
FONCTIONS DE TRANSFERT
u, comme perturbation w
y.
Reprenons les notations d'un systme non linaire telles que nous les
avons vues la Section 1.4.3. On considre un systme tout fait gnral
dcrit par
d
x = f (x, u, w, p),
dt
o
Rn 3 x 7 y = h(x) Rm<n
reprsente
2.2.
91
doit
suivre).
valeur
(en gnral
x , u, w
et
d
=a
(y, , v),
dt
, v)
u = k(y,
ouverte de la Figure 2.2 par une boucle de rtro-action en montrant bien que
les informations issues de la sortie
y,
ajuster le contrle
nouveau contrle
mme
v). On
(
x, y, u, w,
,
de simplicit,
dim(u) = 1, dim(y) = 1
et que
v = yr
(x, y, u, w, , v)
v).
(
x, yr , u, w,
,
92
CHAPITRE 2.
FONCTIONS DE TRANSFERT
x = Ax + Bu + Dw
dt
y = Cx
u = Ly + M + N v
d = F + Gy + Hv
dt
A, B , D, C , L, M , N , F , G, et H s'obtiennent
et a
partielles de f , h, k
. Par le calcul symbolique, on
o les matrices
drives
par
partir des
d
remplace
dt
sx = Ax + Bu + Dw
y = Cx
u = Ly + M + N v
s = F + Gy + Hv
On rsoud simplement
et on forme alors
y = G(s)u + Gw (s)w
avec
G(s)
et
Gw (s)
Gw = C(sI A)1 D
u = L + M (sI F )1 G y + N + M (sI F )1 H v
2.2.
93
v = yr
et on choisit
L = N
et
G = H .
On a donc
u = K(s)(yr y) = K(s)e
avec
K(s)
la fraction rationnelle
K(s) = N + M (sI F )1 H
On en dduit le schma blocs de la boucle ferme de la Figure 2.5. On notera
les indications de signe
leur cot fonctionnel et visuel. Ils permettent de mieux comprendre les liens
de cause eet.
Pour rsumer, on a obtenu de faon directe les relations entre les entres
et
yr
et
e = yr y
GK
Gw
yr +
w,
1 + GK
1 + GK
1
Gw
e=
yr
w
1 + GK
1 + GK
y=
(2.7)
(2.8)
K(s)
en
donnant les gabarits pour les diagrammes de Bode (surtout celui relatif au
gain en fonction de la pulsation
yr
94
CHAPITRE 2.
FONCTIONS DE TRANSFERT
b
,
G(s) =
s+a
d
Gw (s) =
,
s+a
K(s) =
Ki
Kp +
s
es
y=
Ici,
GK
Gw
yr +
w
1 + GK
1 + GK
le plan complexe.
Les objets que nous allons devoir manipuler sont des fonctions mro-
P (s)
et
Q(s),
la fonction
nulle. Une fonction entire est la fonction associe une srie dont le rayon
de convergence est innie. Ainsi,
si et seulement si
P+
an s n
F (s) = Pn=0
+
n
n=0 bn s
an et bn deux suites de nombres complexes 7 telles que les sries associes
n
ont un rayon de convergence inni, c.--d. pour tout r > 0, limn7+ an r =
n
s
limn7+ bn r = 0. Ainsi e , cosh( s), sin(s)/s sont des fonctions entires
cos(s)
sin(s2 )
et
, 1/s,
sont des fonctions mromorphes sur C. En revanche,
sin(s)
cos(s3 )
exp(1/s) n'est ni une fonction entire, ni une fonction mromorphe sur C.
En eet, elle admet en 0 une singularit de degr inni. Pour une fonction
P
8
mromorphe F = Q , les zros de P sont les zros de F et les zros de Q sont
les ples de F . De manire informelle, les fonctions entires peuvent tre vues
avec
bn
soit dirent de
0.
P
et
2.3.
95
MARGE DE ROBUSTESSE
z0 ,
+
X
an (z z0 )n
n=n0
avec
n0 > 0 (an0 6= 0)
G(s) =
avec
NG (s)
,
DG (s)
K(s) =
et
qui suivent
NK (s)
DK (s)
NG = b, DG = s + a, NK = (sKp + Ki )es , DK = s
et on doit considrer dans le transfert en boucle ferme, la fonction mromorphe
T
T =
N (s)
NG NK
GK
=
=
1 + GK
D(s)
DG DK + NG NK
avec
la perturbation
est la valeur de
Gw
).
1+GK
0, b, Kp , Ki
s 7 1 + GK(s)
> 0,
dirent de
et
a < 0.
F (s)
dnie
F (s)
est bien
dnie sur le bord (pas de ple sur le bord) et aussi qu'elle ne s'annule pas
(pas de zro sur le bord). Comme on eectue une boucle, il est clair que la
variation totale de l'argument est ncessairement un multiple de
2N
9. On remarque que
NG
et
DG
2 ,
disons,
et
K.
NK
et
DK .
C'est
96
CHAPITRE 2.
FONCTIONS DE TRANSFERT
sC
et un domaine
Cs ; F (s)
F (s) lorsque s parcourt le bord dans le sens direct une seule fois. Le
Thorme 18 de Cauchy illustr sur la Figure 2.6, dit alors que N = Z P ,
o Z est le nombre de zros et P le nombre de ples l'intrieur du domaine.
complexe
Les zros et les ples sont compts avec leur multiplicit. On en donne ici
un nonc plus formel dont la preuve complte s'appuie sur le thorme des
0
rsidus appliqu la fonction F /F (voir [53]).
Thorme 18
complexe
(Cauchy)
Soient
Cs
F (s)
N =Z P
Dmonstration. Sur le domaine dlimit par
R(z)
avec
Q(z)
R(z) =
Z
Y
(z rk )R(z),
Q(z) =
k=1
o les
zk
sont les
zros et les
(z qk )Q(z)
k=1
qk
les
et
ne s'annulent ni
2.3.
97
MARGE DE ROBUSTESSE
Figure
s = 0; R > 0
est grand et
Cs
log F (z) =
est petit.
Z
X
>0
log F
log(z rk )
k=1
P
X
k=1
lorsque
p +Ki s
F = 1+GK = 1+b sK
e
admet un ple simple en 0.
s(s+a)
Prenons
Cs
en la rduisant conti-
Cs .
Au cours de cette
R(z)/
Q(z)
ne s'annule jamais, son argument est donc bien dni
et sa variation sur un tour de la courbe dforme est un multiple de 2 . la n de la
dformation, la courbe ferme suivie par z est rduite un point et donc la variation de
l'argument de R(z)/
Q(z)
est nulle. Au cours de la dformation, la variation ne peut pas
sauter brusquement d'un multiple non nul de 2 0 pour cause de continuit. Ainsi cette
dformation (homotopie),
98
CHAPITRE 2.
CR,
FONCTIONS DE TRANSFERT
F = 1 + GK
c.--d.
0 lorsqu'on
1 + GK , n'a
autour de
P = 0.
F = 1 + GK au lieu de D = NG NK +
DG DK la place de F . On viterait le ple en s = 0 qu'on est oblig de
contourner avec le petit demi-cercle de rayon . Cela vient du fait que sur la
partie de CR, loin de l'origine (bref sur le grand demi cercle de rayon R) GK
est trs petit et reste donc trs proche de 0. Sur cette partie, F reste ainsi trs
proche de +1 et ne tourne donc pas autour de 0. Le fait que GK soit petit
pour les s de CR, loin de l'origine vient du fait que les transferts G et K sont
sKp +Ki s
e
tend vers 0 lorsque s tend
des transferts causaux : GK(s) = b
s(s+a)
vers l'inni tout en restant partie relle positive. On voit que > 0 est
capital ici pour avoir cette proprit et que ce n'est plus vrai pour s tendant
Maintenant, pourquoi considrer
1
Soit le systme de fonction de transfert s+2 boucl par un contrleur PI de
K
40
fonction de transfert KP + sI = 3 + s . Pour l'tude du systme en boucle
ferme reprsent sur la Figure 2.8, on doit tudier l'annulation de la fonction
de transfert
1+
sKp + KI
s2 + 5s + 40
=
s(s + 2)
s(s + 2)
53i 15
. On peut, en utilisant dirents contours comme on l'a fait sur la
2
Figure 2.9, vrier la formule N = Z P du Thorme 18 de Cauchy.
2.3.
99
MARGE DE ROBUSTESSE
Z=0, P=0
N=0
50
1000
-50
-50
50
-1000
-200
200
400
600
800
-2
-2
-1
Z=2, P=2
50
1000
-50
-50
50
-1000
-200
200
400
600
800
-2
-2
-1
Z=2, P=1
1000
-50
0
50
-1000
-800
-600
-400
-200
200
-2
-2
-1
Z=0, P=1
N=-1
50
1000
-50
-50
N=1
50
-50
0
N=0
50
-1000
-800
-600
-400
-200
200
-2
-2
-1
Figure
s0
(s s0 )
dans le produit
vers
G(s)K(s),
elles ne portent
G()K()
lorsque
parcourt
Thorme 19
(Critre de Nyquist)
G(s)
et
K(s)
partie relle positive. C'est le cas pour des fractions rationnelles dont le degr du numrateur est strictement infrieur celui du dnominateur.
100
CHAPITRE 2.
FONCTIONS DE TRANSFERT
GK
1 + GK
est asymptotiquement stable si et seulement si le lieu de Nyquist ne passe
pas par
GK
admet de ples partie relle strictement positive (les ples sont compts
s s2 + 4s + 2
G(s) = exp
2
s2 1
(2.9)
k,
pour
k = 1).
Le transfert
G(s)
D'aprs le Thorme 19, pour que le systme en boucle ferme reprsent sur
la Figure 2.10 soit asymptotiquement stable, il faut et il sut que le lieu de
Nyquist entoure une seule fois (dans le sens indirect) le point
pas le cas avec
1.
Ce n'est
k = 1,
GK
s = 0
(voir Fi-
<(s) > 0.
2.3.
101
MARGE DE ROBUSTESSE
1.5
0.5
-1.1845
-0. 5
-1
-1. 5
-2
-1. 5
-1
-0. 5
0.5
>0
tel que,
lim
G(s)K(s) = 0
|s| 7 +
<(s)
ce qui est le cas pour les fractions rationnelles et les fractions de quasipolynmes tels que ceux que nous avons considrs. En eet si
les conditions du critre de Nyquist, alors pour un parcours en
dcal vers la gauche,
s = + ,
allant de
GK
vrie
lgrement
+ vers et 0 <
GK( + ) lgrement
et
102
CHAPITRE 2.
FONCTIONS DE TRANSFERT
Revenons l'exemple
phase .
On commence par une normalisation en posant
s
s = ,
a
k = abKp ,
Ki
,
Kp a
Alors
G(s)K(s) = G(
s)K(
s) = kes
= a
s +
s(
s + 1)
s et s
a = 1,
et on crit
G(s)K(s) = kes
s+
s(s + 1)
G(s)K(s)
pour
suivant le
< > 0.
grandit, c.--d. lorsqu'on change les rglage du contrleur. On se convaincra sans dicult que lorsque = 0, le lieu de Nyquist de
G(s)K(s) n'entoure jamais 1 quels que soient k et > 0. Noter que lorsque
= 0, la stabilit est donne par les racines d'un polynme de degr deux et
lorsque le paramtre
,
=0
et
G(s)K(s) lorsque
et > 0 ? Pour s = , G()K() subit une
(multiplication par e ). Comme l'illustre la Figure 2.14,
rotation de
la
entour par le lieu de Nyquist, est directement lie aux points d'intersection
du lieu de Nyquist pour
2.3.
103
MARGE DE ROBUSTESSE
s+
Figure 2.12 Le lieu de Nyquist de G(s)K(s) = kes s(s+1)
=0
et
lorsque
= 0.5. ;
la courbe ferme
dcrit la courbe
CR,
de la
k = 1,
du plan complexe dcrite par G(s)K(s)
Figure 2.7 pour R 1 et 0 < 1.
s+
Figure 2.13 Le lieu de Nyquist de G(s)K(s) = kes s(s+1)
=0
et diverses valeurs de
avec
avec
k = 1,
104
CHAPITRE 2.
pour
FONCTIONS DE TRANSFERT
s+
G(s)K(s) = k s(s+1)
avec
k = 1,
= 0.5.
avec le cercle unit. Un simple calcul faisant intervenir une quation bi-carre
(+)
traduisant le fait que le complexe k
est de module 1, donne
(+1)
s
=
On note
[0, [
(1 k 2 ) +
p
(1 k 2 )2 + 4k 2 2
2
e = k
au second membre)
( + )
( + 1)
critique qui s'en dduit : si, par exemple, la pulsation critique est trs
petit alors le retard critique est grand ds que n'est pas proche de 0.
Pour
k = 1
stabilit lorsque
et
= 0.5,
2.7,
d'aprs
12
lorsque franchit le seuil , deux ples complexes
conjugus traversent en
12. Ce sont les ples en boucle ferme, pas ceux de
GK
mais ceux de
1/(1 + GK).
2.3.
105
MARGE DE ROBUSTESSE
de Nyquist pour
s+
G(s)K(s) = kes s(s+1)
avec
k = 1,
mme temps l'axe imaginaire en venant de la partie stable. On sait cela car
juste aprs , 1 est entour deux fois donc on a exactement deux racines
partie relle strictement positive : un peu avant , le systme est trs oscillant
mais les oscillations sont lentement amorties ; un peu aprs , le systme est
toujours trs oscillant mais les oscillations sont lentement amplies.
on connat mal le
d
y = ay + bu + dw
dt
coecient b devant u (on connat
106
CHAPITRE 2.
FONCTIONS DE TRANSFERT
1
devient instable. Les valeurs
1+kG(s)K(s)
maximales et minimales admissibles de k sont appeles marges de gain .
s s+
Reprenons l'exemple G(s)K(s) = e
. On considre tout d'abord
s(s+1)
= 0. On voit d'aprs les divers lieux de Nyquist tracs sur la Figure 2.13 que,
de
(en partant de
1),
le transfert
1.
par
Ainsi, on a une marge de gain innie dans ce cas. C'est une faon
0.25
pour
= 0.5.
exp()
0, l o les pulsations
> 0,
0.
Aussi, il
trouvera toujours une dilatation du lieu de Nyquist, qui l'amne passer par
1.
Kp
et Ki ne peuvent pas
= > 0 correspond
rapide nglige. Il est intressant de remarquer que le Thorme de Tikhonov 15 porte sur des systmes singulirement perturbs, c'est dire avec un
= k
o l'argument de
GK
180
+180
degrs).
La marge de phase
et
pour la pulsation
GK par 1
(20 log10 )).
module de
dcibel
GK()
en
2.3.
107
MARGE DE ROBUSTESSE
gain: module de GK en dB
40
30
20
10
0
10
20
30
2
10
(rad/s)
10
10
10
150
100
50
0
50
100
150
10
10
(rad/s)
10
10
et de phase
lorsque
s+ 1
2
.
G(s)K(s) = es s(s+1)
Alors la marge de retard, qui seule une signication physique, est donne
mme (il est conseill prendre des radians pour ne pas se tromper).
la partie du lieu qui est proche de l'origine est modie. Donc le nombre de
tour autour du point
108
CHAPITRE 2.
FONCTIONS DE TRANSFERT
G
G.
G(s)
=0
dans le
ne conserve que
les ples dominants : il est ainsi lgitime d'liminer les ples trs rapides et
stables.
En rsum, ne conserver que les ples dominants dans le transfert
G
par
G = G0 .
2.4 Complments
2.4.1 Calcul de tous les contrleurs PID stabilisant un
systme du premier ordre retard
Comme on l'a vu, le contrleur PI et plus gnralement le contrleur
K(s) = kP +
o
kD
kI
+ kD s
s
est le gain driv. Ainsi, rgler un PID revient trouver les bons gains,
GK/(1 + GK)
kP , kI
et
kD ,
au minimum stable.
G(s) =
k
es
1 + s
(2.10)
2.4.
109
COMPLMENTS
k R+ , R , R+ .
K(s) = kP
(2.11)
Thorme 20
([64])
On suppose
> 0,
proportionnels prservant la stabilit du systme (2.10) est dni par les valeurs admissibles suivantes
z1
1
1
< kP <
k
k cos z1
]/2, [
de l'quation
tan(z) =
kP
Thorme 21
([64])
< 0.
On suppose
< | |.
On suppose cette
k
o
z1
z12
]0, /2[
2
< kP <
de l'quation
tan(z) =
1
k
110
CHAPITRE 2.
FONCTIONS DE TRANSFERT
La preuve de ces thormes utilise l'extension du Thorme 6 de HermiteBiehler pour les quasi-polynmes (i.e. des polynmes en s avec coecients en
es comme on en rencontre dans les fonctions de transferts des systmes
retard boucls).
Le cas de la stabilisation par un PID
K(s) = kP +
kI
+ kD s
s
(2.12)
est trait dans l'nonc suivant (un peu compliqu premire vue mais simple
mettre en uvre). Seul le cas des systmes stables en boucle ouverte est
trait ici. On se reportera [64] pour un expos concernant le cas des systmes
instables en boucle ouverte.
Thorme 22
([64])
On suppose
> 0,
PID (2.12) prservant la stabilit du systme (2.10) est dni par les valeurs
admissibles suivantes
1
1
< kP <
1 sin(1 ) cos(1 )
k
k
racine sur ]0, [ de l'quation
tan() =
Pour
est l'unique
kp
z1 , z2
]0, 2[
de l'quation
z sin z = 0
sin z + z cos z , et mi = m(zi ), bi = b(zi ),
kkP + cos z
On note
m(z) =
2
,
z2
b(z) = kz
i = 1, 2.
kP ] k1 , k1 [, alors (kI , kD ) doit tre choisi de telle sorte que k <
kd < k , ki > 0 et kd > m1 kI + b1
1
1. si
2.
3.
On pourra remarquer la similitude apparente entre les noncs des Thormes 22 et 20. Les bornes suprieures sur le gain proportionnels sont direntes. En eet, l'nonc 22 ncessite bien souvent l'usage eectif du terme
intgral et du terme driv car le point
(kI , kD ) = (0, 0)
2.4.
111
COMPLMENTS
G(s), on ralise
et
construits partir de
et
k tels que
y(t) = k(1 e
)It .
Les rglages heuristiques de Ziegler-Nichols sont reports dans le tableau 2.1. Ils permettent de rgler au choix un contrleur
13. Un modle du premier ordre atteint environ
gal
63%
P,
un
PI
ou un
112
CHAPITRE 2.
FONCTIONS DE TRANSFERT
P ID.
Contrleur kP
P
PI
PID
kI
kD
1/a
0.9/a 0.3/(a)
1.2/a 0.6/(a)
0.6/a
0)
Tu
ku
le gain proportionnel
Contrleur kP
P
PI
PID
0.5ku
0.4ku
0.6ku
kI
kD
0.5ku /Tu
1.2ku /Tu
0.075ku Tu
2.4.
113
COMPLMENTS
ku
a=k
Notons
= / .
sont
kP =
1.2
,
k
kI =
0.6
,
k2
kD =
0.6
k
(2.13)
Considrons en premier lieu le gain proportionnel suggr. Nous allons montrer qu'il est toujours acceptable, en d'autres termes, qu'il satisfait toujours
les hypothse du Thorme 22. Pour notre systme stable, le gain propos
1
. En ce qui concerne la borne suprieure indique dans
satisfait kP > 0 >
k
le Thorme 22, on peut la rcrire
kmax
1
=
k
1
1 sin 1 cos 1
1
. En liminant
1+ 1
fonction de 1 dans cette dernire quation, on peut tablir que
o
]0, [
de
tan 1 =
en
1
(1 sin 1 cos 1 1.2)
k
1
1
=
cos 1 +
1.2
k
sin 1
kmax kP =
Par construction,
1 ]0, [.
On vrie alors
kmax kP > 0.
Par consquent,
le gain proportionnel suggr par la premire mthode de Ziegler-Nichols satisfait toujours les hypothses du Thorme 22 de stabilisation par un PID
pour un systme du premier ordre retard. C'est une importante justication de cette mthode heuristique. En outre, on peut montrer par une tude
114
CHAPITRE 2.
FONCTIONS DE TRANSFERT
kI
et
kD
par cette mme mthode satisfont galement les hypothses les concernant
de ce mme thorme. Plus prcisment, on peut tablir qu'ils les satisfont
mais de manire possiblement non robuste lorsque
le retard
),
des frontires des domaines dcrits dans le Thorme 22. C'est galement un
phnomne connu et observ en pratique qui engage souvent modier un
peu les gains au prix de performances moindres.
x(t)
x Rn , u R
et
y R.
G0 (s)
2.4.
115
COMPLMENTS
0 et G(s)
G
reprsentent la
G0 = G0 et G = G. On suppose
G0
stable.
C'est sous cette hypothse qu'on comprend le fonctionnement du prdicteur de Smith. Grce la boucle interne au prdicteur (dans la zone grise
de la Figure 2.19), le signal entrant dans le contrleur
K0
est
Figure
Smith.
Le comportement entre-sortie du systme boucl par le prdicteur de
Smith est quivalent celui du systme donn sur la Figure 2.20. Articiellement, on a russi intercepter le signal de mesure avant le bloc retard et
donc nous ramener un problme de rgulation d'un systme sans retard.
On notera toutefois que le retard est toujours prsent sur la sortie. Il n'a pas
disparu du problme mais il n'interfre pas avec la rgulation.
0
G
et
.
G
et
sont dirents,
G0
K0
116
CHAPITRE 2.
FONCTIONS DE TRANSFERT
K0
F (s)
vaut
G(s) =
N (s))
est
14
G(s) =
1s
.
s2
Ce transfert correspond, sous forme d'tat, un double intgrateur, typiquement un systme mcanique rgi par la loi de Newton,
d
x1 = x2 ,
dt
o la mesure
vitesse
x2
d
x2 = u
dt
x1
et la
y = x1 x2 .
x1 = x2 = y = u = 0 pour les t 0, considrons
la rponse un chelon unitaire u = 1 pour t > 0. Un calcul simple donne
2
y(t) = t2 t pour t > 0. Ainsi au tout dbut y commence par tre ngatif
pour terme devenir positif. Si au lieu de 1 s on avait eu 1 + s, nous
n'aurions pas eu cette rponse inverse. Ainsi, pour rguler y , un contrleur
proportionnel ne sait pas dans quelle direction partir. Le bouclage u = Kp y
conduit toujours une boucle ferme instable quelque soit le gain Kp choisi.
En partant de l'quilibre
d
x1 = x2 ,
dt
d
x2 = Kp x1 + Kp x2 ,
dt
14. Cette rponse inverse n'est pas cependant une caractrisation mathmatique du fait
qu'un zro soit instable.
2.4.
117
COMPLMENTS
est instable ds que
Kp 6= 0
: la matrice
0
1
Kp Kp
est toujours instable
s3 Kp s2 + (Kp Ki )s + Ki = 0.
Le critre de Routh (conditions 1.13) donne ici les conditions de stabilit
Kp > 0,
Kp Ki > 0,
Kp (Kp Ki ) > Ki
Ki > 0,
Kp
et
Ki .
K(s) = Kp + Kd s
de gain
Kd .
Maintenant,
1 + GK = 0
suivante :
(1 Kd )s2 + (Kd Kp )s + Kp = 0
Ces racines sont stables si, et seulement si,
Kd K p
> 0,
1 Kd
Kp
> 0.
1 Kd
0 < Kd < 1,
0 < Kp < Kd ,
petites marges
Kd = 1/2
et
Kp = 1/4,
Kd
petit.
Pour les systmes d'ordre plus lev, une telle analyse avec Routh n'est
pas trs commode. Il est alors utile de tracer le lieu de Nyquist de
certaines valeurs des paramtres du correcteur
gain et de retard.
GK
pour
118
CHAPITRE 2.
FONCTIONS DE TRANSFERT
Chapitre 3
Commandabilit, stabilisation,
feedback
d
x = f (x, u) est un systme sous-dtermin .
dt
La dirence entre le nombre d'quations (indpendantes) et le nombre de
Un systme command
m = dim u.
Il faut
Le problme de planication de trajectoire est ainsi rsolu. Ce point est dtaill la Section 3.3.4. Les sorties de Brunovsky permettent galement de
construire le bouclage (feedback) qui assure le suivi asymptotique d'une tra-
119
120
CHAPITRE 3.
Figure
COMMANDABILIT, STABILISATION
u,
le
contrle.
et
xi ,
l'inclinaison et l'abscisse
i, i = 1, 2.
d2
x1 = a1 (x1 u),
dt2
o
a1 = g/l1
carrs des
rentes des
d2
x2 = a2 (x2 u)
dt2
(3.1)
T >0
et un dplacement dsir
D.
t=0
vers l'quilibre
x1 = x2 = u = D
en
x1 = x2 = u = 0
t = T.
Pour trouver de telles trajectoires, le plus simple est d'introduire la nouvelle variable
z=
x1 x2
a1
a2
x1 x2
a1
a2
= x2 x1
z=
(2)
(3.2)
(4)
z = (a1 a2 )u + a1 x1 a2 x2
elles sont bien contenues dans les trois quations ci-dessus. En fait (3.2) est
une description quivalente de la dynamique du systme dcrit initialement
z.
x1 , x2 et u avec
x1 (t), x2 (t) et u(t) vrient
par (3.1) mais avec une quation de plus et une variable de plus
L'intrt de rajouter
x1 (t), x2 (t)
et
a2 x1 a1 x2 , on obtient encore x1 ,
via z qui est une fonction arbitraire
en posant
z =
on paramtrise
fois,
x1
et
x 2 . u + c1
et
u + c2
x1 + c1
et
x2 + c2 , c1
et
c2
constantes, au lieu de
sont les abscisses des points auxquels sont suspendus les deux
ci
122
CHAPITRE 3.
COMMANDABILIT, STABILISATION
que nous n'en manquons aucune en les dcrivant comme des combinaisons
(2)
(4)
linaires de z , z
et z
.
t = 0, x1 = x2 = u = 0, imposent la
valeur 0 z et ses drives jusqu' l'ordre 3 (ordre 4 si on ne tolre pas de
(i)
discontinuits sur u) : z (0) = 0 pour i = 0, 1, 2, 3, 4. De mme en t = T ,
1
a12 D et z (i) (T ) = 0 pour i = 1, 2, 3, 4. Pour t 6= 0, T ,
on a z(T ) =
a1
z(t) est libre. Il faut cependant respecter la continuit pour z et ses drives
jusqu' l'ordre 4 (ou 3 si tolre des saut sur le contrle u). Une des fonctions
les plus simples z(t) qui respectent ces conditions est la suivante
1
1
t
z(t) =
D
(3.3)
a1 a2
T
Les trois conditions d'quilibre en
est la fonction
C4
croissante de
() =
dans
0,
si
5
,
5 +(1)5
si
1,
si
[0, 1]
dnie par
0;
0 1;
1
l'quilibre d'abscisse
en temps ni
arbitraire. Si on utilise le
z(t) +
u(t) =
1
a1
1
a2
1
a1
z (2) (t) +
1
z (4) (t)
a1 a2
1
a2
x1 (t) =
x2 (t) =
0,
0.
1 (2)
z (t)
a2
1
a12
a1
z(t) + a11 z (2) (t)
1
a12
a1
z(t) +
solution de (3.1).
ur (t)
ouverte
trajectoire de rfrence. Ici, l'tat du systme est form par les positions
(x1 , x2 ) et les vitesses (v1 , v2 ) (vi = dtd xi , i = 1, 2). On note xi = xi xi,r
et vi = vi vi,r les dviations en position et en vitesse par rapport la
rfrence (i
en boucle ferme
xi
et
d2
x1 = a1 (x1 u),
dt2
xi
et
d2
x2 = a2 (x2 u)
dt2
x1,r = x2,r = ur = 0.
u = 0,
l'nergie du systme,
a1
1
a2
1
V = (v1 )2 + (x1 )2 + (v2 )2 + (x1 )2 ,
2
2
2
2
reste constante les longs des trajectoires. Donc, comme les quations sont
linaires par rapport
u, la drive de V
du signe oppos
au second facteur (ce qui est facile comme nous allons le voir) pour faire
dcrotre cette nergie. On conclut alors par le Thorme 11 de LaSalle.
Faisons ici les calculs. On a
d
V = (a1 v1 + a2 v2 )u
dt
Avec
min
u ,
k(a1 v1 + a2 v2 ),
u = K(v1 , v2 ) =
max
u ,
si
si
si
k(a1 v1 + a2 v2 ) umin ;
umin k(a1 v1 + a2 v2 ) umax ;
umax k(a1 v1 + a2 v2 )
(3.4)
min
124
CHAPITRE 3.
COMMANDABILIT, STABILISATION
Figure 3.2 Un atome trois niveaux en interaction avec une lumire laser
polarise linairement et associe au champ lectrique
E R,
le contrle.
a1
d
d
v1 + a2 v2 = (a1 )2 x1 (a2 )2 x2 = 0
dt
dt
(a1 )4 x1 (a2 )4 x2 = 0
Comme
a1 6= a2
et
a1 , a2 > 0,
0.
x1 = x 2 = 0
et
Notre feedback
0.
u : il sut
ur
qui ne passe
par trop prs des bornes. Cette hypothse est vrie s'il existe
,
k(a1 v1 + a2 v2 ),
u = ur +
,
est chaque instant dans
si
si
si
k(a1 v1 + a2 v2 ) ;
k(a1 v1 + a2 v2 ) ;
k(a1 v1 + a2 v2 ).
La fonction d'onde
de l'atome
trois niveaux schmatis sur la Figure 3.2 obit, sous l'approximation di-
E(t)
polaris linairement,
l'quation de Schrdinger
~
C3 est
H0 et H1 sont
o
d
= (H0 + E(t)H1 )
dt
0 0
0
H0 = 0 ~1 0 ,
0 0 ~2
1 , 2
et
et o
C3
0
H1 = 0 0
0 0
1
|0i = 0 ,
0
on voit que
|0i
celui d'nergie
0
|1i = 1 ,
0
0
|2i = 0
1
E2 = ~2 ,
|0i
|0i, |1i
|2i,
ou
d
0 = E(1 + 2 )
dt
~
d
1 = 1 1 + E0
dt
~
d
2 = 2 2 + E0
dt
~
On constate que
0 = 1, 1 = 2 = 0
et
E =0
i , i = 0, 1, 2,
et
linarises
d
0 = 0,
dt
1 = 1 1 + E,
dt
~
2 = 2 2 + E.
dt
~
est constant. C'est une partie de l'tat qui n'est pas inuence par le contrle
126
CHAPITRE 3.
COMMANDABILIT, STABILISATION
(au moins au premier ordre). Cette partie est non commandable (au premier
ordre). Elle ne nous gne pas, elle correspond au fait que le module de
vaut
d
1 = 1 1 + E,
dt
~
2 = 2 2 + E
dt
~
En posant
1 x1 + dtd x1
1 =
,
~(1 )2
2 x2 + dtd x2
2 =
,
~(2 )2
E = u
p1 , 2 = 0 avec E = 0. Cela se
En t = T , on souhaite arriver en 1 =
traduit dans les variables x1 et x2 par des conditions suivantes. En t = 0,
tout est nul. En t = T , on doit avoir
fondamental
|0i
en
x1 = x1 =
Sur la variable
~1
,
p1
v 1 = x2 = v 2 = u = 0
t=0
(voir (3.3))
t = T,
z=
x1
,
a1
z (1) = z (3) = 0,
z (2) =
x1 ,
z (4) = a1 x1
z(t) = x1
1
(t T )2 a1 (t T )4
+
a1
2
4!
t
2. L'intrt ventuel d'un transfert dans ces conditions vient du fait que nous ne supposons pas le contrle rsonnant comme il est usuel de le faire. Nous n'utilisons pas ici
l'approximation du champ tournant et les oscillations de Rabi.
z(t) +
E(t) =
1
a1
1
a2
1
a1
z (2) (t) +
1
z (4) (t)
a1 a2
1
a2
C'est important pour que notre modle linaris reste valable et que le calcul
prcdent ait un sens.
Nous ne traiterons pas le problme du suivi de trajectoire car la notion de
feedback pour un tel systme est trs obscure l'heure actuelle, mme si, en
thorie, elle serait trs sduisante pour construire un calculateur quantique et
rendre les qubits insensibles la dcohrence due au couplage avec l'environnement. vrai dire, on se demande mme si la notion de feedback a un sens
de telles chelles. Pour un systme quantique la notion de rtro-action et
de feedback se heurtent au problme de la mesure. On ne peut pas supposer
que l'on connat chaque instant
et
2 .
Exemple 16
unitaire) dans le plan, dont le centre de gravit est repr par les coordon-
(x, y), dont l'orientation est donne par l'angle , et dont l'inertie est
J . Ce systme est soumis exclusivement 3 une force (commande) u
s'exerant en un point bien dtermin (situ une distance r du centre de
nes
note
d2
x = u sin
dt2
d2
y = u cos
dt2
d2
J 2 = ru
dt
Ce systme mcanique est sous-actionn. Il possde 3 degrs de libert et
une seule commande. On souhaite pourtant le dplacer d'une conguration
une autre (c.--d. d'un point de dpart et d'une orientation un point
3. Il s'agit d'un hockey-puck, c.--d. un palet sur une table coussin d'air
128
CHAPITRE 3.
COMMANDABILIT, STABILISATION
et
B ),
d
x(t) = f (x(t), u(t)),
dt
x(t) Rn ,
u(t) Rm
(3.5)
3.2.
129
I 3 t 7 (x(t), u(t)) Rn Rm
d'intrieur non vide I de R les
Dnition 10 (Commandabilit).
problme de Cauchy
d
x(t)
dt
= f (x(t), u(t))
x(0) = p
vrie
x(T ) = q .
pour
t [0, T ]
T > 0.
gure 3.4, la commandabilit exprime une proprit topologique trs naturelle. En gnral, la commande en boucle ouverte
[0, T ] 3 t 7 u(t)
n'est pas
toire. Calculer
t 7 u(t)
partir de la connaissance de
f, p
et
constitue
l'une des questions majeures de l'Automatique. Cette question est loin d'tre
compltement rsolue actuellement.
Trs souvent, l'absence de commandabilit est due l'existence d'intgrales
premires non triviales. Ce sont des quantits qui restent constantes le long
de toute trajectoire. Nous allons les tudier.
d
x
dt 1
d
x
dt 2
d
T
dt
= D(xin
1 x1 ) k0 exp(E/RT )x1
= Dx2 + k0 exp(E/RT )x1
= D(T in T ) + H exp(E/RT )x1 + u
(3.6)
130
CHAPITRE 3.
Figure
COMMANDABILIT, STABILISATION
correspond aux
k = k0 exp(E/RT )
qui relie la constante de vitesse
la temprature
T.
xi
Xi , i = 1, 2.
de voir que ce systme n'est pas commandable. En eet, le bilan global sur
X1 + X2 ,
d
(x1 + x2 ) = D(xin
1 x1 x2 ).
dt
La quantit = x1
D(xin
1 ). Donc
+ x2
in
= xin
1 + (0 x1 ) exp(Dt)
(3.7)
dt
initial
tel que
3.3.
131
COMMANDABILIT LINAIRE
R Rn 3
t 7 (x(t), u(t))
du systme, c.--d.
h h d
d
h=
+
x0
dt
t
x dt
t 7 h(t, x) alors (3.5)
n
n'est pas commandable. Sinon, il existe T > 0, tel que pour tout p, q R et
tout instant initial t, h(t, p) = h(t + T, q) (il existe une trajectoire reliant p
q sur [t, t+T ]). Donc h est une fonction priodique du temps et indpendante
de x. Mais alors la drive de h le long des trajectoires du systme correspond
h. Comme elle est nulle, h est une constante, ce qui contredit l'hypothse.
t
Si (3.5) admet une intgrale premire non triviale
Proposition 5.
d
x = Ax + Bu
dt
x Rn , la commande u Rm et les matrices A et B
tailles n n et n m, respectivement.
o l'tat
et de
(3.8)
sont constantes
132
CHAPITRE 3.
COMMANDABILIT, STABILISATION
h(t, x) R.
(z, u),
(3.8) devient
d
z = exp(tA)Bu
dt
(3.9)
d
(exp(tA)) = exp(tA) A = A exp(tA). Dans
dt
l'quation (3.9), il est notable que le second membre ne dpend que de u
car d'aprs la Proposition 1,
mais pas de
z ).
nous avons
l
l d
d
l=
+
z=0
dt
t z dt
Comme
d
z
dt
= exp(tA)Bu,
et
u,
on a l'identit
suivante
En prenant,
l
l
(t, z) + (t, z) exp(tA)Bu 0
t
z
u = 0, z et t arbitraires, on en dduit
l
(t, z) 0
t
Donc, ncessairement,
z.
Ainsi
l
(z) exp(tA)B 0
z
En drivant cette relation par rapport
t,
on a,
l
(z) exp(tA)AB 0
z
Plus gnralement, une drivation n'importe quel ordre
l
(z) exp(tA)Ak B 0
z
En spciant
t = 0,
on obtient
l
(z)Ak B = 0,
z
k 0.
k0
donne
3.3.
133
COMMANDABILIT LINAIRE
l
(z) appartient l'intersection des noyaux gauche de la
z
k
k
famille innie de matrice (A B)k0 . Le noyau gauche de A B n'est autre
k
k
que Im(A B) , l'orthogonal de l'image de A B . Donc
Ainsi le vecteur
\
l
k
(z)
Im(A B)
z
k0
Mais
Im(A B)
Im(B)
+ . . . + Im(Ak B) + . . .
k0
ne dpend pas de
z:l
est de rang
n,
son noyau
galement.
n,
que
An
An =
n1
X
(Ak )0kn1
pk Ak
k=0
o les
pk
Pn1
det(In A) = n k=0 pk k . Nous avons prfr un argument
suite des Ek car il a l'avantage de s'appliquer au cas non linaire. Il
134
CHAPITRE 3.
COMMANDABILIT, STABILISATION
Proposition 6.
La matrice de commandabilit
n,
n.
rciproque est vraie. Pour cela, nous avons besoin de certaines proprits
d'invariance.
3.3.2 Invariance
Dnition 12 (Changement d'tat, bouclage statique rgulier).
changement linaire de coordonnes
x 7 x
Un
inversible d'ordre
par une matrice
K x + N u.
par l'tat.
L'ensemble des transformations
x
u
7
x
u
=
M 0
K N
M, N
et
x
u
varient (M et
(3.11)
restant
inversibles).
d
x=
Si
dt
pas d'intgrale premire). Les notions de commandabilit et d'intgrale premire sont intrinsques, c.--d. indpendantes des coordonnes avec lesquelles
les quations du systme sont tablies. Si la matrice de commandabilit dans
les coordonnes
les
coordonnes
au
n1
B) = n
quivaut
AB,
. . . , An1 B)
rang(B,
=n
3.3.
A
(
x, u)
135
COMMANDABILIT LINAIRE
et
d
x
dt
s'obtiennent en crivant
= Ax + Bu
x = M 1 (AM + BK)
x + M 1 BN u.
soit
A = M 1 (AM + BK),
= M 1 BN
B
En fait, il est possible d'aller beaucoup plus loin et de montrer que les indices
de commandabilit dnis ci-dessous sont aussi invariants.
le rang de la matrice
indices
est quivalente
Proposition 7
Bu
n.
n1 = n.
d
Les indices de commandabilit de dt x = Ax +
sont invariants par changement de variable sur x et bouclage statique
rgulier sur
(invariance)
u.
en exercice.
(x, u) 7 (
x, u) du type (3.11) forment un groupe. Ce groupe
dnit une relation d'quivalence entre deux systmes ayant mme nombre
d'tats et mme nombre de commandes. La proposition prcdente signie
simplement que les indices de commandabilit sont les mmes pour deux
systmes appartenant la mme classe d'quivalence, i.e le mme objet gomtrique vu dans deux repres dirents. En fait, on peut montrer que les
indices de commandabilit sont les seuls invariants : il y a autant de classes
d'quivalence que d'indices de commandabilit possibles. Nous ne montrerons pas en dtail ce rsultat. Tous les lments ncessaires cette preuve
se trouvent dans la construction de la forme de Brunovsky ci-dessous (voir
aussi [38, 67]).
Nous allons voir, avec la forme normale de Brunovsky, qu'une telle corres-
(Critre de Kalman)
d
Le systme dt x
= Ax + Bu
est com-
136
CHAPITRE 3.
est de rang
COMMANDABILIT, STABILISATION
n = dim(x).
(A, B) est commandable
commandabilit C est maximum.
pour
La preuve que nous allons donner de ce rsultat n'est pas la plus courte
possible. Cependant, elle permet de dcrire explicitement, pour toute dun
re T > 0 et pour p, q R , les trajectoires du systme qui partent de p et
arrivent en
y1
avec comme tat
Si
(m )
, ym
= vm
= v1 ,
...
(1)
(1 1)
z = (y1 , y1 , . . . , y1
...
(3.12)
( 1)
(1)
, ym , ym , . . . , ym m
),
les
quantits
yi ,
x,
sont
et les
entiers
de la forme de Bru-
novsky sont intimement lis (pour plus de dtail voir [38]) : la connaissance
des uns est quivalente celle des autres.
u;
l'invariance du rang de
mations (3.11) ;
une rcurrence sur la dimension de l'tat.
est de rang
m = dim(u)
m de faon se
x = (xr , xu ) avec
3.3.
137
COMMANDABILIT LINAIRE
dim(xr ) = n m
et
dim(xu ) = m
d
x
dt r
d
x
dt u
o
= Arr xr + Aru xu + Br u
= Aur xr + Auu xu + Bu u
Bu est une matrice carre inversible. Cette partition n'est pas unique, bien
u et en reportant cette
d
x
dt r
d
x
dt u
d
x
dt r
Br Bu1 dtd xu = (Arr Br Bu1 Aur )xr + (Aru Br Bu1 Auu )xu
d
x = Aur xr + Auu xu + Bu u.
dt u
xr = xr Br Bu1 xu ,
les quations
d
x
dt
= Ax + Bu
xu = xu ,
u = Aur xr + Auu xu + Bu u,
deviennent
d
x
dt r
d
x
dt u
= Ar xr + Au xu
= u
pas dans la seconde quation, on voit apparatre un systme plus petit d'tat
xr
et de commande
xu .
et de
Invariance de rang
n1
Un simple calcul par blocs nous montre que si (B, AB, . . . A
B) est de
nm1
rang n alors (Au , Ar Au , . . . Ar
Au ) est de rang n m. Du systme de
d
x = Ar xr + Au xu
taille n on passe ainsi au systme de taille rduite n m,
dt r
(x
r l'tat, xu la commande).
n,
138
CHAPITRE 3.
m = dim(u) > 0.
COMMANDABILIT, STABILISATION
L'limination de
type (3.11),
d
x
dt r
d
x
dt u
= Ar xr + Au xu
= u
le rang de Au . Comme m
m, un changement de variable sur xu , (
xu , xu ) =
P xu avec P inversible, permet d'crire le systme sous la forme
o
d
x
dt r
d
x
dt u
d
x
dt u
= Ar xr + Au xu
= u
= u
(3.13)
(
u, u) = P u, dim(
xu ) = m
et Au de rang m
. Le rang de la matrice de
d
M 0 0
z
xr
xu = K N 0 v
0 0 1
xu
xu
avec
(
u, u)
u = KM 1 (Ar xr + Au xu ) + N v,
u = v
v = (
v , v)
Preuve du Thorme 23
des variables sur
u.
On peut donc
r = 0, . . . , 1
dont
3.3.
139
COMMANDABILIT LINAIRE
Figure 3.6 Deux masses couples par un ressort. L'ensemble est soumis
une seule force
u.
Exemple 17
2 1,
par exemple).
Soit le
k,
m1 x1 = k(x2 x1 ) + u
m2 x2 = k(x1 x2 )
(3.14)
x2 , l'abscisse de la masse qui n'est pas directement souu, joue un rle trs particulier ( sortie de Brunovsky). Si au
lieu de donner t 7 u(t) et d'intgrer (3.14) partir de positions et vitesses
m
initiales, on xe t 7 x2 (t) = y(t), alors, on peut calculer x1 = k2 y
+ y et
donc, u = m1 x
1 + m2 x2 = m1km2 y (4) + (m1 + m2 )
y . Ainsi, on peut crire le
systme en faisant jouer x2 un rle privilgi
x1 = (m2 /k) y + y
x2 = y
t 7 y(t).
140
CHAPITRE 3.
COMMANDABILIT, STABILISATION
d
correspond dt xi ). tant donnes les quations
x1 = (m2 /k) y + y
x2 = y
v = dy
2
dt
il apparat qu'imposer p en t = 0 revient imposer y et ses drives jus(1) (2) (3)
qu' l'ordre 3 en 0 : (y0 , y0 , y0 , y0 ). Il en est de mme en t = T avec
(1) (2) (3)
(yT , yT , yT , yT ). Il sut donc de trouver une fonction rgulire [0, T ] 3
t 7 y(t) dont les drives jusqu' l'ordre 3 sont donnes a priori en 0 et
en T . Un polynme de degr 7 en temps rpond la question mais il existe
bien d'autres possibilits. Nous en dtaillons une ci-dessous qui est compltement explicite.
Soit la fonction
C 4 : [0, 1] 7 [0, 1]
() =
dnie par
4
.
4 + (1 )4
y(t) =
dk
et d k (0)
t
t2 (2) t3 (3)
(1)
1
y0 + ty0 + y0 + y0
T
2
6
(t T )2 (2) (t T )3 (3)
t
(1)
+
yT +
yT
yT + (t T )yT +
T
2
6
k
(k)
vrie
ainsi
(0) = 0, (1) = 1
x1 = x2 = D > 0
durant le
car alors
Dm1 m2 d4
D(m1 + m2 ) d2
u(t) =
+
kT 4 d 4 t
T2
d 2 t
T
T
t
y(t) = D T .
3.3.
141
COMMANDABILIT LINAIRE
d
x = Ax + Bu est commandable , est quivalent
dt
l'existence d'un bouclage statique rgulier u = Kz + N v et d'un chan-
gement d'tat
de Brunovsky
x = M (y, . . . , y (1) ),
o la matrice
u = L(y, . . . , y () )
x(t)
et
u(t)
1 (t), . . ., m (t)
et un nombre
d
x = Ax + Bu implique la possibilit de stabidt
lisation par retour d'tat. La forme de Brunovsky fait apparatre cette
2. La commandabilit de
sk
gnes de degr
i
Y
k,
(X k ) = X i s1 X i 1 + s2 X i 2 + . . . + (1)i si
k=1
Alors, ds que les
(i 1)
vi = s1 yi
assure la stabilit de
(i )
yi
(i 2)
s2 yi
= vi .
+ . . . + (1)i 1 si yi
k .
142
CHAPITRE 3.
COMMANDABILIT, STABILISATION
Thorme 25
Si la paire
d
x = Ax + Bu, la pladt
nication de trajectoire nous donne une trajectoire en boucle ouverte du sysDe retour dans les coordonnes de modlisation,
tme (par exemple la trajectoire que doit suivre une fuse au dcollage, la
manoeuvre d'atterrissage d'un avion,
avec l'indice
. . .).
Nous la notons
ur .
x,
la com-
= Ax + Bu
d
(x) = A x + B u
dt
x = x xr et u = u ur . Le systme tant commandable, il existe K ,
matrice m n, telle que les valeurs propres de A + BK sont toutes partie
o
u = K x
assure le suivi asymptotique de la trajectoire de rfrence
t 7 xr (t).
3.4.
143
sa partie non commandable, i.e., ses intgrales premires, ait une signication
physique immdiate, tout comme les grandeurs
y , fonction de x et intervenant
p, q
un tat
q.
Sous l'hypothse
linaire quadratique .
Nous nous intressons ici, en toute gnralit, aux systmes linaires ins-
tationnaires du type
d
x(t) = A(t)x(t) + B(t)u
dt
o l'tat
matrices
(3.16)
tout
t [0, +[
les
respectivement. Ces
systmes peuvent provenir de bilans exacts ou, plus souvent, de la linarisation autour de trajectoires de manuvre entre des points stationnaires. Ainsi
d
si t 7 (xr (t), ur (t)) est une trajectoire de rfrence de
x = f (x, u), on a
dt
d
x = f (xr , ur ) et on note
dt r
f
A(t) =
,
x (xr (t),ur (t))
En fait,
et
f
B(t) =
u (xr (t),ur (t))
[0, tf ]
x xr (t)
et
u ur (t).
144
CHAPITRE 3.
COMMANDABILIT, STABILISATION
x 10
2.6
altitude
2.4
2.2
2
1.8
1.6
1.4
1.2
1
0.8
200
400
600
800
1000
1200
1400
1600
1800
2000
temps
dratique suivant
tf
xT (t)Rx + uT (t)Qu(t) dt
J=
(3.17)
0
o
positive .
Implicitement, on cherche une commande
pondre par
[0, tf ] 3 t 7 u(t)
faible (car
[0, tf ].
La commande
minimisant (3.17) ralise le meilleur compromis (au sens prcis par les pondrations
et
Exemple 18
Q)
(Rentre atmosphrique)
sant un systme linaris tangent instationnaire du type (3.16) est donn sur
la Figure 3.8. On y a reprsent l'historique des valeurs de l'altitude pour
une trajectoire de vaisseau spatial (type navette) dans la manuvre de rentre atmosphrique au cours de laquelle on cherche maximiser le dport
6. L'hypothse de symtrie n'enlve rien la gnralit. En eet pour tout
x Gx = x ((G + G )/2)x.
T
le calcul de x Gx.
a
x Rn ,
on
G compte dans
3.4.
145
latral (i.e. en faisant pivoter l'appareil pour rejoindre une plus haute latitude o est situ le point de chute dsir pour l'engin). Cet objectif et les
contraintes arodynamiques (notamment la thermique et la variation de densit de l'atmosphre) confrent l'optimum de nombreuses bosses (appeles
rebonds atmosphriques). An d'assurer le suivi de cette trajectoire, on doit
concevoir un contrleur en boucle ferme. On linarise alors les quations autour de cette trajectoire rebonds et on obtient naturellement un modle de
la forme (3.16). On pourra se reporter [11] pour une prsentation dtaille
de ce problme.
Dans le cas multivariable en particulier, i.e. o on dispose de plusieurs
commandes, on a en gnral trop de degrs de libert pour rsoudre les
problmes de planication et de suivi de trajectoire. En voquant un critre
minimiser comme nous venons de le faire en (3.17), on dnit implicitement
l'utilisation des degrs de libert supplmentaires : ils permettent d'optimiser
cet indice de performance.
Exemple 19
On prsente ici un
1
1
J = xT (tf )Sf x(tf ) +
2
2
Z
0
tf
xT (t)Rx(t) + uT (t)Qu(t) dt
(3.18)
146
CHAPITRE 3.
COMMANDABILIT, STABILISATION
gnrateur de vapeur
vanne de
contournement
barres de contrle
rseau lectrique
turbine
pressuriseur
borication/dilution
refroidissement
condenseur
racteur
pompe de circulation
Figure
qui permet de rajouter de l'importance au point nal atteint (Sf tant une
matrice symtrique positive).
L'intrt des formulations quadratiques (3.18) (et (3.17)) est qu'elles sont
en gnral bien poses au sens mathmatique, et qu'elles admettent une solution unique, calculable numriquement
critre
7. Calculable analytiquement pour un ou deux tats mais pas plus en pratique. C'est
trs dirent de l'approche utilisant la forme normale de Brunovsky, approche que l'on
peut conduire analytiquement sans dicult sur de nombreux exemples physiques bien
plus que trois tats.
3.4.
147
J(x)
min
x Rn
h1 (x) = 0
hp (x) = 0
.
.
.
on calcule le Lagrangien
L(x, ) = J(x) +
p
X
i=1
on calcule les conditions de stationnarit du Lagrangien au 1er ordre
La
X hi
J
+
= 0,
i
xk
xk
i=1
La condition
L = 0
pour tout
redonne les
hi (x) = 0,
On a ainsi un systme de
k = 1, . . . , n
contraintes
i = 1, . . . p
bien l'optimum .
Passons maintenant la dimension innie avec le problme suivant o
n
m
n
m
n
n
toutes les fonctions L : R R 7 R, f : R R 7 R , l : R 7 R sont
0
drivables et o le temps nal tf et la condition initiale x sont des constantes
148
CHAPITRE 3.
COMMANDABILIT, STABILISATION
donnes
min
[0, tf ] 3 t 7 (x(t), u(t)) Rn Rm
x(0) = x0
f1 (x(t), u(t)) dtd x1 (t) = 0, t [0, tf ]
tf
Z
l(x(tf )) +
L(x(t), u(t)) dt
.
.
.
fn (x(t), u(t))
d
x (t)
dt n
= 0, t [0, tf ]
(3.19)
t 7 (x(t), u(t)) qui vrient les contraintes, i.e. pour toutes les
d
x = f (x, u) qui dmarrent en t = 0 de x0 .
trajectoires du systme
dt
d
On voit que les contraintes fi (x(t), u(t))
x (t) = 0 dpendent d'un
dt i
indice discret i et d'un indice continu t. Il est donc logique d'introduire les
multiplicateurs i (t) avec ces deux types d'indice. On forme le Lagrangien
L avec une somme discrte sur i et une somme continue sur t (une intgrale
donc) des produits contrainte d'indice (i, t) fois multiplicateur d'indice (i, t)
Z tf
L(x(t), u(t)) dt
L(x, u, ) = l(x(tf )) +
0
n Z tf
X
d
i (t) fi (x(t), u(t)) xi (t) dt
+
dt
i=1 0
les courbes
Le Lagrangien
aux fonctions
associe un
intgrale sur
x, u
t.
et
sur
[0, tf ]
On note de faon
plus compacte
Z
L(x, u, ) = l(x(tf ))+
tf
d
L(x(t), u(t)) + (t) f (x(t), u(t)) x(t) dt
dt
T
x, u et
t 7 (t). Puisqu'on n'a pas
0
introduit de multiplicateur pour la contrainte x(0) = x , nous imposons la
variation x de vrier la contrainte x(0) = 0.
Commenons par la variation de . On doit avoir, pour toute variation de
la courbe , une variation de L nulle au premier ordre. En d'autres termes,
n
pour toute fonction t 7 (t) R on doit avoir
Z tf
d
T
L =
(t) f (x(t), u(t)) x(t) dt = 0
dt
0
riation
de
t 7 x(t), t 7 u(t)
et
3.4.
La seule possibilit
0.
149
u.
du contrle
tion
fonc-
u en facteur on obtient
!
Z tf
L
f
+ T (t)
u(t) dt = 0
L =
u
u
0
(x(t),u(t))
(x(t),u(t))
En mettant
L
f
(x, u) + T
(x, u) = 0, t [0, tf ]
(3.20)
u
u
Terminons par la variation de x. On doit avoir, pour toutes variations x
vriant x(0) = 0, une variation de L nulle au premier ordre. Pour toute
n
fonction t 7 x(t) R telle que x(0) = 0, on doit avoir
l
L =
(x(tf ))x(tf )+
x
"
Z tf
L
x(t) + T (t)
x
0
(x(t),u(t))]
!#
d
f
x(t) x(t)
dt = 0
x (x(t),u(t))
dt
tf
d
t
(t) x(t) dt = [T x]0f +
dt
T
tf
d T
(t) x(t) dt
dt
0
Z tf
d T
T
= (tf )x(tf ) +
(t) x(t) dt
dt
0
x(0) = 0. On a
l
T
L =
(x(tf )) (tf ) x(tf )+
x
#
Z tf "
L
f
d
+ T (t)
+ T (t) x(t) dt = 0
x (x(t),u(t))]
x (x(t),u(t)) dt
0
car
150
CHAPITRE 3.
tf
"
COMMANDABILIT, STABILISATION
t 7 x(t)
telle que
x(0) = x(tf ) = 0,
#
L
f
d
+ T (t)
+ T (t)
x (x(t),u(t))]
x (x(t),u(t)) dt
x(t) dt
on a
On en dduit
L
f
d T
T
(t) = 0
+
(t)
+
x (x(t),u(t))]
x (x(t),u(t)) dt
c.--d.
Enn, avec
L
x
T
+
(x,u)
x(tf ) 6= 0
f
x
T
+
(x,u)
on obtient de
(tf ) =
d
= 0, t [0, tf ]
dt
L = 0
(3.21)
la condition nale
l
(x(tf ))
x
En somme, les conditions d'optimalit du premier ordre pour le problme (3.19) sont pour
t [0, tf ]
dt
T
T
d
L
f
(t)
(t) =
dt
x (x(t),u(t))
x (x(t),u(t))
L
f
0=
+ T
u (x(t),u(t))
u (x(t),u(t))
(3.22)
x(0) = x0 ,
(tf ) =
l
(x(tf ))
x
(3.23)
Il s'agit d'un problme aux deux bouts , ce n'est pas un problme de Cauchy ,
t = 0 et t = tf comme
tat adjoint . Nous allons
f est linaire et o les fonc-
et
3.4.
151
d
1 T
(3.24)
x(0) = x0 ,
L'tat adjoint
(tf ) = Sf x(tf )
u(t) = Q1 B T (t)(t)
La particularit des quations (3.24) est qu'elles admettent une solution
explicite sous forme linaire
(t) = S(t)x(t)
avec
S(tf ) = Sf .
d
S(t)x(t) + S(t)A(t)x(t) S(t)B(t)Q1 B T (t)S(t)x(t)
dt
= Rx(t) AT (t)S(t)x(t)
Il sut alors de choisir
S)
d
1 T
T
S(t) = S(t)A(t) + S(t)B(t)Q B (t)S(t) R A (t)S(t)
dt
S(tf ) = Sf
(3.25)
u(t) = Q1 B T (t)S(t)x(t)
(3.26)
152
CHAPITRE 3.
COMMANDABILIT, STABILISATION
Le fait majeur retenir ici est que la commande optimale (3.26) s'exprime
prcisment comme une loi de feedback instationnaire dont le gain peuttre calcul hors-ligne
10
Exemple 20
([13])
d
Soit la dynamique dt x
= v,
minimiser
1
1
J=
c1 v(tf )2 + c2 x(tf )2 +
2
2
o
c1 , c2
tf
et
d
v
dt
= u
et le critre
tf
u2 (t)dt
x =
v =
avec
D(tf t) =
1
1
+ (tf t)3
c2 3
1
1
+ tf t (tf t)4
c1
4
(3.26). Considrons
l'galit
tf
d T
x (t)S(t)x(t) dt = xT (tf )Sf x(tf ) xT (0)S(0)x(0).
dt
Il vient alors
1
1
J xT (0)S(0)x(0) =
2
2
Z
0
tf
d T
x (t)S(t)x(t) dt
dt
Z
1 tf T
+
(x (t)Rx(t) + uT (t)Qu(t))dt
2 0
10. On peut montrer que le problme linaire instationnaire avec cot quadratique considr ici donne la solution au deuxime ordre d'un problme non-linaire plus prcis dont il
est l'approximation. La loi de feedback que nous venons de calculer procure alors le calcul
des extrmales de voisinages (voir [13]).
3.4.
153
1
1
J xT (0)S(0)x(0) =
2
2
tf
1
J xT (0)S(0)x(0) = 0.
2
On vient de calculer que le cot associ la commande optimale (3.26) est
1
J opt = xT (0)S(0)x(0)
2
(3.27)
d
x(t) = A(t)x(t)
dt
minimiser (3.18)
+ B(t)u
avec
x(0)
1
1
J = xT (tf )Sf x(tf ) +
2
2
tf
xT (t)Rx(t) + uT (t)Qu(t) dt
A(t) est une matrice nn, B(t) est une matrice nm, Sf et R sont symtriques positives, Q est symtrique dnie positive. La solution ce problme
o
u(t) = Q1 B T (t)S(t)x(t)
o
x(tf ) =
(3.28)
154
CHAPITRE 3.
Rn .
COMMANDABILIT, STABILISATION
x(tf ) = .
d
S(t) = S(t)A(t) + S(t)B(t)Q1 B T (t)S(t) R AT (t)S(t)
dt
S(tf ) = 0
d
V (t) = AT (t) S(t)B(t)Q1 B T (t) V (t)
dt
V (tf ) = I
d
H(t) = V T (t)B(t)Q1 B T (t)V (t)
dt
H(tf ) = 0
o
(3.29)
(3.30)
(3.31)
(3.32)
(3.33)
(3.34)
V (t)
H(t)
par une simple intgration en temps rtrograde. La matrice H(t) est toujours
d
H 0. Elle n'est pas singulire lorsque le systme
ngative car H(tf ) = 0 et
dt
est commandable (voir [13]). Finalement, la commande optimale est
u(t) = Q1 B T (t) S(t) V (t)H 1 (t)V T (t) x(t) Q1 B T (t)V (t)H 1 (t)
C'est encore une fois une loi de feedback instationnaire, complt par un
terme de feedforward lui aussi instationnaire.
Exemple 21.
d
x(t) = Ax(t) + Bu(t) ,
dt
0
1
1/2 0
Z
0
x(t) +
0
1
u(t)
3] 3 t
7 u(t) R transfrant le
0]T , en minimisant le critre
quadratique
1
J=
2
u(t)2 dt
3.4.
155
On forme le systme
d
S(t) = S(t)A + S(t)BQ1 B T S(t) AT S(t)
dt
S(3) = 0
d
V (t) = AT S(t)BB T V (t)
dt
V (3) = I
d
H(t) = V T (t)BB T V (t)
dt
H(3) = 0
(3.35)
(3.36)
(3.37)
(3.38)
(3.39)
(3.40)
Z
H(t) =
tf
V T ( )BB T V ( )d
tf +.
Z
J=
xT (t)Rx(t) + uT (t)Qu(t) dt
(3.41)
0
o
d
x(t) = Ax(t) + Bu
dt
(3.42)
156
CHAPITRE 3.
COMMANDABILIT, STABILISATION
0.5
0. 5
1. 5
0.5
1.5
2.5
Figure 3.10 Trajectographie sous contraintes nales (planication de trajectoire ) avec minimisation quadratique.
o l'tat
nn
et
x Rn , la commande u Rm
n m, respectivement.
et les matrices
et
sont de tailles
Thorme 26
(Rgulateur LQR)
tion du cot quadratique (3.41) pour le systme (3.42) sous les hypothses
suivantes :
1.
(A, B)
2.
3.
est commandable
telle que
(A, R1/2 )
u(t) = Q1 B T S 0 x(t)
11. On entend par racine de
R,
note
R1/2
R = (R1/2 )T R1/2 .
3.4.
157
brique
0 = SA + AT S SBQ1 B T S + R
et la valeur du critre qui lui est associe est
(3.43)
xT (0)S 0 x(0).
d
= A + AT BQ1 B T + R
dt
et notons
0 (t)
(3.44)
xT (t)Rx(t) + uT (t)Qu(t) dt = xT (0)0 (t)x(0)
min
u
0 (0) = 0.
x(0),
car
t2 t1
xT (t)Rx(t) + uT (t)Qu(t) dt
Z t1
min
xT (t)Rx(t) + uT (t)Qu(t) dt
min
u
t,
(A, B)
tant com-
>0
Z
min
u
xT (t)Rx(t) + uT (t)Qu(t) dt
La fonction
vers une
158
CHAPITRE 3.
COMMANDABILIT, STABILISATION
0 = A + AT BQ1 B T + R
Montrons que
(3.45)
xT (t)Rx(t) + uT (t)Qu(t) dt = 0
min
u
Or
a alors
x(0)
u=0
et, l'optimum, on
0
On a alors ncessairement, que pour tout
t 0, R1/2 x( ) = 0
pour tout
d
x = Ax
dt
car, comme nous venons de le voir, dans ce cas la commande est nulle. On
[0, t].
R1/2 x(0) = 0 = R1/2 Ax(0) = R1/2 A2 x(0) = ... = R1/2 An1 x(0)
(A, R1/2 ) est observable (voir le critre de Kalman pour l'observabilit donn au Thorme 28). On en dduit x(0) = 0, d'o la contradiction.
Donc, est symtrique dnie positive.
1 T
Posons Ac = A BQ B la matrice obtenue en fermant la boucle.
Or la paire
Ac + ATc = R BQ1 B T
Considrons la fonction (candidate tre de Lyapounov)
V (x) = xT x
Cette fonction continment direntiable est strictement positive, sauf en
o elle est nulle. En drivant par rapport
t,
on obtient
d
V (x) = xT ( Ac + ATc )x = xT R + BQ1 B T x
dt
3.4.
159
d
V (x) = 0 est donc dni par les quaL'ensemble des points tels que
dt
T
1/2
tions B x = 0 et R
x = 0. L'ensemble invariant contenu dans ce sousensemble est rduit l'espace des
satisfaisant
R1/2 x(0) = 0 = R1/2 Ac x(0) = R1/2 Ax(0) = ... = R1/2 An1 x(0)
Puisque la paire
(A, R1/2 )
Lemme 2.
XA + BX = C
o
A, B
et
et
commune.
On pourra se rfrer [38] pour la dmonstration de ce rsultat.
Considrons donc deux solutions symtriques distinctes
S1 et S2 de l'qua-
A1 = A BQ1 B T S1
et
A2 = A BQ1 B T S2
A1
et
A2
A1
et
A2
sont
stables. On en dduit
S1 = S2
d'o l'unicit.
u(t) = Q B S x(t)
et calculons
160
CHAPITRE 3.
la valeur du critre
COMMANDABILIT, STABILISATION
v.
tre stabilisante, on a
d T 0
(x S x)dt = xT (0)S 0 x(0)
dt
0
Poursuivons,
J = x (0)S x(0) +
0
d T 0
T
T
x (t)Rx(t) + v (t)Qv(t) + (x S x) dt
dt
= xT (0)S 0 x(0)+
Z
xT (R + AT S 0 + S 0 A)x + v T Qv + v T B T S 0 x + xT S 0 Bv dt
0
en utilisant l'quation de Riccati algbrique (3.43)
= xT (0)S 0 x(0)+
Z
xT S 0 BQ1 B T S 0 x + v T Qv + v T B T S 0 x + xT S 0 Bv dt
Z0
T
=
Q1 B T S 0 x + v Q Q1 B T S 0 x + v dt
0
Or
Q1 B T S 0 x
et la valeur de cet optimum est
xT (0)S 0 x(0).
(A, B)
est commandable,
et
permettent d'exprimer un
arbitrage entre l'importance des erreurs sur l'tat et l'eort sur la commande.
Plus un terme est grand, plus l'erreur s'y rapportant prend d'importance dans
la fonction cot et plus elle a tendance tre rduite par la solution optimale.
En rsolvant l'quation de Riccati, on obtient la loi de commande optimale.
Exemple
22. Considrons le systme dtd x =
R
+
J = 21 0 (ax2
associe est
+ bu2 )dt
a 0, b > 0.
0=
1
x+u et le critre quadratique
2
S2
Sa+
3.4.
161
LQR
Systme
u=
1
2
a
b
x.
S =
b2
2
+ ab.
S+ .
t +
1 + Q1 B T S 0 (sI A)1 B
(sI A),
0 = S 0 (sI A) (sI + AT )S 0 R + K T QK
162
CHAPITRE 3.
COMMANDABILIT, STABILISATION
d'o
puisque
correspond alors
la transposition hermitienne.
Calculons maintenant
= Q + B T (sI + AT )1 S 0 + S 0 (sI A)1 B
B T (sI + AT )1 K T QK(sI A)1 B
et, en utilisant (3.46), il vient
s =
imaginaire)
1 + K(sI A)1 B
2 = 1 + Q
o
(3.48)
dnie).
Ceci implique que le lieu de Nyquist du systme est une distance plus
grande que
du point
1.
Exemple 23.
1/2,
d
Considrons le systme dt x
A=
0
1
1 0.3
,
= Ax + Bu o
0.25
B=
1
3.5.
163
COMPLMENTS
-1
zone d'exclusion
[0.8168
Q =
1.4823].
1 0
0 1
,
R = 1,
on obtient le
fois le point
K(sI A)1 B =
1.687s + 0.385
s2 0.3s + 1
3.5 Complments
3.5.1 Linarisation par bouclage
Equivalence statique
d
x=
dt
commandable sous forme de Brunovsky peut tre prolonge au cas
Ax + Bu
164
CHAPITRE 3.
COMMANDABILIT, STABILISATION
x
Mx
7
u
Kx + N u
avec
et
x
z = (x)
7
u
v = k(x, u)
o
est un diomorphisme et
bloqu,
u 7 k(x, u) galement. On va
d
x = f (x, u) et leur clasdt
sication, comme nous l'avons fait pour les systmes linaires, modulo le
groupe de transformations ci-dessus. La relation d'quivalence qui en rsulte
est appele quivalence par bouclage statique rgulier et changement de coordonnes (d'une faon plus abrge quivalence statique ). Dcider si deux
d
x = f (x, u)
systmes avec les mmes nombres d'tats et des commandes,
dt
d
z = g(z, v), (f , g rgulires) sont quivalents, est un problme de goet
dt
mtrie dicile et largement ouvert. En revanche, il existe une caractrisation
explicite des systmes non linaires quivalents aux systmes linaires commandables.
Exemple 24.
k0 + a(x1 x2 )2
avec
k0
et
a > 0.
est fonction de
x1 x2
k =
Exemple 25.
x1
et
y = x1
joue le rle de
f (x, u)
et u. La
3.5.
165
COMPLMENTS
est non linaire seulement en apparence : le systme est alors dit linarisable
par bouclage statique . Il sut de changer de repre pour que tout devienne
linaire.
partir de maintenant, nous considrons le systme
d
x = f (x, u),
dt
avec
f (0, 0) = 0.
(x, u) = (0, 0).
rgulire et
l'quilibre
Lemme 3.
x Rn ,
u Rm
1. Le systme tendu
x = f (x, u)
dt
d u = u
dt
bouclage statique (u
est
(3.49)
ici la commande)
2. Le systme
d
x = f (x, u)
dt
(3.50)
Dmonstration. Si
d
z = Az + Bv,
dt
d
v = v
dt
(3.51)
(A, B)
(x, u) =
((z, v), (z, v)) et u = k(z, v, v) qui transforme (3.49) en (3.51) avec dim(z) =
dim(x). Cela veut dire que pour tout (z, v, v)
tme linaire commandable peut s'crire sous la forme (3.51) avec
commandable, (forme de Brunovsky ) il existe une transformation
Donc
inversible
x = (z), u =
166
CHAPITRE 3.
COMMANDABILIT, STABILISATION
d
u = u et en prenant comme entre u,
dt
est ane en u, i.e., que le systme admet
les quations
d
x = f (x) + u1 g1 (x) + . . . + um gm (x)
dt
f
et les
gi
(3.52)
x = (z)
et
v,
i.e.,
x.
Prenons maintenant un changement rgulier de variables x = (z) d'in = 1 , z = (x). Considrons le systme dni par (3.52) dans le
verse
x.
repre
Dans le repre
gk )
devient
est
z,
on obtient
d
z = (D f + u2 D g1 + . . . + um D gm )x=(z)
(3.53)
dt
i
. Ainsi, f (respectivement
la matrice Jacobienne de :
xj
i,j
D f
(respectivement
D gk ).
E0 = {g1 , . . . , gm },
o
[f, g]
et
et o
{}
signie espace vectoriel engendr par les vecteurs l'intrieur des parenthses.
On rappelle que le crochet de deux champs de vecteurs
et
et
g , de composantes
(x1 , ..., xn ), admet
n
X
gi
fi
gk
fk
[f, g]i =
x
x
k
k
k=1
Un simple calcul montre que si
z = (x)
Ek
z , D.Ek .
On
appelle ce type d'objet des distributions (rien voir avec les distributions de
L. Schwartz). Ce sont des objets intrinsques car la mthode de construction
de
Ek
3.5.
167
COMPLMENTS
Autour de l'quilibre
(x, u) =
Ei , i = 1, . . . , n 1
En1
et le rang de
vaut
Une distribution
f et g
E(x)) le
n,
la dimension de
x=0
x.
de vecteurs
dans
vectoriel
crochet
(pour tout
E de rang
w = (w1 , ..., wn ),
volutive
constant
de coordonnes locales
,...,
Ei =
x1
xi
que
Ei . Dans ces coordonnes locales, dtd xi pour i > 0 ne dpend pas de la commande u. Ainsi, en remplaant u par (x)+(x)u avec une
matrice inversible bien choisie, la dynamique (3.52) s'crit ncessairement
o
est le rang de
sous la forme
Un raisonnement
(x1 , . . . , x0 )
car
d
xi = ui , i = 1, . . . , 0
dt
d
xi = fi (x), i = 0 + 1, . . . , n
dt
simple montre que, pour i > 1 , fi
E1
ne dpend pas de
d
xi = ui , i = 1, . . . , 0
dt
d
xi = fi (x1 , . . . , xn ), i = 0 + 1, . . . , 1
dt
d
xi = fi (x0 +1 , . . . , xn ), i = 1 + 1, . . . , n
dt
168
CHAPITRE 3.
De plus, le rang de
Donc
COMMANDABILIT, STABILISATION
(f0 +1 , . . . , f1 )
par rapport
(x1 , . . . , x0 )
vaut
1 0 .
composantes de
1 0
premires composantes de
(x) inversible bien choisi, nous obtenons la structure suivante (les notations
avec u, x et f sont conserves)
d
xi = ui , i = 1, . . . , 0
dt
d
xi = xi0 , i = 0 + 1, . . . , 1
dt
d
xi = fi (x0 +1 , . . . , xn ), i = 1 + 1, . . . , n
dt
On sait que ce systme est linarisable si et seulement si le systme rduit
d
xi = xi0 , i = 0 + 1, . . . , 1
dt
d
xi = fi (x0 +1 , . . . , xn ), i = 1 + 1, . . . , n
dt
l'est avec
(x1 , . . . , x1 0 )
Ei
n1
d
x = f (x, u)
dt
o le rang de
par rapport
x,
linarisation
Bouclage dynamique
Le Lemme 3 est trompeur. Il semble suggrer que le fait d'tendre un systme en rajoutant des drives de la commande dans l'tat ne rajoute rien
3.5.
169
COMPLMENTS
pour la linarisation. Ceci est vrai si on rajoute le mme nombre d'intgrateurs sur toutes les commandes (c.--d. si on eectue une prolongation totale). Par contre, des nombres dirents peuvent permettre de gagner quelque
chose. Par exemple le systme
x = u1 sin ,
z = u1 cos 1,
= u2
n'est pas linarisable par bouclage statique bien que le systme tendu
x = u1 sin ,
de commande
z = u1 cos 1,
u1 = u1 ,
= u2
(
u1 , u2 ) le soit. Ce fait n'est nullement en contradiction avec le
u1 a t prolonge par des intgrateurs deux
d
= a(x, , v),
dt
u = k(x, , v),
d
x = f (x, k(x, , v)),
dt
d
= a(x, , v)
dt
est
libre. La dimension de l'espace dans lequel on doit travailler peut a priori tre
arbitrairement grande. Noter galement que les compensateurs dynamiques
qui consistent ne prolonger que les entres, sont des compensateurs particuliers. Ils sont insusants car ils ne permettent pas de linariser certains
systmes comme celui ci
x = u2 cos u1 sin
z = u2 sin + u1 cos g
= u2
On peut montrer que, quel que soit le compensateur dynamique de la forme
( )
( )
u1 1 = u1 , u2 2 = u2 (1 et 2 entiers arbitraires), le systme tendu n'est
pas linarisable par bouclage statique. En revanche, il est linarisable par des
bouclages dynamiques plus gnraux.
Cette question est l'origine des systmes plats , les systmes linarisables
par des bouclages dynamiques dits endognes et auxquels est associe une relation d'quivalence (i.e., une gomtrie). Pour en savoir plus, on se reportera
[55].
170
CHAPITRE 3.
COMMANDABILIT, STABILISATION
12
u (pour simplier),
d
x = f (x) + ug(x)
dt
et d'une fonction
V (x)
x Rn
tend
vers l'inni en norme. On suppose ici que toutes les fonctions sont drivables
autant de fois que ncessaire.
On suppose de plus que pour u = 0, la drive de V le long des trajectoires
d
x = f (x) est ngative ou nulle. Pour les systmes mcaniques, V est souvent
dt
l'nergie mcanique. Ainsi par hypothse pour tout x on a
V
f (x) 0
x
Avec
u 6= 0,
on a
d
V
V
V =
f (x) + u
g(x)
dt
x
x
K : R 7 R
K() > 0 si < 0
K() < 0
si
>0
u=K
V
g(x)
x
d
x = f (x),
dt
V
f (x) = 0,
x
V
g(x) = 0.
x
3.5.
171
COMPLMENTS
un systme ane en contrle (on suppose toujours, pour simplier l'expos, un seul contrle scalaire)
d
x = f (x) + ug(x)
dt
une fonction de Lyapounov
pour
u=0
u = k(x),
d
x = f (x) + g(x),
dt
o maintenant le contrle n'est plus
fonction suivante
Ainsi
d
=u
dt
mais sa drive
u.
On considre la
1
W (x, ) = V (x) + ( k(x))2
2
rapport au temps
V
k
d
W =
(f (x) + g(x)) + p( k(x)) u
(f (x) + g(x))
dt
x
x
d
V = V
(f (x) + k(x)g(x)) est
dt
x
ngative. Cela conduit au rarrangement suivant du second membre
Utilisons le fait qu'avec
= k(x)
la drive
d
V
k
V
W =
(f (x)+k(x)g(x))+(k(x)) u
(f (x) + g(x)) +
g(x)
dt
x
x
x
Il sut, avec
u=
k
V
(f (x) + g(x))
g(x) p( k(x))
x
x
pour avoir
V
d
W =
(f (x) + k(x)g(x)) p( k(x))2 0
dt
x
On conclut l'analyse toujours par l'invariance de LaSalle. Pour un expos
dtaill des possibilits de ces mthodes nous renvoyons le lecteur intress
[63].
Chapitre 4
Observabilit, estimation et
adaptation
x.
seule une partie de l'tat soit directement mesure. On est alors confront
au problme suivant. Connaissant les quations du systme (i.e., ayant un
d
x = f (x, u), les relations entre les mesures y et l'tat, y = h(x),
modle),
dt
les entres t 7 u(t) et les mesures t 7 y(t) , il nous faut estimer x. Cela
revient rsoudre le problme suivant
d
x = f (x, u),
dt
o
y = h(x)
et
et
173
174 CHAPITRE 4.
le contrleur ainsi obtenu, celui qui part des sorties, estime l'tat et utilise
cette estimation pour calculer le contrle (observateur contrleur, commande
modale, bouclage dynamique de sortie), permet de stabiliser asymptotiquement tout systme linaire coecients constants commandable et observable (c'est le principe de sparation ). Enn, nous proposons quelques extensions aux cas non linaires avec la synthse d'observateurs asymptotiques
via l'injection de sortie et la notion de contraction.
4.1 Un exemple
Cet exemple est reprsentatif de ce que, dans certains domaines industriels, les ingnieurs appellent les capteurs logiciels . Il s'agit, pour un moteur
lectrique, d'estimer la vitesse de rotation et son couple de charge via les
signaux de courants (mesure) et de tension (contrle). Il est possible d'obtenir des estimations de ces deux variables mcaniques, coteuses mesurer,
en partant des variables lectriques, qui sont simples et faciles mesurer.
Pour simplier, nous traitons ici le cas des moteurs courant continu. Pour
les moteurs induction, le mme problme se pose mais il est nettement
plus complexe, non compltement rsolu et fait encore l'objet de travaux de
recherches et de dveloppement .
Les capteurs logiciels sont des outils de traitement en temps-rel de l'information. Ils fournissent (idalement) des informations non bruites sur des
grandeurs mesures ou non. Sur l'exemple choisi ici, il s'agit, partir de la
mesure des tensions et des courants qui traversent le moteur, d'estimer de
faon causale sa vitesse mcanique et son couple de charge. L'intrt pratique est vident : les informations lectriques sont toujours disponibles car
les capteurs sont simples et ables. Au contraire, les informations mcaniques
ncessitent une instrumentation complexe, chre et peu able. On cherche
s'en passer. Pour des raisons de cot mais aussi de scurit, dduire des courants et tensions, la vitesse de rotation est un enjeu technologique important
en lectro-technique.
Dans d'autres domaines, on rencontre des problmes trs similaires. Pour
les procds, les dbits, tempratures et pressions sont faciles avoir par des
capteurs simples et robustes alors que les compositions sont plus diciles
mesurer (temps de retard de l'analyse, ...). Un traitement de l'information contenue dans les signaux de tempratures, pressions et dbits permet
souvent d'obtenir des estimations prcieuses sur les compositions. Un autre
exemple intressant (galement voqu dans l'Exemple 28) est l'estimation
1. Le systme est inobservable au premier ordre et trs sensible aux paramtres basse
vitesse.
4.1.
175
UN EXEMPLE
J dtd = k p
L dtd = k R + u
o
self,
R>0
la rsistance,
L>0
la
le couple de charge et
le courant,
la constante de couple,
la tension,
d
p
dt
=0
d
p
dt
d
J dt
L dtd
= 0
= k p
= k R + u
176 CHAPITRE 4.
d
= (u L R)/k,
dt
p = k (J/k)
d
d2
d
u L 2 R
dt
dt
dt
d
p
dt
d
J dt
L dtd
= Lp ( )
= k p L ( )
= k
R + u L ( )
d'identication ,
d'estimation ou de ltrage ,
et
et
Lp , L
et
d
e
dt p
d
J dt e
L dtd e
ep = pp, e =
et e =
= Lp e
= ep (k L )e
= (L + R)e ke
Il s'agit d'un systme linaire stationnaire dont les valeurs propres sont les
racines du polynme en
de degr
suivant
L + R 2 k(k L )
Lp k
s +
s+
L
LJ
LJ
jouant sur les Lp , L et L , on peut
s3 +
donner n'importe
quelles valeurs aux fonctions symtriques des racines, il est possible de les
choisir comme l'on veut. Si
Lp , L
et
vrient
L + R
= r1 + r2 + r3
L
k(k L )
= r1 r2 + r1 r3 + r2 r3
LJ
Lp k
= r1 r2 r3
LJ
4.1.
177
UN EXEMPLE
r1 , r2
et
r3 .
R
r1 = (1 + 1),
L
R
r2 = (1 1),
L
r
r3 =
k2
LJ
p,
et ainsi
horaire t 7 u(t).
Les valeurs
soit la loi
p,
et
quelle que
est trs petite, positive mais mal connue. Ainsi, tout ce que l'on sait c'est
que
L o est un petit paramtre positif. Il est alors facile de voir que les
rsultats thoriques sur les perturbations singulires (voir Section 1.4.1) s'appliquent ici : le systme reste stable en boucle ouverte avec une dynamique
du courant convergeant immdiatement vers son rgime quasi-statique
= (u k)/R
La dynamique lente de la vitesse tant alors
d
= (k 2 /R) + (k/R)u p.
dt
d
p
dt
d
J dt
o la mesure
= Lp (
z(t))
2
= (k /R)
+ (k/R)u p L (
z(t))
correspond la vitesse
Lp
,
et
(4.1)
suite l'ap-
doivent
tre choisis positifs pour garantir la stabilit et pas trop grands cause de
l'approximation quasi-statique sur le courant.
Le suivi de la rfrence en vitesse
feedback
t 7 r (t)
solution de
(k 2 /R) + (k/R)u p = J(
d
r ( r )/ )
dt
178 CHAPITRE 4.
et
p.
>0
Ici
et
p par leur
(k 2 /R)
+ (k/R)u p = J(
d
r (
r )/ )
dt
et
y = avec yr = r (t)
p)
d
p
dt
d
J dt
= Lp (
z(t))
2
= (k /R)
+ (k/R)u(t) p L (
z(t))
z(t) = (u(t) Ry(t))/k
u(t) = k
+ Rk p + J
d
y (t)
dt r
yr (t)
|| max
o max
>0
1
u = R k
+ ( )
est
tel que
R 1.
L
et donc
est
d
= ke (R + 1/)( )
dt
se rduit
d
= ki p
dt
4.2.
179
J r J(
r )/ + p
k
r .
d x = f (x, u)
dt
y = h(x)
avec
x Rn , u Rm
et
y Rp ,
les fonctions
(4.2)
et
tant rgulires.
4.2.1 Dnition
Pour dnir l'observabilit, il convient d'abord de dnir la notion de
distinguabilit.
Dnition 14 (Distinguabilit).
distinguables (nots
xI x
e)
si pour tout
u(t)
t 0,
2
les sorties
x
e
y(t)
et
ye(t)
sont
non.
L'indistinguabilit est une relation d'quivalence. Notons
d'quivalence de
x.
I(x)
la classe
x
2.
si
I(x) = {x}
initiale
et il est observable si
I(x) = {x}
pour tout
u(t)
x.
et la condition
180 CHAPITRE 4.
y(t) 6= ye(t)
qui distingue
t 0.
et
x
e,
et
x
e,
Il peut exister des entres qui ne distinguent pas certains points. Cepen-
d
x
dt 1
d
x
dt 2
= ux2
= 0
y = x1
u = 1 par exemple). Cependant l'entre u = 0 ne disx et x tels que x1 = x1 et x2 6= x2 . Notons que l'observa-
bilit ne signie pas que toute entre distingue tous les tats. L'observabilit
est un concept global. Il peut tre ncessaire d'aller trs loin dans le temps
et dans l'espace d'tat pour distinguer deux tats initiaux. Pour cela nous
introduisons le concept plus fort qui suit.
>0
L'tat
u.
4.2.2 Critre
La seule faon eective de tester l'observabilit d'un systme est de consi-
y et ses drives en temps. Nous supposerons dans cette section que y et u sont des fonctions rgulires du temps.
d
u, . . .)
Nous supposerons galement que les rangs en x des fonctions de (x, u,
dt
drer l'application qui
associe
au temps on a
d
d
y = Dx h(x) x = Dx h(x) f (x, u) := h1 (x, u)
dt
dt
Des drivations successives conduisent donc une suite de fonctions
hk (x, u, . . . , u(k1) )
4.2.
181
hk+1 =
Si pour un certain
k,
d
(hk ),
dt
le rang en
h0 (x) = h(x)
du systme
h0 (x) = y
d
h1 (x, u) = y
dt
.
.
.
et
y.
du systme
h0 (x) = y
d
h1 (x, u) = y
dt
.
.
.
et
sont
relis par
font
La mise en forme des ides prcdentes est assez fastidieuse mais nanmoins instructive. Nous nous contenterons de retenir qu'en gnral l'observabilit signie que l'tat peut tre exprim en fonction des sorties, des entres
y et u sont
n 1 en u.
en
et
relis
182 CHAPITRE 4.
(x1 , u, y, T )
d
x
dt 1
d
T
dt
= D(xin
1 x1 ) k0 exp(E/RT )x1
= D(T in T ) + H exp(E/RT )x1 + u
y(t) = T
On a facilement
x1
en fonction de
x1 =
d
dt
et
d
y
dt
D(T in y) u
H exp(E/Ry)
(y, dtd y)
et
et du premier ordre en
d
dt y
D(T in y) u
H exp(E/Ry)
(4.3)
u.
On l'obtient en utilisant
d
dt y
D(T in y) u
= Dxin
(D
+
k
exp(E/Ry))
0
1
H exp(E/Ry)
Il s'agit d'une condition de compatibilit entre
et
u.
(4.4)
x partir de y
et
en fonction de drives
des mesures s'avre d'une utilit fort limite ds que l'ordre de drivation
dpasse
en
4.2.
183
Z
J() =
d
= 0,
dt
d
x = f (x, u, ),
dt
d'tat
(x, )
et de sortie
ut (x0 )
y = x.
f = Ax + Bu
et
y=x
h = Cx, ut (x0 )
exp((t s)A)Bu(s) ds
= exp(tA)x +
0
[0, T ], x0
l'argument du minimum de
Z
J() =
0
(z(t) C exp(tA)x0 )2 dt
(4.5)
184 CHAPITRE 4.
z(t) = y(t) C
Rt
les moindres carrs, le ltre de Kalman trait dans la Section 4.5. Nous
allons maintenant aborder l'observabilit des systmes linaires avec un point
de vue moins classique qui met l'accent sur les observateurs asymptotiques.
Ces derniers fournissent, avec des calculs trs conomiques, directement
ut (x0 ) en fonction de y , u et leurs intgrales.
x=
u,
d'tat
d
x = Ax + Bu,
dt
o
n n, B
une matrice
et de sortie
suivant
y = Cx
nm
(4.6)
et
une matrice
p n.
d
Le systme (4.6) dt x = Ax + Bu,
est observable au sens de la Dnition 16 si et seulement si le rang
(Critre de Kalman)
de la matrice d'observabilit
O=
C
CA
..
.
n1
CA
est gal
n = dim(x).
(A, C)
Dmonstration. Drivons
rivation donne
Donc
d
d
y = C x = CAx + CBu.
dt
dt
connues)
Cx = y
CAx = dtd y CBu.
et
sont
4.3.
185
OBSERVABILIT LINAIRE
y1 =
d
y
dt
Cx = y0 = y
CAx = y1 = dtd y CBu
CA2 x = y2 = y 1 CABu.
Il est alors facile de voir que, ainsi de suite,
quations
CAk x = yk
yk sont
y0 = y .
CAk1 Bu
pour
k1
et
(4.7)
yk =
d
y
dt k1
matrice
n, elle
n pn
C
CA
= 1n
.
.
.
n1
CA
Ainsi,
y0
.
.
.
x=P
yn1
La condition de rang est donc susante.
Supposons maintenant que la matrice d'observabilit, de taille
soit de rang
r < n.
pn n,
toires direntes avec les mmes commandes, donnant la mme sortie. Cela
montrera que la condition est aussi ncessaire.
n
Soit w R un lment non nul du noyau de la matrice d'observabik
lit. Pour k = 0, . . . , n 1, CA w = 0. Par un raisonnement identique
celui fait lors de la preuve de la Proposition 6 avec les noyaux gauche
k
k
de A B , on a ncessairement CA w = 0, pour toute k n. Donc, w est
k
dans le noyau de toutes les matrices CA . Prenons comme premire trajectoire
[0, T ] 3 t 7 (x, u) = 0.
Il vient,
y = 0.
Prenons maintenant
Sa sortie vaut
C exp(tA)w =
+ i
X
t
i=0
i!
CAi w = 0
186 CHAPITRE 4.
x(t).
et
u.
d
x = A
x + Bu
dt
partir d'une condition initiale x0 et des valeurs connues du contrle u
chaque instant. Si la matrice A est stable, alors x
peut tre pris comme
estimation de x car l'erreur ex = x
x tend naturellement vers 0 puisque
d
e = Aex .
dt x
Si A est instable cette mthode ne marchera pas. En eet, une petite erreur initiale ex (0) sera amplie exponentiellement. Intuitivement, si l'erreur
x x devient grande alors, le systme tant observable, l'erreur sur les sorties
y y deviendra grande galement 3 . Comme y est connue, il est alors tentant
d
x = A
x + Bu par l'ajout d'un terme du type L(
y y) qu'on
de modier
dt
connat et qui correspond l'erreur d'observation. Le problme suivant se
pose : peut-on choisir la matrice
converge vers
la matrice
d
x = A
x + Bu(t) L(
y y(t)), y = C x
dt
x ? Puisque y = Cx, la question se pose ainsi :
peut-on ajuster
d
ex = (A LC)ex ?
dt
Soyons plus exigeants encore, par un choix judicieux de
ALC
L, peut-on imposer
Thorme 29
L,
matrice
n p,
(A, C)
A LC soit
y = C x
.
nn
Si
librement choisie.
4.4.
187
OBSERVATEUR-CONTRLEUR
variable sur
x=
x,
que
d
y
dt
d
x
dt r
= Ayy y + Ayr xr + By u
= Ary y + Arr xr + Br u
(A, C) est observable si, et seulement si, (Arr , Ayr ) l'est : en eet
d
y Ayy y By u, qui
connatre y et u implique la connaissance de Ayr xr =
dt
d
peut tre vue comme une sortie du systme
x
=
A
x
rr r + (Br u + Ary y).
dt r
En ajustant correctement la matrice des gains d'observation Lr , le spectre
de Arr Lr Ayr concide avec celui de n'importe quelle matrice relle carre
d'ordre n p = dim(xr ). Considrons alors la variable = xr Lr y au lieu
de xr . Un simple calcul montre que
bilit, que
d
= (Arr Lr Ayr ) + (Ary Lr Ayy (Arr Lr Ayr )Lr )y + (Br Lr By )u
dt
Ainsi en choisissant Lr , de faon avoir Arr Lr Ayr stable, nous obtenons
un observateur d'ordre rduit n p pour (donc pour xr = + Lr y ) en
recopiant cette quation direntielle
d
= (Arr Lr Ayr )+(Ary Lr Ayy (Arr Lr Ayr )Lr )y(t)+(Br Lr By )u(t)
dt
La dynamique de l'erreur sur , e = vrie l'quation autonome stable
d
e = (Arr Lr Ayr )e .
dt
Cet observateur rduit est intressant lorsque np est petit, typiquement
n p = 1, 2 : la stabilit d'un systme de dimension 1 ou 2 est en outre trs
simple tudier.
4.4 Observateur-contrleur
4.4.1 Version tat multi-entre multi-sortie (MIMO)
En regroupant les rsultats sur la commandabilit et l'observabilit linaires, nous savons comment rsoudre de faon robuste par rapport de
4. MIMO : pour Multi-Input Multi-Output
188 CHAPITRE 4.
en ne mesurant que
u, l'tat x du
y sachant que
(A, C) observable.
comme (A, B) est commandable,
commandable et
En eet,
pour aller de
q.
[0, T ] 3 t 7
x, Kx,
A BK
soit stable
la commande.
Grce l'observabilit, nous savons construire un observateur asymptotique sur
de faon avoir
A LC
stable.
Alors le bouclage dynamique de sortie
u(t) = ur (t) K(
x xr (t)) contrleur
d
x = A
x + Bu(t) L(C x y(t)) observateur
dt
assure le suivi asymptotique de la trajectoire de rfrence
[0, T ] 3 t 7
(xr (t), ur (t)). Avec ce bouclage, appel commande modale ou encore observa
teur-contrleur, les petites erreurs de conditions initiales sont amorties lorsque
au cours du temps.
En eet, comme
d
x
dt
= Ax + Bu
et
y = Cx,
on a pour la dynamique du
systme boucl
d
x
dt
d
x
dt
= Ax + B(ur (t) K(
x xr (t)))
= A
x + B(ur (t) K(
x xr (t))) L(C x Cx)
d
(x) = (A BK) x BK ex
dt
d
ex = (A LC) ex
dt
Ce qui montre que ex et x tendent vers 0 exponentiellement en temps. Le
spectre du systme d'tat (x, ex ) se compose du spectre de A LC et de
celui de A BK . C'est le principe de sparation .
4.4.
189
OBSERVATEUR-CONTRLEUR
1
Figure 4.1 Le transfert en boucle ferme, e = yc y = 1+GK
yc .
Dans le cas mono-variable o
et
C).
contrleur K(s) aussi sous la forme d'un transfert rationnel causal, K(s) =
N (s)
0
0
(d N < d D ), de sorte que le systme boucl soit stable. Nous allons
D(s)
voir que l'observateur-contrleur rpond la question. Pour cela on passe
la forme d'tat. Pour viter tout confusion avec les fonctions de transfert, les
matrices sont notes en caractres calligraphiques.
d
x = Ax + Bu, y = Cx avec
Il existe trois matrices (A, B, C) telles que
dt
(A, B) commandable, (A, C) observable et G(s) = C(sI A)1 B . L'observateur contrleur
u = K
x,
correspond au transfert
d
x = A
x + Bu L(C x (y yc ))
dt
u = K(s)(yc y)
donn par
1
I CM1 N (M + N + LC)1 L
= I + C(M + N )1 N (M + LC)1 L.
conduit, avec
M = sI A, N = BK,
1
= 1 C(sI A + BK)1 BK(sI A + LC)1 L
1 + G(s)K(s)
Ainsi le transfert en boucle ferme admet comme ples ceux du contrleur et
de l'observateur, ples que l'on peut choisir o l'on veut puisque
commandable et
(A, C)
(A, B)
est
est observable.
190 CHAPITRE 4.
Figure
passe bas sur la consigne yc et dont l'ordre est au moins gal celui du
0
0
systme (d R d Q, R stable).
LC)1 L
entre
e = yc y
et
yc
1
1+G(0)K(0)
u, uc vriant
Q(0)yc = P (0)uc .
On peut aussi gnrer en temps rel et de faon causale des rfrences
et
ur
yr
yr =
avec
polynme stable,
P (s)
yc ,
R(s)
d0 R d0 Q
ur =
et
Q(s)
yc
R(s)
R(0) = 1.
Ainsi,
1/R(s)
est un ltre
u = ur K(s)(y yr ).
Q(s)
y . On parle
R(s) c
alors de ltrage de la consigne yc . Ces petits calculs de gnration et suivi
qui donne comme transfert en boucle ferme
y = yr =
Q(0) 6= 0,
yc 7 yc /Q(0)
on voit que
yr
yc .
4.5.
191
FILTRE DE KALMAN
tats .
4.5.1 Formalisme
On considre un systme sous forme d'tat linaire stationnaire
d
x(t) = Ax(t) + Bu(t) + D(t)
dt
o l'tat est
et
(4.8)
(t) Rq
une perturbation sur le systme. On suppose que ce dernier signal possde les
proprits statistiques suivantes (qui en font un bruit blanc gaussien centr ) :
pour tout
gaussienne de moyenne
E ((t)) = 0,
gaussien color.
En ce qui concerne la mesure, nous disposons de
(4.9)
A LC .
192 CHAPITRE 4.
M%
Mp (R)
t.
On note alors
U (t)
et
Y (t),
x(t)
de l'tat
x(t)
qui
E(
x(t)) = 0
(H1) :
(H2) :
la paire
la paire
(H1) signie que le bruit (t) excite tout l'tat du systme. (H2) implique
que la mesure non bruite Cx contient des informations sur tout l'tat. On
peut relcher ces deux hypothses en n'imposant seulement que
(H10 ) :
(H20 ) :
la paire
la paire
ment stables et que les modes non observs soient asymptotiquement stables.
Minimisation de la covariance
Le ltre de Kalman que nous prsentons est un ltre stationnaire de
dimension gale celle de l'tat du systme observer. Il admet comme entre
le signal
u(t)
et la mesure bruite
y(t).
4.5.
193
FILTRE DE KALMAN
L sous la forme
suivante
d
x(t) = A
x(t) + Bu(t) L(C x(t) y(t))
dt
(4.10)
d
x(t) = (A LC)
x(t) + D(t) L%(t)
dt
En utilisant la matrice de transition
un temps initial
t0
et
t,
entre
E(
x(t)) = (t, t0 )E(x(t0 ))
car les signaux
(t)
et
%(t)
A LC
t0 = ,
on a
E(
x(t)) = 0
et on conclut que l'estimation est, quel que soit le choix de
(stabilisant),
L,
(4.11)
J = trace().
est choisi
t = 0
avec un tat
x(0) = x0
quelconque,
t +.
194 CHAPITRE 4.
Gain du ltre
Le gain du ltre de Kalman est
L = C T M%1
o
(4.12)
brique
0 = A + AT + DM DT C T (M% )1 C
On peut montrer, par une dmonstration trs semblable au cas de la commande quadratique, que le gain
A LC
toutes ses valeurs propres partie relle strictement ngative. Ceci justie a
posteriori les hypothses que nous avons formules.
Exemple 27.
simple
d
x = x + u +
dt
y =x+%
o
tout
d
x(t) =
x + u L(
x y(t))
dt
o
L = (k 2 )1
o
0 = 2 + 1 2 k 2
Il vient
k2 + k4 k2
1
r
d
1
x(t) = 1 + 2 x + u +
dt
k
!
1
1+ 2 1 y
k
4.5.
195
FILTRE DE KALMAN
Bruit dexcitation
200
0
200
6
8
Mesure bruite
10
12
10
5
0
2
4
6
8
10
Etat rel et estimation de ltat (filtre de Kalman)
12
2
4
6
8
10
Estimation de la variance de lerreur (filtre de Kalman)
12
2
4
6
8
10
Etat rel et estimation de ltat (autre rglage de filtre)
12
10
5
0
4
2
0
10
5
0
2
4
6
8
10
12
Estimation de la variance de lerreur (autre rglage de filtre)
4
2
0
10
12
196 CHAPITRE 4.
Exemple 28
Considrons un roTM
bot mobile roues indpendantes tel que le MobileRobots
Pioneer 3-AT
(Fusion de capteurs pour robot roues)
(v + v2 )
d
x= 1
cos ,
dt
2
d = (v2 v1 )
dt
2l
d
(v1 + v2 )
y =
sin ,
dt
2
(4.13)
v1 , v2 reprsentent la vitesse du train roulant gauche et droit respectivement, x, y reprsentent la position du centre de masse du vhicule et
est l'orientation du chassis, l est la demi largeur de l'engin. En conditions
o
v1
et
v2
par l'utilisa-
tion des odomtres (ici des capteurs incrmentaux situs dans les arbres des
d
roues). On mesure x et y par le rcepteur GPS et enn on mesure dt grce
9
un gyroscope un axe.
T
An d'estimer l'tat (x, y, ) du systme, on peut utiliser un observateur,
ou un ltre de Kalman. Ces techniques de fusion de capteurs utilisent la redondance de l'information et l'accord avec un modle dynamique, pour fournir
une estimation meilleure que l'information fournie par chacun des capteurs
sparment. Par exemple, si on intgre (en boucle ouverte) les donnes du
gyroscope et des odomtres, ce qui thoriquement permet de calculer les positions, on observe trs rapidement (aprs quelques dizaines de secondes) une
importante drive de l'estimation. Si on n'utilise que le GPS, on obtient assez
rapidement des aberrations signalant par exemple des mouvements latraux
de plusieurs mtres (alors que le vhicule en est totalement incapable).
On a reprsent sur la Figure 4.5, des rsultats de suivi en boucle ferme
d'une trajectoire de consigne. On donne aussi titre informatif, l'enregis9. Ce gyroscope de technologie MEMS mesure une vitesse angulaire.
4.5.
FILTRE DE KALMAN
197
trement des valeurs donnes par le rcepteur GPS qu'on pourra comparer
l'estimation par fusion de capteurs (on dit aussi hybridation) de la position
du vhicule.
198 CHAPITRE 4.
10
15
20
25
10
10
15
20
4.6.
199
COMPLMENTS
M%
et
agissent
comme des pondrations (on remarquera l'analogie avec la commande quadratique une fois de plus) avec les eets suivants :
1. lorsqu'on augmente
M% ,
M ,
au gain
tion (4.11).
4.6 Complments
4.6.1 Estimation de paramtres et commande adaptative
Soit le systme d'tat
et de paramtre
d
x = f (x, t) + p g(x, t),
dt
On suppose que les trajectoires
tout temps
t 7 x(t)
pR
x.
On souhaite estimer
p.
d
x = f (x(t), t)+
p g(x(t), t)K(
xx(t)),
dt
o
x Rn ,
>0
h, i
d
p = hg(x(t), t), (
x x(t))i
dt
Rn .
Cet estimateur donne en temps rel d'une part une valeur ltre de
et d'autre part reconstruit asymptotiquement le paramtre
x, x
lorsqu'il existe
200 CHAPITRE 4.
>0
tel que
kg(x, t)k
x Rn
pour tout
et tout temps
t.
En eet, il
1
1
x x)2 + (
p p)2
V = (
2
2
On voit que
d
V = K(
x x)2 0
dt
Ainsi x
tend vers x quand t tend vers l'inni. Et donc, intuitivement dtd x dtd x
converge vers 0 soit donc (p p
)g(x, t) converge zro. Comme le vecteur g(x, t)
est toujours de norme plus grande que > 0 on en dduit que p
converge
vers p.
Il est possible de gnraliser cet estimateur pour un nombre arbitraire m
de paramtres. On part de
X
d
x = f (x, t) +
pi gi (x, t)
dt
i=1
On considre avec
i > 0
paramtre (i
= 1, ..., m)
l'estimateur
X
d
x = f (x(t), t) +
pi gi (x(t), t) K(
x x(t))
dt
i=1
d
p1 = 1 hg1 (x(t), t), (
x x(t))i
dt
.
.
.
d
pm = m hgm (x(t), t), (
x x(t))i
dt
Il est alors facile de voir que la fonction
X 1
1
V = (
x x)2 +
(
pi pi ) 2
2
2
i
i=1
est dcroissante
d
V = K(
x x)2 0
dt
Donc on a toujours x
qui converge vers x. En revanche, la convergence des
pi vers les pi n'est pas garantie : tout dpend des gi (x, t) : s'ils forment pour
n
chaque x et t un systme libre de vecteurs de R , systme bien conditionn,
alors la convergence des paramtres est encore assure. Dans les autres cas,
cela dpend de la trajectoire suivie par
4.6.
201
COMPLMENTS
de voir que
x.
x.
et un seul contrle
d
x = f0 (x) + uf1 (x) + pg(x)
dt
Supposons que nous ayons un feedback
en
x=0
mais o le paramtre
u = k(x, p)
u = k(x, p) ou u = k(
x, p)
avec
d
x = f0 (x(t)) + u(t)f1 (x(t)) + p g(x(t), t) K(
x x(t))
dt
d
p = hg(x(t), t), (
x x(t))i
dt
Sous des hypothses raisonnables sur la dynamique en boucle ouverte pour
(pas d'explosion en temps ni essentiellement) on montre que
et ensuite que le feedback assure la convergence de
vers
0.
tend vers
x
x
Sans conditions
connaissance de
Un lecteur intress pourra consulter [41]. On notera que l'une des hypothses
trs importante est la dpendance ane de la dynamique par rapport au
paramtre
p.
existent.
d
x = Ax + f (Cx, t),
dt
avec la paire
y = Cx
Il est clair qu'il faut avoir un peu de air pour choisir les bonnes variables
pour que le systme s'crive ainsi. Ce n'est en gnral pas possible. Parfois
c'est possible et mme vident comme pour le pendule command :
d2
g
= sin + u(t),
2
dt
l
y = .
202 CHAPITRE 4.
x=
dt
,
A=
f (Cx, t) =
0 1
0 0
,
1 0
C=
0
g
l sin + u(t)
A + LC
x.
Il sut de choisir
d
x = A
x + L(C x y(t)) + f (y(t), t)
dt
est exponentiellement convergent car lorsque l'on regarde la dynamique de
ex = x x,
l'erreur
d
ex = (A + LC)ex .
dt
4.6.3 Contraction
La notion de contraction [49, 33] pour un systme, avec une dynamique
x = f (x, t),
rgulier (C
d
Soit un systme dynamique dt x =
par exemple) dni sur une varit M rgulire. Soit g
M.
Soit
U M
un sous ensemble de
M.
La dynamique
au sens de la mtrique
g,
si la partie
>0
et pour tout
sur
U,
nous
x,
f
g
f T
g(x) + g(x)
+
f (x, t) g(x)
x
x x
Nous avons le rsultat suivant qui justie cette dnition et cette terminologie.
Thorme 30.
une varit
associ
d
Soit un systme dynamique dt x = f (x, t) rgulier dni sur
rgulire. Soit g(x) une mtrique sur M . Soit X(x, t) le ot
f
d
X(x, t) = f (X(x, t), t) t [0, T [
dt
X(x, 0) = x
avec
T +.
4.6.
203
COMPLMENTS
x0
and
x1
x0 = (0) et x1 = (1). Si
f est une stricte contraction
dans
et une godsique
(s)
U M,
qui joint
avec
la
X((s), t) appartient U
pour tout
alors
dg
. Soit
au sens de la mtrique
10
l(t) =
0
g.
dX((s), t) T
dX((s), t)
g(X((s), t))
ds
ds
ds
d
l(t) =
dt
Z
0
d
dt
dX((s),t) T
g(X((s), t)) dX((s),t)
ds
ds
q
ds
dX((s),t) T
dX((s),t)
2
g(X((s), t)) ds
ds
Comme
d
d dX((s), t)
= f (X((s), t), t) =
f (X((s), t), t) X((s), t)
dt
ds
ds
X
ds
nous obtenons
d
dt
dX((s), t)
dX((s), t) T
g(X((s), t))
ds
ds
avec
P (s, t) =
)
=
dX((s), t) T
dX((s), t)
P (s, t)
ds
ds
f (X) T
f (X) g(X)
g(X) + g(X)
+
f (X, t)
X
X
X
et
X = X((s), t)
Puisque
U,
il existe
>0
tel que
204 CHAPITRE 4.
d
l(t)
dt
l(t) l(t)
dt
2
qui conduit
l(t) l(0)e 2 t
Puisque
godsique
t [0, T [
dg (X(x0 , t), X(x1 , t)) l(t) et l(0) = dg (x0 , x1 ) (en eet est
qui joint les deux points x0 et x1 ), le thorme est dmontr.
la
n
Lorsque la varit Riemannienne M est l'espace Euclidien R , la dynad
x = f (x, t) est une contraction lorsque la partie symtrique de la
mique
dt
matrice Jacobienne est ngative
f
+
x
f
x
T
0
Enn, l'intrt pour la construction d'observateurs non-linaires asymptotiques vient du fait qu'avec une dynamique contractante, il sut de simuler
le systme pour avoir une estimation de
d
x = f (
x, t)
dt
la dpendance en temps tant alors due aux entres et/ou aux termes d'erreur
entre la sortie estime et la mesure.
L'exemple typique est le suivant. On considre un systme mcanique
un degr de libert
y = x1
d
x2 = F (x1 , x2 , t)
dt
et on suppose que
F
x2
0.
On considrer
alors l'observateur
d
x1 = x2 (
x1 y(t))
dt
d
x2 = F (y(t), x2 ) (
x1 y(t))
dt
, > 0 deux paramtres de rglage. On crit symboliquement cet
d
x = f (
x, t) o la dpendance en t vient de la mesure y(t) =
dt
x1 (t). Cet observateur s'crit formellement dtd x = f (
x, t). Avec comme produit
avec
observateur
scalaire celui qui est associ la matrice constante symtrique dnie positive
g=
1 0
0 1
4.6.
205
COMPLMENTS
on a
f
x
T
f
=
g+g
x
2
0
0
F
2 x
Nous n'avons pas une contraction stricte comme dans la Dnition 17 mais
F
< 0 uniformment
au sens large. Il est cependant facile de voir que si
x2
pour tout x avec > 0, on a une contraction stricte et donc la convergence
exponentielle de
vers
x.
Annexe A
Sur le thorme de
Cauchy-Lipchitz
x(0) = x0 ,
d
x(t) = v(x(t), t).
dt
(A.1)
Pour tablir des rsultats sur ces proprits (essentiellement, les Thormes 1
et 2) nous allons utiliser la notion de solution approchante qui s'appuie simplement sur le schma numrique d'Euler explicite
>0
et
xk
x0 = x(0),
kN
une approximation de
x(k).
kk
dsigne la
M > 0.
(t, x(t)) R on
d
x(t) v(x(t), t)
dt
x(0) = x0 ,
t 7 x(t)
d
en tout point o dt x est dni.
207
continue,
208
ANNEXE A.
En d'autres termes,
points de
|t| a.
d
x(t) peut ne pas tre dni en un nombre ni de
dt
Thorme 31.
R = {kx x k b, |t| a}
et majore par
|v| M .
> 0, on
l'intervalle |t|
Pour tout
min(a, b/M ) , h.
v
> 0,
Dmonstration. L'application
il existe
>0
R,
tel que
|v(x1 , t1 ) v(x2 , t2 )|
quels que soient
(x1 , t1 ) R
Considrons maintenant,
diaires entre
et
et
(x2 , t2 ) R
avec
kx1 x2 k , |t1 t2 | .
h
t0 = 0 < t1 < t2 ... < tm = h
vriant
i = 1, ..., m
(A.2)
(par exemple, cette famille de temps intermdiaires peut tre de plus en plus
nombreuse lorsque
ti1 t ti ,
xi = x(ti )
sde une drive continue par morceaux (elle est en fait ane par morceaux
par construction). Sa drive est dnie partout sauf aux points
En dehors de ces points, on a, pour
(ti )i=1,...,m1 .
ti1 t ti ,
d
x(t) v(x(t), t)
= kv(xi1 , t) v(x(t), t)k
dt
Par (A.2), et d'aprs la relation de rcurrence, on a
=
M
(A.3)
209
|t| < a
t1 , ..., tm
on a
d
x(t) v(x(t), t)
dt
Enn, par construction
x(0) = x0 ,
Rn R v(x, t) R
en x si
k>0
(ou
(x, t) R
k -Lipschitz)
dans
R.
est Lipschitz en
Une fonction
(x, t)
Proposition 9.
n
n
Soit R R (x, t) 7 v(x, t) R . Supposons que chaque
v(x,t)
drive partielle x
pour i = 1, ..., n existe et soit de norme borne par un
i
x = (x1 , ..., xn )
et
y = (y1 , ..., yn )
deux
, on peut crire,
v(y, t) = v(x, t) +
X Z
i=1,...,n
v
(xi yi ) d
xi (y+(xy),t)
210
ANNEXE A.
Thorme 32
chantes). tant
R et k-Lipschitz en
1 et 2 prs du problme de Cauchy (A.1), dnies sur |t| b. La dirence d(t) = x1 (t) x2 (t)
satisfait, pour tout |t| b
x.
Soient
x1 (t)
donne
et
x2 (t)
v(x, t)
1 + 2
(exp(k |t|) 1)
k
(A.4)
d
Dmonstration. La drive dt d(t) est dnie partout sauf en un nombre ni
de points. Par dnition des solutions approchantes, on a (en notant
,
1 + 2 )
d
d
d
d(t)
=
x1 (t) x2 (t)
kv(x1 (t), t) v(x2 (t), t)k +
dt
dt
dt
k kx1 x2 k + k kd(t)k +
d
d(t)
dt
0, on peut donc conclure d'aprs le Lemme 4 (donn un peu
d(t) 6=
v.
plus loin),
d
kd(t)k k kd(t)k +
dt
On a alors trois cas :
1. si
d(t)
2. si
d(t)
exp(kt)
] b, b[,
Z t
d
kd(t)k k kd(t)k dt
exp(kt)dt
dt
0
o le membre de gauche peut avoir un intgrand discontinu mais possde eectivement une primitive. Il vient
(1 exp(kt))
k
211
3. s'il existe
t tel
que
[t1 , t],
on a alors
kd(t)k
(exp (k(t t1 )) 1)
k
Lemme 4.
Si
x(t)
d kx(t)k
dx(t)
dt
dt
Pn 2
Dmonstration. Soit t ]t1 , t2 tel que kx(t)k =
6 0, avec kx(t)k =
i=1 xi (t),
Pn
dxi
xi dt
dkx(t)k
il vient
= i=1
qui est bien dnie. D'autre part, par passage la
dt
kx(t)k
p
1
1
|kx(t + t)k kx(t)k| kx(t + t) x(t)k
t
t
x1
et
x2
Soit le pro-
dans un
du problme (A.1).
x1 x2 .
Thorme 34
h.
x(t)
de
Soit le
212
ANNEXE A.
(n )nN
conver-
0. D'aprs le Thorme 31, on peut construire une suite de fonc(xn )nN qui sont chacune solution approchante n prs de (A.1). On
alors, pour |t| h,
d
xn v(xn (t), t)
n , xn (0) = x0
dt
geant vers
tions
a
d
x est dnie partout sauf en un nombre ni de points
dt n
1, ..., mn . On va prouver trois proprits
La drive
i=
(n)
ti
1. la suite de fonctions
2.
nN
0
3. la fonction x(t) est continment direntiable et vrie x(0) = x et
d
x(t) = v(x(t), t). Autrement dit x(t) est solution du problme de Caudt
chy.
preuve du point 1
Considrons
n < p
lutions approchantes
schitz de
xn (t)
et
xp (t).
Il vient, en notant
la constante Lip-
v(x, t)
2n
n + p
(exp(|t|) 1)
(exp(|t|) 1)
k
k
preuve du point 2
0
0
Considrons une rgion R = {|t| h, kx x k M h}. L'application v(x, t)
0
est continue dans R . Donc, pout tout > 0, il existe > 0 tel que, pour
0
tout (t, x1 ), (t, x2 ) dans R , tels que kx1 x2 k , on a
|t| h
dans
Rn
213
pour tout
v(x(t), t)
|t| h.
et on a
vers
preuve du point 3
Reprenons l'ingalit
d
xn (t) v(xn (t), t)
n
dt
pour tout
|t| < h.
En int-
grant, on obtient
t1
or
xn (t)
d
( xn (t) v(xn (t), t))dt
n |t1 | n h
dt
Z
xn (t1 ) x0
t1
v(xn (t), t)dt
n h
t1
x(t) = x +
0
L'intgrand
sa drive
Annexe B
Autour des fonctions de
Lyapounov
Dnition 21.
suivantes
1.
2.
V (
x) = 0
V (x) > 0
sur
\ {
x}
d
3. dt V (x) = V (x)v(x) 0 pour tout
croissante le long des trajectoires).
(autrement dit
est d-
Lyapounov
stable. Si
x. On souhaite montrer que, pour tout > 0 tel que la boule centre
soit contenue dans , il existe > 0 tel que, pour toute
0
condition initiale kx x
k , on a
bilit de
en
de rayon
kx(t) xk ,
pour tout
215
t0
216
ANNEXE B.
E 2 , {x B /V (x)
}
2
V (x )
et
k
x x k =
donc
V (x )
d'o la contradiction.
V (
x) = 0. On peut
donc nalement construire une boule B centre en x
de rayon dans laquelle
B E 2 B
L'ensemble E est positivement invariant : pour toute condition initiale
2
x(0) = x0 appartenant E 2 , on a x(t) E 2 pour tout t 0. En eet, on
d
dduit de
V (x) 0 que V (x) V (x(0)) 2 .
dt
217
x(0) B on a
x(0) E et donc par l'invariance que vous venons d'voquer, x(t) E 2
pour tout t 0 et donc x(t) B pour tout t 0. D'o la conclusion
concernant la stabilit du point d'quilibre x
.
d
V < 0 pour tout
Considrons maintenant l'hypothse supplmentaire
dt
x \{
x}. La fonction t 7 V (x(t)) est dcroissante et borne infrieurement
par 0, donc elle converge. Notons
On peut alors conclure que pour toute condition initiale
,
2
lim V (x(t)) = l
t+
Enn,
V (x(t)) = V (x(0)) +
0
d
V (x(t))dt V (x(0)) kt
dt
asymptotiquement stable.
Au cours de la preuve du thorme prcdent, nous avons t capables
de construire un sous-ensemble de conditions initiales (not
E 2 )
fournissant
x.
x.
x.
ensemble est dicile, et nous en avons pour l'instant simplement trouv une
partie. Une question intressante est de savoir sous quelle hypothse le bassin
n
d'attraction est l'espace R tout entier, c.--d. sous quelle hypothse x
est
V (x) =
x21
+ x22
1 + x21
218
ANNEXE B.
minkxk= V (x) 1,
pour tout
E 2
est non
lim
kx
xk
V (x) = +
d
V < 0 pour tout x
dt
libre globalement asymptotiquement stable.
6= x,
alors
(B.1)
limt+ V (x(t)) = 0.
D'autre part, on va montrer que lima0 r(a) = 0. La fonction t 7 r(1/t)
est dcroissante et minore donc elle converge lorsque t +. Notons
la limite lima0 r(a) = l 0. Supposons que cette limite est non nulle.
Alors, pour toute suite (an )nN convergeant vers zro, il existe une suite
(xn )nN telle que kxn k l/2 et V (xn ) an . On dduit que, pour cette suite,
limn+ V (xn ) = 0 avec kxn k l/2 ce qui est impossible car V est non nulle
en dehors de x
. On a donc lima0 r(a) = 0.
On dduit donc de la suite d'ingalits (B.1) que limt+ x(t) = 0.
De la mme manire que dans le Thorme 35, on a
219
Thorme 37
Es
converge lorsque
t +
Z.
Exemple 29.
d
d2
x
+
k
x + g(x) = 0
dt2
dt
k est un paramtre strictement positif et g est telle
x 6= 0. On peut rcrire ce systme sous forme d'tat
o
que
xg(x) > 0
pour
d
x=y
dt
d
y = ky g(x)
dt
Une fonction candidate tre de Lyapounov est
g( )d +
V (x, y) =
0
y2
2
Calculons maintenant
d
d
d
V (x, y) = g(x) x + y y = ky 2 0
dt
dt
dt
On peut en dduire la stabilit de l'origine par le Thorme 35. Pour dduire
la stabilit asymptotique, il nous faut utiliser le Thorme 37.
g
Le cas particulier g(x) = R sin x, correspond un pendule de longueur
soumis la gravit, tel que reprsent sur la Figure B.2.
220
ANNEXE B.
Annexe C
Moyennisation
C.1 Introduction
On suppose ici que les eets rapides ont un caractre oscillant. La mthode de moyennisation a t utilise en mcanique cleste depuis longtemps
pour dterminer l'volution des orbites plantaires sous l'inuence des perturbations mutuelles entre les plantes et tudier la stabilit du systme
solaire. Gauss en donne la dnition suivante qui est des plus intuitives : il
convient de rpartir la masse de chaque plante le long de son orbite proportionnellement au temps pass dans chaque partie de l'orbite et de remplacer
l'attraction des plantes par celle des anneaux de matire ainsi dnis.
Dans ce cadre, les quations non perturbes du mouvement de la terre
sont celles qui ne prennent en compte que la force d'attraction due au soleil.
L'orbite de la terre est alors une ellipse dont le soleil est l'un des foyers. Les
quations perturbes sont celles o l'on rajoute les forces d'attraction entre
la terre et les autres plantes en supposant que ces dernires dcrivent toutes
correspond au
1/1000. L'chelle
peuvent entraner
221
222
ANNEXE C.
MOYENNISATION
dx
dt
= f (x, z, )
dz
dt
= g(x, z, )
( )
par
t/.
priode
1/.
de l'ordre de
y=
y1
y2
dy1
dt
= y2
dy2
dt
= g1 (x, y, )
2 2
T
y1 = g2 (x, y, ),
et dpend de
de faon
rgulire
perturb
s'crit alors
dx
dt
= f (x, t, ), 0 1
(C.1)
dz
dt
= T1
RT
0
f (z, t, 0) dt
df
(C.2)
f (z)
Remplacer les trajectoires du systme instationnaire (C.1) par celles du systme stationnaire (C.2), revient alors lisser les trajectoires de (C.1). Comme
pour le thorme 16, si le systme moyen admet un point d'quilibre hyperboliquement stable (les valeurs propres du tangent sont toutes partie relle
strictement ngative) alors le systme perturb oscille lgrement autour de
cet quilibre moyen.
De faon plus rigoureuse, thorme suivant montre qu' un point d'qui-
Thorme 38
z + w(z, t)
de priode
avec
Considrons le systme
en
t,
dz
= f (z) + 2 f1 (z, t, )
dt
avec
f1
rgulire de priode
en
t.
De plus,
x=
C.2.
(i)
223
LE RSULTAT DE BASE
si
(ii)
O()
t [0, +[.
x = z + w(z, t) en enlevant x
T en t). On a, d'une part,
(w
de
priode
dz
w
dz
w
dx
=
+ (z, t) + (z, t)
dt
dt
z
dt
t
et, d'autre part,
dx
= f (z + w(z, t), t, )
dt
Ainsi
1
= I + w
(z, t)
f (z + w(z, t), t, )
z
dz
dt
= f (z, t, 0)
Comme la dpendance en
est
+ O(2 )
T -priodique, il n'est pas possible d'and'ordre 1 en car il n'y a aucune raison pour
de
w
(z, t)
t
w
(z, t)
t
f (z, s, 0) ds
0
soit
T -priodique
. Il sut de poser
Z t
w(z, t) =
f (z, s, 0) f (z) ds
en
0
(noter que
est bien de
T -priodique)
pour obtenir
dz
= f (z) + O(2 )
dt
Si cette approximation n'est pas susante, il faut prendre en compte les
termes d'ordre
224
ANNEXE C.
MOYENNISATION
d2
d
= + (1 2 ) .
2
dt
dt
C'est l'quation d'un pendule pour lequel on a rajout un petit frottement
positif pour les grandes amplitudes (
dx
= f (x, t, )
dt
Le terme oscillant vient du systme non perturb
d2
=
dt2
dont les orbites sont des cercles. Les phnomnes lents (chelle de temps
1/)
sont clairement relatifs aux rayons de ces cercles (i.e. les amplitudes des
oscillations). C'est pourquoi il convient de passer en coordonnes polaires
d
= r sin(). Dans ces coordonnes, le systme
en posant = r cos() et
dt
perturb s'crit
dr
dt
d
dt
t.
On peut crire
dr
dr dt
=
.
d
dt d
Ainsi, on se ramne la forme standard en prenant
comme variable de
temps
du
= u(4 u2 )
d
8
u = 2 est un point d'quilibre hyperbolique attracteur pour , i.e. t
+. Donc pour susamment petit, l'quation perturbe possde un cycle
C.4.
225
2
limite hyperbolique attracteur donc l'quation est approximativement +
d 2
= 4 + O().
dt
L'inconvnient principal de la thorie des perturbations est qu'il faut, ds
le dpart, avoir une ide assez prcise de ce que l'on cherche : il convient de
trouver un petit paramtre
Figure
f (u) o f
un minimum local de
l'amplitude
lorsque la pulsation
> 0).
y = f (u),
la
d
v = k sin(t)(f (v + a sin(t)) ),
dt
d
= h(f (v + a sin(t)) ).
dt
f (u) f + 2 (u u) o f = f (
u) et f = f (
u) > 0. Pour v autour de u
226
ANNEXE C.
MOYENNISATION
00
f
d
2
v = k sin(t) f + (v + a sin(t) u)
dt
2
00
d
f
2
= h f + (v + a sin(t) u)
dt
2
Alors si les gains
(k, a, h, )
ak f00 ,
h
ak f00
d
v=
(
u v),
dt
2
f00
d
a
2
=h f+
(
u v) +
.
dt
2
2
v(t)
C.5.
227
Figure C.2 Le schma bloc d'une PLL : la quantit 0 (1 kx) est une
d
du signal d'entre v qui peut tre trs
dt
fortement bruit et dont l'amplitude a n'est pas connue.
par
d
d
x = kf 0 (v(t) sin x),
= 0 (1 kx)
dt
dt
o est un petit paramtre positif, kf et k deux gains positifs. On pose
v(t) = a cos avec dtd = 0 (1 + p) o a > 0 et p sont des paramtres
inconnus mais constants. Comme 2 cos sin = sin( ) + sin( + ), avec
= et = + , le systme
d
= 0 (1 kx),
dt
d
x = kf 0 (a cos sin x),
dt
devient dans l'chelle de temps
d
x = kf
d
a
2
dt
d
= 0 (1 + p)
dt
= 0 (2 + (p kx)))
sin + a2 sin x
,
2 + (p kx)
d
p + kx
=
.
d
2 + (p kx)
la place de
t.
a
sin x
d
x = kf 2
,
d
2 + (p kx)
On nglige des termes d'ordre
en
d
p + kx
=
.
d
2 + (p kx)
et on prend comme systme moyen :
d
kf a
x=
sin x ,
d
2
2
d
= (p + kx).
d
2
Ce systme s'crit aussi sous la forme d'une seule quation du second ordre
avec
p
/ = kf ka/8
r
d2
2kf d
2p
=
sin
.
d 2
ka d
ak
228
ANNEXE C.
MOYENNISATION
2p
= 2p
On choisit le gain k assez grand pour que < 1. Ainsi on pose sin
ak
ak
] , [. Ce systme admet donc deux points d'quilibre (angle
avec
2 2
dni 2 prs) :
(, =
d
) donne
d
q
2k
kaf < 0.
et
kf
).
k et kf assez
col
Pour
grands
entre la phase
de la PLL et
dnie
Noter que la mme PLL donne, lorsque la frquence reste xe, les modulations
de phase.
Annexe D
Automatique en temps discret
La reprsentation des systmes dynamiques sous forme discrte est souvent ncessaire lorsqu'on doit raliser de manire pratique le contrle avec
un systme numrique d'acquisition, de traitement des donnes et des algorithmes ainsi que leur application. Alors que jusque dans les annes 1960,
les contrleurs utilisaient seulement des composants analogiques, avec des
circuits lectriques assurant les tches de mesure, de calcul et de transmission des ordres vers les actionneurs, aujourd'hui la majorit des systmes de
contrle utilisent des convertisseurs analogiques-numriques , des microprocesseurs, et des convertisseurs numriques-analogiques .
Dans un tel schma, les algorithmes de contrle sont excuts en temps
discret, avec une priodicit (constante) correspondant une frquence choisie en fonction de la ractivit naturelle du systme contrler. On peut
considrer qu'en aronautique, les boucles de guidage-pilotage sont xcutes tous les quelques (10) millisecondes, alors que dans le gnie des procds
de la chimie lourde, les priodes sont plutt de l'ordre de la minute.
Ainsi, dans la chane d'action entourant le systme physique, on a des
signaux numriss utilisables par des microprocesseurs fonctionnant suivant
des cycles d'horloge cadencs une frquence d'chantillonnage
1/Te > 0.
nTe
2Te ,
229
Te est discute
230
ANNEXE D.
CNA
contrleur
Figure
actionneur
Systme
capteur
CAN
contrle.
1/Te ,
yb (t) = y[n] +
t nTe
(y[n] y[n 1]), nTe t < (n + 1)Te
Te
yb
prc-
prcdemment).
est faite
1/Te .
D.1.
231
Thorme 39
tR
(Thorme de Shannon)
y(t),
1/(2B)
n Z.
y(t) est
F (t 7 y(t), N ) =
] B, B[
de cet intervalle).
L'nonc ne s'applique pas des signaux en temps continu dni seulement sur un intervalle de temps born, car ces signaux ne sont en gnral
pas contenu frquentiel support born . L'hypothse de contenu frquentiel nul en dehors du domaine
] B, B[
rieure
de
F (t 7 y(t), N ) = (Fy)(2N ).
3. Si y est support compact,
tique, et donc ne peut pas tre support compact car sinon elle est nulle, voir [26][31.5.4]
232
ANNEXE D.
16
14
12
10
8
6
4
2
0
Figure
10
12
14
16
18
20
y(t) =
+
X
y[n]sinc
n=
(t nTe )
Te
sin(t)
. Cette formule de ret
construction est quivalente au ltrage d'un signal constitu d'impulsions
de Dirac
y[n]
1/(2Te ).
Lemme 5
dans
C)
|y(x)|
(Formule de Poisson)
2
Soit
D.1.
233
+
X
y[n] =
n=
F (t 7 y(t), k)
k=
Ce rsultat est dmontr dans [68], voir aussi [52] pour un nonc dans
l'espace de Schwartz, et [26] pour un nonc concernant les fonctions de classe
L1 (R).
On utilise ce lemme pour donner une expression simple la fonction
suivante, nomme sommation priodique de la transforme de Fourier de la
fonction
y
+
X
(N ) =
F (t 7 y(t), N k/Te )
(D.1)
k=
En utilisant les proprits usuelles de la transforme de Fourier (modulation
et translation en frquence, voir [52]), on obtient
+
X
(N ) =Te
exp(2nN Te )y(nTe )
n=
+
X
=Te
y[n] exp(2nN Te )
(D.2)
n=
Lorsque
l'hypothse
F (t
7 y(t), N ) est nulle
1
que B <
, la formule
2Te
1
, 1 [, alors, sous
2Te 2Te
(D.1) s'interprte comme une somme
en dehors de
F (t 7 y(t), N ) = (N )
1
0
si
|N | < B
sinon
= (N ) rect(
[1,
1]
N
)
B
o elle vaut
F (t 7 y(t), N ) = Te
+
X
n=
exp(2nN Te )y[n]rect(N/B)
1.
En
234
ANNEXE D.
or
1
t nTe
sinc(
), N )
Te
Te
exp(2nN Te )rect(N/B) = F (t 7
comme cela est aisment montr par le calcul.
Ainsi, on a
F (t 7 y(t), N ) = F (t 7
+
X
sinc
n=
t nTe
Te
y[n], N )
d'o l'identication
y(t) =
+
X
sinc
n=
t nTe
Te
y[n]
y(t),
y(t)
souvent que le signal eectivement accessible la mesure, c.--d. la conversion CAN, viole cette hypothse. En eet, les bruits sont souvent spectre
haute frquence et viennent donc se replier en signaux basse-frquence par
le phnomne d'aliasing dcrit prcdemment. Ce phnomne renforce la ncessit de ltrer avec l'chantillonnage.
u(t)
Te
d
x = v(x, u[k], t),
dt
x(kTe ) = x[k]
[kTe , (k + 1)Te [
zro, k entier).
D.2.
235
soit bien dni (prendre par exemple les hypothses du lemme 1 assurant
l'existence et l'unicit globale en temps). On note alors par
de la solution en
u[k]
et
k.
t = (k + 1)Te .
x[k + 1] est
On voit que
x[k + 1] la valeur
x[k],
une fonction de
(D.3)
Soit
kx[0] xk ,
>0
lorsque
tend vers
x[k]
+.
x de x[k + 1] = F (x[k]) est localement asympx, si F est une contraction autour de x. Ainsi
Rn
F
(
x) =
x
Fi
xj
1.
1i,jn
dans
Rn
est dit
236
ANNEXE D.
Soit
Jacobienne
F
(
x) =
x
Fi
xj
1i,jn
z.
et
Bd
n n, n > 0
H(z) = C(zI Ad )1 Bd + D
(D.4)
(D.5)
et un vecteur
Ad , Bd peuvent avoir un lien avec des quations direnX = AX + BU , Y = CX + DU qu'on aura discrtises la priode
d'chantillonnage Te . Ainsi une manire de les discrtiser de manire dite
Les matrices
tielles
Te
Z
Ad = exp(ATe ),
exp(At)Bdt
Bd =
0
Ad , Bd
et
D.3.1 Transforme en z
Considrons un signal en temps continu
aux valeurs
y(t),
On
appelle transforme en
Z(t 7 y(t), z) =
+
X
y(nTe )z
+
X
y[n]z n
(D.6)
n=0
n=0
z
Te . La transformation en z d'un signal
n'est pas une bijection (mme si on n'a pas encore prcis d'espace d'arrive
et d'espace de dpart) : tant donne un signal
forme en
y,
ont pour
donne.
Une transforme en
238
ANNEXE D.
n1
X
(D.7)
(D.8)
!
y[i]z i
nN
(D.9)
i=0
(D.10)
(D.11)
+
X
1
y [n] =
2
n=0
G(z) =
b1 z 1 + ... + bn z n
1 + a1 z 1 + ... + an z n
est
Ad =
0
.
.
.
0
an
,
...
0
1
an1 ... a1
..
.
0
1
D.4.
239
G(z) =
b0 + b1 z 1 + ... + bn z n
N (z)
=
1
n
1 + a1 z + ... + an z
D(z)
solution
x[k]
tend vers
si
x[k]
lorsque
x0 ,
la
s'il existe
est stable
reste born.
x[k + 1] =
de A soient
Ax[k]
Thorme 42
(Critre de Jury,[16])
a1 z n1 + ... + an
avec
a0 > 0.
Ligne 1
Ligne 2
Ligne 3
Ligne 4
Ligne 5
Soit un polynme
On forme le tableau
a0 a1 ... ... an
a
n an1 ... ... a0
b0 b1 ... bn1 0
= Ligne 1 aan0 Ligne 2
bn1 bn2 ... b0 0
c0 c1 ... cn2 0 0
= Ligne 3 bn1
Ligne 4
b0
Ligne 6
..
.
Ligne
2n+1
...
w0
0 ... 0
P (z) = a0 z n +
240
ANNEXE D.
P (z)
soient
(a0 , b0 , ..., w0 )
(D.12)
de dimension
cas o
est
0)
Dnition 27
Le systme en temps
x0 , il existe
discret (D.12) est dit commandable, si quel que soit l'tat initial
une squence de commande
0.
Dnition 28
en
au bout de
et le point atteint
x[k]
itrations.
x[n] = An x[0] + [B, AB, ..., An1 B] [u[n 1], ..., u[0]]T
= An x[0] + C [u[n 1], ..., u[0]]T
o
(D.13)
(A, B) dj rencontre la
Proposition 10
x[k + 1] = Ax[k] +
itrations le systme de
x[0]
xf .
D.5.
241
ncessaire. Ainsi
plein.
n 0
La condition ncessaire de commandabilit est que A x doit appartenir
n1
l'espace engendr par les vecteur B, AB, ..., A
B qui est l'espace accessible
la commande. Si
nn
et
n. Comme dans le cas continu, il est possible lorsque le systme est commandable, de choisir le polynme caractristique det(zI A + BK) de A BK
en le choisissant gal un polynme P (z) librement choisi (de premier terme
n
normalis z ). Ceci est ralis en choisissant le gain K d'aprs la formule
d'Ackermann (qui sert galement dans le cas continu)
A BK
en au plus
itrations.
A BK
P (z) =
nilpotente est
1
K = [0, ..., 0, 1] C 1 An = [0, ..., 0, 1] An B, ..., A1 B
aprs simplication.
242
ANNEXE D.
xf = Axf + Buf
En utilisant le contrleur
u = K(x xf ) + uf
(D.14)
(x[k + 1] xf ) = (A BK)(x[k] xf )
La matrice (A BK) tant nilpotente, grce au choix de K , on atteint donc
xf en au plus n intrations, quelle que soit la condition initiale. Ceci tablit
le rsultat suivant.
Soit
xf
uf
u=
D.5.
243
JN = x [N ]Sf x[N ] +
N
1
X
x [i]Rx[i] +
N
1
X
i=1
avec
N > 0, Sf
et
uT [i]Qu[i]
i=0
matrice symtrique
k[i 1] = B T S[i]A,
K[i] = Q + B T S[i]B
S[i 1] = AT S[i]A + R k[i 1]T K[i]1 k[i 1],
S[N ] = Sf
et le cot optimal associ est
i = N, ..., 0
(x0 )T S[0]x0 .
et sa condition initiale
x0 .
J=
+
X
xT [i]Rx[i] +
i=1
avec
N > 0, Pf
et
+
X
uT [i]Qu[i]
i=0
matrice symtrique
de
0 = S A SA + A SB(B SB + Q) B T SA R
244
ANNEXE D.
y de l'tat x
Dnition 29
n n, B
dimension p n.
dimension
de
univoque l'tat
commandes
Dnition 30
k,
(D.15)
futures
et les
Le systme en temps
k , on peut dterminer de
x[k] d'aprs les mesures passes y[k n + 1], ..., y[k]
u[k n + 1], ..., u[k 1] passes.
quelconque.
y[k] = Cx[k]
y[k + 1] = C(Ax[k] + Bu[k])
y[k + 2] = C(A2 x[k] + ABu[k] + Bu[k + 1])
.
.
.
D.6.
245
0
CB
CAB
y[k]
.
.
=
Ox[k]
+
y[k + n 1]
.
.
.
n2
CA
o
... ...
0 ...
CB
..
0
0
0
u[k]
.
.
u[k + n 2]
CB
(A, C)
dj rencontre dans
avec
Proposition 15
Soit un systme
une estimation
et
xr [k]
l'tat
246
ANNEXE D.
(
Initialisation
(
Propagation
x[k]
est simplement
xr [k].
(D.16)
xp [k + 1] = A
xr [k] + Bu[k]
p [k + 1] = Ar [k]AT + DM DT
1
T
T
C
[k
+
1]C
+
M
K
=
[k
+
1]C
xr [k + 1] = xp [k + 1] + K(y[k + 1] C xp [k + 1])
Recalage
1
r [k + 1] = p [k + 1]1 + C T M1 C
(D.17)
(D.18)
Ces formules sont celles usuellement considres (voir [69]) Avantageusement, on pourra remplacer la dernire formule dans l'quation de recalage
par l'une ou l'autre des deux quations suivantes (formule de Joseph [14, 23])
obtenue par la formule de Sherman-Morrison-Woodbury applique l'inverse
1
de la matrice p [k + 1]
+ C T M1 C
r [k + 1] = p [k + 1] p [k + 1]C T Cp [k + 1]C T + M
1
Cp [k + 1]
p [k + 1]
r [k + 1]
l'est.
Bibliographie
248
BIBLIOGRAPHIE
[13] A. E. Bryson and Y. C. Ho. Applied Optimal Control. Ginn and Company, 1969.
[14] R. S. Bucy and P. D. Joseph.
Hermann,
1961.
[16] C.-T. Chen. Signals and Systems. Oxford University Press, 2004.
[17] K. L. Chien, J. A. Hrones, and J. B. Reswick. On the automatic control
of generalized passive systems. Transactions ASME, 74 :175185, 1952.
[18] G. H. Cohen and G. A. Coon.
Verlag, 1995.
[20] R. Dautray and J.-L. Lions. Analyse mathmatique et calcul numrique
2000.
[22] V. Ditkin and A. P. Prudnikov. Formulaire pour le calcul oprationnel.
Masson et Cie., 1967.
[23] P. Faurre. Navigation inertielle et ltrage stochastique. Mthodes mathmatiques de l'informatique. Dunod, 1971.
[24] F.R. Gantmacher. Thorie des Matrices : tome 1. Dunod, Paris, 1966.
[25] F.R. Gantmacher. Thorie des Matrices : tome 2. Dunod, Paris, 1966.
[26] C. Gasquet and P. Witomski. Analyse de Fourier et applications. Masson, 1990.
[27] J.P. Gauthier and I. Kupka.
Her-
249
BIBLIOGRAPHIE
[32] S.
Haroche.
priences,
Contrle
2004.
de
Notes
la
de
dcohrence
cours,
thorie
Collge
de
et
ex-
France.
http ://www.lkb.ens.fr/recherche/qedcav/college/college.html.
[33] P. Hartman. Ordinary Dierential Equations. Birkuser, Boston, 1982.
[34] M.W. Hirsch and S. Smale. Dierential Equations, Dynamical Systems
Presses Polytechniques et
250
BIBLIOGRAPHIE
[52] F. Maisonneuve.
Calcul intgral.
Martin,
equivalence
R.
and
Murray,
trajectory
and
P.
Rouchon.
generation,
2003.
Flat
systems,
Technical
Report
http://www.cds.caltech.edu/reports/.
[56] D. Q. Mayne, J. B. Rawlings, C. V. Rao, and P. O. M. Scokaert.
Constrained model predictive control : stability and optimality.
Au-
Constructive nonlinear
Chemical
BIBLIOGRAPHIE
251
Available from
www.driedger.ca.
[75] J. G. Ziegler and N. B. Nichols. Process lags in automatic-control circuits. Transp. A.S.M.E., Vol. 65 :pp. 433444, 1943.
252
BIBLIOGRAPHIE
Index
anti-windup, 55, 58
approximation adiabatique, 46
approximation quasi-statique, 46
143, 145
approximation sculaire, 46
atome trois niveaux, 124
attracteur, 33
backstepping, 170
contrleur P, 100
bouclage dynamique, 61
contraction, 202
boucle ferme, 61
boucle ouverte, 61
centre, 23
230
19
CNS de stabilit d'un systme linaire
stationnaire, 21
col, 23
critre de Bendixon, 40
critre de Routh, 26
critre du revers, 98
commande, 7
253
254
INDEX
fonctions mromorphes, 94
forme d'tat, 61
forme canonique d'un systme linaire,
24, 25
quation de sortie, 8
forme de Jordan, 19
tat, 7
tat, 60
Whittaker, 232
formule de Sherman-Morrison-Woodbury,
246
foyer instable, 23, 42
exponentielle de matrice, 18
exposants caractristiques, 38
facteur d'amortissement, 74
gain d'anti-emballement, 63
gain intgral, 57
identication, 176
indices de commandabilit, 135, 136
intgrale premire, 129, 131, 132, 134
intgrale premire triviale, 131
invariance de LaSalle, 33, 219
invariant chimique, 130
fonction de transfert, 80
162, 163
255
INDEX
perturbation, 61
perturbations singulires, 46
phnomne d'aliasing, 231
pic de rsonance, 84
placement de ples en temps discret,
241
placement de ples, 120, 142, 157, 186
placement de ples pour l'observateur,
177
plan de phases, 22, 64
planication de trajectoire en temps
discret, 242
planication de trajectoires, 119122,
128, 129, 142, 153, 156
point d'quilibre, 9
point d'quilibre asymptotiquement stable, 79
point d'quilibre globalement asymptotiquement stable, 16, 19, 34,
217
point d'quilibre hyperbolique, 30, 42,
52, 222, 224
point d'quilibre instable, 15
point d'quilibre localement asymptotiquement stable, 15, 31
point d'quilibre stable (au sens de
Lyapounov), 15
observable, 156
observateur, 8, 182
186
observateur rduit de Luenberger, 187
observateur-contrleur, 175, 187, 188
orbite htrocline, 39
orbite homocline, 39
point stationnaire, 9
orbite priodique, 41
ple, 82
oscillateur harmonique, 16
ple instable, 95
oscillateurs, 120
256
INDEX
retour de sortie, 8
polynme Hurwitz, 25
rtro-action, 8
robuste, 37
principe de superposition, 9
ngliges, 52
robustesse paramtrique, 36, 53
schma blocs, 90
pulsation de coupure, 74
priode d'chantillonnage, 57
sortie, 8
sortie de Brunovsky, 119, 136, 139
quasi-polynmes, 110
stabilit Entre-Borne-Sortie-Borne,
86
142
systme nominal, 79
systme autonome, 39
systme instationnaire, 9
systme libre, 9
gbrique, 161
rsonance, 84
systme perturb, 79
systme plan, 38
257
INDEX
z,
237