Poly Auto 2011

Automatique
Dynamique et contrle des systmes

Nicolas Petit
Pierre Rouchon
MINES ParisTech
CAS - Centre Automatique et Systmes
Unit Mathmatiques et Systmes
Fvrier 2011
Avant propos : un bref rappel de l'histoire de l'Automatique
Les
mcanismes de rgulation et d'adaptation, largement rpandus dans la nature, sont aussi la base du fonctionnement des systmes crs et utiliss
par l'homme. Depuis trs longtemps, on les retrouve dans diverses machines
et inventions. Avec la rvolution industrielle et le rgulateur de Watt, on a
vu apparatre les premires formalisations modernes : modlisation (avec les
quations direntielles inventes par Newton) et stabilit. Le point de dpart de la thorie mathmatique des systmes remonte ainsi aux travaux du
mathmaticien et astronome anglais G. Airy. Il fut le premier tenter une
analyse du rgulateur de Watt. Ce n'est qu'en 1868, que le physicien cossais J. C. Maxwell publia une premire analyse mathmatique convaincante
et expliqua certains comportements erratiques observs parmi les nombreux
rgulateurs en service cet poque. Ses travaux furent le point de dpart de
nombreux autres sur la stabilit, notion marque par le travail de H. Poincar
et A. M. Lyapounov, sa caractrisation ayant t obtenue indpendamment
par les mathmaticiens A. Hurwitz et E. J. Routh. Durant les annes 1930,
les recherches aux Bell Telephone Laboratories sur les amplicateurs ont
t l'origine de notions encore enseignes aujourd'hui. Citons par exemple
les travaux de Nyquist et de Bode caractrisant partir de la rponse frquentielle en boucle ouverte celle de la boucle ferme.
Tous ces dveloppements ont vu le jour dans le cadre des systmes linaires ayant une seule commande et une seule sortie. On disposait d'une
mesure sous la forme d'un signal lectrique. Cette dernire tait alors entre dans un amplicateur qui restituait en sortie un autre signal lectrique
qu'on utilisait comme signal de contrle. Ce n'est qu'aprs les annes 1950
que les dveloppements thoriques et technologiques (avec l'invention des calculateurs numriques) permirent le traitement des systmes multi-variables
linaires et non linaires ayant plusieurs entres et plusieurs sorties. Citons
comme contributions importantes dans les annes 1960 celles de R. Bellmann
avec la programmation dynamique, celles de R. Kalman avec la commandabilit, le ltrage et la commande linaire quadratique ; celles de L. Pontryagin
avec la commande optimale. Ces contributions continuent encore aujourd'hui
alimenter les recherches en thorie des systmes. Le champ d'application
s'est considrablement tendu. Alors qu'aujourd'hui l'Automatique est omniprsente dans les domaines industriels tels que l'aronautique, l'arospatiale,
l'automobile, ou le gnie des procds, certaines recherches actuelles s'appuyant sur des notions cls prsentes dans ce cours concernent la construction d'un premier calculateur quantique.
Objectif de ce cours
Le but est de prsenter les notions et outils fon-
damentaux ncessaires l'analyse et au contrle des systmes. Ce cours est

articul autour des trois thmes suivants :
Systmes dynamiques : stabilit, robustesse, thorie de perturbations.
Commandabilit : stabilisation par bouclage, planication et suivi de
trajectoire.
Observabilit : estimation, observateur asymptotique, ltrage et diagnostic.
Le cours part de quelques exemples issus du monde industriel ou acadmique. Chaque exemple motive et justie les dnitions et rsultats abstraits
sur lesquels reposent une classe d'algorithmes de contrle et/ou d'estimation.
Dans bien des domaines scientiques, une thorie a trs souvent pour origine
une petite collection d'exemples reprsentatifs bien compris et analyss. Nous
nous inscrivons dans cette dmarche. Une approche qui part du particulier
pour aller vers le gnral permet aussi de mieux comprendre les ressorts fondamentaux sur lesquels reposent certains rsultats mais aussi de bien cerner
leur limitations. L'Automatique est un domaine actif de recherche scientique. Le cours abordera certaines questions qui n'admettent pas de rponse
claire aujourd'hui bien qu'elles aient de fortes motivations pratiques.
Note de cette dition
Nous vous serions reconnaissants de nous faire part
de vos critiques et des erreurs que vous auriez dcouvertes par un message
explicatif
nicolas.petit@mines-paristech.fr ou
pierre.rouchon@mines-paristech.fr
en identiant votre message par Poly Mines corrections.
Nicolas Petit et Pierre Rouchon

Fvrier 2011
Table des matires
1 Systmes dynamiques et rgulateurs

1.1
1.2
Systmes dynamiques non linaires
7
. . . . . . . . . . . . . . .
Existence et unicit des solutions
. . . . . . . . . . . .
11
1.1.2
Sensibilit et premire variation . . . . . . . . . . . . .
14
1.1.3
Stabilit locale autour d'un quilibre
. . . . . . . . . .
15
Systmes dynamiques linaires . . . . . . . . . . . . . . . . . .
18
1.2.1
L'exponentielle d'une matrice
18
1.2.2
Forme de Jordan et calcul de l'exponentielle
1.2.3
Portraits de phases des systmes linaires . . . . . . . .
22
1.2.4
Polynme caractristique . . . . . . . . . . . . . . . . .
24
1.2.5
Systmes linaires instationnaires
27
1.2.6
Complments : matrices symtriques et quation de
. . . . . . . . . . . . . .
. . . . . .
. . . . . . . . . . . .
Lyapounov . . . . . . . . . . . . . . . . . . . . . . . . .
1.3
1.4
1.5
1.1.1
Stabilit des systmes non linaires
19
28
. . . . . . . . . . . . . . .
29
1.3.1
tude au premier ordre . . . . . . . . . . . . . . . . . .
29
1.3.2
Fonctions de Lyapounov
. . . . . . . . . . . . . . . . .
31
1.3.3
Robustesse paramtrique . . . . . . . . . . . . . . . . .
36
1.3.4
Complments : caractre intrinsque des valeurs propres

du systme linaris tangent . . . . . . . . . . . . . . .
37
1.3.5
Complments : les systmes dynamiques dans le plan
38
. . . . . . . . . . . . . .
45
1.4.1
Perturbations singulires . . . . . . . . . . . . . . . . .
46
1.4.2
Feedback sur un systme deux chelles de temps . . .
51
1.4.3
Modle de contrle et modle de simulation
. . . . . .
52
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
55
Systmes multi-chelles lents/rapides
Cas d'tude
1.5.1
Prsentation du systme
1.5.2
Un rgulateur PI
. . . . . . . . . . . . . . . . .
55
. . . . . . . . . . . . . . . . . . . . .
56
1.5.3
Une modlisation simplie
1.5.4
Passage en temps continu
1.5.5
. . . . . . . . . . . . . . .
58
. . . . . . . . . . . . . . . .
59
Simulations en boucle ouverte et en boucle ferme . . .
60
TABLE DES MATIRES
1.5.6
Un rsultat gnral : rgulateur PI sur un systme non

linaire du premier ordre . . . . . . . . . . . . . . . . .
1.5.7
Dynamiques ngliges : rle du contrle dans l'approximation . . . . . . . . . . . . . . . . . . . . . . . . . . .
68
1.5.8
Intrt de la pr-compensation (feedforward) . . . . . .
70
1.5.9
Pr-compensation et suivi de trajectoires sur un systme linaire du premier ordre . . . . . . . . . . . . . .
1.6
Cas d'tude
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 Fonctions de transfert
2.1
2.2
2.3
2.4
74
79
Passage la fonction de transfert
. . . . . . . . . . . . . . . .
80
Questions de robustesse
. . . . . . . . . . . . . . . . .
80
2.1.2
Principe des calculs . . . . . . . . . . . . . . . . . . . .
81
2.1.3
Rgime asymptotique forc . . . . . . . . . . . . . . . .
83
2.1.4
Simplications ples-zros
. . . . . . . . . . . . . . . .
84
2.1.5
Formalisme
. . . . . . . . . . . . . . . . . . . . . . . .
85
2.1.6
Du transfert vers l'tat : ralisation . . . . . . . . . . .
87
Schmas blocs et fonctions de transfert
. . . . . . . . . . . . .
90
2.2.1
De la forme d'tat vers le transfert
. . . . . . . . . . .
90
2.2.2
Transfert avec perturbation et bouclage . . . . . . . . .
92
Marge de robustesse
. . . . . . . . . . . . . . . . . . . . . . .
Critre de Nyquist
2.3.2
Marge de phase . . . . . . . . . . . . . . . . . . . . . . 102
2.3.3
Marge de gain . . . . . . . . . . . . . . . . . . . . . . . 105
2.3.4
Lecture des marges sur le diagramme de Bode . . . . . 106
2.3.5
Ples dominants . . . . . . . . . . . . . . . . . . . . . . 107
Complments
. . . . . . . . . . . . . . . . . . . .
94
2.3.1
94
. . . . . . . . . . . . . . . . . . . . . . . . . . . 108
Calcul de tous les contrleurs PID stabilisant un systme du premier ordre retard
. . . . . . . . . . . . . 108
2.4.2
Mthodes de rglage de Ziegler-Nichols . . . . . . . . . 111
2.4.3
Prdicteur de Smith
2.4.4
Systmes non minimum de phase
. . . . . . . . . . . . . . . . . . . 114
. . . . . . . . . . . 116
3 Commandabilit, stabilisation
3.2
72
2.1.1
2.4.1
3.1
63
119
Un exemple de planication et de suivi de trajectoires . . . . . 120

3.1.1
Modlisation de deux oscillateurs en parallle
3.1.2
Planication de trajectoires
. . . . . 120
3.1.3
Stabilisation et suivi de trajectoires . . . . . . . . . . . 122
3.1.4
Autres exemples . . . . . . . . . . . . . . . . . . . . . . 124
. . . . . . . . . . . . . . . 121
Commandabilit non linaire . . . . . . . . . . . . . . . . . . . 128
TABLE DES MATIRES
3.2.1
Exemple de non commandabilit par la prsence d'intgrale premire . . . . . . . . . . . . . . . . . . . . . . 129
3.3
3.4
3.5
Commandabilit linaire
. . . . . . . . . . . . . . . . . . . . . 131
3.3.1
Matrice de commandabilit et intgrales premires . . . 132
3.3.2
Invariance . . . . . . . . . . . . . . . . . . . . . . . . . 134
3.3.3
Critre de Kalman et forme de Brunovsky
3.3.4
Planication et suivi de trajectoires . . . . . . . . . . . 141
. . . . . . . 135
Commande linaire quadratique LQR . . . . . . . . . . . . . . 143

3.4.1
Multiplicateurs de Lagrange en dimension innie . . . . 146
3.4.2
Problme aux deux bouts dans le cas linaire quadratique151
3.4.3
Planication de trajectoires
3.4.4
Rgulateur LQR
Complments
. . . . . . . . . . . . . . . 153
. . . . . . . . . . . . . . . . . . . . . 155
. . . . . . . . . . . . . . . . . . . . . . . . . . . 163
3.5.1
Linarisation par bouclage . . . . . . . . . . . . . . . . 163
3.5.2
Stabilisation par mthode de Lyapounov et backstepping170
4 Observabilit, estimation et adaptation

4.1
4.2
4.3
4.4
4.5
4.6
Un exemple
173
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
4.1.1
Un modle simple de moteur courant continu
4.1.2
Estimation de la vitesse et de la charge . . . . . . . . . 175
4.1.3
Prise en compte des chelles de temps . . . . . . . . . . 177
4.1.4
Contraintes sur les courants
Observabilit non linaire
. . . . 175
. . . . . . . . . . . . . . . 178
. . . . . . . . . . . . . . . . . . . . 179
4.2.1
Dnition
. . . . . . . . . . . . . . . . . . . . . . . . . 179
4.2.2
Critre . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
4.2.3
Observateur, estimation, moindres carrs . . . . . . . . 182
Observabilit linaire . . . . . . . . . . . . . . . . . . . . . . . 184

4.3.1
Le critre de Kalman . . . . . . . . . . . . . . . . . . . 184
4.3.2
Observateurs asymptotiques . . . . . . . . . . . . . . . 186
4.3.3
Observateurs rduits de Luenberger . . . . . . . . . . . 187
Observateur-contrleur . . . . . . . . . . . . . . . . . . . . . . 187
4.4.1
Version tat multi-entre multi-sortie (MIMO)
4.4.2
Version transfert mono-entre mono-sortie (SISO)
Filtre de Kalman
Formalisme
4.5.2
Hypothses et dnition du ltre
4.6.1
. . 189
. . . . . . . . . . . . . . . . . . . . . . . . . 190
4.5.1
Complments
. . . . 187
. . . . . . . . . . . . . . . . . . . . . . . . 191
. . . . . . . . . . . . 192
. . . . . . . . . . . . . . . . . . . . . . . . . . . 199
Estimation de paramtres et commande adaptative
1. MIMO : pour Multi-Input Multi-Output

2. SISO : pour Single-Input Single-Output
. . 199
TABLE DES MATIRES
4.6.2
Linarisation par injection de sortie . . . . . . . . . . . 201
4.6.3
Contraction
. . . . . . . . . . . . . . . . . . . . . . . . 202
A Sur le thorme de Cauchy-Lipchitz
207
B Autour des fonctions de Lyapounov
215
C Moyennisation
221
C.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
C.2
Le rsultat de base
C.3
Un exemple classique . . . . . . . . . . . . . . . . . . . . . . . 224
C.4
Recherche d'extremum (extremum seeking) . . . . . . . . . . . 225
C.5
Boucle verrouillage de phase PLL . . . . . . . . . . . . . . . 226
. . . . . . . . . . . . . . . . . . . . . . . . 222
D Automatique en temps discret
229
D.1
Thorme d'chantillonnage de Shannon
D.2
Systmes dynamiques en temps discret
D.3
. . . . . . . . . . . . 231
. . . . . . . . . . . . . 234
Reprsentations externes et internes des systmes linaires
. . 236
D.3.1
Transforme en
. . . . . . . . . . . . . . . . . . . . . 237
D.3.2
Ralisation canonique d'une fonction de transfert discrte238
D.4
Stabilit des systmes linaires stationnaires
D.5
Commandabilit linaire en temps discret . . . . . . . . . . . . 240

D.5.1
Placement de ples . . . . . . . . . . . . . . . . . . . . 241
D.5.2
Rendre une matrice nilpotente par feedback
D.5.3
Synthse d'une commande pour aller en temps ni
D.5.4
Commande linaire quadratique LQR en temps discret
un point d'quilibre arbitraire

D.6
. . . . . . . . . . 239
. . . . . . 241
. . . . . . . . . . . . . . 242
242
Observabilit linaire, estimation et ltrage . . . . . . . . . . . 244

D.6.1
Filtre de Kalman en temps discret . . . . . . . . . . . . 245
Rfrences
246
Index
253
Chapitre 1
Systmes dynamiques et
rgulateurs
1.1 Systmes dynamiques non linaires

Nous nous intressons des systmes dynamiques reprsents par un
nombre ni d'quations direntielles du premier ordre couples entre elles
que nous crivons
d
x1 = v1 (x1 , ..., xn , u1 , ..., um , t)
dt
d
x2 = v2 (x1 , ..., xn , u1 , ..., um , t)
dt
.
.
.
o
les
d
xn = vn (x1 , ..., xn , u1 , ..., um , t)
dt
les grandeurs x1 ,...,xn sont appeles tats, les grandeurs u1 ,...,um sont
entres (ou commandes), et n et m sont des entiers. Le temps t est ici
considr de manire gnrale dans le second membre des quations. Les

fonctions
(vi )i=1,...,n
sont valeur relle. En toute gnralit, leur rgularit
peut tre trs faible, mme si, comme on le verra par la suite, de nombreuses
proprits fondamentales proviennent justement de leur rgularit.
Il est commode d'crire le systme direntiel prcdent sous la forme
vectorielle (appele forme d'tat)
d
x = v(x, u, t)
dt
(1.1)
Pour calculer l'volution future d'un tel systme, il faut connatre les grandeurs
t 7 u(t)
ainsi que la condition initiale de l'tat. On dit que l'tat
CHAPITRE 1.
SYSTMES DYNAMIQUES ET RGULATEURS
du systme reprsente sa mmoire. tant donne l'volution du systme, on

s'intresse souvent un certain nombre de grandeurs (par exemple car elles
ont un intrt pratique) qu'on nomme sorties ou mesures. Les quations de
sorties que nous considrons sont de la forme
y = h(x, u, t) Rq
o
est un entier souvent infrieur
(1.2)
n 1.
Le formalisme (1.1) (1.2) que nous venons de prsenter est trs gnral.
On trouve un vaste choix d'exemples dans les domaines de la mcanique
(les quations d'Euler-Lagrange, voir [44] par exemple, exprimant le principe de moindre action sont des quations d'ordre 2 dans les variables de
congurations (positions gnralises), l'tat est alors constitu des positions
gnralises et leur vitesses), les machines lectriques (voir [46]), l'aronautique (voir l'Exemple 1), la robotique (voir [58]), la chimie, la biochimie, les
sciences du vivant (voir
[37]) .
Ce que nous cherchons faire dans le domaine de l'Automatique ce n'est

pas simplement tudier les proprits des systmes d'quations direntielles,
mais les contrler. Dans l'quation (1.1), on peut agir sur l'tat
sissant
u.
L'outil principal de l'Automaticien c'est la rtro-action
x en choiu = k(t, x)
aussi appele feedback. En spciant de la sorte la commande, on change

compltement le comportement du systme dynamique (1.1) qui devient
d
x = v(x, k(t, x), t)
dt
En pratique, on sera souvent limit l'utilisation de la mesure dnie en (1.2).
Dans ce contexte, les rtro-actions envisageables sont de la forme
u = k(t, y).
On parle alors de retour de sortie. C'est un problme dicile pour lequel

nous montrerons, au Chapitre 4 qu'il est en fait utile d'utiliser un systme
dynamique supplmentaire (on parlera d'observateur) qui permettra de bien
plus intressantes possibilits.
1. Bien souvent seules certaines composantes sont mesures pour des raisons technologiques, il existe des exceptions notables comme dans les applications de fusion de capteurs
(voir le Chapitre 4) o on dispose de mesures redondantes de certaines composantes de
l'tat
x.
2. Pourtant, on pourra remarquer que certains domaines chappent ce formalisme.

On peut citer quelques exemples tels que l'tude de la turbulence dans les coulements, les
phnomnes thermiques dans les chambres de combustion, ou les ondes de propagation.
L'tude des systmes de dimension innie est traite dans de nombreux ouvrages sur les
quations direntielles partielles [19] aussi appels systmes paramtres distribus. Ils
sont en grande partie absent de ce cours.
1.1.
SYSTMES DYNAMIQUES NON LINAIRES
Que ce soit parce qu'on a choisi une loi de rtroaction particulire ou parce
que le systme considr ne possde pas de commande, il est important de
comprendre comment tudier les systmes libres de la forme
d
x = v(x, t)
dt
(1.3)
On dira qu'un tel systme est stationnaire (par opposition au cas (1.3) ins-
tationnaire) lorsque
ne dpend pas explicitement du temps. Dans ce cas
l'quation s'crit
d
x = v(x)
dt
Un des concepts cls dans l'tude des systmes dynamiques est la notion
de point d'quilibre (appel galement point stationnaire )
x. On appelle point
x tel que, si le systme direntiel (1.3) est initialis en ce

x(0) = x, alors le systme reste en x pour tous les temps futurs.
d'quilibre, un point
point, c.--d.
Dans le cas d'un systme stationnaire, les points d'quilibre sont simplement
caractriss par l'quation
v(
x) = 0.
Autour d'un point d'quilibre il est tentant de chercher une expression

approche des quations dynamiques (1.3) qu'on souhaite tudier. En gnral, lorsque le systme est instationnaire, on obtiendra un systme linaire
instationnaire (appel linaris tangent) de la forme
d
x = A(t)x + B(t)u
dt
y = C(t)x + D(t)u
(1.4)
(1.5)
Comme nous le verrons (notamment la Section 1.3), cette approche est intressante car elle fournit souvent une information locale sur le comportement
de (1.3) autour de
x.
Nanmoins, cette information est parfois insusante,
surtout lorsqu'on recherche des informations sur le comportement du systme

loin de l'quilibre. En outre, les systmes linaires et les systmes non linaires
sont en fait trs dirents par nature. Soumis une superposition d'excitations (par une somme de termes dans la commande), les systmes linaires
rpondent d'aprs le principe de superposition : leur sortie est la somme des
sorties correspondant chacun des termes d'excitation. Ce principe, qui ne
s'applique pas aux systmes non linaires, est la base de l'analyse de Fourier des signaux. Il existe de nombreux phnomnes qu'on ne constate que
chez les systmes rgis par des quations non linaires (on pourra se rfrer
3. On notera l'intrt d'un formalisme du premier ordre. Si on considre l'quation
d2
d
d
T
x, dt
x) = (0, 0)
dt2 x = 2x, dont l'tat est (x, dt x) , les points d'quilibre sont donns par (
et pas uniquement par l'quation 2
x = 0.
10
CHAPITRE 1.
[40] pour une discussion plus dtaille). Les systmes non linaires peuvent
diverger en temps ni alors que c'est seulement en temps inni qu'un systme
linaire peut diverger (c.--d. que son tat tend vers l'inni). Un systme non
linaire peut avoir de multiples points d'quilibre isols. L'unicit des points
d'quilibre n'est pas non plus garantie dans le cas des systmes linaires, mais
elle apparat sous la forme de sous espaces vectoriels de points d'quilibre.
Enn, et c'est un des faits les plus marquants, un systme non linaire peut
possder un ou plusieurs cycles limites. C'est une des particularit les plus
importantes et aussi l'une des plus frquemment observes en pratique. Alors
que les systmes linaires peuvent avoir des trajectoires oscillantes, l'amplitude de celles-ci dpendent de la condition initiale. Dans le cas non linaire il
est possible d'observer des trajectoires oscillantes dont l'amplitude ne dpend pas de la condition initiale. C'est en exploitant cette proprit qu'on
a construit les premiers circuits lectriques oscillants qui sont la base de
l'lectronique (et de la synthse sonore notamment). titre d'illustration,
on pourra se reporter l'onde de densit observe dans les puits de ptrole
prsents dans l'Exemple 10.
Exemple 1 (Missile dans le plan).
En grande partie cause des eets aro-
dynamiques, les quations qui rgissent le mouvement d'un missile ou d'une

fuse sont non linaires. Aprs rduction un plan, les quations de la dynamique d'un missile s'expriment au moyen de 6 tats. Les variables
ym
xm
et
Vm est sa
m , m et m correspondent des angles, et on utilise deux variables
intermdiaires A et T pour exprimer les seconds membres de la dynamique
correspondent aux coordonnes du centre de gravit de l'engin,
vitesse,
(voir la Figure 1.1).
x m = Vm cos m
y m = Vm sin m

1
1
T cos T SVm CD (T )
Vm =
m
2
o sin T =
1
2
2
1 + tan m + tan m
g
m = tan A
Vm
tan
o 1 + tan A =
tan m
m = 0.3(c m )
m = 0.3(c m )
Les deux commandes sont
c , c ,
tandis que
m(t)
et
T (t)
(1.6)
sont des fonctions
1.1.
11
donnes du temps (variation de la masse et de la pousse),

constantes et
CD (.)
et
sont des
est le coecient de trane. Ce modle prend en compte
les eets arodynamiques dus aux angles d'attaque du corps du missile, la

perte de masse au cours du vol (qui est loin d'tre ngligeable), et les dynamiques des actionneurs ( travers des vrins).
Figure 1.1 Variables dcrivant un missile.
1.1.1 Existence et unicit des solutions

L'outil de base de la modlisation mathmatique d'un modle physique
est le problme de Cauchy . Il consiste en une condition initiale et une quation
direntielle
x(0) = x0 ,
d
x(t) = v(x(t), t)
dt
(1.7)
Face ce problme, on est en droit d'esprer que les proprits suivantes sont
satisfaites
1. qu'une solution avec ces conditions initiales existe
2. que cette solution soit unique
3. que les solutions dpendent continment des conditions initiales
On trouvera une dmonstration lmentaire du thorme de Cauchy-Lipschitz
( partir du schma d'Euler explicite et de la notion de solution approchante)
dans l'Annexe A. Ce thorme dont une version un peu plus gnrale est
donne ci-dessous garantie l'existence et l'unicit pour des temps courts. En
12
CHAPITRE 1.
revanche l'existence pour des temps
arbitrairement grands est nettement
plus dlicate. On peut la garantir sous des hypothses fortes (voir Lemme 1).
Enn, la continuit de la solution par rapport sa condition initiale peut tre
garantie, mais sous une hypothse plus forte. C'est l'objet du Thorme 2.
Thorme 1 (Cauchy-Lipschitz. Existence et unicit).

n
(x, t) 7 v(x, t) R
Rn R
une fonction satisfaisant aux deux proprits suivantes :
1. (localement lipchitzienne par rapport
x)
pour tout
x,t > 0 et Kx,t > 0, tels que, pour tout

kx yk x,t on a kv(x, t) v(y, t)k Kx,t kx yk
il existe
2. (localement intgrable par rapport
t 7 v(x, t)
Soit
t)
pour tout
(x, t) Rn R,
y Rn vriant
x Rn ,
l'application
est localement intgrable .
On considre le problme de Cauchy,
x(0) = x0 ,
d
x(t) = v(x(t), t),
dt
Ce problme possde les proprits suivantes

0
n
1. existence locale en temps : pour toute condition initiale x R , il
n
existe > 0 et une fonction ] , [3 t 7 x(t) R drivable par
rapport
et solution du problme de Cauchy.
x0 Rn et pour
] a, b[3 t 7 x(t) Rn
2. unicit globale en temps : pour toute condition initiale

tout
a, b > 0
il existe au plus une fonction
drivable par rapport
et solution du problme de Cauchy.
Une dmonstration de ce thorme, reposant sur le thorme du point xe

de Picard dans un espace de Banach, gure dans [51, 34]. On peut vrier
grce aux exemples qui suivent que les hypothses du Thorme 1 de CauchyLipchitz sont eectivement ncessaires :
p
d
x = |x| admet deux solutions partant de x0 = 0 :
l'quation
dt
p
0 et x(t) = t2 /4 ; on remarque que |x| n'est pas Lipchitz en
bien qu'elle y soit continue. En dehors du point
0,
x(t) =
x=0
l'unique solution
de l'quation direntielle (voir [10, page 149])est x(0) = l , x(t) =
1
(t + 2 l)2 .
4
d
toute solution de
x = 1/t n'est pas dnie en t = 0 car 1/t n'est pas
dt
p
d
localement intgrable autour de 0 alors que
x = 1/ |t| admet des
dt
solutions parfaitement dnies en 0.
4. +
x, chacune de ses composantes est une fonction mesurable du temps dont
l'intgrale de la valeur absolue sur tout intervalle born est borne, voir [52].
1.1.
13
10
9
8
7
6
5
4
3
2
1
Figure
0.2
0.4
0.6
0.8
1
t
1.2
1.4
1.6
1.8
1.2 Dpendance de la solution d'une quation direntielle par
rapport sa condition initiale. Trois solutions d'une quation scalaire au

cours du temps. Elles ne peuvent se croiser en vertu de la proprit d'unicit.
Thorme 2 (Dpendance en la condition initiale).
Soit
Rn R (x, t) 7
v
continues par
v(x, t) Rn une fonction continue drives partielles x
i
0
n
rapport x. Soit x R une condition initiale, il existe une unique solution
t 7 x(t) telle que x(0) = x0 . Cette solution, considre comme une foncxi (x0 ,t)
0
tion de la condition initiale x , admet des direntielles partielles
x0
j
continues par rapport
x0
et
t.
Ce thorme est dmontr dans [36, page 29]. Il est illustr par la Figure 1.2 o on a reprsent trois solutions de la mme quation direntielle
1
scalaire ( second membre C ) obtenues en faisant varier la condition initiale. On remarque que les courbes ne se croisent pas (cela est interdit par la
proprit d'unicit). Elles semblent s'carter lorsque
L'existence pour tout temps
croit.
t>0
n'est pas une consquence du Thod

x = x2 vrie bien toutes ses hyporme 1 de Cauchy-Lipchitz. En eet,
dt
x0
0
thses, mais comme la solution qui part de x est x(t) =
, on voit que,
1tx0
0
0
pour x > 0, la solution explose en t = 1/x . La solution explose en temps
ni.
On peut donner une condition assez gnrale (mais relativement forte)
pour viter l'explosion en temps ni. C'est l'objet du lemme suivant.
Lemme 1 (existence globale en temps). En plus des hypothses du ThoM0 (t), M1 (t) > 0 fonctions localement inn
tgrables telles que pour tout x R , kv(x, t)k M0 (t) + M1 (t)kxk, alors la
solution (unique) au problme de Cauchy est dnie pour t ] , +[.
rme 1, si on suppose qu'il existe
14
CHAPITRE 1.
Noter que ce lemme ne dit pas que les trajectoires restent bornes. A
d
x = x : elles peuvent
priori, elles ne le sont pas comme le montre l'exemple
dt
tendre vers l'inni mais en temps inni.
1.1.2 Sensibilit et premire variation

Nous nous intressons la solution du systme
d
x(t) = f (x(t), u(t), p),
dt
C 1 de x, u et p (n, m, r N).
m
On suppose ici que la fonction R 3 t 7 u(t) R est continue par morceaux.
Ainsi, les hypothses du thorme 1 sont satisfaites et donc la solution t 7
x(t) existe pour t autour de 0 et est unique. On regarde sa dpendance des
petites variations de l'entre u, du paramtre p ou de sa condition initiale
x0 . Nous ne prsentons pas de faon rigoureuse les rsultats de drivabilit
0
de x par rapport u, p et x . Ils dcoulent du thorme 2 et du fait que
f est C 1 . Nous prsentons simplement la faon de calculer directement les
0
drives partielles de x par rapport aux composantes de x et p, ainsi que la
direntielle de x par rapport u.
o
x Rn , u Rm , p Rr , f
x(0) = x0
est une fonction
La mthode est lmentaire : il sut de direntier les quations. On

note l'opration de dierentiation. Ainsi les petites variations de u, p et
x0 , notes u, p et x0 , engendrent des petites variations de x, notes x.
0
r
n
Il faut bien comprendre que p et x sont des petits vecteurs de R et R
m
alors que u et x sont des petites fonctions du temps valeur dans R
et
n
R , respectivement. Ainsi x est solution de l'quation direntielle
d
(x)(t) =
dt
f
x

x +
f
u

u(t) +
f
p

p
t
f
0
avec comme condition initiale x(0) = x . Les matrices Jacobiennes
,
x
f
f
et
sont values le long de la trajectoire (x(t), u(t), p). C'est pourquoi
u
p

f
f
f
nous les notons
,
et
. Ainsi, x est solution d'une quation
x t
u t
p
t
direntielle ane coecients dpendant a priori du temps :
d
(x)(t) = A(t)x + b(t), x(0) = x0 ,
dt

f
f
A(t) = x t et b(t) = u t u(t) + f
p.
p
t
Supposons que l'on souhaite calculer la drive partielle de
pk ,
le
k -ime
paramtre scalaire (k
{1, . . . , r}).
On
x par rapport
n
note W (t) R
1.1.
15
cette drive partielle l'instant
t.
Le calcul ci-dessus nous dit que
est la
solution du systme ane dpendant du temps suivant :
d
W =
dt
f
x

W+
f
pk

t
avec comme condition initiale W (0) = 0. De mme, pour la drive par0

n
tielle par rapport xk note V (t) R , on doit rsoudre le systme linaire
dpendant du temps
d
V =
dt
f
x

V
t
V (0) = (j,k )1jn

j = k et 0 sinon.
avec comme condition initiale

Kronecker qui vaut
si
o ici
jk
est le symbole de
Noter qu'il n'est pas possible de dnir la drive partielle de

port
uk
avec un simple vecteur car
uk
est une fonction de
t.
par rap-
On parle alors
de direntielle partielle qui est, chaque instant, un oprateur linaire sur

des fonctions, une fonctionnelle linaire donc.
1.1.3 Stabilit locale autour d'un quilibre

La notion de stabilit s'attache formaliser l'intuition suivante : un point
d'quilibre sera dit stable si un petit dsquilibre initial n'entrane que de
petits carts pour tout temps postrieur ; en bref de petites causes n'ont que
de petites consquences.
Dnition 1 (Stabilit (au sens de Lyapounov) et instabilit). On reprend les notations et hypothses du Thorme 1 de Cauchy Lipchitz. On suppose de plus qu'il existe un point d'quilibre x
Rn caractris par v(
x, t) = 0
t R.
L'quilibre x
Rn est dit stable (au sens de Lyapounov) si et seulement
0
si pour tout > 0, il existe > 0 tel que pour toute condition initiale x
0
vriant kx x
k , la solution de dtd x = v(x, t) issue de x0 t = 0, est
dnie pour tout temps positif et vrie kx(t) x
k pour tout temps t 0.
pour tout
S'il n'est pas stable, il est dit instable.
Dnition 2 (Stabilit asymptotique).

tion 1, l'quilibre
Avec les notations de la Dni-
est dit localement asymptotiquement stable si et seule-
ment s'il est stable et si, de plus, il existe > 0 tel que toutes les solud
0
tions x(t) de dt x = v(x, t), partant en t = 0 de conditions initiales x telles
0
que kx x
k , convergent vers x lorsque t tend vers +.
16
CHAPITRE 1.
Figure 1.3 Stabilit (gauche) et stabilit asymptotique (droite).

Ces notions de stabilit sont illustres sur la Figure 1.3. Lorsque
est
asymptotiquement stable, on dit souvent que le systme oublie sa condition

initiale. En eet, localement, quelle que soit la condition initiale, la trajectoire
converge vers
x.
Lorsque, dans la Dnition 2, la condition initiale peut tre
librement choisie, on dit que
Exemple 2
est globalement asymptotiquement stable .
(Oscillateur harmonique)
Un exemple d'quilibre stable mais
non asymptotiquement stable est celui de l'oscillateur harmonique non amorti

(le paramtre
>0
est la pulsation)
d
x2 = 2 x1
dt
(1.8)
d
x2 = 2 x1 2 x2
dt
(1.9)
d
x1 = x2 ,
dt
Le rajout d'un amortissement
d
x1 = x 2 ,
dt
rend alors l'quilibre
mension
> 0
(0, 0)
asymptotiquement stable. Le paramtre sans di-
est le facteur d'amortissement : pour
l'quilibre se fait sous la forme d'oscillations amorties ;
]0, 1[ le
pour 1,
retour
le retour
l'quilibre se fait quasiment sans oscillation, i.e., avec un trs petit nombre
de changements de signe pour
x1
et
x2 .
Comme on le verra en dtails dans
la Section 1.2 consacre aux systmes linaires, cela vient du fait bien connu
que les racines
du polynme caractristique
s2 + 2 s + 2 = 0
de l'quation du second ordre
d
d2
x1 + 2 x1 + 2 x1 = 0
2
dt
dt
1.1.
17
Figure
1.4 Deux congurations possibles d'un avion de combat. Noter
la dirence de position relative entre le centre de pousse (P) et le centre

de masse (M) entre les deux congurations. Le systme est stable dans la
conguration de droite, et instable dans la conguration de gauche.
> 1 et complexes conjugues avec une partie relle ngative si 0 < < 1. Noter enn
qu'aucun des quilibres du double intgrateur, (1.8) avec = 0, n'est stable.
qui correspond au systme (1.9), sont relles ngatives pour
Exemple 3
(Stabilit des avions)
La position relative du centre de masse
et du centre de pression arodynamique conditionnent la stabilit en boucle

ouverte des avions. Si l'engin est trop stable, il est dicile manoeuvrer. On
doit alors utiliser des surfaces de contrle (volets) trs tendues pour gnrer
les forces requises pour les manoeuvres. En rgime supersonique, le centre
de pression se dcale vers l'arrire de l'appareil. Lors de la conception d'un
appareil de combat, il est souvent prfr de prvoir un centre de pousse
l'avant du centre de pression lors du rgime subsonique, l'avion y est instable
en boucle ouverte (notamment pour le dcollage et l'atterrissage), alors qu'en
rgime supersonique il est stable car le centre de pression passe l'arrire.
On se reportera l'ouvrage [2] pour de trs nombreuses explications et dveloppements sur ce thme.
Du fait du caractre local de la Dnition 2, il est possible, sous certaines
conditions, de dduire la stabilit asymptotique des termes du dveloppement
limit l'ordre
1 des quations direntielles autour de l'quilibre (le systme
5
linaris tangent ) . Avant d'noncer un rsultat fondamental dans ce cadre
5. Ce calcul l'ordre
spectrale
est mme l'origine de la thorie des matrices et de l'analyse
18
CHAPITRE 1.
(Thorme 10) nous devons d'abord tudier les systmes linaires.
1.2 Systmes dynamiques linaires

Cette section ne comporte que le strict minimum sur les systmes linaires. Pour un expos complet, nous renvoyons [34]. Considrons le systme linaire
d
x(t) = Ax(t)
(1.10)
dt
n
avec x(t) R et A une matrice n n coecients constants. Une des principales spcicits des systmes linaires est que, par homothtie, les proprits locales sont galement globales. C'est en particulier vrai pour la stabilit
asymptotique qui peut s'tablir, comme nous le verrons au Thorme 4, en
tudiant les valeurs propres de
A.
1.2.1 L'exponentielle d'une matrice

La matrice dpendant du temps
exp(tA)
est dnie par la srie absolu-
ment convergente
t2
tk
exp(tA) = I + tA + A2 + . . . + Ak + . . .
2!
k!

(1.11)
est la matrice identit. On appelle t 7 exp(tA) l'exponentielle de la

A. Quel que soit x0 Rn , l'unique solution x(t) du problme de
d
x(t) = Ax(t), x(0) = x0 s'exprime sous la forme
Cauchy
dt
o
matrice
x(t) = exp(tA) x0
Proposition 1
(Proprits de l'exponentielle de matrice)
L' exponentielle
de matrice satisfait les proprits suivantes
exp(tA) exp( A) = exp((t + )A)

d
(exp(tA))
dt
= exp(tA) A = A exp(tA)
exp(P AP 1 ) = P exp(A)P 1
exp(A) = limm+ I +

A m
m
det(exp(A)) = exp(tr(A))
o
et
sont des rels,
est une matrice inversible, det dsigne le dter-
minant et tr dsigne la trace.
1.2.
19
SYSTMES DYNAMIQUES LINAIRES
1.2.2 Forme de Jordan et calcul de l'exponentielle

exp(tA)
Le calcul de l'exponentielle de matrice

faisant intervenir une transformation
c'est possible, ou qui transforme
peut tre simpli en
inversible qui diagonalise
A,
lorsque
en une matrice diagonale par blocs, dite
matrice de Jordan (voir par exemple [34]). Le rsultat suivant prcise les
notations.
Thorme 3
(Rduction de Jordan)
polynme caractristique scind sur
det(sI A) =
Soit
une matrice
nn
dont le
s'crit sous la forme
q
Y
(s i )i ,
(i 6= j ,
si
i 6= j)
i=1
Il existe une matrice inversible
( coecients complexes) telle que
A = T 1 JT
o
J1
0
J2
J =
..
0
avec pour
Jq
i = 1, ..., q ,
i vi,1
0
.
Ji =
..
.
..
0
o pour tout
i, j , vi,j
vaut
ou
vi,2
..
..
..
... ...
...
..
..
.
..
i
0
vi,i1
i
1.
Thorme 4 (CNS de stabilit asymptotique d'un systme linaire stationnaire). Soit le problme de Cauchy pour le systme linaire stationnaire
d
x = Ax, x(0) = x0 o A est une matrice n n et x0 Rn . Ce systme
dt
0
possde la proprit que limt x(t) = 0 quel que soit x (c.--d. que le point
d'quilibre
est globalement asymptotiquement stable) si et seulement si
toutes les valeurs propres de

Dmonstration.
ont une partie relle strictement ngative.
20
CHAPITRE 1.
La condition est ncessaire.
valeur propre de A et v un vecteur propre

i N, Ai v = i v . On a alors, pour tout t > 0,
Considrons
pour tout
exp(tA)v =
i
X
t
i=0
i!
Av=
(t)i v = exp(t)v
i=0
limt x(t) = 0
Donc, pour avoir
associ. Il vient,
quelle que soit la condition initiale, il
faut que toutes les valeurs propres aient une partie relle
<(i )
strictement
ngative.
La condition est susante.

Supposons la condition ralise et notons = supi=1,...n <(i ). D'aprs le
1
Thorme 3, on peut dcomposer A = T
JT , avec J = D + N o D est
diagonale et
est nilpotente. D'aprs la Proposition 1, on a
exp(At) = T exp(tJ)T 1
Les matrice
et
commutent. Intressons nous donc a
exp(tJ) = exp(tD) exp(tN )

Par construction, on a
D = diag(i )
o les
sont les valeurs propres de
A.
On obtient directement
exp t1
exp t2
exp(tD) =
..
0
kM k =
kexp(tD)k =
exp tn
i=1,...,n,j=1,...,n |mi,j |, pour

peut clairement tablir, pour tout t > 0,
Notons
M = (mi,j )
matrice
n n.
On
|exp(ti )| n exp(t)
i=1,...,n
D'autre part,
tant nilpotente, on a, pour tout
exp(tN ) = I + tN +
t > 0,
t2 2
tn1
N + ... +
N n1
2
(n 1)!
Donc, on peut majorer
exp(tN ) p(t)
par le polynme
n1
t
p(t) , 1 + t kN k + t2 kN 2 k + ... + (n1)!
kN n1 k. Il vient alors
kexp(tA)k = kexp(tD) exp(tN )k kexp(tD)k kexp(tN )k np(t) exp(t)

On en dduit, que
limt kexp(tA)k = 0,
d'o la conclusion.
1.2.
21
Dans le cas o le systme linaire est eectivement (globalement) asymptotiquement stable, on a en fait convergence exponentielle vers zro de toutes
les trajectoires. Le rsultat suivant prcise ce point, on peut utiliser n'importe quel minorant strict (en valeur absolue) des parties relles des valeurs
propres comme constante
dans cet nonc. On trouvera une dmonstration
dans [12].
Proposition 2 (Estimation de la convergence d'un systme linaire). Soit le

d
problme de Cauchy pour le systme linaire stationnaire dt x = Ax, x(0) =
0
0
n
x o A est une matrice n n et x R . Si toutes les valeurs propres de
sont partie relle strictement ngative, alors il existe
que, pour tout
K>0
et
>0
tel
t0
kexp(tA)k K exp (t)
et donc

kx(t)k K x0 exp (t)
Thorme 5 (CNS de stabilit d'un systme linaire stationnaire).
Le point
d
d'quilibre x = 0 du systme linaire dt x = Ax est stable si et seulement si
toutes les valeurs propres de A ont une partie relle ngative ou nulle et si
toute valeur propre ayant une partie relle nulle et une multiplicit suprieure
ou gale
correspond un bloc de Jordan d'ordre
1.
L'ide de la dmonstration du Thorme 5 repose sur le calcul de l'exponentielle d'une matrice de Jordan d'ordre suprieur
le plus simple o on a un bloc de Jordan de taille
1
..
Jp =
0
.
..
..
0
Dans ce cas, l'exponentielle de matrice
0 ...
exp(tJp ) = exp(t)
..
.
0 ...
Considrons le cas
et d'ordre
exp(tJp )
1.
vaut
...
..
..
tp1
(p1)!
.
.
.
t
1
Les termes polynomiaux n'apparaissent que dans ce cas. Dans le cas d'une
valeur propre partie relle nulle, le terme exponentiel ne procure pas d'amortissement et par consquent, ne domine pas les termes polynomiaux. Ensuite,
22
CHAPITRE 1.
par les formules de changement de base, on en retrouvera des combinaisons

linaires dans les coordonnes d'origine, prouvant ainsi que les composantes
de l'exponentielle de la matrice sont non bornes lorsque
t croit. On en dduit
l'instabilit du systme. Une dmonstration dtaille se trouve dans [12]. Une

interprtation de ce rsultat est que la forme de Jordan d'ordre suprieur
met en vidence un couplage entre les tats, qui rsultent en une instabilit.
Exemple 4.
Considrons une matrice
ayant toutes ses valeurs propres
partie relle ou nulle. Si les valeurs propres partie relle nulle sont toutes
valeur propre de A partie relle

m corresponde un bloc de Jordan de taille 1 est
quivalent la condition rang(I A) = nm. On vriera ainsi simplement
que la matrice A1 correspond un systme stable alors que la matrice A2
simples, le systme est stable. Le fait que
nulle et de multiplicit
correspond un systme instable, avec
0
1
A1 =
0
0
1 0
0 0
0 0
0 1
0
0
,
1
0
0
1
A2 =
0
0
1 0
0 1
0 0
0 1
0
0
1
0
1.2.3 Portraits de phases des systmes linaires

Nous allons considrer maintenant les cas les plus intressants, principalement les cas gnriques (i.e. invariants par lgres modications des lments
de la matrice
A),
qu'on peut rencontrer en dimensions
n=2
et
n = 3.
Dimension n = 2
Les principaux cas sont illustrs sur les Figures 1.5, et 1.6. On a not
et
les valeurs propres de
(distinctes ou non, relles ou complexes
1 et 2 sont les vecteurs propres rels associs quand ils existent.

Rn correspondant l'tat x. Pour
on a reprsent l'emplacement des valeurs propres de A dans le
conjugues),
On appelle ici plan de phases l'espace

chaque cas,
plan complexe, et l'allure gnrale des trajectoires (note portrait de phases )

d
x = Ax. Cette forme gnrale, comme on l'a vu, ne dpend par
du systme
dt
de la condition initiale.
Dimension n = 3
La Figure 1.7, montre sur un exemple comment, partir des portraits de
phases en dimension 2, on construit, dans les cas gnriques, le portrait de
3
phases en dimension 3 : il sut de dcomposer R en somme d'espaces propres
1.2.
23
Figure 1.5 Portraits de phases plans et linaires lorsque les valeurs propres
de
A, 1
et
2 ,
ont une partie imaginaire non nulle.
Figure 1.6 Portraits de phases
d
x = Ax, lorsque les
dt
valeurs propres de A, 1 et 2 , sont relles (1 et 2 vecteurs propres de A,
lorsqu'ils existent).
plans et linaires,
24
CHAPITRE 1.
trajectoire
valeurs propres
Figure 1.7 Exemple de portrait de phases d'un systme linaire de dimension
en fonction des valeurs propres de
A.
invariants de dimension 1 ou 2. On a convergence suivant une direction et

enroulement avec convergence (typique d'un foyer stable) suivant deux autres
directions.
1.2.4 Polynme caractristique

Les valeurs propres de
polynme caractristique
A (son
P (s)
spectre) correspondent aux racines de son
P (s) = det(sI A) = s
n1
X
s = 0
=0
partir des coecients de la matrice
nme
P (s)
les coecients
de ce poly-
se calculent simplement.
Exemple 5
(Forme canonique d'un systme linaire)
Soit
t 7 y(t) R
solution de
y (n) = 0 y + 1 y (1) + . . . + n1 y (n1)

sont des scalaires et o la -ime drive de y par rapport au temps
()
est note y .
(1)
(n1) T
En posant x = (y, y , . . . , y
) vecteur de Rn , cette quation scalaire
d
d'ordre n devient un systme du premier ordre de dimension n, dt x = Ax,
o les
d
d
dt x = Ax, l'oprateur dt par s la variable
C pour le systme linaire de n quations
6. Ce dernier est obtenu en remplaant dans
s
sx = Ax admette des solutions x non triviales. Ce qui quivaut dire que
la matrice sI A n'est pas inversible, c'est dire que son dterminant P (s), un polynme
de degr n, est nul
de Laplace et en cherchant les conditions sur
inconnues
1.2.
25
avec pour
la matrice suivante
0 1
0 ... ...
0
0 0
1
0
...
0
.
..
. ... ... ... ...
.
.
A=
.
0 . . . .. 0
1
0
0 ... ... ...

0
1
0 . . . . . . . . . n2 n1
A a une forme compagne (aussi appele forme canonique),

P (s) s'obtient trs simplement en partant did
forme scalaire d'ordre n. Il sut de remplacer dt par s
Puisque la matrice
son polynme caractristique

rectement de la
sn y = 0 y + 1 sy + . . . + n1 sn1 y
La condition pour que cette quation linaire en
donne
ait des solutions non nulles
P (s)
P (s) = sn 0 1 s . . . n1 sn1 = 0
On dit que la matrice
est Hurwitz (stable), lorsque toutes ses valeurs
propres sont partie relle strictement ngative, i.e., les zros du polynme
P (s)
que
<(s) < 0. D'aprs le Thorme 4, le point

0 est asymptotiquement stable sous cette hypothse. On dit alors
sont dans le demi-plan
d'quilibre
P (s)
est un polynme Hurwitz (stable).
Dnition 3 (Polynme Hurwitz).
Un polynme coecients rels dont
toutes les racines rsident dans le demi plan complexe ouvert gauche (i.e.
sont partie relle strictement ngative) est un polynme Hurwitz.
Les polynmes Hurwitz sont caractriss par la condition ncessaire et
susante dtaille dans le thorme suivant.
Thorme 6 (Hermite-Biehler). Soit P (s) = a0 +a1 s+...+an sn un polynme

de degr
Pp (s2 ) et sPi (s2 )

P (s) = Pp (s2 ) + sPi (s2 ).
coecients rels. On dnit
et impaires de
P (s),
si bien que
les parties paires

Ce polynme est
Hurwitz si et seulement si
1. tous les zros de
w 7 Pp (w2 )
et de
w 7 Pi (w2 )
sont rels et dis-
tincts
2.
an
et
an1
sont de mme signe
3. les racines positives ranges en ordre croissant de
w 7 Pi (w2 )
(no-
wi1 ,...) et les racines positives ranges en ordre croissant de s 7

Pp (w2 ) (notes wp1 ,...) satisfont la proprit d' entrelacement
tes
0 < wp1 < we1 < wp2 < we2 < ...
26
CHAPITRE 1.
Exemple 6.
2
3
Considrons le polynme P (s) = 36 + 34s + 61s + 36s +
29s4 + 11s5 + 4s6 + s7 . On a alors Pp (s2 ) = 36 + 61s2 + 29s4 + 4s6 et Pi (s2 ) =
34 + 36s2 + 11s4 + s6 . Les racines positives ranges en ordre croissant des
polynmes
w 7 Pp (w2 ) = 36 61w2 + 29w4 4w6

et
w 7 Pi (w2 ) = 34 36w2 + 11w4 w6

[1
3/2
2]
[1.2873
2.4111]. Elles satisfont bien la pro2

2
prit d'entrelacement. Tous les zros de w 7 Pp (w ) et de w 7 Pi (w )
sont rels et distincts. Enn, les coecients an = 1 et an1 = 4 sont de
mme signe. Le polynme P (s) est donc Hurwitz comme on peut aisment le
sont
et
1.8786
vrier numriquement.
De manire gnrale, ce n'est pas en calculant les racines du polynme
caractristique qu'on peut vrier que les parties relles des valeurs propres
sont ngatives, mais en analysant ses coecients. C'est l'objet du critre de
Routh explicit dans le Thorme 7. On sait d'ailleurs depuis Galois, qu'il
n'existe pas de formule gnrale utilisant des radicaux donnant les racines
d'un polynme partir de ses coecients pour un degr
Thorme 7
(Critre de Routh)
polynme de degr
Soit
n 5.
P (s) = a0 + a1 s + ... + an sn
un
coecients rels. On dnit la table de Routh partir
de ces deux premires lignes comme suit
sn
sn1
sn2
sn3
.
.
.
s0
an
an1
bn1
cn1
.
.
.
gn1
an2
an3
bn3
cn3
.
.
.
.
an4 ...
an5
bn5
cn5
.
.
.
.
bn1

1 an an2
=
an1 an1 an3
Le nombre de

1 an an4
bn3 =
, ...
an1 an1 an5

1 an1 an3
cn1 =
...
bn1 bn1 bn3
racines de P (s) ayant une partie relle positive est gal
au
nombre de changements de signe dans la premire colonne de la table de

Routh. Le polynme
P (s)
est Hurwitz si et seulement si il n'y a pas de chan-
gement de signe dans la premire colonne de la table de Routh.
1.2.
27
On trouvera dans [24, 25] la dmonstration de ce rsultat. Pour les sysd

x = Ax de polynme caractristique P (s) = det(sI
tmes d'ordres 2 et 3,
dt
A), on en dduit les conditions suivantes de stabilit asymptotique :
2
pour n = 2 et P (s) = s 1 s 0 ,
0 = det(A) < 0
pour
n=3
et
1 = tr(A) < 0.
et
(1.12)
P (s) = s3 2 s2 1 s 0 ,
0 < 0,
1 < 0,
2 < 0
0 < 1 2 .
et
(1.13)
1.2.5 Systmes linaires instationnaires

La solution gnrale du systme linaire stationnaire avec terme de forage
b(t)
d
x = Ax + b(t),
dt
x Rn ,
b(t) Rn
s'crit
exp ((t )A) b( ) d
x(t) = exp(tA)x(0) +
(1.14)
0
Si
dpend du temps
(cas instationnaire), on n'obtient pas, contrai-
rement ce qu'on pourrait croire, une formule correcte en remplaant tA

Rt
Rt
et (t )A par les intgrales
A
et
A, respectivement. La raison fon0
damentale est que le produit de deux matrices n'est pas commutatif en

gnral eth donc
n'a pas l'identit
R que l'on i
R pourtant
fort sduisante suit
t
d
exp 0 A( ) d = A(t) exp 0 A( ) d . C'est cependant vrai
vante :
dt
A(t1 ) et A(t2 ) commutent, c.--d. A(t1 )A(t2 ) = A(t2 )A(t1 ) pour tout couple
(t1 , t2 ).
Ainsi cette quadrature instationnaire, fausse en gnrale pour n > 1, n'est
valide qu'essentiellement en dimension 1 (o la commutation est trivialement
si
vraie) : la solution gnrale de l'quation scalaire ane coecients variables
d
x = a(t)x + b(t),
dt
xR
est
Z
x(t) = exp

a( ) d
0
partir de la dimension
Z
x(0) +
Z
exp
2,

a() d b( ) d
on ne dispose plus de formules explicites et

d
gnrales pour calculer la solution de
x = A(t)x + b(t), mme si b(t) = 0.
dt
28
CHAPITRE 1.
d2
x = (a + bt)x qui n'admet pas
dt2
de quadrature simple avec des fonctions usuelles (exponentielle, logarithme,
Un exemple est l'quation d'Airy [1] :
...) et qui dnit les fonctions d'Airy, une classe particulire de fonctions
spciales .
Il est faux en gnral de dire que, si chaque instant t,
A(t) a ses valeurs

d
x = A(t)x
dt
propres partie relle strictement ngative, alors les solutions de

convergent vers
0.
Un contre-exemple sut s'en convaincre. Considrons

1 + 1.5 cos2 t
1 1.5 sin t cos t
A(t) =
1 1.5 sin t cos t 1 + 1.5 sin2 t
Pour tout t, les valeurs propres de A(t) sont 0.25 0.25 7i. Or, le systme
d
x(t) = A(t)x(t) a pour solution
dt
0.5t

e cos t et sin t
x(t) =
x0
e0.5t sin t et cos t
qui, pour des conditions initiales
diverge lorsque
t +.
x0
aussi proches de
qu'on le souhaite,
Un autre exemple, encore plus simple est fourni
par la matrice

A(t) =
0
1
(1 + k(t)) 0.2
correspondant un systme masse-ressort dont le ressort a une raideur variable dans le temps. Si on choisit
stable, alors que pour tout temps
k(t) = cos(2t)/2,
le systme devient in-
x, la matrice correspond un systme
exponentiellement stable. Une explication intuitive est que si le ressort est

raide la contraction et mou la dilatation, les dplacements de la masse
croissent au lieu de se rduire (voir [62]).
En conclusion, on ne dispose pas de mthode gnrale pour caractriser,
partir des formules donnant
A(t),
la stabilit du systme direntiel linaire

d
x = A(t)x, sauf lorsque dim(x) = 1, bien
coecients dpendant du temps
dt
sr.
1.2.6 Complments : matrices symtriques et quation

de Lyapounov
On donne ici deux rsultats utiles qui permettent de caractriser les matrices constantes ayant un polynme caractristique Hurwitz.
7. En fait l'immense majorit les fonctions spciales (fonctions de Bessel, de Jacobi
voir [7]) sont solutions d'quations direntielles du second ordre coecients polynmiaux en
: elles correspondent donc des matrices carres
coecients sont simplement des polynmes en
t.
A(t)
de dimension
dont les
1.3.
29
STABILIT DES SYSTMES NON LINAIRES
Thorme 8 (Sylvester).
Une matrice symtrique de
Mn (R)
est dnie po-
sitive si et seulement si tous ses mineurs principaux sont strictement positifs.

Le thorme suivant est souvent utilis pour construire une fonction de
Lyapounov
(dnition B) d'un systme linaire asymptotiquement stable

V (x) = xT P x)
(P sert pour exhiber
Thorme 9
(quation de Lyapounov)
trice symtrique dnie positive. Si
Soit
une matrice et
une ma-
est Hurwitz (stable), alors il existe
une matrice symtrique dnie positive
solution de l'quation suivante,
quation dite de Lyapounov
AT P + P A = Q
(1.15)
Rciproquement, s'il existe des matrices symtrique dnies positives

telles que (1.15) est vrie, alors
et
est Hurwitz (stable).
1.3 Stabilit des systmes non linaires

1.3.1 tude au premier ordre
Les notions de stabilit de la Section 1.1.3 sont, dans le cadre non linaire, locales. Autour d'un point d'quilibre, les quations non linaires de
la dynamique sont proches de leur dveloppement limit. Il est naturel de
se demander quelle information peut tre dduite d'un tel dveloppement au
premier ordre.
Comme nous l'avons voqu la Section 1.1, un systme non linaire peut
avoir plusieurs points d'quilibre isols. Autour de chacun de ces quilibres,
les quations peuvent admettre des systmes linariss tangents trs dirents et donc localement des proprits direntes. On pourra se reporter
l'exemple suivant.
Exemple 7.
Le systme suivant
d
x1 = a1 x1 x2 x1 + a2
dt
d
x2 = x2 + x21
dt
possde, suivant les valeurs des paramtres
a1 , a2 ,
un portrait de phase trs
intressant. Il est tudi en dtail dans [54]. Il s'agit en fait d'un simple sysd
tme linaire dt x = a1 x+u+a2 o on choisit une commande proportionnelle
30
CHAPITRE 1.
Cycle limite
3
Foyer
Foyer
Point selle
0
4
Figure 1.8 Portrait de phase d'un systme avec deux foyers stables, un
point selle et un cycle limite instable.
8
dont le gain k varie (de manire adaptative ) selon l'quation difd
2
frentielle dt k = k + x . L'ide est que tant que le x n'a pas converg vers
zro, le gain k augmente de telle sorte que la commande entrane eective-
u = kx
ment le systme vers zro. La convergence espre de
tant exponentielle,
k devrait tre limite. On peut montrer que ce n'est pas le cas

a2 6= 0. On a reprsent sur la Figure 1.8, le portrait de phase
pour a1 = 3 , a2 = 1.1. Comme cela est montr dans [54], pour
la croissance de
si le paramtre
du systme
ces valeurs, le systme possde deux foyers stables, un cycle limite instable et
un point selle. Lorsque le systme converge, ce n'est pas vers zro.
D'aprs le thorme suivant, il est possible de dduire la stabilit asymptotique locale d'un point d'quilibre hyperbolique d'aprs son linaris tangent.
Dnition 4 (Point d'quilibre hyperbolique). Un point d'quilibre x de

d
l'quation dt x
Jacobienne
= v(x)
est dit hyperbolique si les valeurs propres de la matrice
v
(
x) =
x
vi
xj

1i,jn
sont toutes partie relle non nulle.
Thorme 10
(Stabilit asymptotique locale d'un point d'quilibre hypern

bolique (premire mthode de Lyapounov)) Soit R
3 x 7 v(x) Rn
8. La
commande adaptative
pourra se rfrer [5].
est un domaine scientique riche de l'automatique. On
1.3.
31
continment drivable par rapport

d'quilibre
et
x Rn
tel que
v(
x) = 0.
Le point
de
d
x = v(x)
dt
est localement asymptotiquement stable (c.f. Dnition 1) si les valeurs
propres de la matrice Jacobienne
v
(
x) =
x
vi
xj

1i,jn
sont toutes partie relle strictement ngative. Le point d'quilibre
est
instable au sens de Lyapounov si au moins l'une des valeurs propres de la

v
x) est partie relle strictement positive.
matrice Jacobienne x (
Il est important de bien comprendre ce rsultat. On commence par crire
un dveloppement limit autour de
d
d
v
x = (x x) = v(x) = v(
x) +
(
x)(x x) + (x x)
dt
dt
x
(x x) rassemble les termes d'ordres suprieurs. On ne considre que les
1 en = x x pour en dduire le systme direntiel linaire
coecients constants (A ne dpend pas du temps) suivant
termes d'ordre
d
= A
dt
v
(
x) la matrice Jacobienne de v en x. On sait,
x
d'aprs le Thorme 4, que toutes ses solutions convergent vers 0 lorsque
avec
(t) Rn
et
A =
les valeurs propres de
sont toutes partie relle strictement ngative. Le
Thorme 10 nonce que, si le systme linaire du premier ordre est asymptotiquement stable, alors les termes d'ordre suprieur ne peuvent pas tre
dstabilisateurs pour des conditions initiales proches de l'quilibre. La preuve
de ce rsultat est reproduite un peu plus loin. Elle utilise la seconde mthode
de Lyapounov, un autre outil pour montrer la stabilit d'un point d'quilibre
qui s'inspire la notion d'nergie et de dissipation. Nous dveloppons cette
mthode maintenant.
1.3.2 Fonctions de Lyapounov

titre d'introduction, reprenons l'exemple 2 de l'oscillateur harmonique
amorti et considrons la fonction
V (x1 , x2 ) =
1
2
(x1 )2 + (x2 )2
2
2
32
CHAPITRE 1.
qui n'est autre que son nergie totale. Un calcul simple montre que pour
t 7 (x1 (t), x2 (t))
solution de (1.9), on a
V d
V d
d
(V (x1 (t), x2 (t))) =
x1 +
x2
dt
x1 dt
x2 dt
Or
d
x
dt 1
= x2
et
d
x
dt 2
= 2x2 2 x1 .
Donc
d
V = 2(x2 )2 0
dt
Ainsi,
t 7 V (x1 (t), x2 (t))
est une fonction dcroissante, comme elle est po-
sitive, elle converge vers une valeur positive. Il est intuitif de penser que
d
V converge vers 0 et donc que x2 converge vers 0. Mais si x2 converge
dt
vers 0, il est aussi intuitif de penser que sa drive converge aussi vers 0.
d
x = 2x2 2 x1 et donc x1 tend vers 0 aussi. Le raisonnement
Or,
dt 2
ci-dessus n'est pas trs rigoureux mais il est correct car on a aaire des
V, x1 , x2 , .... uniformment continues, c.--d. dont le mo9

dule de continuit en t ne dpend pas de t . Cette continuit uniforme vient
du fait que, comme V est dcroissante le long des trajectoires et que V est
inni quand x1 ou x2 tend vers l'inni, les trajectoires sont ncessairement
fonctions du temps
bornes et donc sont des fonctions uniformment continues du temps. En

eet, leurs drives en temps sont uniformment bornes. Or, un lemme clasRt
sique d'analyse (lemme de Barbalat) dit que, si l'intgrale
h(s)ds d'une
0
fonction uniformment continue h de [0, +[ dans R est convergente pour t
tendant vers l'inni, alors cette fonction h admet 0 comme limite en t = +.
Rt
V (t) V (0) = 0 dtd V on sait que dtd V converge vers 0 et comme
R t d2
2
d
d
V
(t)
V
(0)
=
V , dtd 2 V converge aussi vers 0. Ce qui nous donne
dt
dt
0 dt2
que x2 et x1 convergent vers 0. En fait, nous aurions pu faire le raisonne-
Comme
ment l'identique pour un systme gnral pour peu que nous disposions
d'une fonction
V,
innie l'inni (on dira non borne radialement ), borne
infrieurement et dcroissante le long de toute trajectoire.

Il est remarquable que dans ces calculs nous n'ayons jamais eu besoin
d'expliciter la loi horaire des trajectoires
force des fonctions
t 7 x1 (t)
et
t 7 x2 (t).
C'est la
dites de Lyapounov : elles fournissent des informa-
tions prcieuses sur les solutions d'quations direntielles sans requrir la

connaissance prcise des lois horaires.
Un lecteur ayant compris ce qui prcde n'aura pas de dicult montrer le rsultat suivant. Des variantes de ce thorme sont donnes dans
l'Annexe B.
R 3 t 7 h(t) Rn est dite uniformment continue si pour tout > 0,

> 0 indpendant de t, tel que kh(t + ) h(t)k pour tout t R.
9. Une fonction
il existe
1.3.
33
Thorme 11
(Invariance de LaSalle)
n
Soit
Rn
un ouvert non vide.
3 x 7 v(x) R une fonction continment drivable de x. Soit 3 x 7

V (x) R une fonction relle continment drivable de x . On suppose
1. qu'il existe c R tel que le sous-ensemble Vc = {x
Rn soit un compact (ferm born dans Rn ) non vide.
V dcrot
x Vc ,
2. que
d
le long des trajectoires de dt x
= v(x),
| V (x) c}
de
c.--d. , pour tout
X V
d
V (x) = V (x) v(x) =
(x) vi (x) 0
dt
xi
i=1
x0 Vc , la solution de dtd x = v(x) reste
temps t > 0 (pas d'explosion en temps ni) et
Alors, pour toute condition initiale

dans
Vc ,
est dnie pour tout
converge vers le plus grand sous-ensemble invariant inclus dans

d
x Vc | V (x) = 0 .
dt
Une fonction
de l'espace d'tat valeur relle qui dcrot le long de

d
toutes les trajectoires, i.e., telle que
V 0 est dite fonction de Lyapounov.
dt
n
Un ensemble E R est dit invariant si, et seulement si, les solutions de
d
x = v(x) dont les conditions initiales appartiennent E , restent dans E
dt
pour les temps t o elles sont dnies. Ainsi, l'ensemble invariant dont il est
question dans le thorme 11 est caractris par le systme sur-dtermin de
n+1
quations
d
1 = v1 ()
dt
.
.
.
d
n = vn ()
dt
n
X
V
i=1
xi
() vi () = 0
n inconnues (1 (t), . . . , n (t)) Vc qui sont des fonctions continment drivables de t. Pour rsoudre ce systme, i.e., obtenir les quations de l'ensemble
et
invariant de LaSalle, il sut de driver un certain nombre de fois la dernire

d
quation et de remplacer, chaque nouvelle drivation en temps, les
par
dt i
vi (). On obtient ainsi une famille d'quations portant uniquement sur qui
caractrise cet ensemble limite qui attire les trajectoires initialises dans
c'est un attracteur .
Vc
34
CHAPITRE 1.
Dans le cas o
que
(t) = x
x Vc
est un point d'quilibre,
v(
x) = 0 ,
il est clair
est une solution du systme sur-dtermin prcdent et donc
appartient cet ensemble limite. Si, maintenant,
est l'unique solution de
ce systme sur-dtermin, alors on est sr que les trajectoires du systme qui
Vc
dmarrent dans
convergent toutes vers
x.
Si maintenant, on suppose dans le thorme 11 que le paramtre

peut tre choisi aussi grand que l'on veut, alors d'une part,
quand
kxk
cR
tend vers
tend vers l'inni c.--d. que V est non borne radialement
x(t) est borne pour les temps t > 0 car

contenue dans Vc avec c = V (x(0)). Enn, si on suppose en plus que le
point d'quilibre x
est l'unique solution = x du systme sur-dtermin cidessus, alors toutes les trajectoires convergent vers l'quilibre x
qui est dit
et, d'autre part, toute trajectoire
globalement asymptotiquement stable .
Exemple 8.
Considrons un systme scalaire,
dim(x) = 1,
de la forme
d
x = v(x(t))
dt
o
(fonction Lipschitz) satisfait les deux proprits suivantes :
2.
R +
0
x 6= 0
xv(x) < 0
R0
v(x)dx = , et v(x)dx = +
1. pour tout
La forme gnrale de
on a
est donne sur la Figure 1.9. Une fonction candidate
tre de Lyapounov est
Z
V (x) =
v( )d
0
Par construction, d'aprs le point 1,
est continue et possde une drive
continue. On a
d
V (x) = v(x)2
dt
d
Donc, pour tout x, dt V (x) 0. Enn, d'aprs le point 2, V (x) + lorsque
|x| +. D'aprs le Thorme 11, on peut prendre pour c n'importe quelle
d
valeur positive. Comme dt V = 0 implique x = 0, on en dduit que 0 est
globalement asymptotiquement stable. titre d'exemple, on obtient, par ce
raisonnement, la stabilit asymptotique de l'origine pour le systme
d
x = x sinh x
dt
alors qu'en considrant le linaris tangent autour de
conclure (le point d'quilibre
n'tant pas hyperbolique).
0,
on ne peut pas
1.3.
35
Figure 1.9 Forme gnrale de la fonction v.

Montrons en quoi la preuve du Thorme 10 repose sur le Thorme 11
d'invariance de LaSalle. Avec les notations du Thorme 10, considrons un
point d'quilibre
x.
On suppose que les valeurs propresdu linaire

tangent,
c.--d. les valeurs propres de la matrice Jacobienne
A=
vi
(
x)
xj
sont
1i,j,n
toutes partie relle strictement ngative. Il nous faut construire une fonc-
x. On sait que exp(tA) est une matrice qui

converge exponentiellement vers 0 quand t tend vers + (voir Proposition 2).
tion de Lyapounov
autour de
On pose
exp(sAT ) exp(sA) ds
P =
0
o
est la transpose de
A.
Par cette construction,
est une matrice
symtrique dnie positive. On pose
V (x) = (x x)T P (x x).

Ainsi on a
Z
V (x) =
[exp(sA)(x x)]T exp(sA)(x x) ds
0
On a en drivant par rapport au temps sous le signe somme
d
V (x) =
dt
Z +

T
T
[exp(sA)(x x)] exp(sA)v(x) + [exp(sA)v(x)] exp(sA)(x x) ds
0
d
x
dt
= v(x). Comme v(x) = A(x x) + o(kx xk), on a

Z +
d
V (x) =
[exp(sA)(x x)]T exp(sA)A(x x) ds
dt
0
Z +
+
[exp(sA)A(x x)]T exp(sA)(x x) ds + o(kx xk2 )
car
36
CHAPITRE 1.
Ainsi,
avec la matrice
d
V (x) = (x x)T Q(x x) + o(kx xk2 )
dt
symtrique Q, dnie par l'intgrale
Q=

[exp(sA)A] exp(sA) + [exp(sA)] exp(sA)A ds
T
0
Comme
d
ds
exp(sA) = exp(sA)A
(voir Proposition 1), on a

d
(exp(sA))T exp(sA) = [exp(sA)A]T exp(sA) + [exp(sA)]T exp(sA)A
ds
et donc l'intgrale dnissant
plement
se calcule explicitement, pour donner sim-

s=+
Q = (exp(sA))T exp(sA) s=0 = I
est la matrice identit de taille
n.
Ainsi, on a
d
V (x) = kx xk2 + o(kx xk2 )
dt
d
V 0 pour
dt
Thorme 11 avec c
Donc
d'quilibre
x assez proche de x et ne s'annule qu'en x = x. Le

> 0 assez petit permet alors de conclure : le point
est localement asymptotiquement stable.
d
x = v(x)
dt
sont toutes partie relle ngative, des petits carts l'quilibre sont natuAinsi, lorsque les valeurs propres au point d'quilibre
de
rellement amortis : le systme oublie sa condition initiale et converge vers
x.
Le systme n'est que transitoirement aect pas une petite perturbation de

conditions initiales.
1.3.3 Robustesse paramtrique

Imaginons que les quations dpendent en fait de paramtres nots p =
(p1 , . . . , pr ) Rr plus ou moins bien connus : dtd x = v(x, p), avec v fonction
continment drivable par rapport x et p. On suppose que, pour une valeur
p, le systme admet un point d'quilibre x, v(

x, p) = 0
propres du systme linaris tangent en ce point x
sont
nominale du paramtre
et que les valeurs
toutes partie relle strictement ngative. Qu'en est-il des systmes voisins
obtenus pour des valeurs de p proche de p
? En fait, pour p proche de p, dtd x =
v(x, p) admet aussi un point d'quilibre (p) qui dpend continment de p,
v((p), p), (
p) = x.
De plus, les valeurs propres en
(p)
sont toutes partie
relle strictement ngative. Ainsi, qualitativement, le systme ne change pas
1.3.
37
de comportement lorsqu'on bouge un peu les paramtres : localement autour

de
x,
les trajectoires convergent vers un point d'quilibre unique qui reste
proche de
x.
La situation est dite robuste au sens o elle ne change que trs
peu lorsque l'on bouge un peu la condition initiale et les paramtres.

L'existence de
(p)
rsulte en fait du thorme des fonctions implicites.
pour p = p
on
vi
x, p) est
a une solution x
; pour cette solution x, la matrice Jacobienne xj (
Le point d'quilibre est dni implicitement par
v(x, p) = 0 ;
inversible (pas de valeur propre nulle puisqu'elles sont toutes par hypothse
partie relle strictement ngative) ;
les valeurs propres en
(p)
dpend continment de
p. Le fait que
restent partie relle strictement ngative, vient
du fait que les valeurs propres d'une matrice dpendent de faon continue de
ses coecients
10
1.3.4 Complments : caractre intrinsque des valeurs

propres du systme linaris tangent
Les valeurs propres du linaire tangent associ un quilibre sont des
nombres intrinsques, i.e. ils ne dpendent pas des systmes de coordonnes x.
d
x = v(x), on considre un jeu particulier de variables
Lorsque qu'on pose
dt
pour crire les quations du systme. Ici, on a choisi, pour reprsenter notre
n
systme les variables (x1 , . . . , xn ) R . Ce choix est clairement arbitraire :
on pourrait tout aussi bien prendre d'autres variables, par exemple les variables
z = (z1 , . . . , zn ) dnies par une correspondance

x : z = (x) et x = (z) o les fonctions
variables
bi-univoque avec les

et
sont des appli-
cations inverses l'une de l'autre. Par exemple, pour reprer un point dans la
plan on doit dnir un jeu de deux nombres. On peut prendre les coordonnes cartsiennes avec l'abscisse et l'ordonne mais on peut aussi prendre les
coordonnes polaires avec un angle et la distance l'origine. Il est vident
que les rsultats de nature qualitative ne doivent pas dpendre du choix des
variables. C'est bien le cas de la proprit de stabilit.
d
Si dans les variables x, la dynamique s'crit
x = v(x) et qu'elle admet
dt
un point d'quilibre x
asymptotiquement stable, alors dans les variables z ,
x aura son
z sera bientransformations et
les quations vont bien-sr changer, mais le point d'quilibre

correspondant
via les transformations inversibles
sr lui aussi asymptotiquement stable. Supposons les
et
et
rgulires (diomorphismes continment drivables). Alors, les quations
dans les variables
se dduisent de celles dans les variables
0
10. Onn'a pas en gnral de dpendance plus rgulire que C
0 1
avec p proche de 0 ; les valeurs propres sont p.
p 0
par un simple
: prendre par exemple
38
CHAPITRE 1.
calcul de fonctions composes
d
d
x = (z) =
dt
dt
d
z = v((z))
dt
Ainsi,
1
d
z = w(z) =
v((z))
dt
z
Comme
de
en
v(
x) = 0, w(
z ) = 0. Un calcul montre alors que la matrice Jacobienne
x est semblable celle de w en z
w
v
(
z)
(
z) =
(
x) (
z)
z
z
x
z
(
z ) est une matrice inversible. Il sut de driver par rapport
z
relation
car
la
(z) w(z) = v((z))

z
et de remarquer, puisque w(
z ) = 0, qu'il n'est pas utile de calculer la drive
2
seconde
car elle est en facteur de w(
z ). Ainsi les valeurs propres obtenues
z 2
avec les variables x sont les mmes que celles obtenues avec les variables z .
Le spectre de la matrice du linaire tangent autour d'un point d'quilibre
est indpendant du choix des variables que l'on choisit pour faire les calculs.
Ces valeurs propres ont pour unit l'inverse d'un temps : ce sont des indicateurs intrinsques caractrisant les chelles du systme. On les appelle aussi
exposants caractristiques.
1.3.5 Complments : les systmes dynamiques dans le

plan
Dans bien des cas pratiques, on se trouve confront des systmes de
dimension 2. Il est notable que, dans ces cas, on peut tablir un certain
nombre de rsultats thoriques trs informatifs. Nous les prsentons dans ce
qui suit.
Thorme 12
d
Le systme autonome plan dt x = v(x) avec x
R2 , ne peut admettre que quelques types de rgimes asymptotiques possibles.
0
2
tant donne une condition initiale x R , considrons t 7 x(t) la solution
d
0
de dt x = v(x) qui dmarre en t = 0 en x . Alors, pour des temps t 0, on ne
peut avoir que les cas de gure suivants (voir illustrations sur la Figure 1.10) :
(Poincar)
1.3.
39
Figure 1.10 Les quatre comportements asymptotiques possibles pour une

trajectoire d'un systme dynamique autonome dni dans le plan.
x(t) ne reste pas born, alors soit x(t) explose en temps ni, soit x(t)
n'explose pas en temps ni mais alors x(t) est dni pour tout t > 0 et
limt7+ kx(t)k = +. En rsum : si la trajectoire n'est pas borne
1. Si
pour les temps positifs, elle converge vers l'inni en temps ni ou en
temps inni.
x(t) reste born pour les temps positifs alors elle est dnie pour tout
temps t > 0 et on distingue trois cas :
0
(a) soit x(t) converge vers un point d'quilibre (en temps inni si x
2. Si
n'est pas un point d'quilibre)

(b) soit
x(t)
converge vers une trajectoire priodique ( cycle limite)
(c) soit
x(t)
s'enroule autour d'une courbe ferme du plan forme de
trajectoires qui partent en

arrive en
t = +
t =
d'un point d'quilibre et qui
vers, a priori, un autre point d'quilibre (orbite
htrocline si les deux points d'quilibres sont dirents et orbite

homocline si les deux points d'quilibres sont identiques).
En rsum, lorsque la trajectoire reste borne elle converge soit vers un
point soit vers une courbe ferme du plan, courbe qui est tangente au champs
de vecteurs
v(x).
Ainsi en dimension
2,
on ne peut pas avoir de comporte-
ments asymptotiques trs compliqus : il est d'usage de dire qu'en dimension

deux, il ne peut pas y avoir de chaos. Il faut bien comprendre que cela n'est
1
1
vrai que pour le plan (sur le tore S S ce n'est plus vrai, les trajectoires
peuvent tre partout denses), et que pour les systmes continus autonomes,
i.e., dnis par deux quations direntielles scalaires ne dpendant pas du
temps. L'argument essentiel de dmonstration est l'unicit des trajectoires.
Dans le plan deux trajectoires ne peuvent se couper sans tre confondues.
Si l'on rajoute par exemple une dpendance priodique en temps
v(x, t + 2)
v(x, t)
alors ce n'est plus vrai. Le systme autonome sous-jacent est de
40
CHAPITRE 1.
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0.2
0.4
0.6
0.8
Figure 1.11 Premire bissectrice et graphes de la fonction logistique [0, 1] 3

x 7 f (x) = 4x(1x) [0, 1] et de ses deux premires itres, f f
dimension
3 : (x1 , x2 , ) R2 S1
et
f f f .
avec
d
d
d
x1 = v1 (x1 , x2 , ),
x2 = v2 (x1 , x2 , ),
= 1.
dt
dt
dt
Ce n'est plus vrai non plus avec les systmes discrets mme de dimension
un. Par exemple les solutions de l'quation logistique
xk+1 = 4xk (1 xk )
qui
x0 [0, 1] restent toujours dans [0, 1] mais elles sont partout

[0, 1]. Pour comprendre ce phnomne il faut tudier des itres
dmarrent en
denses dans
de la formule de rcurrence. On a reprsent les applications correspondantes

sur la Figure 1.11. Les rgimes asymptotiques pour les indices
grands sont
complexes.
Sous une hypothse supplmentaire, on peut spcier la nature de la
limite.
Thorme 13 (Critre de Bendixon). Soit R2 3 x 7 v(x) R2 une fonction
v
v
continue et drivable. On suppose que div(v)(x) = x1 (x) + x2 (x) < 0 pour
1
2
d
2
presque tout x R . Soit t 7 x(t) une solution de dt x = v(x) qui reste
borne pour les temps
positifs. Alors, sa limite quand

un point d'quilibre, i.e., une solution x
R2 de v(
x) =
t tend
0.
vers
est
Ce rsultat n'est plus du tout vrai en dimension suprieure deux. Il sut

de prendre le systme chaotique de Lorenz (reprsent sur la Figure 1.12) de
l'exemple suivant.
1.3.
41
45
40
35
30
25
20
15
10
5
10
0
10
10
20
10
20
Figure 1.12 Systme chaotique de Lorenz.

Exemple 9 (Systme de Lorenz).
avec
s = 10, r = 28
et
dx1
dt
dx2
dt
dx3
dt
= s(x1 + x2 )
= rx1 x2 x1 x3
= bx3 + x1 x2 ,
b = 8/3.
divergence du champs de vecteurs,
Toutes les trajectoires sont bornes, la
s 1 b < 0,
et les trajectoires ont
des comportements asymptotiques complexes et encore aujourd'hui assez mal

compris.
De la caractrisation des rgimes asymptotiques illustrs sur la Figure 1.10,
on peut montrer directement le rsultat suivant, rsultat utile pour montrer
l'existence d'une orbite priodique (cycle limite) tel qu'illustre sur la Figure 1.13.
Thorme 14
R2 3 x = v(x) R2 une fonction

d
1
de classe C . On considre le systme dynamique dt x = v(x). On suppose
qu'il existe dans le plan un ensemble compact tel que
toute trajectoire ayant sa condition initiale dans reste dans pour
les temps t > 0 ( est positivement invariant).
(Poincar-Bendixon)
Soit
42
CHAPITRE 1.
Figure
1.13 Existence d'un cycle limite dans un compact positivement
invariant et qui ne comporte qu'un seul point d'quilibre type foyer instable
ou nud instable .
soit
ne contient aucun point d'quilibre, soit
contient un unique
point d'quilibre dont toutes les valeurs propres sont partie relle strictement positive.
alors
contient une orbite priodique (cycle limite).
L'ide derrire cet nonc est que les trajectoires bornes dans le plan
doivent approcher des orbites priodiques ou des points d'quilibre lorsque
le temps tend vers l'inni. Si
ne contient aucun point d'quilibre alors il
doit contenir une orbite priodique. Si
contient un unique point
d'quilibre
hyperbolique instable dans toutes les directions, alors au voisinage de ce point,

les trajectoires sont repousses par ce point. Il est alors possible de dnir
une courbe ferme permettant d'exclure ce point et de se ramener au cas
prcdent.
Exemple 10
(Exemple de cycle limite : l'onde de densit)
Un exemple de
cycle limite observ en pratique sur site industriel est donn par l'onde de
densit. Ce phnomne apparat sur les puits de ptrole activs par gas-lift.
La technique d'activation par gas-lift des puits de ptrole (reliant un rservoir situ en profondeur aux installations de surface) permet de produire des
hydrocarbures partir de champs matures. Au dbut de la production d'un
puits la pression du rservoir sut frquemment propulser les hydrocarbures
jusqu' la surface o le ptrole est rcupr. C'est une phase de production
1.3.
43
vanne de production
E
fond de l'ocan
production
de gaz et d'huile
arrive
de gaz
tubing
D
casing
B
vanne C
d'injection
rservoir
d'hydrocarbures
rservoir
F
dbit d'huile du rservoir
Figure 1.14 Schma d'un puits de ptrole activ par gas-lift.
dite naturelle qui, suivant les caractristiques du rservoir, peut durer de

quelques de nombreuses annes. Malheureusement en expulsant les euents
vers la surface, le rservoir tend se dpressuriser jusqu' n'tre plus capable
de contrebalancer le poids de la colonne de liquide dans le puits. Il faut alors
recourir des moyens d'activation. Le gaz est inject au fond du puits, il
peut alors tre utilis pour pousser le liquide ou pour s'y mler de faon
diminuer la masse volumique moyenne. On peut se reporter la Figure 1.14
pour voir les dirents lments permettant la production (tubing, partie centrale) et l'injection de gaz (casing, partie annulaire). On a reprsent sur la
Figure 1.15 le cycle limite observ sur site. Ces oscillations nonlinaires font
sensiblement diminuer le dbit de production et donc la rentabilit du champs
ptrolier (elles concourent galement endommager les installations par les
-coups de pression coups de blier ds l'inhomognit de l'coulement).
Comme cela a t mentionn dans la Section 1.1, on constate en pratique une
parfaite rptabilit de l'tablissement du cycle limite, et que sa forme (mais
pas sa phase) ne dpend pas des conditions initiales. Il s'agit eectivement
44
CHAPITRE 1.
0.5
0
0
0.5
1.5
2.5
3.5
0.5
1.5
2.5
3.5
0.5
0
0
Figure 1.15 Onde de densit dans un puits activ en gas-lift. On peut clairement observer un cycle limite suivi par la pression en tte de tubing (courbe
du haut) et une production par bouchons (courbe du bas) trs dommageable
pour le dbit d'huile produit (donnes normalises TOTAL 2006).
d'un cycle limite. On pourra se rfrer [65] pour plus de dtails.
Exemple 11
(Les systmes de Linard et leurs cycles limites)

d
T
systme de Linard les systmes de dimension 2 d'tat (x, dt x)
On appelle
d2
d
x
+
f
(x)
x + g(x) = 0
dt2
dt
o
et
1.
est paire et
sont des fonctions
C1
satisfaisant les conditions suivantes
est impaire et strictement positive sur
f nulle en zro F (x) = 0 f (x)dx est ngative sur un

0 < x < a, nulle en a, jamais dcroissante pour x > a et
+ lorsque |x| .
2. La primitive de
intervalle
tend vers
R+
Rx
Ces systmes possdent une unique solution priodique. Ce rsultat est connu
sous le nom de thorme de Linard (on pourra se rfrer [12]). Un exemple
de tel systme est l'oscillateur de Van der Pol
d2
d
2
x
+
(x
1)
x+x=0
dt2
dt
Ces quations reprsentent un circuit lectrique oscillant rsistance ngative (telle qu'on peut les reproduire avec des lampes de puissance). Ce circuit
1.4.
45
SYSTMES MULTI-CHELLES LENTS/RAPIDES
5
4
3
2
1
0
-1
-2
-3
-4
-5
-2
Figure 1.16 Oscillations du systme de Van der Pol et attraction du cycle

limite.
augmente naturellement l'amplitude des faibles oscillations tandis qu'elle attnue celle des oscillations trop fortes. On a reprsent sur la Figure 1.16
le portrait de phases d'un oscillateur de Van der Pol. Pour
> 0,
le cycle
limite prvu par le thorme de Linard est attractif, tandis que l'origine est
un point d'quilibre instable. Plus
est grand plus les trajectoires convergent
rapidement vers ce cycle limite. La priode laquelle est parcourue de manire asymptotique le cycle limite est approximativement gale pour
grand
(3 2 ln(2)).
1.4 Systmes multi-chelles lents/rapides

Toutes les analyses mathmatiques que nous proposons reposent sur un
modle de la physique du systme que nous avons tudier. Dans ce contexte,
toute simplication pralable des quations peut sembler la bienvenue, mais
on peut lgitimement se demander si ces simplications ne risquent pas de
remettre en cause la validit des conclusions qu'elles ont permis d'tablir.
Le systme rel est en gnral nettement plus complexe que la modlisation
qu'on en fait. Une tendance naturelle est de proposer des modles de plus
en plus compliqus et de fait inextricables, ce qui est, en y rchissant bien
46
CHAPITRE 1.
assez facile et ne mne pas trs loin dans la comprhension des phnomnes.
Par exemple, on ne peut pas en gnral mener d'analyse thorique de stabilit comme nous l'avons fait sur un systme de grande dimension. Il est en
revanche nettement plus dicile de proposer un modle de complexit minimale compte tenu des phnomnes que l'on souhaite comprendre et contrler.
Le but de cette section est de donner quelques rsultats gnraux sur les systmes multi-chelles et leur approximation, sous certaines hypothses, par
des systmes moins complexes et ne comportant essentiellement qu'une
seule chelle de temps. C'est une des voies possibles pour justier la pertinence de modles rduits sur lesquels on sait prouver mathmatiquement
des rsultats de stabilit et de robustesse. Les modles plus compliqus, plus
proches en quelque sorte de la ralit au sens platonicien du terme et trs
utile comme modles de simulation, sont alors vu comme des perturbations,
prenant en compte des dynamiques rapides et donc des phnomnes hautes
frquences, de modles plus simples, de petites dimensions et trs souvent
utiliss en contrle.
1.4.1 Perturbations singulires

Le premier outil que nous prsentons est la thorie des perturbations sin-
gulires . Cette thorie a pour origine l'tude des phnomnes de couches

limites dans les coulements prs des parois d'un uide avec une faible viscosit. Certaines terminologies en sont directement inspires.
La thorie des perturbations permet de relier les trajectoires de deux
systmes ayant des espaces d'tat de dimensions direntes. Dans ce cadre,
le systme perturb possde un nombre d'tats plus grand que le systme
rduit. Plus prcisment, cette thorie vise liminer les eets court terme
et ne conserver que les eets long terme. C'est un outil prcieux pour
la construction de modles rduits rsumant l'essentiel des comportements
qualitatifs long terme.
De manire gnrale, on distingue deux cas illustrs par la Figure 1.17 :
premier cas : les eets rapides se stabilisent trs vite et on parle alors
de perturbations singulires, d'approximation quasi-statique, ou encore
d'approximation adiabatique ;
second cas : les eets rapides ne sont pas asymptotiquement stables
mais restent d'amplitude borne ; ils sont donc oscillants et l'on parle
alors indiremment de moyennisation ou d'approximation sculaire .
Seul le premier cas est abord ici. Le second est trait dans l'Annexe C
lorsque la dynamique rapide est priodique. Les cas plus gnraux o la
dynamique rapide n'est pas priodique sont nettement plus diciles formaliser : il faut passer par la thorie ergodique des systmes dynamiques
1.4.
47
systme lent-rapide
systme lent
perturbations
singulires
0
x
0
x
moyennisation
Figure 1.17 La thorie des perturbations consiste liminer les eets

court terme,
t ,
qu'ils soient asymptotiquement stables ou oscillants, an
de ne conserver que les eets long terme,
t 1 (0 < 1).
pour obtenir la dynamique lente en prenant des moyennes faisant intervenir la mesure asymptotique du rapide : la dynamique rapide est alors vue
comme un bruit haute frquence dont il faut connatre la loi de probabilit
(la mesure asymptotique) qui dpend en gnral des variables lentes.
On considre les systmes continus du type
( )
dx
dt = f (x, z, )
dz = g(x, z, )
dt
avec
x Rn , z Rp ,
0 < 1 est un petit paramtre, f et g sont

x correspond aux variables dont l'vosignicative sur une dure en t de l'ordre 1) et z
des fonctions rgulires. L'tat partiel

lution est lente (variation
correspond aux variables dont l'volution est rapide (variation signicative

sur une dure en
de temps rapide et
de l'ordre de
t1
).
On dit que
l'chelle de temps lente.
correspond l'chelle
48
CHAPITRE 1.
Figure 1.18 Le champs des vitesses est quasi-vertical pour la forme nor
male de Tikhonov ( ).
Considrons pour commencer l'exemple suivant
11
x=z
dt
d z = x z
dt
avec 0 < 1. Intuitivement, on voit que x est une variable lente (sa vitesse
est petite et d'ordre 1), tandis que z est une variable rapide (sa vitesse est
d'ordre 1/). On a donc envie de dire que z atteint rapidement son point
d
x = x. Cette ide est
d'quilibre z = x et que, par suite, x volue selon
dt
fondamentalement correcte ds que les eets rapides sont asymptotiquement
stables.
La situation gomtrique est donne par la Figure 1.18 : pour
petit et localement autour de
g(x, z, 0) = 0,
> 0 assez
les trajectoires du systme sont
quasi-verticales et convergent toutes vers le sous-ensemble de l'espace d'tat

(sous-varit ) donn l'ordre
en
par l'quation
g(x, z, 0) = 0.
Les rsultats ci-dessous justient alors, sous essentiellement l'hypothse

d
de stabilit asymptotique x constant de la dynamique rapide en z , z =
dt
g(x, z, 0), l'approximation des trajectoires du systme perturb ( ) par celles

0
du systme lent ( ) obtenu en faisant = 0 dans les quations
( )
dx
dt
= f (x, z, 0)
0 = g(x, z, 0)
11. Comme autre exemple caractristique citons la cintique chimique o les constantes
de vitesses de certaines ractions peuvent tre nettement plus grandes que d'autres (cintiques lentes et cintiques trs rapides).
1.4.
49
On nglige ainsi les convergences rapides vers la sous-varit donne approximativement par les quations statiques g(x, z, 0) = 0. Toute trajectoire du
systme ( ) dmarrant en (x, z) est proche, aprs une dure en t de l'ordre

0
de , de la trajectoire du systme lent ( ) dmarrant avec le mme x (projection selon la verticale, voir Figure 1.18).
Nous voyons que cette approximation s'accompagne d'une diminution de
la dimension de l'tat. En fait, la rduction n'est qu'une restriction une
sous-varit invariante attractive, les quations de cette sous-varit tant

approximativement donnes par
g(x, z, 0) = 0.
On a le premier rsultat g-
nral suivant (sa dmonstration gure dans [71])
Thorme 15 (Tikhonov). Soit le systme ( ). Supposons que

H1 l'quation g(x, z, 0) = 0 admet une solution, z = (x), avec
rgulire de
fonction
telle que la matrice Jacobienne partielle
g
(x, (x), 0)
z
est une matrice dont toutes les valeurs propres sont partie relle strictement ngative (Hurwitz) ; on dit alors que le systme est sous forme
standard ;
H2
le systme rduit
dx
dt
= f (x, (x), 0)
x(t=0) = x0
admet une unique solution

Alors, pour
x0 (t)
susamment proche de
pour
0,
(1.16)
t [0, T ], 0 < T < +.

( )
admet une
0
unique solution (x (t), z (t)) sur [0, T ] ds que la condition initiale z appar0
tient au bassin d'attraction du point d'quilibre (x ) du sous-systme rapide
le systme complet
d
= g(x0 , , 0).
dt
De plus on a
lim0+ x (t) = x0 (t)

uniformment pour
lim0+ z (t) = z0 (t)
t dans tout intervalle ferm de la forme [a, T ] avec a > 0.
Par le Thorme 4, l'hypothse

de
et
H1 implique que, x x, la dynamique
d
= g(x, , 0).
dt
50
CHAPITRE 1.
est localement asymptotiquement stable autour du point d'quilibre

Remarquons aussi que
(0 )
(x).
s'crit ainsi
d
x = f (x, (x), 0)
dt
avec
z = (x), la fonction x 7 (x) tant dnie implicitement par g(x, , 0) =
0.
Sans hypothses supplmentaires, l'approximation du Thorme 15 n'est
valable, en gnral, que sur des intervalles de temps
de longueur borne
T.
L'hypothse supplmentaire, qu'il convient alors d'utiliser pour avoir une

bonne approximation pour tous les temps positifs, concerne le comportement
asymptotique du systme rduit (1.16) : si ce dernier admet un point d'quilibre dont le linaire tangent est asymptotiquement stable, l'approximation
est alors valable pour tous les temps positifs (pourvu que la condition initiale
x0 soit dans le bassin d'attraction de l'quilibre de la dynamique lente).
Thorme 16
(Prservation de la stabilit)
Supposons en plus des hypo-
thses du Thorme 15 que le systme rduit (1.16) admet un point d'quilibre
x : f (
x, (
x), 0) = 0
et que les valeurs propres de la matrice
f
f
+
x z x

(
x,(
x),0)
sont partie relle strictement ngative. Alors, pour tout 0 assez proche
de 0, le systme perturb ( ) admet un point d'quilibre proche de (

x, (
x))
et dont le linaire tangent est asymptotiquement stable.
Preuve
L'existence du point stationnaire pour le systme perturb est lais-
se en exercice (il sut d'utiliser le thorme des fonctions implicites pour
g=0
f = 0). Quitte faire, pour chaque une translation,

(0, 0) est point stationnaire du systme perturb
et ensuite pour
nous supposons que
f (0, 0, ) = 0,
g(0, 0, ) = 0
x proche de 0, z = (x), la solution proche de 0 de g(x, z, ) =

(0) = 0. Considrons le changement de variables (x, z) 7 (x, w = z (x)). Dans les coordonnes (x, w),
le systme perturb admet (x, w) = (0, 0) comme point d'quilibre et ses
Notons, pour
0.
Suite la translation prcdente, on a
quations ont la forme suivante
d
x = F (x, w, ),
dt
d
w = G(x, w, )
dt
1.4.
51
avec
F (x, w, ) = f (x, w+ (x), ),

Sa matrice Jacobien en

J =
(0, 0)
G(x, w, ) = g(x, w+ (x), )
F (x, w, ).
x
est alors donne par
F
(0, 0, )
x
1 G
(0, 0, )
x
F
(0, 0, )
w
1 G
(0, 0, )
w

=
A
C A
B
1
D + E

A =
f
f
(0, 0, ) +
(0, 0, )
(0), B =
(0, 0, ), C =
(0),
x
z
x
z
x
f
g
(0, 0, ), E =
(0) (0, 0, )
D =
z
x
z
On a utilis le fait que g(x, 0+ (x), ) 0 et que F (0, 0, ) = 0. Les matrices

A , B , C , D et E dpendent rgulirement de et convergent vers A0 , B0 ,
C0 , D0 et E0 quand tend vers 0 avec, par hypothse A0 et D0 stables. On
va montrer que pour > 0 assez petit, J est stable. Soit et Y une valeur
propre et vecteur propre de J . On peut toujours supposer Y de longueur
1 et que 7 ( , Y ) est continue (les valeurs propres, vecteurs propres
dpendent continment des coecients de la matrice). On dcompose alors
en
(X , W )
selon les coordonnes
A X + B W =
C A X +
On a alors
1
D

+ E W =
W .
0 est valeur propre de D0 donc <( ) < 0 pour

>0
W0 = 0 est alors X0 6= 0 et avec A0 X0 = lim70+ X0 on
dduit aussi que pour > 0 assez petit, <( ) < 0.
Ainsi les valeurs propres de J sont parties relles strictement ngatives
pour > 0 assez petit.
Soit
W0 6= 0
X ,
(x, w).
est alors
assez petit. Soit
Cette preuve peut tre amliore pour montrer que l'approximation du

Thorme 15 devient valide, localement autour de
les temps
positifs, ds que
indpendant de
(
x, (
x))
et pour tous
est assez petit (le caractre local tant alors
tendant vers zro).
1.4.2 Feedback sur un systme deux chelles de temps

12
En thorie des systmes, le Thorme 16 est utilis constamment

de
la manire suivante. Rajoutons une commande u ( ) et supposons,

12. C'est un peu comme Monsieur Jourdain dans le Bourgeois Gentil-Homme de Molire
lorsqu'il ralise qu'il parle constamment en prose.
52
CHAPITRE 1.
commande
xe, que les hypothses du Thorme 15 de Tikhonov soient
valables. Ainsi
dx
dt
= f (x, z, u, )
(1.17)
dz = g(x, z, u, )
dt
avec (x, u) le point d'quilibre asymptotiquement stable de la partie rapide
d
= g(x, , u, 0). Le systme lent est alors dx
= f (x, (x, u), u, 0).
dt
dt
Supposons que nous ayons un retour d'tat lent u = k(x) tel que le
systme lent boucl soit asymptotiquement stable autour du point d'quilibre
(
x, u = k(
x)).
Alors pour tout
>0
assez petit, le systme perturb (1.17)
u = k(x), admet un point d'quilibre hyperbolique proche

(
x, z = (
x, u)). Cela veut simplement dire que l'on peut, pour la synthse
avec le bouclage lent

de
d'un bouclage, ignorer des dynamiques asymptotiquement stables et assez

rapides. On parle alors de robustesse par rapport aux dynamiques ngliges.
Noter que le retour d'tat ne porte que sur la partie lente,
du type
u = k(x, z)
x.
Un bouclage
apparat directement est envisageable mais alors il
faut vrier que la dpendance en
de
ne dtruise pas la stabilit de la
dynamique rapide
d
= g(x, , k(x, ), 0)
dt
C'est toujours le cas lorsque
ne dpend pas de
g
u
= 0.
1.4.3 Modle de contrle et modle de simulation

Pour les besoins de simulation ou de conception d'un rgulateur, on n'a
pas besoin d'utiliser le mme modle. Ainsi il n'y a pas de modle universel.
Pour
petit il sut, pour concevoir le feedback
u = k(x)
de prendre par
exemple comme modle, l'approximation lente de (1.17)
d
x = f (x, (x, u), u, 0).
dt
Pour la simulation, il peut cependant tre utile de vrier que le feedback
u = k(x)
inject dans les quations (1.17) donne des rsultats proches de
ceux que l'on aurait avec le modle lent en boucle ferme
d
x = f (x, (x, k(x)), k(x), 0)
dt
Cela permet de vrier si
est assez petit pour que le thorme soit ap-
plicable. En pratique, on remarque que
n'a pas besoin d'tre trs petit :
1.4.
53
on constate qu'un rapport de
entre les constantes de temps de la dyna-
mique rapide et celles de la dynamique lente donne bien souvent une bonne
approximation. Cela veut dire que
= 1/2
est dj petit.
Voyons en dtail la conception d'un contrleur. On part d'un modle

de contrle issu d'une modlisation mme trs grossire du systme pour
dcrire les corrlations entre les entre
(u, w) et les mesures y . Ce modle est
le modle d'tat
d
x = f (x, u, w, p), y = h(x)
dt
dpendant des paramtres p. On labore partir de ce modle de contrle et
pour une valeur nominale des paramtres p
, une loi de contrle sous la forme
d'un retour dynamique de sortie (comme l'est un contrleur PI )
d
=a
(y, , v),
dt
o
, v)
u = k(y,
est le nouveau contrle (pour le PI c'est la consigne). On est alors sr
du comportement du systme boucl nominal
x = f (x, k(h(x),
, v), w, p),
dt
d
=a
(h(x), v)
dt
Par exemple, on sait que lorsque les perturbations
et le nouveau contrle
sont constant, le systme est asymptotiquement stable.

On peut bien sr rsoudre numriquement le systme direntiel ci-dessus
pour vrier que nous ne nous sommes pas tromps dans les choix de
et
a
. On peut aussi, dans une seconde tape, simuler le systme prcdent mais
avec un paramtre p dirent de p
, pour vrier que notre contrleur n'est pas
trop sensible aux erreurs de paramtres et surtout pour quantier les erreurs
paramtriques au del desquelles le contrleur conduit des comportements
non acceptables. On quantie en simulation la robustesse paramtrique du
contrleur . On voit donc ici que nous avons encore deux modles : le modle
de contrle de paramtre
p et
le modle de simulation de paramtre
mthodes usuelles de contrle garantissent alors que pour
p,
p.
Les
assez proche de
tout se passe bien : de petites erreurs de paramtres n'engendrent que
de petits carts sur les trajectoires. En gnral, il n'existe pas de mthode

simple qui permet de quantier analytiquement les valeurs critiques de
au
del desquelles le systme change de comportement. C'est l'objet de la thorie des bifurcations et des catastrophes, thories mathmatiquement assez
techniques (on pourra se reporter [30]).
Il convient aussi de faire quelques simulations pour quantier la robustesse
du contrleur par rapport des dynamiques ngliges. Le but est en autre de
vrier que les gains ne sont pas irralistes (en gnral trop grands) : pour
54
CHAPITRE 1.
simplier, il ne faut pas que, dans les formules servant calculer
et
a
,
il y
ait de trop grands coecients et/ou de petits diviseurs.

Les dynamiques ngliges sont de trois ordres qualitativement : celles
lies au processus de mesure et donc aux capteurs donnant
y;
celles lies au
processus de contrle et donc aux actionneurs assurant des valeurs arbitraires

pour
u;
celles lies au systme lui-mme, indpendamment des actionneurs
et des capteurs.
y et u des premiers ordres avec des

petites chelles de temps y > 0 et u > 0 pour prendre en compte le fait que
Par exemple, on peut associer
la rponse des capteurs n'est pas instantane et que les actionneurs ne sont
pas parfaits. On simule alors le systme tendu
d
x = f (x, um , w, p)
dt
d
=a
(y m , v)
dt
d
y y m = h(x) y m
dt
u d um = k(y
m , , v) um
dt
et on teste pour diverses valeurs
et
les performances en quantiant les
seuils critiques au del desquels les performances se dgradent notablement

pour conduire des instabilits
13
Si, par exemple, on s'aperoit que la constante de temps
que l'on avait
nglige au dpart, est en fait trop grande compte tenu des performances
demandes au contrleur, alors il nous faut changer le modle de contrle et
l'enrichir avec une partie de la dynamique du capteur. Cela signie qu'on a
pris comme modle de contrle de dpart, un modle trop grossier, compte
tenu des objectifs.
Il ne faudrait pas en conclure qu'il faille ds le dpart prendre le modle
le plus complet possible comme modle de contrle. Comme en physique,
il est en fait bien plus ecace de partir d'une vision trop synthtique qui
s'appuie sur des a priori trs forts mais dont on est conscient
14
. D'en dduire
13. Une autre faon de prendre en compte des dynamiques rapides ngliges consiste
introduire un petit retard de l'ordre de
Comme
ym = e dt y
>0
en posant, par exemple,
ym (t) = y(t ).
on voit que l'on est aussi en face d'un phnomne de perturbation
d
dt ) mais cette fois en dimension innie
d
dt
, ym = e
y devient ym = 1+1 d y et on
singulire (petit paramtre positif multipliant

d'tat. Avec l'approximation
d
dt
retrouve le ltre du premier ordre
1
d
1+ dt
dt
d
y = ym + dt
ym .
14. Citons l'exemple des calculs perturbatifs de trajectoires spatiales pour lesquels on
remet en cause les hypothses simplicatrices au fur et mesure : trajectoire plane puis
1.5.
55
CAS D'TUDE
un modle simple et ultra-simpli, dont on sait pertinemment qu'il est faux

mais dont, si ncessaire, on identiera les faiblesses et que l'on corrigera au
bout de quelques itrations de la mthodologie rsume ci-dessus. On aura
alors obtenu un modle de complexit rduite qui reprsentera l'essentiel de
la dynamique que l'on souhaite contrler.
Moralit : les choses sont dj assez compliques naturellement, gardons
nous de les rendre encore plus obscures et utilisons des modles de complexit
aussi rduite que possible compte tenu des objectifs atteindre.
1.5 Cas d'tude : PI et thermostat

L'objet de cette section est l'tude d'un rgulateur proportionnel-intgral (rgulateur PI ) sur un systme non linaire du premier ordre. On prend
en compte les contraintes sur le contrle
par une gestion du terme int-
gral grce un algorithme d'anti-emballement ( anti-windup en anglais).

L'immense majorit des systmes industriels de contrle sont construits
partir de tels rgulateurs PI lmentaires. Il est donc naturel de les tudier
en dtails.
Ce cas d'tude est aussi l'occasion d'utiliser un grand nombre des notions
importantes issues de la thorie des quations direntielles ordinaires que
nous avons prsente dans ce chapitre : stabilit asymptotique (voir Dnition 2), relations entre la stabilit et les valeurs propres du systme linaire
tangent autour d'un point d'quilibre (voir Thorme 10), systmes avec des
chelles de temps trs direntes (voir la Section 1.4), liens avec les cascades
de rgulateurs et robustesse par rapport aux dynamiques ngliges. Nous
ferons aussi appel aux rsultats fondamentaux de Poincar et de Bendixon
(voir Thormes 12 et 13) sur les systmes stationnaires dans le plan. Enn,
nous montrerons l'intrt de rajouter la rtro-action PI (feedback ) de la
pr-compensation (feedforward ) pour anticiper et ainsi mieux grer des transitoires importants en particulier ceux lis aux changements de consignes.
1.5.1 Prsentation du systme

Considrons un btiment quip d'une chaudire. Notre objectif est d'ajuster la marche de la chaudire en fonction d'une consigne de temprature
(librement choisie par un habitant) et d'une mesure en temps rel de la temprature ambiante
l'intrieur du btiment. Intuitivement, si l'cart
est positif il convient de baisser la chaudire, dans le cas contraire il convient

dans l'espace, anomalie des potentiels de gravit, non-sphricit des plantes, eets atmosphriques en altitude basse,...
56
CHAPITRE 1.
Figure 1.19 Rgulation PI de la temprature sa consigne avec une

vanne trois voies de position
u [0, 1].
de l'augmenter. An d'aranchir l'habitant des incessants ajustements ncessaires pour que la temprature
reste le plus proche possible de la consigne
une question intressante est : comment faire cela de faon automatique
et able ?
1.5.2 Un rgulateur PI
Comme l'illustre la Figure 1.19, l'algorithme usuellement utilis avec une
vanne proportionnelle 3 voies est le suivant. La marche de la chaudire est directement relie la position de la vanne trois voies note
u : pour u = 0, l'eau
qui arrive des radiateurs ne passe pas par la chaudire et repart directement
avec la mme temprature ; pour
u = 1,
toute l'eau arrivant des radiateurs
ch (tem ; pour
prature constante), temprature bien sr nettement plus haute que
les valeurs intermdiaires de u ]0, 1[, l'eau qui arrive des radiateurs n'est
passe par la chaudire et ressort la temprature de la chaudire
que partiellement rchaue et repart avec une temprature intermdiaire.

Le rgulateur (thermostat) lectronique qui se trouve dans une pice de vie,
comporte une sonde de temprature
de consigne
vanne
. L'habitant peut xer une temprature
Le rgulateur pilote, via un signal lectrique, la position de la
u.
L'algorithme usuellement rencontr dans ce type de d'quipement est celui

d'un rgulateur proportionnel/intgral, rgulateur dit PI, qui s'crit, entre
1.5.
57
CAS D'TUDE
deux instants spars par
t > 0,
uk+1 = Kp ( k ) + Ik
uk+1
en fonction de la temprature
intgral
(k + 1)t,
est la nouvelle position de la vanne, l'instant
Ik
kt.
l'instant
k ,
de la consigne
Ik
Kp
calcule
de la valeur d'un terme
La priode d'chantillonnage
de la seconde. Le gain proportionnel
terme intgral
et
est de l'ordre
est un paramtre positif. Enn, le
se calcule par une rcurrence
Ik+1 = Ik + t Ki ( k )
o
Ki
est le gain intgral . Contrairement
u,
le terme
est donc gard en
mmoire entre deux calculs successifs. C'est une valeur interne au contrleur
(tat).
En somme, la commande
est calcule rcursivement par l'algorithme
uk+1 = Kp ( k ) + Ik
Ik+1 = Ik + t Ki ( k )
o, en mme temps qu'on calcule
uk+1 ,
on met jour le terme intgral
Ik+1
uk+2 ). Tel quel, cet algorithme ne marche pas.

imparable : u doit rester entre 0 et 1. Or un tel
pour le calcul suivant (celui de

La raison est brutale mais
algorithme ne garantit nullement ces conditions. Pour prendre en compte ces

limitations, on sature
et on obtient l'algorithme modi suivant
uk+1 = S at Kp ( k ) + Ik
Ik+1 = Ik + t Ki ( k )
o
S at (x) = x
si
x [0, 1], S at (x) = 0
pour
x<0
et
S at (x) = 1
pour
x > 1.
Un tel algorithme ne marche pas non plus. La raison est en plus sophistique.
Imaginons que nous soyons l't par temps de canicule. Dans ce cas
toujours nettement suprieur
donc le terme intgral
(une
chaudire n'est pas un climatiseur) et

restera du fait de la fonction
S at
0.
aura une valeur ngative trs grande en valeur absolue.
Lorsque les premiers froids arrivent,
sera
deviendra au cours du temps de plus en plus ngatif,
on parle d'emballement ou windup,

la n de l't
sera tellement ngatif que, mme si
u restera
Kp ( )
descend largement en dessous de la consigne,
Il faudra attendre que
remonte au dessus de
toujours zro.
pour avoir enn
un peu de chauage. Cela peut prendre des semaines. On comprend donc

qu'il faut modier aussi la faon dont on met jour
I.
terme tmoignant de la saturation de la commande. Si
On va rajouter un
uk+1
ne sature pas,
58
CHAPITRE 1.
ce terme sera nul, sinon ce terme cherchera s'opposer l'emballement dont

on vient de parler. C'est le mcanisme d'anti-emballement (ou anti-windup )
qui conduit l'algorithme suivant

uk+1 = S at Kp ( k ) + Ik

Ik+1 = Ik + t Ki ( k ) + Ks (uk+1 Kp ( k ) Ik )
avec un gain
Ks
choisit assez grand de faon avoir
Ks Kp > Ki .
(1.18)
Tout rgu-
lateur industriel PI comporte un tel mcanisme d'anti-windup pour prendre

en compte les contraintes sur le contrle
u.
Cette version est la bonne, nous
allons l'tudier en dtails.

Dans un premier temps, demandons-nous quoi sert le terme (intgral)
et pourquoi n'avons nous pas tout simplement considr le rgulateur proportionnel P
uk+1 = S at (Kp ( k ))
Comme on pourrait le voir par exemple avec des simulations (et conformment l'intuition) un tel algorithme a tendance limiter les variations de
temprature
Cependant, en rgime stabilis, il n'y a aucune raison pour
. Cet algorithme est incapable d'assurer, en

. En eet si = alors
rgime stationnaire le fait que rejoigne sa consigne
u = 0 et donc il ne faut pas chauage : ce qui est certes trs conomique mais
que
soit gal sa consigne
assez inconfortable et compltement idiot. Rapidement, on va s'loigner de

ce point qui ne correspond pas une situation d'quilibre. En revanche avec
u reste constant et l'intrieur (non strict) des
contraintes 0 et 1 (et o et restent eux aussi constants) on voit trs simplement que I ne peut tre que constant. En eet, la seconde quation de (1.18)
. Comme on le voit, le terme I garantit que,
implique ncessairement =
. Le terme I annule l'erreur statique.
si on atteint un quilibre, c'est =
le PI, en rgime stabilis o
1.5.3 Une modlisation simplie

Si on relve les signaux
t 7 u(t)
et
t 7 (t)
sur une priode de temps
assez longue (par exemple une journe), on s'aperoit qu'ils sont fortement
corrls. La modlisation consiste tablir ces corrlations. On peut partir de telles mesures identier un modle. On peut aussi utiliser les lois de
conservation de la physique. Bien sr, il n'est pas question ici d'crire un modle dtaill prenant en compte un maximum de phnomnes. Notre objectif
consiste rguler une temprature moyenne, telle que mesure par une seule
sonde, en utilisant un seul actionneur (la chaudire). Si, en revanche, on s'intresse la temprature en dirents points, son inhomognit spatiale,
1.5.
59
CAS D'TUDE
on aura recours des modles plus sophistiqus tels que ceux utiliss pour
la simulation ne des transferts thermiques.
Dans notre situation, nous avons besoin d'un modle minimal nous permettant de comprendre pourquoi un rgulateur PI fonctionne
avoir besoin de rgler de faon trs pointue les gains
Kp
et
15
Ki .
, et ce sans
Ce modle
sera bien-sr grossier et donc faux. En d'autres termes, il ne reprsentera

qu'une vision en rduction de la ralit physique. Il ne prendra en compte
que des eets moyens en espace et en temps, moyennes relatives aux chelles
qui nous intressent. Ici l'chelle spatiale est dnie par la taille du btiment,
alors que l'intervalle temporel le plus court pris en considration est la demiheure. Un tel modle simpli a l'immense avantage d'claircir l'analyse :
de bien cerner les congurations pour lesquelles l'algorithme PI fonctionne ;
de bien cerner aussi les cas o des instabilits (oscillations, pompages, ...)
peuvent apparatre pour donner des pistes de solutions et ainsi traiter ces
dicults.
1.5.4 Passage en temps continu

Nous allons raisonner en temps continu pour suivre la formulation habituelle des lois de conservation de la physique.

d
I
Ik+1tIk , on obtient la version en temps continu de (1.18)
Avec
dt k
u(t) = S at (Kp ( (t)) + I(t))
(1.19)
d I(t) = Ki ( (t)) + Ks (u(t) Kp ( (t)) I(t)).
dt
Pour construire un modle reliant la position de la vanne u et la temprature , nous allons faire, en accord avec notre choix des chelles de temps
et d'espace, les hypothses simplicatrices illustres sur la Figure 1.20.
. Il change des carad , et avec l'extrieur

> 0 et ext > 0, les coe-
On suppose le btiment homogne en temprature

lories avec les radiateurs de temprature uniforme
dont la temprature est
ext .
En notant
rad
cients d'changes thermiques avec les radiateurs et l'extrieur, le bilan global

d'nergie donne le modle suivant
M Cp
o
d
= rad (rad ) + ext (ext )
dt
est la masse du btiment,
Cp sa capacit calorique spcique (J/kg/K).
Nous pouvons faire un bilan thermique stationnaire autour des radiateurs en

15. Il faut savoir que pour l'immense majorit des installations domestiques, un algorithme PI pilotant une vanne 3 voies donne entirement satisfaction avec quelques rglages
standards pour
Kp
et
Ki
choisis selon la taille et l'inertie thermique de l'installation.
60
CHAPITRE 1.
Figure 1.20 Modlisation simplie avec un seul compartiment de temprature uniforme
qui change de la chaleur avec l'extrieur de temprature
ext et avec les radiateurs de temprature rad dont une fraction de l'eau
u [0, 1] passe par la chaudire et ressort la temprature sortie chaudire
ch .
supposant que le ux de chaleur perdue par les radiateurs
rad (rad )
est
instantanment compens par la chaudire via la fraction du dbit d'eau des

radiateurs qui passe par la chaudire et en ressort la temprature
ch . Cela
donne la relation statique suivante
u(ch rad ) = rad (rad )

o
>0
est un coecient donn.
rad
u
avec des coef-
d
urad
=
(ch ) + ext (ext )
dt
u + rad
(1.20)
On peut alors calculer

cients tant fonction de
rad =
comme barycentre de
ch
et
rad
u
ch +
u + rad
u + rad
Ainsi, nous obtenons le modle suivant
M Cp
1.5.5 Simulations en boucle ouverte et en boucle ferme

On va utiliser les notations qui suivent

est l'tat du systme, i.e. les grandeurs satisfaisant des quations
direntielles. Ici

y = h(x)
x = .
est la partie de l'tat qui est mesure (sortie), ici
y = x,
on
mesure tout l'tat.

u reprsente les contrles (commandes), i.e., les variables d'entre qu'on

peut choisir comme on le souhaite.
1.5.
61
CAS D'TUDE
dsigne les perturbations , i.e., les variables d'entre qu'on ne peut
w = ext (t).
p est un ensemble de paramtres constants apparaissant dans le modle
(ce sont des entres particulires qui sont des constantes) : ici p =
(, rad , ext , M Cp ).
pas choisir car elles sont imposes par l'environnement ; ici

Ces notations nous permettent d'crire le modle sous la forme d'tat
d
x = f (x, u, w, p),
dt
o
et
y = h(x)
sont des fonctions issues de la modlisation ; ici
f (x, u, w, p) =
ext
urad
(ch ) +
(ext ),
(M Cp )(u + rad )
M Cp
h(x) = x
La simulation d'un tel systme consiste rsoudre numriquement l'quad

tion direntielle
x = f (x, u, w, p) partir d'une condition initiale x(0) =
dt
x0 , d'un scnario de perturbations t 7 w(t) donn l'avance et de certaines
valeurs des paramtres
p.
Les valeurs du contrle sont galement requises.
t 7 u(t), on parle
u est au contraire calcul
Lorsque le contrle est une loi horaire donne l'avance

de simulation en boucle ouverte . Lorsque le contrle
en fonction de
ou de
(i.e. par bouclage d'tat ou de sortie), on parle de
simulation en boucle ferme .

Le contrle
avec un tat
I,
donn par (1.19) fait apparatre une quation direntielle

c'est un bouclage dynamique . Pour calculer l'volution de
la temprature, il faut aussi xer la condition initiale

mentaire
I.
I0
sur l'tat suppl-
Enn, pour simuler, il faut aussi se donner le scnario pour la
consigne de temprature
t 7 (t)
et connatre les paramtres
Kp , Ki
et
Ks
de rglage du rgulateur.
Considrons une simulation en boucle ferme. Le modle correspondant
est
d
(t)
dt
d
I(t)
dt
avec u(t)
ext
rad
= (M Cpu(t)
( (t)) + M
( (t))
)(u(t)+rad ) ch
Cp ext
= Ki ( (t)) + Ks (u(t) Kp ( (t)) I(t))

+ I(t))
= S at (Kp ( (t)
w = (ext , ch ) constant. Si on choisit des

Ks > 0 tels que Ks Kp > Ki , on constate que les
avec
gains
(1.21)
Kp > 0, Ki > 0 et
t 7 ((t), I(t))
trajectoires
convergent toutes vers le mme point, indpendamment de leur condition

initiale. Ce point est donc globalement asymptotiquement stable. Le contrle
u(t)
converge vers une valeur
ncessairement la limite de
(t)
dans
[0, 1].
De plus, si
est la consigne
0 < u < 1
alors
62
CHAPITRE 1.
Avec ces rglages, on n'a pas besoin de connatre prcisment les valeurs
des coecients d'changes thermiques ni celles de l'inertie thermique du btiment ni la valeur de la temprature extrieure. Par ces simulations, on se
rend donc compte qu'avec un algorithme de contrle lmentaire de type
PI, il est possible de contrler la temprature d'une trs large gamme de
btiments dont les transitoires thermiques peuvent tre dcrits de faon approximative par une quation bilan du type de celle construite ci-dessus. En
fait, nous allons voir que cette constatation exprimentale correspond un
rsultat gnral.
d
x=
dt
et croissante de u pour
Considrons un systme avec un tat de dimension 1. Il sut que
f (x, u, w, p)
soit une fonction dcroissante de
qu'un tel rgulateur fonctionne.
x=
1.5.
63
CAS D'TUDE
1.5.6 Un rsultat gnral : rgulateur PI sur un systme

non linaire du premier ordre
Rsultat
On considre le systme (mono-dimensionnel) du premier ordre
d
x = f (x, u)
(1.22)
dt
d'tat x(t) R avec le contrle scalaire u(t) R soumis aux contraintes
u [umin , umax ] (umin < umax ). On suppose que R [umin , umax ] 3 (x, u) 7
f (x, u) R est une fonction continue et drivable par morceaux. Les seules
informations que nous avons sur notre modle, i.e. sur f , sont de nature
min
qualitative : pour tout (x, u) R [u
, umax ],
f
(x, u) 0
x
et
f
(x, u) > 0
u
On suppose en outre qu'il existe un rgime stationnaire respectant strictement les contraintes sur le contrle : il existe
(
x, u) R]umin , umax [
tel que
f (
x, u) = 0.
Nous allons montrer que le rgulateur PI avec anti-emballement
u = S at [Kp (
x x) + I] ,
o la fonction saturation
d
I = Ki (
x x)+Ks (u Kp (
x x) I)
dt
S at
(1.23)
est dnie par
min
u ,
u,
R 3 u 7 S at (u) =
max
u ,
si
si
si
u umin ;
umin u umax ;
umax u.
(1.24)
(
x, u) globalement asymptotiquement stable pour le
(x, I) ds que ses gains, Kp le gain proportionnel, Ki
rend le point d'quilibre

systme d'tat tendu
le gain intgral et
Ks
le gain d'anti-emballement , vrient
Kp > 0,
Ki > 0,
Ks > 0,
et
Ks Kp Ki
Dynamique tudier
Nous cherchons montrer la stabilit asymptotique globale du point
(
x, u). Nous cherchons donc tablir que,
(x , I 0 ), la solution t 7 (x(t), I(t)) du systme
d'quilibre
0
initiale
pour toute condition

boucl
d
x = f (x, S at [Kp (
x x) + I])
dt
d
I = Ki (
x x) + Ks (S at [Kp (
x x) + I] Kp (
x x) I)
dt
(1.25)
64
CHAPITRE 1.
Figure 1.21 Le rectangle R est positivement invariant car le champs de

vecteurs
bord de
X 7 F (X)
R .
pointe vers l'intrieur lorsque
X = (x, I)
parcourt le
t 0 et que sa limite quand t tend vers + est (

x, u).
Dans tout ce qui suit, nous considrons l'tat tendu X = (x, I) et rd
crivons (1.25) sous la forme
X = F (X). La fonction F : R2 R2 est une
dt
= (
fonction continue et drivable par morceaux de X . On note aussi X
x, u)
le point d'quilibre de F : F (X) = 0.

existe pour tout temps
Les trajectoires sont bornes

Nous allons montrer que les trajectoires du systme (1.25) restent bornes
pour
t > 0.
Elles seront donc automatiquement dnies pour tout temps
0. Pour cela nous allons considrer le plan
de phases
t>
X = (x, I) et construire
une famille de rectangles embots les uns dans les autres. Chacun de ces
rectangles est positivement invariant par la dynamique (voir Dnition 22) :
si la condition initiale appartient l'intrieur d'un de ces rectangles alors il
est impossible la trajectoire d'en sortir. Pour tablir ce point, il sut de
F (X) quand X parcourt le bord du

F (X) pointe constamment vers l'intrieur, alors il est impossible
regarder la direction du vecteur vitesse

rectangle : si
de sortir du rectangle en intgrant selon les temps positifs. L'existence de ces

ensembles repose sur les hypothses dj voques
Ks Kp Ki , f
La fonction
croissante par rapport
S at
Kp > 0, Ki > 0, Ks > 0,

x.
et dcroissante par rapport
qui intervient dans (1.24) conduit un dcoupage en trois
zones du plan de phases
(x, I)
(voir Figure 1.21) selon la position de
Kp (
x
1.5.
65
CAS D'TUDE
x)+I par rapport umin et umax : les deux zones satures Kp (

x x)+I umax
et Kp (
x x)+I umin et la zone sans saturation umin Kp (
x x)+I umax .
max
min
Posons L = max(u
u, u u ) > 0. Comme reprsent sur la Figure 1.21, considrons, pour L, le rectangle R de centre (
x, u), de cots
parallles aux axes et coupant l'axe des x en x
/Kp et l'axe des I en u .
x
I
tudions maintenant, en dtaillant ses composantes F et F , la direction,
pour (x, I) sur le bord de R , du vecteur tangent la trajectoire
F (x, I) =
x

F (x, I) = f (x, S at [Kp (
x x) + I])
F I (x, I) = Ki (
x x) + I] Kp (
x x) I)
(cot horizontal suprieur) pour I = u
+ et
I
on voit que F (x, u
+ ) 0 ; en eet si x
x [
x /Kp , x + /Kp ],
[
x /Kp , x] on a
}|
{z }| {
}|
{
z
z
x x) +Ks (umax u ) 0;
F =(Ki Ks Kp )(
I
si
x [
x, x + (
u + umax )/Kp ]
on a
z }| {
z
}|
{
F I = Ki (
x x) +Ks (umax u Kp (
x x)) 0;
si
x [
x + (
u + umax )/Kp , x + /Kp ]
on a
z }| {
F = Ki (
x x) 0
x
F
F =
pointe vers le bas
FI
I
Ainsi, le vecteur
le long du cot hori-
zontal suprieur.
(cot vertical droit) pour
x = x + /Kp
et
I [
u , u + ] on voit que
F x (
x + /Kp , I) 0;
en eet si
I [
u , umin + ]
on a
F x = f (
x + /Kp , umin ) f (
x, umin ) f (
x, u) = 0
car
f
x
et
f
u
> 0;
si
I [umin + , u + ]
on a de mme
F x = f (
x + /Kp , I ) f (
x, I ) f (
x, u) = 0
Ainsi, le vecteur
pointe vers la gauche le long du cot vertical droit.
66
CHAPITRE 1.
On dmontre, de la mme faon, que
pointe vers le haut le long du cot
horizontal infrieur et pointe vers la droite le long du cot vertical gauche.

En conclusion, pour tout
L,
le vecteur tangent la trajectoire
pointe vers l'intrieur du rectangle
R .
F (X)
Cet ensemble est donc positivement
invariant.
0
Prenons maintenant une condition initiale X
= (x0 , I 0 ) arbitraire. Il
0
existe toujours au moins un (il sut de le prendre assez grand en fait)
d
0
X = F (X) avec
pour que X soit l'intrieur de R0 . Ainsi, la solution de
dt
X(0) = X 0 reste dans R0 pour tout temps positif : elle est donc dnie pour
tout temps
t>0
et reste borne.
Stabilit asymptotique
Nous cherchons maintenant tudier la convergence des trajectoires. On
suppose que l'quilibre
(
x, I)
rside strictement l'intrieur des contraintes,
c.--d.
umin < I = u < umax

Pour
(x, I)
autour de
,
(
x, I)
le systme s'crit
x = f (x, Kp (
x x) + I)
dt
d I = Ki (
x x)
dt
(1.26)
Le calcul du linaire tangent fait apparatre la matrice Jacobienne suivante
f
x (
x,
u)

Kp f
u (
x,
u)
Ki
f
u (
x,
u)
!
(1.27)
La trace de cette matrice 2 2 est strictement ngative car Kp > 0, Ki > 0,

f
0 et f
> 0 par hypothse. Son dterminant est strictement positif
x
u
pour les mmes raisons. Donc ses deux valeurs propres sont partie relle
strictement ngative. Ainsi, quels que soient les choix de
Kp > 0 et Ki > 0, le
linaire tangent est toujours localement asymptotiquement stable (voir par

exemple la Section 1.2.3).
C'est bien un systme continu et stationnaire dans le plan. On peut donc
utiliser le Thorme 12 de Poincar. Nous avons vu que les trajectoires restent
bornes. Donc, les trajectoires convergent soit vers un quilibre, soit vers une
courbe ferme du plan qui dlimite un domaine born.
(
x, I = u) dont on
est
contraintes. En eet, (
x, I)
Or, il n'existe pas d'autre quilibre que l'quilibre

a suppos l'existence l'intrieur strict des
1.5.
67
CAS D'TUDE
l'unique solution de
f (x, S at [Kp (
x x) + I]) = 0
Ki (
x x) + I] Kp (
x x) I) = 0
L'unicit rsulte du raisonnement suivant

Si
umin Kp (
x x) + I umax ,
on a
alors la premire quation donne
x = x
par la seconde quation, et
comme solution de
f (
x, I) = 0.
Or,
f est strictement croissante par rapport son second argument, donc

I = I.
Si Kp (
x x) + I > umax , la premire quation f (x, umax ) = 0 implique
que x > x
, car f (
x, umax ) > 0 et f est dcroissante par rapport x. La
seconde quation donne alors Ki (x
x) = Ks (umax (Kp (
xx)+I)) < 0,
car Ks > 0 par hypothse. Ceci contredit le fait que x est plus grand
que x
.
Si Kp (
x x) + I < umin , la premire quation f (x, umin ) = 0 implique
que x < x
et la seconde le contraire.
de (1.25),
Pour montrer la convergence globale vers l'unique quilibre (
x, I)
il sut de montrer qu'il n'existe pas de courbe ferme du plan, forme partir de trajectoires du systme. Il ne restera que la convergence vers l'unique
quilibre comme rgime asymptotique possible.
Pour montrer qu'il n'existe pas de telles courbes fermes, nous procdons
par contradiction. Admettons qu' partir des trajectoires de (1.25), on puisse
former par raccordement une courbe ferme du plan. On note
l'intrieur
F
. Cette intgrale est gale l'intgrale sur le bord
16
sortant . Avec < ., . > le produit scalaire usuel, il vient
Z Z
I
divF =
< F, n > ds
de cette courbe ferme. Calculons l'intgrale de la divergence du champ

sur le domaine born
de son ux
n est la normale extrieure. Par construction, le champs de vecteur associ
(1.25)

F =
f (x, S at [Kp (
x x) + I])
at
Ki (
x x) + Ks (S [Kp (
x x) + I] Kp (
x x) I)
est tangent au bord
de
: son ux sortant est donc nul. Pourtant, on
remarque que sa divergence (trace de la matrice Jacobienne) est toujours

strictement ngative
f
f
Kp (S at )0 + Ks ((S at )0 1) < 0
x
u
16. Il s'agit du thorme de Gauss souvent utilis en lectrostatique.
68
CHAPITRE 1.
(S at )0 vaut soit 0 soit 1. On obtient la contradiction recherche. En conclu est

sion, il n'existe pas de telle courbe ferme, et le point d'quilibre (
x, I)
car
globalement asymptotiquement stable.

En fait nous avons montr le point no 1 du rsultat suivant :
Thorme 17 (PI avec anti-emballement sur un premier ordre non-linaire

d
x = f (x, u) avec,
et stable). Soit le systme du premier ordre non-linaire
dt
x R, u [umin , umax ], f continue, drivable par morceau vriant f

(x, u)
x
f
min
max
0, u (x, u) > 0 pour tout avec (x, u) R [u , u ].
Soit le rgulateur PI avec anti-emballement de consigne x
R:
u = S at [Kp (
x x) + I] ,
avec
Kp , Ki > 0, Ks Kp > Ki
d
I = Ki (
x x) + Ks (u Kp (
x x) I)
dt
et
S at () max(umin , min(umax , )).
Alors on a
les deux cas suivants :
u ]umin , umax [ tel que f (

x, u) = 0 et alors l'quilibre
(x, I) = (
x, u) du systme boucl est unique et globalement asympto-
1. soit il existe
tiquement stable au sens de Lyapounov

2. sinon :
min
soit [u
, umax ], f (
x, ) < 0 (resp. > 0) alors limt7+ u(t) =
max
min
u
(resp. u
) et limt7+ x(t) existe, est ventuellement innie
[, x[ (resp. ]
x, +])
max
soit f (
x, u ) = 0 (resp. f (
x, umin ) = 0) alors limt7+ u(t) = umax
min
(resp. u
) et limt7+ x(t) existe, est nie dans ] , x
[ (resp.
]
x, +[).
dans
Le point no 2 signie simplement que, compte tenu des contraintes, le

rgulateur PI fait au mieux, i.e., tente de rapprocher au maximum
consigne
x.
de sa
La preuve de ce point est laisse en exercice.
1.5.7 Dynamiques ngliges : rle du contrle dans l'approximation

Les simulations en boucle ferme du thermostat que nous pouvons dduire du modle (1.21) ne sont qu'une reprsentation approximative de la
ralit. Cela est d, entre autres, l'criture par un modle continu (1.19)
du rgulateur PI qui est l'origine rgi par des quations discrtes (1.18).
Si la priode d'chantillonnage
est petite nous ne faisons qu'une petite
erreur. D'autres erreurs proviennent des nombreux phnomnes dynamiques

ngligs comme par exemple l'htrognit des tempratures
et
rad ,
les
uctuations de la chaudire dues sa propre rgulation de temprature, ...
1.5.
69
CAS D'TUDE
Bref, nous avons implicitement suppos, en accord avec les rsultats de la

Section 1.4, que si d'autres phnomnes transitoires existent, ils sont rapides
et stables. En consquence, notre modle de simulation ne prend en compte
que les dynamiques les plus lentes (disons celles qui sont plus lentes que 30
minutes).
Est-ce gnant en pratique ? Bien qu'en thorie nous avons montr que
l'quilibre de (1.21) est globalement asymptotiquement stable pour tout gain
Kp , Ki
et
Ks
positifs vriant
Ks Kp > Ki ,
il apparat, lorsqu'on passe aux
exprimentations, un phnomne qui semble contredire ce rsultat. Le rsum

des direntes expriences qu'on peut raliser est qu'il n'est pas possible de
choisir ces gains aussi grands que nous le souhaiterions. Lorsque les gains
sont petits on constate un bon accord entre la thorie propose et la pratique.
Lorsque les gains sont grands, on constate des carts importants, voire des
instabilits.
Ceci est en fait en accord avec la thorie, si on en revient aux hypothses que nous avons formules plus ou moins explicitement. L'explication
est que des gains trs grands rendent le systme (1.21) trs rapide. Pour s'en
convaincre il sut de voir que les valeurs propres du systme linaire tangent
autour de l'quilibre
(
x, I)
sont celles de la matrice Jacobienne (1.27). Au
moins une des valeurs propres de cette matrice tend vers l'inni (en module)
quand
Kp
et/ou
Ki
tendent vers
+.
S'il est possible, en thorie, de rendre
le systme (1.21) aussi rapide qu'on le dsire grce un rgulateur PI avec

des grand gains, en pratique, les gains du rgulateur sont limits par l'apparition d'instabilits lies toutes les dynamiques rapides ngliges et qui sont
alors excites par le contrle. Les hypothses d'application des thormes
d'approximation ne sont plus vries. Par exemple, l'approximation du PI
discret par un PI continu n'est plus valable, si on prend
Ti = Kp /Ki
d'chantillonnage t. On va
le temps intgral
Kp
et
Ki
tels que
est du mme ordre de grandeur que la priode

se concentrer sur un des possibles problmes
qui est caractristique de ce phnomne : la dynamique nglige de la sonde

thermique.
Exemple : le rle de la sonde
Rajoutons au modle de simulation en
boucle ferme (1.21), la dynamique de la sonde de temprature. Le modle

le plus simple ayant une base physique vidente est une dynamique linaire
stable du premier ordre (ltre passe-bas) avec une constante de temps trs
petite car la sonde a trs peu d'inertie thermique et donc rpond trs rapidement (en quelques secondes pour xer l'ordre de grandeur) aux changements
de la temprature de l'air ambiant. Ce modle est vriable exprimentalement, par analyse de la rponse transitoire de la sonde thermique des
70
CHAPITRE 1.
signaux d'excitation type chelon. En notant
> 0
cette petite constante
de temps, la temprature qu'on peut utiliser pour le calcul de u n'est plus

m relie via le ltre du premier ordre suivant
mais sa mesure note
d m m
=
dt
Cette dynamique supplmentaire complte le modle en boucle ferme tudier. Celui-ci est alors
d
(t)
dt
d
I(t)
dt
d m
dt (t)
avec u(t)
En posant
ext
rad
= (M Cpu(t)
( (t)) + M
( (t))
)(u(t)+rad ) ch
Cp ext
m
= Ki ( (t)) + Ks (u(t) Kp ( m (t)) I(t))
= (t) m (t)
= S at (Kp ( m (t) + I(t))
X = (, I)
et
Z = m ,
(1.28)
ce modle admet la structure suivante
d
X = F (X, Z),
dt
d
Z = G(X, Z),
dt
alors que le modle initial (1.21) correspond en fait
d
X = F (X, Z),
dt
=0
0 = G(X, Z).
G
(X, Z)
Z
sont toutes partie relle ngative (ce qui
En application du Thorme 15 de Tikhonov, si les valeurs propres de

pour
(X, Z) vriant G(X, Z) = 0
est trivialement le cas ici), alors, pour
> 0
assez petit, les trajectoires
des deux modles sont trs proches. Autrement dit, si la dynamique de la

sonde thermique est stable et rapide devant les autres dynamiques, on peut
la ngliger.
On comprend galement pourquoi on ne peut pas choisir les gains
Kp
Ki trop grands. Si tel est le cas, Kp et/ou Ki sont alors du mme

d
1
X comportera des termes en 1 . L'criture
ordre de grandeur que . Donc
dt
d
sous la forme
X = F (X, Z) avec dtd Z = G(X, Z) n'est plus valable et
dt
l'approximation prcdente peut tre mise en dfaut. On ne sait plus dduire
et/ou
de la stabilit de (1.21) une information sur celle de (1.28). Dans ce cas, la

dynamique de la sonde, bien que stable isolment, n'est plus rapide devant
les autres dynamiques. L'approximation n'est pas valable.
1.5.8 Intrt de la pr-compensation (feedforward)

Pour amliorer les performances de la rgulation de temprature (et donc
le confort), on peut complter le rgulateur prcdent en utilisant les techniques de pr-compensation et de feedforward.
1.5.
71
CAS D'TUDE
Trs souvent, on utilise aussi pour ajuster la position de la vanne trois

voies,
u, la temprature extrieure, ext . Ainsi, u ne dpend pas seulement de

et de sa consigne , mais aussi de ext . Souvent,
la temprature intrieure
on substitue alors aux quations (1.19) les quations suivantes
u(t) = S at (Kp ( (t))

+ I(t) Kext ext )
d I(t) = Ki ( (t)) + Ks (u(t) Kp ( (t)) I(t) + Kext ext )

dt
, lorsque la tempraavec Kext un coecient positif. Ainsi, mme si =
ture extrieure baisse, u a tendance augmenter pour anticiper la prochaine
baisse de . Le rajout de ext permet d'anticiper les variations de temprature
extrieure. C'est le terme de pr-compensation .
Une autre amlioration un peu plus subtile est celle qu'on utilise lors
de changement de la consigne
consigne de temprature
Il est assez frquent de programmer une
un peu plus basse dans la journe, pendant les
heures o les habitants sont absents, et un peu plus haute en dbut et en

n de journe. Ainsi
que la temprature
est
une fonction constante par morceaux. Il est clair
ne peut pas suivre
chacune de ses discontinuits : la
rponse de notre systme n'est pas instantane ; notre modle (1.20) implique
que est une
max > 0 cette
fonction drivable de
borne
et dont la drive est borne. Notons

d
(t) max

dt
pour la transformer en
(t)
est constante,
une fonction continue drivable par morceaux r (t) : l o
r est aussi constante ; l o admet un saut, alors r est la fonction ane
max
par morceau de pente infrieure en module
( 1) qui remplace le
saut par une rampe comme illustr sur la Figure (1.22). Ainsi, r (t) est une
, drivable par morceaux et dont la drive
approximation continue de (t)
max
reste toujours plus petite que
en valeur absolue. En quelque sorte, r (t)
tout en
est une consigne de temprature variable dans le temps, proche de
Il est naturel de modier localement la fonction
tant rellement ralisable par le systme. On parle de ltrage de consigne .
r (t) qui lisse la consigne
brute (t).
, on rajoute alors au PI (1.19) la drive r
Avec r (t) au lieu de (t)
u(t) = S at (Kp (r (t) (t)) + I(t) + Kr r (t))

d I(t) = Ki (r (t) (t)) + Ks (u(t) Kp (r (t) (t)) I(t) Kr r (t))
dt
avec Kr un coecient positif. L'eet de ce terme est le suivant. Supposons
que pour t < 0, = r . partir de t = 0, r commence une rampe de pente
Il est facile de calculer en temps rel la fonction
72
CHAPITRE 1.
Figure
1.22 Approximation de la consigne brute
,
t 7 (t)
fonction
constante par morceaux impossible suivre cause des discontinuits, par

la rfrence
t 7 r (t),
fonction continue et drivable par morceaux corres-
pondant une trajectoire ralisable par le systme.
constante positive rsultant d'une augmentation de la consigne brute
t = 0.
Alors, le terme en
contrle
r ,
en
dit de feedforward aura tendance booster le
avec un surplus de chauage pour compenser l'inertie thermique
du btiment et ainsi avoir une temprature
qui suivra mieux la rfrence
ralisable. Il s'agit d'une anticipation sur la rampe de monte. De mme,

la n de la rampe de monte pour
r , r
retourne
et alors, le contrle
aura un saut vers le bas, une sorte de freinage pour viter que
en n de monte la valeur de
ne dpasse
(vite l'over-shoot). C'est le feedforward .
La combinaison de ses deux types d'anticipation, l'une sur la perturbation

mesure
ext , l'autre sur la consigne variable , conduit l'algorithme PI avec
anticipation suivant
h
i
u(t) =S at Kp (r (t) (t)) + I(t) + Kr r (t) Kext ext
d
I(t) =Ki (r (t) (t))
dt
h
i
+ Ks u(t) Kp (r (t) (t)) I(t) Kr r (t) + Kext ext

(1.29)
Des versions plus ou moins sophistiques de cet algorithme sont utilises dans
les thermostats vendus dans le commerce.
1.5.9 Pr-compensation et suivi de trajectoires sur un

systme linaire du premier ordre
Pour comprendre de faon plus formelle et plus prcise le rle de ces
deux types d'anticipation, prenons comme modle de contrle, le modle
u, ext ). On note et u les carts

(,
et u, donne
l'quilibre. La premire variation de (1.20) autour de l'quilibre
linaire tangent autour d'un quilibre
un systme du premier ordre stable. On va la calculer. Le modle (1.20) est
1.5.
73
CAS D'TUDE
de la forme
dt
u, ext ) = 0.
f (,
= f (, u, ext )
avec
fonction rgulire de ces arguments et
Il est d'usage de noter
par
y , u
par
et
ext
par
d
y = ay + bu + dw
dt

f
f
f
, b=
, d=
a=
,
u ,
ext ,
u,ext
u,ext
u,ext
avec
On remarque que
a > 0, b > 0
et
d > 0.
w.
(1.30)
Ainsi, le systme est asymptotique-
y comme
= 1/a, excit
ment stable en boucle ouverte. On peut interprter la temprature

la sortie d'un ltre du premier ordre de constante de temps
par le signal
(bu + dw)
en notant
d
1
y = ( bu + dw y)
dt
Pour simplier, nous considrons ici :
umin =
et
Supposons qu'on souhaite suivre une rfrence
umax = +.
t 7 yr (t) continue
et
drivable par morceaux tout en connaissant chaque instant la perturbation w(t). On dnit le contrle de rfrence comme tant la fonction
t 7 ur (t) continue par morceaux et telle que dtd yr = ayr + bur + dw, c'est
dire
y r (t) + ayr (t) dw(t)

b
alors ur une correction de
ur (t) =
u, on rajoute
e = y yr
Pour obtenir
de suivi,
u(t) = ur (t) + Kp (yr (t) y(t)) + I(t),
type PI sur l'erreur
d
I(t) = Ki (yr (t) y(t))
dt
La partie anticipation (feedforward ) correspond
ur
: elle compense, de
faon cohrente avec le modle, les eets transitoires dus aux variations de
yr
et
w.
On obtient ainsi en boucle ferme un systme direntiel autonome
pour les variables
e = y yr
et
d
e = (bKp + a) e + bI,
dt
d
I = Ki e
dt
Ce systme s'crit alors sous la forme d'un systme du second ordre
d2
d
e = 20 e (0 )2 e
2
dt
dt
avec les notations usuelles
20 = (bKp + a) ,
(0 )2 = bKi
(1.31)
74
CHAPITRE 1.
0 > 0
est la pulsation de coupure et
> 0,
le facteur d'amortisse-
w et yr varient au cours du temps, leurs variations sont

ur qui est une combinaison linaire de yr , y r et w. On
comprend mieux l'intrt des termes Kr y r et Kext w dans (1.29).
En pratique, les coecients a, b et d ne sont connus qu'avec une certaine
approximation. Si l'on note a , b et d les carts entre leurs vraies valeurs
(celles du modle (1.30)) et celles utilises pour le calcul de ur par y r =
(a a )yr + (b b )ur + (d d )w, alors la dynamique de l'erreur e devient
ment . Ainsi, mme si

pr-compenses par
d
d2
e = 20 e (0 )2 e + b u r + d w + a y r
2
dt
dt
En absence de terme de feedforward, le simple contrleur PI
u = Kp (yr y) + I,
d
I = Ki (yr y)
dt
conduit un systme du second ordre similaire pour
e = y yr
d
d2
d2
2
e
=
2
e
(
)
e
yr + dw + ay r
0
0
dt2
dt
dt2
mais avec un terme source
que
b u r + d w + a y r
dtd 2 yr + dw ay r
(1.32)
a priori beaucoup plus grand
dans (1.31), puisque les erreurs paramtriques sont
supposes peu importantes. Ainsi, mme avec des erreurs de modlisation, le

rajout de
ur
plus prs de
conduit en gnral une amlioration notable du suivi :
reste
0.
En l'absence de feedforward, on voit que la partie rtro-action, le feedback, doit alors corriger aprs coup les variations de la rfrence
perturbations
rfrence
yr
w.
yr
et les
Il en rsulte une moins bonne prcision dans le suivi de la
et des performances dgrades car on demande au feedback de
compenser non seulement les erreurs de modle, ce qui est son rle premier,
mais aussi les variations de
feedforward
yr
et
w,
ce qui est mieux ralis par le contrle
ur .
1.6 Cas d'tude : contrle hirarchis et rgulateurs en cascade

La thorie des systmes lents/rapides (en particulier le Thorme 15 de
Tikhonov) permet de justier une pratique courante pour la synthse de
boucle de rgulation : le contrle hirarchis qui consiste imbriquer les rgulateurs. Un exemple sura pour comprendre ce dont il s'agit. Cet exemple
1.6.
75
CAS D'TUDE
est non trivial car il s'agit d'un systme du second ordre avec dynamique
inconnue et des contraintes la fois sur l'tat et sur le contrle. La synthse
d'un contrleur prenant explicitement les contraintes d'tat est un problme
largement ouvert et pour lequel on ne dispose pas, l'heure actuelle, de solution systmatique et simple. Des solutions plus numriques fondes sur les
techniques de commande prdictive peuvent tre considres mais elles sont
coteuses en temps de calculs et peuvent poser problme en particulier en
ce qui concerne l'existence de solutions et la convergence numrique
17
. Le
contrleur que nous proposons ci-dessus s'appuie sur le paradigme des systmes lents/rapides, sa structure est facile comprendre. Le rglage des gains
est simple et s'eectue partir des contraintes. Nous donnons des formules
explicites qui peuvent tre utilises.
Considrons un systme du second ordre de la forme suivante
d
d2
x
=
f
(x,
x) + u
dt2
dt
o
x et u sont dans R. De tels modles se rencontrent naturellement pour les
systmes mcaniques (par formulation variationnelle) : il s'agit par exemple

de l'quation de Newton qui relie l'acclration aux forces extrieures parmi
lesquelles se trouve le contrle
f (x, dtd x).
u.
On suppose qu'on ne connat pas bien
Il est possible de se ramener, au moins approximativement, au cas de deux

systmes du premier ordre. Le principe de la stratgie de contrle hirarchis
comporte deux tapes : un premier rgulateur proportionnel (rgulateur P)
d
x vers une consigne v. Un
assure la convergence rapide de la vitesse v =
dt
second rgulateur PI cherche stabiliser la position x x
et, pour ce faire,
met lentement jour la consigne du rgulateur de vitesse
v.
Comme nous
allons le voir, il est assez ais de prendre en compte des contraintes sur la
vitesse
et le contrle
u.
crivons l'quation du second ordre sous la forme d'un systme de deux
17. La technique MPC (Model Predictive Control) propose une slection optimale, au
sens d'un critre choisi par l'utilisateur, parmi des trajectoires satisfaisant des contraintes.
Elle suppose l'existence de telles trajectoires et l'unicit d'un optimum caractrisable numriquement. Ce sont ces hypothses qui sont bien souvent diciles garantir sur des
exemples concrets gnraux. Si ces hypothses sont vries, la technique MPC consiste
en la rsolution itre du problme d'optimisation avec mise jour chaque nouvelle
priode d'chantillonnage de la condition initiale. La fonction cot optimal est alors une
fonction de Lyapounov, elle garantit la stabilit.
76
CHAPITRE 1.
quations du premier ordre
x=v
dt
d v = f (x, v) + u
dt
(1.33)
u [umax , umax ] et v [v max , v max ] (umax , v max > 0). On

considre un rgime stationnaire caractris par un tat admissible (
x, v = 0)
et un contrle admissible u
; soit |
u| < umax et f (
x, 0) + u = 0. On cherche par
un bouclage u stabiliser (x, v) en (
x, u), en respectant les contraintes sur u
max
et aussi sur v . Prcisment, si la vitesse initiale v0 appartient [v
, v max ]
alors on souhaite que pour t > 0 la vitesse v(t) du systme en boucle ferme
max
reste aussi dans [v
, v max ]. Cet objectif doit tre atteint de manire robuste
aux incertitudes sur la fonction f (x, v).
Sans hypothse supplmentaire sur f , il est dicile de donner une rponse
un peu gnrale ce problme. Nous allons supposer qu'il existe 0 < < 1
tel que pour tout (x, v),
|f (x, v)| umax
(1.34)
Les contraintes sont
Cela veut dire que pour toute valeur de
qui domine
f (x, v)
(x, v),
on peut choisir un contrle

d2
x. Cette hypothse est
et ainsi imposer le signe de
dt2
essentielle.
La cascade de deux rgulateurs, voque ci-dessus, donne l'algorithme de
contrle suivant
x x) + Ks (
v Kp (
x x) I)
dt I = Ki (
v = Svat [Kp (
x x) + I]
at
u = Su [Kp (
v v)/]
(1.35)
Kp > 0, Ki > 0, Ks > 0, Ks Kp > Ki , et un paramtre positif. Les

Svat et Suat sont les fonctions de saturation usuelles (telles que celle
utilise en (1.24)) associe aux contraintes sur v et u (projections sur les
max
convexes [v
, v max ] et [umax , umax ]).
avec
fonctions
La dynamique en boucle ferme est le systme de trois quations direntielles non linaires suivant
x=v
dt
d
x x) + I] v)/]
v = f (x, v) + Suat [Kp (Svat [Kp (
dt
d I = Ki (
x x) + Ks (Svat [Kp (
x x) + I] Kp (
x x) I)
dt
1.6.
77
CAS D'TUDE
Pour
(x, v, I)
proche de
at
Sv et
ci-dessus devient
les fonctions
at
Su
(
x, 0, u),
les contraintes ne sont pas actives et donc
sont les fonctions identits. Ainsi, le systme boucl
x=v
dt
d
x x) + I) v)
v = f (x, v) + Kp (Kp (
dt
d I = Ki (
x x)
dt
Ce systme est bien sous la forme standard du thorme 15 de Tikhonov :
l'tat lent est
(x, I),
l'tat rapide
v,
et la dynamique rapide est bien asymp-
totiquement stable. Le systme lent
d
x = v,
dt
d
I = Ki (
x x)
dt
est bien asymptotiquement stable. On conclut la stabilit via le thorme 16. En l'absence de contraintes, la preuve de la stabilit repose uniquement sur le fait que
est susamment petit.
Pour garantir la stabilit avec la prise en compte des eets non linaires
dus aux fonctions de saturation
et
Ki
Suat
et
Svat ,
il convient de ne pas choisir
Kp
n'importe comment. Intuitivement, si notre raisonnement par chelles
de temps est correct, il faut que le systme rapide soit en mesure de suivre
sa consigne
v = Svat [Kp (
x x) + I]
mme si cette dernire varie au cours du

d
v doit respecter les contraintes
temps : cela entrane qualitativement que
dt
sur u, tout au moins sur la partie de u qui reste disponible aprs avoir domin
la dynamique f (x, v). Cela veut dire approximativement que le module de
d
v ne doit pas dpasser (1 )umax . Il nous faut maintenant avoir une ide
dt
d
de l'ordre de grandeur de
v : pour cela on drive dans le cas non satur v
dt
d
et on nglige la variation de I . Cela nous donne comme estimation de
v :
dt
v max
Kp v . Ainsi, il est naturel d'imposer Kp (1)umax .
On constate, avec des simulations numriques qu'avec
Kp =
v max
,
(1 )umax
Ki =
Kp2
,
5
Ks =
2Kp
,
5
= 3,
le contrleur (1.35) est bien stabilisant tout en respectant les contraintes sur
et approximativement les contraintes sur
v.
Ce qui prcde n'est pas une preuve formelle mais plutt une illustration
de la dmarche fonde sur la thorie des perturbations pour concevoir un
rgulateur simple pour un systme du second ordre dont le modle comporte
d'importantes incertitudes que l'on peut dominer par un contrle born. De
plus ce rgulateur (1.35) prend en compte la contrainte d'tat
|v| v max .
78
CHAPITRE 1.
Chapitre 2
Fonctions de transfert
Les rsultats du Chapitre 1 sont essentiellement de nature qualitative.

La stabilit d'un systme est garantie sous l'hypothse qu'un paramtre
soit susamment petit. Dans ces conditions, on peut alors raisonner sur un
systme simpli (nominal). La question de la robustesse a t traite de
manire perturbative : si le systme nominal en boucle ferme ou en boucle
ouverte admet un quilibre asymptotiquement stable , alors le systme perturb
(rgulirement et/ou singulirement)
admet un quilibre voisin de celui du
systme nominal, quilibre qui est lui aussi asymptotiquement stable.

La question de savoir partir de quelle valeur critique
de
il y a perte
de stabilit est importante, notamment d'un point de vue pratique. Comme

nous allons le voir dans ce chapitre, une rponse est lie aux notions de
marges de robustesse que nous allons dnir. On notera que, d'un point de
vue formel, l'tude des changements qualitatifs de comportement d'un systme dynamique en fonction de paramtres intervenant dans les quations
est l'objet de la thorie des bifurcations et des catastrophes [21]. Cette thorie
dpasse largement le cadre de ce cours.
Les marges de robustesse sont des notions diciles aborder de faon
gnrale pour un systme non linaire. Cependant, il est possible, une fois de
plus, d'obtenir des informations prcieuses en considrant le systme linaris
tangent autour de l'quilibre.
1. On parle de perturbations rgulires lorsque
apparat dans les membres de droite

d
d
dt x = f (x, z, ) et dt z = g(x, z, ). On
parle de perturbations singulires lorsque apparat gauche devant une drive en temps,
d
d
d
comme par exemple
dt x = f (x, z) et dt z = g(x, z). Ainsi le systme dt x = f (x, z, ) et
d
dt z = g(x, z, ) est la fois rgulirement et singulirement perturb. Ses solutions sont
d
alors proches de celles du systme nominal (obtenu en faisant = 0,
dt x = f (x, z, 0) et
des quations direntielles, comme par exemple,
0 = g(x, z, 0))
sous certaines hypothses comme celles du thorme 15.
79
80
CHAPITRE 2.
FONCTIONS DE TRANSFERT
On utilise sur ce systme linaire le calcul symbolique , i.e. on remplace

d
par la variable de Laplace s C (en utilisant la transforme
l'oprateur
dt
3
de Laplace voir [53]). Grce ce formalisme , on peut faire des calculs algbriques pour aboutir une quation reliant entre et sortie. Le systme est
alors reprsent par une fonction de la variable complexe
correspondant enn
(note aussi
et
en thorie des circuits). Cette fonction est appele
fonction de transfert . L'analyse complexe fournit une rponse directe (par le

Thorme de Cauchy) la dnition des marges de robustesse.
2.1 Passage la fonction de transfert

Nous allons considrer l'exemple (1.30) de la n du chapitre prcdent
d
y(t) = ay(t) + bu(t) + dw(t)
dt
(2.1)
a, b et d positifs et constants. Ce systme est linaire. Le contrle est u, la

perturbation w et la mesure y . On a vu, toujours dans le chapitre prcdent,
avec
qu'un simple
rgulateur PI
d
I = Ki (yr y)
dt
u = Kp (yr y) + I,
avec
(2.2)
Kp , Ki > 0 assure la convergence asymptotique de y(t) vers la consigne

yr suppose constante, pour peu que la perturbation w soit cons-
(rfrence)
tante. Rappelons qu'on n'a pas besoin de connatre cette constante pour
prouver que de manire asymptotique
y = yr .
2.1.1 Questions de robustesse

tant donn le systme en boucle ferme (2.1)-(2.2), nous souhaitons
tudier les trois points suivants
1. Que se passe-t-il si la mesure de
n'est pas instantane mais est eec-
? Dans une telle conguration,

l'instant t, on connat la valeur de y(t ). La valeur y(t) n'est disponible, pour calculer u, qu' l'instant t + . Ce retard est par exemple
tue avec un certain temps de retard
2. Le calcul symbolique est aussi dnomm calcul oprationnel [73, 22] en rfrence
la thorie des oprateurs linaires [43].
3. Nous laissons de ct les problmes de convergence des transformes de Laplace qui
sont relativement hors-sujet ici et qui sont abords dans les cours [52, 53]. On pourra aussi
se reporter [15] pour un expos mettant en lumire le rle des bandes de convergence
dans le plan complexe.
4. Nous ne prenons pas en compte les contraintes sur
ici.
2.1.
81
PASSAGE LA FONCTION DE TRANSFERT
imputable la dynamique du capteur, la chane informatique tempsrel, des dlais d'chantillonnage de certains capteurs, ou des dlais
de communication de l'information.
w n'est plus constante

mais sinusodale de la forme w(t) = cos(t) avec constant. Ne peut-il
2. Que se passe-t-il si la perturbation non mesure
pas y avoir propagation de ces oscillations ? Est-ce gnant ?

3. Que se passe-t-il si l'on superpose les deux points prcdents, un retard
de mesure et une perturbation sinusodale ?
2.1.2 Principe des calculs

De manire prliminaire, nous montrons ici comment obtenir la fonc-
tion de transfert d'un systme. Le principe des calculs est trs simple : il
d
par s. Par abus de notation et soucis de
sut de remplacer l'oprateur
dt
simplicit, on note ici y(s) la transforme de Laplace de t 7 y(t) : ainsi

R +
y(s) = 0 est y(t)dt. Sauf indication contraire, on travaille toujours en Laplace unilatral par rfrence des problmes de Cauchy avec des conditions
s
initiales nulles en t = 0. Dans ce cas, l'oprateur retard devient e
o
est le retard
Considrons le systme boucl avec

la mesure de
yr
et
variables et un retard
sur
y(t) = ay(t) + bu(t) + dw(t)
dt
u(t) = Kp (yr (t) y(t )) + I(t)
d I(t) = Ki (yr (t) y(t ))

dt
5. On peut d'abord utiliser le calcul
est y(t )dt =
0
o
doit tre nulle pour les temps
es( +) y( )d = es y(s)
ngatifs. On a aussi formellement (sans chercher
()k (k)
(t). Comme y (k) =
k=0
k! y
k
P
k
+
()
d
y = sk y , on voit naturellement apparatre la srie k=0 k! sk qui n'est autre que
dtk
s
e
. Ainsi, en calcul symbolique, l'oprateur qui la fonction y associe la fonction y
s
retarde de n'est autre qu'une multiplication par e
. On trouvera toutes les formules
le justier) le dveloppement en srie
y(t ) =
P+
ncessaires des calculs oprationnels plus compliqus dans [22].
82
CHAPITRE 2.
On obtient alors (dans le domaine des transformes de Laplace)
sy = ay + bu + dw
u = Kp (yr es y) + I
sI = Ki (yr es y)
On peut alors calculer algbriquement
y , u,
et
en fonction de
yr
et
w .
Il
sut de rsoudre ces quations par rapport aux variables recherches. La

sortie
est une combinaison linaire de yr et w , les coecients tant des

s et es . Tout calcul fait, on obtient
fractions rationnelles en
y=
sd
b(Ki + sKp )
yr +
w
s
s(s + a) + b(Ki + sKp )e
s(s + a) + b(Ki + sKp )es
La stabilit se dduit des zros des dnominateurs (nomms ples ), i.e., les
valeurs
s C pour lesquelles la formule ci-dessus donnant y
n'est pas dnie.
Nous reviendrons sur ce point dans la Dnition 5 et la Proposition 3.

S'il existe
> 0,
tel que les valeurs de
pour lesquelles la fonction de
la variable complexe (c'est une fonction dite entire car elle est dnie pour
toute valeur de
s C)
D(s) = s(s + a) + b(Ki + sKp )es
s'annule, sont toutes dans le demi plan
<(s) ,
(2.3)
alors le systme est
asymptotiquement stable en boucle ferme. En revanche, si un des zros est

partie relle strictement positive, le systme est instable et la sortie
n'est pas borne lorsque
y(t)
t +.
Cette caractrisation est une gnralisation naturelle de celle que nous

avons dj vue pour les systmes linaires (voir Thorme 4) sous forme
d
x = A(x x) : pour ce dernier systme, le point d'quilibre x est
d'tat
dt
asymptotiquement stable en boucle ouverte lorsque les zros de det(sI
A)
sont tous partie relle strictement ngative. La formule donnant la
transforme de Laplace de
x explicitement partir de celle de x ( conditions
initiales nulles)
x = (sI A)1 A
x
n'est pas dnie pour les valeurs de
det(sI A)
appartenant au spectre de
A.
Comme
est un polynme, il ne possde qu'un nombre ni de zros d'o
l'existence de
> 0.
Pour des fonctions de s plus compliques comme les polynmes en s et

s
e
(appels quasi-polynmes [31]), on a un nombre inni de zros en gnral. La localisation des zros de la fonction entire
D(s),
dnie par (2.3),
2.1.
83
est un problme ardu et non compltement rsolu l'heure actuelle (voir [29]
pour un expos complet et la Section 2.4.1 pour un exemple de rsultats
qu'on peut obtenir).
Pour
= 0, D(s) = s2 + (bKp + a)s + bKi
n'a que deux zros et ils sont
partie relle strictement ngative (sous l'hypothse
Kp , Ki , b > 0 et a 0).
partir
Nous verrons comment il est possible de calculer le retard critique

duquel
D(s)
admet ncessairement des zros instables rendant le systme en
boucle ferme instable.
2.1.3 Rgime asymptotique forc

Lorsqu'un systme est asymptotiquement stable en boucle ferme, on peut
tudier comment il ragit des perturbations (on dit aussi excitations) sinusodales
w . Comme le prcise la Proposition 4, un systme asymptotiquement
stable soumis une telle excitation, converge, aprs un transitoire, vers un

rgime priodique de mme priode. Le systme oublie sa condition initiale
(de manire asymptotique), comme discut la Section 1.1.3.
Pour une excitation priodique
notant
w = exp(t)
w = cos(t),
et on cherche la solution
on passe en complexes en
(y, u, I),
pour
yr = 0,
des
quations
y(t) = ay(t) + bu(t) + d exp(t)
dt
u(t) = Kp (yr (t) y(t )) + I(t)
d I(t) = Ki (yr (t) y(t ))

dt
sous la forme
y(t) = Y exp(t), u(t) = U exp(t) et I(t) = I exp(t). Cela
revient faire exactement les mmes manipulations que celles faites la

d
s
par s et le retard par e
, mais avec s = .
Section 2.1.2 en remplaant
dt
On obtient

Y=

sd

s
s=
Ce nombre complexe peut s'crire sous la forme

sd

= G() exp(())

s
s=
o
G() 0
est le gain et
() [, [,
la phase. Il sut alors de prendre
la partie relle de la formule
y(t) = G() exp((t + ()))
84
CHAPITRE 2.
y . La solution
w = cos(t), est
priodique du systme en boucle
pour avoir le rgime forc

ferme, avec
yr = 0
et
y(t) = G() cos(t + ())

6
On reprsente sur deux graphiques, appels diagrammes de Bode , le gain
G()
et le dphasage () en fonction de . Une grande

G en fonction de est la signature de rsonances , dont les
en fonction de
variation locale de
frquences caractristiques sont donnes approximativement par les maxima

locaux de
(les pics de rsonance ). Le diagramme de Bode peut s'obtenir
exprimentalement (jusqu' une certaine frquence au del de laquelle les

instruments sont inutilisables) avec un analyseur de frquence si le systme
est eectivement asymptotiquement stable.
2.1.4 Simplications ples-zros

Il y a une distinction entre la stabilit d'un systme reprsent sous forme
d
x = Ax + Bu, y = Cx, et celle de la relation entre-sortie y(s) =
d'tat
dt
H(s)u(s).
Il peut y avoir des simplications de ples avec des zros . En d'autres
termes, il se peut qu'on ait une racine commune entre le numrateur et le dnominateur de
que
H(s). Ainsi, H(s) peut ne possder que des ples stables alors
peut avoir des valeurs propres instables. On verra que la Dnition 5
et la Proposition 3 tiennent compte de ce phnomne.

Prenons un exemple trs simple qui fera bien comprendre le problme.
Supposons que nous ayons le systme suivant
d
d2
yy = uu
2
dt
dt
(2.4)
Le calcul symbolique dj utilis prcdemment donne

soit
y=
(s2 1)y = (s 1)u,
s1
1
u=
u
2
s 1
s+1
On pourrait en conclure que le systme est asymptotiquement stable car la

relation entre-sortie ne fait apparatre qu'un seul ple
s = 1 partie relle
ngative. Ceci est faux : le systme est du second ordre, il admet une autre
valeur propre. Cette dernire est instable et vaut
1. Pour comprendre l'origine

s 1 entre
du problme engendr par la simplication par le facteur commun

6. En gnral, on trace, sur le premier graphique
des ordonnes) en fonction de
()
en fonction de
log10 ().
log10 () (log10
20 log10 (G()) (dcibels comme chelle
comme chelle en abscisse), sur le second
2.1.
85
le numrateur et le dnominateur de la fonction de transfert, il faut reprendre

la transformation de Laplace (voir [52]) et bien noter que, si on ne nglige
d
plus la condition initiale, la transformation de Laplace de
y donne en fait
dt
sy y(0) au lieu de sy comme nous l'avons fait, pour simplier les calculs.
t = 0 tout est l'quilibre et tout

u0 = 0. Si tel n'est pas le cas, il faut utiliser
t = 0 de (y, y)
et de u apparaissent
Ainsi, tous nos calculs sont corrects si

est nul, c.--d.
y0 = 0, y 0 = 0
les formules o les valeurs en
et
y(s) = s2 y(s) sy0 y 0 ,
u(s)
= su(s) u0 .
R +
Elles se dmontrent avec deux intgrations par partie pour

est y(t)dt et
0
R + st
une pour
e u(t)dt
et en supposant que y
(t) et u(t)
sont continus par

0
rapport t et que les intgrales sont absolument convergentes. Ainsi on a
(s2 1)y sy0 y 0 = (s 1)u u0

o
y0 , y 0
et
u0
sont les valeurs
t=0
de
y,
d
y et
dt
u.
En eet on a
Dans ce cas, on obtient le calcul complet
y(s) =
1
sy0 + y 0 u0
u+
s+1
s2 1
u y et celui des conditions initiales

y . La simplication initialement envisage n'est plus possible, sauf pour des
valeurs trs particulire de y0 , y 0 , et u0 . Le second terme dans la fonction de
transfert correspond une fonction qui diverge lorsque t +. Il est nul
si et seulement si on a y(0)
= y(0) u(0) = 0. En gnral, cette condition

n'est pas satisfaite, le systme est instable cause du ple en s = 1 qui ne
Cette quation rvle le transfert de
disparat plus.
Dans la suite du chapitre, nous supposerons qu'il n'y a pas de canular de ce
type. En pratique, ce genre de simplication se voit trs vite en inspectant les
quations. Il sut de modier un tout petit peu les coecients, par exemple
prendre
u 0.999u
pour casser cette simplication et revoir apparatre le
ple instable qui avait disparu. Ce type de simplication est surtout gnant
quand des ples instables sont en jeu. Pour des ples stables, c'est moins
embtant et ce d'autant plus s'ils ont des parties relles fortement ngatives.
Les termes correspondants convergent de toutes faons trs rapidement vers
zro lorsque
t +.
2.1.5 Formalisme
Dans ce qui suit, on s'attache donner des lments prcis (dnitions et
proprits) concernant les fonctions de transfert que nous avons introduites
86
CHAPITRE 2.
partir d'exemples simples dans les Sections 2.1.2, 2.1.3 et 2.1.4. On considre
un systme avec
m1
est une matrice
entres
et
p1
sorties
sous forme d'tat
d
x = Ax + Bu, y = Cx
dt
n n coecients constants, B
(2.5)
est une matrice (dans
le cas o on a plusieurs entres, sinon c'est un vecteur colonne) de taille

coecients constants, et
nm
est une matrice (dans le cas o on a plusieurs
sorties, sinon c'est un vecteur ligne) de taille
pn
coecients constants.
La notion de stabilit dont nous avons parl pour les fonctions de transfert
correspond en fait la dnition suivante.
Dnition 5 (Stabilit Entre-Borne-Sortie-Borne).
Un systme de
la forme (2.5) est stable Entre-Borne-Sortie-Borne (on dit EBSB), si pour

toute entre borne
t 7 u(t)
la sortie
t 7 y(t)
reste borne.
Dnition 6 (Matrice et fonction de transfert).
On appelle matrice de
transfert du systme (2.5) la matrice dpendant de la variable complexe
C 3 s 7 H(s) = C(sI A)1 B

s strictement
sortie) H(s) est
. Les lments de cette matrice sont des fractions rationnelles en
p=m=1
propres. Lorsque
(systme une entre et une
une simple fraction rationnelle en
s et on parle alors de
fonction de transfert.
P (s)
est dite causale ou propre quand le degr du
Une fraction rationnelle
Q(s)
numrateur P (s) est plus petit que (ou gal ) celui du dnominateur Q(s).
Lorsque l'ingalit est stricte on dit que la fraction rationnelle est strictement
causale ou strictement propre.
Dnition 7 (Ples et zros d'une fonction de transfert).

zro d'une fonction de transfert (scalaire)
H(s)
On appelle
les racines de son numra-
teur. On appelle ples les racines de son dnominateur.

Il est facile de montrer le rsultat suivant partir de la formule de variation des constantes (1.14), page 27, donnant les solutions de (2.5) (prendre
b(t) = Bu(t)).
Proposition 3.
Si les valeurs propres de
sont toutes partie relle stric-
tement ngative, alors le systme (2.5) est stable EBSB.

d
x = Ax implique la stabilit EBSB
dt
mais l'inverse est faux comme on peut s'en convaincre simplement avec le
Ainsi la stabilit asymptotique de
systme o
n=2
et
m=p=1
d
x1 = x1 + u,
dt
d
x2 = x2 + u,
dt
y = x2 .
2.1.
87
> 0, la matrice A est exponentiel1

lement instable. Un simple calcul de H(s) = C(sI A) B montre que le
1
facteur (s ) apparaissant dans les dnominateurs de (sI A)
disparat
du transfert entre y et u. Plus gnralement, la rciproque de la proposition 3
Ce systme est bien EBSB mais pour
est fausse cause de simplications ples-zros dans le calcul de la fonction

C(sI A)1 B . Ces cas pathologiques sont dus au fait que l'tat
de transfert
peut ne pas tre observable partir de la sortie
aussi au fait que l'tat
(cf thorme 28) et
peut ne pas tre commandable avec l'entre
(cf
thorme 23)
On a, de manire gnrale, la proprit suivante qui permet de caractriser
la rponse asymptotique d'un systme stable EBSB une entre sinusodale.
Proposition 4
(Rponse asymptotique d'un systme stable EBSB une
entre sinusodale)
Considrons le systme (2.5) avec
m=p=1
et suppo-
H(s) sa fonction de transfert. Si on excite ce

u(t) = cos(t + ) de pulsation et de phase
alors, de manire asymptotique lorsque t +, la sortie y(t)

(t+)
le signal < H()e
= |H()| cos(t + + arg H(i)).
sons le stable EBSB. Notons
systme par un signal d'entre
constantes,
converge vers
On notera ainsi que les pulsations correspondant aux zros de
H()
sont asymptotiquement rejetes. Si
H(s)
R 3 7
a un zro en zro (c'est sou-
vent le cas lorsqu'on recoure un contrleur PI ), alors les entres constantes

sont rejetes. On a rejet de l'erreur statique .
2.1.6 Du transfert vers l'tat : ralisation

La donne d'un transfert rationnel
H(s) est quivalente la donne d'une
forme d'tat canonique minimale que nous allons dnir. C'est ce qu'on appelle la ralisation sous forme d'tat d'un transfert rationnel .
De manire prliminaire, nous allons traiter un cas particulier qui permet
de comprendre l'algorithme gnral de construction du systme d'tat.
Exemple 12 (Ralisation d'un systme d'ordre 2).

posions du transfert suivant entre
y(s) =
o
(a0 , a1 , b0 , b1 )
s2
et
Supposons que nous dis-
b1 s + b0
u(s)
+ a1 s + a0
sont des paramtres. Ce transfert correspond l'quation
direntielle du second ordre suivante
d2
d
d
y + a1 y + a0 y = b 1 u + b 0 u
2
dt
dt
dt
88
CHAPITRE 2.
On pose
z = (z1 , z2 ) = (y, dtd y)

d
z1 = z2 ,
dt
pour obtenir
d
d
z2 = a0 z1 a1 z2 + b1 u + b0 u
dt
dt
On regroupe les drives dans la seconde quation en une seule variable
z2 b1 u au lieu de z2 . Avec les variables (x1 = z1 , x2 )

(z1 , z2 ), on a la ralisation d'tat souhaite
d
x2 = a0 x1 a1 x2 + (b0 a1 b1 )u,
dt
d
x1 = x2 + b1 u,
dt
x2 =
au lieu des variables
y = x1
On notera les matrices

A=
0
1
a0 a1

,
B=
b1
b 0 a1 b 1

,
C = (1 0)
(2.6)
On voit que l'astuce est de faire disparatre par des changements astucieux
sur l'tat, les drives de
u.
Supposons maintenant que nous ayons eu un degr de plus au numrateur
y(s) =
b2 s 2 + b1 s + b0
u(s)
s2 + a1 s + a0
Alors, en reprenant les calculs prcdents, on a avec
d
z1 = z2 ,
dt
z = (y, dtd y)
d
d2
d
z2 = a0 z1 a1 z2 + b2 2 u + b1 u + b0 u
dt
dt
dt
On pose z
2 = z2 b2 dtd u. Avec les variables
2
u, dtd 2 u, disparat
d
d
z1 = z2 + b2 u,
dt
dt
(z1 , z2 ),
la plus haute drive de
d
d
z2 = a0 z1 a1 z2 + (b1 a1 b2 ) u + b0 u
dt
dt
On regroupe les drives dans les deux variables suivantes :
x1 = z1 b2 u,
x2 = z2 (b1 a1 b2 )u
On obtient alors la forme d'tat souhaite (avec une loi de sortie qui dpend
directement de
u)
d
x1 = x2 + (b1 a1 b2 )u,
dt
car
y = x 1 + b2 u .
d
x2 = a0 x1 a1 x2 + (b0 a0 b2 a1 (b1 a1 b2 ))u
dt
2.1.
89
D'aprs l'exemple prcdent, on comprend ainsi que, par liminations

successives des plus hautes drives de
en rajoutant des drives de
dans les composantes de l'tat, il est toujours possible, lorsque la fraction
rationnelle
y(s)/u(s) = G(s)
est propre, d'obtenir la forme d'tat suivante
d
x = Ax + Bu,
dt
o
dim(x)
y = Cx + Du
est gal au degr du dnominateur de
G(s)
G(s) = (C(sI A)1 B + D)u

Cette mthode de ralisation se gnralise aux systmes multi-variables avec
m > 1
entres
et
p > 1
sorties
y,
le transfert entre
et
tant donn
(en accord avec la Dnition 6), par une matrice dont les lments sont des
fractions rationnelles en
s.
Un lecteur intress par un expos plus formel de
la thorie de la ralisation pourra consulter [38].

Plusieurs ralisation direntes peuvent conduire au mme transfert. Une
ralisation dirente de celle propose par (2.6) peut tre obtenue avec le
schma gnral de la Figure 2.1 qui fournit une ralisation d'une fonction de
transfert strictement propre
bn1 sn1 + ... + b0

sn + an1 sn1 + ... + a0
ainsi que les formes canoniques
x = Ax + Bu,
1.
(A1 , B1 , C1 )
avec
0
1
0
0
0
1
...
...
A1 =
0
... 0
a0 a1 ...

C1 = b0 ... bn1
2.
(A2 , B2 , C2 )
y = Cx
...
0
...
...
...
...
0
1
... an1
, B1 = 0
...
avec
0 a0
b
0
...
...
, B = ...
...
... 2
bn1
1 an1

0 ... 0 1
0
1
A2 =
...
0
C2 =
...
0
...
...
90
CHAPITRE 2.
Figure 2.1 Ralisation d'une fonction de transfert strictement propre.
2.2 Schmas blocs et fonctions de transfert

Les schmas blocs sont un langage relativement universel. Ils permettent
d'exprimer l'action sur un systme des commandes, des perturbations, et
d'expliciter des schmas de rgulation. On prsente ici, pour une structure
trs gnrale de contrle (voir Figure 2.5), les fonctions de transfert en boucle
ferme.
2.2.1 De la forme d'tat vers le transfert
Figure 2.2 Le schma blocs de type fonctionnel pour le systme en boucle

ouverte avec comme contrle
sure)
u, comme perturbation w
et comme sortie (me-
y.
Reprenons les notations d'un systme non linaire telles que nous les
avons vues la Section 1.4.3. On considre un systme tout fait gnral
dcrit par
d
x = f (x, u, w, p),
dt
o
Rn 3 x 7 y = h(x) Rm<n
p reprsente des paramtres, u reprsente des commandes et w
reprsente
des perturbations. On dispose de capteurs qui fournissent chaque instant la
2.2.
91
SCHMAS BLOCS ET FONCTIONS DE TRANSFERT
Figure 2.3 Le schma blocs de type fonctionnel pour le systme en boucle

ferme o le nouveau contrle est
(typiquement la consigne que
doit
suivre).
valeur
(en gnral
dim(y) < dim(x)
c.--d. que l'tat du systme n'est pas
compltement mesur). Les dimensions de
x , u, w
et
sont ici arbitraires.
Ce systme est reprsent par le schma blocs de la Figure 2.2.

On labore une loi de contrle sous la forme d'un retour dynamique de
sortie , c.--d. un systme dynamique (comme l'est un rgulateur PI)
d
=a
(y, , v),
dt
, v)
u = k(y,
est le nouveau contrle. On complte alors le schma blocs en boucle
ouverte de la Figure 2.2 par une boucle de rtro-action en montrant bien que
les informations issues de la sortie
y,
sont utilises de manire causale pour
u de faon atteindre un objectif prcis. Typiquement, le

v sera la consigne que devra suivre y (lorsque v et y ont la
dimension) et u sera calcul de faon ce que y suive v . On obtient
ajuster le contrle
nouveau contrle
mme
ainsi le schma en boucle ferme de la Figure 2.3.

Supposons que l'on soit proche d'un point d'quilibre
v). On
(
x, y, u, w,
,
peut linariser toutes les quations ci-dessus, celle du systme et celle du

contrleur, et ainsi tudier de faon plus formelle et approfondie la dynamique
du systme en boucle ouverte et/ou en boucle ferme. On supposera ici pour
simplier que
doit suivre
de simplicit,
dim(u) = 1, dim(y) = 1
et que
v = yr
est la consigne que
(problme de rgulation mono-variable). On notera, par souci
(x, y, u, w, , v)
les carts l'quilibre
v).
(
x, yr , u, w,
,
92
CHAPITRE 2.
Figure 2.4 Le schma blocs en boucle ouverte.
2.2.2 Transfert avec perturbation et bouclage

Les quations du systme linaris tangent s'crivent
x = Ax + Bu + Dw
dt
y = Cx
u = Ly + M + N v
d = F + Gy + Hv
dt
A, B , D, C , L, M , N , F , G, et H s'obtiennent
et a
partielles de f , h, k
. Par le calcul symbolique, on
o les matrices
drives
par
partir des
d
remplace
dt
pour obtenir le systme d'quations algbriques suivant
sx = Ax + Bu + Dw
y = Cx
u = Ly + M + N v
s = F + Gy + Hv
On rsoud simplement
x = (sI A)1 (Bu + Dw)
et on forme alors
y = G(s)u + Gw (s)w
avec
G(s)
et
Gw (s)
les fractions rationnelles suivantes
G(s) = C(sI A)1 B,
Gw = C(sI A)1 D
Ceci nous donne le schma blocs du transfert en boucle ouverte de la Fi1

gure 2.4. Comme = (sI F ) (Gy + Hv), on a

u = L + M (sI F )1 G y + N + M (sI F )1 H v
2.2.
93
SCHMAS BLOCS ET FONCTIONS DE TRANSFERT
Figure 2.5 Le schma blocs en boucle ferme ; conguration normale d'une

boucle d'asservissement.
Pour un problme de rgulation on note
v = yr
et on choisit
L = N
et
G = H .
On a donc
u = K(s)(yr y) = K(s)e
avec
K(s)
la fraction rationnelle
K(s) = N + M (sI F )1 H
On en dduit le schma blocs de la boucle ferme de la Figure 2.5. On notera
les indications de signe
. L'intrt de ces schmas blocs rside surtout dans
leur cot fonctionnel et visuel. Ils permettent de mieux comprendre les liens
de cause eet.
Pour rsumer, on a obtenu de faon directe les relations entre les entres
et
yr
et certaines variables comme
et
e = yr y
GK
Gw
yr +
w,
1 + GK
1 + GK
1
Gw
e=
yr
w
1 + GK
1 + GK
y=
Il est alors usuel de xer le cahier des charges d'un asservissement
(2.7)
(2.8)
K(s)
en
donnant les gabarits pour les diagrammes de Bode (surtout celui relatif au
gain en fonction de la pulsation
yr
) des transferts en boucle ferme entre y et

e et w (performances en rejet
(performances du suivi de consigne) et entre
de perturbation). Nous renvoyons aux ouvrages classiques [70] et au cours de

SI des classes prparatoires.
94
CHAPITRE 2.
2.3 Marge de robustesse

2.3.1 Critre de Nyquist
Revenons au problme que nous avons voqu en introduction dans la
Section 2.1.1. tant donns le systme (2.1) et le rgulateur PI (2.2), on
cherche calculer le retard critique au del duquel le systme en boucle

ferme devient instable. Le schma blocs en boucle ferme correspond celui
de la Figure 2.5 avec ici les transferts suivants
b
,
G(s) =
s+a
d
Gw (s) =
,
s+a

K(s) =
Ki
Kp +
s
es
Comme prcis dans l'quation (2.7), on a
y=
Ici,
GK
Gw
yr +
w
1 + GK
1 + GK
G(s) et K(s) sont les quotients de fonctions de s globalement dnies sur
le plan complexe.
Les objets que nous allons devoir manipuler sont des fonctions mro-
morphes sur le plan complexe
riable complexe est en fait (voir par exemple [15]) le

deux fonctions entires
P (s)
et
F (s) de la vaquotient P (s)/Q(s) de
: une fonction mromorphe
Q(s),
la fonction
tant non identiquement
nulle. Une fonction entire est la fonction associe une srie dont le rayon
de convergence est innie. Ainsi,
est mromorphe sur
si et seulement si
P+
an s n
F (s) = Pn=0
+
n
n=0 bn s
an et bn deux suites de nombres complexes 7 telles que les sries associes
n
ont un rayon de convergence inni, c.--d. pour tout r > 0, limn7+ an r =
n
s
limn7+ bn r = 0. Ainsi e , cosh( s), sin(s)/s sont des fonctions entires
cos(s)
sin(s2 )
et
, 1/s,
sont des fonctions mromorphes sur C. En revanche,
sin(s)
cos(s3 )
exp(1/s) n'est ni une fonction entire, ni une fonction mromorphe sur C.
En eet, elle admet en 0 une singularit de degr inni. Pour une fonction
P
8
mromorphe F = Q , les zros de P sont les zros de F et les zros de Q sont
les ples de F . De manire informelle, les fonctions entires peuvent tre vues
avec
comme des polynmes de degr inni et les fonctions mromorphes comme

7. Il faut qu'au moins l'un de
bn
soit dirent de
8. On peut toujours choisir les fonctions entires

zro en commun.
0.
P
et
pour qu'elles n'aient aucun
2.3.
95
MARGE DE ROBUSTESSE
l'analogue des fractions rationnelles en remplaant les polynmes par des

fonctions entires. Autour d'un ple
z0 ,
fonctions mromorphes et fractions
rationnelles ont des dveloppements limits gnraliss trs similaires de la

forme
+
X
an (z z0 )n
n=n0
avec
n0 > 0 (an0 6= 0)
tant la multiplicit du ple.
Dans notre cas, on a les fonctions mromorphes
G(s) =
avec
NG (s)
,
DG (s)
K(s) =
et
qui suivent
NK (s)
DK (s)
NG = b, DG = s + a, NK = (sKp + Ki )es , DK = s
et on doit considrer dans le transfert en boucle ferme, la fonction mromorphe
T
T =
N (s)
NG NK
GK
=
=
1 + GK
D(s)
DG DK + NG NK
avec
N (s) = b(sKp + Ki )es ,
D(s) = s(s + a) + b(sKp + Ki )es
partir de laquelle D(s) admet au

moins un zro dans le demi plan <(s) 0, i.e., un zro instable. Ce zro sera
un ple instable de T (il sera galement un ple instable du transfert depuis
La valeur critique
la perturbation
est la valeur de
Gw
).
1+GK
0, b, Kp , Ki
il est clair que les zros instables de D(s),

sKp +Ki s
correspondent aux zros instables de 1 + GK = 1 + b
e
. La fonction
s(s+a)
Comme
s 7 1 + GK(s)
> 0,
est ici dnie pour
dirent de
et
a < 0.
On va maintenant utiliser un rsultat important d'analyse complexe qui

relie le nombre de zros et de ples d'une fonction mromorphe
F (s)
dnie
sur un domaine du plan complexe, la variation de son argument lorsque

l'on parcourt le bord du domaine dans le sens direct. On suppose, pour
que l'argument de
F (s)
soit dni sur le bord du domaine, que
est bien
dnie sur le bord (pas de ple sur le bord) et aussi qu'elle ne s'annule pas
(pas de zro sur le bord). Comme on eectue une boucle, il est clair que la
variation totale de l'argument est ncessairement un multiple de
2N
est alors le nombre de tours autour de
9. On remarque que
NG
et
DG
ne s'annulent pas en mme temps, ni
important : il faut prendre ici les fractions irrductibles pour
2 ,
disons,
que fait le point d'axe
et
K.
NK
et
DK .
C'est
96
CHAPITRE 2.
Figure 2.6 Le thorme de Cauchy pour une fonction mromorphe F (s)

de
sC
et un domaine
dlimit par la courbe ferme note
Cs ; F (s)
CF lorsque s parcourt Cs dans le sens direct.

N que fait CF autour de 0 est reli aux nombres de
ples P et de zros Z de F (s) dans par N = Z P . Ici Z = 4 et P = 2,
donc F (s) fait deux fois le tour de 0 dans le sens direct, i.e., N = 2.
dcrit une courbe ferme note

Alors, le nombre de tours
F (s) lorsque s parcourt le bord dans le sens direct une seule fois. Le
Thorme 18 de Cauchy illustr sur la Figure 2.6, dit alors que N = Z P ,
o Z est le nombre de zros et P le nombre de ples l'intrieur du domaine.
complexe
Les zros et les ples sont compts avec leur multiplicit. On en donne ici
un nonc plus formel dont la preuve complte s'appuie sur le thorme des
0
rsidus appliqu la fonction F /F (voir [53]).
Thorme 18
complexe
(Cauchy)
Soient
Cs
une courbe ferme simple dans le plan
oriente dans le sens direct, et
F (s)
une fonction mromorphe
Cs . Soit CF la courbe ferme du plan complexe

F (s) lorsque s parcourt Cs dans le sens direct. Notons N le nombre
de tours (compts dans le sens direct) que fait CF autour de 0, et P et Z
respectivement le nombre de ples et de zros contenus l'intrieur de Cs .
n'ayant ni ples ni zros sur
dcrite par
Alors on a l'galit suivante
N =Z P
Dmonstration. Sur le domaine dlimit par
R(z)
avec
Q(z)
R(z) =
Z
Y
(z rk )R(z),
Q(z) =
k=1
o les
zk
sont les
zros et les
Cs on peut toujours crire F (z) =

P
Y
(z qk )Q(z)
k=1
qk
les
ples (apparaissant plusieurs fois
s'ils sont multiples) et o les fonctions analytiques
et
ne s'annulent ni
2.3.
97
MARGE DE ROBUSTESSE
Figure
2.7 La boucle que doit faire
pour englober tout le demi plan

p +Ki s
e
en
GK(s) = b sK
s(s+a)
partie relle positive tout en vitant le ple de
s = 0; R > 0
est grand et
sur la courbe ferme
Cs
log F (z) =
est petit.
ni sur le domaine qu'elle entoure. L'argument de
est la partie imaginaire de
Z
X
>0
log F
log(z rk )
k=1
P
X
log(z qk ) + log R(z)

log Q(z)
k=1
z dcrit Cs est la somme de trois

log(zrk ), les opposs des variations
des arguments des log(zqk ) et la variation de l'argument de log(R(z)/

Q(z))
.
Or la variation de l'argument de log(z rk ) ou de log(z qk ) est 2 car rk
et qk sont entours par Cs . Comme R(z)/

Q(z)
ne s'annule pas, la variation
10
de son argument vaut 0 lorsque z parcours une fois Cs . Ainsi la variation
de l'argument de F est bien Z P .
Ainsi la variation de l'argument de
lorsque
termes : les variations des arguments des
Dans notre cas,
p +Ki s
F = 1+GK = 1+b sK
e
admet un ple simple en 0.
s(s+a)
de la forme d'un demi-disque comme illustr sur la Figure 2.7 avec

R > 0 grand et > 0 petit. On note CR, le bord de . On voit que si 1 + GK
admet un zro dans le demi-plan <(s) 0, il doit faire partie ncessairement
d'un tel pour un R assez grand et un assez petit. Maintenant, il faut
Prenons
10. Pour s'en convaincre, il sut de dformer la courbe ferme
Cs
nment en un point, intrieur au domaine initialement entour par
en la rduisant conti-
Cs .
Au cours de cette
R(z)/
Q(z)
ne s'annule jamais, son argument est donc bien dni
et sa variation sur un tour de la courbe dforme est un multiple de 2 . la n de la
dformation, la courbe ferme suivie par z est rduite un point et donc la variation de
l'argument de R(z)/
Q(z)
est nulle. Au cours de la dformation, la variation ne peut pas
sauter brusquement d'un multiple non nul de 2 0 pour cause de continuit. Ainsi cette
dformation (homotopie),
variation doit tre nulle ds le dpart.
98
CHAPITRE 2.
compter le nombre de tour que fait

parcoure
CR,
F = 1 + GK
: c'est ncessairement dans le sens positif car ici
pas de ple dans
c.--d.
0 lorsqu'on
1 + GK , n'a
autour de
P = 0.
F = 1 + GK au lieu de D = NG NK +
DG DK la place de F . On viterait le ple en s = 0 qu'on est oblig de
contourner avec le petit demi-cercle de rayon . Cela vient du fait que sur la
partie de CR, loin de l'origine (bref sur le grand demi cercle de rayon R) GK
est trs petit et reste donc trs proche de 0. Sur cette partie, F reste ainsi trs
proche de +1 et ne tourne donc pas autour de 0. Le fait que GK soit petit
pour les s de CR, loin de l'origine vient du fait que les transferts G et K sont
sKp +Ki s
e
tend vers 0 lorsque s tend
des transferts causaux : GK(s) = b
s(s+a)
vers l'inni tout en restant partie relle positive. On voit que > 0 est
capital ici pour avoir cette proprit et que ce n'est plus vrai pour s tendant
Maintenant, pourquoi considrer
vers l'inni avec une partie relle ngative.
1 + GK autour de 0 revient compter

le nombre de tours de GK autour de 1. Ainsi, si la courbe ferme du plan
complexe dcrite par GK(s) avec s dcrivant le contour de la Figure 2.7
n'entoure pas 1, alors, F = 1 + GK n'entoure pas 0. On a donc N = 0, or
P = 0 donc, d'aprs le Thorme de Cauchy 18, on dduit Z = 0, F n'admet
pas de zro dans le demi plan <(s) > 0. On vient de retrouver ici le critre
Compter le nombre de tours de
du revers (connu en classes prparatoires).
Figure 2.8 Exemple de systme pour l'tude du Thorme de Cauchy.

Exemple 13 (Illustration du Thorme de Cauchy pour dirents contours).
1
Soit le systme de fonction de transfert s+2 boucl par un contrleur PI de
K
40
fonction de transfert KP + sI = 3 + s . Pour l'tude du systme en boucle
ferme reprsent sur la Figure 2.8, on doit tudier l'annulation de la fonction
de transfert
1+
sKp + KI
s2 + 5s + 40
=
s(s + 2)
s(s + 2)
Ce transfert possde deux ples (0 et 2) et deux zros complexes conjugus
53i 15
. On peut, en utilisant dirents contours comme on l'a fait sur la
2
Figure 2.9, vrier la formule N = Z P du Thorme 18 de Cauchy.
2.3.
99
MARGE DE ROBUSTESSE
Z=0, P=0
N=0
50
1000
-50
-50
50
-1000
-200
200
400
600
800
-2
-2
-1
Z=2, P=2
50
1000
-50
-50
50
-1000
-200
200
400
600
800
-2
-2
-1
Z=2, P=1
1000
-50
0
50
-1000
-800
-600
-400
-200
200
-2
-2
-1
Z=0, P=1
N=-1
50
1000
-50
-50
N=1
50
-50
0
N=0
50
-1000
-800
-600
-400
-200
200
-2
-2
-1
Figure
2.9 Illustrations du Thorme 18 de Cauchy. Gauche : courbe

sKp +KI
ferme parcourue par s. Milieu : lieu de 1 +
. Droite : agrandissement
s(s+2)
du lieu autour de 0.
Des considrations ci-dessus on dduit sans peine le critre de Nyquist

pour les systmes boucls de la Figure 2.5.
Dnition 8 (Lieu de Nyquist).

en boucle ouverte
galement strictement causal

par des facteurs du type
pas sur des
s0
tant donne une fonction de transfert
G(s) strictement causale et un transfert de contrleur K(s)

11
. On suppose que, s'il y a des simplications
(s s0 )
dans le produit
la courbe dcrite dans le plan complexe par
vers
G(s)K(s),
elles ne portent
partie relle strictement positive. On appelle lieu de Nyquist
G()K()
lorsque
parcourt
Thorme 19
(Critre de Nyquist)
Avec les notations de la Dnition 8,
11. Par strictement causal, on signie ici que

morphes qui tendent vers zro quand
G(s)
et
K(s)
sont des fonctions mro-
tend vers l'inni dans le demi plan complexe
partie relle positive. C'est le cas pour des fractions rationnelles dont le degr du numrateur est strictement infrieur celui du dnominateur.
100
CHAPITRE 2.
le systme en boucle ferme de transfert
GK
1 + GK
est asymptotiquement stable si et seulement si le lieu de Nyquist ne passe
pas par
GK
et s'il entoure le point
dans le sens indirect autant de fois que
admet de ples partie relle strictement positive (les ples sont compts
avec leur multiplicit).
Exemple 14 (Stabilisation avec retard). Considrons le systme de fonction

de transfert avec retard
s s2 + 4s + 2
G(s) = exp
2
s2 1
(2.9)
On boucle ce systme avec un contrleur P proportionnel de gain
k,
pour
obtenir le schma en boucle ferme reprsent sur la Figure 2.10. On se
Figure 2.10 Bouclage d'un systme retard.

demande sous quelle condition sur
k , le paramtre de rglage du contrleur, on
obtient la stabilit en boucle ferme. Pour rpondre cette question, il sut de

tracer le lieu de Nyquist de
kG(s), qu'on a reprsent sur la Figure 2.11 (pour
k = 1).
comporte un unique ple partie relle positive.
Le transfert
G(s)
D'aprs le Thorme 19, pour que le systme en boucle ferme reprsent sur
la Figure 2.10 soit asymptotiquement stable, il faut et il sut que le lieu de
Nyquist entoure une seule fois (dans le sens indirect) le point
pas le cas avec
1.
Ce n'est
k = 1,
comme on peut le constater sur la Figure 2.11. Le

1
1
paramtre k agit comme une homothtie. Pour k ] 2 , 1.1845 [, le systme est
asymptotiquement stable, il est instable sinon.
Si,
GK
admet des ples sur l'axe imaginaire, alors le lieu de Nyquist
admet des branches innies. Il convient alors pour compter correctement le

nombre tours de modier lgrement le contour le long de l'axe imaginaire
descendant comme on l'a fait auparavant pour le ple en
s = 0
(voir Fi-
gure 2.7) : on contourne chaque ple imaginaire avec un petit demi-cercle,

centr sur ce ple imaginaire et qui passe du cot de
<(s) > 0.
2.3.
101
MARGE DE ROBUSTESSE
1.5
0.5
-1.1845
-0. 5
-1
-1. 5
-2
-1. 5
-1
-0. 5
0.5
Figure 2.11 Lieu de Nyquist de kG(s) donn par (2.9) avec k = 1.

Noter enn que, en toute gnralit, pour que le critre de Nyquist implique la stabilit asymptotique, il faut qu'il existe
>0
tel que,
lim
G(s)K(s) = 0
|s| 7 +
<(s)
ce qui est le cas pour les fractions rationnelles et les fractions de quasipolynmes tels que ceux que nous avons considrs. En eet si
les conditions du critre de Nyquist, alors pour un parcours en
dcal vers la gauche,
s = + ,
allant de
GK
vrie
lgrement
+ vers et 0 <
GK( + ) lgrement
trs petit a priori, on aura un lieu de Nyquist,

dplac et qui entourera le point
avec le mme nombre de tours que
celui pour lequel = 0. Ainsi, on est sr que les zros de 1 + GK et donc de

D = NG NK +DG DK sont tous partie relle infrieure . Nous dtaillons
ces conditions ici car nous souhaitons prendre en compte des retards. Donc
on ne peut pas se contenter de prendre
rationnelles en
s
et e
.
et
dans la classe des fractions
uniquement. On souhaite aussi traiter des fractions en
102
CHAPITRE 2.
2.3.2 Marge de phase

p +Ki s
e
. Nous allons calculer exG(s)K(s) = b sK
s(s+a)
plicitement le retard critique > 0 partir duquel, le lieu de Nyquist

commence entourer 1. Il est donn par ce que l'on appelle la marge de
Revenons l'exemple
phase .
On commence par une normalisation en posant
s
s = ,
a
k = abKp ,
Ki
,
Kp a
Alors
G(s)K(s) = G(
s)K(
s) = kes
= a
s +
s(
s + 1)
Ainsi, quitte changer l'chelle de temps, on peut toujours supposer

on confond dans la suite
s et s
a = 1,
et on crit
G(s)K(s) = kes
s+
s(s + 1)
Sur la Figure 2.12, on a trac le lieu de

parcours de la Figure 2.7. Le point
G(s)K(s)
pour
suivant le
est l'extrieur du domaine entour
par le lieu de Nyquist. En gnral, on ne reprsente pas le grand demi-cercle

du demi plan droit. On ne trace que la gure simplie qui est droite. On
sait alors qu'il faut refermer cette courbe en partant de la branche innie du
+
bas = = lorsque = 0 vers celle du haut = = + lorsque = 0 en

passant l'inni par le demi plan droit
< > 0.
On trouvera sur la Figure 2.13, les dformations successives qu'on observe
grandit, c.--d. lorsqu'on change les rglage du contrleur. On se convaincra sans dicult que lorsque = 0, le lieu de Nyquist de
G(s)K(s) n'entoure jamais 1 quels que soient k et > 0. Noter que lorsque
= 0, la stabilit est donne par les racines d'un polynme de degr deux et
lorsque le paramtre
on a dj vu, au premier chapitre, qu'un rgulateur PI sur un premier ordre

est toujours asymptotiquement stable. Mais ce n'est pas pour retrouver ce
fait trivial que l'on a fait tout cela. C'est pour voir ce qui se passe lorsque le
retard
est non nul.
Pour les mmes

de
,
=0
et
quelle relation y-a-t-il entre le lieu de Nyquist
G(s)K(s) lorsque
et > 0 ? Pour s = , G()K() subit une
(multiplication par e ). Comme l'illustre la Figure 2.14,
valeur critique partir de laquelle 1 rentre l'intrieur du domaine
rotation de
la
entour par le lieu de Nyquist, est directement lie aux points d'intersection
du lieu de Nyquist pour
= 0 avec le cercle unit. Pour chaque k et , on note
les deux valeurs de pulsation qui correspondent aux points d'intersection
2.3.
103
MARGE DE ROBUSTESSE
s+
Figure 2.12 Le lieu de Nyquist de G(s)K(s) = kes s(s+1)
=0
et
lorsque
= 0.5. ;
la courbe ferme
dcrit la courbe
CR,
de la
k = 1,
du plan complexe dcrite par G(s)K(s)
Figure 2.7 pour R 1 et 0 < 1.
s+
Figure 2.13 Le lieu de Nyquist de G(s)K(s) = kes s(s+1)
=0
et diverses valeurs de
avec
avec
k = 1,
104
CHAPITRE 2.
Figure 2.14 La marge de phase
pour
s+
G(s)K(s) = k s(s+1)
avec
k = 1,
= 0.5.
avec le cercle unit. Un simple calcul faisant intervenir une quation bi-carre
(+)
traduisant le fait que le complexe k
est de module 1, donne
(+1)
s
=
On note
[0, [
(1 k 2 ) +
p
(1 k 2 )2 + 4k 2 2
2
l'argument suivant (noter le signe
e = k
au second membre)
( + )
( + 1)
c'est la marge de phase . Alors,
est le retard critique au del duquel des instabilits apparaissent. La marge

de phase n'a pas vraiment de sens intrinsque. Seul compte en fait le retard
critique qui s'en dduit : si, par exemple, la pulsation critique est trs
petit alors le retard critique est grand ds que n'est pas proche de 0.
Pour
k = 1
stabilit lorsque
et
= 0.5,
la Figure 2.15 montre la perte progressive de
grandit, la valeur critique tant autour de
2.7,
d'aprs
les formules ci-dessus. De ce graphique on tire aussi l'information suivante :
12
lorsque franchit le seuil , deux ples complexes
conjugus traversent en
12. Ce sont les ples en boucle ferme, pas ceux de
GK
mais ceux de
1/(1 + GK).
2.3.
105
MARGE DE ROBUSTESSE
Figure 2.15 Lieu

= 0.5
de Nyquist pour
et diverses valeurs du retard
s+
G(s)K(s) = kes s(s+1)
avec
k = 1,
mme temps l'axe imaginaire en venant de la partie stable. On sait cela car
juste aprs , 1 est entour deux fois donc on a exactement deux racines
partie relle strictement positive : un peu avant , le systme est trs oscillant
mais les oscillations sont lentement amorties ; un peu aprs , le systme est
toujours trs oscillant mais les oscillations sont lentement amplies.
2.3.3 Marge de gain

La marge de gain permet de quantier la prservation de la stabilit,
quand sur le modle
on connat mal le
d
y = ay + bu + dw
dt
coecient b devant u (on connat
son signe cependant),
c.--d. qu'on connat mal le gain de la commande. Cette incertitude revient

multiplier le bloc contrle K(s) par un coecient k > 0, en thorie proche
1
de 1.
tant stable, on cherche savoir partir de quelle valeur
1+G(s)K(s)
106
CHAPITRE 2.
1
devient instable. Les valeurs
1+kG(s)K(s)
maximales et minimales admissibles de k sont appeles marges de gain .
s s+
Reprenons l'exemple G(s)K(s) = e
. On considre tout d'abord
s(s+1)
= 0. On voit d'aprs les divers lieux de Nyquist tracs sur la Figure 2.13 que,
de
(en partant de
1),
le transfert
quelle que soit l'homothtie de rapport
1.
par
positif, ce dernier ne passe jamais
Ainsi, on a une marge de gain innie dans ce cas. C'est une faon
indirecte de retrouver le rsultat du Chapitre 1 qui dit qu'un rgulateur PI

sur un 1er ordre stable est toujours asymptotiquement stable pourvu qu'on
connaisse le signe du gain sur le contrle.
Cependant, supposons que nous ayons un petit retard, par exemple
0.25
pour
= 0.5.
Alors on voit sur la Figure 2.15 que ce petit retard ne
modie sensiblement le lieu de Nyquist qu'autour de

sont grandes en valeurs absolues. Plus
exp()
0, l o les pulsations
est grand, plus la multiplication par
aura tendance enrouler le lieu de Nyquist autour de
est vident que, quelle que soit la taille du retard
> 0,
0.
Aussi, il
mme trs petit, on
trouvera toujours une dilatation du lieu de Nyquist, qui l'amne passer par
1.
Bien-sr, plus le retard sera petit, plus la dilatation
devra tre grande
pour introduire une instabilit.

On retrouve ainsi ce que nous avons vu dj au chapitre prcdent sur les
dynamiques ngliges : les gains
Kp
rement grands. Ici, un petit retard
et Ki ne peuvent pas
= > 0 correspond
tre pris arbitrai une dynamique
rapide nglige. Il est intressant de remarquer que le Thorme de Tikhonov 15 porte sur des systmes singulirement perturbs, c'est dire avec un
positif devant d/dt. C'est formellement et aussi fondamens

talement la mme chose pour un retard d'ordre : dans l'oprateur e
on
retrouve bien le mme petit paramtre devant s = d/dt.
petit paramtre
2.3.4 Lecture des marges sur le diagramme de Bode

Il sut de prendre un exemple pour comprendre comment on fait. Sur la
1
s s+ 2
qui
gure 2.16 on a trac le diagramme de Bode pour G(s)K(s) = e
s(s+1)
n'admet aucun ple partie relle strictement positive. Ainsi on voit que
la marge de gain k est gale l'inverse du module de GK() pour

la pulsation
= k
o l'argument de
GK
passe la premire fois par
(sur le diagramme cela correspond au premier saut de
180
+180
degrs).
La marge de phase
et
pour la pulsation
GK par 1
(20 log10 )).
module de
dcibel
correspond l'cart entre la phase de
GK()
correspondant au premier passage du
(sur le diagramme cela correspond dont
en
2.3.
107
MARGE DE ROBUSTESSE
gain: module de GK en dB
40
30
20
10
0
10
20
phase: argument de GK en degr
30
2
10
(rad/s)
10
10
10
150
100
50
0
50
100
150
10
10
(rad/s)
10
10
Figure 2.16 Visualisation sur le diagramme de Bode des marges de gains

k
et de phase
lorsque
s+ 1
2
.
G(s)K(s) = es s(s+1)
Alors la marge de retard, qui seule une signication physique, est donne
. Dans cette formule l'unit d'angle pour et doit tre la

par =
mme (il est conseill prendre des radians pour ne pas se tromper).
2.3.5 Ples dominants

Supposons, comme nous l'avons fait dans le chapitre prcdent, que le
capteur qui fournit
n'est pas instantan mais a une petite dynamique que

1
. Ainsi G(s)
1+s
est remplac par G = G(s)R (s). Supposons 1/(1 + G(s)K(s)) stable. Alors
l'on peut reprsenter comme un ltre rapide de transfert
> 0, susamment petit, 1/(1 + G (s)K(s)) reste stable.

Pour assez petit, l'eet sur le lieu de Nyquist de G(s)K(s) de la multipli1
cation par
, n'est notable que pour des s = assez grands en module. Or,
1+s
pour de tels de l'ordre de 1/, G()K() est dj trs petit et donc seule
pour
la partie du lieu qui est proche de l'origine est modie. Donc le nombre de
tour autour du point
1 ne change pas, et donc le transfert 1/(1+G (s)K(s))
108
CHAPITRE 2.
est lui aussi stable. Aussi, il est lgitime de faire brutalement

transfert
G
pour ne garder que
G.
On dit alors que
G(s)
=0
dans le
ne conserve que
les ples dominants : il est ainsi lgitime d'liminer les ples trs rapides et
stables.
En rsum, ne conserver que les ples dominants dans le transfert
est identique au fait de prendre comme modle de contrle la partie lente

du systme, la partie rapide tant stable : l'approximation, dcrite dans la

0
Section 1.4.1 du systme lent/rapide ( ) par le systme lent ( ) est de
mme nature que celle de
G
par
G = G0 .
2.4 Complments
2.4.1 Calcul de tous les contrleurs PID stabilisant un
systme du premier ordre retard
Comme on l'a vu, le contrleur PI et plus gnralement le contrleur
PID (D pour drive) est extrmement ecace et utilisable dans un nombre

important de situations. On a vu que le transfert K d'un PI est K(s) =
kP + ksI avec kP et kI les gains proportionnel et intgral. Le rgulateur PID
a simplement le transfert
K(s) = kP +
o
kD
kI
+ kD s
s
est le gain driv. Ainsi, rgler un PID revient trouver les bons gains,
quand c'est possible,
GK/(1 + GK)
kP , kI
et
kD ,
pour avoir un transfert en boucle ferme
au minimum stable.
On a vu comment tester sa robustesse , notamment au retard. On propose

ici quelques rsultats thoriques importants qui donnent des conditions ncessaires et susantes pour obtenir la stabilit en boucle ferme en utilisant
un tel contrleur. Ces rsultats se limitent aux systmes du premier ordre (on
se rfrera [64], pour direntes extensions aboutissant des noncs beaucoup plus indirects), leur dmonstration fait appel des rsultats d'analyse
complexe permettant de qualier la ngativit des racines d'un polynme
sans les calculer. De tels critres (critre de Routh, ou de Hermite-Biehler
noncs dans les Thormes 7 et 6) sont souvent utiliss car numriquement
trs simples.
On considre un systme du premier ordre retard dont la fonction de
transfert est
G(s) =
k
es
1 + s
(2.10)
2.4.
109
COMPLMENTS
k R+ , R , R+ .
Dans un premier temps, on considre qu'on
utilise seulement un contrleur proportionnel
K(s) = kP
(2.11)
et qu'on l'utilise tel que reprsent sur la Figure 2.17.
Figure 2.17 Bouclage d'un systme du premier ordre retard.

Deux cas sont alors considrer. Soit le systme est stable (cas du Thorme 20) en boucle ouverte, et on cherche juste amliorer ses performances
par un contrleur en boucle ferme, soit le systme est instable (cas du Thorme 21) et c'est la boucle ferme de le stabiliser.
Thorme 20
([64])
On suppose
> 0,
alors l'ensemble des contrleurs
proportionnels prservant la stabilit du systme (2.10) est dni par les valeurs admissibles suivantes
z1
1
1
< kP <
k
k cos z1
]/2, [
est l'unique racine sur
de l'quation
tan(z) =
On notera de plus que la borne suprieure sur

fonction dcroissante du retard
kP
dans cet nonc est une
. Dans le cas instable, on souhaite en gnral
que le contrleur stabilise galement le systme en l'absence de retard. On

aboutit alors l'nonc suivant.
Thorme 21
([64])
< 0.
On suppose
Une condition ncessaire pour
que le contrleur proportionnel (2.11) stabilise la fois le systme (2.10) et

ce mme systme en l'absence de retard est que
< | |.
On suppose cette
condition vrie, alors l'ensemble des contrleurs proportionnels assurant la

stabilit du systme (2.10) est dni par les valeurs admissibles suivantes
k
o
z1
est l'unique racine sur
z12
]0, /2[
2
< kP <
de l'quation
tan(z) =
1
k
110
CHAPITRE 2.
La preuve de ces thormes utilise l'extension du Thorme 6 de HermiteBiehler pour les quasi-polynmes (i.e. des polynmes en s avec coecients en
es comme on en rencontre dans les fonctions de transferts des systmes
retard boucls).
Le cas de la stabilisation par un PID
K(s) = kP +
kI
+ kD s
s
(2.12)
est trait dans l'nonc suivant (un peu compliqu premire vue mais simple
mettre en uvre). Seul le cas des systmes stables en boucle ouverte est
trait ici. On se reportera [64] pour un expos concernant le cas des systmes
instables en boucle ouverte.
Thorme 22
([64])
On suppose
> 0,
alors l'ensemble des contrleurs
PID (2.12) prservant la stabilit du systme (2.10) est dni par les valeurs
admissibles suivantes

1
1
< kP <
1 sin(1 ) cos(1 )
k
k
racine sur ]0, [ de l'quation
tan() =
Pour
est l'unique
kp
en dehors de ces bornes, il n'existe pas de contrleur PID (2.12)
kp dans ces bornes,

(kI , kD ) comme suit.
stabilisant (2.10). Une fois choisi

stabiliser (2.10) de choisir
Soient
z1 , z2
il faut et il sut pour
les deux racines relles (ordonnes) sur
]0, 2[
de l'quation
z sin z = 0

sin z + z cos z , et mi = m(zi ), bi = b(zi ),
kkP + cos z
On note
m(z) =
2
,
z2
b(z) = kz
i = 1, 2.
kP ] k1 , k1 [, alors (kI , kD ) doit tre choisi de telle sorte que k <
kd < k , ki > 0 et kd > m1 kI + b1
1
si kP = k , alors (kI , kD ) doit tre choisi de telle sorte que kd < k ,

ki > 0 et kd > m1 kI + b1

1 1
si kP ] k , k 1 sin(1 ) cos(1 ) [, alors (kI , kD ) doit tre choisi de
telle sorte que m1 kI + b1 < kd < min(m2 kI + b2 , k ), et ki > 0
1. si
2.
3.
On pourra remarquer la similitude apparente entre les noncs des Thormes 22 et 20. Les bornes suprieures sur le gain proportionnels sont direntes. En eet, l'nonc 22 ncessite bien souvent l'usage eectif du terme
intgral et du terme driv car le point
(kI , kD ) = (0, 0)
l'adhrence des contraintes (dans le cas 3, on peut avoir
peut tre exclu de
b2 > b1 > 0).
2.4.
111
COMPLMENTS
2.4.2 Mthodes de rglage de Ziegler-Nichols

Il existe plusieurs mthodes systmatiques de rglage des rgulateurs PID.
Ces mthodes sont souvent utilises en pratique comme heuristiques, sans
justication. On propose de les re-situer dans le cadre d'analyse de stabilit que nous avons prsent, notamment la Section 2.4.1. Ces rgles sont
trs nombreuses et dirent par les performances qu'on peut en atteindre
en terme de temps de convergence, dpassement prvu, robustesse, etc. Historiquement, ce sont les rgles de Ziegler-Nichols [74, 75] qui sont apparues
les premires, elles sont toujours parmi les plus utilises. On trouve aussi
les rgles de Cohen-Coon [18], Chien-Hrones-Reswick [17], ou Lee-Park-LeeBrosilow [45].
Premire mthode de Ziegler-Nichols

Pour concevoir un rgulateur PID pour un process donn
G(s), on ralise
l'exprience boucle-ouverte suivante. On enregistre la rponse du systme

un chelon d'entre et on relve les paramtres
et
construits partir de
la ligne de plus grande pente de la rponse. On note galement
et
k tels que
reprsents sur la Figure 2.18, construits partir de la valeur asymptotique

1
estime et du temps de rponse 1 e
= 0.63 13 .
Figure 2.18 Dtermination d'un modle du premier ordre retard partir

de la rponse un chelon donn par
y(t) = k(1 e
)It .
Les rglages heuristiques de Ziegler-Nichols sont reports dans le tableau 2.1. Ils permettent de rgler au choix un contrleur
13. Un modle du premier ordre atteint environ
gal
fois sa constante de temps
63%
P,
un
PI
ou un
de sa valeur nale en un temps
112
CHAPITRE 2.
P ID.
Contrleur kP
P
PI
PID
kI
kD
1/a
0.9/a 0.3/(a)
1.2/a 0.6/(a)
0.6/a
Table 2.1 Rglages de Ziegler-Nichols premire mthode.

Seconde mthode de Ziegler-Nichols
La seconde mthode de Ziegler-Nichols ncessite une exprimentation en
boucle ferme avec un contrleur dj install dont il sut de modier les
gains. On boucle le systme avec un rgulateur
et le gain driv
0)
(en mettant le gain intgral
dont on fait progressivement augmenter le gain jusqu'
atteindre un rgime oscillatoire entretenu. Autrement dit, on atteint la limite

de stabilit. Une fois ce rgime obtenu, on note
ultime et la priode des oscillations
Tu
ku
le gain proportionnel
lui correspondant et on rgle alors
le contrleur comme expliqu sur le tableau 2.2.
Contrleur kP
P
PI
PID
0.5ku
0.4ku
0.6ku
kI
kD
0.5ku /Tu
1.2ku /Tu
0.075ku Tu
Table 2.2 Rglages de Ziegler-Nichols seconde mthode.

Bien que trs simple utiliser, ce mode opratoire de rglage de contrleur a le dsavantage de ncessiter la presque dstabilisation de l'installation
qu'on souhaite contrler. Cet inconvnient peut tre vit. On pourra se reporter [70] pour une prsentation d'une mthode de rglage aboutissant aux
coecients de la seconde mthode de Ziegler-Nichols, sans risque de dstabilisation. Cette mthode, qui utilise un bloc relai en boucle ferme, consiste
faire apparatre un cycle limite dont on analyse les caractristiques pour
retrouver les paramtres du systme contrler.
Liens avec les rsultats de stabilisation

Il est assez simple de faire un lien entre la seconde mthode de ZieglerNichols et le Thorme 20 si on suppose que le systme qu'on cherche
2.4.
113
COMPLMENTS
contrler est eectivement un systme du premier ordre retard stable de la

forme (2.10). Ce thorme montre qu'il existe une valeur dstabilisante du
gain proportionnel. C'est cette valeur
ku
que l'exprience en boucle ferme
permet d'estimer sans connaissance des paramtres du modle. Ensuite, la

mthode de Ziegler-Nichols du tableau 2.2 propose de rduire ce gain et donc
de se retrouver avec un contrleur proportionnel stabilisant.
Les coecients proposs par la premire mthode de Ziegler-Nichols sont
en pratique trs proches de ceux de la deuxime mthode. Nanmoins, c'est
de ces derniers que nous allons prouver une proprit trs intressante. Dans
le cas o le systme contrler est eectivement un systme du premier ordre
retard stable de la forme (2.10), un calcul direct montre que le paramtre
tel que dni sur la Figure 2.18 vaut
a=k
Notons
= / .
Avec cette valeur, les gains proposs dans le tableau 2.1
sont
kP =
1.2
,
k
kI =
0.6
,
k2
kD =
0.6
k
(2.13)
Considrons en premier lieu le gain proportionnel suggr. Nous allons montrer qu'il est toujours acceptable, en d'autres termes, qu'il satisfait toujours
les hypothse du Thorme 22. Pour notre systme stable, le gain propos
1
. En ce qui concerne la borne suprieure indique dans
satisfait kP > 0 >
k
le Thorme 22, on peut la rcrire
kmax
1
=
k
1
1 sin 1 cos 1
1
. En liminant
1+ 1
fonction de 1 dans cette dernire quation, on peut tablir que
o
est l'unique solution sur
]0, [
de
tan 1 =
en
1
(1 sin 1 cos 1 1.2)
k

1
1
=
cos 1 +
1.2
k
sin 1
kmax kP =
Par construction,
1 ]0, [.
On vrie alors
kmax kP > 0.
Par consquent,
le gain proportionnel suggr par la premire mthode de Ziegler-Nichols satisfait toujours les hypothses du Thorme 22 de stabilisation par un PID
pour un systme du premier ordre retard. C'est une importante justication de cette mthode heuristique. En outre, on peut montrer par une tude
114
CHAPITRE 2.
dtaille (on se reportera [64]) que les gains
kI
et
kD
dni dans (2.13)
par cette mme mthode satisfont galement les hypothses les concernant
de ce mme thorme. Plus prcisment, on peut tablir qu'ils les satisfont
mais de manire possiblement non robuste lorsque
le retard
devient grand (lorsque
devient grand devant la constante de temps
),
i.e. ils sont prs
des frontires des domaines dcrits dans le Thorme 22. C'est galement un
phnomne connu et observ en pratique qui engage souvent modier un
peu les gains au prix de performances moindres.
2.4.3 Prdicteur de Smith

Le prdicteur de Smith est un outil de rgulation pour les systmes
asymptotiquement stables en boucle ouverte retards mono-variables (propos dans [66]). Des gnralisations aux cas multi-variables et pour les systmes instables sont possibles mais alors il n'est plus possible de raliser le
bouclage avec un transfert rationnel. On utilise alors des bouclages retards
s
rpartis faisant apparatre des fractions rationnelles en s et e
. Nous ne
prsentons ici que la version historique publie par Smith.
Dans ce contexte, un retard sur l'entre ou la sortie est quivalent. En
eet les formes d'tat suivantes possdent la mme fonction de transfert
x(t)
= Ax(t) + Bu(t ), y(t) = Cx(t)

x(t)
= Ax(t) + Bu(t), y(t) = Cx(t )

o
x Rn , u R
et
y R.
Cette fonction de transfert est un produit d'une
fraction rationnelle propre et d'un oprateur retard
G(s) , G0 (s)es = C(sI A)1 Bes

L'intrt du prdicteur de Smith est de permettre d'utiliser un contrleur
Figure 2.19 Le prdicteur de Smith (zone grise).

K0
conu pour le systme sans retard
G0 (s)
en l'insrant dans le schma
2.4.
115
COMPLMENTS
0 et G(s)
G
reprsentent la
G0 = G0 et G = G. On suppose
gnral de la Figure 2.19. Les blocs additionnels

connaissance du systme. Idalement, on a
donc le transfert
G0
stable.
C'est sous cette hypothse qu'on comprend le fonctionnement du prdicteur de Smith. Grce la boucle interne au prdicteur (dans la zone grise
de la Figure 2.19), le signal entrant dans le contrleur
K0
est
e2 = yr G(s)u (G0 (s) G(s))u = yr G0 (s)u

Ce terme est la dirence entre la rfrence et la prdiction de la valeur de
sortie du systme l'horizon
Figure
2.20 Forme quivalente du systme boucl avec prdicteur de
Smith.
Le comportement entre-sortie du systme boucl par le prdicteur de
Smith est quivalent celui du systme donn sur la Figure 2.20. Articiellement, on a russi intercepter le signal de mesure avant le bloc retard et
donc nous ramener un problme de rgulation d'un systme sans retard.
On notera toutefois que le retard est toujours prsent sur la sortie. Il n'a pas
disparu du problme mais il n'interfre pas avec la rgulation.
Figure 2.21 Implmentation du prdicteur de Smith avec ltre additionnel

de robustesse.
En pratique, le prdicteur de Smith soure d'un manque de robustesse par
rapport une incertitude sur le retard, alors que la robustesse par rapport
aux paramtres est moins problmatique. En ce cas,
de mme que
0
G
et
.
G
et
sont dirents,
Il ne sut pas toujours de calculer un contrleur
procurant de bonnes marges de stabilit au systme
G0
K0
boucl (on pourra
se reporter [47, Chap 10.8] pour de nombreux contre-exemples). Certaines
116
CHAPITRE 2.
conditions susantes de robustesse sont exposes dans [60] ; elles portent

sur le choix du contrleur
K0
mais sont diciles mettre en uvre. Il est
indispensable de l'utiliser dans la conguration propose sur la Figure 2.21.

On a rajout dans la boucle externe un ltre de robustesse qu'on peut
ajuster pour dgrader les performances mais assurer une stabilit en boucle
ferme en dpit d'une incertitude sur le retard. Lorsque ce ltre
F (s)
vaut
on retrouve le prdicteur de Smith des Figures 2.19 et 2.20.
2.4.4 Systmes non minimum de phase

N (s)
o N (s) et D(s) sont deux polynmes
D(s)
premiers entre eux (i.e., pas de racine commune dans C) est dit non miLe transfert rationnel
G(s) =
nimum de phase si l'un de ses zros (i.e. l'une des racines de
N (s))
est
partie relle strictement positive. On parle alors de zro instable. Ce type de

systmes est rput dicile contrler. Ces systmes sont souvent associs
une rponse inverse lors d'une variation en chelon de l'entre
14
Pour comprendre la dicult, rien ne vaut un petit exemple. Considrons

le second ordre suivant
G(s) =
1s
.
s2
Ce transfert correspond, sous forme d'tat, un double intgrateur, typiquement un systme mcanique rgi par la loi de Newton,
d
x1 = x2 ,
dt
o la mesure
vitesse
x2
d
x2 = u
dt
est une combinaison "contradictoire" de la position
x1
et la
y = x1 x2 .
x1 = x2 = y = u = 0 pour les t 0, considrons
la rponse un chelon unitaire u = 1 pour t > 0. Un calcul simple donne
2
y(t) = t2 t pour t > 0. Ainsi au tout dbut y commence par tre ngatif
pour terme devenir positif. Si au lieu de 1 s on avait eu 1 + s, nous
n'aurions pas eu cette rponse inverse. Ainsi, pour rguler y , un contrleur
proportionnel ne sait pas dans quelle direction partir. Le bouclage u = Kp y
conduit toujours une boucle ferme instable quelque soit le gain Kp choisi.
En partant de l'quilibre
En eet le systme boucl,
d
x1 = x2 ,
dt
d
x2 = Kp x1 + Kp x2 ,
dt
14. Cette rponse inverse n'est pas cependant une caractrisation mathmatique du fait
qu'un zro soit instable.
2.4.
117
COMPLMENTS

est instable ds que
Kp 6= 0
: la matrice
0
1
Kp Kp

est toujours instable
avec une trace et un dterminant de mme signe (voir le critre de Routh,

condition 1.12). En transfert, on retrouve ce rsultat en regardant les zros
1s
2
de 1 + GK avec K(s) = Kp , soit 1 + Kp 2 = 0 qui donne s Kp s + Kp = 0.
s
K
Avec un correcteur PI de transfert K(s) = Kp + i (Kp gain proportionnel
s
et Ki gain intgral) la situation est identique : 1 + GK = 0 s'crit 1 +

1s
Kp + Ksi = 0 soit
s2
s3 Kp s2 + (Kp Ki )s + Ki = 0.
Le critre de Routh (conditions 1.13) donne ici les conditions de stabilit
Kp > 0,
Kp Ki > 0,
Kp (Kp Ki ) > Ki
Ki > 0,
qui sont impossibles satisfaire quelques soient les valeurs de
Kp
et
Ki .
Il est possible, pour stabiliser, de remplacer le terme "intgral" par un

terme "driv"
K(s) = Kp + Kd s
de gain
Kd .
Maintenant,
1 + GK = 0
donne l'quation d'ordre
suivante :
(1 Kd )s2 + (Kd Kp )s + Kp = 0
Ces racines sont stables si, et seulement si,
Kd K p
> 0,
1 Kd
Kp
> 0.
1 Kd
Un raisonnement simple montre que ces conditions de stabilit sont quivalentes
0 < Kd < 1,
0 < Kp < Kd ,
Ces deux ingalits dnissent un triangle. Le fait que ce domaine de stabilit

soit si peu tendu dans le plan
(Kp , Kd ) est une indication de
petites marges
de robustesse. Pour s'en convaincre, il sut de tracer le lieu de Nyquist avec
Kd = 1/2
et
Kp = 1/4,
par exemple. De plus un terme "driv" amplie
notablement les bruits de mesure et donc il vaut mieux prendre
Kd
petit.
Pour les systmes d'ordre plus lev, une telle analyse avec Routh n'est
pas trs commode. Il est alors utile de tracer le lieu de Nyquist de
certaines valeurs des paramtres du correcteur
gain et de retard.
GK
pour
et d'analyser les marges de
118
CHAPITRE 2.
Chapitre 3
Commandabilit, stabilisation,
feedback
d
x = f (x, u) est un systme sous-dtermin .
dt
La dirence entre le nombre d'quations (indpendantes) et le nombre de
Un systme command
variables donne le nombre de commandes indpendantes
m = dim u.
Il faut
noter que le degr de sous-dtermination est ici inni car on ne manipule

pas des scalaires mais des fonctions du temps. L'tude des systmes sousdtermins d'quations direntielles ordinaires est d'une nature dirente de
celle des systmes dtermins qui ont t l'objet du Chapitre 1. Nanmoins,
toutes les notions que nous y avons vues vont nous tre utiles.
La particularit de ces systmes sous-dtermins est qu'on peut utiliser la
commande pour agir sur eux. En pratique, deux problmes nous intressent :
la planication et le suivi de trajectoires .
La notion clef de ces problmes est la commandabilit . Dans ce chapitre,
aprs une rapide dnition de cette proprit dans le cas non linaire gnral
d
x =
(voir Dnition 10), nous tudions en dtails les systmes linaires
dt
Ax + Bu. Leur commandabilit est caractrise par le critre de Kalman
(voir Thorme 23). Nous prsentons alors deux mthodes pour rsoudre les
problmes qui nous proccupent.
La premire mthode utilise la forme normale dite de Brunovsky . L'criture sous cette forme met en lumire un paramtrage explicite de toutes les
m fonctions scalaires arbitraires t 7 y(t) et d'un

nombre ni de leurs drives. Ces quantits y , dites sorties de Brunovsky ,
sont des combinaisons linaires de x. Elles permettent de calculer trs simplement des commandes u faisant transiter le systme d'un tat vers un autre.
trajectoires en fonctions de
Le problme de planication de trajectoire est ainsi rsolu. Ce point est dtaill la Section 3.3.4. Les sorties de Brunovsky permettent galement de
construire le bouclage (feedback) qui assure le suivi asymptotique d'une tra-
119
120
CHAPITRE 3.
Figure
COMMANDABILIT, STABILISATION
3.1 Deux pendules accrochs au mme chariot d'abscisse
u,
le
contrle.
jectoire de rfrence arbitraire. La convergence est obtenue par la technique

de placement de ples . On se reportera au Thorme 25.
La seconde mthode s'attache optimiser les trajectoires. On caractrise
le contrle en boucle ouverte permettant d'aller d'un tat vers un autre tout
en minimisant un critre quadratique. On calcule galement la commande
minimisant l'cart quadratique entre la trajectoire de rfrence et la trajectoire relle. On montre que la solution optimale est donne par un feedback
dont les gains sont calculs partir d'une quation matricielle de Riccati.
C'est la commande linaire quadratique . Cette technique est dtaille la
Section 3.4.
3.1 Un exemple de planication et de suivi de

trajectoires
Nous considrons un systme de deux oscillateurs de frquences direntes soumis en parallle un mme contrle. Comme nous le verrons dans
l'Exemple 15, ce modle est d'une porte assez gnrale. Il correspond, une
rcriture prs, la dynamique linarise d'un systme quantique trois niveaux dont les transitions entre le niveau fondamental et les deux niveaux
excits (d'nergies direntes) sont contrles par la lumire d'un laser.
3.1.1 Modlisation de deux oscillateurs en parallle

On considre deux pendules ponctuels accrochs un mme chariot de
position
(la commande), tels que reprsents sur la Figure 3.1. On note
3.1. UN EXEMPLE DE PLANIFICATION ET DE SUIVI DE TRAJECTOIRES121
et
xi ,
l'inclinaison et l'abscisse
de la masse du pendule numro
i, i = 1, 2.
Autour de l'quilibre stable, les quations de Newton linarises sont
d2
x1 = a1 (x1 u),
dt2
o
a1 = g/l1
carrs des
rentes des
d2
x2 = a2 (x2 u)
dt2
(3.1)
a2 = g/l2 sont deux paramtres positifs correspondant aux

pulsations (l1 et l2 correspondant aux longueurs supposes dipendules l1 6= l2 ).
et
3.1.2 Planication de trajectoires

Soit
T >0
et un dplacement dsir
D.
On souhaite trouver un contrle
en boucle ouverte qui amne le systme de l'quilibre en
t=0
vers l'quilibre
x1 = x2 = u = D
en
x1 = x2 = u = 0
t = T.
Pour trouver de telles trajectoires, le plus simple est d'introduire la nouvelle variable
z=
x1 x2
a1
a2
Des calculs lmentaires donnent alors les relations suivantes
x1 x2
a1
a2
= x2 x1
z=
(2)
(3.2)
(4)
z = (a1 a2 )u + a1 x1 a2 x2
x1 , x2 et u s'expriment explicitement en fonction de z , z (2) et z (4) ds que

a1 6= a2 . Les deux quations (3.1), qui ne font intervenir que les trois variables
(x1 , x2 , u), s'obtiennent en liminant z des trois quations prcdentes. Ainsi,
elles sont bien contenues dans les trois quations ci-dessus. En fait (3.2) est
une description quivalente de la dynamique du systme dcrit initialement
z.
x1 , x2 et u avec
x1 (t), x2 (t) et u(t) vrient
par (3.1) mais avec une quation de plus et une variable de plus
L'intrt de rajouter
vient du fait que si l'on calcule
les formules (3.2), alors les fonctions du temps
automatiquement les quations direntielles (3.1). Rciproquement, si les

fonctions du temps
x1 (t), x2 (t)
et
u(t) vrient (3.1) alors

x2 et u via (3.2). Ainsi,
a2 x1 a1 x2 , on obtient encore x1 ,
via z qui est une fonction arbitraire
en posant
z =
on paramtrise
du temps, drivable au moins
fois,
toutes les solutions de (3.1). Le raisonnement prcdent montre clairement

1. En fait les vraies abscisses sont
x1
et
x 2 . u + c1
et
u + c2
x1 + c1
et
x2 + c2 , c1
et
c2
constantes, au lieu de
sont les abscisses des points auxquels sont suspendus les deux
pendules. Cependant les constants
ci
disparaissent dans les quations de Newton.
122
CHAPITRE 3.
que nous n'en manquons aucune en les dcrivant comme des combinaisons
(2)
(4)
linaires de z , z
et z
.
t = 0, x1 = x2 = u = 0, imposent la
valeur 0 z et ses drives jusqu' l'ordre 3 (ordre 4 si on ne tolre pas de
(i)
discontinuits sur u) : z (0) = 0 pour i = 0, 1, 2, 3, 4. De mme en t = T ,

1
a12 D et z (i) (T ) = 0 pour i = 1, 2, 3, 4. Pour t 6= 0, T ,
on a z(T ) =
a1
z(t) est libre. Il faut cependant respecter la continuit pour z et ses drives
jusqu' l'ordre 4 (ou 3 si tolre des saut sur le contrle u). Une des fonctions
les plus simples z(t) qui respectent ces conditions est la suivante

1
1
t
z(t) =
D
(3.3)
a1 a2
T
Les trois conditions d'quilibre en
est la fonction
C4
croissante de
() =
dans
0,
si
5
,
5 +(1)5
si
1,
si
[0, 1]
dnie par
0;
0 1;
1
Nous avons obtenu explicitement une trajectoire allant de l'quilibre d'abscisse
l'quilibre d'abscisse
en temps ni
arbitraire. Si on utilise le
contrle en boucle ouverte (z(t) est donne par (3.3))
z(t) +
u(t) =
1
a1
1
a2
1
a1
z (2) (t) +
1
z (4) (t)
a1 a2
1
a2
alors la solution de (3.1) qui passe en t = 0 par l'quilibre x1 = x2 =

d
x = dtd x2 = 0, passe en t = T par l'quilibre x1 = x2 = D, dtd x1 = dtd x2 =
dt 1
On connat mme explicitement cette solution avec
x1 (t) =
x2 (t) =
0,
0.
1 (2)
z (t)
a2
1
a12
a1
z(t) + a11 z (2) (t)
1
a12
a1
z(t) +
Nous avons rsolu le problme de planication de trajectoires .
3.1.3 Stabilisation et suivi de trajectoires

Supposons donne une trajectoire de rfrence (par exemple issue de la
construction prcdente) note
t 7 (x1,r (t), x2,r (t), ur (t))
solution de (3.1).
On cherche un feedback qui assure le suivi asymptotique de cette trajectoire.

En d'autres termes, nous cherchons des corrections sur le contrle en boucle
ur (t)
ouverte
pour compenser les dviations entre la trajectoire relle et la
trajectoire de rfrence. Ici, l'tat du systme est form par les positions
(x1 , x2 ) et les vitesses (v1 , v2 ) (vi = dtd xi , i = 1, 2). On note xi = xi xi,r
et vi = vi vi,r les dviations en position et en vitesse par rapport la
rfrence (i
= 1, 2). On cherche u en fonction des xi et vi . Le contrle

u qu'on appliquera sera ur + u. Dans le cas particulier o
en boucle ferme
la trajectoire de rfrence correspond un point d'quilibre, on parle alors

de stabilisation plutt que de suivi.
Comme les quations du systme sont linaires, un calcul direct montre
que
xi
et
vrient les mmes quations que
d2
x1 = a1 (x1 u),
dt2
xi
et
d2
x2 = a2 (x2 u)
dt2
Aussi, il sut de rsoudre le problme de la stabilisation pour obtenir une

solution au suivi . Supposons donc que la trajectoire de rfrence est nulle
x1,r = x2,r = ur = 0.
La faon la plus simple de concevoir le feedback
stabilisant est alors d'utiliser une mthode de Lyapounov. Utilisons comme

fonction candidate tre de Lyapounov l'nergie du systme. Pour
u = 0,
l'nergie du systme,
a1
1
a2
1
V = (v1 )2 + (x1 )2 + (v2 )2 + (x1 )2 ,
2
2
2
2
reste constante les longs des trajectoires. Donc, comme les quations sont
linaires par rapport
u, la drive de V
de deux termes : le premier facteur est
le long des trajectoires est le produit
et le second est une fonction des
positions et vitesses uniquement. Il sut alors de prendre
du signe oppos
au second facteur (ce qui est facile comme nous allons le voir) pour faire
dcrotre cette nergie. On conclut alors par le Thorme 11 de LaSalle.
Faisons ici les calculs. On a
d
V = (a1 v1 + a2 v2 )u
dt
Avec
paramtre strictement positif, on considre le feedback suivant
min
u ,
k(a1 v1 + a2 v2 ),
u = K(v1 , v2 ) =
max
u ,
si
si
si
k(a1 v1 + a2 v2 ) umin ;
umin k(a1 v1 + a2 v2 ) umax ;
umax k(a1 v1 + a2 v2 )
(3.4)
On suppose bien sr que les contraintes sur
min
u sont telles que u
< 0 < umax .
124
CHAPITRE 3.
Figure 3.2 Un atome trois niveaux en interaction avec une lumire laser
polarise linairement et associe au champ lectrique
Avec le feedback prcdent, la fonction
E R,
le contrle.
est toujours positive, innie
l'inni et maintenant elle dcrot le long des trajectoires. On peut donc

appliquer le Thorme 11 de LaSalle, qui caractrise l'ensemble vers lequel
tendent les trajectoires : les solutions du systme en boucle ferme avec le
d
V = 0 c.--d. a1 v1 + a2 v2 = 0. Dans ce cas
contrle 3.4 qui vrient en plus
dt
u = 0 et donc
a1
d
d
v1 + a2 v2 = (a1 )2 x1 (a2 )2 x2 = 0
dt
dt
En drivant encore deux fois, on a
(a1 )4 x1 (a2 )4 x2 = 0
Comme
a1 6= a2
et
a1 , a2 > 0,
on dduit que, ncessairement,
donc tout est nul. Les trajectoires convergent toutes vers

stabilise globalement asymptotiquement le systme en
0.
x1 = x 2 = 0
et
Notre feedback
0.
D'aprs ce qui prcde, le contrle complet avec suivi de trajectoire s'crit

trs simplement. On peut grer trs simplement des contraintes sur
u : il sut
ur
qui ne passe
par trop prs des bornes. Cette hypothse est vrie s'il existe
> 0 tel que
de prendre une trajectoire de rfrence donnant un contrle

pour tout temps t,
ur (t) [umin + , umax ]. Dans ces conditions, le contrle
,
k(a1 v1 + a2 v2 ),
u = ur +
,
est chaque instant dans
si
si
si
k(a1 v1 + a2 v2 ) ;
k(a1 v1 + a2 v2 ) ;
k(a1 v1 + a2 v2 ).
[umin , umax ] et de plus assure la convergence asymp-
totique vers la trajectoire de rfrence.
3.1.4 Autres exemples

Exemple 15
(Un atome trois niveaux)
La fonction d'onde
de l'atome
trois niveaux schmatis sur la Figure 3.2 obit, sous l'approximation di-
E(t)
polaire lectrique et dans un champ lectrique
polaris linairement,
l'quation de Schrdinger
~
C3 est
H0 et H1 sont
o
d
= (H0 + E(t)H1 )
dt
la fonction d'onde appartenant l'espace de Hilbert
0 0
0
H0 = 0 ~1 0 ,
0 0 ~2
1 , 2
et
et o
les oprateurs auto-adjoints dcrits par les matrices
C3
0
H1 = 0 0
0 0
sont des paramtres rels et strictement positifs. Avec les
notations usuelles en mcanique quantique
1
|0i = 0 ,
0
on voit que
|0i
celui d'nergie
0
|1i = 1 ,
0
0
|2i = 0
1
E0 = 0, |1i celui d'nergie E1 = ~1 et |2i

~ = h/(2) tant la constante de Plank. Les pulsa-
est l'tat d'nergie
E2 = ~2 ,
tions de transitions (les raies atomiques donc) entre le niveau fondamental
|0i
|1i et |2i ont pour pulsations 1 et 2 .

= 0 |0i + 1 |1i + 2 |2i avec 0 , 1 et 2 trois nombres
et les deux niveaux excits

On a donc
complexes dont le carr du module reprsente la probabilit pour que l'atome

soit dans le niveau
|0i, |1i
|2i,
ou
respectivement. L'quation de Schrdinger
pour ce systme s'crit
d
0 = E(1 + 2 )
dt
~
d
1 = 1 1 + E0
dt
~
d
2 = 2 2 + E0
dt
~
On constate que
0 = 1, 1 = 2 = 0
et
E =0
est un rgime d'quilibre (tat
fondamental, laser teint). Linarisons les quations autour de cet quilibre.

En notant
i , i = 0, 1, 2,
et
les petits carts, on obtient les quations
linarises
d
0 = 0,
dt
1 = 1 1 + E,
dt
~
Il ne faut pas oublier que les
2 = 2 2 + E.
dt
~
sont des complexes. Au premier ordre
est constant. C'est une partie de l'tat qui n'est pas inuence par le contrle
126
CHAPITRE 3.
(au moins au premier ordre). Cette partie est non commandable (au premier
ordre). Elle ne nous gne pas, elle correspond au fait que le module de
vaut
(conservation de la probabilit). Nous allons l'oublier ici. On a donc

2
4
le systme dans C , c'est dire dans R suivant
d
1 = 1 1 + E,
dt
~
2 = 2 2 + E
dt
~
En posant

1 x1 + dtd x1
1 =
,
~(1 )2

2 x2 + dtd x2
2 =
,
~(2 )2
E = u
on obtient exactement les quations des deux pendules (3.1) pour x1 , x2 et u

2
2
avec a1 = (1 ) et a2 = (2 ) . Il s'agit en fait du mme systme. Le carr
2
du module de i , |i | correspond alors, une constante prs, l'nergie
2
a
d
2
mcanique du pendule numro i : 2i (xi ) + dt xi .
Il est possible de reprendre les calculs de transitoires faits pour les deux
pendules et de les adapter pour traiter le problme suivant. On part de l'tat
t = 0. On cherche la forme de l'impulsion laser E(t) qui

assure le transfert en t = T d'une petite fraction 0 < p1 1 de la probabilit
2
sur l'tat |1i en gardant, au nal, nulle celle de l'tat |2i . Ce problme se
traduit de la faon suivante : en t = 0 on part de 1 = 2 = 0 avec E = 0.
p1 , 2 = 0 avec E = 0. Cela se
En t = T , on souhaite arriver en 1 =
traduit dans les variables x1 et x2 par des conditions suivantes. En t = 0,
tout est nul. En t = T , on doit avoir
fondamental
|0i
en
x1 = x1 =
Sur la variable
~1
,
p1
v 1 = x2 = v 2 = u = 0
cela donne comme condition en
t=0
(voir (3.3))
z = z (1) = z (2) = z (3) = z (4) = 0

et en
t = T,
z=
x1
,
a1
z (1) = z (3) = 0,
z (2) =
x1 ,
z (4) = a1 x1
Il sut alors de prendre

z(t) = x1
1
(t T )2 a1 (t T )4
+
a1
2
4!

t
2. L'intrt ventuel d'un transfert dans ces conditions vient du fait que nous ne supposons pas le contrle rsonnant comme il est usuel de le faire. Nous n'utilisons pas ici
l'approximation du champ tournant et les oscillations de Rabi.
et de calculer le contrle en boucle ouverte par la formule
z(t) +
E(t) =
1
a1
1
a2
1
a1
z (2) (t) +
1
z (4) (t)
a1 a2
1
a2
p1 << 1, il est facile de garantir en prenant un temps T assez

grand que |1 (t)| et |2 (t)| restent petits devant 1 tout au long du transfert.
Comme
C'est important pour que notre modle linaris reste valable et que le calcul
prcdent ait un sens.
Nous ne traiterons pas le problme du suivi de trajectoire car la notion de
feedback pour un tel systme est trs obscure l'heure actuelle, mme si, en
thorie, elle serait trs sduisante pour construire un calculateur quantique et
rendre les qubits insensibles la dcohrence due au couplage avec l'environnement. vrai dire, on se demande mme si la notion de feedback a un sens
de telles chelles. Pour un systme quantique la notion de rtro-action et
de feedback se heurtent au problme de la mesure. On ne peut pas supposer
que l'on connat chaque instant
et
2 .
En eet, toute mesure perturbe
notablement le systme et donc, pour ces systmes toutes petites chelles,

il n'est plus possible de dissocier l'appareil de mesure du systme lui mme
et de supposer que la perturbation due la mesure est arbitrairement petite.
Nous renvoyons un lecteur intress au cours du physicien S. Haroche [32].
Exemple 16
(Le hockey puck)
tant donn un corps rigide (de masse
unitaire) dans le plan, dont le centre de gravit est repr par les coordon-
(x, y), dont l'orientation est donne par l'angle , et dont l'inertie est
J . Ce systme est soumis exclusivement 3 une force (commande) u
s'exerant en un point bien dtermin (situ une distance r du centre de
nes
note
gravit) de ce corps. Il est reprsent sur la Figure 3.3. Les quations de la

dynamique sont
d2
x = u sin
dt2
d2
y = u cos
dt2
d2
J 2 = ru
dt
Ce systme mcanique est sous-actionn. Il possde 3 degrs de libert et
une seule commande. On souhaite pourtant le dplacer d'une conguration
une autre (c.--d. d'un point de dpart et d'une orientation un point
3. Il s'agit d'un hockey-puck, c.--d. un palet sur une table coussin d'air
128
CHAPITRE 3.
Figure 3.3 Le hockey puck : un solide soumis une force u (commande).

Pour eectuer des dplacements (entre
et
B ),
il faut le faire tourner en
le faisant avancer puis le retourner brutalement avant de le faire avancer

nouveau pour enn le freiner en prenant en compte la rotation induite par
la dclration.
d'arrive et une orientation possiblement dirente). On ne dispose que

d'une seule commande. Pour raliser ces manoeuvres, on est oblig d'utiliser
des stratgies compliques. Par exemple, on ne peut pas dplacer latralement
le systme sans engendrer de rotation. Pour arrter le solide lorsqu'il a acquis
de la vitesse, il faut le faire tourner et adapter la force suivant l'angle de
rotation. On se reportera [57] pour un expos dtaill.
3.2 Commandabilit non linaire
Figure 3.4 Planication de trajectoire entre deux tats p et q.

On considre le systme (f tant une fonction rgulire)
d
x(t) = f (x(t), u(t)),
dt
x(t) Rn ,
u(t) Rm
(3.5)
3.2.
129
COMMANDABILIT NON LINAIRE
Dnition 9 (Trajectoire d'un systme command). On appelle trajec-
I 3 t 7 (x(t), u(t)) Rn Rm
d'intrieur non vide I de R les
toire du systme (3.5) toute fonction rgulire
qui satisfait identiquement sur un intervalle

quations (3.5).
Dnition 10 (Commandabilit).
Le systme (3.5) est dit commandable
T > 0 si et seulement si pour tout p, q Rn , il existe une loi horaire

[0, T ] 3 t 7 u(t) Rm , appele commande en boucle ouverte, qui amne le
systme de l'tat x(0) = p l'tat x(T ) = q , c.--d. , telle que la solution du
en temps
problme de Cauchy
d
x(t)
dt
= f (x(t), u(t))
x(0) = p
vrie
x(T ) = q .
pour
t [0, T ]
Le systme est dit simplement commandable lorsqu'il est
commandable pour au moins un temps
T > 0.
D'autres dnitions sont possibles : elles correspondent toutes des variantes
plus ou moins subtiles de la Dnition 10. Comme l'illustre la Fi-
gure 3.4, la commandabilit exprime une proprit topologique trs naturelle. En gnral, la commande en boucle ouverte
[0, T ] 3 t 7 u(t)
n'est pas
unique, il en existe une innit. Cette tape s'appelle planication de trajec-
toire. Calculer
t 7 u(t)
partir de la connaissance de
f, p
et
constitue
l'une des questions majeures de l'Automatique. Cette question est loin d'tre
compltement rsolue actuellement.
Trs souvent, l'absence de commandabilit est due l'existence d'intgrales
premires non triviales. Ce sont des quantits qui restent constantes le long
de toute trajectoire. Nous allons les tudier.
3.2.1 Exemple de non commandabilit par la prsence

d'intgrale premire
Considrons le racteur exothermique de la Figure 3.5. Les quations de
bilan matire et d'nergie donnent les quations direntielles suivantes
d
x
dt 1
d
x
dt 2
d
T
dt
= D(xin
1 x1 ) k0 exp(E/RT )x1
= Dx2 + k0 exp(E/RT )x1
= D(T in T ) + H exp(E/RT )x1 + u
(3.6)
4. titre d'exemple, on pourra considrer la notion de commandabilit en temps petits,

qui demande que toutes les directions soient accessibles en temps court. Un contre exemple
est constitu par une voiture n'ayant pas de marche arrire, qui bien que pouvant, au prix
d'un certain nombre de manuvres, atteindre tous les points de son espace d'tat, ne peut
se dplacer latralement.
130
CHAPITRE 3.
Figure
3.5 Un racteur chimique exothermique o
correspond aux
changes thermiques avec l'extrieur.
On reconnat l'eet non linaire essentiel de la loi d'Arrhenius
k = k0 exp(E/RT )
qui relie la constante de vitesse
la temprature
T.
Comme nous l'avons
crit, la cintique est suppose du premier ordre. Les constantes physiques

in
in
usuelles (D , x1 , k0 , E , T , et H ) sont toutes positives. La commande u
est proportionnelle la puissance thermique change avec l'extrieur. On
note
xi
la concentration de l'espce chimique
Xi , i = 1, 2.
Il est assez facile
de voir que ce systme n'est pas commandable. En eet, le bilan global sur
X1 + X2 ,
limine le terme non linaire pour donner
d
(x1 + x2 ) = D(xin
1 x1 x2 ).
dt
La quantit = x1
D(xin
1 ). Donc
+ x2
vrie une quation direntielle autonome
in
= xin
1 + (0 x1 ) exp(Dt)
(3.7)
. Si, dans la Dnition 10, on prend l'tat

= x1 + x2 = xin
1 et q tel que = x1 + x2 = 0, il n'existe
pas de commande qui amne le systme de p vers q . En eet, pour toute
trajectoire dmarrant en un tel p, la quantit x1 + x2 reste constante et gale
in
x1 . Cette partie non commandable du systme reprsente par la variable
admet ici un sens physique prcis. Elle est bien connue des chimistes qui la
o
dt
initial
est la valeur initiale de
tel que
nomment invariant chimique .

L'exemple ci-dessus nous indique que l'absence de commandabilit peuttre lie l'existence d'invariants, i.e., des combinaisons des variables du
3.3.
131
COMMANDABILIT LINAIRE
systme et ventuellement du temps, qui sont conserves le long de toute train

jectoire. Pour (3.6), il s'agit de (x1 +x2 x1 ) exp(Dt) comme le montre (3.7).
Nous dnissons la notion d'intgrale premire pour les systmes commands.
Dnition 11 (Intgrale premire).

(t, x) 7 h(t, x) R
Une fonction rgulire
R Rn 3
est appele intgrale premire du systme (3.5), si elle
est constante le long de toute trajectoire du systme. Une intgrale premire

n
est dite triviale si c'est une fonction constante sur R R .
Si
est une intgrale premire, sa drive le long d'une trajectoire arbi-
traire est nulle pour toute trajectoire
t 7 (x(t), u(t))
du systme, c.--d.
h h d
d
h=
+
x0
dt
t
x dt
t 7 h(t, x) alors (3.5)
n
n'est pas commandable. Sinon, il existe T > 0, tel que pour tout p, q R et
tout instant initial t, h(t, p) = h(t + T, q) (il existe une trajectoire reliant p
q sur [t, t+T ]). Donc h est une fonction priodique du temps et indpendante
de x. Mais alors la drive de h le long des trajectoires du systme correspond
h. Comme elle est nulle, h est une constante, ce qui contredit l'hypothse.
t
Si (3.5) admet une intgrale premire non triviale
Nous avons montr la proposition suivante
Proposition 5.
Si le systme (3.5) est commandable, alors ses intgrales
premires sont triviales.

Il est possible de caractriser, partir de
et d'un nombre ni de ses
drives partielles, l'existence d'intgrales premires non triviales. Nous allons

nous restreindre dans ce cours au cas linaire. La dmarche est transposable
au cas non linaire mais elle conduit alors des calculs plus lourds qui,
pour tre prsents de faon compacte, ncessitent le langage de la gomtrie
direntielle et des crochets de Lie (voir par exemple [40]).
3.3 Commandabilit linaire

Nous considrons ici les systmes linaires stationnaires du type
d
x = Ax + Bu
dt
x Rn , la commande u Rm et les matrices A et B
tailles n n et n m, respectivement.
o l'tat
et de
(3.8)
sont constantes
132
CHAPITRE 3.
3.3.1 Matrice de commandabilit et intgrales premires

h : RRn 3 (t, x) 7
x dni par x = exp(tA)z .
Supposons que (3.8) admette une intgrale premire
h(t, x) R.
Soit le changement de variables sur
Avec les variables
(z, u),
(3.8) devient
d
z = exp(tA)Bu
dt
(3.9)
d
(exp(tA)) = exp(tA) A = A exp(tA). Dans
dt
l'quation (3.9), il est notable que le second membre ne dpend que de u
car d'aprs la Proposition 1,
h(t, exp(tA)z) = l(t, z).

Comme la valeur de l est constante le long de toute trajectoire t 7 (z(t), u(t)),
(et de
mais pas de
z ).
L'intgrale premire devient
nous avons
l
l d
d
l=
+
z=0
dt
t z dt
Comme
d
z
dt
= exp(tA)Bu,
pour toute valeur de
et
u,
on a l'identit
suivante
En prenant,
l
l
(t, z) + (t, z) exp(tA)Bu 0
t
z
u = 0, z et t arbitraires, on en dduit
l
(t, z) 0
t
Donc, ncessairement,
est uniquement fonction de
z.
Ainsi
l
(z) exp(tA)B 0
z
En drivant cette relation par rapport
t,
on a,
l
(z) exp(tA)AB 0
z
Plus gnralement, une drivation n'importe quel ordre
l
(z) exp(tA)Ak B 0
z
En spciant
t = 0,
on obtient
l
(z)Ak B = 0,
z
k 0.
k0
donne
3.3.
133
l
(z) appartient l'intersection des noyaux gauche de la
z
k
k
famille innie de matrice (A B)k0 . Le noyau gauche de A B n'est autre
k
k
que Im(A B) , l'orthogonal de l'image de A B . Donc
Ainsi le vecteur
\
l
k
(z)
Im(A B)
z
k0
Mais
Im(A B)
Im(B)
+ . . . + Im(Ak B) + . . .
k0
Ek = Im(B) + . . . + Im(Ak B) est une suite

croissante pour l'inclusion, Ek Ek+1 . Si pour un certain k , Ek = Ek+1 ,
k+1
cela signie que Im(A
B) Ek , donc A(E k ) Ek . Mais Im(Ak+2 B) =
k+1
Im(AA
B) A(E k+1 ). Ainsi Im(Ak+2 B) Ek . On voit donc que pour
k+r
tout r > 0, Im(A
B) Ek , d'o Ek+r = Ek . La suite des Ek est une suite
n
de sous-espaces vectoriels de R embots les uns dans les autres. Cette suite
stationne ds qu'elle n'est plus, pour un certain k , strictement croissante. Il
sut donc de ne considrer que ses n premiers termes, c.--d. E0 ,. . . ,En1 ,
car automatiquement En1 = En+r pour tout r > 0.
k
En revenant la suite des noyaux gauche de A B , nous voyons que
l
(z) est dans le noyau gauche de la suite innie de matrices
le fait que
z
l
k
(A B)k0 , est quivalent au fait que z
(z) est dans le noyau gauche de la
k
5
suite nie de matrices (A B)0kn1 .
l
Ainsi, pour tout z ,
(z) appartient au noyau gauche de la matrice
z
n (nm),
C = (B, AB, A2 B, . . . , An1 B)
(3.10)
La suite d'espaces vectoriels
dite matrice de commandabilit de Kalman. Si

gauche est nul, donc
et
ne dpend pas de
z:l
est de rang
n,
son noyau
est alors une fonction constante
galement.
Rciproquement, si la matrice de commandabilit C n'est pas de rang

n
maximal, alors il existe un vecteur w R /{0}, dans le noyau gauche de
5. On pourrait aussi utiliser le thorme de Cayley-Hamilton qui donne un rsultat plus
prcis : toute matrice carre est racine de son polynme caractristique. Cela veut dire,
tant de taille
n,
que
An
est une combinaison linaire des
An =
n1
X
(Ak )0kn1
pk Ak
k=0
o les
pk
Pn1
det(In A) = n k=0 pk k . Nous avons prfr un argument
suite des Ek car il a l'avantage de s'appliquer au cas non linaire. Il
sont dnis par
plus simple avec la
correspond au calcul de l'algbre de Lie de commandabilit.
134
CHAPITRE 3.
l(z, t) = wT z , on voit que dtd l = 0 le

long des trajectoires. En passant aux variables (x, u), on obtient une intgrale
T
premire non triviale h(t, x) = w exp(tA)x. Toute trajectoire du systme
se situe dans un hyperplan orthogonal w .
(3.10). En remontant les calculs avec
En rsum, nous avons dmontr la proposition suivante.
Proposition 6.
La matrice de commandabilit
C = (B, AB, A2 B, . . . , An1 B)

est de rang
n,
si, et seulement si, les seules intgrales premires du sys-
tme (3.8) sont triviales.

Des Propositions 5 et 6, il vient que, si le systme (3.8) est commandable, sa matrice de commandabilit est de rang
n.
Nous allons voir que la
rciproque est vraie. Pour cela, nous avons besoin de certaines proprits
d'invariance.
3.3.2 Invariance
Dnition 12 (Changement d'tat, bouclage statique rgulier).
changement linaire de coordonnes
x 7 x
est dni par une matrice
Un
n : x = M x. Un bouclage statique rgulier u 7 u est dni

N inversible d'ordre m et une autre matrice K , m n : u =
inversible d'ordre
par une matrice
K x + N u.
C'est un changement de variables sur les commandes paramtr
par l'tat.
L'ensemble des transformations
x
u

7
x
u

=
forment un groupe lorsque les matrices
M 0
K N
M, N
et

x
u
varient (M et
(3.11)
restant
inversibles).
d
x=
Si
dt
Ax + Bu est commandable (resp. n'admet pas d'intgrale pre

ex + Be
e u obtenu avec (3.11) est commandable (resp. n'admet
mire) alors x
e = Ae
pas d'intgrale premire). Les notions de commandabilit et d'intgrale premire sont intrinsques, c.--d. indpendantes des coordonnes avec lesquelles
les quations du systme sont tablies. Si la matrice de commandabilit dans
(x, u) est de rang n, la matrice de commandabilit dans

(
x, u) sera aussi de rang n. Cette simple remarque conduit
les coordonnes
les
coordonnes
au
rsultat non vident suivant

rang(B, AB, . . . A
n1
B) = n
quivaut
AB,
. . . , An1 B)
rang(B,
=n
3.3.
A
(
x, u)
135
et
d
x
dt
s'obtiennent en crivant
= Ax + Bu
dans les coordonnes
x = M 1 (AM + BK)
x + M 1 BN u.
soit
A = M 1 (AM + BK),
= M 1 BN
B
En fait, il est possible d'aller beaucoup plus loin et de montrer que les indices
de commandabilit dnis ci-dessous sont aussi invariants.
Dnition 13 (Indices de commandabilit). Pour tout entier k, on note

k
le rang de la matrice
(B, AB, A2 B, . . . , Ak B). Les (k ) sont appels
indices
de commandabilit du systme linaire (3.8),

La suite
est croissance, majore par
est quivalente
Proposition 7
Bu
n.
L'absence d'intgrale premire
n1 = n.
d
Les indices de commandabilit de dt x = Ax +
sont invariants par changement de variable sur x et bouclage statique
rgulier sur
(invariance)
u.
Nous laissons la preuve de ce rsultat par rcurrence sur
en exercice.
Il est important de comprendre l'ide gomtrique de cette invariance. Les

transformations
(x, u) 7 (
x, u) du type (3.11) forment un groupe. Ce groupe
dnit une relation d'quivalence entre deux systmes ayant mme nombre
d'tats et mme nombre de commandes. La proposition prcdente signie
simplement que les indices de commandabilit sont les mmes pour deux
systmes appartenant la mme classe d'quivalence, i.e le mme objet gomtrique vu dans deux repres dirents. En fait, on peut montrer que les
indices de commandabilit sont les seuls invariants : il y a autant de classes
d'quivalence que d'indices de commandabilit possibles. Nous ne montrerons pas en dtail ce rsultat. Tous les lments ncessaires cette preuve
se trouvent dans la construction de la forme de Brunovsky ci-dessous (voir
aussi [38, 67]).
Nous allons voir, avec la forme normale de Brunovsky, qu'une telle corres-
y et les trajectoires du systme est gnrale. Il sut que (3.8)

soit commandable. Tout revient donc trouver la sortie de Brunovsky y de
mme dimension que la commande u.
pondance entre
3.3.3 Critre de Kalman et forme de Brunovsky

Thorme 23
(Critre de Kalman)
d
Le systme dt x
= Ax + Bu
mandable si et seulement si la matrice de commandabilit
C = (B, AB, . . . An1 B)
est com-
136
CHAPITRE 3.
est de rang
n = dim(x).
(A, B) est commandable
commandabilit C est maximum.
Pour abrger, on dit souvent que la paire

dire que le rang de la matrice de
pour
La preuve que nous allons donner de ce rsultat n'est pas la plus courte
possible. Cependant, elle permet de dcrire explicitement, pour toute dun
re T > 0 et pour p, q R , les trajectoires du systme qui partent de p et
arrivent en
q . Cette preuve utilise la forme
dite de Brunovsky , objet du tho-
rme suivant. La forme de Brunovsky se construit en suivant une mthode

d'limination proche du pivot de Gauss.
Thorme 24 (Forme de Brunovsky).
(B, AB, . . . An1 B), la matrice de

d
x = Ax + Bu, est de rang n = dim(x) et si B est de
commandabilit de
dt
rang m = dim(u), alors il existe un changement d'tat z = M x (M matrice
inversible n n) et un bouclage statique rgulier u = Kz + N v (N matrice
inversible m m), tels que les quations du systme dans les variables (z, v)
admettent la forme normale suivante (criture sous la forme de m quations
direntielles d'ordre 1)
(1 )
y1
avec comme tat
Si
(m )
, ym
= vm
= v1 ,
...
(1)
(1 1)
z = (y1 , y1 , . . . , y1
...
(3.12)
( 1)
(1)
, ym , ym , . . . , ym m
),
les
tant des entiers positifs.

Les
quantits
yi ,
qui sont des combinaisons linaires de l'tat
x,
sont
appeles sorties de Brunovsky.

Les indices de commandabilit
et les
entiers
de la forme de Bru-
novsky sont intimement lis (pour plus de dtail voir [38]) : la connaissance
des uns est quivalente celle des autres.
Dmonstration. La preuve de ce rsultat repose sur

une mise sous forme triangulaire des quations d'tat et l'limination
de
u;
l'invariance du rang de
(B, AB, . . . An1 B)
par rapport aux transfor-
mations (3.11) ;
une rcurrence sur la dimension de l'tat.
Mise sous forme triangulaire

On suppose que
est de rang
m = dim(u)
(sinon, on peut faire un
m de faon se
x = (xr , xu ) avec
regroupement des commandes en un nombre plus petit que

ramener ce cas). Alors, il existe une partition de l'tat
3.3.
137
dim(xr ) = n m
et
dim(xu ) = m
telle que les quations (3.8) admettent la
structure bloc suivante
d
x
dt r
d
x
dt u
o
= Arr xr + Aru xu + Br u
= Aur xr + Auu xu + Bu u
Bu est une matrice carre inversible. Cette partition n'est pas unique, bien
u et en reportant cette
sr. En rsolvant la seconde quation par rapport

expression dans la premire quation, on obtient
d
x
dt r
d
x
dt u
= Arr xr + Aru xu + Br Bu1 ( dtd xu Aur xr Auu xu )

= Aur xr + Auu xu + Bu u
En regroupant les drives dans la premire quation, on a
d
x
dt r
Br Bu1 dtd xu = (Arr Br Bu1 Aur )xr + (Aru Br Bu1 Auu )xu
d
x = Aur xr + Auu xu + Bu u.
dt u
Avec la transformation du type (3.11) dnie par
xr = xr Br Bu1 xu ,
les quations
d
x
dt
= Ax + Bu
xu = xu ,
u = Aur xr + Auu xu + Bu u,
deviennent
d
x
dt r
d
x
dt u
= Ar xr + Au xu
= u
Ar = (Arr Br Bu1 Aur ) et Au = (Arr Br Bu1 Aur )Br Bu1 + (Aru

Br Bu1 Auu ). Dans cette structure triangulaire, o la commande u n'intervient
o
pas dans la seconde quation, on voit apparatre un systme plus petit d'tat
xr
et de commande
xu .
Cela nous permet de rduire la dimension de
et de
raisonner par rcurrence.
Invariance de rang
n1
Un simple calcul par blocs nous montre que si (B, AB, . . . A
B) est de
nm1
rang n alors (Au , Ar Au , . . . Ar
Au ) est de rang n m. Du systme de
d
x = Ar xr + Au xu
taille n on passe ainsi au systme de taille rduite n m,
dt r
(x
r l'tat, xu la commande).
Rcurrence sur le nombre d'tats

tant donn
n,
supposons le rsultat vrai pour toutes les dimensions

d
d'tat infrieures ou gales n 1. Considrons un systme
x = Ax + Bu
dt
avec n = dim(x), sa matrice de commandabilit de rang n, et B de rang
138
CHAPITRE 3.
m = dim(u) > 0.
L'limination de
donne, aprs une transformation du
type (3.11),
d
x
dt r
d
x
dt u
= Ar xr + Au xu
= u
dim(u) = dim(xu ) = m et dim(xr ) = nm avec (Au , Ar Au , . . . Arnm1 Au )

de rang n m < n (les ont t enlevs pour allger les notations). Notons m
le rang de Au . Comme m
m, un changement de variable sur xu , (
xu , xu ) =
P xu avec P inversible, permet d'crire le systme sous la forme
o
d
x
dt r
d
x
dt u
d
x
dt u
= Ar xr + Au xu
= u
= u
(3.13)
(
u, u) = P u, dim(
xu ) = m
et Au de rang m
. Le rang de la matrice de
d
x = Ar xr + Au xu (xr est l'tat et xu la commande)

commandabilit de
dt r
est gal n m = dim(xr ), l'hypothse de rcurrence assure l'existence
d'un changement de variable xr = M z et d'un bouclage statique rgulier
xu = Kz + N v (v est la nouvelle commande ici) mettant ce sous-systme
sous forme de Brunovsky. Le changement d'tat (xr , x
u , xu ) dni par
M 0 0
z
xr
xu = K N 0 v
0 0 1
xu
xu
avec
et le bouclage statique rgulier sur
(
u, u)
u = KM 1 (Ar xr + Au xu ) + N v,
u = v
transforment le systme (3.13) sous forme de Brunovsky avec
v = (
v , v)
comme nouvelle commande.
Preuve du Thorme 23
des variables sur
La commandabilit est indpendante du choix
et d'un bouclage statique rgulier sur
u.
On peut donc
supposer le systme sous sa forme de Brunovsky. Dans ces coordonnes, aller

d'un tat un autre est lmentaire. Ce problme se ramne tudier la
()
commandabilit du systme scalaire y
= v . L'tat initial (y0 , . . . , y01 ),
1
) ainsi que la dure T tant donns, les lois horaires
l'tat nal (yT , . . . , yT
t 7 v(t) assurant le passage entre ces deux tats pendant la dure T correspondent alors la drive
les drives jusqu' l'ordre
(r) (0) = y0r ,
-ime de fonctions [0, T ] 3 t 7 (t) R,

1 en 0 et T sont imposes par
(r) (T ) = yTr ,
r = 0, . . . , 1
dont
3.3.
139
Figure 3.6 Deux masses couples par un ressort. L'ensemble est soumis
une seule force
u.
Il existe bien sr une innit de telles fonctions

un polynme de degr
Exemple 17
2 1,
(on peut prendre pour
par exemple).
(Un exemple d'utilisation de la forme de Brunovsky)
Soit le
systme mcanique deux degrs de libert et une seule commande reprsent

sur la Figure 3.6. En ngligeant les frottements et en supposant le ressort
linaire de raideur
k,
on obtient le modle suivant
m1 x1 = k(x2 x1 ) + u
m2 x2 = k(x1 x2 )
(3.14)
Montrons que ce systme est commandable. Il sut pour cela de remar-
x2 , l'abscisse de la masse qui n'est pas directement souu, joue un rle trs particulier ( sortie de Brunovsky). Si au
lieu de donner t 7 u(t) et d'intgrer (3.14) partir de positions et vitesses
m
initiales, on xe t 7 x2 (t) = y(t), alors, on peut calculer x1 = k2 y
+ y et
donc, u = m1 x
1 + m2 x2 = m1km2 y (4) + (m1 + m2 )
y . Ainsi, on peut crire le
systme en faisant jouer x2 un rle privilgi
quer que la quantit

mise la force
x1 = (m2 /k) y + y
x2 = y
u = (m1 m2 /k) y (4) + (m1 + m2 )

y
On obtient une paramtrisation explicite de toutes les trajectoires du systme. Les relations prcdentes tablissent une correspondance bi-univoque et
rgulire entre les trajectoires de (3.14) et les fonctions rgulires
t 7 y(t).
Cette correspondance permet de calculer de faon lmentaire une commande

[0, T ] 3 t 7 u(t) qui fait passer le systme de l'tat p = (xp1 , v1p , xp2 , v2p ) l'tat
140
CHAPITRE 3.
q = (xq1 , v1q , xq2 , v2q ) (vi
d
correspond dt xi ). tant donnes les quations
x1 = (m2 /k) y + y
v1 = (m2 /k) y (3) + y

dt
(3.15)
x2 = y
v = dy
2
dt
il apparat qu'imposer p en t = 0 revient imposer y et ses drives jus(1) (2) (3)
qu' l'ordre 3 en 0 : (y0 , y0 , y0 , y0 ). Il en est de mme en t = T avec
(1) (2) (3)
(yT , yT , yT , yT ). Il sut donc de trouver une fonction rgulire [0, T ] 3
t 7 y(t) dont les drives jusqu' l'ordre 3 sont donnes a priori en 0 et
en T . Un polynme de degr 7 en temps rpond la question mais il existe
bien d'autres possibilits. Nous en dtaillons une ci-dessous qui est compltement explicite.
Soit la fonction
C 4 : [0, 1] 7 [0, 1]
() =
dnie par
4
.
4 + (1 )4
Il est facile de voir que est croissante avec

dk
(1) = 0 pour k = 1, 2, 3. La fonction
d k

y(t) =
dk
et d k (0)

t
t2 (2) t3 (3)
(1)
1
y0 + ty0 + y0 + y0
T
2
6

(t T )2 (2) (t T )3 (3)
t
(1)
+
yT +
yT
yT + (t T )yT +
T
2
6
k
(k)
y(0) = y0 , y(T ) = yT avec ddtky (0, T ) = y0,T , k = 1, 2, 3. On obtient

une trajectoire en x correspondant une telle transition en utilisant les
vrie
ainsi
(0) = 0, (1) = 1
formules (3.15) et le contrle correspondant avec
u = (m1 m2 /k) y (4) + (m1 + m2 )

y
x1 = x2 = 0 la
temps T s'obtient avec
En particulier, le transfert de la conguration stationnaire

conguration stationnaire
x1 = x2 = D > 0
durant le
le contrle en boucle ouverte suivant ( feedforward)
car alors

Dm1 m2 d4
D(m1 + m2 ) d2
u(t) =
+
kT 4 d 4 t
T2
d 2 t
T
T

t
y(t) = D T .
3.3.
141
3.3.4 Planication et suivi de trajectoires

Des preuves des Thormes 23 et 24, il est important de retenir deux
choses.
d
x = Ax + Bu est commandable , est quivalent
dt
l'existence d'un bouclage statique rgulier u = Kz + N v et d'un chan-
1. Dire que le systme
x = M z permettant de ramener le systme la forme

y () = v et z = (y, . . . , y (1) ) (par abus de notation
( )
( )
y = (y1 , . . . , ym ) et y () = (y1 1 , . . . , ym m )). Ces changements donnent
gement d'tat
de Brunovsky
x = M (y, . . . , y (1) ),
o la matrice
u = L(y, . . . , y () )
L est construite avec K , N et M . Lorsqu'on considre une

t 7 (t) Rm et qu'on calcule
fonction rgulire arbitraire du temps
x(t)
et
u(t)
par les relations
x(t) = M ((t), . . . , (1) (t)),
u(t) = L((t), . . . , () (t))
t 7 (x(t), u(t)) est une trajectoire du systme. L'quation dtd x(t)

Ax(t)Bu(t) = 0 est identiquement satisfaite. Rciproquement, toutes
alors
les trajectoires rgulires du systme se paramtrisent de cette faon,

grce
fonctions scalaires arbitraires
1 (t), . . ., m (t)
et un nombre
ni de leurs drives par les formules ci-dessus.
d
x = Ax + Bu implique la possibilit de stabidt
lisation par retour d'tat. La forme de Brunovsky fait apparatre cette
2. La commandabilit de
possibilit. Sous cette forme normale, chacun des m sous-systmes in(i )

dpendants s'crit yi
= vi . Soient i valeurs propres, 1 , . . . , i ,
correspondant au spectre d'une matrice relle de dimension i . Notons
sk
les fonctions symtriques des
gnes de degr
i
Y
k,
(des quantits relles donc) homo-
obtenues par le dveloppement suivant
(X k ) = X i s1 X i 1 + s2 X i 2 + . . . + (1)i si
k=1
Alors, ds que les
sont partie relle strictement ngative (c.--d.
qu'ils correspondent une matrice Hurwitz ), le bouclage
(i 1)
vi = s1 yi
assure la stabilit de
(i )
yi
(i 2)
s2 yi
= vi .
+ . . . + (1)i 1 si yi
En eet, les exposants caractristiques
(on dit aussi les ples) du systme boucl sont les
k .
142
CHAPITRE 3.
Figure 3.7 Suivi de trajectoire.

Comme nous venons de le voir, de la forme de Brunovsky, on dduit directement le rsultat suivant
Thorme 25
(A, B) est commandable

(voir le Thorme 23) alors, pour toute matrice relle F de taille n n, il
existe une matrice m n, K (non ncessairement unique si m > 1), telle que
le spectre de A BK concide avec celui de F .
(Placement de ples)
Si la paire
d
x = Ax + Bu, la pladt
nication de trajectoire nous donne une trajectoire en boucle ouverte du sysDe retour dans les coordonnes de modlisation,
tme (par exemple la trajectoire que doit suivre une fuse au dcollage, la
manoeuvre d'atterrissage d'un avion,
avec l'indice
. . .).
Nous la notons
t 7 (xr (t), ur (t))
pour rfrence. En pratique, il convient, comme l'illustre la
Figure 3.7, de corriger en boucle ferme en fonction de l'cart

mande de rfrence
partir de
ur .
x,
la com-
Le problme est donc de calculer la correction
de faon revenir sur la trajectoire de rfrence. C'est un
problme de suivi de trajectoire . On peut galement le rsoudre en utilisant

un bouclage stabilisant par placement de ples sous la forme de Brunovsky.
Nous allons dtailler ce point.
d
x = Axr + Bur , on obtient, par dirence avec dtd x
Comme
dt r
l'quation d'erreur suivante
= Ax + Bu
d
(x) = A x + B u
dt
x = x xr et u = u ur . Le systme tant commandable, il existe K ,
matrice m n, telle que les valeurs propres de A + BK sont toutes partie
o
relle strictement ngative (d'aprs le Thorme de placement de ples 25).

La correction
u = K x
assure le suivi asymptotique de la trajectoire de rfrence
t 7 xr (t).
Nous terminerons par une constatation d'ordre exprimental : lorsque le

d
modle dynamique
x = Ax+Bu est d'origine physique, il n'est pas rare que
dt
3.4.
143
COMMANDE LINAIRE QUADRATIQUE LQR
sa partie non commandable, i.e., ses intgrales premires, ait une signication
physique immdiate, tout comme les grandeurs
y , fonction de x et intervenant
dans la forme de Brunovsky de sa partie commandable. Cet tat de fait n'est

vraisemblablement pas d entirement au hasard : en physique, les grandeurs
qui admettent une signication intrinsque, i.e., les grandeurs physiques, sont
celles qui ne dpendent pas du repre de l'observateur. En Automatique, le
passage d'un repre un autre correspond, entre autres, une transformation
de type (3.11). Il est alors clair que le sous-espace engendr par les sorties
de Brunovsky est un invariant. Il a donc toutes les chances d'avoir un sens
physique immdiat. Les sorties de Brunovsky admettent un quivalent non
linaire pour de nombreux systmes physiques (voir la Section 3.5.1).
3.4 Commande linaire quadratique LQR

Nous avons tudi la proprit de commandabilit (objet de la Dnition 10), qui requiert, pour tre satisfaite par un systme, l'existence pour
tout
p, q
d'une trajectoire reliant un tat
un tat
q.
Sous l'hypothse
de commandabilit, nous avons vu comment construire une telle trajectoire

par la forme de Brunovsky (voir Thorme 24). Cette trajectoire est loin
d'tre unique. On va maintenant montrer comment choisir la trajectoire la
meilleure au sens d'un critre quadratique. C'est l'objet de la commande
linaire quadratique .
Nous nous intressons ici, en toute gnralit, aux systmes linaires ins-
tationnaires du type
d
x(t) = A(t)x(t) + B(t)u
dt
o l'tat
matrices
(3.16)
x(t) Rn , la commande u(t) Rm et, pour

A(t) et B(t) sont de tailles n n et n m,
tout
t [0, +[
les
respectivement. Ces
systmes peuvent provenir de bilans exacts ou, plus souvent, de la linarisation autour de trajectoires de manuvre entre des points stationnaires. Ainsi
d
si t 7 (xr (t), ur (t)) est une trajectoire de rfrence de
x = f (x, u), on a
dt
d
x = f (xr , ur ) et on note
dt r

f
A(t) =
,
x (xr (t),ur (t))
En fait,
et

f
B(t) =
u (xr (t),ur (t))
dans (3.16), correspondent aux carts
Considrons un intervalle de temps donn
[0, tf ]
x xr (t)
et
u ur (t).
(sur lequel l'ventuelle
trajectoire de rfrence est dnie). On cherche minimiser le critre qua-
144
CHAPITRE 3.
x 10
2.6
altitude
2.4
2.2
2
1.8
1.6
1.4
1.2
1
0.8
200
400
600
800
1000
1200
1400
1600
1800
2000
temps
Figure 3.8 Trajectoire de rentre d'un vhicule spatial (dpart en orbite,

arrive 80.000 pieds) . Les rebonds atmosphriques permettent de maximiser
le dport latral en utilisant les eets arodynamiques.
dratique suivant
tf

xT (t)Rx + uT (t)Qu(t) dt
J=
(3.17)
0
o
R est une matrice symtrique positive et Q une matrice symtrique dnie

6
positive .
Implicitement, on cherche une commande
pondre par
[0, tf ] 3 t 7 u(t)
faible (car
dans le calcul de l'intgrale) limitant les dviations de
elles-mmes pondres par
sur l'horizon temporel
[0, tf ].
La commande
minimisant (3.17) ralise le meilleur compromis (au sens prcis par les pondrations
et
Exemple 18
Q)
entre dviation de l'tat et eort sur les actionneurs.
(Rentre atmosphrique)
Un exemple de trajectoire dnis-
sant un systme linaris tangent instationnaire du type (3.16) est donn sur
la Figure 3.8. On y a reprsent l'historique des valeurs de l'altitude pour
une trajectoire de vaisseau spatial (type navette) dans la manuvre de rentre atmosphrique au cours de laquelle on cherche maximiser le dport
6. L'hypothse de symtrie n'enlve rien la gnralit. En eet pour tout
x Gx = x ((G + G )/2)x.
T
le calcul de x Gx.
a
Autrement dit, seule la partie symtrique de
x Rn ,
on
G compte dans
3.4.
145
latral (i.e. en faisant pivoter l'appareil pour rejoindre une plus haute latitude o est situ le point de chute dsir pour l'engin). Cet objectif et les
contraintes arodynamiques (notamment la thermique et la variation de densit de l'atmosphre) confrent l'optimum de nombreuses bosses (appeles
rebonds atmosphriques). An d'assurer le suivi de cette trajectoire, on doit
concevoir un contrleur en boucle ferme. On linarise alors les quations autour de cette trajectoire rebonds et on obtient naturellement un modle de
la forme (3.16). On pourra se reporter [11] pour une prsentation dtaille
de ce problme.
Dans le cas multivariable en particulier, i.e. o on dispose de plusieurs
commandes, on a en gnral trop de degrs de libert pour rsoudre les
problmes de planication et de suivi de trajectoire. En voquant un critre
minimiser comme nous venons de le faire en (3.17), on dnit implicitement
l'utilisation des degrs de libert supplmentaires : ils permettent d'optimiser
cet indice de performance.
Exemple 19
(Racteur nuclaire eau pressurise)
On prsente ici un
exemple de systme multivariable pour lequel on peut raliser des transitoires

de trs nombreuses faons. De manire gnrale, les racteurs nuclaires de
production d'lectricit prsentent d'intressants problmes d'Automatique.
Leur schma de principe est donn sur la Figure 3.9, on pourra se rfrer
[48] pour une prsentation gnrale. Dans le circuit primaire, la neutronique
est contrle par la contre-ractivit des barres et du bore dont on peut agir
sur la concentration par un circuit de borication/dilution. Les changes avec
le circuit secondaire fournissent, travers le gnrateur de vapeur, de la
puissance la turbine qui est accouple une gnratrice. On peut utiliser
une vanne de contournement pour fournir plus ou moins de puissance la
turbine. En dehors des phases de rgulation, c.--d. de la stabilisation autour
d'un point de fonctionnement (on parle de rgulation de frquence du rseau),
on est souvent amen raliser des transitoires lorsque la demande du rseau
lectrique varie. Une manuvre dicile est l'iltage, qui consiste isoler le
rseau. Il faut alors utiliser les direntes commandes de manire coordonne
pour rduire la puissance en minimisant la fatigue des installations. Une
formulation type commande linaire quadratique permet de spcier ce genre
de cahier des charges.
De manire encore plus gnrale, on peut considrer le cot avec pondration nale
1
1
J = xT (tf )Sf x(tf ) +
2
2
Z
0
tf

xT (t)Rx(t) + uT (t)Qu(t) dt
(3.18)
146
CHAPITRE 3.
gnrateur de vapeur
vanne de
contournement
barres de contrle
rseau lectrique
turbine
pressuriseur
borication/dilution
refroidissement
condenseur
racteur
pompe de circulation
Figure
pompe circuit secondaire
3.9 Schma de principe d'un racteur nuclaire eau pressuri-
se. Pour contrler la production d'lectricit, on peut utiliser 3 actionneurs

(commandes) : barres de contrle, systme de borication/dilution, vanne de
contournement de la turbine.
qui permet de rajouter de l'importance au point nal atteint (Sf tant une
matrice symtrique positive).
L'intrt des formulations quadratiques (3.18) (et (3.17)) est qu'elles sont
en gnral bien poses au sens mathmatique, et qu'elles admettent une solution unique, calculable numriquement
3.4.1 Multiplicateurs de Lagrange en dimension innie

Le but de cette section est de prsenter de faon simple la mthode
des multiplicateurs de Lagrange en dimension innie. Cette mthode permet
de caractriser l'optimum du critre (3.18) (ou (3.17)). Un lecteur intress
pourra consulter [4, 13] ou les notes de l'ES d'optimisation [61].
Commenons par la dimension nie. On part du problme suivant o le
J : Rn 7 R et les p contraintes scalaires hi : Rn 7 R sont des
critre
7. Calculable analytiquement pour un ou deux tats mais pas plus en pratique. C'est
trs dirent de l'approche utilisant la forme normale de Brunovsky, approche que l'on
peut conduire analytiquement sans dicult sur de nombreux exemples physiques bien
plus que trois tats.
3.4.
147
fonctions drivables du temps
J(x)
min
x Rn
h1 (x) = 0
hp (x) = 0
.
.
.
Pour rsoudre ce problme on introduit

p multiplicateurs de Lagrange (les variables adjointes ) = (1 , ..., p )

Rp ;
on calcule le Lagrangien
L(x, ) = J(x) +
p
X
i hi (x) = J(x) + T h(x);
i=1
on calcule les conditions de stationnarit du Lagrangien au 1er ordre
x et pouvaient varier librement dans

toutes les directions. Ces conditions traduisent le fait que L = 0 pour
toutes variations innitsimales x et des variables x et .
condition L = 0 pour tout x donne n quations
en faisant comme si les variables
La
X hi
J
+
= 0,
i
xk
xk
i=1
La condition
L = 0
pour tout
redonne les
hi (x) = 0,
On a ainsi un systme de
k = 1, . . . , n
contraintes
i = 1, . . . p
n+p inconnues avec n+p quations rsoudre pour
trouver l'optimum. La partie la plus dure reste cependant faire : rsoudre

ce systme d'quations non-linaires et vrier que la solution trouve est
bien l'optimum .
Passons maintenant la dimension innie avec le problme suivant o
n
m
n
m
n
n
toutes les fonctions L : R R 7 R, f : R R 7 R , l : R 7 R sont
0
drivables et o le temps nal tf et la condition initiale x sont des constantes
8. On pourra alors regarder les conditions au second ordre.
148
CHAPITRE 3.
donnes
min
[0, tf ] 3 t 7 (x(t), u(t)) Rn Rm
x(0) = x0
f1 (x(t), u(t)) dtd x1 (t) = 0, t [0, tf ]
tf
Z
l(x(tf )) +

L(x(t), u(t)) dt
.
.
.
fn (x(t), u(t))
d
x (t)
dt n
= 0, t [0, tf ]
(3.19)
On est en dimension innie car on minimise une fonctionnelle pour toutes
t 7 (x(t), u(t)) qui vrient les contraintes, i.e. pour toutes les
d
x = f (x, u) qui dmarrent en t = 0 de x0 .
trajectoires du systme
dt
d
On voit que les contraintes fi (x(t), u(t))
x (t) = 0 dpendent d'un
dt i
indice discret i et d'un indice continu t. Il est donc logique d'introduire les
multiplicateurs i (t) avec ces deux types d'indice. On forme le Lagrangien
L avec une somme discrte sur i et une somme continue sur t (une intgrale
donc) des produits contrainte d'indice (i, t) fois multiplicateur d'indice (i, t)
Z tf
L(x(t), u(t)) dt
L(x, u, ) = l(x(tf )) +
0

n Z tf
X
d
i (t) fi (x(t), u(t)) xi (t) dt
+
dt
i=1 0
les courbes
L est une fonctionnelle qui

rel L(x, u, ) calcul avec une
Le Lagrangien
aux fonctions
associe un
intgrale sur
x, u
t.
et
sur
[0, tf ]
On note de faon
plus compacte
Z
L(x, u, ) = l(x(tf ))+
tf

d
L(x(t), u(t)) + (t) f (x(t), u(t)) x(t) dt
dt
T
Les conditions de stationnarit du premier ordre s'obtiennent alors, comme

dans le cas de la dimension nie, en explicitant qu'au premier ordre la va-
x, u et
t 7 (t). Puisqu'on n'a pas
0
introduit de multiplicateur pour la contrainte x(0) = x , nous imposons la
variation x de vrier la contrainte x(0) = 0.
Commenons par la variation de . On doit avoir, pour toute variation de
la courbe , une variation de L nulle au premier ordre. En d'autres termes,
n
pour toute fonction t 7 (t) R on doit avoir

Z tf
d
T
L =
(t) f (x(t), u(t)) x(t) dt = 0
dt
0
riation
de
est nulle pour toute variation innitsimale
des courbes paramtres
t 7 x(t), t 7 u(t)
et
3.4.
La seule possibilit
0.
est qu' chaque instant
149
t [0, tf ], f (x(t), u(t)) dtd x(t) =
On retrouve bien les contraintes comme en dimension nie.

Poursuivons avec la variation de
u.
On doit avoir, pour toutes variations
u, une variation de L nulle au premier ordre. Pour toute

t 7 u(t) Rm , on doit avoir
!

Z tf

L
f

L =
u(t) + T (t)
u(t) dt = 0

u
u (x(t),u(t))
0
(x(t),u(t))]
du contrle
tion
fonc-
u en facteur on obtient
!

Z tf

L
f

+ T (t)
u(t) dt = 0
L =

u
u
0
(x(t),u(t))
(x(t),u(t))
En mettant
Ceci donne la condition de stationnarit sur
L
f
(x, u) + T
(x, u) = 0, t [0, tf ]
(3.20)
u
u
Terminons par la variation de x. On doit avoir, pour toutes variations x
vriant x(0) = 0, une variation de L nulle au premier ordre. Pour toute
n
fonction t 7 x(t) R telle que x(0) = 0, on doit avoir
l
L =
(x(tf ))x(tf )+
x
"

Z tf
L
x(t) + T (t)

x
0
(x(t),u(t))]
!#

d
f
x(t) x(t)
dt = 0
x (x(t),u(t))
dt
Pour mettre, comme avec u, x en facteur dans l'intgrale, il nous faut

d
liminer
x. La seule possibilit est de faire une intgration par partie.
dt
d
. C'est ici que rside principalement la nouveaut par
Cela fait apparatre
dt
rapport la dimension nie. On a
tf
d
t
(t) x(t) dt = [T x]0f +
dt
T
tf
d T
(t) x(t) dt
dt
0
Z tf
d T
T
= (tf )x(tf ) +
(t) x(t) dt
dt
0
x(0) = 0. On a

l
T
L =
(x(tf )) (tf ) x(tf )+
x
#

Z tf "

L
f
d

+ T (t)
+ T (t) x(t) dt = 0

x (x(t),u(t))]
x (x(t),u(t)) dt
0
car
9. On se reportera au lemme de duBois-Reymond.
150
CHAPITRE 3.
Donc, pour toute fonction
tf
"
t 7 x(t)
telle que
x(0) = x(tf ) = 0,
#

L
f
d

+ T (t)
+ T (t)
x (x(t),u(t))]
x (x(t),u(t)) dt
x(t) dt
on a
On en dduit

L
f
d T
T
(t) = 0
+
(t)
+
x (x(t),u(t))]
x (x(t),u(t)) dt
c.--d.
Enn, avec
L
x
T

+
(x,u)
x(tf ) 6= 0
f
x
T
+
(x,u)
on obtient de
(tf ) =
d
= 0, t [0, tf ]
dt
L = 0
(3.21)
la condition nale
l
(x(tf ))
x
En somme, les conditions d'optimalit du premier ordre pour le problme (3.19) sont pour
t [0, tf ]
x(t) = f (x(t), u(t))
dt
T
T
d
L
f
(t)
(t) =
dt
x (x(t),u(t))
x (x(t),u(t))

L
f
0=
+ T
u (x(t),u(t))
u (x(t),u(t))
(3.22)
avec comme condition au bord
x(0) = x0 ,
(tf ) =
l
(x(tf ))
x
(3.23)
Il s'agit d'un problme aux deux bouts , ce n'est pas un problme de Cauchy ,
t = 0 et t = tf comme
tat adjoint . Nous allons
f est linaire et o les fonc-
car la condition initiale est spare entre les temps

le prcise l'quation (3.23). On appelle souvent
maintenant utiliser ces formules dans le cas o
tions
et
sont quadratiques. C'est le cas dit linaire quadratique . Sous ces
hypothses, les conditions de stationnarit ci-dessus sont alors des conditions

ncessaires et susantes d'optimalit.
3.4.
151
3.4.2 Problme aux deux bouts dans le cas linaire quadratique

La caractrisation de la commande optimale pour le problme de mi0
nimisation du critre (3.18) pour une condition initiale x(0) = x donne
passe par le calcul des conditions de stationnarit (3.22) avec f = Ax + Bu,
L = 21 (xT Rx + uT Qu) et l = 12 xT Sf x. Le problme aux deux bouts correspondant prend la forme
d
1 T
x(t) = A(t)x(t) BQ B (t)

dt
d
(t) = Rx(t) AT (t)(t)

dt
(3.24)
avec les conditions limites bilatrales
x(0) = x0 ,
L'tat adjoint
(tf ) = Sf x(tf )
est de la mme dimension que x. La commande optimale est
alors donne par la dernire quation de (3.22)
u(t) = Q1 B T (t)(t)
La particularit des quations (3.24) est qu'elles admettent une solution
explicite sous forme linaire
(t) = S(t)x(t)
avec
S(tf ) = Sf .
Nous allons dtailler ce point.
En substituant dans (3.24), on obtient
d
S(t)x(t) + S(t)A(t)x(t) S(t)B(t)Q1 B T (t)S(t)x(t)
dt
= Rx(t) AT (t)S(t)x(t)
Il sut alors de choisir
solution de l'quation direntielle matricielle
de Riccati en temps rtrograde (quadratique en l'inconnue
S)
d
1 T
T
S(t) = S(t)A(t) + S(t)B(t)Q B (t)S(t) R A (t)S(t)
dt
S(tf ) = Sf
(3.25)
pour obtenir nalement la commande optimale
u(t) = Q1 B T (t)S(t)x(t)
(3.26)
152
CHAPITRE 3.
Le fait majeur retenir ici est que la commande optimale (3.26) s'exprime
prcisment comme une loi de feedback instationnaire dont le gain peuttre calcul hors-ligne
10
(i.e. avant de raliser la moindre exprience) par la
rsolution de l'quation de Riccati (3.25).
Exemple 20
([13])
d
Soit la dynamique dt x
= v,
minimiser
1
1
J=
c1 v(tf )2 + c2 x(tf )2 +
2
2
o
c1 , c2
tf
et
d
v
dt
= u
et le critre
tf
u2 (t)dt
sont des constantes positives. La commande optimale est
u(t) = x (t)x(t) v (t)v(t)

o
x =
1/c2 + 1/c1 (tf t)2 + 1/3(tf t)3

D(tf t)
v =
1/c1 (tf t) + 1/2(tf t)2

D(tf t)
avec

D(tf t) =
1
1
+ (tf t)3
c2 3

1
1
+ tf t (tf t)4
c1
4
De manire intressante, il est possible d'exprimer simplement la valeur

du cot
(3.18) associe la commande optimale
(3.26). Considrons
l'galit
tf

d T
x (t)S(t)x(t) dt = xT (tf )Sf x(tf ) xT (0)S(0)x(0).
dt
Il vient alors
1
1
J xT (0)S(0)x(0) =
2
2
Z
0
tf

d T
x (t)S(t)x(t) dt
dt
Z
1 tf T
+
(x (t)Rx(t) + uT (t)Qu(t))dt
2 0
10. On peut montrer que le problme linaire instationnaire avec cot quadratique considr ici donne la solution au deuxime ordre d'un problme non-linaire plus prcis dont il
est l'approximation. La loi de feedback que nous venons de calculer procure alors le calcul
des extrmales de voisinages (voir [13]).
3.4.
153
En dveloppant et en explicitant (3.26), on a
1
1
J xT (0)S(0)x(0) =
2
2
tf
(x (t) R SBQ B S + SA + A S + S x(t))dt

T
En utilisant (3.25), on obtient nalement
1
J xT (0)S(0)x(0) = 0.
2
On vient de calculer que le cot associ la commande optimale (3.26) est
1
J opt = xT (0)S(0)x(0)
2
(3.27)
Nous pouvons maintenant rcapituler nos rsultats dans la proposition suivante
Proposition 8 (contrleur LQR). Soit le systme linaire instationnaire (3.16)
d
x(t) = A(t)x(t)
dt
minimiser (3.18)
+ B(t)u
avec
x(0)
1
1
J = xT (tf )Sf x(tf ) +
2
2
comme condition initiale, et le critre
tf

A(t) est une matrice nn, B(t) est une matrice nm, Sf et R sont symtriques positives, Q est symtrique dnie positive. La solution ce problme
o
de minimisation est la loi de feedback optimal (3.26)
u(t) = Q1 B T (t)S(t)x(t)
o
est dnie par l' quation direntielle de Riccati rtrograde (3.25), et

opt = 1 xT (0)S(0)x(0).
la valeur du critre qui lui est associe est J
2
3.4.3 Planication de trajectoires

+ l'objectif de minimiser un critre quadratique du type (3.17), on peut
ajouter une contrainte nale , permettant d'exprimer le souhait de se rendre
exactement en un point donn. On se retrouve alors avec un problme de
planication de trajectoire optimale pour un systme linaire instationnaire .
La contrainte que nous considrons ici est
x(tf ) =
(3.28)
154
CHAPITRE 3.
Rn .
Il est possible bien sr de considrer des contraintes plus gn-
rales, et/ou ne portant que sur certaines composantes de l'tat, on pourra se

rfrer [13] pour un expos des mthodes se rapportant ces cas.
Les conditions de stationnarit sont modies par l'adjonction de la contrainte (3.28). Il sut de remplacer la condition nale dans (3.23) par la
condition nale
x(tf ) = .
On obtient la commande optimale par la rsolu-
tion des quations suivantes
d
S(t) = S(t)A(t) + S(t)B(t)Q1 B T (t)S(t) R AT (t)S(t)
dt
S(tf ) = 0

d
V (t) = AT (t) S(t)B(t)Q1 B T (t) V (t)
dt
V (tf ) = I
d
H(t) = V T (t)B(t)Q1 B T (t)V (t)
dt
H(tf ) = 0
o
est la matrice identit de taille
(3.29)
(3.30)
(3.31)
(3.32)
(3.33)
(3.34)
n. On notera que (3.29) est une quation
direntielle de Riccati qu'on devra rsoudre en temps rtrograde depuis

sa condition terminale (3.30). Une fois cette quation rsolue, on pourra
calculer
V (t)
en rsolvant l'quation linaire (3.31) partir de la condition
terminale (3.32). Ensuite, on pourra calculer
H(t)
travers (3.33) et (3.34)
par une simple intgration en temps rtrograde. La matrice H(t) est toujours
d
H 0. Elle n'est pas singulire lorsque le systme
ngative car H(tf ) = 0 et
dt
est commandable (voir [13]). Finalement, la commande optimale est

u(t) = Q1 B T (t) S(t) V (t)H 1 (t)V T (t) x(t) Q1 B T (t)V (t)H 1 (t)
C'est encore une fois une loi de feedback instationnaire, complt par un
terme de feedforward lui aussi instationnaire.
Exemple 21.
Considrons le systme dynamique
d
x(t) = Ax(t) + Bu(t) ,
dt
0
1
1/2 0
On souhaite calculer une commande [0

0
T
systme de x = [0.5 1] xf = [1
Z
0

x(t) +
0
1

u(t)
3] 3 t
7 u(t) R transfrant le
0]T , en minimisant le critre
quadratique
1
J=
2
u(t)2 dt
3.4.
155
On forme le systme
d
S(t) = S(t)A + S(t)BQ1 B T S(t) AT S(t)
dt
S(3) = 0

d
V (t) = AT S(t)BB T V (t)
dt
V (3) = I
d
H(t) = V T (t)BB T V (t)
dt
H(3) = 0
(3.35)
(3.36)
(3.37)
(3.38)
(3.39)
(3.40)
qu'on rsoud en cascade comme expliqu la Section 3.4.3. Tout d'abord, on

d
T
remarque que S(t) = 0. L'quation (3.37) se rcrit alors dt V (t) = A V (t),
qu'on peut rsoudre explicitement avec la condition terminale (3.38). Il vient
V (t) = exp (t 3)AT
Ensuite, on intgre numriquement (3.39) ce qui donne
Z
H(t) =
tf
V T ( )BB T V ( )d
pour nalement calculer le contrle optimal
u(t) = B T V (t)H 1 (t)V T (t)x(t) B T (t)V (t)H 1 (t)

La rsolution eective de ces calculs donne les trajectoires de la Figure 3.10.
3.4.4 Rgulateur LQR

On utilise souvent une version plus simple de la commande linaire quadratique que celle que nous venons de prsenter en considrant
tf +.
Le cot minimiser est alors
Z
J=

(3.41)
0
o
est une matrice symtrique positive,
est une matrice symtrique
dnie positive et la dynamique que nous considrons est linaire stationnaire
d
x(t) = Ax(t) + Bu
dt
(3.42)
156
CHAPITRE 3.
0.5
0. 5
1. 5
0.5
1.5
2.5
Figure 3.10 Trajectographie sous contraintes nales (planication de trajectoire ) avec minimisation quadratique.
o l'tat
nn
et
x Rn , la commande u Rm
n m, respectivement.
et les matrices
et
sont de tailles
La rsolution de ce problme de commande optimale est plus simple. Elle

aboutit un feedback stationnaire qui possde d'intressantes proprits.
Thorme 26
(Rgulateur LQR)
Considrons le problme de minimisa-
tion du cot quadratique (3.41) pour le systme (3.42) sous les hypothses
suivantes :
1.
(A, B)
2.
est symtrique positive
3.
est symtrique dnie positive
est commandable
4. Il existe une racine de

11
pitre 4) .
telle que
(A, R1/2 )
est observable (voir Cha-
La solution ce problme de minimisation est la loi de feedback optimal
u(t) = Q1 B T S 0 x(t)
11. On entend par racine de
R,
note
R1/2
une matrice telle que
Toute matrice hermitienne positive admet une telle factorisation.
R = (R1/2 )T R1/2 .
3.4.
157
S 0 est l'unique solution symtrique stabilisante (i.e. telle que dtd x = (A

BQ1 B T S 0 )x(t) est asymptotiquement stable) de l' quation de Riccati algo
brique
0 = SA + AT S SBQ1 B T S + R
et la valeur du critre qui lui est associe est
(3.43)
xT (0)S 0 x(0).
Dmonstration. La preuve de ce rsultat s'articule en plusieurs points. La

principale dicult rside dans la preuve de l'existence et de l'unicit d'une
solution symtrique stabilisante l'quation de Riccati algbrique (3.43).
i) Commenons par montrer l'existence d'une telle solution. Considrons

l'quation direntielle de Riccati obtenue partir de (3.25) en inversant le
temps
d
= A + AT BQ1 B T + R
dt
et notons
0 (t)
(3.44)
Comme on l'a vu la Proposition 8, on a alors, quel que soit

xT (t)Rx(t) + uT (t)Qu(t) dt = xT (0)0 (t)x(0)
min
u
0 (0) = 0.
x(0),
la solution correspondant la condition initiale
Cette fonction est croissante en
car
t2 t1

Z t1

min
min
u
t,
D'autre part, cette fonction est majore. En eet, la paire
(A, B)
tant com-
mandable, il existe, par le Thorme de placement de ples 25 un feedback
u(t) = Kx(t) procurant la convergence exponentielle

d
x = (A BK)x. L'tat, et donc la commande calcuau systme boucl
dt
le par ce feedback, convergent tous deux exponentiellement vers zro. On
linaire stationnaire
en dduit que, pour un certain
>0
correspondant la valeur du critre
obtenue en utilisant ce feedback linaire stationnaire, on a
Z
min
u

t 7 xT (0)0 (t)x(0) est croissante et majore donc elle converge

T
limite, ncessairement quadratique, que nous notons x (0) x(0)
La fonction
vers une
158
CHAPITRE 3.
symtrique. Quel que soit x(0), on a limt xT (0)0 (t)x(0) =

x (0) x(0). On en dduit limt 0 (t) = . En utilisant l'quation did
rentielle de Riccati (3.44), on en dduit que, lorsque t , dt (t) converge
avec
T
lui aussi, et que sa limite est ncessairement nulle. On en dduit nalement,

que
satisfait l'quation de Riccati algbrique
0 = A + AT BQ1 B T + R
Montrons que
(3.45)
est dnie positive (dans le but de l'utiliser ensuite
pour construire une fonction de Lyapounov). Supposons qu'il existe un

T
non nul tel que x (0) x(0) = 0, alors, quel que soit t 0, on a

xT (t)Rx(t) + uT (t)Qu(t) dt = 0
min
u
Or
est symtrique dnie positive, on en dduit
a alors
x(0)
u=0
et, l'optimum, on
(R1/2 x(t))T R1/2 x(t)dt = 0
0
On a alors ncessairement, que pour tout
t 0, R1/2 x( ) = 0
pour tout
d
x = Ax
dt
car, comme nous venons de le voir, dans ce cas la commande est nulle. On
[0, t].
L'quation direntielle satisfaite pour cet optimum est
en dduit, par drivations successives,
R1/2 x(0) = 0 = R1/2 Ax(0) = R1/2 A2 x(0) = ... = R1/2 An1 x(0)
(A, R1/2 ) est observable (voir le critre de Kalman pour l'observabilit donn au Thorme 28). On en dduit x(0) = 0, d'o la contradiction.
Donc, est symtrique dnie positive.
1 T
Posons Ac = A BQ B la matrice obtenue en fermant la boucle.
Or la paire
On peut dduire de l'quation de Riccati (3.45) l'galit
Ac + ATc = R BQ1 B T
Considrons la fonction (candidate tre de Lyapounov)
V (x) = xT x
Cette fonction continment direntiable est strictement positive, sauf en
o elle est nulle. En drivant par rapport
t,
on obtient

d
V (x) = xT ( Ac + ATc )x = xT R + BQ1 B T x
dt
3.4.
159
d
V (x) = 0 est donc dni par les quaL'ensemble des points tels que
dt
T
1/2
tions B x = 0 et R
x = 0. L'ensemble invariant contenu dans ce sousensemble est rduit l'espace des
satisfaisant
R1/2 x(0) = 0 = R1/2 Ac x(0) = R1/2 Ax(0) = ... = R1/2 An1 x(0)
Puisque la paire
(A, R1/2 )
est observable, ce sous-ensemble est rduit zro.
Par le Thorme de LaSalle 11, on en dduit la convergence asymptotique

du systme vers zro. La matrice
est donc stabilisante.
ii) Pour prouver l'unicit nous allons utiliser le lemme suivant.
Lemme 2.
L'quation matricielle d'inconnue
XA + BX = C
o
A, B
et
sont des matrices carres de dimensions bien choisies, possde
une unique solution si et seulement si
et
n'ont pas de valeur propre
commune.
On pourra se rfrer [38] pour la dmonstration de ce rsultat.
Considrons donc deux solutions symtriques distinctes
S1 et S2 de l'qua-
tion (3.43) telles que
A1 = A BQ1 B T S1
et
A2 = A BQ1 B T S2
sont toutes deux stables. Calculons alors
(S1 S2 )A1 + AT2 (S1 S2 )

= S1 A S1 BQ1 B T S1 S2 A + S2 BQ1 B T S1
T
+ A BQ1 B T S2 (S1 S2 ) = R + R = 0
en utilisant deux fois l'quation (3.43).
On en dduit l'quation matricielle
(S1 S2 )A1 + AT2 (S1 S2 ) = 0

qui est justement de la forme voque dans le Lemme 2. Or, par hypothse,
A1
et
A2
ne possdent pas de valeur propre commune car
A1
et
A2
sont
stables. On en dduit
S1 = S2
d'o l'unicit.
iii) Calculons enn la valeur obtenue pour la commande optimale. Consi1 T 0
drons la commande optimale candidate
u(t) = Q B S x(t)
et calculons
160
CHAPITRE 3.
la valeur du critre
pour une autre commande
v.
Cette commande devant
tre stabilisante, on a
d T 0
(x S x)dt = xT (0)S 0 x(0)
dt
0
Poursuivons,
J = x (0)S x(0) +
0

d T 0
T
T
x (t)Rx(t) + v (t)Qv(t) + (x S x) dt
dt
= xT (0)S 0 x(0)+
Z

xT (R + AT S 0 + S 0 A)x + v T Qv + v T B T S 0 x + xT S 0 Bv dt
0
en utilisant l'quation de Riccati algbrique (3.43)
= xT (0)S 0 x(0)+
Z

xT S 0 BQ1 B T S 0 x + v T Qv + v T B T S 0 x + xT S 0 Bv dt
Z0

T
=
Q1 B T S 0 x + v Q Q1 B T S 0 x + v dt
0
Or
est par hypothse symtrique dnie positive. Donc, l'optimum est
atteint pour la commande optimale
Q1 B T S 0 x
et la valeur de cet optimum est
xT (0)S 0 x(0).
Utilisation pratique de la commande LQR

Si
et
(A, B)
est commandable,
diagonale termes strictement positifs
symtrique positive (par exemple diagonale termes positifs), alors
le thorme est applicable. Les matrices
et
permettent d'exprimer un
arbitrage entre l'importance des erreurs sur l'tat et l'eort sur la commande.
Plus un terme est grand, plus l'erreur s'y rapportant prend d'importance dans
la fonction cot et plus elle a tendance tre rduite par la solution optimale.
En rsolvant l'quation de Riccati, on obtient la loi de commande optimale.
Exemple
22. Considrons le systme dtd x =
R
+
J = 21 0 (ax2
associe est
+ bu2 )dt
a 0, b > 0.
0=
1
x+u et le critre quadratique
L' quation de Riccati algbrique
2
S2
Sa+
3.4.
161
LQR
Systme
Figure 3.11 Utilisation du rgulateur LQR en boucle ferme.

Elle possde deux solutions
u=
1
2
a
b
x.
S =
b2
2
+ ab.
La commande associe est
La commande optimale correspond
S+ .
Rsolution de l'quation de Riccati algbrique

Lorsqu'on cherche eectivement rsoudre l'quation Riccati algbrique
(3.43) on peut utiliser deux approches. La premire consiste rsoudre l'quation de Riccati direntielle (3.25) en temps rtrograde (i.e. en rajoutant un
signe
devant le second membre) en partant de la condition initiale nulle.
La solution converge pour
t +
vers la solution de l'quation Riccati al-
gbrique (3.43) recherche. Cette mthode est de Kalman. C'est d'ailleurs

l'ide utilise dans la preuve du Thorme 26. Une autre mthode repose sur
la dcomposition de Schur de la matrice recherche (i.e. une dcomposition
sous la forme d'une matrice unitaire et d'une matrice triangulaire suprieure).
C'est ce genre d'approche qui est utilise dans les logiciels de calcul scientique. On pourra se rfrer dirents articles sur le sujet dont [8].
Marges de stabilit du rgulateur LQR

On s'intresse ici aux marges de stabilit, dnies au Chapitre 2, procures
par le rgulateur LQR du Thorme 26.
Utilis en boucle ferme tel que sur la Figure 3.11, on se retrouve tudier
le lieu de Nyquist de la fonction de transfert
1 + Q1 B T S 0 (sI A)1 B
. Ainsi dans les calculs ci-dessous, s = est imaginaire pur et donc s = s.

1 T 0
Notons K = Q B S . D'aprs l'quation de Riccati algbrique (3.43), on a,
en faisant apparatre
(sI A),
0 = S 0 (sI A) (sI + AT )S 0 R + K T QK
162
CHAPITRE 3.
d'o
0 = (sI + AT )1 S 0 + S 0 (sI A)1 (sI + AT )1 (K T QK R)(sI A)1

(3.46)
car
((sI A)1 )T = (s I AT )1 = (sI + AT )1
puisque
correspond alors
la transposition hermitienne.
Calculons maintenant
(I + K(sI A)1 B) Q(I + K(sI A)1 B)

= (I + B T (sI AT )1 K T )Q(I + K(sI A)1 B)
qui donne aprs substitution partielle de

= Q + B T (sI + AT )1 S 0 + S 0 (sI A)1 B
B T (sI + AT )1 K T QK(sI A)1 B
et, en utilisant (3.46), il vient
= Q + (sI A)1 B R(sI A)1 B

Nous venons d'tablir dans un cadre gnral multivariable l'quation (dite
de retour et valable uniquement pour
s =
imaginaire)
(I + K(sI A)1 B) Q(I + K(sI A)1 B) = Q + (sI A)1 B R(sI A)1 B

(3.47)
Exprimons la dans le cas mono-entre. Alors,
positif,
est un vecteur ligne,
est un scalaire strictement
est un vecteur colonne. Il vient alors

1 + K(sI A)1 B 2 = 1 + Q
o
est un rel positif ou nul (car
(3.48)
n'est que positive et non pas positive
dnie).
Ceci implique que le lieu de Nyquist du systme est une distance plus
grande que
du point
1.
Ceci procure donc toujours une marge de phase
suprieure 60 degrs, une marge de gain (positive) innie, et une marge de

gain (ngative) d'au moins
Exemple 23.
1/2,
voir Figure 3.12.
d
Considrons le systme dt x

A=
0
1
1 0.3

,
= Ax + Bu o

0.25
B=
1
3.5.
163
COMPLMENTS
Lieu de Nyquist avec LQR
-1
zone d'exclusion
Figure 3.12 Utilisation du LQR en boucle ferme.

Avec les matrices de pondration
rgulateur LQR de gains
[0.8168
Q =
1.4823].
1 0
0 1

,
R = 1,
on obtient le
Le lieu de Nyquist du systme
ainsi boucl est reprsent sur la Figure 3.12. Il entoure
fois le point
dans le sens indirect. C'est le nombre de ples instables de la fonction de

transfert
K(sI A)1 B =
1.687s + 0.385
s2 0.3s + 1
Le rgultateur LQR assure la stabilit. Les marges de stabilit sont visibles

sur la Figure 3.12.
3.5 Complments
3.5.1 Linarisation par bouclage
Equivalence statique
d
x=
dt
commandable sous forme de Brunovsky peut tre prolonge au cas
La relation d'quivalence qui permet de mettre un systme linaire
Ax + Bu
164
CHAPITRE 3.
des systmes non linaires de la manire suivante. Au lieu de considrer des

transformations du type

x
Mx
7
u
Kx + N u
avec
et
matrices inversibles, considrons des transformations inversibles
plus gnrales et non linaires suivantes

x
z = (x)
7
u
v = k(x, u)
o
est un diomorphisme et
bloqu,
u 7 k(x, u) galement. On va
d
x = f (x, u) et leur clasdt
considrer les systmes non linaires de la forme
sication, comme nous l'avons fait pour les systmes linaires, modulo le
groupe de transformations ci-dessus. La relation d'quivalence qui en rsulte
est appele quivalence par bouclage statique rgulier et changement de coordonnes (d'une faon plus abrge quivalence statique ). Dcider si deux
d
x = f (x, u)
systmes avec les mmes nombres d'tats et des commandes,
dt
d
z = g(z, v), (f , g rgulires) sont quivalents, est un problme de goet
dt
mtrie dicile et largement ouvert. En revanche, il existe une caractrisation
explicite des systmes non linaires quivalents aux systmes linaires commandables.
Exemple 24.
Soit le systme de la Figure 3.6. On suppose ici que le ressort
est non linaire. Dans (3.14) la raideur
k0 + a(x1 x2 )2
avec
k0
et
a > 0.
est fonction de
x1 x2
k =
On peut montrer que le systme reste
commandable et calculer sa sortie non linaire de Brunovsky (la sortie plate).
Exemple 25.
Reprenons le systme (3.6) en ne considrant que les deux
quations direntielles relatives
x1
et
(nous ne considrons que la partie
commandable). On peut montrer (formellement) que ce sous-systme deux

tats et une commande est commandable (la quantit
y = x1
joue le rle de
sortie non linaire de Brunovsky (la sortie plate)) et en dduire le bouclage
statique qui linarise le systme.
CNS de linarisation statique

d
x=
dt
sont en gnral non linaires dans les coordonnes de modlisation x
L'intrt pratique est le suivant. Les quations issues de la physique
f (x, u)
et u. La
question Existe-t-il des coordonnes, z = (x) et v = k(x, u), qui

d
rendent les quations linaires,
z = Az + Bv avec (A, B) commandable ?
dt
est alors d'importance. En eet, une rponse positive signie que le systme
3.5.
165
COMPLMENTS
est non linaire seulement en apparence : le systme est alors dit linarisable
par bouclage statique . Il sut de changer de repre pour que tout devienne
linaire.
partir de maintenant, nous considrons le systme
d
x = f (x, u),
dt
avec
f (0, 0) = 0.
(x, u) = (0, 0).
rgulire et
l'quilibre
Lemme 3.
x Rn ,
u Rm
Notre point de vue sera local autour de
Les deux propositions suivantes sont quivalentes
1. Le systme tendu
est linarisable par
x = f (x, u)
dt
d u = u
dt
bouclage statique (u
est
(3.49)
ici la commande)
2. Le systme
d
x = f (x, u)
dt
(3.50)
est linarisable par bouclage statique.
x = (z) et u = k(z, v) transforment (3.50) en un systme

d
linaire commandable
z = Az + Bv , alors (x, u) = ((z), k(z, v)) et u =
dt
k
k
(Az + Bv) + v v transforment (3.49) en
z
Dmonstration. Si
d
z = Az + Bv,
dt
d
v = v
dt
(3.51)
systme linaire commandable. Ainsi la seconde proposition implique la premire.

Supposons maintenant la premire proposition vraie. Comme tout sys-
(A, B)
(x, u) =
((z, v), (z, v)) et u = k(z, v, v) qui transforme (3.49) en (3.51) avec dim(z) =
dim(x). Cela veut dire que pour tout (z, v, v)
tme linaire commandable peut s'crire sous la forme (3.51) avec
commandable, (forme de Brunovsky ) il existe une transformation
(z, v)(Az + Bv) +

v = f ((z, v), (z, v)).
z
v
ne dpend pas de v et la transformation
(z, v) transforme (3.50) en dtd z = Az + Bv .
Donc
inversible
x = (z), u =
166
CHAPITRE 3.
d
u = u et en prenant comme entre u,
dt
est ane en u, i.e., que le systme admet
Quitte tendre l'tat en posant

on peut toujours supposer que
les quations
d
x = f (x) + u1 g1 (x) + . . . + um gm (x)
dt
f
et les
gi
(3.52)
sont des champs de vecteurs rguliers. Il est alors facile de
x = (z)
et
linaire sont ncessairement anes en
v,
voir que les transformations

inversible pour tout
u = k(z, v) qui rendent le systme

k(x, v) = (x) + (x)v avec
i.e.,
x.
Prenons maintenant un changement rgulier de variables x = (z) d'in = 1 , z = (x). Considrons le systme dni par (3.52) dans le
verse
x.
repre
Dans le repre
gk )
devient
est
z,
on obtient
d
z = (D f + u2 D g1 + . . . + um D gm )x=(z)
(3.53)
dt

i
. Ainsi, f (respectivement
la matrice Jacobienne de :
xj
i,j
D f
(respectivement
D gk ).
partir de ces champs de vecteurs dnissant (3.52), on construit, par la

rcurrence suivante, une suite croissante d'espaces vectoriels indexs par
E0 = {g1 , . . . , gm },
o
[f, g]
Ei = {Ei1 , [f, Ei1 ]} i 1
est le crochet de Lie de deux champs de vecteurs
et
et o
{}
signie espace vectoriel engendr par les vecteurs l'intrieur des parenthses.
On rappelle que le crochet de deux champs de vecteurs
(f1 (x), ..., fn (x))
et
(g1 (x), ..., gn (x))
et
dans les coordonnes
comme composantes dans les mmes coordonnes
g , de composantes
(x1 , ..., xn ), admet
n
X
gi
fi
gk
fk
[f, g]i =
x
x
k
k
k=1
Un simple calcul montre que si
z = (x)
est un changement rgulier de
[f, g] dans les coordonnes z

coordonnes x. En d'autres termes
variables on obtient les composantes du crochet

par les mmes formules que dans les
D.[f, g] = [D.f, D.g]

On sait faire du calcul direntiel intrinsque sans passer par un choix particulier de repre. Les
Ek
deviennent, dans les coordonnes
z , D.Ek .
On
appelle ce type d'objet des distributions (rien voir avec les distributions de
L. Schwartz). Ce sont des objets intrinsques car la mthode de construction
de
Ek
ne dpend pas du systme de coordonnes choisi pour faire les calculs.
3.5.
167
COMPLMENTS
Thorme 27. CNS linarisation statique

(0, 0),
Autour de l'quilibre
(x, u) =
le systme (3.52) est linarisable par bouclage statique rgulier si et
seulement si les distributions
Ei , i = 1, . . . , n 1
dnies ci-dessus sont
involutives (stables par le crochet de Lie), de rang constant autour de
En1
et le rang de
vaut
Une distribution
f et g
E(x)) le
n,
la dimension de
x=0
x.
est dite involutive si et seulement si pour tous champs
de vecteurs
dans
vectoriel
crochet
x, f (x) et g(x) appartiennent l'espace

[f, g] reste aussi dans E .
(pour tout
Ei restent inchanges par

u = (x) + (x)v avec (x) inversible. Comme pour un
d
x = Ax + Bu, Ei correspond l'image de
systme linaire commandable
dt
i
(B, AB, . . . , A B), les conditions sur les Ei sont donc ncessaires.
Dmonstration. Il est vident que les distributions
bouclage statique
Leur cot susant repose essentiellement sur le thorme de Frobenius [28].

Ce rsultat classique de gometrie direntielle dit que toute distribution in-
E de rang
w = (w1 , ..., wn ),
volutive
constant
correspond, dans des coordonnes adaptes
m premires compo/wk le champs de vecteurs de composantes

coordonnes w . Alors E = {/w1 , ..., /wm }.
l'espace vectoriel engendr par les
santes. On a l'habitude de noter
(i,k )1in dans les

Si les Ei vrient
les conditions du thorme, alors il existe un systme
de coordonnes locales
(x1 , . . . , xn ) autour de 0 tel

,...,
Ei =
x1
xi
que
Ei . Dans ces coordonnes locales, dtd xi pour i > 0 ne dpend pas de la commande u. Ainsi, en remplaant u par (x)+(x)u avec une
matrice inversible bien choisie, la dynamique (3.52) s'crit ncessairement
o
est le rang de
sous la forme
Un raisonnement
(x1 , . . . , x0 )
car
d
xi = ui , i = 1, . . . , 0
dt
d
xi = fi (x), i = 0 + 1, . . . , n
dt
simple montre que, pour i > 1 , fi
E1
ne dpend pas de
est involutive. Ainsi nous avons la structure suivante
d
xi = ui , i = 1, . . . , 0
dt
d
xi = fi (x1 , . . . , xn ), i = 0 + 1, . . . , 1
dt
d
xi = fi (x0 +1 , . . . , xn ), i = 1 + 1, . . . , n
dt
168
CHAPITRE 3.
De plus, le rang de
Donc
(f0 +1 , . . . , f1 )
par rapport
(x1 , . . . , x0 )
vaut
1 0 .
0 1 0 . Quitte faire des permutations sur les 0 premires

x, on peut supposer que (x1 , . . . , x1 0 ) 7 (f0 +1 , . . . , f1 )
composantes de
est inversible. Cela permet de dnir un nouveau systme de coordonnes en

remplaant les
1 0
premires composantes de
x par (f0 +1 , . . . , f1 ). Dans

u 7 (x)u avec
ces nouvelles coordonnes, aprs bouclage statique rgulier
(x) inversible bien choisi, nous obtenons la structure suivante (les notations
avec u, x et f sont conserves)
d
xi = ui , i = 1, . . . , 0
dt
d
xi = xi0 , i = 0 + 1, . . . , 1
dt
d
xi = fi (x0 +1 , . . . , xn ), i = 1 + 1, . . . , n
dt
On sait que ce systme est linarisable si et seulement si le systme rduit
d
xi = xi0 , i = 0 + 1, . . . , 1
dt
d
xi = fi (x0 +1 , . . . , xn ), i = 1 + 1, . . . , n
dt
l'est avec
(x1 , . . . , x1 0 )
comme commande. Comme les distributions
Ei
associes ce systme rduit se dduisent simplement de celles du systme
tendu en liminant les champs de vecteurs

, ...
, on voit qu'elles
x1
x0
vrient, elles aussi, les conditions du thorme. Il est donc possible de rduire
encore le systme. chaque tape, la linarisation du systme tendu est
quivalente celle du systme rduit. Au bout de cette limination (en au plus
de
n1
tapes), la linarisation du systme de dpart est alors quivalente
celle d'un systme rduit de la forme
d
x = f (x, u)
dt
o le rang de
par rapport
est gale la dimension de
x,
linarisation
qui est alors triviale.
Bouclage dynamique
Le Lemme 3 est trompeur. Il semble suggrer que le fait d'tendre un systme en rajoutant des drives de la commande dans l'tat ne rajoute rien
3.5.
169
COMPLMENTS
pour la linarisation. Ceci est vrai si on rajoute le mme nombre d'intgrateurs sur toutes les commandes (c.--d. si on eectue une prolongation totale). Par contre, des nombres dirents peuvent permettre de gagner quelque
chose. Par exemple le systme
x = u1 sin ,
z = u1 cos 1,
= u2
n'est pas linarisable par bouclage statique bien que le systme tendu
x = u1 sin ,
de commande
z = u1 cos 1,
u1 = u1 ,
= u2
(
u1 , u2 ) le soit. Ce fait n'est nullement en contradiction avec le
u1 a t prolonge par des intgrateurs deux
Lemme 3 puisque seule l'entre
fois. Pour un systme une seule commande, on ne gagne videment rien.

Cette remarque est l'origine de la technique de linarisation par boud
clage dynamique . Un systme dt x = f (x, u) est dit linarisable par bouclage
dynamique rgulier si et seulement si il existe un compensateur dynamique
rgulier
d
= a(x, , v),
dt
u = k(x, , v),
tel que le systme boucl
d
x = f (x, k(x, , v)),
dt
d
= a(x, , v)
dt
soit linarisable par bouclage statique rgulier. Noter que la dimension de
est
libre. La dimension de l'espace dans lequel on doit travailler peut a priori tre
arbitrairement grande. Noter galement que les compensateurs dynamiques
qui consistent ne prolonger que les entres, sont des compensateurs particuliers. Ils sont insusants car ils ne permettent pas de linariser certains
systmes comme celui ci
x = u2 cos u1 sin
z = u2 sin + u1 cos g
= u2
On peut montrer que, quel que soit le compensateur dynamique de la forme
( )
( )
u1 1 = u1 , u2 2 = u2 (1 et 2 entiers arbitraires), le systme tendu n'est
pas linarisable par bouclage statique. En revanche, il est linarisable par des
bouclages dynamiques plus gnraux.
Cette question est l'origine des systmes plats , les systmes linarisables
par des bouclages dynamiques dits endognes et auxquels est associe une relation d'quivalence (i.e., une gomtrie). Pour en savoir plus, on se reportera
[55].
170
CHAPITRE 3.
3.5.2 Stabilisation par mthode de Lyapounov et backstepping

On a dj dcouvert cette mthode de stabilisation autour d'un point
d'quilibre lors de l'exemple reprsent sur la Figure 3.1. On reprend ici
simplement l'ide de base pour un systme non linaire
12
On part d'un systme dynamique avec un seul contrle
u (pour simplier),
d
x = f (x) + ug(x)
dt
et d'une fonction
V (x)
positive et qui tend l'inni quand
x Rn
tend
vers l'inni en norme. On suppose ici que toutes les fonctions sont drivables
autant de fois que ncessaire.
On suppose de plus que pour u = 0, la drive de V le long des trajectoires
d
x = f (x) est ngative ou nulle. Pour les systmes mcaniques, V est souvent
dt
l'nergie mcanique. Ainsi par hypothse pour tout x on a
V
f (x) 0
x
Avec
u 6= 0,
on a
d
V
V
V =
f (x) + u
g(x)
dt
x
x
K : R 7 R
K() > 0 si < 0
Le feedback est alors construit avec n'importe quelle fonction

assez rgulire qui s'annule en
et
K() < 0
si
uniquement et telle que
>0

u=K

V
g(x)
x
Le principe d'invariance de LaSalle s'applique alors (voir le Thorme 11).

L'ensemble vers lequel convergent les trajectoires du systme en boucle ferme est donn en rsolvant le systme sur-dtermin suivant
d
x = f (x),
dt
V
f (x) = 0,
x
V
g(x) = 0.
x
La mthode consiste driver un certain nombre de fois les deux quations

V
algbriques
f (x) = 0 et V
g(x) = 0 par rapport au temps et remplacer
x
x
d
chaque fois
x
par f (x). La fonction V est souvent appele controlled
dt
Lyapounov function ou CLF.
La mthode dite du backstepping rsout le problme suivant. Les donnes sont
12. L'ide s'applique aussi aux systmes de dimension innie, i.e., gouverns par des
quations aux drives partielles avec un contrle sur la frontire.
3.5.
171
COMPLMENTS
un systme ane en contrle (on suppose toujours, pour simplier l'expos, un seul contrle scalaire)
d
x = f (x) + ug(x)
dt
une fonction de Lyapounov
pour
u=0
(une CLF donc)
On peut donc utiliser la mthode ci-dessous pour construire le feedback,

not
u = k(x),
qui stabilise le systme. On souhaite en dduire un feedback
stabilisant pour le systme tendu
d
x = f (x) + g(x),
dt
o maintenant le contrle n'est plus
fonction suivante
Ainsi
d
=u
dt
mais sa drive
u.
On considre la
1
W (x, ) = V (x) + ( k(x))2
2
est bien innie l'inni et reste positive. Calculons sa drive par
rapport au temps

V
k
d
W =
(f (x) + g(x)) + p( k(x)) u
(f (x) + g(x))
dt
x
x
d
V = V
(f (x) + k(x)g(x)) est
dt
x
ngative. Cela conduit au rarrangement suivant du second membre
Utilisons le fait qu'avec
= k(x)
la drive

d
V
k
V
W =
(f (x)+k(x)g(x))+(k(x)) u
(f (x) + g(x)) +
g(x)
dt
x
x
x
Il sut, avec
paramtre positif, de poser
u=
k
V
(f (x) + g(x))
g(x) p( k(x))
x
x
pour avoir
V
d
W =
(f (x) + k(x)g(x)) p( k(x))2 0
dt
x
On conclut l'analyse toujours par l'invariance de LaSalle. Pour un expos
dtaill des possibilits de ces mthodes nous renvoyons le lecteur intress
[63].
Chapitre 4
Observabilit, estimation et
adaptation
Dans le chapitre prcdent, nous avons vu comment stabiliser un systme

par retour d'tat (feedback). La ralisation pratique de tels bouclages ncessite la connaissance chaque instant de l'tat
x.
Or, il est frquent que
seule une partie de l'tat soit directement mesure. On est alors confront
au problme suivant. Connaissant les quations du systme (i.e., ayant un
d
x = f (x, u), les relations entre les mesures y et l'tat, y = h(x),
modle),
dt
les entres t 7 u(t) et les mesures t 7 y(t) , il nous faut estimer x. Cela
revient rsoudre le problme suivant
d
x = f (x, u),
dt
o
y = h(x)
est l'inconnue (une fonction du temps) et o
et
sont des fonctions
connues du temps. Il est clair que ce problme est sur-dtermin. L'unicit de

la solution correspond la proprit d'observabilit que nous allons dnir.
L'existence d'une solution provient du fait que
et
u ne peuvent pas tre des
fonctions du temps indpendantes l'une de l'autre. Elles doivent vrier des

relations de compatibilit qui prennent la forme d'quations direntielles (le
modle).
Ce chapitre aborde ces questions. Tout d'abord nous donnons, dans un
cadre gnral, les dnitions et les critres assurant l'existence et l'unicit
de la solution. Pour les systmes linaires nous prsentons une mthode trs
conome en calculs pour obtenir
avec un observateur asymptotique. Nous
montrons aussi comment paramtrer de faon optimale un tel observateur

asymptotique grce au ltre de Kalman . Le couplage avec la loi de feedback est alors simple : il sut de remplacer dans les formules donnant la loi
de rtro-action les valeurs de l'tat par leur estimes. On montre alors que
173
174 CHAPITRE 4.
OBSERVABILIT, ESTIMATION ET ADAPTATION
le contrleur ainsi obtenu, celui qui part des sorties, estime l'tat et utilise
cette estimation pour calculer le contrle (observateur contrleur, commande
modale, bouclage dynamique de sortie), permet de stabiliser asymptotiquement tout systme linaire coecients constants commandable et observable (c'est le principe de sparation ). Enn, nous proposons quelques extensions aux cas non linaires avec la synthse d'observateurs asymptotiques
via l'injection de sortie et la notion de contraction.
4.1 Un exemple
Cet exemple est reprsentatif de ce que, dans certains domaines industriels, les ingnieurs appellent les capteurs logiciels . Il s'agit, pour un moteur
lectrique, d'estimer la vitesse de rotation et son couple de charge via les
signaux de courants (mesure) et de tension (contrle). Il est possible d'obtenir des estimations de ces deux variables mcaniques, coteuses mesurer,
en partant des variables lectriques, qui sont simples et faciles mesurer.
Pour simplier, nous traitons ici le cas des moteurs courant continu. Pour
les moteurs induction, le mme problme se pose mais il est nettement
plus complexe, non compltement rsolu et fait encore l'objet de travaux de
recherches et de dveloppement .
Les capteurs logiciels sont des outils de traitement en temps-rel de l'information. Ils fournissent (idalement) des informations non bruites sur des
grandeurs mesures ou non. Sur l'exemple choisi ici, il s'agit, partir de la
mesure des tensions et des courants qui traversent le moteur, d'estimer de
faon causale sa vitesse mcanique et son couple de charge. L'intrt pratique est vident : les informations lectriques sont toujours disponibles car
les capteurs sont simples et ables. Au contraire, les informations mcaniques
ncessitent une instrumentation complexe, chre et peu able. On cherche
s'en passer. Pour des raisons de cot mais aussi de scurit, dduire des courants et tensions, la vitesse de rotation est un enjeu technologique important
en lectro-technique.
Dans d'autres domaines, on rencontre des problmes trs similaires. Pour
les procds, les dbits, tempratures et pressions sont faciles avoir par des
capteurs simples et robustes alors que les compositions sont plus diciles
mesurer (temps de retard de l'analyse, ...). Un traitement de l'information contenue dans les signaux de tempratures, pressions et dbits permet
souvent d'obtenir des estimations prcieuses sur les compositions. Un autre
exemple intressant (galement voqu dans l'Exemple 28) est l'estimation
1. Le systme est inobservable au premier ordre et trs sensible aux paramtres basse
vitesse.
4.1.
175
UN EXEMPLE
de l'orientation relative d'un mobile par rapport un rfrentiel terrestre les

mesures sont de deux types : les gyromtres donnent de faon prcise et rapide les vitesses angulaires ; le GPS ou les images issues camra embarques
donnent des informations basse frquence sur les positions et orientations.
On peut dduire grce aux relations cinmatiques, une estimation robuste de
l'orientation du mobile (ses trois angles d'Euler, i.e., une matrice de rotation),
de sa vitesse et de sa position. Ce problme est central dans les techniques
de guidage de missiles et de drones.
L'exemple du moteur courant continu que nous prsentons en dtails
illustre la notion d'observabilit (voir la Dnition 14), la technique des ob-
servateurs asymptotiques (voir la Section 4.3.2), et l'observateur-contrleur

(voir la Section 4.4).
4.1.1 Un modle simple de moteur courant continu

Un premier modle de moteur courant continu est le suivant
J dtd = k p
L dtd = k R + u
o
self,
est la vitesse de rotation du moteur,
R>0
la rsistance,
L>0
la
le couple de charge et
le courant,
la constante de couple,
la tension,
l'inertie de la partie tournante (moteur + charge).
J > 0, k > 0, L > 0 et R > 0 connus et

l'intensit est mesure. La charge p est une
Nous supposons les paramtres

constants. En revanche, seule
constante inconnue. Il nous faut concevoir un algorithme qui ajuste en temps

rel la tension
u de faon suivre une vitesse de rfrence r (t) variable dans
le temps. Pour cela nous ne disposons que d'un capteur de courant.
4.1.2 Estimation de la vitesse et de la charge

Comme
est un paramtre constant,
d
p
dt
=0
et on peut l'inclure dans
les variables d'tat. On a alors le systme
d
p
dt
d
J dt
L dtd
= 0
= k p
= k R + u
u et comme sortie y = . +tudier l'observabilit de ce

systme revient se poser la question suivante : connaissant t 7 ((t), u(t))
et les quations du systme, est-il possible de calculer et p ? La rponse est
avec comme commande
176 CHAPITRE 4.
positive et immdiate car
d
= (u L R)/k,
dt
p = k (J/k)
d
d2
d
u L 2 R
dt
dt
dt
Le systme est donc observable. On pourrait aussi reprendre le critre de

Kalman (Thorme 28). Dans l'esprit, il est issu du mme calcul.
Cependant les mesures de courant sont bruites. Il est donc hors de question de driver ce signal. Le fait d'tre en thorie observable ne donne pas un
algorithme d'estimation raliste. Il nous faut concevoir un algorithme qui soit
insensible au bruit, i.e., qui les ltre sans introduire de dphasage comme le
ferait un simple ltre passe-bas. Ici apparat une ide centrale : l'observateur
asymptotique . Cette ide consiste copier la dynamique du systme en lui

rajoutant des termes correctifs lis l'erreur entre la prdiction et la mesure.
Cela donne ici l'observateur suivant
d
p
dt
d
J dt
L dtd
= Lp ( )
= k p L ( )
= k
R + u L ( )
Il est d'usage de rajouter un sur les estimes. On parle souvent pour

le paramtre
d'identication ,
d'estimation ou de ltrage ,
et
tant la valeur identie et pour
et
tant les valeurs estimes et ltres (c'est
dire dbarrasses des bruits hautes frquences). En choisissant correctement

les gains
Lp , L
et
les carts entre les estimes et les vraies valeurs tendent
vers zro. En eet la dynamique des erreurs

s'crit
d
e
dt p
d
J dt e
L dtd e
ep = pp, e =
et e =
= Lp e
= ep (k L )e
= (L + R)e ke
Il s'agit d'un systme linaire stationnaire dont les valeurs propres sont les
racines du polynme en
de degr
suivant
L + R 2 k(k L )
Lp k
s +
s+
L
LJ
LJ
jouant sur les Lp , L et L , on peut
s3 +
+tant donn qu'en
donner n'importe
quelles valeurs aux fonctions symtriques des racines, il est possible de les
choisir comme l'on veut. Si
Lp , L
et
vrient
L + R
= r1 + r2 + r3
L
k(k L )
= r1 r2 + r1 r3 + r2 r3
LJ
Lp k
= r1 r2 r3
LJ
4.1.
177
UN EXEMPLE
alors les racines seront
r1 , r2
et
r3 .
On peut choisir pour les ples d'obser-
vation (on le verra en dtail dans le Thorme 29 de placement des ples de
l'observateur ) les valeurs suivantes
R
r1 = (1 + 1),
L
R
r2 = (1 1),
L
r
r3 =
k2
LJ
Ce choix correspond aux chelles de temps caractristiques du systme en

boucle ouverte.
p,
et ainsi
horaire t 7 u(t).
Les valeurs
soit la loi
calcules convergent vers
p,
et
quelle que
4.1.3 Prise en compte des chelles de temps

Supposons, et c'est souvent le cas, que la dynamique lectrique est nettement plus rapide que la dynamique mcanique. Cela revient dire que la self
est trs petite, positive mais mal connue. Ainsi, tout ce que l'on sait c'est
que
L o est un petit paramtre positif. Il est alors facile de voir que les
rsultats thoriques sur les perturbations singulires (voir Section 1.4.1) s'appliquent ici : le systme reste stable en boucle ouverte avec une dynamique
du courant convergeant immdiatement vers son rgime quasi-statique
= (u k)/R
La dynamique lente de la vitesse tant alors
d
= (k 2 /R) + (k/R)u p.
dt
Il sut de remarquer que, puisque
= (uR)/k , la vitesse est indirectement
connue en combinant la tension et la mesure de courant.

L'observateur asymptotique aura alors la forme plus simple suivante
d
p
dt
d
J dt
o la mesure
= Lp (
z(t))
2
= (k /R)
+ (k/R)u p L (
z(t))
z(t) = (u(t) R(t))/k
correspond la vitesse
proximation quasi-statique pour le courant. Les gains
Lp
,
et
(4.1)
suite l'ap-
doivent
tre choisis positifs pour garantir la stabilit et pas trop grands cause de
l'approximation quasi-statique sur le courant.
Le suivi de la rfrence en vitesse
feedback
t 7 r (t)
sera alors assur par le
solution de
(k 2 /R) + (k/R)u p = J(
d
r ( r )/ )
dt
178 CHAPITRE 4.
si on avait directement accs

de suivi.
et
p.
>0
Ici
est la constante de temps
ne doit pas tre trop petit toujours cause de l'approximation
quasi-statique sur le courant. Il est alors naturel de remplacer

estimes pour calculer
et
p par leur
(k 2 /R)
+ (k/R)u p = J(
d
r (
r )/ )
dt
Nous avons obtenu le bouclage dynamique de sortie

une rfrence continment drivable en
forme par l'observateur de
et
y = avec yr = r (t)
(la partie dynamique tant alors
p)
d
p
dt
d
J dt
= Lp (
z(t))
2
= (k /R)
+ (k/R)u(t) p L (
z(t))
z(t) = (u(t) Ry(t))/k

u(t) = k
+ Rk p + J
d
y (t)
dt r
yr (t)
4.1.4 Contraintes sur les courants

Il est important pour des raisons de scurit de garantir un courant
born. Ainsi nous avons comme contrainte
|| max
o max
>0
est le courant maximum support par le variateur et le moteur.
Les algorithmes prcdents ne garantissent pas le respect de cette contrainte

d'tat. Nanmoins, il est possible de prendre en compte cette contrainte en
ne modiant que le contrleur de la section prcdente sans toucher l'observateur. On considre donc un premier bouclage grand gain en courant :
1
u = R k
+ ( )
est
une rfrence de courant et
tel que
R 1.
Un tel bouclage rend
la dynamique du courant stable et bien plus rapide que celle de la vitesse. On

pourra remarquer que, mme si
L est petit, ce bouclage ne fait que renforcer
la rapidit du courant sans le dstabiliser. En eet on a
L
et donc
est
d
= ke (R + 1/)( )
dt
une trs bonne approximation. La dynamique de la vitesse
se rduit
d
= ki p
dt
4.2.
179
OBSERVABILIT NON LINAIRE
Une justication mathmatique de cette rduction relve encore de la thorie

des perturbations singulires.
La rfrence de courant peut alors tre calcule ainsi
J r J(
r )/ + p
k
> 0 est un temps nettement suprieur l'chelle de temps de la dynamique

du courant, i.e., L/(R + 1/) avec
et p solution de (4.1).
Si la rfrence de courant
ainsi calcule ne vrie pas la contrainte, alors
il sut de la saturer en valeur absolue max en prservant son signe. Il est
o
possible de voir qu'une telle saturation ne peut pas dstabiliser la vitesse.

Elle assure de fait le suivi au mieux de la rfrence
r .
4.2 Observabilit non linaire

Considrons les systmes non linaires de la forme
d x = f (x, u)
dt
y = h(x)
avec
x Rn , u Rm
et
y Rp ,
les fonctions
(4.2)
et
tant rgulires.
4.2.1 Dnition
Pour dnir l'observabilit, il convient d'abord de dnir la notion de
distinguabilit.
Dnition 14 (Distinguabilit).
distinguables (nots
xI x
e)
Deux tats initiaux
si pour tout
identiques pour toute entre
u(t)
t 0,
2
les sorties
x
e
y(t)
et
sont dits inet
ye(t)
sont
admissible . Ils sont dits distinguables si-
non.
L'indistinguabilit est une relation d'quivalence. Notons
d'quivalence de
x.
I(x)
la classe
L'observabilit est alors dnie de la manire suivante
Dnition 15 (Observabilit globale). Le systme (4.2) est dit observable

en
x
2.
si
I(x) = {x}
y(t) (resp. ye(t))

x (resp. x
e).
initiale
et il est observable si
I(x) = {x}
pour tout
correspond la sortie de (4.2) avec l'entre
u(t)
x.
et la condition
180 CHAPITRE 4.
En fait, le systme est observable si pour tous les tats initiaux

il existe une entre admissible
y(t) 6= ye(t)
qui distingue
pour au moins un temps
t 0.
et
x
e,
et
x
e,
c'est dire telle que
Il peut exister des entres qui ne distinguent pas certains points. Cepen-
dant, le systme peut tre malgr tout observable. Par exemple
est observable (pour

tingue pas les points
d
x
dt 1
d
x
dt 2
= ux2
= 0
y = x1
u = 1 par exemple). Cependant l'entre u = 0 ne disx et x tels que x1 = x1 et x2 6= x2 . Notons que l'observa-
bilit ne signie pas que toute entre distingue tous les tats. L'observabilit
est un concept global. Il peut tre ncessaire d'aller trs loin dans le temps
et dans l'espace d'tat pour distinguer deux tats initiaux. Pour cela nous
introduisons le concept plus fort qui suit.
Dnition 16 (Observabilit locale en temps et en espace).

de (4.2) est localement observable, si pour tout
>0
L'tat
et pour tout voisinage
U de x, il existe > 0 plus petit que et un voisinage V de x contenu dans

U , tel que pour tout x
e V , il existe une entre [0, ] 3 t 7 u(t) qui distingue
x et x
e, i.e. telle que y() 6= ye(). Le systme (4.2) est localement observable
s'il l'est pour tout x.
Intuitivement, le systme (4.2) est localement observable si on peut instantanment distinguer chaque tat de ses voisins en choisissant judicieusement l'entre
u.
4.2.2 Critre
La seule faon eective de tester l'observabilit d'un systme est de consi-
y et ses drives en temps. Nous supposerons dans cette section que y et u sont des fonctions rgulires du temps.
d
u, . . .)
Nous supposerons galement que les rangs en x des fonctions de (x, u,
dt
drer l'application qui
associe
qui apparaissent ci-dessous sont constants.

Considrons donc (4.2). On note
h0 (x) := h(x). En drivant y par rapport
au temps on a
d
d
y = Dx h(x) x = Dx h(x) f (x, u) := h1 (x, u)
dt
dt
Des drivations successives conduisent donc une suite de fonctions
hk (x, u, . . . , u(k1) )
4.2.
181
dnie par la rcurrence
hk+1 =
Si pour un certain
k,
d
(hk ),
dt
le rang en
h0 (x) = h(x)
du systme
h0 (x) = y
d
h1 (x, u) = y
dt
.
.
.
hk (x, u, . . . , u(k1) ) = y (k)
n = dim(x) alors le systme est localement observable . Il sut d'utiliser

(k)
le thorme d'inversion locale pour calculer x en fonction de (y, . . . , y
)
(k1)
et (u, . . . , u
). Si partir d'un certain k , hk+1 ne fait plus apparatre de
0
nouvelle relation en x, i.e., si le rang en x de (h0 , . . . , hk ) est identique celui
0
de (h0 , . . . , hk , hk+1 ) , alors il en est de mme pour k + 2, k + 3, . . . Ainsi, il
n'est pas ncessaire de driver plus de n 1 fois y pour savoir si un systme
vaut
est localement observable ou non. Ce raisonnement est valable autour d'un

tat gnrique, nous ne traitons pas les singularits qui peuvent apparatre
en des tats et entres particulires. Nous renvoyons [27] pour les cas plus
gnraux avec singularits.
Ce calcul lmentaire montre aussi que
y et u sont relis par des quations
direntielles. Elles correspondent aux relations de compatibilit associes au

systme sur-dtermin (4.2) o l'inconnue est
et les donnes sont
On obtient toutes les relations possibles en liminant
et
y.
du systme
h0 (x) = y
d
h1 (x, u) = y
dt
.
.
.
hn (x, u, . . . , u(n1) ) = y (n)
On peut montrer que pour un systme localement observable,
et
sont
p = dim(y) quations direntielles indpendantes. Ces quations

intervenir y driv au plus n fois et u driv au plus n 1 fois.
relis par
font
La mise en forme des ides prcdentes est assez fastidieuse mais nanmoins instructive. Nous nous contenterons de retenir qu'en gnral l'observabilit signie que l'tat peut tre exprim en fonction des sorties, des entres
y et u sont
n 1 en u.
et d'un nombre ni de leur drives en temps. Dans ce cas,

par
quations direntielles d'ordre au plus
en
et
relis
182 CHAPITRE 4.
Exemple 26. Pour conclure, reprenons l'exemple du racteur chimique (3.6)

an d'illustrer l'analyse formelle prcdente. Nous ne considrons que x1 et
T car l'invariant chimique x1 +x2 est suppos gal xin
1 . Nous supposons que
la temprature T est mesure (thermo-couple) mais pas la concentration x1 .
Nous avons donc rsoudre le systme sur-dtermin (les quantits autres
que
(x1 , u, y, T )
sont des constantes connues)
d
x
dt 1
d
T
dt
= D(xin
1 x1 ) k0 exp(E/RT )x1
= D(T in T ) + H exp(E/RT )x1 + u
y(t) = T
On a facilement
x1
en fonction de
x1 =
d
dt
et
d
y
dt
D(T in y) u
H exp(E/Ry)
Le systme est donc observable.

tielle du second ordre en
d
l'quation donnant dt x1
(y, dtd y)
et
sont relis par une quation diren-
et du premier ordre en
d
dt y
D(T in y) u
H exp(E/Ry)
(4.3)
u.
On l'obtient en utilisant
d
dt y
D(T in y) u
= Dxin
(D
+
k
exp(E/Ry))
0
1
H exp(E/Ry)
Il s'agit d'une condition de compatibilit entre
et
u.
(4.4)
Si elle n'est pas sa-
tisfaite alors le systme sur-dtermin de dpart n'admet pas de solution. On

conoit trs bien que ces relations de compatibilit sont la base du diagnostic
et de la dtection de panne.
4.2.3 Observateur, estimation, moindres carrs

Savoir que le systme est observable est bien. Calculer
x partir de y
et
est encore mieux. Cependant, la dmarche formelle prcdente ne rpond en

pratique qu' la premire question. En eet, avoir
en fonction de drives
des mesures s'avre d'une utilit fort limite ds que l'ordre de drivation
2 et/ou ds que les signaux sont bruits. Il convient en fait de calculer

fonction d'intgrales de y et u. Dans ce cas, le bruit sur les signaux
dpasse
en
est beaucoup moins gnant. La synthse d'observateur pose des problmes

supplmentaires (et nettement plus diciles en fait) que la caractrisation
des systmes observables.
4.2.
183
Revenons (4.2). Nous avons un nombre inni d'quations en trop. En

eet, puisque l'entre u est connue, l'tat x est entirement donn par sa
d
0
u
condition initiale x grce au ot t de
x = f (x, u(t)) : ut (x0 ) est la
dt
d
solution de
x = f (x, u(t)) qui dmarre en x0 t = 0. Ainsi x0 vrie
dt
chaque instant t, p quations, p tant donc le nombre de mesures
y(t) = h(ut (x0 ))

Il est trs tentant de rsoudre ce systme par les moindres carrs, mme si,
pour un systme non-linaire cela n'a pas beaucoup de sens. Considrons
0
un intervalle d'observation [0, T ]. x peut tre calcul comme l'argument du
minimum de
Z
J() =
(y(t) h(ut (x0 )))2 dt
est ainsi obtenu comme on obtient un paramtre partir de donnes
exprimentales et d'un modle o ce paramtre intervient : en minimisant

l'erreur quadratique entre l'observation y(t) et la valeur prdite par le modle
ut (x0 ). Les problmes d'observateurs sont fondamentalement proches des
problmes d'estimation pour lesquels l'optimisation joue un rle important.
Cependant, les dicults ne sont pas pour autant aplanies : la rsolution de
d
x = f (x, u) ne peut se faire que numriquement en
l'quation direntielle
dt
gnral ; la fonction J n'a aucune raison d'avoir les proprits de convexit qui
assurent la convergence des principaux algorithmes d'optimisation (voir par
exemple [61]). La synthse d'observateurs reste donc une question dicile en
gnral bien que trs importante en pratique. Noter enn que l'identication
d
x = f (x, u, ) en est un sous-problme :
de paramtres sur un modle
dt
l'identiabilit correspond alors l'observabilit du systme tendu
d
= 0,
dt
d
x = f (x, u, ),
dt
d'tat
(x, )
et de sortie
Dans le cas linaire,

0
ane en x
ut (x0 )
y = x.
f = Ax + Bu
et
y=x
h = Cx, ut (x0 )
est une fonction
exp((t s)A)Bu(s) ds
= exp(tA)x +
0
partir d'un intervalle d'observations
[0, T ], x0
peut tre calcul comme
l'argument du minimum de
Z
J() =
0
(z(t) C exp(tA)x0 )2 dt
(4.5)
184 CHAPITRE 4.
z(t) = y(t) C
Rt
exp((t s)A)Bu(s) ds. Dans ces conditions J est

0
quadratique. On est en train de retrouver, dans un cadre dterministe pour
les moindres carrs, le ltre de Kalman trait dans la Section 4.5. Nous
allons maintenant aborder l'observabilit des systmes linaires avec un point
de vue moins classique qui met l'accent sur les observateurs asymptotiques.
Ces derniers fournissent, avec des calculs trs conomiques, directement
ut (x0 ) en fonction de y , u et leurs intgrales.
x=
4.3 Observabilit linaire

On considre ici le systme, d'entre
u,
d'tat
d
x = Ax + Bu,
dt
o
est une matrice
n n, B
une matrice
et de sortie
suivant
y = Cx
nm
(4.6)
et
une matrice
p n.
4.3.1 Le critre de Kalman

Thorme 28
y = Cx
d
Le systme (4.6) dt x = Ax + Bu,
est observable au sens de la Dnition 16 si et seulement si le rang
(Critre de Kalman)
de la matrice d'observabilit
O=
C
CA
..
.
n1
CA
est gal
n = dim(x).
Pour abrger, on dit souvent que la paire

rang de la matrice d'observabilit
(A, C)
est observable lorsque le
est maximum. On notera la dualit avec
le critre de commandabilit du Thorme 23.
Dmonstration. Drivons
rivation donne
Donc
et d'utilisons l'quation d'tat. Une premire d-
d
d
y = C x = CAx + CBu.
dt
dt
est ncessairement solution du systme (les fonctions
connues)
Cx = y
CAx = dtd y CBu.
et
sont
4.3.
185
OBSERVABILIT LINAIRE
ce niveau, tout se passe comme si la quantit
y1 =
nouvelle sortie. En la drivant de nouveau, nous avons

Maintenant,
d
y
dt
CBu tait une

CA x = y 1 CABu.
2
est ncessairement solution du systme tendu
Cx = y0 = y
CAx = y1 = dtd y CBu
CA2 x = y2 = y 1 CABu.
Il est alors facile de voir que, ainsi de suite,
x est ncessairement solution des
quations
CAk x = yk
yk sont
y0 = y .
o les quantits connues
CAk1 Bu
pour
k1
et
(4.7)
dnies par la rcurrence
yk =
d
y
dt k1
Si le rang de la matrice d'observabilit est maximum et gal

admet un inverse gauche (non ncessairement unique),
vriant
matrice
n, elle
n pn
C
CA
= 1n
.
.
.
n1
CA
Ainsi,
y0
.
.
.
x=P
yn1
La condition de rang est donc susante.
Supposons maintenant que la matrice d'observabilit, de taille
soit de rang
r < n.
pn n,
Nous allons montrer qu'il existe, au moins, deux trajec-
toires direntes avec les mmes commandes, donnant la mme sortie. Cela
montrera que la condition est aussi ncessaire.
n
Soit w R un lment non nul du noyau de la matrice d'observabik
lit. Pour k = 0, . . . , n 1, CA w = 0. Par un raisonnement identique
celui fait lors de la preuve de la Proposition 6 avec les noyaux gauche
k
k
de A B , on a ncessairement CA w = 0, pour toute k n. Donc, w est
k
dans le noyau de toutes les matrices CA . Prenons comme premire trajectoire
[0, T ] 3 t 7 (x, u) = 0.
Il vient,
y = 0.
Prenons maintenant
comme seconde trajectoire, celle qui, commande nulle, dmarre en
[0, T ] 3 t 7 (x, u) = (exp(tA)w, 0).
Sa sortie vaut
C exp(tA)w =
+ i
X
t
i=0
i!
CAi w = 0
186 CHAPITRE 4.
car chaque terme de la srie est nul. Ceci conclut la preuve.
4.3.2 Observateurs asymptotiques

Comme on l'a dj dit, il est classique de noter par
la quantit
x(t).
x(t) une estimation de
Nous cherchons ici obtenir une estimation de l'tat sans
utiliser les drives de
et
u.
La premire ide qui vient l'esprit est de
copier la dynamique du systme. On intgre directement
d
x = A
x + Bu
dt
partir d'une condition initiale x0 et des valeurs connues du contrle u
chaque instant. Si la matrice A est stable, alors x
peut tre pris comme
estimation de x car l'erreur ex = x
x tend naturellement vers 0 puisque
d
e = Aex .
dt x
Si A est instable cette mthode ne marchera pas. En eet, une petite erreur initiale ex (0) sera amplie exponentiellement. Intuitivement, si l'erreur
x x devient grande alors, le systme tant observable, l'erreur sur les sorties
y y deviendra grande galement 3 . Comme y est connue, il est alors tentant
d
x = A
x + Bu par l'ajout d'un terme du type L(
y y) qu'on
de modier
dt
connat et qui correspond l'erreur d'observation. Le problme suivant se
pose : peut-on choisir la matrice
converge vers
la matrice
L de faon ce que la solution x du systme
d
x = A
x + Bu(t) L(
y y(t)), y = C x
dt
x ? Puisque y = Cx, la question se pose ainsi :
peut-on ajuster
de faon obtenir une quation direntielle d'erreur stable
d
ex = (A LC)ex ?
dt
Soyons plus exigeants encore, par un choix judicieux de
ALC
L, peut-on imposer
d'avoir toutes ses valeurs propres partie relle strictement ngative ?
Or, les valeurs propres restent inchanges par la transposition : A LC

0
0 0
admet le mme spectre que A C L . De plus la paire (A, C) est observable si,
0
0
et seulement si, la paire (A , C ) est commandable (comme on l'a dj voqu,
on obtient le critre de Kalman de commandabilit en transposant celui de
l'observabilit). Ainsi le thorme 25 se transpose de la manire suivante.
Thorme 29
est observable, il existe
L,
matrice
n p,
telle que le spectre de
le mme que celui de n'importe quelle matrice relle

3. On a not
(A, C)
A LC soit
(Placement de ples. Observateur asymptotique)
y = C x
.
nn
Si
librement choisie.
4.4.
187
OBSERVATEUR-CONTRLEUR
4.3.3 Observateurs rduits de Luenberger

Supposons que
soit de rang maximum
p = dim(y) et que la paire (A, C)
soit observable. On peut toujours supposer, quitte faire un changement de

correspond aux p premires composantes de l'tat x :
(y, xr ). L'quation d'tat dtd x = Ax + Bu s'crit alors sous forme blocs
variable sur
x=
x,
que
d
y
dt
d
x
dt r
= Ayy y + Ayr xr + By u
= Ary y + Arr xr + Br u
Il est facile de montrer, en revenant, par exemple la dnition de l'observa-
(A, C) est observable si, et seulement si, (Arr , Ayr ) l'est : en eet
d
y Ayy y By u, qui
connatre y et u implique la connaissance de Ayr xr =
dt
d
peut tre vue comme une sortie du systme
x
=
A
x
rr r + (Br u + Ary y).
dt r
En ajustant correctement la matrice des gains d'observation Lr , le spectre
de Arr Lr Ayr concide avec celui de n'importe quelle matrice relle carre
d'ordre n p = dim(xr ). Considrons alors la variable = xr Lr y au lieu
de xr . Un simple calcul montre que
bilit, que
d
= (Arr Lr Ayr ) + (Ary Lr Ayy (Arr Lr Ayr )Lr )y + (Br Lr By )u
dt
Ainsi en choisissant Lr , de faon avoir Arr Lr Ayr stable, nous obtenons
un observateur d'ordre rduit n p pour (donc pour xr = + Lr y ) en
recopiant cette quation direntielle
d
= (Arr Lr Ayr )+(Ary Lr Ayy (Arr Lr Ayr )Lr )y(t)+(Br Lr By )u(t)
dt
La dynamique de l'erreur sur , e = vrie l'quation autonome stable
d
e = (Arr Lr Ayr )e .
dt
Cet observateur rduit est intressant lorsque np est petit, typiquement
n p = 1, 2 : la stabilit d'un systme de dimension 1 ou 2 est en outre trs
simple tudier.
4.4 Observateur-contrleur
4.4.1 Version tat multi-entre multi-sortie (MIMO)
En regroupant les rsultats sur la commandabilit et l'observabilit linaires, nous savons comment rsoudre de faon robuste par rapport de
4. MIMO : pour Multi-Input Multi-Output
188 CHAPITRE 4.
petites erreurs de modle et de mesures, le problme suivant : amener,

l'aide de la commande
en ne mesurant que
u, l'tat x du
y sachant que
systme de p q pendant le temps

d
:
x = Ax + Bu, y = Cx, (A, B)
dt
(A, C) observable.
comme (A, B) est commandable,
commandable et
En eet,
nous savons avec la forme de
Brunovsky construire explicitement une trajectoire de rfrence
(xr (t), ur (t))
pour aller de
q.
[0, T ] 3 t 7
Le respect de certaines contraintes peut-
tre important ce niveau et tre un guide dans le choix de cette trajectoire

de rfrence (et intervenir dans la dnition du critre pour la commande
optimale).
Toujours cause de la commandabilit, nous savons construire un bouclage statique sur
x, Kx,
de faon ce que la matrice
(placement de ple). La matrice
A BK
soit stable
est souvent appele matrice des gains de
la commande.
Grce l'observabilit, nous savons construire un observateur asymptotique sur
en choisissant les gains d'observation
de faon avoir
A LC
stable.
Alors le bouclage dynamique de sortie
u(t) = ur (t) K(
x xr (t)) contrleur
d
x = A
x + Bu(t) L(C x y(t)) observateur
dt
assure le suivi asymptotique de la trajectoire de rfrence
[0, T ] 3 t 7
(xr (t), ur (t)). Avec ce bouclage, appel commande modale ou encore observa
teur-contrleur, les petites erreurs de conditions initiales sont amorties lorsque
crot et les petites erreurs de modle et de mesures ne sont pas amplies
au cours du temps.
En eet, comme
d
x
dt
= Ax + Bu
et
y = Cx,
on a pour la dynamique du
systme boucl
d
x
dt
d
x
dt
= Ax + B(ur (t) K(
x xr (t)))
= A
x + B(ur (t) K(
x xr (t))) L(C x Cx)
o l'tat est maintenant (x, x

). Comme (xr , ur ) est une trajectoire du systme,
d
x
=
Ax
+
Bu
,
on
a
en
prenant comme variables d'tat (x = x
r
r
dt r
xr (t), ex = x x) au lieu de (x, x), la forme triangulaire suivante :
d
(x) = (A BK) x BK ex
dt
d
ex = (A LC) ex
dt
Ce qui montre que ex et x tendent vers 0 exponentiellement en temps. Le
spectre du systme d'tat (x, ex ) se compose du spectre de A LC et de
celui de A BK . C'est le principe de sparation .
4.4.
189
OBSERVATEUR-CONTRLEUR
4.4.2 Version transfert mono-entre mono-sortie (SISO)
1
Figure 4.1 Le transfert en boucle ferme, e = yc y = 1+GK
yc .
Dans le cas mono-variable o
et
u sont de dimension un, il est instructif
d'interprter l'observateur contrleur ci-dessus sous sa version tat, en terme

de transfert. On part donc du transfert rationnel y = G(s)u, avec G(s) =
P (s)
0
0
strictement causal (d P < d Q), P et Q premiers entre eux (pas de
Q(s)
racines communes dans
C).
On cherche, comme illustr sur la gure 4.1, un
contrleur K(s) aussi sous la forme d'un transfert rationnel causal, K(s) =
N (s)
0
0
(d N < d D ), de sorte que le systme boucl soit stable. Nous allons
D(s)
voir que l'observateur-contrleur rpond la question. Pour cela on passe
la forme d'tat. Pour viter tout confusion avec les fonctions de transfert, les
matrices sont notes en caractres calligraphiques.
d
x = Ax + Bu, y = Cx avec
Il existe trois matrices (A, B, C) telles que
dt
(A, B) commandable, (A, C) observable et G(s) = C(sI A)1 B . L'observateur contrleur
u = K
x,
correspond au transfert
d
x = A
x + Bu L(C x (y yc ))
dt
u = K(s)(yc y)
donn par
K(s) = K(sI A + BK + LC)1 L.

L'identit matricielle suivante

1
I CM1 N (M + N + LC)1 L
= I + C(M + N )1 N (M + LC)1 L.
conduit, avec
M = sI A, N = BK,
la formule explicite suivante :
1
= 1 C(sI A + BK)1 BK(sI A + LC)1 L
1 + G(s)K(s)
Ainsi le transfert en boucle ferme admet comme ples ceux du contrleur et
de l'observateur, ples que l'on peut choisir o l'on veut puisque
commandable et
(A, C)
(A, B)
est
est observable.
5. SISO : pour Single-Input Single-Output

6. Cette identit est un excellent exercice de calcul dans un cadre non commutatif.
190 CHAPITRE 4.
Figure
4.2 Boucle ferme avec gnrations de trajectoires par un ltre
passe bas sur la consigne yc et dont l'ordre est au moins gal celui du
0
0
systme (d R d Q, R stable).
Le gain statique en boucle ferme
LC)1 L
entre
e = yc y
et
yc
1
1+G(0)K(0)
= 1 C(A BK)1 BK(A
n'a aucune raison d'tre nul. Pour avoir cela,
soit on rajoute un eet intgral lent (recalage), soit on rajoute
u, uc vriant
Q(0)yc = P (0)uc .
On peut aussi gnrer en temps rel et de faon causale des rfrences
et
ur
qui vrient identiquement
yr
Q(s)yr = P (s)ur et qui suivent asymptoQ(0)yc = P (0)uc . Il sut de
tiquement n'importe quelle consigne vriant

poser
yr =
avec
polynme stable,
P (s)
yc ,
R(s)
d0 R d0 Q
ur =
et
Q(s)
yc
R(s)
R(0) = 1.
Ainsi,
1/R(s)
est un ltre
passe-bas de gain statique unitaire, et on considre le contrleur
u = ur K(s)(y yr ).
Q(s)
y . On parle
R(s) c
alors de ltrage de la consigne yc . Ces petits calculs de gnration et suivi
qui donne comme transfert en boucle ferme
y = yr =
de trajectoires correspondent au schma bloc fonctionnel de la gure 4.2. Si
Q(0) 6= 0,
alors, avec le changement d'chelle
est bien une valeur ltre de
yc 7 yc /Q(0)
on voit que
yr
yc .
4.5 Filtre de Kalman

Nous proposons ici une prsentation simplie de la technique du ltrage
de Kalman. On se restreint au cas des ltres gains constants. Le ltre de
Kalman gains constants, tel que nous le prsentons ici, est un algorithme
utilis pour reconstruire les variables d'tat d'un systme continu soumis des
perturbations stochastiques en utilisant des mesures incompltes entches
4.5.
191
FILTRE DE KALMAN
de bruit. Cette technique (voir [39]) a t utilise de manire intensive dans le

domaine de la navigation inertielle [23]. Il en existe de nombreuses variantes :
version instationnaire, version discrte, version tendue pour tenir compte de
la variation du point de fonctionnement, etc. On pourra se reporter [59]
pour une prsentation complte et [9] pour des complments au sujet de la
robustesse dans le cadre stationnaire.
Le lien avec les observateurs asymptotiques de la section prcdente est
simple : ces derniers peuvent tre interprts comme des ltres de Kalman
o les matrices de covariance des bruits sur l'tat et la sortie paramtrisent
la matrice des gains
L du thorme 29. Au lieu de dnir L partir des ples

A LC , L est dni partir des
de l'observateur, i.e., des valeurs propres de
matrices de covariance. Comme pour la commande LQR, il dicile d'avoir

alors des formules analytiques pour
sauf pour les systmes un ou deux
tats .
4.5.1 Formalisme
On considre un systme sous forme d'tat linaire stationnaire
d
x(t) = Ax(t) + Bu(t) + D(t)
dt
o l'tat est
et
(4.8)
x(t) Rn , l'entre est un signal (dterministe) connu u(t) Rm ,
(t) Rq
reprsente la valeur d'un signal stochastique qui agit comme
une perturbation sur le systme. On suppose que ce dernier signal possde les
proprits statistiques suivantes (qui en font un bruit blanc gaussien centr ) :
t, (t) est une variable

cov ((t), ( )) = M (t )
pour tout
gaussienne de moyenne
E ((t)) = 0,
est la fonction Dirac (voir [42]), et M est une matrice constante de

Mq (R) symtrique dnie positive.
Sous ces hypothses, x(t) solution de (4.8) est un processus stochastique
o
gaussien color.
En ce qui concerne la mesure, nous disposons de
y(t) = Cx(t) + %(t)

y(t) Rp , et %(t) Rp reprsente lui aussi un bruit
indpendant de (t) tel que
(4.9)
blanc gaussien centr,
E (%(t)) = 0, pour tout t

cov (%(t), %( )) = M% (t )
7. Ce qui n'est pas le cas si
est dni en plaant les valeurs propres de
A LC .
192 CHAPITRE 4.
M%
est une matrice constante de
Mp (R)
symtrique dnie positive.
On se place dans le cas o on connat les entres et les mesures jusqu'au

temps
t.
On note alors
U (t) = {u( ), ] , t]}

Y (t) = {y( ), ] , t]}
tant donn
U (t)
et
Y (t),
on cherche une estimation
x(t)
de l'tat
x(t)
qui
soit optimale en un certain sens. Le critre minimiser est la covariance

totale de l'erreur
x(t) = x(t) x(t)

J = E xT x = trace E(
x(t)
xT (t)
sous la contrainte d'estimation non biaise
E(
x(t)) = 0
4.5.2 Hypothses et dnition du ltre

Hypothses
Pour pouvoir construire le ltre de Kalman, on suppose que les deux
hypothses (fortes) sont vries
(H1) :
(H2) :
la paire
la paire
(A, D) est commandable

(A, C) est observable
(H1) signie que le bruit (t) excite tout l'tat du systme. (H2) implique
que la mesure non bruite Cx contient des informations sur tout l'tat. On
peut relcher ces deux hypothses en n'imposant seulement que
(H10 ) :
(H20 ) :
la paire
la paire
(A, D) est stabilisable

(A, C) est dtectable
en imposant que les modes non excits par le bruit
(t) soient asymptotique-
ment stables et que les modes non observs soient asymptotiquement stables.
Minimisation de la covariance
Le ltre de Kalman que nous prsentons est un ltre stationnaire de
dimension gale celle de l'tat du systme observer. Il admet comme entre
le signal
u(t)
et la mesure bruite
y(t).
Il s'crit, comme pour l'observateur
4.5.
193
FILTRE DE KALMAN
asymptotique de Luenberger, au moyen d'une matrice de gain
L sous la forme
suivante
d
x(t) = A
x(t) + Bu(t) L(C x(t) y(t))
dt
(4.10)
C x(t) y(t) est nomm innovation. La stabilit de ce ltre dpend

0
de la stabilit de la matrice A LC . D'aprs (H2), (ou (H2 )) il est possible
de stabiliser cette matrice par un choix appropri de L. La particularit du
ltre de Kalman rside dans le calcul de L partir des matrices de covariance
sur les bruits et %.
Le terme
Par dnition de l'quation (4.10), l'quation satisfaite par l'erreur est
d
x(t) = (A LC)
x(t) + D(t) L%(t)
dt
En utilisant la matrice de transition
un temps initial
t0
et
t,
(t, t0 ) = exp((A LC)(t t0 ))
entre
on peut crire la solution de ce systme comme-suit
(t, ) (D( ) L%( )) ( )d
x(t) = (t, t0 )x(t0 ) +

t0
En passant aux esprances, il vient
E(
x(t)) = (t, t0 )E(x(t0 ))
car les signaux
(t)
et
%(t)
sont d'esprance nulle par hypothse. Si
A LC
est asymptotiquement stable, on en dduit que lorsque le ltre de Kalman

est initialis au temps
t0 = ,
on a
E(
x(t)) = 0
et on conclut que l'estimation est, quel que soit le choix de
(stabilisant),
non biaise . Un calcul semblable permet de calculer la covariance de l'erreur,

note , E x
(t)
xT (t) comme l'unique solution symtrique positive de
l'quation matricielle de Lyapounov suivante
(A LC) + (A LC)T + DM DT + LM% LT = 0

Ainsi, pour toute valeur de la matrice de gain
L,
(4.11)
on peut calculer la cova-
riance de l'erreur par l'quation prcdente. Le critre que nous cherchons

minimiser est justement
J = trace().
Pour le ltre de Kalman,
est choisi
comme l'argument du minimum de cette fonction.

8. Si on initialise le ltre de Kalman en
t = 0
avec un tat
x(0) = x0
quelconque,
la stabilit permettra de conclure l'absence de biais de manire asymptotique, lorsque
t +.
194 CHAPITRE 4.
Gain du ltre
Le gain du ltre de Kalman est
L = C T M%1
o
(4.12)
est l'unique solution symtrique positive de l'quation de Riccati alg-
brique
0 = A + AT + DM DT C T (M% )1 C
On peut montrer, par une dmonstration trs semblable au cas de la commande quadratique, que le gain
est stabilisant, i.e. est tel que
A LC
toutes ses valeurs propres partie relle strictement ngative. Ceci justie a
posteriori les hypothses que nous avons formules.
Exemple 27.
Considrons un systme autonome mono-dimensionnel trs
simple
d
x = x + u +
dt
y =x+%
o
E ((t)) = 0, pour tout t, cov ((t), ( )) = (t ), E (%(t)) = 0, pour

t, cov (%(t), %( )) = k 2 (t ). Le ltre de Kalman est de la forme
tout
d
x(t) =
x + u L(
x y(t))
dt
o
est calcul par
L = (k 2 )1
o
est l'unique solution positive de
0 = 2 + 1 2 k 2
Il vient
k2 + k4 k2
1
et l'quation du ltre de Kalman est alors
r
d
1
x(t) = 1 + 2 x + u +
dt
k
!
1
1+ 2 1 y
k
titre d'illustration, on a reprsent sur la gure 4.3 des rsultats de

simulation permettant de comprendre l'eet du ltre de Kalman. On peut
comparer sur la mme gure ses rsultats avec un autre rglage non optimal.
4.5.
195
FILTRE DE KALMAN
Bruit dexcitation
200
0
200
6
8
Mesure bruite
10
12
10
5
0
2
4
6
8
10
Etat rel et estimation de ltat (filtre de Kalman)
12
2
4
6
8
10
Estimation de la variance de lerreur (filtre de Kalman)
12
2
4
6
8
10
Etat rel et estimation de ltat (autre rglage de filtre)
12
10
5
0
4
2
0
10
5
0
2
4
6
8
10
12
Estimation de la variance de lerreur (autre rglage de filtre)
4
2
0
10
Figure 4.3 Utilisation d'un ltre de Kalman.
12
196 CHAPITRE 4.
Exemple 28
Considrons un roTM
bot mobile roues indpendantes tel que le MobileRobots
Pioneer 3-AT
(Fusion de capteurs pour robot roues)
reprsent sur la Figure 4.4. Pour contrler ce vhicule, on peut librement

agir sur les quatres roues indpendantes. Pour le rendre autonome, c.--d.
capable de suivre une trajectoire prvue l'avance par exemple, la principale
dicult consiste estimer ( bord) prcisment la position et l'orientation
du vhicule. Pour rsoudre ce problme, on peut quiper le vhicule d'un certain nombre de capteurs embarqus : odomtres, rcepteur GPS, gyroscope
entre autres.
Chaque capteur prsente des dfauts bien spciques. Le GPS fournit un
signal actualis relativement basse frquence, entch d'un fort bruit de
mesure basse frquence. Le gyroscope fournit des informations frquemment
ractualises mais dgrades par un fort bruit de mesure haute frquence. Enn, les odomtres sont relativement ables, mais ont une rsolution limite.
Les quations de la dynamique du vhicule sont
(v + v2 )
d
x= 1
cos ,
dt
2
d = (v2 v1 )
dt
2l
d
(v1 + v2 )
y =
sin ,
dt
2
(4.13)
v1 , v2 reprsentent la vitesse du train roulant gauche et droit respectivement, x, y reprsentent la position du centre de masse du vhicule et
est l'orientation du chassis, l est la demi largeur de l'engin. En conditions
o
normales d'utilisation, le modle (4.13) est able.

Dans ce modle, on dispose de la connaissance de
v1
et
v2
par l'utilisa-
tion des odomtres (ici des capteurs incrmentaux situs dans les arbres des
d
roues). On mesure x et y par le rcepteur GPS et enn on mesure dt grce
9
un gyroscope un axe.
T
An d'estimer l'tat (x, y, ) du systme, on peut utiliser un observateur,
ou un ltre de Kalman. Ces techniques de fusion de capteurs utilisent la redondance de l'information et l'accord avec un modle dynamique, pour fournir
une estimation meilleure que l'information fournie par chacun des capteurs
sparment. Par exemple, si on intgre (en boucle ouverte) les donnes du
gyroscope et des odomtres, ce qui thoriquement permet de calculer les positions, on observe trs rapidement (aprs quelques dizaines de secondes) une
importante drive de l'estimation. Si on n'utilise que le GPS, on obtient assez
rapidement des aberrations signalant par exemple des mouvements latraux
de plusieurs mtres (alors que le vhicule en est totalement incapable).
On a reprsent sur la Figure 4.5, des rsultats de suivi en boucle ferme
d'une trajectoire de consigne. On donne aussi titre informatif, l'enregis9. Ce gyroscope de technologie MEMS mesure une vitesse angulaire.
4.5.
FILTRE DE KALMAN
197
Figure 4.4 Vhicule autonome roues indpendantes (remerciements au

Laboratoire de recherches balistiques et arodynamiques de la Dlgation
Gnrale pour l'Armement).
trement des valeurs donnes par le rcepteur GPS qu'on pourra comparer
l'estimation par fusion de capteurs (on dit aussi hybridation) de la position
du vhicule.
198 CHAPITRE 4.
10
15
20
25
10
10
15
20
Figure 4.5 Suivi de trajectoire en boucle ferme pour un vhicule roues

en utilisant une fusion de capteurs : GPS, gyroscope et odomtres.
4.6.
199
COMPLMENTS
Utilisation dans un cadre dterministe

Lorsque le systme n'est pas aect par des bruits ou que ceux-ci sont mal
connus, on peut continuer utiliser le ltre de Kalman pour rgler l'observateur asymptotique stationnaire qu'il dnit. Les matrices
M%
et
agissent
comme des pondrations (on remarquera l'analogie avec la commande quadratique une fois de plus) avec les eets suivants :
1. lorsqu'on augmente
M% ,
on a tendance faire moins conance aux
mesures (ou certaines d'entre elles si on agit seulement sur certains

coecients dominants de la matrice) et donc naturellement l'inuence
de ces mesures sur la dynamique du ltre sera rduite travers le calcul
de la matrice de gain (4.12) ;
2. lorsqu'on augmente
M ,
on a tendance faire moins conance au
modle de la dynamique non bruite, naturellement on va acclrer

la dynamique de l'observateur pour en tenir compte en privilgiant
dans (4.10) l'innovation aux dpens du modle. Ceci est apparent dans
la contribution de
au gain
travers la covariance dans l'qua-
tion (4.11).
4.6 Complments
4.6.1 Estimation de paramtres et commande adaptative
Soit le systme d'tat
et de paramtre
d
x = f (x, t) + p g(x, t),
dt
On suppose que les trajectoires
tout temps
t 7 x(t)
pR
sont bornes et donc dnies pour
x.
On souhaite estimer
p.
K et sont des paramtres constants
(sorte de moindres carrs rcursifs)
d
x = f (x(t), t)+
p g(x(t), t)K(
xx(t)),
dt
o
x Rn ,
positif. On mesure ici tout l'tat
On considre l'estimateur suivant o
>0
h, i
est le produit scalaire dans
d
p = hg(x(t), t), (
x x(t))i
dt
Rn .
Cet estimateur donne en temps rel d'une part une valeur ltre de
et d'autre part reconstruit asymptotiquement le paramtre
x, x
lorsqu'il existe
200 CHAPITRE 4.
>0
tel que
kg(x, t)k
x Rn
pour tout
et tout temps
t.
En eet, il
sut de considrer la fonction de Lyapounov suivante
1
1
x x)2 + (
p p)2
V = (
2
2
On voit que
d
V = K(
x x)2 0
dt
Ainsi x
tend vers x quand t tend vers l'inni. Et donc, intuitivement dtd x dtd x
converge vers 0 soit donc (p p
)g(x, t) converge zro. Comme le vecteur g(x, t)
est toujours de norme plus grande que > 0 on en dduit que p
converge
vers p.
Il est possible de gnraliser cet estimateur pour un nombre arbitraire m
de paramtres. On part de
X
d
x = f (x, t) +
pi gi (x, t)
dt
i=1
On considre avec
i > 0
paramtre (i
= 1, ..., m)
l'estimateur
X
d
x = f (x(t), t) +
pi gi (x(t), t) K(
x x(t))
dt
i=1
d
p1 = 1 hg1 (x(t), t), (
x x(t))i
dt
.
.
.
d
pm = m hgm (x(t), t), (
x x(t))i
dt
Il est alors facile de voir que la fonction
X 1
1
V = (
x x)2 +
(
pi pi ) 2
2
2
i
i=1
est dcroissante
d
V = K(
x x)2 0
dt
Donc on a toujours x
qui converge vers x. En revanche, la convergence des
pi vers les pi n'est pas garantie : tout dpend des gi (x, t) : s'ils forment pour
n
chaque x et t un systme libre de vecteurs de R , systme bien conditionn,
alors la convergence des paramtres est encore assure. Dans les autres cas,
cela dpend de la trajectoire suivie par
x. En revanche, il est trs intressant
4.6.
201
COMPLMENTS
de voir que
converge toujours vers
de ltre non linaire et adaptatif de
x.
x.
L'estimateur prcdent est une sorte
Cet estimateur est aussi la base de la commande adaptative qui estime

en mme temps que l'on contrle le systme via
et un seul contrle
u. Prenons un seul paramtre
(la gnralisation est simple partir de l)
d
x = f0 (x) + uf1 (x) + pg(x)
dt
Supposons que nous ayons un feedback
en
x=0
mais o le paramtre
u = k(x, p)
qui stabilise le systme
inconnu intervient. Alors, il est naturel de
considre le feedback construit partir des estimes
u = k(x, p) ou u = k(
x, p)
avec
d
x = f0 (x(t)) + u(t)f1 (x(t)) + p g(x(t), t) K(
x x(t))
dt
d
p = hg(x(t), t), (
x x(t))i
dt
Sous des hypothses raisonnables sur la dynamique en boucle ouverte pour
(pas d'explosion en temps ni essentiellement) on montre que
et ensuite que le feedback assure la convergence de
vers
0.
tend vers
x
x
Sans conditions
p reste born. Ainsi, la

p n'est pas ncessairement indispensable pour faire converger
x vers 0 avec le contrle u. C'est le principal paradoxe du contrle adaptatif.
supplmentaires, tout ce que l'on peut dire c'est que
connaissance de
Un lecteur intress pourra consulter [41]. On notera que l'une des hypothses
trs importante est la dpendance ane de la dynamique par rapport au
paramtre
p.
Dans le cas de dpendance non linaire trs peu de rsultats
existent.
4.6.2 Linarisation par injection de sortie

Il arrive parfois que, dans les bonnes coordonnes d'tat, coordonnes
notes
ici, les quations du systme s'crivent ainsi :
d
x = Ax + f (Cx, t),
dt
avec la paire
y = Cx
(A, C) observable et f (y, t) est une fonction a priori non linaire.

x
Il est clair qu'il faut avoir un peu de air pour choisir les bonnes variables
pour que le systme s'crive ainsi. Ce n'est en gnral pas possible. Parfois
c'est possible et mme vident comme pour le pendule command :
d2
g
= sin + u(t),
2
dt
l
y = .
202 CHAPITRE 4.
En eet dans ce cas on a

x=
dt

,
A=

f (Cx, t) =
0 1
0 0

,
1 0
C=
0
g
l sin + u(t)
A + LC
Il est alors facile de construire un observateur pour

telle que
x.
Il sut de choisir
soit une matrice relle stable. Alors l'observateur
d
x = A
x + L(C x y(t)) + f (y(t), t)
dt
est exponentiellement convergent car lorsque l'on regarde la dynamique de
ex = x x,
l'erreur
les termes non linaires disparaissent et on a
d
ex = (A + LC)ex .
dt
4.6.3 Contraction
La notion de contraction [49, 33] pour un systme, avec une dynamique
x = f (x, t),
peut tre interprte comme la dcroissance exponentielle, avec
le temps, de la longueur de tout segment de conditions initiales transport

par le ot.
Dnition 17 (Contraction stricte).

f (x, t)
rgulier (C
une mtrique sur
d
Soit un systme dynamique dt x =
par exemple) dni sur une varit M rgulire. Soit g
M.
Soit
U M
un sous ensemble de
est dite strictement contractante sur
M.
La dynamique
au sens de la mtrique
g,
si la partie
symtrique de sa matrice Jacobienne est une matrice dnie ngative, c'est

dire, s'il existe
avons pour tout
>0
tel que, dans des coordonnes locales
et pour tout
sur
U,
nous
x,
f
g
f T
g(x) + g(x)
+
f (x, t) g(x)
x
x x
Nous avons le rsultat suivant qui justie cette dnition et cette terminologie.
Thorme 30.
une varit
associ
d
Soit un systme dynamique dt x = f (x, t) rgulier dni sur
rgulire. Soit g(x) une mtrique sur M . Soit X(x, t) le ot
f
d
X(x, t) = f (X(x, t), t) t [0, T [
dt
X(x, 0) = x
avec
T +.
4.6.
203
COMPLMENTS
Considrons deux points
x0
and
x1
x0 = (0) et x1 = (1). Si
f est une stricte contraction
dans
et une godsique
sur un sous ensemble
(s)
U M,
qui joint
avec
la
constante prsente dans la dnition 17,

et si
X((s), t) appartient U
pour tout
s [0, 1] et pour tout t [0, T [.
alors
dg (X(x0 , t), X(x1 , t)) e 2 t dg (x0 , x1 ) t [0, T [

o
dg
est la distance godsique associe la mtrique
Dmonstration. La preuve est la suivante
(X((s), t), s [0, 1])
. Soit
au sens de la mtrique
10
l(t) =
0
g.
l(t) la longueur de la courbe
dX((s), t) T
dX((s), t)
g(X((s), t))
ds
ds
ds
Nous avons alors
d
l(t) =
dt
Z
0
d
dt
dX((s),t) T
g(X((s), t)) dX((s),t)
ds
ds
q
ds
dX((s),t) T
dX((s),t)
2
g(X((s), t)) ds
ds
Comme
d
d dX((s), t)
= f (X((s), t), t) =
f (X((s), t), t) X((s), t)
dt
ds
ds
X
ds
nous obtenons
d
dt
dX((s), t)
dX((s), t) T
g(X((s), t))
ds
ds
avec
P (s, t) =
)
=
dX((s), t) T
dX((s), t)
P (s, t)
ds
ds
f (X) T
f (X) g(X)
g(X) + g(X)
+
f (X, t)
X
X
X
et
X = X((s), t)
Puisque
est une contraction sur
U,
il existe
>0
tel que
P (s, t) g(X((s), t))

10. Cette preuve s'inspire de calculs faits par Laurent Praly
204 CHAPITRE 4.
On obtient alors l'ingalit suivante pour la drive
d
l(t)
dt
l(t) l(t)
dt
2
qui conduit
l(t) l(0)e 2 t
Puisque
godsique
t [0, T [
dg (X(x0 , t), X(x1 , t)) l(t) et l(0) = dg (x0 , x1 ) (en eet est
qui joint les deux points x0 et x1 ), le thorme est dmontr.
la
n
Lorsque la varit Riemannienne M est l'espace Euclidien R , la dynad
x = f (x, t) est une contraction lorsque la partie symtrique de la
mique
dt
matrice Jacobienne est ngative
f
+
x
f
x
T
0
Enn, l'intrt pour la construction d'observateurs non-linaires asymptotiques vient du fait qu'avec une dynamique contractante, il sut de simuler
le systme pour avoir une estimation de
d
x = f (
x, t)
dt
la dpendance en temps tant alors due aux entres et/ou aux termes d'erreur
entre la sortie estime et la mesure.
L'exemple typique est le suivant. On considre un systme mcanique
un degr de libert
x1 , de vitesse x2 obissant l'quation de Newton suivante

d
x1 = x2 ,
dt
avec comme seule mesure
y = x1
d
x2 = F (x1 , x2 , t)
dt
et on suppose que
F
x2
0.
On considrer
alors l'observateur
d
x1 = x2 (
x1 y(t))
dt
d
x2 = F (y(t), x2 ) (
x1 y(t))
dt
, > 0 deux paramtres de rglage. On crit symboliquement cet
d
x = f (
x, t) o la dpendance en t vient de la mesure y(t) =
dt
x1 (t). Cet observateur s'crit formellement dtd x = f (
x, t). Avec comme produit
avec
observateur
scalaire celui qui est associ la matrice constante symtrique dnie positive

g=
1 0
0 1
4.6.
205
COMPLMENTS
on a
f
x
T
f
=
g+g
x
2
0
0
F
2 x
Nous n'avons pas une contraction stricte comme dans la Dnition 17 mais
F
< 0 uniformment
au sens large. Il est cependant facile de voir que si
x2
pour tout x avec > 0, on a une contraction stricte et donc la convergence
exponentielle de
vers
x.
Annexe A
Sur le thorme de
Cauchy-Lipchitz
On considre donc le problme de Cauchy suivant :
x(0) = x0 ,
d
x(t) = v(x(t), t).
dt
(A.1)
Pour tablir des rsultats sur ces proprits (essentiellement, les Thormes 1
et 2) nous allons utiliser la notion de solution approchante qui s'appuie simplement sur le schma numrique d'Euler explicite
xk+1 = xk + v(xk , k),

o
est un petit temps
>0
et
xk
x0 = x(0),
kN
une approximation de
x(k).
Considrons le problme de Cauchy (A.1). On suppose, de manire gn0

rale, que v est continue dans une rgion R = {kx x k b, |t| a}. En
n
gnral on prend comme norme k k, la norme euclidienne sur R , mais ce
n'est pas une obligation. Par la suite, sauf mention contraire
norme euclidienne. Il en dcoule que
constante
est borne sur
kk
dsigne la
par une certaine
M > 0.
Dnition 18 (Solution approchante).
On appelle solution approchante
prs du problme de Cauchy (A.1), une fonction
(t, x(t)) R on

d

x(t) v(x(t), t)
dt

drivable par morceaux, telle que pour tout
x(0) = x0 ,
t 7 x(t)
d
en tout point o dt x est dni.
207
continue,
208
ANNEXE A.
En d'autres termes,
points de
|t| a.
SUR LE THORME DE CAUCHY-LIPCHITZ
d
x(t) peut ne pas tre dni en un nombre ni de
dt
De telles solutions approchantes existent comme le prcise le rsultat

suivant.
Thorme 31.
Soit le problme de Cauchy (A.1) o
R = {kx x k b, |t| a}
et majore par
peut construire une solution approchante
|v| M .
est continue sur
> 0, on
l'intervalle |t|
Pour tout
prs dnie sur
min(a, b/M ) , h.
v
> 0,
Dmonstration. L'application
est continue sur
ment continue. Pour tout
il existe
>0
R,
elle est donc uniform-
tel que
|v(x1 , t1 ) v(x2 , t2 )|
quels que soient
(x1 , t1 ) R
Considrons maintenant,
diaires entre
et
et
(x2 , t2 ) R
avec
kx1 x2 k , |t1 t2 | .
tant donn, un ensemble de temps interm-
h
t0 = 0 < t1 < t2 ... < tm = h
vriant
|ti ti1 | min(, /M ),
i = 1, ..., m
(A.2)
(par exemple, cette famille de temps intermdiaires peut tre de plus en plus
nombreuse lorsque
diminue). Nous allons montrer que la fonction dnie
par la relation de rcurrence (dite de Cauchy-Euler)
x(t) = xi1 + (t ti1 )v(xi1 , ti1 ),

est une solution approchante
ti1 t ti ,
xi = x(ti )
prs. Cette fonction est continue, et elle pos-
sde une drive continue par morceaux (elle est en fait ane par morceaux
par construction). Sa drive est dnie partout sauf aux points
En dehors de ces points, on a, pour
(ti )i=1,...,m1 .
ti1 t ti ,

d

x(t) v(x(t), t) = kv(xi1 , t) v(x(t), t)k

dt
Par (A.2), et d'aprs la relation de rcurrence, on a
kx(t) xi1 k = M (t ti1 ) < M
=
M
(A.3)
209
D'aprs la continuit uniforme de
dj voque, on dduit de (A.2)-(A.3)
kv(xi1 , ti1 ) v(x(t), t)k

On a donc tabli, que pour tout
|t| < a
en dehors des points
t1 , ..., tm
on a

d
x(t) v(x(t), t)

dt
Enn, par construction
x(0) = x0 ,
ce qui achve la dmonstration.
Nous allons maintenant avoir besoin de la proprit Lipschitz permettant

de prouver une ingalit de croissance de la propagation des approximations.
Dnition 19 (Fonction Lipschitz).
Rn R v(x, t) R
en x si
Une fonction scalaire
est Lipschitz avec la constante
k>0
(ou
(x, t) R
k -Lipschitz)
kv(x1 , t) v(x2 , t)k k kx1 x2 k

pour tout
(x1 , t), (x2 , t)
dans
R.
Dnition 20 (Fonction Lipschitz vectorielle).

Rn R v(x, t) Rn
est Lipschitz en
Une fonction
(x, t)
si et seulement si chacune de ses
composantes l'est (les constantes Lipschitz de chaque composante peuvent

direr).
On notera, grce la proposition suivante, que la proprit Lipschitzienne est trs gnrale.
Proposition 9.
n
n
Soit R R (x, t) 7 v(x, t) R . Supposons que chaque
v(x,t)
drive partielle x
pour i = 1, ..., n existe et soit de norme borne par un
i
scalaire c, alors v(x, t) est Lipschitzienne en x avec comme constante c n.
Dmonstration. Quels que soient

n
vecteurs de
x = (x1 , ..., xn )
et
y = (y1 , ..., yn )
deux
, on peut crire,
v(y, t) = v(x, t) +
X Z
i=1,...,n

v
(xi yi ) d
xi (y+(xy),t)
Il sut alors d'utiliser

l'ingalit de Cauchy-Schwartz, l'ingalit triangulaire
v(x,t)
et l'hypothse
n pour avoir
xi
kv(y, t) v(x, t)k c n kx yk
210
ANNEXE A.
Nous allons maintenant pouvoir noncer, sous une hypothse de Lipschitz,

un rsultat important sur la propagation des direntes entre les solutions
approchantes.
Thorme 32
chantes). tant
(Propagation de la distance entre deux solutions appro-
R et k-Lipschitz en
1 et 2 prs du problme de Cauchy (A.1), dnies sur |t| b. La dirence d(t) = x1 (t) x2 (t)
satisfait, pour tout |t| b
x.
Soient
x1 (t)
donne
et
x2 (t)
v(x, t)
continue sur une rgion
deux solutions approchantes
kd(t)k exp(k |t|) kd(0)k +
1 + 2
(exp(k |t|) 1)
k
(A.4)
d
Dmonstration. La drive dt d(t) est dnie partout sauf en un nombre ni
de points. Par dnition des solutions approchantes, on a (en notant
,
1 + 2 )

d
d

d
d(t) = x1 (t) x2 (t) kv(x1 (t), t) v(x2 (t), t)k +
dt
dt

dt
k kx1 x2 k + k kd(t)k +
d
d(t)
dt
0, on peut donc conclure d'aprs le Lemme 4 (donn un peu
o on a utilis la proprit Lipschitzienne de

existe et
d(t) 6=
v.
Aux points tels que
plus loin),
d
kd(t)k k kd(t)k +
dt
On a alors trois cas :
1. si
d(t)
est identiquement nul, alors la conclusion est triviale
2. si
d(t)
ne s'annule jamais sur

exp(kt)
] b, b[,
alors on peut crire

Z t
d
kd(t)k k kd(t)k dt
exp(kt)dt
dt
0
o le membre de gauche peut avoir un intgrand discontinu mais possde eectivement une primitive. Il vient
exp(kt) kd(t)k kd(0)k

d'o la conclusion

(1 exp(kt))
k
211
d(t) 6= 0, |t| b alors que d s'annule quelque part

], alors, par continuit de kd(t)k, il existe t1 , avec
sur l'intervalle [b, t
b t1 < t b tel que d(t1 ) = 0 et d(t) 6= 0 sur t1 < t < t. Par une
3. s'il existe
t tel
que
intgration semblable au cas prcdent mais eectue sur l'intervalle
[t1 , t],
on a alors
kd(t)k

(exp (k(t t1 )) 1)
k
qui est une majoration plus forte que celle recherche.
Lemme 4.
Si
x(t)
est continment direntiable sur un intervalle ouvert

]t1 , t2 [, alors, en tout point t tel que kx(t)k 6= 0, la drive dkx(t)k
existe et
dt
vrie

d kx(t)k dx(t)

dt dt
Pn 2
Dmonstration. Soit t ]t1 , t2 tel que kx(t)k =
6 0, avec kx(t)k =
i=1 xi (t),
Pn
dxi
xi dt
dkx(t)k
il vient
= i=1
qui est bien dnie. D'autre part, par passage la
dt
kx(t)k
p
limite dans l'ingalit suivante, on obtient le rsultat dsir.
1
1
|kx(t + t)k kx(t)k| kx(t + t) x(t)k
t
t
Nous pouvons maintenant nous intresser aux thormes d'existence et

d'unicit des solutions du problme de Cauchy.
Thorme 33 (Unicit de la solution au problme de Cauchy).

blme de Cauchy (A.1) o v(x, t) est continue et Lipschitz en
0
voisinage de (x , 0). Ce problme possde au plus une solution.
Dmonstration. Soient deux solutions (exactes)
x1
et
x2
Soit le pro-
dans un
du problme (A.1).
D'aprs le Thorme 32, on a
kx1 (t) x2 (t)k 0

d'o
x1 x2 .
Thorme 34
(Existence d'une solution au problme de Cauchy)
h.
x(t)
de
Soit le
v(x, t) est continue et Lipschitz en x dans la

a}. Soit M la borne suprieure de kf k sur R.
b
(A.1) dnie sur l'intervalle |t| min(a,
),
M
problme de Cauchy (A.1) o

0
rgion R = {|x x | b, |t|
Il existe une solution
212
ANNEXE A.
Dmonstration. Considrons une suite dcroissante positive
(n )nN
conver-
0. D'aprs le Thorme 31, on peut construire une suite de fonc(xn )nN qui sont chacune solution approchante n prs de (A.1). On
alors, pour |t| h,

d
xn v(xn (t), t) n , xn (0) = x0

dt
geant vers
tions
a
d
x est dnie partout sauf en un nombre ni de points
dt n
1, ..., mn . On va prouver trois proprits
La drive
i=
(n)
ti
(xn )nN converge uniformment sur |t| h vers

x(t)
R

Rt
t
la suite
f
(t,
x
(t))dt
converge uniformment vers 0 f (t, x(t))dt
n
0
1. la suite de fonctions
une fonction continue
2.
nN
0
3. la fonction x(t) est continment direntiable et vrie x(0) = x et
d
x(t) = v(x(t), t). Autrement dit x(t) est solution du problme de Caudt
chy.
preuve du point 1
Considrons
n < p
et appliquons l'ingalit du Thorme 32 aux deux so-
lutions approchantes
schitz de
xn (t)
et
xp (t).
Il vient, en notant
la constante Lip-
v(x, t)
kxn (t) xp (t)k
2n
n + p
(exp(|t|) 1)
(exp(|t|) 1)
k
k
donc la suite de fonctions continues
(xn (t)) est uniformment de Cauchy, elle

1
converge vers une fonction limite continue .
preuve du point 2
0
0
Considrons une rgion R = {|t| h, kx x k M h}. L'application v(x, t)
0
est continue dans R . Donc, pout tout > 0, il existe > 0 tel que, pour
0
tout (t, x1 ), (t, x2 ) dans R , tels que kx1 x2 k , on a
kv(x1 , t) v(x2 , t)k

Pour ce
, il existe d'aprs le rsultat de convergence tabli au point 1, N N

n > N on a
tel que, pour tout
kxn (t) x(t)k

1. L'ensemble des fonctions continues bornes de
clos des fonctions bornes et est donc complet.
|t| h
dans
Rn
est un sous espace
213
pour tout
v(x(t), t)
|t| h.
et on a
(v(xn (t), t)) converge uniformment

(uniformment en t)
Z t
Z t
v(xn (t), t)dt =
v(x(t), t)dt
lim
Donc la suite
vers
preuve du point 3
Reprenons l'ingalit
d

xn (t) v(xn (t), t) n
dt
pour tout
|t| < h.
En int-
grant, on obtient
t1
or
xn (t)

d
( xn (t) v(xn (t), t))dt
n |t1 | n h
dt
est continue, donc l'intgration donne

Z

xn (t1 ) x0

t1

v(xn (t), t)dt
n h
D'aprs le point 2, on a alors par passage la limite
t1
v(xn (t), t)dt
x(t) = x +
0
v(x(t), t) est continu, donc x(t) est continment direntiable et

d
x(t) = v(x(t), t).
vaut
dt
L'intgrand
sa drive
Annexe B
Autour des fonctions de
Lyapounov
D'une faon moins restrictive que dans la dnition ci-dessous, dnition

que nous n'utiliserons que dans cette annexe, on appelle en gnral fonction
de Lyapounov toute fonction globalement dnie sur l'espace d'tat, valeurs

relles et dcroissante le long de toute trajectoire.
Dnition 21.
x un point d'quilibre d'un systme dtd x = v(x) dni

n
dans un domaine R , o v est Lipschitz. On appelle fonction de Lyapounov (centre en x
) une fonction V : R qui vrie les trois proprits
Soit
suivantes
1.
2.
V (
x) = 0
est continue et possde des drives partielles continues

et
V (x) > 0
sur
\ {
x}
d
3. dt V (x) = V (x)v(x) 0 pour tout
croissante le long des trajectoires).
(autrement dit
est d-
Thorme 35 (Stabilit et stabilit asymptotique locale par une fonction de

Lyapounov). Avec les notations de la Dnition B, s'il existe une fonction de
V (x) dans un voisinage centr en x alors x est un point d'quilibre
d
de plus, dt V < 0 pour tout x \ {
x}, alors x est un point
Lyapounov
stable. Si
d'quilibre (localement) asymptotiquement stable.

Dmonstration. Reprenons la Dnition 1, et montrons tout d'abord la sta-
x. On souhaite montrer que, pour tout > 0 tel que la boule centre
soit contenue dans , il existe > 0 tel que, pour toute
0
condition initiale kx x
k , on a
bilit de
en
de rayon
kx(t) xk ,
pour tout
215
t0
216
ANNEXE B.
AUTOUR DES FONCTIONS DE LYAPOUNOV
Figure B.1 Liens entre fonction de Lyapounov et la norme Euclidienne.

La fonction de Lyapounov va nous fournir ces ingalits qui portent sur la
norme Euclidienne. Notons
le minimum atteint par V (qui est continue) sur

B centre en x de rayon . Par hypothse,
la frontire (compacte) de la boule
= minkxxk= V (x) > 0.
Considrons maintenant le sous-ensemble
E 2 , {x B /V (x)
}
2
Ce sous-ensemble est strictement l'intrieur de B et est donc gal {x/V (x)
}. En eet, si ce n'tait pas le cas, il existerait un x la fois dans E 2 et

2
la frontire de B . On aurait alors
V (x )
et
k
x x k =
donc
V (x )
d'o la contradiction.
V (
x) = 0. On peut
donc nalement construire une boule B centre en x
de rayon dans laquelle
on a V (x) . Cette boule est donc incluse dans E .

2
2
D'autre part, on note que
est continue et vrie
On vient d'tablir (voir Figure B.1)
B E 2 B
L'ensemble E est positivement invariant : pour toute condition initiale
2
x(0) = x0 appartenant E 2 , on a x(t) E 2 pour tout t 0. En eet, on
d
dduit de
V (x) 0 que V (x) V (x(0)) 2 .
dt
217
x(0) B on a
x(0) E et donc par l'invariance que vous venons d'voquer, x(t) E 2
pour tout t 0 et donc x(t) B pour tout t 0. D'o la conclusion
concernant la stabilit du point d'quilibre x
.
d
V < 0 pour tout
Considrons maintenant l'hypothse supplmentaire
dt
x \{
x}. La fonction t 7 V (x(t)) est dcroissante et borne infrieurement
par 0, donc elle converge. Notons
On peut alors conclure que pour toute condition initiale
,
2
lim V (x(t)) = l
t+
l 0, montrons par l'absurde que l = 0. Si ce n'tait pas le cas,

l
alors x(t) resterait en dehors, lorsque t +, de E l = {x /V (x) } et
2
2
donc, par la continuit de V et l'quation V (
x) = 0 dj voques, en dehors
d'une certaine boule Br de rayon r vriant > r > 0 centre en x
. On peut
d
V
(x)
qui, par construction, vrie k < 0.
alors calculer k = maxrkxk
dt
Par hypothse
Enn,
V (x(t)) = V (x(0)) +
0
d
V (x(t))dt V (x(0)) kt
dt
ce qui est inV (x) 0.

Nous venons de montrer que limt+ V (x(t)) = 0. Il nous faut maintenant conclure sur x lui-mme. Considrons > 0, et, comme prcdemment,
l'ensemble E B . Puisque limt+ V (x(t)) = 0, alors il existe un temps
2
T > 0 tel que x(t) E 2 pour tout t T . On en dduit que pour tout
> 0, il existe un temps T > 0 tel que x(t) B . Le point x est donc
Le second membre de la dernire ingalit converge vers
compatible avec la proprit
asymptotiquement stable.
Au cours de la preuve du thorme prcdent, nous avons t capables
de construire un sous-ensemble de conditions initiales (not
E 2 )
fournissant
des trajectoires convergeant asymptotiquement vers le point d'quilibre
x.
Ce sous-ensemble fait donc partie d'un ensemble appel bassin d'attraction

du point
x.
Ce dernier est dni comme l'ensemble des conditions initiales
fournissant une trajectoire convergeant vers
x.
Caractriser prcisment cet
ensemble est dicile, et nous en avons pour l'instant simplement trouv une
partie. Une question intressante est de savoir sous quelle hypothse le bassin
n
d'attraction est l'espace R tout entier, c.--d. sous quelle hypothse x
est
globalement asymptotiquement stable.

De manire prliminaire, considrons l'exemple d'un systme de dimension 2, avec
V (x) =
x21
+ x22
1 + x21
218
ANNEXE B.
On peut vrier que
minkxk= V (x) 1,
> 0. Ainsi, la construc {x/V (x) 1/2} qui ne
pour tout
tion prcdente est limite des ensembles
couvrent pas l'ensemble du plan. On peut, en fait, garantir la possibilit

d'une construction de
E 2
aussi vaste que dsir si la fonction
est non
borne radialement, c.--d. si
lim
kx
xk
V (x) = +
On obtient alors le thorme suivant, qui sera trs utile en pratique
Thorme 36 (Stabilit asymptotique globale par une fonction de Lyapoun

nov). S'il existe une fonction de Lyapounov V (x) dnie sur R non borne
d
V < 0 pour tout x
dt
libre globalement asymptotiquement stable.
radialement telle que
6= x,
alors
est un point d'qui-
[0, +[3 a 7 r(a) = sup{x / V (x)a} kxk. Cette

fonction est bien dnie car V est non borne radialement. Le long d'une
d
trajectoire ayant x(0) pour condition initiale, on a par hypothse
V 0,
dt
et donc V (x(t)) V (x(0)) pour tout t 0. Donc, pour tout t 0, kx(t)k
sup{x / V (x)V (x(0))} kxk = r(V (x(0)). De cette ingalit on dduit que pour
toute condition initiale x(0), on peut, en chantillonnant la trajectoire qui
en est issue, construire la suite (x(i))iN et que, pour tout t i on a
Dmonstration. Dnissons
kx(t)k r(V (x(i)))
(B.1)
limt+ V (x(t)) = 0.
D'autre part, on va montrer que lima0 r(a) = 0. La fonction t 7 r(1/t)
est dcroissante et minore donc elle converge lorsque t +. Notons
la limite lima0 r(a) = l 0. Supposons que cette limite est non nulle.
Alors, pour toute suite (an )nN convergeant vers zro, il existe une suite
(xn )nN telle que kxn k l/2 et V (xn ) an . On dduit que, pour cette suite,
limn+ V (xn ) = 0 avec kxn k l/2 ce qui est impossible car V est non nulle
en dehors de x
. On a donc lima0 r(a) = 0.
On dduit donc de la suite d'ingalits (B.1) que limt+ x(t) = 0.
De la mme manire que dans le Thorme 35, on a
Bien souvent, on trouvera que la condition de stricte ngativit de la

d
drive
V en dehors du point d'quilibre x est trop contraignante. En eet,
dt
on pourra souvent trouver une fonction de Lyapounov (ce qui est dj dicile)
telle que l'ensemble des points x o sa drive est nulle n'est pas rduite un
d
point. Notons Z = {x/ V (x) = 0}. Dans ce cas, le thorme suivant permet
dt
de dterminer l'ensemble vers lequel le systme converge. Il utilise la notion
d'ensemble positivement invariant (dj rencontre plus haut dans la preuve
du Thorme 35 mais que nous formalisons ici).
219
Dnition 22 (Ensemble positivement invariant).
On dit que I est un

d
0
sous-ensemble positivement invariant de dt x = v(x), si quel que soit x I
d
0
condition initiale du problme de Cauchy dt x = v(x), x(0) = x , tous les
points de la trajectoire [0, +[3 t 7 x(t) appartiennent I .
Thorme 37
(Invariance de LaSalle (version locale)) Soit V fonction de

d
Lyapounov pour le systme dt x = v(x). Soient s > 0 et Es le sous-ensemble
{x / V (x) s}. On suppose que Es est borne et que dtd V (x) 0 l'intrieur
d
de Es . Notons Z l'ensemble des points de Es pour lesquels dt V (x) = 0. Toute
trajectoire issue d'une condition initiale dans
Es
converge lorsque
t +
Z.
vers le plus grand sous-ensemble positivement invariant contenu dans
Exemple 29.
Considrons l'oscillateur non linaire suivant
d
d2
x
+
k
x + g(x) = 0
dt2
dt
k est un paramtre strictement positif et g est telle
x 6= 0. On peut rcrire ce systme sous forme d'tat
o
que
xg(x) > 0
pour
d
x=y
dt
d
y = ky g(x)
dt
Une fonction candidate tre de Lyapounov est
g( )d +
V (x, y) =
0
y2
2
Cette fonction est continue et possde des drives partielles continues.

possde un unique minimum en
(x, y) = (0, 0).
Calculons maintenant
d
d
d
V (x, y) = g(x) x + y y = ky 2 0
dt
dt
dt
On peut en dduire la stabilit de l'origine par le Thorme 35. Pour dduire
la stabilit asymptotique, il nous faut utiliser le Thorme 37.
g
Le cas particulier g(x) = R sin x, correspond un pendule de longueur
soumis la gravit, tel que reprsent sur la Figure B.2.
220
ANNEXE B.
Figure B.2 Pendule amorti.
Annexe C
Moyennisation
C.1 Introduction
On suppose ici que les eets rapides ont un caractre oscillant. La mthode de moyennisation a t utilise en mcanique cleste depuis longtemps
pour dterminer l'volution des orbites plantaires sous l'inuence des perturbations mutuelles entre les plantes et tudier la stabilit du systme
solaire. Gauss en donne la dnition suivante qui est des plus intuitives : il
convient de rpartir la masse de chaque plante le long de son orbite proportionnellement au temps pass dans chaque partie de l'orbite et de remplacer
l'attraction des plantes par celle des anneaux de matire ainsi dnis.
Dans ce cadre, les quations non perturbes du mouvement de la terre
sont celles qui ne prennent en compte que la force d'attraction due au soleil.
L'orbite de la terre est alors une ellipse dont le soleil est l'un des foyers. Les
quations perturbes sont celles o l'on rajoute les forces d'attraction entre
la terre et les autres plantes en supposant que ces dernires dcrivent toutes
correspond au
1/1000. L'chelle
des orbites elliptiques selon les lois de Kepler. Le paramtre

rapport de la masse du soleil celles des plantes :
de temps rapide est de l'ordre d'une priode de rvolution, quelques annes.

L'chelle de temps lente est de l'ordre de quelques millnaires. La question
est alors de savoir si ces petites perturbations d'ordre
peuvent entraner
terme, i.e. l'chelle du millnaire, une drive systmatique des longueurs

du grand axe et du petit axe de la trajectoire de la terre, ce qui aurait des
consquences catastrophiques pour le climat. En fait, les calculs (moyennisation) montrent qu'il n'en est rien. En revanche, l'excentricit des orbites
oscille lentement. Ces oscillations inuencent le climat.
221
222
ANNEXE C.
MOYENNISATION
C.2 Le rsultat de base

Considrons le systme
dx
dt
= f (x, z, )
dz
dt
= g(x, z, )
On passe de cette forme la forme
( )
choisie pour noncer le thorme
de Tikhonov (Thorme 15) par un simple changement d'chelle de temps.

On remplace
par
t/.
L'chelle de temps rapide correspond maintenant
d'ordre 1 et l'chelle de temps lente
priode
1/.
de l'ordre de
Le rgime oscillatoire le plus simple pour
est le rgime priodique, de

y=
y1
y2
dy1
dt
= y2
dy2
dt
= g1 (x, y, )
2 2
T
y1 = g2 (x, y, ),
f (x, y(t), ) = f (x, t, ) : f est

priodique (priode T ). Le systme
Sans changer de notation, on pose

en
et dpend de
de faon
rgulire
perturb
s'crit alors
dx
dt
= f (x, t, ), 0 1
(C.1)
Le systme moyenn (ou systme lent) est alors
dz
dt
= T1
RT
0
f (z, t, 0) dt
df
(C.2)
f (z)
Remplacer les trajectoires du systme instationnaire (C.1) par celles du systme stationnaire (C.2), revient alors lisser les trajectoires de (C.1). Comme
pour le thorme 16, si le systme moyen admet un point d'quilibre hyperboliquement stable (les valeurs propres du tangent sont toutes partie relle
strictement ngative) alors le systme perturb oscille lgrement autour de
cet quilibre moyen.
De faon plus rigoureuse, thorme suivant montre qu' un point d'qui-
libre hyperbolique du systme moyen correspond une petite orbite priodique

du systme perturb (C.1) (dmonstration dans [30]).
Thorme 38
(Moyennisation une frquence)
perturb (C.1) avec
z + w(z, t)
de priode
avec
Considrons le systme
rgulire. Il existe un changement de variables,
en
t,
tel que (C.1) devienne
dz
= f (z) + 2 f1 (z, t, )
dt
avec
dnie par (C.2) et
f1
rgulire de priode
en
t.
De plus,
x=
C.2.
(i)
223
LE RSULTAT DE BASE
x(t) et z(t) sont respectivement solutions de (C.1) et (C.2) avec comme

conditions initiales x0 et z0 telles que kx0 z0 k = O(), alors kx(t)
z(t)k = O() sur un intervalle de temps de l'ordre de 1/.
Si z est un point xe hyperbolique stable du systme moyenn (C.2), alors
il existe > 0 tel que, pour tout ]0, ], le systme perturb (C.1) admet une unique orbite priodique (t), proche de z ( (t) = z + O())
et asymptotiquement stable (les trajectoires dmarrant prs de (t)
si
(ii)
ont tendance s'enrouler autour de cette dernire). L'approximation,
O()
prs, des trajectoires du systme perturb (C.1) par celles du
systme moyenn (C.2) devient valable pour
t [0, +[.
Il est instructif de voir comment est construit le changement de coordonnes
x = z + w(z, t) en enlevant x
T en t). On a, d'une part,
des termes oscillants d'ordre
(w
de
priode
dz
w
dz
w
dx
=
+ (z, t) + (z, t)
dt
dt
z
dt
t
et, d'autre part,
dx
= f (z + w(z, t), t, )
dt
Ainsi
1
= I + w
(z, t)
f (z + w(z, t), t, )
z
dz
dt

= f (z, t, 0)
Comme la dpendance en
est
+ O(2 )
T -priodique, il n'est pas possible d'and'ordre 1 en car il n'y a aucune raison pour
de
nuler compltement le terme
w
(z, t)
t
w
(z, t)
t
que la fonction dnie par
f (z, s, 0) ds
0
soit
T -priodique
en temps. En revanche, on peut liminer la dpendance en
. Il sut de poser
Z t

w(z, t) =
f (z, s, 0) f (z) ds
temps du terme d'ordre
en
0
(noter que
est bien de
T -priodique)
pour obtenir
dz
= f (z) + O(2 )
dt
Si cette approximation n'est pas susante, il faut prendre en compte les
termes d'ordre
et liminer leur dpendance en temps par un changement

2
de variable du type x = z + w1 (z, t) + w2 (z, t) avec w1 et w2 T -priodique.
224
ANNEXE C.
MOYENNISATION
C.3 Un exemple classique

Soit l'quation du second ordre suivante :
d2
d
= + (1 2 ) .
2
dt
dt
C'est l'quation d'un pendule pour lequel on a rajout un petit frottement
positif pour les grandes amplitudes (
> 1) et ngatif pour les petites ( < 1).
Mettons d'abord ce systme sous la forme standard
dx
= f (x, t, )
dt
Le terme oscillant vient du systme non perturb
d2
=
dt2
dont les orbites sont des cercles. Les phnomnes lents (chelle de temps
1/)
sont clairement relatifs aux rayons de ces cercles (i.e. les amplitudes des
oscillations). C'est pourquoi il convient de passer en coordonnes polaires
d
= r sin(). Dans ces coordonnes, le systme
en posant = r cos() et
dt
perturb s'crit
dr
dt
= [1 r2 cos2 ()] sin2 ()
d
dt
= 1 + sin() cos()[1 r2 cos2 ()]
est quasiment gal, une constante prs, au temps
t.
On peut crire
dr
dr dt
=
.
d
dt d
Ainsi, on se ramne la forme standard en prenant
comme variable de
temps
[1 r2 cos2 ()] sin2 ()

dr
=
= f (r, , )
d
1 + sin() cos()[1 r2 cos2 ()]
Le systme moyenn est alors
du
= u(4 u2 )
d
8
u = 2 est un point d'quilibre hyperbolique attracteur pour , i.e. t
+. Donc pour susamment petit, l'quation perturbe possde un cycle
C.4.
RECHERCHE D'EXTREMUM (EXTREMUM SEEKING)
225
2
limite hyperbolique attracteur donc l'quation est approximativement +
d 2
= 4 + O().
dt
L'inconvnient principal de la thorie des perturbations est qu'il faut, ds
le dpart, avoir une ide assez prcise de ce que l'on cherche : il convient de
trouver un petit paramtre
et d'isoler la partie rapide du systme. ce
niveau l'intuition physique joue un rle important.
C.4 Recherche d'extremum (extremum seeking)
Figure
C.1 Boucle "extremum seeking" ; pour le systme statique y =

2
n'est pas connue mais uniquement suppose KC , u converge vers
f (u) o f
un minimum local de
l'amplitude
lorsque la pulsation
est choisie assez grande et
assez petite ((k, h) sont deux autres paramtres
> 0).
Pour conduire une optimisation en temps-rel, en ligne et sans modle,

les ingnieurs ont souvent recours une boucle de feedback dcrite sur la
gure C.1. Ce type de boucle est aussi couramment utilis en spectroscopie
pour ajuster, par exemple, la frquence
d'un laser sur une frquence ato-
mique en cherchant le maximum d'un signal de uorescence

fonction
y = f (u),
la
ayant la forme d'une Lorentzienne dont on cherche le maximum :

f (u) = (uup)12 +p2 + p3 avec p1 , p2 , p3 > 0 paramtres inconus et u, l'argument
du maximum de f , tant aussi inconnu.
Les quations associes au schma bloc de la gure C.1 sont
d
v = k sin(t)(f (v + a sin(t)) ),
dt
d
= h(f (v + a sin(t)) ).
dt
Supposons que f admette un minimum local en u = u

, avec l'approximation
f00
2
00
00
f (u) f + 2 (u u) o f = f (
u) et f = f (
u) > 0. Pour v autour de u
226
ANNEXE C.
MOYENNISATION
on a le systme approch (a assez petit) :

00
f
d
2
v = k sin(t) f + (v + a sin(t) u)
dt
2

00
d
f
2
= h f + (v + a sin(t) u)
dt
2
Alors si les gains
(k, a, h, )
sont tels que
ak f00 ,
h
on peut utiliser l'approximation sculaire et prendre la moyenne sur une

priode en temps. Le systme moyen est alors simplement
ak f00
d
v=
(
u v),
dt
2

f00
d
a
2
=h f+
(
u v) +
.
dt
2
2
Ce systme triangulaire converge alors vers l'quilibre hyperbolique v = u

et
af00
= 4 .. Comme u = v + a sin(t) on voit que u converge en moyenne vers
u.
C.5 Boucle verrouillage de phase PLL

On dispose d'un signal d'entre
v(t)
bruit dont on souhaite estimer en
temps rel la frquence : cette dernire se situe autour d'une frquence de
0 > 0. Ainsi on a v(t) = a(t) cos((t)) + w(t) avec |

0 | 0 , a(t) > 0 avec |a|
0 a et w(t) un bruit. L'cart type de w
peut tre bien plus grand que l'amplitude a : le rapport signal sur bruit
rfrence note
peut tre trs dfavorable. Pour ce faire, on dispose de circuits lectroniques
analogiques ou de systmes digitaux, dits de type PLL , qui donnent en

d
: ce type de
temps-rel une estimation non bruite de la frquence d'entre
dt
circuits spcialiss se retrouve dans quasiment tous les systmes lectroniques
de tl-communication (tlphone portable, carte WiFi, bre optique, laser,
horloges atomiques, GPS,....). Les PLL sont aussi utiliss par les physiciens
pour mesurer trs prcisment les constantes fondamentales . Le principe

de fonctionnement des PLL s'analyse trs bien avec la moyennisation une
frquence.
La gure C.2 donne un schma bloc simpli et de principe : chaque bloc
correspond soit un circuit spcique dans le cas d'une PLL analogique, soit
une tape de l'algorithme pour une PLL digitale. La dynamique est rgie
1. PLL pour Phase-Locked Loop.
2. A.L. Schawlow (physicien, prix Nobel 1981 pour ses travaux sur la spectroscopie
laser) disait que pour avoir une mesure trs prcise, il faut mesurer une frquence.
C.5.
227
BOUCLE VERROUILLAGE DE PHASE PLL
Figure C.2 Le schma bloc d'une PLL : la quantit 0 (1 kx) est une
d
du signal d'entre v qui peut tre trs
dt
fortement bruit et dont l'amplitude a n'est pas connue.
estimation ltre de la frquence
par
d
d
x = kf 0 (v(t) sin x),
= 0 (1 kx)
dt
dt
o est un petit paramtre positif, kf et k deux gains positifs. On pose
v(t) = a cos avec dtd = 0 (1 + p) o a > 0 et p sont des paramtres
inconnus mais constants. Comme 2 cos sin = sin( ) + sin( + ), avec
= et = + , le systme
d
= 0 (1 kx),
dt
d
x = kf 0 (a cos sin x),
dt
devient dans l'chelle de temps
d
x = kf
d
a
2
dt
d
= 0 (1 + p)
dt
= 0 (2 + (p kx)))
sin + a2 sin x
,
2 + (p kx)
d
p + kx
=
.
d
2 + (p kx)
Ainsi, on est sous la forme standard du thorme 38 avec
la place de
t.
Le systme moyen est
a
sin x
d
x = kf 2
,
d
2 + (p kx)
On nglige des termes d'ordre
en
d
p + kx
=
.
d
2 + (p kx)
et on prend comme systme moyen :

d
kf a
x=
sin x ,
d
2
2
d

= (p + kx).
d
2
Ce systme s'crit aussi sous la forme d'une seule quation du second ordre
avec
p
/ = kf ka/8
r

d2
2kf d
2p
=
sin
.
d 2
ka d
ak
228
ANNEXE C.
MOYENNISATION
2p
= 2p
On choisit le gain k assez grand pour que < 1. Ainsi on pose sin
ak
ak
] , [. Ce systme admet donc deux points d'quilibre (angle
avec
2 2
dni 2 prs) :

est un col (deux valeurs propres relles de signes opposs)

=
est localement asymptotiquement stable (deux valeurs propres
=
partie relle strictement ngative).
On reprend en partie les arguments utiliss pour le PI avec anti-emballement

(systmes autonomes dans le plan, section 1.3.5). Ici, il faut faire un peu
attention car l'espace des phases est un cylindre et non un plan. Une tude
complte est faite au chapitre 7 de [6]. Nous en rsumons ici les grandes
lignes :
Le calcul de la divergence du champ de vecteur dans les coordonnes
(, =
d
) donne
d
q
2k
kaf < 0.
Les trajectoires sont bornes dans le
cylindre (la vitesse est borne).

Ainsi, il ne peut y avoir au plus qu'une seule orbite priodique et de
plus elle fait un tour autour du cylindre.
Pour
et
kf
assez grands, on a deux points d'quilibre et on n'a pas
d'orbite priodique (bifurcation globale fonde sur l'espace rentrant du
).
k et kf assez
col
Pour
grands
converge donc vers une constante.
C'est le verrouillage de phase : la dirence
entre la phase
de la PLL et
du signal d'entre analyser converge vers une valeur constante

2 prs : = + cte.
d
converge vers dtd , comme dtd = 0 (1 kx), on voit que l'on
Ainsi
dt
d
avec 0 (1 kx).
a une estimation peu bruite de la frquence d'entre
dt
Pour cela, nous n'avons pas eu besoin de connatre prcisment l'amplitude a.
la phase
dnie
Noter que la mme PLL donne, lorsque la frquence reste xe, les modulations
de phase.
Annexe D
Automatique en temps discret
La reprsentation des systmes dynamiques sous forme discrte est souvent ncessaire lorsqu'on doit raliser de manire pratique le contrle avec
un systme numrique d'acquisition, de traitement des donnes et des algorithmes ainsi que leur application. Alors que jusque dans les annes 1960,
les contrleurs utilisaient seulement des composants analogiques, avec des
circuits lectriques assurant les tches de mesure, de calcul et de transmission des ordres vers les actionneurs, aujourd'hui la majorit des systmes de
contrle utilisent des convertisseurs analogiques-numriques , des microprocesseurs, et des convertisseurs numriques-analogiques .
Dans un tel schma, les algorithmes de contrle sont excuts en temps
discret, avec une priodicit (constante) correspondant une frquence choisie en fonction de la ractivit naturelle du systme contrler. On peut
considrer qu'en aronautique, les boucles de guidage-pilotage sont xcutes tous les quelques (10) millisecondes, alors que dans le gnie des procds
de la chimie lourde, les priodes sont plutt de l'ordre de la minute.
Ainsi, dans la chane d'action entourant le systme physique, on a des
signaux numriss utilisables par des microprocesseurs fonctionnant suivant
des cycles d'horloge cadencs une frquence d'chantillonnage
1/Te > 0.
En outre, on doit souvent considrer plusieurs horloges, dont les frquences

n'ont pas ncessairement de multiple commun. Nous laissons volontairement
de ct ces problmes diciles dits de multi-chantillonnage (multirate [3]),
mme s'ils ont une importance pratique certaine.
Dans la suite de ce chapitre, les mesures de signal sont supposes tre
eectues des instants
nTe
n N. Elles vont tre utilises par le contr0, Te ,

1
rsultat de calcul en un temps infrieur Te .
leur prenant la forme d'un algorithme excut chaque pas de temps
2Te ,
... suppos aboutir un
1. la question des problmes engendrs par des temps de calculs excdant
229
Te est discute
230
ANNEXE D.
CNA
contrleur
Figure
AUTOMATIQUE EN TEMPS DISCRET
actionneur
Systme
capteur
CAN
D.1 Schma d'implmentation numrique d'un algorithme de
contrle.
Le rsultat de cet algorithme est ensuite utilis pour actionner un organe de

commande (comme un moteur, une gouverne, etc...).
La description prcdente correspond la Figure D.1. Dans ce schma,
reprsentant une utilisation d'un algorithme de contrle en temps discret
la frquence
1/Te ,
deux lments n'ont pas encore t dcrits.
Le premier bloc est le CNA (convertisseur numrique-analogique ), il s'agit

d'un sous-systme prenant en entre des grandeurs discrtes et les transformant en signal continu. Cette conversion peut se faire suivant la mthode du
bloqueur d'ordre zro
yb (t) = y(nT e) = y[n], nTe t < (n + 1)Te

yb est le signal de sortie en temps continu, y est le signal discret d'entre
et n est la partie entire de t/Te . On peut utiliser d'autres types de bloqueur
pour rendre le signal yb continu, direntiable, ou plus rgulier encore. Ainsi
le bloqueur d'ordre 1 est
yb (t) = y[n] +
t nTe
(y[n] y[n 1]), nTe t < (n + 1)Te
Te
Le second bloc est le CAN (convertisseur analogique-numrique ). Il s'agit

d'un systme ayant en entre un signal en temps continu (comme
demment) et en sortie un signal en temps discret (comme
yb
prc-
prcdemment).
Un autre problme important est que la reprsentation du signal
est faite
en utilisant un nombre ni de bits composant la reprsentation numrique

binaire du signal chantillonn. On pourra se reporter [35] pour une prsentation des direntes technologies de conversion binaire. Laissant volontairement de ct les problmes de reprsentation binaire de grandeurs
valeur relle, il reste se soucier des problmes lis l'chantillonnage une
frquence
1/Te .
dans le cadre d'algorithmes numriquement intensifs comme la Model Predictive Control,

MPC [56]
D.1.
231
THORME D'CHANTILLONNAGE DE SHANNON
D.1 Thorme d'chantillonnage de Shannon

Le thorme de Shannon prcise les liens entre un signal en temps continu
et sa reprsentation chantillonne. Le dernier chapitre de [52] en propose une
dmonstration plus mathmatique. Nous allons la reprendre ici en insistant
sur ses implications en automatique.
Thorme 39
tR
(Thorme de Shannon)
Si le signal en temps continu
ne contient pas de frquence suprieure
y(t),
Hertz, alors il peut tre
reconstruit de manire exacte partir d'chantillons rgulirement espacs de
1/(2B)
secondes (ou moins).
Ce thorme fondamental en thorie de l'information, voir [72], doit tre

compris en dtails pour en saisir la port, et les limitations. Le signal
suppos tre dni pour tout
connus pour tout
n Z.
y(t) est
t R, et les chantillons y[n] sont supposs tre

y(t) est un signal
L'hypothse principale est que
contenu frquentiel born, c.--d. que sa transforme de Fourier
F (t 7 y(t), N ) =
y(t) exp(2iN t)dt
est support born inclus dans
] B, B[
(c.--d. qu'elle est nulle en dehors
de cet intervalle).
L'nonc ne s'applique pas des signaux en temps continu dni seulement sur un intervalle de temps born, car ces signaux ne sont en gnral
pas contenu frquentiel support born . L'hypothse de contenu frquentiel nul en dehors du domaine
] B, B[
peut en pratique tre relche, au
prix d'une reconstruction inexacte due au phnomne de repliement spectral

(aussi appel aliasing ) expos ci-dessous.
Le phnomne d'aliasing peut-tre mis en vidence trs simplement sur un
signal sinusoidal de frquence suprieure
1/(2Te ). Considrons la gure D.2
Si le signal chantillonner est pralablement ltr par un ltre anti-
aliasing ayant pour fonction d'attnuer compltement toute frquence sup-
1/(2Te ) (c.--d. d'avoir un gain nul toutes les frquences au dessus

1/(2Te )), ce signal ltr peut tre en thorie parfaitement reconstruit. Des
rieure
de
ltres de dimension nie peuvent approcher ce ltre anti-aliasing idal. On

peut ainsi utiliser les ltres de Butterworth, ou de Bessel rgls la bonne
frquence [35].
2. on notera la notation trs proche de celle du cours [52] avec la correspondance
F (t 7 y(t), N ) = (Fy)(2N ).
3. Si y est support compact,
alors sa transforme de Fourier est une fonction analy-
tique, et donc ne peut pas tre support compact car sinon elle est nulle, voir [26][31.5.4]
232
ANNEXE D.
16
14
12
10
8
6
4
2
0
Figure
10
12
14
16
18
20
D.2 Apparition du phnomne de repliement spectral lors de
l'chantillonnage d'un signal sinusoidal. Des basses frquences apparaissent

lorsque la frquence d'chantillonnage choisie viole l'hypothse du Thorme 39 de Shannon (courbes du bas).
La formule de reconstruction est la formule de Shannon-Whittaker
y(t) =
+
X
y[n]sinc
n=
(t nTe )
Te
sin(t)
. Cette formule de ret
construction est quivalente au ltrage d'un signal constitu d'impulsions
o sinc est la fonction sinus-cardinal sinc(t)
de Dirac
pondres par les chantillons
y[n]
avec un ltre passe bas idal
(ayant une fonction de transfert rectangle dans le domaine frquentiel) la

frquence
1/(2Te ).
La formule de reconstruction prcdente est convergente sous la condip

tion susante que la suite (y[n])nZ appartient l'espace ` (Z, R)) c.--d.
P
p
nZ (y[n]) < , avec 1 < p < . Elle est aussi convergente si la suite est
constante.
Pour dmontrer le thorme de Shannon, on utilise un rsultat intermdiaire utilisant le lemme suivant (formule de Poisson).
Lemme 5
dans
C)
|y(x)|
y une fonction valeur relle (ou
f , f , f sont sommables et dcroissance

F (t 7 y(t), N ) sa transforme de Fourier.
(Formule de Poisson)
2
de classe C telle que

K
, K > 0. On note
1+x2
Soit
D.1.
233
THORME D'CHANTILLONNAGE DE SHANNON
Alors, on a la formule de sommation de Poisson

+
X
+
X
y[n] =
n=
F (t 7 y(t), k)
k=
Ce rsultat est dmontr dans [68], voir aussi [52] pour un nonc dans
l'espace de Schwartz, et [26] pour un nonc concernant les fonctions de classe
L1 (R).
On utilise ce lemme pour donner une expression simple la fonction
suivante, nomme sommation priodique de la transforme de Fourier de la
fonction
y
+
X
(N ) =
F (t 7 y(t), N k/Te )
(D.1)
k=
En utilisant les proprits usuelles de la transforme de Fourier (modulation
et translation en frquence, voir [52]), on obtient
F (t 7 y(t), N k/Te ) = Te F (t 7 exp(2tN Te )y(tTe ), k)

En utilisant la formule de Poisson du lemme 5, il vient
+
X
(N ) =Te
exp(2nN Te )y(nTe )
n=
+
X
=Te
y[n] exp(2nN Te )
(D.2)
n=
Lorsque
l'hypothse
F (t
7 y(t), N ) est nulle
1
que B <
, la formule
2Te
1
, 1 [, alors, sous
2Te 2Te
(D.1) s'interprte comme une somme
en dehors de
(innie) de fonctions supports disjoints. On peut isoler chaque terme de la

somme en procdant ainsi

F (t 7 y(t), N ) = (N )
1
0
si
|N | < B
sinon
o rect est la fonction nulle partout sauf sur
= (N ) rect(
[1,
1]
N
)
B
o elle vaut
utilisant (D.2), on a alors
F (t 7 y(t), N ) = Te
+
X
n=
exp(2nN Te )y[n]rect(N/B)
1.
En
234
ANNEXE D.
or
1
t nTe
sinc(
), N )
Te
Te
exp(2nN Te )rect(N/B) = F (t 7
comme cela est aisment montr par le calcul.
Ainsi, on a
F (t 7 y(t), N ) = F (t 7
+
X

sinc
n=
t nTe
Te

y[n], N )
d'o l'identication
y(t) =
+
X

sinc
n=
t nTe
Te

y[n]
Ce rsultat ne peut plus tre tabli lorsqu'on a recouvrement des spectres

dans la sommation de Poisson. Des termes additionnels viennent s'ajouter
au signal
y(t),
ce phnomne est dsign aliasing [72].
En pratique, les principaux problmes lis l'chantillonnage sont lis

la violation des hypothses du thorme de Shannon. Pour limiter l'eet
d'aliasing, il est ncessaire de ltrer les signaux avant leur chantillonnage.
Nanmoins, mme si le signal considr
y(t)
satisfait l'hypothse, il advient
souvent que le signal eectivement accessible la mesure, c.--d. la conversion CAN, viole cette hypothse. En eet, les bruits sont souvent spectre
haute frquence et viennent donc se replier en signaux basse-frquence par
le phnomne d'aliasing dcrit prcdemment. Ce phnomne renforce la ncessit de ltrer avec l'chantillonnage.
D.2 Systmes dynamiques en temps discret

Nous reprenons ici pour le temps discret, les notions de stabilit dj
introduites dans le chapitre 1 pour le temps continu et la forme d'tat (1.1) :
d
x = v(x, u, t). Montrons d'abord comment associer une telle forme d'tat
dt
en temps continu, une forme d'tat en temps discret. Pour cela prenons la
priode d'chantillonnage
l'entre
u(t)
Te
et supposons que sur l'intervalle
u[k] (bloqueur d'ordre

Cauchy de kTe (k + 1)Te
soit constante la valeur
Supposons que le problme de
d
x = v(x, u[k], t),
dt
x(kTe ) = x[k]
[kTe , (k + 1)Te [
zro, k entier).
D.2.
235
SYSTMES DYNAMIQUES EN TEMPS DISCRET
soit bien dni (prendre par exemple les hypothses du lemme 1 assurant
l'existence et l'unicit globale en temps). On note alors par
de la solution en
u[k]
et
k.
t = (k + 1)Te .
x[k + 1] est
On voit que
x[k + 1] la valeur
x[k],
une fonction de
On peut donc poser
x[k + 1] = F (x[k], u[k], k)
(D.3)
F . En revanche, si v est une fonction continment drivable de ses arguments, alors F

sera aussi une fonction continment drivable de x[k] et u[k] (cf thorme 2).
x, u, t) = 0),
Si (
x, u) est un point d'quilibre de dtd x = v(x, u, t) (t, v(
alors (
x, u) est un point xe du systme dynamique en temps discret (D.3) :
k, x = F (
x, u, k). La rciproque n'est pas vraie en gnral : un point xe
d
x = v(x, u, t). Il
de (D.3) n'est pas en gnral un point d'quilibre de
dt
d
sut de prendre l'oscillateur harmonique de priode Te ( x1 = 2x2 /Te ,
dt
d
x = 2x1 /Te ) et de remarquer que tout tat x R2 est point xe de F .
dt 2
En gnral, on ne dispose pas de formule explicite pour la fonction
Les analogues en temps discret des dnitions 1 et 2 sont les suivantes :
Dnition 23 (Stabilit (au sens de Lyapounov) et instabilit).
Soit
une dynamique discrte en temps x[k + 1] = F (x[k], k] ayant un point xe

x Rn , i.e., k , x = F (
x, k). Le point xe x est dit stable (au sens de
> 0, il existe > 0 tel que pour

toute condition initiale x[0] vriant kx[0] x
k , la suite des x[k] est
dnie pour tout entier k positif et vrie kx[k] x
k pour tout temps
k 0. S'il n'est pas stable, il est dit instable.
Lyapounov) si et seulement si pour tout
Dnition 24 (Stabilit asymptotique).

nition 23, le point xe
seulement s'il est stable et si, de plus, il existe

telles que
kx[0] xk ,
Avec les notations de la D-
est dit localement asymptotiquement stable si et

convergent vers
>0
lorsque
tel que toutes suites
tend vers
x[k]
+.
x de x[k + 1] = F (x[k]) est localement asympx, si F est une contraction autour de x. Ainsi
Intuitivement un point xe

totiquement stable autour de
la dnition 4 et le thorme 10 admettent eux aussi des analogues en temps

discret.
Dnition 25 (Point xe hyperbolique). Un point xe x de la rcurrence

x[k + 1] = F (x[k])
est continment direntiable de
Rn
hyperbolique si les valeurs propres de la matrice Jacobienne
F
(
x) =
x
sont toutes de normes direntes de
Fi
xj
1.

1i,jn
dans
Rn
est dit
236
ANNEXE D.
Thorme 40 (Stabilit asymptotique locale d'un point xe hyperbolique).

Rn 3 x 7 F (x) Rn continment drivable par rapport x et x Rn
tel que F (
x) = x. Le point xe x de x[k +1] = F (x[k]) est localement asymp-
Soit
totiquement stable (c.f. Dnition 23) si les valeurs propres de la matrice
Jacobienne
F
(
x) =
x
Fi
xj

1i,jn
sont toutes strictement l'intrieur du disque unit du plan complexe. Le
x est instable au sens de Lyapounov si au moins l'une des vaF

leurs propres de la matrice Jacobienne x (
x) est strictement l'extrieure
du disque unit.
point xe
On remarquera que ces conditions susantes de stabilit fondes sur les

valeurs propres de la matrice Jacobienne correspondent celles obtenues en
temps continu (thorme 10) via l'application exponentielle : le demi-plan
complexe partie relle strictement ngative est envoy par l'exponentielle
sur l'intrieur du disque unit. Ainsi pour un systme en temps discret les valeurs propres de la Jacobienne sont appeles multiplicateurs caractristiques
alors que pour un systme en temps continu elles sont appeles exposants
caractristiques.
D.3 Reprsentations externes et internes des

systmes linaires
Dans le domaine discret, les quations de rcurrence (appeles galement
quations aux dirences) remplacent les quations direntielles.
Comme dans le cas du temps continu, les relations entre les entres et les
sorties peuvent tre obtenues soient par une identication entre-sortie, on
parle alors de reprsentation externe, soit en modlisant avec des tats les
quations du fonctionnement du systme, c'est la reprsentation interne.
Le passage de la reprsentation interne externe est direct, travers le
calcul algbrique de la transforme en
z.
Ainsi, au systme 1 seule entre,
et une seule sortie dni par les quations matricielles de rcurrence
x[k + 1] = Ad x[k] + Bd u[k]

y[k] = Cx[k] + Du[k]
Ad
n 1,
o
et
Bd
sont, respectivement, une matrice
n n, n > 0
il correspond la fonction de transfert discrte
H(z) = C(zI Ad )1 Bd + D
(D.4)
(D.5)
et un vecteur
D.3. REPRSENTATIONS EXTERNES ET INTERNES DES SYSTMES LINAIRES237
On peut gnraliser ce calcul aux systmes plusieurs entres et plusieurs
H(z) est une matrice de fonctions de transfert discrtes.

de transfert est calcule partir de la transforme en z
sorties. Dans ce cas,

Cette fonction
des quations de la description interne (D.4) (D.5). Cette transforme est

prsente dans ce qui suit.
Ad , Bd peuvent avoir un lien avec des quations direnX = AX + BU , Y = CX + DU qu'on aura discrtises la priode
d'chantillonnage Te . Ainsi une manire de les discrtiser de manire dite
Les matrices
tielles
exacte (au sens du bloqueur d'ordre 0) est d'utiliser les matrices
Te
Z
Ad = exp(ATe ),
exp(At)Bdt
Bd =
0
Dans la suite, on simpliera la notation
Ad , Bd
pour n'utiliser que
et
dans un cadre discret.
D.3.1 Transforme en z
Considrons un signal en temps continu
aux valeurs
y(t),
pour lequel on s'intresse
y(nTe ) = y[n] aux instants d'chantillonnage nTe , n N.

z du signal y la fonction
On
appelle transforme en
Z(t 7 y(t), z) =
+
X
y(nTe )z
+
X
y[n]z n
(D.6)
n=0
n=0
z
Te . La transformation en z d'un signal
La dernire criture sera prfre dans la suite. Cette fonction de la variable

dpend de la priode d'chantillonnage
n'est pas une bijection (mme si on n'a pas encore prcis d'espace d'arrive
et d'espace de dpart) : tant donne un signal
forme en
y,
il existe une unique trans-
correspondante, mais une innit de signaux continus
image une transforme en
ont pour
donne. En eet, seules les valeurs aux instants
d'chantillonnage dterminent le signal continu antcdent d'une transforme

en
donne.
Une transforme en
dnie par (D.6) est une srie. Nous laissons de
ct les problmes de convergence, comme nous l'avons dj fait pour la

transforme de Laplace, le lecteur intress pourra se reporter [20][Chap.
XVI]. Dans le domaine des signaux chantillonns, les proprits de la transforme en
en font l'quivalent de la transforme de Laplace pour les si-
gnaux en temps continu. Ses proprits principales sont : la linarit (D.7),

la translation par un rel (pour les systmes retard (D.8) ou avance (D.9)),
238
ANNEXE D.
l'homothtie exponentielle (D.10), la drivation (D.11) et la convolution
Z(a1 y1 (.) + a2 y2 (.), z) = a1 Z(y1 (.), z) + a2 Z(y2 (.), z)

Z(t 7 y(t nTe ), z) = z n Z(t 7 y(t), z), n N
Z(t 7 y(t + nTe ), z) = z n Z(t 7 y(t), z)
n1
X
(D.7)
(D.8)
!
y[i]z i
nN
(D.9)
i=0
Z(t 7 exp(at)y(t), z) = Z(t 7 y(t), exp(aTe )z)

Z(t 7 ty(t), z) = Te zZ(t 7 y(t), z)
Enn, on notera que la transforme en
(D.10)
(D.11)
est une isomtrie car elle prserve
l'nergie d'un signal au sens de l'galit de Parseval
+
X
1
y [n] =
2
n=0
z 1 Z(t 7 y(t), z)Z(t 7 y(t), z 1 )dz
est un contour entourant l'origine dans le plan complexe.
D.3.2 Ralisation canonique d'une fonction de transfert

discrte
Une ralisation de l'quation aux dirences
y[k] + a1 y[k 1] + ... + an y[k n] = b1 u[k 1] + ... + bn u[k n]

correspondant la fonction de transfert
G(z) =
b1 z 1 + ... + bn z n
1 + a1 z 1 + ... + an z n
est
Ad =
0
.
.
.
0
an
,
...
0
1
an1 ... a1
..
.
0
1
Cd = (bn , bn1 , ..., b2 , b1 )

D'autres ralisations canoniques peuvent tre considres. De manire
gnrale, soit T une matrice (inversible) de changement de base, le triplet
{T Ad T 1 , T Bd , Cd T } est une ralisation au mme ttre que {Ad , Bd , Cd }.
4. dont certains coecients peuvent tre nuls sans perte de gnralit
D.4.
STABILIT DES SYSTMES LINAIRES STATIONNAIRES
239
D.4 Stabilit des systmes linaires stationnaires

Considrons la fonction de transfert discrte
G(z) =
b0 + b1 z 1 + ... + bn z n
N (z)
=
1
n
1 + a1 z + ... + an z
D(z)
En soumettant le signal des signaux d'entre (y compris des conditions

initiales par exemple), on engendre des signaux de sortie qui peuvent se
calculer explicitement travers une dcomposition en lments simples de
la fraction rationnelle obtenue et identication de la transforme inverse de
chaque terme, pour obtenir une description complte de la sortie au cours du
temps (continu). Le comportement asymtotique de la solution, c.--d. lorsque
le temps tend vers l'inni, est dni comme suit.
Dnition 26. Un point d'quilibre x de l'quation aux dirences x[k +1] =

Ax[k]
est asymptotiquement stable si, pour toute condition initiale
solution
x[k]
tend vers
si
x[k]
k +. Le point est instable

kx[k]k + lorsque k +. Il
lorsque
une condition initiale telle que
x0 ,
la
s'il existe
est stable
reste born.
Il apparat la condition ncessaire et susante suivante.
Thorme 41 (Stabilit en temps discret [50]).
Une condition ncessaire et
x[k + 1] =
de A soient
susante pour qu'un point d'quilibre de l'quation aux dirences
Ax[k]
soit asymptotiquement stable est que les valeurs propres
toutes l'intrieur (strict) du cercle de rayon 1 ayant l'origine pour centre.

Si une valeur propre est en dehors de ce cercle, alors le systme est instable.
Comme dans le cas des systmes en temps continu, on dispose d'un rsultat permettant de tester le fait que les racines d'un polynme satisfont les
proprits requises pour les conditions ncessaires de stabilit asymptotique.
Thorme 42
(Critre de Jury,[16])
a1 z n1 + ... + an
avec
a0 > 0.
Ligne 1
Ligne 2
Ligne 3
Ligne 4
Ligne 5
Soit un polynme
On forme le tableau
a0 a1 ... ... an
a
n an1 ... ... a0
b0 b1 ... bn1 0
= Ligne 1 aan0 Ligne 2
bn1 bn2 ... b0 0
c0 c1 ... cn2 0 0
= Ligne 3 bn1
Ligne 4
b0
Ligne 6
..
.
Ligne
2n+1
...
w0
0 ... 0
P (z) = a0 z n +
240
ANNEXE D.
Une condition ncessaire et susante pour que les racines de
P (z)
soient
toutes (strictement) l'intrieur du cercle de rayon 1 ayant l'origine comme

centre est que tous les lments de
(a0 , b0 , ..., w0 )
soient strictement positifs.
D.5 Commandabilit linaire en temps discret

Considrons maintenant l'quation aux dirences o intervient la commande
x[k + 1] = Ax[k] + Bu[k]
(D.12)
A est une matrice de dimension n n et B est une matrice

n m. Comme on va le voir, il faut distinguer, sauf dans le
o
de dimension
cas o
est
inversible, la notion de commandabilit (possibilit d'aller de n'importe quel

tat
0)
de l'atteignabilit (possibilit d'aller de
Dnition 27
n'importe quel tat).
(Commandabilit en temps discret)
Le systme en temps
x0 , il existe
discret (D.12) est dit commandable, si quel que soit l'tat initial
une squence de commande
u[0], u[1],..., u[n 1]
qui permet d'atteindre l'tat
0.
Dnition 28
Le systme en temps disf

cret (D.12) est dit atteignable, si quel que soit l'tat nal dsir x , il existe
(Atteignabilit en temps discret)
une squence de commande

0 l'tat xf .
u[0], u[1],..., u[n1] amenant le systme initialis
en
Par un simple calcul, on tablit la relation gnrale entre un tat initial
, une squence de commande
au bout de
u[0], u[1], ..., u[n 1]
et le point atteint
x[k]
itrations.
x[n] = An x[0] + [B, AB, ..., An1 B] [u[n 1], ..., u[0]]T
= An x[0] + C [u[n 1], ..., u[0]]T
o
est la matrice de commandabilit de la paire
(D.13)
(A, B) dj rencontre la
Proposition 6. En prenant comme inconnue la squence de commande dans

la dernire quation, on tablit directement le rsultat suivant (voir [38]).
Proposition 10
(Atteignabilit et commande en boucle ouverte atteignant
un point arbitraire en temps ni)
Soit un systme discret
x[k + 1] = Ax[k] +
Bu[k] avec dim x = n. Ce systme est atteignable si et seulement si la matrice

C = [B, AB, ..., An1 B] est de rang plein. Soit xf un point arbitraire qu'on
souhaite atteindre. La commande en boucle ouverte
[u[n 1], ..., u[0]]T = C 1 (xf An x[0])

permet de faire transiter en exactement
itrations le systme de
x[0]
xf .
D.5.
241
COMMANDABILIT LINAIRE EN TEMPS DISCRET
Si on souhaite que le systme atteigne l'tat
0, la condition que la matrice
C est de rang plein est une condition susante mais pas

C peut tre singulire si A est nilpotente, et dans ce cas, la
commande u = 0 sut a atteindre 0. Ainsi la proprit de commandabilit
dans le cas discret n'est pas quivalente au fait que la matrice C est de rang
de commandabilit
ncessaire. Ainsi
plein.
n 0
La condition ncessaire de commandabilit est que A x doit appartenir
n1
l'espace engendr par les vecteur B, AB, ..., A
B qui est l'espace accessible
la commande. Si
est inversible, on peut r-crire (D.13) sous la forme
An x[n] = x[0] + An C [u[n 1], ..., u[0]]T

En considrant la squence de commande comme inconnue dans cette dernire quation, on voit que dans ce cas, la commandabilit est quivalente au
n
fait que la matrice A
C soit de rang plein, ce qui est quivalent ce que C
soit de rang plein.
D.5.1 Placement de ples

Considrons l'quation aux dirences o intervient la commande
x[k + 1] = Ax[k] + Bu[k]

o
est une matrice de dimension
nn
et
est un vecteur de dimension
n. Comme dans le cas continu, il est possible lorsque le systme est commandable, de choisir le polynme caractristique det(zI A + BK) de A BK
en le choisissant gal un polynme P (z) librement choisi (de premier terme
n
normalis z ). Ceci est ralis en choisissant le gain K d'aprs la formule
d'Ackermann (qui sert galement dans le cas continu)
K = [0, ..., 0, 1] C 1 P (A)
D.5.2 Rendre une matrice nilpotente par feedback

Pour stabiliser asymptotiquement le systme (commandable) il est sufsant de rendre la matrice
A BK
nilpotente. Ainsi, quelle que soit la
condition initiale, le systme atteint le point
en au plus
itrations.
Pour raliser ceci, il sut d'utiliser la formule d'Ackermann avec
. Ainsi un gain qui rend la matrice
A BK
P (z) =
nilpotente est

1
K = [0, ..., 0, 1] C 1 An = [0, ..., 0, 1] An B, ..., A1 B
aprs simplication.
242
ANNEXE D.
D.5.3 Synthse d'une commande pour aller en temps

ni un point d'quilibre arbitraire
En utilisant le rsultat prcdent, il est ais de calculer une loi de feedback
f
permettant d'atteindre en un nombre ni d'itrations un point d'quilibre x
arbitrairement choisi. Ceci rsoud le problme de planication de trajectoires
f
A ce point d'quilibre il correspond une commande d'quilibre u solution de
l'quation
xf = Axf + Buf
En utilisant le contrleur
prcdent, on forme la commande
u = K(x xf ) + uf
(D.14)
Ce qui donne l'quation aux dirences
x[k + 1] = Ax[k] BK(x[k] xf ) + Buf

d'o, aprs factorisation, et en utilisant (D.14),
(x[k + 1] xf ) = (A BK)(x[k] xf )
La matrice (A BK) tant nilpotente, grce au choix de K , on atteint donc
xf en au plus n intrations, quelle que soit la condition initiale. Ceci tablit
le rsultat suivant.
Proposition 11 (Commande en feedback atteignant un point d'quilibre en

temps ni). Soit un systme discret x[k + 1] = Ax[k] + Bu[k] atteignable avec
dim x = n.
Soit
xf
uf
u=
un point d'quilibre qu'on souhaite atteindre, et soit
la commande d'quilibre correspondante. La commande en boucle ferme

1
K(x xf ) + uf o K = [0, ..., 0, 1] [An B, ..., A1 B] permet d'atteindre
f
le point x en au plus n itrations.
D.5.4 Commande linaire quadratique LQR en temps

discret
Tout comme dans le cas continu, il est intressant de planier des transitoires optimaux entre deux points de l'espace d'tat, ainsi que de calculer
des rgulateurs stabilisants optimaux au sens d'un critre quadratique. On se
reportera 3.4 pour des explications gnrales sur la formulation du critre
et l'obtention des quations de stationnarit qui permettent de caractriser
la solution. Nous donnons ici la solution dans le cas du temps discret.
D.5.
COMMANDABILIT LINAIRE EN TEMPS DISCRET
243
Proposition 12 (Commande quadratique en temps discret). Soit un systme

discret x[k+1] = Ax[k]+Bu[k],
x0 . Soit le critre minimiser
dim x = n, dim u = 1, et sa condition initiale
JN = x [N ]Sf x[N ] +
N
1
X
x [i]Rx[i] +
N
1
X
i=1
avec
N > 0, Sf
et
uT [i]Qu[i]
i=0
matrices symtriques positives,
matrice symtrique
dnie positive. La loi de commande minimisant ce critre est la loi de feedback
u[i] = K[i]1 k[i]x[i]

avec
k[i 1] = B T S[i]A,
K[i] = Q + B T S[i]B
S[i 1] = AT S[i]A + R k[i 1]T K[i]1 k[i 1],
S[N ] = Sf
et le cot optimal associ est
i = N, ..., 0
(x0 )T S[0]x0 .
Les formules permettant de calculer le gain optimal et la commande en

boucle ferme sont, comme dans le cas du temps continu, des formules en
temps rtrograde.
Le passage la limite lorsque
N , l'horizon temporel sur lequel est formul
le critre, tend vers l'inni est trait par le rsultat suivant
Proposition 13 (Rgulateur LQR en temps discret). Soit un systme discret

x[k + 1] = Ax[k] + Bu[k], dim x = n, dim u = 1,
et sa condition initiale
x0 .
Soit le critre minimiser
J=
+
X
xT [i]Rx[i] +
i=1
avec
N > 0, Pf
et
+
X
uT [i]Qu[i]
i=0
matrices symtriques positives,
matrice symtrique
dnie positive. La loi de commande minimisant ce critre est la loi de feedback
u[i] = (B T SB + Q)1 B T SA x[i]

o S est l'unique solution stabilisante
T
de
0 = S A SA + A SB(B SB + Q) B T SA R
244
ANNEXE D.
( quation algbrique de Riccati en temps discret pour laquelle l'existence

et l'unicit d'une solution stabilisante est garantie sous des hypothses de
commandabilit et d'criture du critre semblables au cas en temps continu
1/2
du Thorme 26, i.e. (A, R
) observable)) et le cot (optimal) associ est
0 T
0
(x ) S[0]x .
D.6 Observabilit linaire, estimation et ltrage

De mme qu'en ce qui concerne la commande, certaines subtilits apparaissent dans le domaine de la reconstruction d'tat partir des mesures
lorsqu'on considre un systme sous sa forme en temps discret. Ainsi, on
doit distinguer la proprit d'observabilit et celle de reconstructibilit d'un
systme (voir ci-dessous).
Considrons l'quation aux dirences, o intervient la mesure
y de l'tat x
x[k + 1] = Ax[k] + Bu[k]

y[k] = Cx[k]
A est une matrice de
n m, et C une matrice
o
Dnition 29
n n, B
dimension p n.
dimension
de
x[k] d'aprs les mesures

u[k], ..., u[k + n 2] futures.
univoque l'tat
commandes
Dnition 30
est une matrice de dimension
(Observabilit en temps discret)
cret (D.15) est dit observable, si, pour tout
k,
(D.15)
Le systme en temps dis-
on peut dterminer de manire
futures
y[k], ..., y[k + n 1]
(Reconstructibilit en temps discret)
et les
Le systme en temps
k , on peut dterminer de
x[k] d'aprs les mesures passes y[k n + 1], ..., y[k]
u[k n + 1], ..., u[k 1] passes.
discret (D.15) est dit reconstructible, si, pour tout

manire univoque l'tat
et les commandes
La constructibilit n'implique pas l'observabilit, on peut trouver des

contre-exemples simples dans [38].
Considrons les quations suivantes, obtenues par un calcul direct depuis
un indice
quelconque.
y[k] = Cx[k]
y[k + 1] = C(Ax[k] + Bu[k])
y[k + 2] = C(A2 x[k] + ABu[k] + Bu[k + 1])
.
.
.
y[k + n 1] = C(An1 x[k] + An2 Bu[k] + ... + Bu[k + n 2])
D.6.
OBSERVABILIT LINAIRE, ESTIMATION ET FILTRAGE
245
Il vient, en regroupant, sous la forme de vecteurs :
0
CB
CAB
y[k]
.
.
=
Ox[k]
+
y[k + n 1]
.
.
.
n2
CA
o
... ...
0 ...
CB
..
0
0
0
u[k]
.
.
u[k + n 2]
est la matrice d'observabilit de la paire
CB
(A, C)
dj rencontre dans
le cas du temps continu au Thorme 28. Dans cette dernire quation, il

apparat directement le rsultat suivant
Proposition 14 (Observabilit et reconstructibilit).
Soit un systme x[k +

dim x = n. Ce systme est observable
n1
d'observabilit O = [C; CA; ...; CA
] est de
1] = Ax[k] + Bu[k], y[k] = Cx[k]

si et seulement si la matrice
avec
rang plein. Ce systme est reconstructible si la matrice d'observabilit est de

rang plein.
Comme ceci est prcis dans [38], les proprits de commandabilit et
de reconstructibilit sont duales, de mme que celle d'atteignabilit et et
d'observabilit.
D.6.1 Filtre de Kalman en temps discret

Lorsqu'on cherche eectivement reconstruire l'tat partir de la connaissances des entres et des sorties du systme, on peut le faire par un observateur asymptotique, en utilisant, par dualit avec les problmes de commande,
les thormes de placement de ples, o invoquer un principe d'optimalit
pour prendre en compte au mieux les incertitudes sur le modle, les entres
et sur les mesures. Comme dans le cas du temps continu, l'outil permettant ce ltrage optimal au sens stochastique est le ltre de Kalman qui est
implment, dans le cas considr, sous forme d'quations aux dirences.
Proposition 15
(Filtre de Kalman en temps discret)
Soit un systme
x[k + 1] = Ax[k] + Bu[k] + D[k], y[k] = Cx[k] + [k], initialis en une

0
variable alatoire x , o est un bruit gaussien centr de matrice de covaj
riance cov([k], [j]) = k M , et est un bruit gaussien centr indpendant
j
de de matrice de covariance cov([k], [j]) = k M . Le ltre de Kalman
reconstruit, travers les quations de propagation et de recalage qui suivent
x de l'tat x. Notons xp [k] l'tat des quations de propagation,

des quations de recalage, ainsi que p [k] et r [k] les matrices
une estimation
et
xr [k]
l'tat
246
ANNEXE D.
de covariance pour les tapes de propagation et de recalage, respectivement.

Au cours des itrations, l'estimation recherche de
(
Initialisation
(
Propagation
x[k]
est simplement
xp [0] = xr [0] = E(x0 )

p [0] = r [0] = var(x0 )
xr [k].
(D.16)
xp [k + 1] = A
xr [k] + Bu[k]
p [k + 1] = Ar [k]AT + DM DT
1
T
T
C
[k
+
1]C
+
M
K
=
[k
+
1]C
xr [k + 1] = xp [k + 1] + K(y[k + 1] C xp [k + 1])
Recalage
1
r [k + 1] = p [k + 1]1 + C T M1 C
(D.17)
(D.18)
Ces formules sont celles usuellement considres (voir [69]) Avantageusement, on pourra remplacer la dernire formule dans l'quation de recalage
par l'une ou l'autre des deux quations suivantes (formule de Joseph [14, 23])
obtenue par la formule de Sherman-Morrison-Woodbury applique l'inverse
1
de la matrice p [k + 1]
+ C T M1 C
r [k + 1] = p [k + 1] p [k + 1]C T Cp [k + 1]C T + M
1
Cp [k + 1]
qui se rcrit encore
r [k + 1] = (In KC)p [k + 1](In KC)T + KM K T

qui garantit que la mise jour
positive ds lors que
p [k + 1]
r [k + 1]
l'est.
est une matrice symtrique dnie
Bibliographie
[1] M. Abramowitz and I.A. Stegun. Handbook of Mathematical Functions.

Dover, New York, 1965.
[2] M. J. Abzug and E. Eugene Larrabee.
Airplane stability and control.
Cambridge Aerospace Series. Cambridge University Press, 2002.

[3] Hamed M. Al-Rahmani and Gene F. Franklin. Techniques in multirate
digital control.
In C.T. Leondes, editor, Digital Control Systems Im-
plementation Techniques, volume 70 of Control and Dynamic Systems,

pages 1 24. Academic Press, 1995.
[4] V. Alexeev, E. Galeev, and V. Tikhomirov. Receuil de Problmes d'Op-
timisation. Editions Mir, Moscou, 1987.

[5] B.D.O. Anderson, R.R. Bitmead, C.R. Johnson, P.V. Kokotovic, R.L.
Kosut, I.M.Y. Mareels, L. Praly, and B.D. Riedle. Stability of adaptive
systems : Passivity and averaging analysis. MIT Press, 1986.

[6] A. Andronov, S. Khaikin, and A. Vitt. Theory of Oscillators. Dover,
1987. English Translation.
[7] A. Angot. Complments de mathmatiques. Editions de la revue d'optique, Paris, third edition, 1957.
[8] W. F. III Arnold and A. J. Laub. Generalized eigenproblem algorithms
and software for algebraic Riccati equations. Proc. IEEE, 72 :17461754,
1984.
[9] M. Athans. The Control Handbook, chapter Kalman ltering, pages 589
594. CRC Press and IEEE Press, 1996.
[10] R. Bellman and K. L. Cooke. Modern elementary dierential equations.
Addison-Wesley, 1971.
[11] J. T. Betts. Practical Methods for optimal control using nonlinear pro-
gramming. Advances in Design and Control. Society for Industrial and

Applied Mathematics (SIAM), Philadelphia, PA, 2001.
[12] F. Brauer and J. A. Nohel. The qualitative theory of ordinary dierential
equations. W. A. Benjamin, Inc., New York, 1969.

247
248
BIBLIOGRAPHIE
[13] A. E. Bryson and Y. C. Ho. Applied Optimal Control. Ginn and Company, 1969.
[14] R. S. Bucy and P. D. Joseph.
Filtering for stochastic processes with
applications to guidance. Interscience, 1968.

[15] H. Cartan.
Thorie lmentaire des fonctions analytiques.
Hermann,
1961.
[16] C.-T. Chen. Signals and Systems. Oxford University Press, 2004.
[17] K. L. Chien, J. A. Hrones, and J. B. Reswick. On the automatic control
of generalized passive systems. Transactions ASME, 74 :175185, 1952.
[18] G. H. Cohen and G. A. Coon.
Theoretical consideration of retarded
control. Trans. A.S.M.E., Vol. 75(No. 1) :pp. 827834, 1953.

[19] R. F. Curtain and H. J. Zwart. An Introduction to innite-Dimensional
Linear Systems Theory.
Text in Applied Mathematics, 21. Springer-
Verlag, 1995.
[20] R. Dautray and J.-L. Lions. Analyse mathmatique et calcul numrique
pour les sciences et les techniques, volume 7. Masson, 1988.

[21] M. Demazure.
Bifurcations and Catastrophes. Universitext. Springer,
2000.
[22] V. Ditkin and A. P. Prudnikov. Formulaire pour le calcul oprationnel.
Masson et Cie., 1967.
[23] P. Faurre. Navigation inertielle et ltrage stochastique. Mthodes mathmatiques de l'informatique. Dunod, 1971.
[24] F.R. Gantmacher. Thorie des Matrices : tome 1. Dunod, Paris, 1966.
[25] F.R. Gantmacher. Thorie des Matrices : tome 2. Dunod, Paris, 1966.
[26] C. Gasquet and P. Witomski. Analyse de Fourier et applications. Masson, 1990.
[27] J.P. Gauthier and I. Kupka.
Deterministic Observation Theory and
Applications. Cambridge University Press, 2001.

[28] C. Godbillon.
Gomtrie direntielle et mcanique analytique.
Her-
mann, Paris, 1969.

[29] K. Gu, V. L. Kharitonov, and J. Chen. Stability of time-delay systems.
Birkhuser, 2003.
[30] J. Guckenheimer and P. Holmes.
Nonlinear Oscillations, Dynamical
Systems and Bifurcations of Vector Fields. Springer, New York, 1983.

[31] J. K. Hale and S. M. Verduyn Lunel. Introduction to functional die-
rential equations. Springer-Verlag, 1993.
249
BIBLIOGRAPHIE
[32] S.
Haroche.
priences,
Contrle
2004.
de
Notes
la
de
dcohrence
cours,
thorie
Collge
de
et
ex-
France.
http ://www.lkb.ens.fr/recherche/qedcav/college/college.html.
[33] P. Hartman. Ordinary Dierential Equations. Birkuser, Boston, 1982.
[34] M.W. Hirsch and S. Smale. Dierential Equations, Dynamical Systems
and Linear Algebra. Acamedic Press : New-York, 1974.

[35] P. Horowitz and H. Wineld. The art of electronics. Cambdrige University Press, 2 edition, 1989.
[36] W. Hurewicz. Lectures on ordinary dierential equations. Dover Phoenix
Editions, 1990.
[37] J. Istas. Introduction aux modlisations mathmatiques pour les sciences
du vivant. Number 34 in Mathmatiques & Applications. Springer, 2000.

[38] T. Kailath. Linear Systems. Prentice-Hall, Englewood Clis, NJ, 1980.
[39] R. E. Kalman and R. S. Bucy. New results in linear ltering and prediction problems. ASME Journal of Basic Engineering, pages 95108,
1961.
[40] H.K. Khalil. Nonlinear Systems. MacMillan, 1992.
[41] M. Krsti, I. Kanellakopoulos, and P.V. Kokotovic. Nonlinear and Adap-
tive Control Design. J. Wiley, New-York, 1995.

[42] O. Latte. Distributions et applications. Cours et exercices, cole Nationale Suprieure des Mines de Paris, 2005.
[43] C. Lanczos. Linear Dierential Operators. Dover Publications, 1997.
[44] L. Landau and E. Lifshitz. Mcanique. Mir, Moscou, 4th edition, 1982.
[45] Y. Lee, S. Park, M. Lee, and C. Brosilow.
PID controller for desired
closed-loop responses for SI/SO systems. AIChE Journal, Vol. 44(No.

1) :pp. 106115, 1998.
[46] W. Leonhard. Control of Electrical Drives. Elsevier, 1985.
[47] W. S. Levine. The Control Handbook. CRC Press and IEEE Press, 1996.
[48] J. Ligou.
Introduction au gnie nuclaire.
Presses Polytechniques et
Universitaires Romandes, 2 edition, 1997.

[49] W. Lohmiler and J.J.E. Slotine. On metric analysis and observers for
nonlinear systems. Automatica, 34(6) :683696, 1998.
[50] D. G. Luenberger. Introduction to Dynamic Systems : Theory, Models,
and Applications. John Wiley & Sons, 2 edition, 1979.

[51] F. Maisonneuve. Calcul direntiel. Cours et exercices, cole Nationale
Suprieure des Mines de Paris, 2006.
250
BIBLIOGRAPHIE
[52] F. Maisonneuve.
Calcul intgral.
Cours et exercices, cole Nationale
Suprieure des Mines de Paris, 2006.

[53] F. Maisonneuve. Fonctions d'une variable complexe. Cours et exercices,
cole Nationale Suprieure des Mines de Paris, 2006.
[54] I. Mareels, S. Van Gils, J. W. Polderman, and A. Ilchmann. Asymptotic
dynamics in adaptive gain control. In P. M. Frank, editor, Advances in
Control, Highlights of ECC'99, pages 391449. Springer, 1999.

[55] Ph.
Martin,
equivalence
R.
and
Murray,
trajectory
and
P.
Rouchon.
generation,
2003.
Flat
systems,
Technical
Report
http://www.cds.caltech.edu/reports/.
[56] D. Q. Mayne, J. B. Rawlings, C. V. Rao, and P. O. M. Scokaert.
Constrained model predictive control : stability and optimality.
Au-
tomatica, 36 :789814, 2000.

[57] M. B. Milam.
Real-time optimal trajectory generation for constrained
systems. PhD thesis, California Institute of Technology, 2003.

[58] R. Murray, Z. Li, and S. Sastry. A Mathematical Introduction to Robotic
Manipulation. CRC Press, 1993.

[59] N. E. Nahi. Estimation theory and applications. John Wiley & Sons,
Inc., 1969.
[60] Z. J. Palmor.
Stability properties of Smith dead-time compensator
controller. Int. J. Control, 32(6) :937949, 1980.

[61] N. Petit. Optimisation. Notes de cours, cole Nationale Suprieure des
Mines de Paris, 2004.
[62] W. J. Rugh and J. S. Shamma. Research on gain scheduling. Automatica,
36 :14011425, 2000.
[63] R. Sepulchre, M. Jankovi, and P. Kokotovi.
Constructive nonlinear
control. Springer Verlag, 1997.

[64] G. J. Silva, A. Datta, and S. P. Bhattacharyya.
PID controllers for
time-delay systems. Birkhuser, 2005.

[65] L. Singre. Etude des instabilits dans les puits activs par gas-lift. PhD
thesis, cole des Mines de Paris, 2006.
[66] O. J. M. Smith.
Closer control of loops with dead time.
Chemical
Engineering Progress, 53(5) :217219, 1958.

[67] E. Sontag. Mathematical Control Theory. Springer Verlag, 1990.
[68] E. M. Stein and G. Weiss. Introduction to Fourier Analysis on Euclidean
Spaces. Princeton University Press, 1971.
BIBLIOGRAPHIE
251
[69] R. F. Stengel. Optimal control and estimation. Dover Publications, 1994.

[70] K. J. +strm and T. Hgglund. PID Controllers : Theory, Design, and
Tuning. Instrument Society of America, 1995.

[71] A. Tikhonov, A. Vasil'eva, and A. Sveshnikov. Dierential Equations.
Springer, New York, 1980.
[72] M. Unser. Sampling-50 years after Shannon. Proceedings of the IEEE,
88(4) :569 587, 2000.
[73] K. Yosida. Operational Calculus. Springer, Berlin, 1999.
[74] J. G. Ziegler and N. B. Nichols. Optimum settings for automatic controllers.
Trans. A.S.M.E., Vol. 64 :pp. 759765, 1942.
Available from
www.driedger.ca.
[75] J. G. Ziegler and N. B. Nichols. Process lags in automatic-control circuits. Transp. A.S.M.E., Vol. 65 :pp. 433444, 1943.
252
BIBLIOGRAPHIE
Index
anti-windup, 55, 58
commande linaire quadratique en temps

discret, 243
approximation adiabatique, 46
commande linaire quadratique, 120,
approximation quasi-statique, 46
143, 145
approximation sculaire, 46
atome trois niveaux, 124
commande LQR, 143, 153
atteignabilit en temps discret, 240
commande LQR en temps discret, 243
attracteur, 33
commande modale, 188

consigne, 55
backstepping, 170
contrleur P, 100
bassin d'attraction, 49, 217
contrleur PI, 53, 87, 98
bouclage dynamique, 61
contraction, 202
bouclage statique rgulier, 134, 136
contrainte nale, 153
boucle ferme, 61
contrle en boucle ferme, 123
boucle ouverte, 61
contrle en boucle ouverte, 122

contrle hirarchis, 74
calcul direntiel intrinsque, 166
convergence exponentielle, 21, 157
capteurs logiciels, 174
convertisseur analogique-numrique, 229,

230
centre, 23
convertisseur numrique-analogique, 229,
champs de vecteurs, 39, 166
230
CNS de stabilit asymptotique d'un

systme linaire stationnaire,
critre d'atteignabilit en temps discret, 240
19
CNS de stabilit d'un systme linaire
critre d'observabilit en temps discret, 245
stationnaire, 21
col, 23
critre de Bendixon, 40
commandabilit en temps discret, 240
critre de Jury, 239
commandabilit, 119, 129, 143
critre de Nyquist, 94, 99
commandabilit linaire, 131
critre de Routh, 26
commandabilit non linaire, 128
critre du revers, 98
commande, 7
critre d'observabilit, 184
commande adaptative, 30, 199, 201
critre de commandabilit, 135
commande en boucle ferme, 123
crochet de Lie, 166
commande en boucle ouverte, 129
cycle limite, 39, 41, 42
253
254
INDEX
dpendance de la solution en la condition initiale, 13

distinguabilit, 179
fonction de transfert, 81, 86

fonction mromorphe, 94
fonction non borne radialement, 32,
34, 218
ensemble positivement invariant, 33,

64, 216, 218, 219
entre, 7
entrelacement, 25
fonctions mromorphes, 94
forme d'tat, 61
forme canonique d'un systme linaire,
24, 25
equation algbrique de Riccati en tempsforme d'tat, 7, 86

discret, 244
forme d'tat canonique, 89
quation de Lyapounov, 29, 193
forme d'tat canonique minimale, 87
quation de Riccati algbrique, 157,
forme de Brunovsky, 119, 136, 141,
158, 160, 161
143, 165, 188
quation de sortie, 8
forme de Jordan, 19
quation direntielle de Riccati, 151,
forme normale, 136
153, 154, 158

quivalence statique, 164
forme standard du thorme de Tikhonov, 49
estimation, 176, 182
formule de Joseph, 246
tat, 7
formule de Poisson, 232
tat, 60
formule de reconstruction de Shannon-
tat adjoint, 150, 151

excitation sinusodale, 83
existence d'une solution au problme
de Cauchy, 211
Whittaker, 232
formule de Sherman-Morrison-Woodbury,
246
foyer instable, 23, 42
existence et unicit des solutions d'une foyer stable, 23

quation direntielle, 12
frquence d'chantillonnage, 229
exponentielle de matrice, 18
fraction rationnelle causale, 86
exposants caractristiques, 38
fraction rationnelle propre, 86
facteur d'amortissement, 74
gain d'anti-emballement, 63
feedback, 8, 55, 119, 123
gain intgral, 57
feedback optimal, 153

feedforward, 55, 70, 72, 73, 140, 154
ltrage, 176
ltrage de consigne, 71
ltre de Kalman, 173
ltre de Kalman en temps discret, 245
fonction Lipschitz, 209
identication, 176
indices de commandabilit, 135, 136
intgrale premire, 129, 131, 132, 134
intgrale premire triviale, 131
invariance de LaSalle, 33, 219
invariant chimique, 130
fonction Lipschitz vectorielle, 209
Lagrangien, 147, 148
fonction de transfert, 80
lieu de Nyquist, 99, 100, 102, 105, 107,
fonction de Lyapounov, 33, 215, 218
162, 163
255
INDEX
linarisation par bouclage dynamique,

169
linarisation par injection de sortie,
201
loi d'Arrhenius, 130
marge de gain, 105, 106
marge de phase, 102, 104
marges de robustesse, 79, 94
marges de stabilit du rgulateur LQR,
161
matrice d'observabilit, 245
matrice d'observabilit, 184
matrice de commandabilit, 240
matrice de commandabilit, 132136
matrice de transfert, 86
matrice de transition, 193
matrice Hurwitz, 25, 29, 49, 141
mesure, 8
moteur courant continu, 175
moyennisation, 46, 222
multiplicateurs de Lagrange, 146
nud instable, 23, 42
nud stable, 23
observabilit en temps discret, 244
observabilit, 175
perturbation, 61
perturbations singulires, 46
phnomne d'aliasing, 231
pic de rsonance, 84
placement de ples en temps discret,
241
placement de ples, 120, 142, 157, 186
placement de ples pour l'observateur,
177
plan de phases, 22, 64
planication de trajectoire en temps
discret, 242
planication de trajectoires, 119122,
128, 129, 142, 153, 156
point d'quilibre, 9
point d'quilibre asymptotiquement stable, 79
point d'quilibre globalement asymptotiquement stable, 16, 19, 34,
217
point d'quilibre hyperbolique, 30, 42,
52, 222, 224
point d'quilibre instable, 15
point d'quilibre localement asymptotiquement stable, 15, 31
point d'quilibre stable (au sens de
Lyapounov), 15
observabilit globale, 179
point xe, 235
observabilit locale, 180, 181
point xe localement asymptotique-
observable, 156
ment stable, 235
observateur, 8, 182
point xe hyperbolique, 235
observateur asymptotique, 175, 176,
point xe instable, 235
186
observateur rduit de Luenberger, 187
observateur-contrleur, 175, 187, 188
orbite htrocline, 39
point xe localement asymptotiquement stable, 236

point xe stable (au sens de Lyapounov), 235
orbite homocline, 39
point stationnaire, 9
orbite priodique, 41
ple, 82
oscillateur de Van der Pol, 44
ple d'une fonction mromorphe, 94
oscillateur harmonique, 16
ple instable, 95
oscillateurs, 120
ples d'une fonction de transfert, 86
256
INDEX
ples dominants, 107, 108
retour de sortie, 8
polynme caractristique, 19, 24, 25
retour dynamique de sortie, 91
polynme Hurwitz, 25
rtro-action, 8
portrait de phases, 2224
robuste, 37
prdicteur de Smith, 114, 115
robustesse, 79, 80, 115
principe de superposition, 9
robustesse au retard, 108
principe de sparation, 174, 188
robustesse par rapport aux dynamiques
problme de Cauchy, 11, 12

problme aux deux bouts, 150, 151
ngliges, 52
robustesse paramtrique, 36, 53
problme de Cauchy, 129, 150, 207,

211
schma blocs, 90
pr-compensation, 55, 70, 71
simplications ples-zros, 84, 87
pulsation de coupure, 74
solution approchante, 207, 208, 210
priode d'chantillonnage, 57
sortie, 8
sortie de Brunovsky, 119, 136, 139
quasi-polynmes, 110
sortie de Brunovsky non linaire, 164

sous-varit invariante, 49
ralisation d'une fonction de transfert

discrte, 238
rponse une entre sinusodale, 87
racteur exothermique, 130
ralisation, 87
ralisation d'un transfert rationnel, 87
stabilisation, 119, 122, 123, 141

stabilit, 15
stabilit asymptotique, 15, 31, 86, 215,
218
stabilit asymptotique en temps discret, 235, 236
reconstructibilit en temps discret, 244 stabilit EBSB, 86

rduction de Jordan, 19
stabilit en temps discret, 235, 239
rentre atmosphrique, 144
stabilit Entre-Borne-Sortie-Borne,
rgime asymptotique forc, 83
86
rglages de Ziegler-Nichols, 111, 112
suivi asymptotique, 142
rgulateur LQR, 155, 156
suivi asymptotique de trajectoire, 123
rgulateur PI, 80, 94, 102, 108
suivi de trajectoire, 119, 120, 122, 123,
rgulateur PI, 55, 56
142
rgulateur PI avec anticipation, 72
systme nominal, 79
rgulateur PID, 108
systme non minimum de phase, 116
rejet de l'erreur statique, 87
systme autonome, 39
rponse un chelon, 111
systme discrtis exact, 237
rponse inverse, 116
systme instationnaire, 9
rsolution de l'quation de Riccati al-
systme libre, 9
gbrique, 161
rsonance, 84
systme linaris tangent, 9, 17, 36,

37, 79, 92
retard critique, 94, 104
systme perturb, 79
retour d'tat, 141
systme plan, 38
257
INDEX
systme sous-actionn, 127

systme stationnaire, 9
systmes de Linard, 44
systme autonome, 66
systme commandable, 129
systme command, 119
systme du second ordre, 75
systme linaire commandable, 141
systme linaire instationnaire, 143,
153
systme linaire stationnaire, 176
systme linaire cot quadratique,
150
systme linarisable par bouclage statique, 165
systme sous-dtermin, 119
systme stationnaire, 55
systmes plats, 169
terme intgral, 57
thorme d'invariance de LaSalle, 33
thorme de Cauchy, 96
thorme de Cauchy-Lipschitz, 12
thorme de Hermite-Biehler, 25
thorme de Poincar, 38
thorme de Poincar-Bendixon, 41
thorme de Shannon, 231
thorme de Sylvester, 29
thorme de Tikhonov, 49
thorie des bifurcations et des catastrophes, 79
trajectoire, 129, 141
trajectoire d'un systme command,
129
trajectoire de rfrence, 142
trajectoire en boucle ouverte, 142
transforme de Fourier, 231
transforme de Laplace, 80
transforme en
z,
237
unicit de la solution au problme de

Cauchy, 211
utilisation pratique de la commande

LQR, 160
zro d'une fonction mromorphe, 94
zros d'une fonction de transfert, 86
tat adjoint, 147

Poly Auto 2011

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Poly Auto 2011

Diunggah oleh

Hak Cipta:

Format Tersedia

Automatique

Dynamique et contrle des systmes

Avant propos : un bref rappel de l'histoire de l'Automatique

Le but est de prsenter les notions et outils fon-

damentaux ncessaires l'analyse et au contrle des systmes. Ce cours est

Note de cette dition

Nous vous serions reconnaissants de nous faire part

en identiant votre message par Poly Mines corrections.

Nicolas Petit et Pierre Rouchon

Table des matires

1 Systmes dynamiques et rgulateurs

Systmes dynamiques non linaires

Existence et unicit des solutions

Sensibilit et premire variation . . . . . . . . . . . . .

Stabilit locale autour d'un quilibre

Systmes dynamiques linaires . . . . . . . . . . . . . . . . . .

L'exponentielle d'une matrice

Forme de Jordan et calcul de l'exponentielle

Portraits de phases des systmes linaires . . . . . . . .

Systmes linaires instationnaires

Complments : matrices symtriques et quation de

Stabilit des systmes non linaires

tude au premier ordre . . . . . . . . . . . . . . . . . .

Complments : caractre intrinsque des valeurs propres

Complments : les systmes dynamiques dans le plan

Feedback sur un systme deux chelles de temps . . .

Modle de contrle et modle de simulation

Systmes multi-chelles lents/rapides

Une modlisation simplie

Passage en temps continu

Simulations en boucle ouverte et en boucle ferme . . .

TABLE DES MATIRES

Un rsultat gnral : rgulateur PI sur un systme non

Dynamiques ngliges : rle du contrle dans l'approximation . . . . . . . . . . . . . . . . . . . . . . . . . . .

Intrt de la pr-compensation (feedforward) . . . . . .

Pr-compensation et suivi de trajectoires sur un systme linaire du premier ordre . . . . . . . . . . . . . .

Passage la fonction de transfert

Principe des calculs . . . . . . . . . . . . . . . . . . . .

Rgime asymptotique forc . . . . . . . . . . . . . . . .

Du transfert vers l'tat : ralisation . . . . . . . . . . .

Schmas blocs et fonctions de transfert

De la forme d'tat vers le transfert

Transfert avec perturbation et bouclage . . . . . . . . .

Marge de phase . . . . . . . . . . . . . . . . . . . . . . 102

Marge de gain . . . . . . . . . . . . . . . . . . . . . . . 105

Lecture des marges sur le diagramme de Bode . . . . . 106

Ples dominants . . . . . . . . . . . . . . . . . . . . . . 107

Mthodes de rglage de Ziegler-Nichols . . . . . . . . . 111

Systmes non minimum de phase

Un exemple de planication et de suivi de trajectoires . . . . . 120

Modlisation de deux oscillateurs en parallle

Stabilisation et suivi de trajectoires . . . . . . . . . . . 122

Autres exemples . . . . . . . . . . . . . . . . . . . . . . 124

Commandabilit non linaire . . . . . . . . . . . . . . . . . . . 128

TABLE DES MATIRES

Exemple de non commandabilit par la prsence d'intgrale premire . . . . . . . . . . . . . . . . . . . . . . 129

Matrice de commandabilit et intgrales premires . . . 132

Critre de Kalman et forme de Brunovsky

Planication et suivi de trajectoires . . . . . . . . . . . 141

Commande linaire quadratique LQR . . . . . . . . . . . . . . 143

Multiplicateurs de Lagrange en dimension innie . . . . 146

Problme aux deux bouts dans le cas linaire quadratique151

Linarisation par bouclage . . . . . . . . . . . . . . . . 163

Stabilisation par mthode de Lyapounov et backstepping170

en identiant votre message par Poly Mines corrections.

Une modlisation simplie

Un exemple de planication et de suivi de trajectoires . . . . . 120

Planication et suivi de trajectoires . . . . . . . . . . . 141

Multiplicateurs de Lagrange en dimension innie . . . . 146

Hypothses et dnition du ltre

Synthse d'une commande pour aller en temps ni

Observabilit linaire, estimation et ltrage . . . . . . . . . . . 244

aussi appele feedback. En spciant de la sorte la commande, on change

On parle alors de retour de sortie. C'est un problme dicile pour lequel

x tel que, si le systme direntiel (1.3) est initialis en ce

Nanmoins, cette information est parfois insusante,

En grande partie cause des eets aro-

est le coecient de trane. Ce modle prend en compte

les eets arodynamiques dus aux angles d'attaque du corps du missile, la

Figure 1.1 Variables dcrivant un missile.