Anda di halaman 1dari 260

Automatique

Dynamique et contrle des systmes


Nicolas Petit

Pierre Rouchon

MINES ParisTech
CAS - Centre Automatique et Systmes
Unit Mathmatiques et Systmes
Fvrier 2011

Avant propos : un bref rappel de l'histoire de l'Automatique

Les

mcanismes de rgulation et d'adaptation, largement rpandus dans la nature, sont aussi la base du fonctionnement des systmes crs et utiliss
par l'homme. Depuis trs longtemps, on les retrouve dans diverses machines
et inventions. Avec la rvolution industrielle et le rgulateur de Watt, on a
vu apparatre les premires formalisations modernes : modlisation (avec les
quations direntielles inventes par Newton) et stabilit. Le point de dpart de la thorie mathmatique des systmes remonte ainsi aux travaux du
mathmaticien et astronome anglais G. Airy. Il fut le premier tenter une
analyse du rgulateur de Watt. Ce n'est qu'en 1868, que le physicien cossais J. C. Maxwell publia une premire analyse mathmatique convaincante
et expliqua certains comportements erratiques observs parmi les nombreux
rgulateurs en service cet poque. Ses travaux furent le point de dpart de
nombreux autres sur la stabilit, notion marque par le travail de H. Poincar
et A. M. Lyapounov, sa caractrisation ayant t obtenue indpendamment
par les mathmaticiens A. Hurwitz et E. J. Routh. Durant les annes 1930,
les recherches aux Bell Telephone Laboratories sur les amplicateurs ont
t l'origine de notions encore enseignes aujourd'hui. Citons par exemple
les travaux de Nyquist et de Bode caractrisant partir de la rponse frquentielle en boucle ouverte celle de la boucle ferme.

Tous ces dveloppements ont vu le jour dans le cadre des systmes linaires ayant une seule commande et une seule sortie. On disposait d'une
mesure sous la forme d'un signal lectrique. Cette dernire tait alors entre dans un amplicateur qui restituait en sortie un autre signal lectrique
qu'on utilisait comme signal de contrle. Ce n'est qu'aprs les annes 1950
que les dveloppements thoriques et technologiques (avec l'invention des calculateurs numriques) permirent le traitement des systmes multi-variables
linaires et non linaires ayant plusieurs entres et plusieurs sorties. Citons
comme contributions importantes dans les annes 1960 celles de R. Bellmann
avec la programmation dynamique, celles de R. Kalman avec la commandabilit, le ltrage et la commande linaire quadratique ; celles de L. Pontryagin
avec la commande optimale. Ces contributions continuent encore aujourd'hui
alimenter les recherches en thorie des systmes. Le champ d'application
s'est considrablement tendu. Alors qu'aujourd'hui l'Automatique est omniprsente dans les domaines industriels tels que l'aronautique, l'arospatiale,
l'automobile, ou le gnie des procds, certaines recherches actuelles s'appuyant sur des notions cls prsentes dans ce cours concernent la construction d'un premier calculateur quantique.

Objectif de ce cours

Le but est de prsenter les notions et outils fon-

damentaux ncessaires l'analyse et au contrle des systmes. Ce cours est


articul autour des trois thmes suivants :
 Systmes dynamiques : stabilit, robustesse, thorie de perturbations.
 Commandabilit : stabilisation par bouclage, planication et suivi de
trajectoire.
 Observabilit : estimation, observateur asymptotique, ltrage et diagnostic.
Le cours part de quelques exemples issus du monde industriel ou acadmique. Chaque exemple motive et justie les dnitions et rsultats abstraits
sur lesquels reposent une classe d'algorithmes de contrle et/ou d'estimation.
Dans bien des domaines scientiques, une thorie a trs souvent pour origine
une petite collection d'exemples reprsentatifs bien compris et analyss. Nous
nous inscrivons dans cette dmarche. Une approche qui part du particulier
pour aller vers le gnral permet aussi de mieux comprendre les ressorts fondamentaux sur lesquels reposent certains rsultats mais aussi de bien cerner
leur limitations. L'Automatique est un domaine actif de recherche scientique. Le cours abordera certaines questions qui n'admettent pas de rponse
claire aujourd'hui bien qu'elles aient de fortes motivations pratiques.

Note de cette dition

Nous vous serions reconnaissants de nous faire part

de vos critiques et des erreurs que vous auriez dcouvertes par un message
explicatif

nicolas.petit@mines-paristech.fr ou
pierre.rouchon@mines-paristech.fr

en identiant votre message par Poly Mines corrections.

Nicolas Petit et Pierre Rouchon


Fvrier 2011

Table des matires

1 Systmes dynamiques et rgulateurs


1.1

1.2

Systmes dynamiques non linaires

7
. . . . . . . . . . . . . . .

Existence et unicit des solutions

. . . . . . . . . . . .

11

1.1.2

Sensibilit et premire variation . . . . . . . . . . . . .

14

1.1.3

Stabilit locale autour d'un quilibre

. . . . . . . . . .

15

Systmes dynamiques linaires . . . . . . . . . . . . . . . . . .

18

1.2.1

L'exponentielle d'une matrice

18

1.2.2

Forme de Jordan et calcul de l'exponentielle

1.2.3

Portraits de phases des systmes linaires . . . . . . . .

22

1.2.4

Polynme caractristique . . . . . . . . . . . . . . . . .

24

1.2.5

Systmes linaires instationnaires

27

1.2.6

Complments : matrices symtriques et quation de

. . . . . . . . . . . . . .
. . . . . .

. . . . . . . . . . . .

Lyapounov . . . . . . . . . . . . . . . . . . . . . . . . .
1.3

1.4

1.5

1.1.1

Stabilit des systmes non linaires

19

28

. . . . . . . . . . . . . . .

29

1.3.1

tude au premier ordre . . . . . . . . . . . . . . . . . .

29

1.3.2

Fonctions de Lyapounov

. . . . . . . . . . . . . . . . .

31

1.3.3

Robustesse paramtrique . . . . . . . . . . . . . . . . .

36

1.3.4

Complments : caractre intrinsque des valeurs propres


du systme linaris tangent . . . . . . . . . . . . . . .

37

1.3.5

Complments : les systmes dynamiques dans le plan

38

. . . . . . . . . . . . . .

45

1.4.1

Perturbations singulires . . . . . . . . . . . . . . . . .

46

1.4.2

Feedback sur un systme deux chelles de temps . . .

51

1.4.3

Modle de contrle et modle de simulation

. . . . . .

52

. . . . . . . . . . . . . . . . . . . . . . . . . . . .

55

Systmes multi-chelles lents/rapides

Cas d'tude
1.5.1

Prsentation du systme

1.5.2

Un rgulateur PI

. . . . . . . . . . . . . . . . .

55

. . . . . . . . . . . . . . . . . . . . .

56

1.5.3

Une modlisation simplie

1.5.4

Passage en temps continu

1.5.5

. . . . . . . . . . . . . . .

58

. . . . . . . . . . . . . . . .

59

Simulations en boucle ouverte et en boucle ferme . . .

60

TABLE DES MATIRES

1.5.6

Un rsultat gnral : rgulateur PI sur un systme non


linaire du premier ordre . . . . . . . . . . . . . . . . .

1.5.7

Dynamiques ngliges : rle du contrle dans l'approximation . . . . . . . . . . . . . . . . . . . . . . . . . . .

68

1.5.8

Intrt de la pr-compensation (feedforward) . . . . . .

70

1.5.9

Pr-compensation et suivi de trajectoires sur un systme linaire du premier ordre . . . . . . . . . . . . . .

1.6

Cas d'tude

. . . . . . . . . . . . . . . . . . . . . . . . . . . .

2 Fonctions de transfert
2.1

2.2

2.3

2.4

74

79

Passage la fonction de transfert

. . . . . . . . . . . . . . . .

80

Questions de robustesse

. . . . . . . . . . . . . . . . .

80

2.1.2

Principe des calculs . . . . . . . . . . . . . . . . . . . .

81

2.1.3

Rgime asymptotique forc . . . . . . . . . . . . . . . .

83

2.1.4

Simplications ples-zros

. . . . . . . . . . . . . . . .

84

2.1.5

Formalisme

. . . . . . . . . . . . . . . . . . . . . . . .

85

2.1.6

Du transfert vers l'tat : ralisation . . . . . . . . . . .

87

Schmas blocs et fonctions de transfert

. . . . . . . . . . . . .

90

2.2.1

De la forme d'tat vers le transfert

. . . . . . . . . . .

90

2.2.2

Transfert avec perturbation et bouclage . . . . . . . . .

92

Marge de robustesse

. . . . . . . . . . . . . . . . . . . . . . .

Critre de Nyquist

2.3.2

Marge de phase . . . . . . . . . . . . . . . . . . . . . . 102

2.3.3

Marge de gain . . . . . . . . . . . . . . . . . . . . . . . 105

2.3.4

Lecture des marges sur le diagramme de Bode . . . . . 106

2.3.5

Ples dominants . . . . . . . . . . . . . . . . . . . . . . 107

Complments

. . . . . . . . . . . . . . . . . . . .

94

2.3.1

94

. . . . . . . . . . . . . . . . . . . . . . . . . . . 108

Calcul de tous les contrleurs PID stabilisant un systme du premier ordre retard

. . . . . . . . . . . . . 108

2.4.2

Mthodes de rglage de Ziegler-Nichols . . . . . . . . . 111

2.4.3

Prdicteur de Smith

2.4.4

Systmes non minimum de phase

. . . . . . . . . . . . . . . . . . . 114
. . . . . . . . . . . 116

3 Commandabilit, stabilisation

3.2

72

2.1.1

2.4.1

3.1

63

119

Un exemple de planication et de suivi de trajectoires . . . . . 120


3.1.1

Modlisation de deux oscillateurs en parallle

3.1.2

Planication de trajectoires

. . . . . 120

3.1.3

Stabilisation et suivi de trajectoires . . . . . . . . . . . 122

3.1.4

Autres exemples . . . . . . . . . . . . . . . . . . . . . . 124

. . . . . . . . . . . . . . . 121

Commandabilit non linaire . . . . . . . . . . . . . . . . . . . 128

TABLE DES MATIRES

3.2.1

Exemple de non commandabilit par la prsence d'intgrale premire . . . . . . . . . . . . . . . . . . . . . . 129

3.3

3.4

3.5

Commandabilit linaire

. . . . . . . . . . . . . . . . . . . . . 131

3.3.1

Matrice de commandabilit et intgrales premires . . . 132

3.3.2

Invariance . . . . . . . . . . . . . . . . . . . . . . . . . 134

3.3.3

Critre de Kalman et forme de Brunovsky

3.3.4

Planication et suivi de trajectoires . . . . . . . . . . . 141

. . . . . . . 135

Commande linaire quadratique LQR . . . . . . . . . . . . . . 143


3.4.1

Multiplicateurs de Lagrange en dimension innie . . . . 146

3.4.2

Problme aux deux bouts dans le cas linaire quadratique151

3.4.3

Planication de trajectoires

3.4.4

Rgulateur LQR

Complments

. . . . . . . . . . . . . . . 153

. . . . . . . . . . . . . . . . . . . . . 155

. . . . . . . . . . . . . . . . . . . . . . . . . . . 163

3.5.1

Linarisation par bouclage . . . . . . . . . . . . . . . . 163

3.5.2

Stabilisation par mthode de Lyapounov et backstepping170

4 Observabilit, estimation et adaptation


4.1

4.2

4.3

4.4

4.5

4.6

Un exemple

173

. . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

4.1.1

Un modle simple de moteur courant continu

4.1.2

Estimation de la vitesse et de la charge . . . . . . . . . 175

4.1.3

Prise en compte des chelles de temps . . . . . . . . . . 177

4.1.4

Contraintes sur les courants

Observabilit non linaire

. . . . 175

. . . . . . . . . . . . . . . 178

. . . . . . . . . . . . . . . . . . . . 179

4.2.1

Dnition

. . . . . . . . . . . . . . . . . . . . . . . . . 179

4.2.2

Critre . . . . . . . . . . . . . . . . . . . . . . . . . . . 180

4.2.3

Observateur, estimation, moindres carrs . . . . . . . . 182

Observabilit linaire . . . . . . . . . . . . . . . . . . . . . . . 184


4.3.1

Le critre de Kalman . . . . . . . . . . . . . . . . . . . 184

4.3.2

Observateurs asymptotiques . . . . . . . . . . . . . . . 186

4.3.3

Observateurs rduits de Luenberger . . . . . . . . . . . 187

Observateur-contrleur . . . . . . . . . . . . . . . . . . . . . . 187

4.4.1

Version tat multi-entre multi-sortie (MIMO)

4.4.2

Version transfert mono-entre mono-sortie (SISO)

Filtre de Kalman
Formalisme

4.5.2

Hypothses et dnition du ltre

4.6.1

. . 189

. . . . . . . . . . . . . . . . . . . . . . . . . 190

4.5.1

Complments

. . . . 187

. . . . . . . . . . . . . . . . . . . . . . . . 191
. . . . . . . . . . . . 192

. . . . . . . . . . . . . . . . . . . . . . . . . . . 199

Estimation de paramtres et commande adaptative

1. MIMO : pour Multi-Input Multi-Output


2. SISO : pour Single-Input Single-Output

. . 199

TABLE DES MATIRES

4.6.2

Linarisation par injection de sortie . . . . . . . . . . . 201

4.6.3

Contraction

. . . . . . . . . . . . . . . . . . . . . . . . 202

A Sur le thorme de Cauchy-Lipchitz

207

B Autour des fonctions de Lyapounov

215

C Moyennisation

221

C.1

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221

C.2

Le rsultat de base

C.3

Un exemple classique . . . . . . . . . . . . . . . . . . . . . . . 224

C.4

Recherche d'extremum (extremum seeking) . . . . . . . . . . . 225

C.5

Boucle verrouillage de phase PLL . . . . . . . . . . . . . . . 226

. . . . . . . . . . . . . . . . . . . . . . . . 222

D Automatique en temps discret

229

D.1

Thorme d'chantillonnage de Shannon

D.2

Systmes dynamiques en temps discret

D.3

. . . . . . . . . . . . 231
. . . . . . . . . . . . . 234

Reprsentations externes et internes des systmes linaires

. . 236

D.3.1

Transforme en

. . . . . . . . . . . . . . . . . . . . . 237

D.3.2

Ralisation canonique d'une fonction de transfert discrte238

D.4

Stabilit des systmes linaires stationnaires

D.5

Commandabilit linaire en temps discret . . . . . . . . . . . . 240


D.5.1

Placement de ples . . . . . . . . . . . . . . . . . . . . 241

D.5.2

Rendre une matrice nilpotente par feedback

D.5.3

Synthse d'une commande pour aller en temps ni

D.5.4

Commande linaire quadratique LQR en temps discret

un point d'quilibre arbitraire


D.6

. . . . . . . . . . 239

. . . . . . 241

. . . . . . . . . . . . . . 242
242

Observabilit linaire, estimation et ltrage . . . . . . . . . . . 244


D.6.1

Filtre de Kalman en temps discret . . . . . . . . . . . . 245

Rfrences

246

Index

253

Chapitre 1
Systmes dynamiques et
rgulateurs

1.1 Systmes dynamiques non linaires


Nous nous intressons des systmes dynamiques reprsents par un
nombre ni d'quations direntielles du premier ordre couples entre elles
que nous crivons

d
x1 = v1 (x1 , ..., xn , u1 , ..., um , t)
dt
d
x2 = v2 (x1 , ..., xn , u1 , ..., um , t)
dt
.
.
.

o
les

d
xn = vn (x1 , ..., xn , u1 , ..., um , t)
dt
les grandeurs x1 ,...,xn sont appeles tats, les grandeurs u1 ,...,um sont
entres (ou commandes), et n et m sont des entiers. Le temps t est ici

considr de manire gnrale dans le second membre des quations. Les


fonctions

(vi )i=1,...,n

sont valeur relle. En toute gnralit, leur rgularit

peut tre trs faible, mme si, comme on le verra par la suite, de nombreuses
proprits fondamentales proviennent justement de leur rgularit.
Il est commode d'crire le systme direntiel prcdent sous la forme
vectorielle (appele forme d'tat)

d
x = v(x, u, t)
dt

(1.1)

Pour calculer l'volution future d'un tel systme, il faut connatre les grandeurs

t 7 u(t)

ainsi que la condition initiale de l'tat. On dit que l'tat

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

du systme reprsente sa mmoire. tant donne l'volution du systme, on


s'intresse souvent un certain nombre de grandeurs (par exemple car elles
ont un intrt pratique) qu'on nomme sorties ou mesures. Les quations de

sorties que nous considrons sont de la forme

y = h(x, u, t) Rq
o

est un entier souvent infrieur

(1.2)

n 1.

Le formalisme (1.1) (1.2) que nous venons de prsenter est trs gnral.
On trouve un vaste choix d'exemples dans les domaines de la mcanique
(les quations d'Euler-Lagrange, voir [44] par exemple, exprimant le principe de moindre action sont des quations d'ordre 2 dans les variables de
congurations (positions gnralises), l'tat est alors constitu des positions
gnralises et leur vitesses), les machines lectriques (voir [46]), l'aronautique (voir l'Exemple 1), la robotique (voir [58]), la chimie, la biochimie, les
sciences du vivant (voir

[37]) .

Ce que nous cherchons faire dans le domaine de l'Automatique ce n'est


pas simplement tudier les proprits des systmes d'quations direntielles,
mais les contrler. Dans l'quation (1.1), on peut agir sur l'tat
sissant

u.

L'outil principal de l'Automaticien c'est la rtro-action

x en choiu = k(t, x)

aussi appele feedback. En spciant de la sorte la commande, on change


compltement le comportement du systme dynamique (1.1) qui devient

d
x = v(x, k(t, x), t)
dt
En pratique, on sera souvent limit l'utilisation de la mesure dnie en (1.2).
Dans ce contexte, les rtro-actions envisageables sont de la forme

u = k(t, y).

On parle alors de retour de sortie. C'est un problme dicile pour lequel


nous montrerons, au Chapitre 4 qu'il est en fait utile d'utiliser un systme
dynamique supplmentaire (on parlera d'observateur) qui permettra de bien
plus intressantes possibilits.
1. Bien souvent seules certaines composantes sont mesures pour des raisons technologiques, il existe des exceptions notables comme dans les applications de fusion de capteurs
(voir le Chapitre 4) o on dispose de mesures redondantes de certaines composantes de
l'tat

x.

2. Pourtant, on pourra remarquer que certains domaines chappent ce formalisme.


On peut citer quelques exemples tels que l'tude de la turbulence dans les coulements, les
phnomnes thermiques dans les chambres de combustion, ou les ondes de propagation.
L'tude des systmes de dimension innie est traite dans de nombreux ouvrages sur les
quations direntielles partielles [19] aussi appels systmes paramtres distribus. Ils
sont en grande partie absent de ce cours.

1.1.

SYSTMES DYNAMIQUES NON LINAIRES

Que ce soit parce qu'on a choisi une loi de rtroaction particulire ou parce
que le systme considr ne possde pas de commande, il est important de
comprendre comment tudier les systmes libres de la forme

d
x = v(x, t)
dt

(1.3)

On dira qu'un tel systme est stationnaire (par opposition au cas (1.3) ins-

tationnaire) lorsque

ne dpend pas explicitement du temps. Dans ce cas

l'quation s'crit

d
x = v(x)
dt
Un des concepts cls dans l'tude des systmes dynamiques est la notion
de point d'quilibre (appel galement point stationnaire )

x. On appelle point

x tel que, si le systme direntiel (1.3) est initialis en ce


x(0) = x, alors le systme reste en x pour tous les temps futurs.

d'quilibre, un point
point, c.--d.

Dans le cas d'un systme stationnaire, les points d'quilibre sont simplement
caractriss par l'quation

v(
x) = 0.

Autour d'un point d'quilibre il est tentant de chercher une expression


approche des quations dynamiques (1.3) qu'on souhaite tudier. En gnral, lorsque le systme est instationnaire, on obtiendra un systme linaire
instationnaire (appel linaris tangent) de la forme

d
x = A(t)x + B(t)u
dt
y = C(t)x + D(t)u

(1.4)
(1.5)

Comme nous le verrons (notamment la Section 1.3), cette approche est intressante car elle fournit souvent une information locale sur le comportement
de (1.3) autour de

x.

Nanmoins, cette information est parfois insusante,

surtout lorsqu'on recherche des informations sur le comportement du systme


loin de l'quilibre. En outre, les systmes linaires et les systmes non linaires
sont en fait trs dirents par nature. Soumis une superposition d'excitations (par une somme de termes dans la commande), les systmes linaires
rpondent d'aprs le principe de superposition : leur sortie est la somme des
sorties correspondant chacun des termes d'excitation. Ce principe, qui ne
s'applique pas aux systmes non linaires, est la base de l'analyse de Fourier des signaux. Il existe de nombreux phnomnes qu'on ne constate que
chez les systmes rgis par des quations non linaires (on pourra se rfrer
3. On notera l'intrt d'un formalisme du premier ordre. Si on considre l'quation
d2
d
d
T
x, dt
x) = (0, 0)
dt2 x = 2x, dont l'tat est (x, dt x) , les points d'quilibre sont donns par (
et pas uniquement par l'quation 2
x = 0.

10

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

[40] pour une discussion plus dtaille). Les systmes non linaires peuvent
diverger en temps ni alors que c'est seulement en temps inni qu'un systme
linaire peut diverger (c.--d. que son tat tend vers l'inni). Un systme non
linaire peut avoir de multiples points d'quilibre isols. L'unicit des points
d'quilibre n'est pas non plus garantie dans le cas des systmes linaires, mais
elle apparat sous la forme de sous espaces vectoriels de points d'quilibre.
Enn, et c'est un des faits les plus marquants, un systme non linaire peut
possder un ou plusieurs cycles limites. C'est une des particularit les plus
importantes et aussi l'une des plus frquemment observes en pratique. Alors
que les systmes linaires peuvent avoir des trajectoires oscillantes, l'amplitude de celles-ci dpendent de la condition initiale. Dans le cas non linaire il
est possible d'observer des trajectoires oscillantes dont l'amplitude ne dpend pas de la condition initiale. C'est en exploitant cette proprit qu'on
a construit les premiers circuits lectriques oscillants qui sont la base de
l'lectronique (et de la synthse sonore notamment). titre d'illustration,
on pourra se reporter l'onde de densit observe dans les puits de ptrole
prsents dans l'Exemple 10.

Exemple 1 (Missile dans le plan).

En grande partie cause des eets aro-

dynamiques, les quations qui rgissent le mouvement d'un missile ou d'une


fuse sont non linaires. Aprs rduction un plan, les quations de la dynamique d'un missile s'expriment au moyen de 6 tats. Les variables

ym

xm

et

Vm est sa
m , m et m correspondent des angles, et on utilise deux variables
intermdiaires A et T pour exprimer les seconds membres de la dynamique
correspondent aux coordonnes du centre de gravit de l'engin,

vitesse,

(voir la Figure 1.1).

x m = Vm cos m

y m = Vm sin m




1
1

T cos T SVm CD (T )
Vm =

m
2

o sin T =
1
2
2
1 + tan m + tan m
g

m = tan A

Vm

tan

o 1 + tan A =

tan m

m = 0.3(c m )

m = 0.3(c m )
Les deux commandes sont

c , c ,

tandis que

m(t)

et

T (t)

(1.6)

sont des fonctions

1.1.

11

SYSTMES DYNAMIQUES NON LINAIRES

donnes du temps (variation de la masse et de la pousse),


constantes et

CD (.)

et

sont des

est le coecient de trane. Ce modle prend en compte

les eets arodynamiques dus aux angles d'attaque du corps du missile, la


perte de masse au cours du vol (qui est loin d'tre ngligeable), et les dynamiques des actionneurs ( travers des vrins).

Figure 1.1  Variables dcrivant un missile.

1.1.1 Existence et unicit des solutions


L'outil de base de la modlisation mathmatique d'un modle physique
est le problme de Cauchy . Il consiste en une condition initiale et une quation
direntielle

x(0) = x0 ,

d
x(t) = v(x(t), t)
dt

(1.7)

Face ce problme, on est en droit d'esprer que les proprits suivantes sont
satisfaites
1. qu'une solution avec ces conditions initiales existe
2. que cette solution soit unique
3. que les solutions dpendent continment des conditions initiales
On trouvera une dmonstration lmentaire du thorme de Cauchy-Lipschitz
( partir du schma d'Euler explicite et de la notion de solution approchante)
dans l'Annexe A. Ce thorme dont une version un peu plus gnrale est
donne ci-dessous garantie l'existence et l'unicit pour des temps courts. En

12

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

revanche l'existence pour des temps

arbitrairement grands est nettement

plus dlicate. On peut la garantir sous des hypothses fortes (voir Lemme 1).
Enn, la continuit de la solution par rapport sa condition initiale peut tre
garantie, mais sous une hypothse plus forte. C'est l'objet du Thorme 2.

Thorme 1 (Cauchy-Lipschitz. Existence et unicit).


n

(x, t) 7 v(x, t) R

Rn R

une fonction satisfaisant aux deux proprits suivantes :

1. (localement lipchitzienne par rapport

x)

pour tout

x,t > 0 et Kx,t > 0, tels que, pour tout


kx yk x,t on a kv(x, t) v(y, t)k Kx,t kx yk

il existe

2. (localement intgrable par rapport

t 7 v(x, t)

Soit

t)

pour tout

(x, t) Rn R,
y Rn vriant

x Rn ,

l'application

est localement intgrable .

On considre le problme de Cauchy,

x(0) = x0 ,

d
x(t) = v(x(t), t),
dt

Ce problme possde les proprits suivantes


0
n
1. existence locale en temps : pour toute condition initiale x R , il
n
existe  > 0 et une fonction ] , [3 t 7 x(t) R drivable par

rapport

et solution du problme de Cauchy.

x0 Rn et pour
] a, b[3 t 7 x(t) Rn

2. unicit globale en temps : pour toute condition initiale


tout

a, b > 0

il existe au plus une fonction

drivable par rapport

et solution du problme de Cauchy.

Une dmonstration de ce thorme, reposant sur le thorme du point xe


de Picard dans un espace de Banach, gure dans [51, 34]. On peut vrier
grce aux exemples qui suivent que les hypothses du Thorme 1 de CauchyLipchitz sont eectivement ncessaires :
p
d
x = |x| admet deux solutions partant de x0 = 0 :
 l'quation
dt
p
0 et x(t) = t2 /4 ; on remarque que |x| n'est pas Lipchitz en
bien qu'elle y soit continue. En dehors du point

0,

x(t) =
x=0

l'unique solution

de l'quation direntielle (voir [10, page 149])est x(0) = l , x(t) =

1
(t + 2 l)2 .
4
d
 toute solution de
x = 1/t n'est pas dnie en t = 0 car 1/t n'est pas
dt
p
d
localement intgrable autour de 0 alors que
x = 1/ |t| admet des
dt
solutions parfaitement dnies en 0.
4. +

x, chacune de ses composantes est une fonction mesurable du temps dont

l'intgrale de la valeur absolue sur tout intervalle born est borne, voir [52].

1.1.

13

SYSTMES DYNAMIQUES NON LINAIRES

10
9
8
7

6
5
4
3
2
1

Figure

0.2

0.4

0.6

0.8

1
t

1.2

1.4

1.6

1.8

1.2  Dpendance de la solution d'une quation direntielle par

rapport sa condition initiale. Trois solutions d'une quation scalaire au


cours du temps. Elles ne peuvent se croiser en vertu de la proprit d'unicit.

Thorme 2 (Dpendance en la condition initiale).

Soit

Rn R (x, t) 7

v
continues par
v(x, t) Rn une fonction continue drives partielles x
i
0
n
rapport x. Soit x R une condition initiale, il existe une unique solution
t 7 x(t) telle que x(0) = x0 . Cette solution, considre comme une foncxi (x0 ,t)
0
tion de la condition initiale x , admet des direntielles partielles
x0
j

continues par rapport

x0

et

t.

Ce thorme est dmontr dans [36, page 29]. Il est illustr par la Figure 1.2 o on a reprsent trois solutions de la mme quation direntielle
1
scalaire ( second membre C ) obtenues en faisant varier la condition initiale. On remarque que les courbes ne se croisent pas (cela est interdit par la
proprit d'unicit). Elles semblent s'carter lorsque
L'existence pour tout temps

croit.

t>0

n'est pas une consquence du Thod


x = x2 vrie bien toutes ses hyporme 1 de Cauchy-Lipchitz. En eet,
dt
x0
0
thses, mais comme la solution qui part de x est x(t) =
, on voit que,
1tx0
0
0
pour x > 0, la solution explose en t = 1/x . La solution explose en temps
ni.
On peut donner une condition assez gnrale (mais relativement forte)
pour viter l'explosion en temps ni. C'est l'objet du lemme suivant.

Lemme 1 (existence globale en temps). En plus des hypothses du ThoM0 (t), M1 (t) > 0 fonctions localement inn
tgrables telles que pour tout x R , kv(x, t)k M0 (t) + M1 (t)kxk, alors la
solution (unique) au problme de Cauchy est dnie pour t ] , +[.

rme 1, si on suppose qu'il existe

14

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

Noter que ce lemme ne dit pas que les trajectoires restent bornes. A
d
x = x : elles peuvent
priori, elles ne le sont pas comme le montre l'exemple
dt
tendre vers l'inni mais en temps inni.

1.1.2 Sensibilit et premire variation


Nous nous intressons la solution du systme

d
x(t) = f (x(t), u(t), p),
dt

C 1 de x, u et p (n, m, r N).
m
On suppose ici que la fonction R 3 t 7 u(t) R est continue par morceaux.
Ainsi, les hypothses du thorme 1 sont satisfaites et donc la solution t 7
x(t) existe pour t autour de 0 et est unique. On regarde sa dpendance des
petites variations de l'entre u, du paramtre p ou de sa condition initiale
x0 . Nous ne prsentons pas de faon rigoureuse les rsultats de drivabilit
0
de x par rapport u, p et x . Ils dcoulent du thorme 2 et du fait que
f est C 1 . Nous prsentons simplement la faon de calculer directement les
0
drives partielles de x par rapport aux composantes de x et p, ainsi que la
direntielle de x par rapport u.
o

x Rn , u Rm , p Rr , f

x(0) = x0

est une fonction

La mthode est lmentaire : il sut de direntier les quations. On


note l'opration de dierentiation. Ainsi les petites variations de u, p et
x0 , notes u, p et x0 , engendrent des petites variations de x, notes x.
0
r
n
Il faut bien comprendre que p et x sont des petits vecteurs de R et R
m
alors que u et x sont des petites fonctions du temps valeur dans R
et
n
R , respectivement. Ainsi x est solution de l'quation direntielle

d
(x)(t) =
dt

f
x


x +

f
u


u(t) +

f
p


p
t

f
0
avec comme condition initiale x(0) = x . Les matrices Jacobiennes
,
x
f
f
et
sont values le long de la trajectoire (x(t), u(t), p). C'est pourquoi
u
p
 
 f 
f
f
nous les notons
,
et
. Ainsi, x est solution d'une quation
x t
u t
p
t
direntielle ane coecients dpendant a priori du temps :

d
(x)(t) = A(t)x + b(t), x(0) = x0 ,
dt
 


f
f
A(t) = x t et b(t) = u t u(t) + f
p.
p

t
Supposons que l'on souhaite calculer la drive partielle de

pk ,

le

k -ime

paramtre scalaire (k

{1, . . . , r}).

On

x par rapport
n
note W (t) R

1.1.

15

SYSTMES DYNAMIQUES NON LINAIRES

cette drive partielle l'instant

t.

Le calcul ci-dessus nous dit que

est la

solution du systme ane dpendant du temps suivant :

d
W =
dt

f
x


W+

f
pk


t

avec comme condition initiale W (0) = 0. De mme, pour la drive par0


n
tielle par rapport xk note V (t) R , on doit rsoudre le systme linaire
dpendant du temps

d
V =
dt

f
x


V
t

V (0) = (j,k )1jn


j = k et 0 sinon.

avec comme condition initiale


Kronecker qui vaut

si

o ici

jk

est le symbole de

Noter qu'il n'est pas possible de dnir la drive partielle de


port

uk

avec un simple vecteur car

uk

est une fonction de

t.

par rap-

On parle alors

de direntielle partielle qui est, chaque instant, un oprateur linaire sur


des fonctions, une fonctionnelle linaire donc.

1.1.3 Stabilit locale autour d'un quilibre


La notion de stabilit s'attache formaliser l'intuition suivante : un point
d'quilibre sera dit stable si un petit dsquilibre initial n'entrane que de
petits carts pour tout temps postrieur ; en bref de petites causes n'ont que
de petites consquences.

Dnition 1 (Stabilit (au sens de Lyapounov) et instabilit). On reprend les notations et hypothses du Thorme 1 de Cauchy Lipchitz. On suppose de plus qu'il existe un point d'quilibre x
Rn caractris par v(
x, t) = 0

t R.
L'quilibre x
Rn est dit stable (au sens de Lyapounov) si et seulement
0
si pour tout  > 0, il existe > 0 tel que pour toute condition initiale x
0
vriant kx x
k , la solution de dtd x = v(x, t) issue de x0 t = 0, est
dnie pour tout temps positif et vrie kx(t) x
k  pour tout temps t 0.
pour tout

S'il n'est pas stable, il est dit instable.

Dnition 2 (Stabilit asymptotique).


tion 1, l'quilibre

Avec les notations de la Dni-

est dit localement asymptotiquement stable si et seule-

ment s'il est stable et si, de plus, il existe > 0 tel que toutes les solud
0
tions x(t) de dt x = v(x, t), partant en t = 0 de conditions initiales x telles
0
que kx x
k , convergent vers x lorsque t tend vers +.

16

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

Figure 1.3  Stabilit (gauche) et stabilit asymptotique (droite).


Ces notions de stabilit sont illustres sur la Figure 1.3. Lorsque

est

asymptotiquement stable, on dit souvent que le systme oublie sa condition


initiale. En eet, localement, quelle que soit la condition initiale, la trajectoire
converge vers

x.

Lorsque, dans la Dnition 2, la condition initiale peut tre

librement choisie, on dit que

Exemple 2

est globalement asymptotiquement stable .

(Oscillateur harmonique)

Un exemple d'quilibre stable mais

non asymptotiquement stable est celui de l'oscillateur harmonique non amorti


(le paramtre

>0

est la pulsation)

d
x2 = 2 x1
dt

(1.8)

d
x2 = 2 x1 2 x2
dt

(1.9)

d
x1 = x2 ,
dt
Le rajout d'un amortissement

d
x1 = x 2 ,
dt
rend alors l'quilibre
mension

> 0

(0, 0)

asymptotiquement stable. Le paramtre sans di-

est le facteur d'amortissement : pour

l'quilibre se fait sous la forme d'oscillations amorties ;

]0, 1[ le
pour 1,

retour
le retour

l'quilibre se fait quasiment sans oscillation, i.e., avec un trs petit nombre
de changements de signe pour

x1

et

x2 .

Comme on le verra en dtails dans

la Section 1.2 consacre aux systmes linaires, cela vient du fait bien connu
que les racines

du polynme caractristique

s2 + 2 s + 2 = 0
de l'quation du second ordre

d
d2
x1 + 2 x1 + 2 x1 = 0
2
dt
dt

1.1.

17

SYSTMES DYNAMIQUES NON LINAIRES

Figure

1.4  Deux congurations possibles d'un avion de combat. Noter

la dirence de position relative entre le centre de pousse (P) et le centre


de masse (M) entre les deux congurations. Le systme est stable dans la
conguration de droite, et instable dans la conguration de gauche.

> 1 et complexes conjugues avec une partie relle ngative si 0 < < 1. Noter enn
qu'aucun des quilibres du double intgrateur, (1.8) avec = 0, n'est stable.

qui correspond au systme (1.9), sont relles ngatives pour

Exemple 3

(Stabilit des avions)

La position relative du centre de masse

et du centre de pression arodynamique conditionnent la stabilit en boucle


ouverte des avions. Si l'engin est trop stable, il est dicile manoeuvrer. On
doit alors utiliser des surfaces de contrle (volets) trs tendues pour gnrer
les forces requises pour les manoeuvres. En rgime supersonique, le centre
de pression se dcale vers l'arrire de l'appareil. Lors de la conception d'un
appareil de combat, il est souvent prfr de prvoir un centre de pousse
l'avant du centre de pression lors du rgime subsonique, l'avion y est instable
en boucle ouverte (notamment pour le dcollage et l'atterrissage), alors qu'en
rgime supersonique il est stable car le centre de pression passe l'arrire.
On se reportera l'ouvrage [2] pour de trs nombreuses explications et dveloppements sur ce thme.
Du fait du caractre local de la Dnition 2, il est possible, sous certaines
conditions, de dduire la stabilit asymptotique des termes du dveloppement
limit l'ordre

1 des quations direntielles autour de l'quilibre (le systme

5
linaris tangent ) . Avant d'noncer un rsultat fondamental dans ce cadre
5. Ce calcul l'ordre
spectrale

est mme l'origine de la thorie des matrices et de l'analyse

18

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

(Thorme 10) nous devons d'abord tudier les systmes linaires.

1.2 Systmes dynamiques linaires


Cette section ne comporte que le strict minimum sur les systmes linaires. Pour un expos complet, nous renvoyons [34]. Considrons le systme linaire

d
x(t) = Ax(t)
(1.10)
dt
n
avec x(t) R et A une matrice n n coecients constants. Une des principales spcicits des systmes linaires est que, par homothtie, les proprits locales sont galement globales. C'est en particulier vrai pour la stabilit
asymptotique qui peut s'tablir, comme nous le verrons au Thorme 4, en
tudiant les valeurs propres de

A.

1.2.1 L'exponentielle d'une matrice


La matrice dpendant du temps

exp(tA)

est dnie par la srie absolu-

ment convergente

t2
tk
exp(tA) = I + tA + A2 + . . . + Ak + . . .
2!
k!



(1.11)

est la matrice identit. On appelle t 7 exp(tA) l'exponentielle de la


A. Quel que soit x0 Rn , l'unique solution x(t) du problme de
d
x(t) = Ax(t), x(0) = x0 s'exprime sous la forme
Cauchy
dt
o

matrice

x(t) = exp(tA) x0

Proposition 1

(Proprits de l'exponentielle de matrice)

L' exponentielle

de matrice satisfait les proprits suivantes

exp(tA) exp( A) = exp((t + )A)


d
(exp(tA))
dt

= exp(tA) A = A exp(tA)

exp(P AP 1 ) = P exp(A)P 1
exp(A) = limm+ I +


A m
m

det(exp(A)) = exp(tr(A))
o

et

sont des rels,

est une matrice inversible,  det dsigne le dter-

minant et  tr  dsigne la trace.

1.2.

19

SYSTMES DYNAMIQUES LINAIRES

1.2.2 Forme de Jordan et calcul de l'exponentielle


exp(tA)

Le calcul de l'exponentielle de matrice


faisant intervenir une transformation

c'est possible, ou qui transforme

peut tre simpli en

inversible qui diagonalise

A,

lorsque

en une matrice diagonale par blocs, dite

matrice de Jordan (voir par exemple [34]). Le rsultat suivant prcise les
notations.

Thorme 3

(Rduction de Jordan)

polynme caractristique scind sur

det(sI A) =

Soit

une matrice

nn

dont le

s'crit sous la forme

q
Y
(s i )i ,

(i 6= j ,

si

i 6= j)

i=1

Il existe une matrice inversible

( coecients complexes) telle que

A = T 1 JT
o

J1

0
J2

J =

..

0
avec pour

Jq

i = 1, ..., q ,

i vi,1

0
.
Ji =
..
.
..
0
o pour tout

i, j , vi,j

vaut

ou

vi,2

..

..

..

... ...

...

..

..
.

..

i
0

vi,i1
i

1.

Thorme 4 (CNS de stabilit asymptotique d'un systme linaire stationnaire). Soit le problme de Cauchy pour le systme linaire stationnaire

d
x = Ax, x(0) = x0 o A est une matrice n n et x0 Rn . Ce systme
dt
0
possde la proprit que limt x(t) = 0 quel que soit x (c.--d. que le point

d'quilibre

est globalement asymptotiquement stable) si et seulement si

toutes les valeurs propres de


Dmonstration.

ont une partie relle strictement ngative.

20

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

La condition est ncessaire.

valeur propre de A et v un vecteur propre


i N, Ai v = i v . On a alors, pour tout t > 0,

Considrons
pour tout

exp(tA)v =

i
X
t
i=0

i!

Av=

(t)i v = exp(t)v

i=0

limt x(t) = 0

Donc, pour avoir

associ. Il vient,

quelle que soit la condition initiale, il

faut que toutes les valeurs propres aient une partie relle

<(i )

strictement

ngative.

La condition est susante.


Supposons la condition ralise et notons = supi=1,...n <(i ). D'aprs le
1
Thorme 3, on peut dcomposer A = T
JT , avec J = D + N o D est
diagonale et

est nilpotente. D'aprs la Proposition 1, on a

exp(At) = T exp(tJ)T 1
Les matrice

et

commutent. Intressons nous donc a

exp(tJ) = exp(tD) exp(tN )


Par construction, on a

D = diag(i )

o les

sont les valeurs propres de

A.

On obtient directement

exp t1
exp t2

exp(tD) =

..

0
kM k =

kexp(tD)k =

exp tn

i=1,...,n,j=1,...,n |mi,j |, pour


peut clairement tablir, pour tout t > 0,

Notons

M = (mi,j )

matrice

n n.

On

|exp(ti )| n exp(t)

i=1,...,n
D'autre part,

tant nilpotente, on a, pour tout

exp(tN ) = I + tN +

t > 0,

t2 2
tn1
N + ... +
N n1
2
(n 1)!

Donc, on peut majorer

exp(tN ) p(t)
par le polynme

n1

t
p(t) , 1 + t kN k + t2 kN 2 k + ... + (n1)!
kN n1 k. Il vient alors

kexp(tA)k = kexp(tD) exp(tN )k kexp(tD)k kexp(tN )k np(t) exp(t)


On en dduit, que

limt kexp(tA)k = 0,

d'o la conclusion.

1.2.

21

SYSTMES DYNAMIQUES LINAIRES

Dans le cas o le systme linaire est eectivement (globalement) asymptotiquement stable, on a en fait convergence exponentielle vers zro de toutes
les trajectoires. Le rsultat suivant prcise ce point, on peut utiliser n'importe quel minorant strict (en valeur absolue) des parties relles des valeurs
propres comme constante

dans cet nonc. On trouvera une dmonstration

dans [12].

Proposition 2 (Estimation de la convergence d'un systme linaire). Soit le


d
problme de Cauchy pour le systme linaire stationnaire dt x = Ax, x(0) =
0
0
n
x o A est une matrice n n et x R . Si toutes les valeurs propres de

sont partie relle strictement ngative, alors il existe

que, pour tout

K>0

et

>0

tel

t0
kexp(tA)k K exp (t)

et donc


kx(t)k K x0 exp (t)

Thorme 5 (CNS de stabilit d'un systme linaire stationnaire).

Le point
d
d'quilibre x = 0 du systme linaire dt x = Ax est stable si et seulement si
toutes les valeurs propres de A ont une partie relle ngative ou nulle et si
toute valeur propre ayant une partie relle nulle et une multiplicit suprieure
ou gale

correspond un bloc de Jordan d'ordre

1.

L'ide de la dmonstration du Thorme 5 repose sur le calcul de l'exponentielle d'une matrice de Jordan d'ordre suprieur

le plus simple o on a un bloc de Jordan de taille

1
..

Jp =

0
.

..

..

0
Dans ce cas, l'exponentielle de matrice

0 ...
exp(tJp ) = exp(t)
..
.
0 ...

Considrons le cas

et d'ordre

exp(tJp )

1.

vaut

...
..

..

tp1
(p1)!
.
.
.

t
1

Les termes polynomiaux n'apparaissent que dans ce cas. Dans le cas d'une
valeur propre partie relle nulle, le terme exponentiel ne procure pas d'amortissement et par consquent, ne domine pas les termes polynomiaux. Ensuite,

22

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

par les formules de changement de base, on en retrouvera des combinaisons


linaires dans les coordonnes d'origine, prouvant ainsi que les composantes
de l'exponentielle de la matrice sont non bornes lorsque

t croit. On en dduit

l'instabilit du systme. Une dmonstration dtaille se trouve dans [12]. Une


interprtation de ce rsultat est que la forme de Jordan d'ordre suprieur

met en vidence un couplage entre les tats, qui rsultent en une instabilit.

Exemple 4.

Considrons une matrice

ayant toutes ses valeurs propres

partie relle ou nulle. Si les valeurs propres partie relle nulle sont toutes

valeur propre de A partie relle


m corresponde un bloc de Jordan de taille 1 est
quivalent la condition rang(I A) = nm. On vriera ainsi simplement
que la matrice A1 correspond un systme stable alors que la matrice A2
simples, le systme est stable. Le fait que

nulle et de multiplicit

correspond un systme instable, avec

0
1
A1 =
0
0

1 0
0 0
0 0
0 1

0
0
,
1
0

0
1
A2 =
0
0

1 0
0 1
0 0
0 1

0
0

1
0

1.2.3 Portraits de phases des systmes linaires


Nous allons considrer maintenant les cas les plus intressants, principalement les cas gnriques (i.e. invariants par lgres modications des lments
de la matrice

A),

qu'on peut rencontrer en dimensions

n=2

et

n = 3.

Dimension n = 2
Les principaux cas sont illustrs sur les Figures 1.5, et 1.6. On a not

et

les valeurs propres de

(distinctes ou non, relles ou complexes

1 et 2 sont les vecteurs propres rels associs quand ils existent.


Rn correspondant l'tat x. Pour
on a reprsent l'emplacement des valeurs propres de A dans le

conjugues),

On appelle ici plan de phases l'espace


chaque cas,

plan complexe, et l'allure gnrale des trajectoires (note portrait de phases )


d
x = Ax. Cette forme gnrale, comme on l'a vu, ne dpend par
du systme
dt
de la condition initiale.

Dimension n = 3
La Figure 1.7, montre sur un exemple comment, partir des portraits de
phases en dimension 2, on construit, dans les cas gnriques, le portrait de
3
phases en dimension 3 : il sut de dcomposer R en somme d'espaces propres

1.2.

SYSTMES DYNAMIQUES LINAIRES

23

Figure 1.5  Portraits de phases plans et linaires lorsque les valeurs propres
de

A, 1

et

2 ,

ont une partie imaginaire non nulle.

Figure 1.6  Portraits de phases

d
x = Ax, lorsque les
dt
valeurs propres de A, 1 et 2 , sont relles (1 et 2 vecteurs propres de A,
lorsqu'ils existent).

plans et linaires,

24

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

trajectoire

valeurs propres

Figure 1.7  Exemple de portrait de phases d'un systme linaire de dimension

en fonction des valeurs propres de

A.

invariants de dimension 1 ou 2. On a convergence suivant une direction et


enroulement avec convergence (typique d'un foyer stable) suivant deux autres
directions.

1.2.4 Polynme caractristique


Les valeurs propres de
polynme caractristique

A (son
P (s)

spectre) correspondent aux racines de son

P (s) = det(sI A) = s

n1
X

s = 0

=0
partir des coecients de la matrice
nme

P (s)

les coecients

de ce poly-

se calculent simplement.

Exemple 5

(Forme canonique d'un systme linaire)

Soit

t 7 y(t) R

solution de

y (n) = 0 y + 1 y (1) + . . . + n1 y (n1)


sont des scalaires et o la -ime drive de y par rapport au temps
()
est note y .
(1)
(n1) T
En posant x = (y, y , . . . , y
) vecteur de Rn , cette quation scalaire
d
d'ordre n devient un systme du premier ordre de dimension n, dt x = Ax,
o les

d
d
dt x = Ax, l'oprateur dt par s la variable
C pour le systme linaire de n quations

6. Ce dernier est obtenu en remplaant dans

s
sx = Ax admette des solutions x non triviales. Ce qui quivaut dire que
la matrice sI A n'est pas inversible, c'est dire que son dterminant P (s), un polynme
de degr n, est nul
de Laplace et en cherchant les conditions sur

inconnues

1.2.

25

SYSTMES DYNAMIQUES LINAIRES

avec pour

la matrice suivante

0 1
0 ... ...
0
0 0
1
0
...
0
.
..
. ... ... ... ...
.
.
A=
.
0 . . . .. 0
1
0

0 ... ... ...


0
1
0 . . . . . . . . . n2 n1

A a une forme compagne (aussi appele forme canonique),


P (s) s'obtient trs simplement en partant did
forme scalaire d'ordre n. Il sut de remplacer dt par s

Puisque la matrice

son polynme caractristique


rectement de la

sn y = 0 y + 1 sy + . . . + n1 sn1 y
La condition pour que cette quation linaire en
donne

ait des solutions non nulles

P (s)
P (s) = sn 0 1 s . . . n1 sn1 = 0

On dit que la matrice

est Hurwitz (stable), lorsque toutes ses valeurs

propres sont partie relle strictement ngative, i.e., les zros du polynme

P (s)
que

<(s) < 0. D'aprs le Thorme 4, le point


0 est asymptotiquement stable sous cette hypothse. On dit alors

sont dans le demi-plan

d'quilibre

P (s)

est un polynme Hurwitz (stable).

Dnition 3 (Polynme Hurwitz).

Un polynme coecients rels dont

toutes les racines rsident dans le demi plan complexe ouvert gauche (i.e.
sont partie relle strictement ngative) est un polynme Hurwitz.
Les polynmes Hurwitz sont caractriss par la condition ncessaire et
susante dtaille dans le thorme suivant.

Thorme 6 (Hermite-Biehler). Soit P (s) = a0 +a1 s+...+an sn un polynme


de degr

Pp (s2 ) et sPi (s2 )


P (s) = Pp (s2 ) + sPi (s2 ).

coecients rels. On dnit

et impaires de

P (s),

si bien que

les parties paires


Ce polynme est

Hurwitz si et seulement si
1. tous les zros de

w 7 Pp (w2 )

et de

w 7 Pi (w2 )

sont rels et dis-

tincts
2.

an

et

an1

sont de mme signe

3. les racines positives ranges en ordre croissant de

w 7 Pi (w2 )

(no-

wi1 ,...) et les racines positives ranges en ordre croissant de s 7


Pp (w2 ) (notes wp1 ,...) satisfont la proprit d' entrelacement

tes

0 < wp1 < we1 < wp2 < we2 < ...

26

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

Exemple 6.

2
3
Considrons le polynme P (s) = 36 + 34s + 61s + 36s +
29s4 + 11s5 + 4s6 + s7 . On a alors Pp (s2 ) = 36 + 61s2 + 29s4 + 4s6 et Pi (s2 ) =
34 + 36s2 + 11s4 + s6 . Les racines positives ranges en ordre croissant des

polynmes

w 7 Pp (w2 ) = 36 61w2 + 29w4 4w6


et

w 7 Pi (w2 ) = 34 36w2 + 11w4 w6


[1

3/2

2]

[1.2873

2.4111]. Elles satisfont bien la pro2


2
prit d'entrelacement. Tous les zros de w 7 Pp (w ) et de w 7 Pi (w )
sont rels et distincts. Enn, les coecients an = 1 et an1 = 4 sont de
mme signe. Le polynme P (s) est donc Hurwitz comme on peut aisment le
sont

et

1.8786

vrier numriquement.
De manire gnrale, ce n'est pas en calculant les racines du polynme
caractristique qu'on peut vrier que les parties relles des valeurs propres
sont ngatives, mais en analysant ses coecients. C'est l'objet du critre de
Routh explicit dans le Thorme 7. On sait d'ailleurs depuis Galois, qu'il
n'existe pas de formule gnrale utilisant des radicaux donnant les racines
d'un polynme partir de ses coecients pour un degr

Thorme 7

(Critre de Routh)

polynme de degr

Soit

n 5.

P (s) = a0 + a1 s + ... + an sn

un

coecients rels. On dnit la table de Routh partir

de ces deux premires lignes comme suit

sn
sn1
sn2
sn3
.
.
.
s0

an
an1
bn1
cn1
.
.
.
gn1

an2
an3
bn3
cn3
.
.
.
.

an4 ...
an5
bn5
cn5
.
.
.
.

bn1


1 an an2
=
an1 an1 an3

Le nombre de



1 an an4
bn3 =
, ...
an1 an1 an5


1 an1 an3
cn1 =
...
bn1 bn1 bn3
racines de P (s) ayant une partie relle positive est gal

au

nombre de changements de signe dans la premire colonne de la table de


Routh. Le polynme

P (s)

est Hurwitz si et seulement si il n'y a pas de chan-

gement de signe dans la premire colonne de la table de Routh.

1.2.

27

SYSTMES DYNAMIQUES LINAIRES

On trouvera dans [24, 25] la dmonstration de ce rsultat. Pour les sysd


x = Ax de polynme caractristique P (s) = det(sI
tmes d'ordres 2 et 3,
dt
A), on en dduit les conditions suivantes de stabilit asymptotique :
2
 pour n = 2 et P (s) = s 1 s 0 ,

0 = det(A) < 0
 pour

n=3

et

1 = tr(A) < 0.

et

(1.12)

P (s) = s3 2 s2 1 s 0 ,

0 < 0,

1 < 0,

2 < 0

0 < 1 2 .

et

(1.13)

1.2.5 Systmes linaires instationnaires


La solution gnrale du systme linaire stationnaire avec terme de forage

b(t)
d
x = Ax + b(t),
dt

x Rn ,

b(t) Rn

s'crit

exp ((t )A) b( ) d

x(t) = exp(tA)x(0) +

(1.14)

0
Si

dpend du temps

(cas instationnaire), on n'obtient pas, contrai-

rement ce qu'on pourrait croire, une formule correcte en remplaant tA


Rt
Rt
et (t )A par les intgrales
A
et
A, respectivement. La raison fon0

damentale est que le produit de deux matrices n'est pas commutatif en


gnral eth donc
n'a pas l'identit
R que l'on i
R pourtant
 fort sduisante suit
t
d
exp 0 A( ) d = A(t) exp 0 A( ) d . C'est cependant vrai
vante :
dt

A(t1 ) et A(t2 ) commutent, c.--d. A(t1 )A(t2 ) = A(t2 )A(t1 ) pour tout couple
(t1 , t2 ).
Ainsi cette quadrature instationnaire, fausse en gnrale pour n > 1, n'est
valide qu'essentiellement en dimension 1 (o la commutation est trivialement

si

vraie) : la solution gnrale de l'quation scalaire ane coecients variables

d
x = a(t)x + b(t),
dt

xR

est

Z
x(t) = exp


a( ) d

0
partir de la dimension

Z
x(0) +

Z
exp

2,


a() d b( ) d

on ne dispose plus de formules explicites et


d
gnrales pour calculer la solution de
x = A(t)x + b(t), mme si b(t) = 0.
dt

28

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

d2
x = (a + bt)x qui n'admet pas
dt2
de quadrature simple avec des fonctions usuelles (exponentielle, logarithme,
Un exemple est l'quation d'Airy [1] :

...) et qui dnit les fonctions d'Airy, une classe particulire de fonctions

spciales .
Il est faux en gnral de dire que, si chaque instant t,

A(t) a ses valeurs


d
x = A(t)x
dt

propres partie relle strictement ngative, alors les solutions de


convergent vers

0.

Un contre-exemple sut s'en convaincre. Considrons


1 + 1.5 cos2 t
1 1.5 sin t cos t
A(t) =
1 1.5 sin t cos t 1 + 1.5 sin2 t

Pour tout t, les valeurs propres de A(t) sont 0.25 0.25 7i. Or, le systme
d
x(t) = A(t)x(t) a pour solution
dt
 0.5t

e cos t et sin t
x(t) =
x0
e0.5t sin t et cos t
qui, pour des conditions initiales
diverge lorsque

t +.

x0

aussi proches de

qu'on le souhaite,

Un autre exemple, encore plus simple est fourni

par la matrice


A(t) =

0
1
(1 + k(t)) 0.2

correspondant un systme masse-ressort dont le ressort a une raideur variable dans le temps. Si on choisit
stable, alors que pour tout temps

k(t) = cos(2t)/2,

le systme devient in-

x, la matrice correspond un systme

exponentiellement stable. Une explication intuitive est que si le ressort est


raide la contraction et mou la dilatation, les dplacements de la masse
croissent au lieu de se rduire (voir [62]).
En conclusion, on ne dispose pas de mthode gnrale pour caractriser,
partir des formules donnant

A(t),

la stabilit du systme direntiel linaire


d
x = A(t)x, sauf lorsque dim(x) = 1, bien
coecients dpendant du temps
dt
sr.

1.2.6 Complments : matrices symtriques et quation


de Lyapounov
On donne ici deux rsultats utiles qui permettent de caractriser les matrices constantes ayant un polynme caractristique Hurwitz.
7. En fait l'immense majorit les fonctions spciales (fonctions de Bessel, de Jacobi
voir [7]) sont solutions d'quations direntielles du second ordre coecients polynmiaux en

: elles correspondent donc des matrices carres

coecients sont simplement des polynmes en

t.

A(t)

de dimension

dont les

1.3.

29

STABILIT DES SYSTMES NON LINAIRES

Thorme 8 (Sylvester).

Une matrice symtrique de

Mn (R)

est dnie po-

sitive si et seulement si tous ses mineurs principaux sont strictement positifs.


Le thorme suivant est souvent utilis pour construire une fonction de
Lyapounov

(dnition B) d'un systme linaire asymptotiquement stable


V (x) = xT P x)

(P sert pour exhiber

Thorme 9

(quation de Lyapounov)

trice symtrique dnie positive. Si

Soit

une matrice et

une ma-

est Hurwitz (stable), alors il existe

une matrice symtrique dnie positive

solution de l'quation suivante,

quation dite de Lyapounov

AT P + P A = Q

(1.15)

Rciproquement, s'il existe des matrices symtrique dnies positives


telles que (1.15) est vrie, alors

et

est Hurwitz (stable).

1.3 Stabilit des systmes non linaires


1.3.1 tude au premier ordre
Les notions de stabilit de la Section 1.1.3 sont, dans le cadre non linaire, locales. Autour d'un point d'quilibre, les quations non linaires de
la dynamique sont proches de leur dveloppement limit. Il est naturel de
se demander quelle information peut tre dduite d'un tel dveloppement au
premier ordre.
Comme nous l'avons voqu la Section 1.1, un systme non linaire peut
avoir plusieurs points d'quilibre isols. Autour de chacun de ces quilibres,
les quations peuvent admettre des systmes linariss tangents trs dirents et donc localement des proprits direntes. On pourra se reporter
l'exemple suivant.

Exemple 7.

Le systme suivant

d
x1 = a1 x1 x2 x1 + a2
dt
d
x2 = x2 + x21
dt
possde, suivant les valeurs des paramtres

a1 , a2 ,

un portrait de phase trs

intressant. Il est tudi en dtail dans [54]. Il s'agit en fait d'un simple sysd
tme linaire dt x = a1 x+u+a2 o on choisit une commande proportionnelle

30

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

Cycle limite
3

Foyer

Foyer

Point selle

0
4

Figure 1.8  Portrait de phase d'un systme avec deux foyers stables, un
point selle et un cycle limite instable.

8
dont le gain k varie (de manire adaptative ) selon l'quation difd
2
frentielle dt k = k + x . L'ide est que tant que le x n'a pas converg vers
zro, le gain k augmente de telle sorte que la commande entrane eective-

u = kx

ment le systme vers zro. La convergence espre de

tant exponentielle,

k devrait tre limite. On peut montrer que ce n'est pas le cas


a2 6= 0. On a reprsent sur la Figure 1.8, le portrait de phase
pour a1 = 3 , a2 = 1.1. Comme cela est montr dans [54], pour

la croissance de
si le paramtre
du systme

ces valeurs, le systme possde deux foyers stables, un cycle limite instable et
un point selle. Lorsque le systme converge, ce n'est pas vers zro.
D'aprs le thorme suivant, il est possible de dduire la stabilit asymptotique locale d'un point d'quilibre hyperbolique d'aprs son linaris tangent.

Dnition 4 (Point d'quilibre hyperbolique). Un point d'quilibre x de


d
l'quation dt x
Jacobienne

= v(x)

est dit hyperbolique si les valeurs propres de la matrice

v
(
x) =
x

vi
xj


1i,jn

sont toutes partie relle non nulle.

Thorme 10

(Stabilit asymptotique locale d'un point d'quilibre hypern


bolique (premire mthode de Lyapounov)) Soit R
3 x 7 v(x) Rn
8. La

commande adaptative

pourra se rfrer [5].

est un domaine scientique riche de l'automatique. On

1.3.

31

STABILIT DES SYSTMES NON LINAIRES

continment drivable par rapport


d'quilibre

et

x Rn

tel que

v(
x) = 0.

Le point

de

d
x = v(x)
dt
est localement asymptotiquement stable (c.f. Dnition 1) si les valeurs
propres de la matrice Jacobienne

v
(
x) =
x

vi
xj


1i,jn

sont toutes partie relle strictement ngative. Le point d'quilibre

est

instable au sens de Lyapounov si au moins l'une des valeurs propres de la


v
x) est partie relle strictement positive.
matrice Jacobienne x (
Il est important de bien comprendre ce rsultat. On commence par crire
un dveloppement limit autour de

d
d
v
x = (x x) = v(x) = v(
x) +
(
x)(x x) + (x x)
dt
dt
x
(x x) rassemble les termes d'ordres suprieurs. On ne considre que les
1 en = x x pour en dduire le systme direntiel linaire
coecients constants (A ne dpend pas du temps) suivant

termes d'ordre

d
= A
dt
v
(
x) la matrice Jacobienne de v en x. On sait,
x
d'aprs le Thorme 4, que toutes ses solutions convergent vers 0 lorsque
avec

(t) Rn

et

A =

les valeurs propres de

sont toutes partie relle strictement ngative. Le

Thorme 10 nonce que, si le systme linaire du premier ordre est asymptotiquement stable, alors les termes d'ordre suprieur ne peuvent pas tre
dstabilisateurs pour des conditions initiales proches de l'quilibre. La preuve
de ce rsultat est reproduite un peu plus loin. Elle utilise la seconde mthode
de Lyapounov, un autre outil pour montrer la stabilit d'un point d'quilibre
qui s'inspire la notion d'nergie et de dissipation. Nous dveloppons cette
mthode maintenant.

1.3.2 Fonctions de Lyapounov


titre d'introduction, reprenons l'exemple 2 de l'oscillateur harmonique
amorti et considrons la fonction

V (x1 , x2 ) =

1
2
(x1 )2 + (x2 )2
2
2

32

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

qui n'est autre que son nergie totale. Un calcul simple montre que pour

t 7 (x1 (t), x2 (t))

solution de (1.9), on a

V d
V d
d
(V (x1 (t), x2 (t))) =
x1 +
x2
dt
x1 dt
x2 dt
Or

d
x
dt 1

= x2

et

d
x
dt 2

= 2x2 2 x1 .

Donc

d
V = 2(x2 )2 0
dt
Ainsi,

t 7 V (x1 (t), x2 (t))

est une fonction dcroissante, comme elle est po-

sitive, elle converge vers une valeur positive. Il est intuitif de penser que
d
V converge vers 0 et donc que x2 converge vers 0. Mais si x2 converge
dt
vers 0, il est aussi intuitif de penser que sa drive converge aussi vers 0.
d
x = 2x2 2 x1 et donc x1 tend vers 0 aussi. Le raisonnement
Or,
dt 2
ci-dessus n'est pas trs rigoureux mais il est correct car on a aaire des

V, x1 , x2 , .... uniformment continues, c.--d. dont le mo9


dule de continuit en t ne dpend pas de t . Cette continuit uniforme vient
du fait que, comme V est dcroissante le long des trajectoires et que V est
inni quand x1 ou x2 tend vers l'inni, les trajectoires sont ncessairement
fonctions du temps

bornes et donc sont des fonctions uniformment continues du temps. En


eet, leurs drives en temps sont uniformment bornes. Or, un lemme clasRt
sique d'analyse (lemme de Barbalat) dit que, si l'intgrale
h(s)ds d'une
0
fonction uniformment continue h de [0, +[ dans R est convergente pour t
tendant vers l'inni, alors cette fonction h admet 0 comme limite en t = +.
Rt
V (t) V (0) = 0 dtd V on sait que dtd V converge vers 0 et comme
R t d2
2
d
d
V
(t)

V
(0)
=
V , dtd 2 V converge aussi vers 0. Ce qui nous donne
dt
dt
0 dt2
que x2 et x1 convergent vers 0. En fait, nous aurions pu faire le raisonne-

Comme

ment l'identique pour un systme gnral pour peu que nous disposions
d'une fonction

V,

innie l'inni (on dira non borne radialement ), borne

infrieurement et dcroissante le long de toute trajectoire.


Il est remarquable que dans ces calculs nous n'ayons jamais eu besoin
d'expliciter la loi horaire des trajectoires
force des fonctions

t 7 x1 (t)

et

t 7 x2 (t).

C'est la

dites de Lyapounov : elles fournissent des informa-

tions prcieuses sur les solutions d'quations direntielles sans requrir la


connaissance prcise des lois horaires.
Un lecteur ayant compris ce qui prcde n'aura pas de dicult montrer le rsultat suivant. Des variantes de ce thorme sont donnes dans
l'Annexe B.

R 3 t 7 h(t) Rn est dite uniformment continue si pour tout  > 0,


> 0 indpendant de t, tel que kh(t + ) h(t)k pour tout t R.

9. Une fonction
il existe

1.3.

33

STABILIT DES SYSTMES NON LINAIRES

Thorme 11

(Invariance de LaSalle)
n

Soit

Rn

un ouvert non vide.

3 x 7 v(x) R une fonction continment drivable de x. Soit 3 x 7


V (x) R une fonction relle continment drivable de x . On suppose
1. qu'il existe c R tel que le sous-ensemble Vc = {x
Rn soit un compact (ferm born dans Rn ) non vide.

V dcrot
x Vc ,

2. que

d
le long des trajectoires de dt x

= v(x),

| V (x) c}

de

c.--d. , pour tout

X V
d
V (x) = V (x) v(x) =
(x) vi (x) 0
dt
xi
i=1
x0 Vc , la solution de dtd x = v(x) reste
temps t > 0 (pas d'explosion en temps ni) et

Alors, pour toute condition initiale


dans

Vc ,

est dnie pour tout

converge vers le plus grand sous-ensemble invariant inclus dans



d
x Vc | V (x) = 0 .
dt
Une fonction

de l'espace d'tat valeur relle qui dcrot le long de


d
toutes les trajectoires, i.e., telle que
V 0 est dite fonction de Lyapounov.
dt
n
Un ensemble E R est dit invariant si, et seulement si, les solutions de
d
x = v(x) dont les conditions initiales appartiennent E , restent dans E
dt
pour les temps t o elles sont dnies. Ainsi, l'ensemble invariant dont il est
question dans le thorme 11 est caractris par le systme sur-dtermin de

n+1

quations

d
1 = v1 ()
dt
.
.
.

d
n = vn ()
dt
n
X
V
i=1

xi

() vi () = 0

n inconnues (1 (t), . . . , n (t)) Vc qui sont des fonctions continment drivables de t. Pour rsoudre ce systme, i.e., obtenir les quations de l'ensemble
et

invariant de LaSalle, il sut de driver un certain nombre de fois la dernire


d
quation et de remplacer, chaque nouvelle drivation en temps, les
par
dt i
vi (). On obtient ainsi une famille d'quations portant uniquement sur qui
caractrise cet ensemble limite qui attire les trajectoires initialises dans
c'est un attracteur .

Vc

34

CHAPITRE 1.

Dans le cas o
que

(t) = x

SYSTMES DYNAMIQUES ET RGULATEURS

x Vc

est un point d'quilibre,

v(
x) = 0 ,

il est clair

est une solution du systme sur-dtermin prcdent et donc

appartient cet ensemble limite. Si, maintenant,

est l'unique solution de

ce systme sur-dtermin, alors on est sr que les trajectoires du systme qui

Vc

dmarrent dans

convergent toutes vers

x.

Si maintenant, on suppose dans le thorme 11 que le paramtre


peut tre choisi aussi grand que l'on veut, alors d'une part,

quand

kxk

cR

tend vers

tend vers l'inni c.--d. que V est non borne radialement

x(t) est borne pour les temps t > 0 car


contenue dans Vc avec c = V (x(0)). Enn, si on suppose en plus que le
point d'quilibre x
est l'unique solution = x du systme sur-dtermin cidessus, alors toutes les trajectoires convergent vers l'quilibre x
qui est dit
et, d'autre part, toute trajectoire

globalement asymptotiquement stable .

Exemple 8.

Considrons un systme scalaire,

dim(x) = 1,

de la forme

d
x = v(x(t))
dt
o

(fonction Lipschitz) satisfait les deux proprits suivantes :

2.

R +
0

x 6= 0

xv(x) < 0
R0
v(x)dx = , et v(x)dx = +

1. pour tout

La forme gnrale de

on a

est donne sur la Figure 1.9. Une fonction candidate

tre de Lyapounov est

Z
V (x) =

v( )d
0

Par construction, d'aprs le point 1,

est continue et possde une drive

continue. On a

d
V (x) = v(x)2
dt
d
Donc, pour tout x, dt V (x) 0. Enn, d'aprs le point 2, V (x) + lorsque
|x| +. D'aprs le Thorme 11, on peut prendre pour c n'importe quelle
d
valeur positive. Comme dt V = 0 implique x = 0, on en dduit que 0 est
globalement asymptotiquement stable. titre d'exemple, on obtient, par ce
raisonnement, la stabilit asymptotique de l'origine pour le systme

d
x = x sinh x
dt
alors qu'en considrant le linaris tangent autour de
conclure (le point d'quilibre

n'tant pas hyperbolique).

0,

on ne peut pas

1.3.

35

STABILIT DES SYSTMES NON LINAIRES

Figure 1.9  Forme gnrale de la fonction v.


Montrons en quoi la preuve du Thorme 10 repose sur le Thorme 11
d'invariance de LaSalle. Avec les notations du Thorme 10, considrons un
point d'quilibre

x.

On suppose que les valeurs propresdu linaire


 tangent,

c.--d. les valeurs propres de la matrice Jacobienne

A=

vi
(
x)
xj

sont
1i,j,n
toutes partie relle strictement ngative. Il nous faut construire une fonc-

x. On sait que exp(tA) est une matrice qui


converge exponentiellement vers 0 quand t tend vers + (voir Proposition 2).
tion de Lyapounov

autour de

On pose

exp(sAT ) exp(sA) ds

P =
0
o

est la transpose de

A.

Par cette construction,

est une matrice

symtrique dnie positive. On pose

V (x) = (x x)T P (x x).


Ainsi on a

Z
V (x) =

[exp(sA)(x x)]T exp(sA)(x x) ds

0
On a en drivant par rapport au temps sous le signe somme

d
V (x) =
dt
Z + 

T
T
[exp(sA)(x x)] exp(sA)v(x) + [exp(sA)v(x)] exp(sA)(x x) ds
0
d
x
dt

= v(x). Comme v(x) = A(x x) + o(kx xk), on a


Z +
d
V (x) =
[exp(sA)(x x)]T exp(sA)A(x x) ds
dt
0
Z +
+
[exp(sA)A(x x)]T exp(sA)(x x) ds + o(kx xk2 )

car

36

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

Ainsi,

avec la matrice

d
V (x) = (x x)T Q(x x) + o(kx xk2 )
dt
symtrique Q, dnie par l'intgrale

Q=


[exp(sA)A] exp(sA) + [exp(sA)] exp(sA)A ds
T

0
Comme

d
ds

exp(sA) = exp(sA)A

(voir Proposition 1), on a


d 
(exp(sA))T exp(sA) = [exp(sA)A]T exp(sA) + [exp(sA)]T exp(sA)A
ds
et donc l'intgrale dnissant
plement

se calcule explicitement, pour donner sim-


s=+
Q = (exp(sA))T exp(sA) s=0 = I

est la matrice identit de taille

n.

Ainsi, on a

d
V (x) = kx xk2 + o(kx xk2 )
dt
d
V 0 pour
dt
Thorme 11 avec c
Donc

d'quilibre

x assez proche de x et ne s'annule qu'en x = x. Le


> 0 assez petit permet alors de conclure : le point

est localement asymptotiquement stable.

d
x = v(x)
dt
sont toutes partie relle ngative, des petits carts l'quilibre sont natuAinsi, lorsque les valeurs propres au point d'quilibre

de

rellement amortis : le systme oublie sa condition initiale et converge vers

x.

Le systme n'est que transitoirement aect pas une petite perturbation de


conditions initiales.

1.3.3 Robustesse paramtrique


Imaginons que les quations dpendent en fait de paramtres nots p =
(p1 , . . . , pr ) Rr plus ou moins bien connus : dtd x = v(x, p), avec v fonction
continment drivable par rapport x et p. On suppose que, pour une valeur

p, le systme admet un point d'quilibre x, v(


x, p) = 0
propres du systme linaris tangent en ce point x
sont

nominale du paramtre
et que les valeurs

toutes partie relle strictement ngative. Qu'en est-il des systmes voisins
obtenus pour des valeurs de p proche de p
? En fait, pour p proche de p, dtd x =
v(x, p) admet aussi un point d'quilibre (p) qui dpend continment de p,

v((p), p), (
p) = x.

De plus, les valeurs propres en

(p)

sont toutes partie

relle strictement ngative. Ainsi, qualitativement, le systme ne change pas

1.3.

37

STABILIT DES SYSTMES NON LINAIRES

de comportement lorsqu'on bouge un peu les paramtres : localement autour


de

x,

les trajectoires convergent vers un point d'quilibre unique qui reste

proche de

x.

La situation est dite robuste au sens o elle ne change que trs

peu lorsque l'on bouge un peu la condition initiale et les paramtres.


L'existence de

(p)

rsulte en fait du thorme des fonctions implicites.

pour p = p
on
vi
x, p) est
a une solution x
; pour cette solution x, la matrice Jacobienne xj (

Le point d'quilibre est dni implicitement par

v(x, p) = 0 ;

inversible (pas de valeur propre nulle puisqu'elles sont toutes par hypothse
partie relle strictement ngative) ;
les valeurs propres en

(p)

dpend continment de

p. Le fait que

restent partie relle strictement ngative, vient

du fait que les valeurs propres d'une matrice dpendent de faon continue de
ses coecients

10

1.3.4 Complments : caractre intrinsque des valeurs


propres du systme linaris tangent
Les valeurs propres du linaire tangent associ un quilibre sont des
nombres intrinsques, i.e. ils ne dpendent pas des systmes de coordonnes x.
d
x = v(x), on considre un jeu particulier de variables
Lorsque qu'on pose
dt
pour crire les quations du systme. Ici, on a choisi, pour reprsenter notre
n
systme les variables (x1 , . . . , xn ) R . Ce choix est clairement arbitraire :
on pourrait tout aussi bien prendre d'autres variables, par exemple les variables

z = (z1 , . . . , zn ) dnies par une correspondance


x : z = (x) et x = (z) o les fonctions

variables

bi-univoque avec les


et

sont des appli-

cations inverses l'une de l'autre. Par exemple, pour reprer un point dans la
plan on doit dnir un jeu de deux nombres. On peut prendre les coordonnes cartsiennes avec l'abscisse et l'ordonne mais on peut aussi prendre les
coordonnes polaires avec un angle et la distance l'origine. Il est vident
que les rsultats de nature qualitative ne doivent pas dpendre du choix des
variables. C'est bien le cas de la proprit de stabilit.
d
Si dans les variables x, la dynamique s'crit
x = v(x) et qu'elle admet
dt
un point d'quilibre x
asymptotiquement stable, alors dans les variables z ,

x aura son
z sera bientransformations et

les quations vont bien-sr changer, mais le point d'quilibre


correspondant

via les transformations inversibles

sr lui aussi asymptotiquement stable. Supposons les

et

et

rgulires (diomorphismes continment drivables). Alors, les quations

dans les variables

se dduisent de celles dans les variables

0
10. Onn'a pas en gnral de dpendance plus rgulire que C

0 1
avec p proche de 0 ; les valeurs propres sont p.
p 0

par un simple

: prendre par exemple

38

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

calcul de fonctions composes

d
d
x = (z) =
dt
dt

d
z = v((z))
dt

Ainsi,

 1
d

z = w(z) =
v((z))
dt
z
Comme
de

en

v(
x) = 0, w(
z ) = 0. Un calcul montre alors que la matrice Jacobienne
x est semblable celle de w en z
w
v

(
z)
(
z) =
(
x) (
z)
z
z
x
z

(
z ) est une matrice inversible. Il sut de driver par rapport
z
relation
car

la

(z) w(z) = v((z))


z
et de remarquer, puisque w(
z ) = 0, qu'il n'est pas utile de calculer la drive
2
seconde
car elle est en facteur de w(
z ). Ainsi les valeurs propres obtenues
z 2
avec les variables x sont les mmes que celles obtenues avec les variables z .
Le spectre de la matrice du linaire tangent autour d'un point d'quilibre
est indpendant du choix des variables que l'on choisit pour faire les calculs.
Ces valeurs propres ont pour unit l'inverse d'un temps : ce sont des indicateurs intrinsques caractrisant les chelles du systme. On les appelle aussi
exposants caractristiques.

1.3.5 Complments : les systmes dynamiques dans le


plan
Dans bien des cas pratiques, on se trouve confront des systmes de
dimension 2. Il est notable que, dans ces cas, on peut tablir un certain
nombre de rsultats thoriques trs informatifs. Nous les prsentons dans ce
qui suit.

Thorme 12

d
Le systme autonome plan dt x = v(x) avec x
R2 , ne peut admettre que quelques types de rgimes asymptotiques possibles.
0
2
tant donne une condition initiale x R , considrons t 7 x(t) la solution
d
0
de dt x = v(x) qui dmarre en t = 0 en x . Alors, pour des temps t 0, on ne
peut avoir que les cas de gure suivants (voir illustrations sur la Figure 1.10) :
(Poincar)

1.3.

39

STABILIT DES SYSTMES NON LINAIRES

Figure 1.10  Les quatre comportements asymptotiques possibles pour une


trajectoire d'un systme dynamique autonome dni dans le plan.

x(t) ne reste pas born, alors soit x(t) explose en temps ni, soit x(t)
n'explose pas en temps ni mais alors x(t) est dni pour tout t > 0 et
limt7+ kx(t)k = +. En rsum : si la trajectoire n'est pas borne

1. Si

pour les temps positifs, elle converge vers l'inni en temps ni ou en
temps inni.

x(t) reste born pour les temps positifs alors elle est dnie pour tout
temps t > 0 et on distingue trois cas :
0
(a) soit x(t) converge vers un point d'quilibre (en temps inni si x

2. Si

n'est pas un point d'quilibre)


(b) soit

x(t)

converge vers une trajectoire priodique ( cycle limite)

(c) soit

x(t)

s'enroule autour d'une courbe ferme du plan forme de

trajectoires qui partent en


arrive en

t = +

t =

d'un point d'quilibre et qui

vers, a priori, un autre point d'quilibre (orbite

htrocline si les deux points d'quilibres sont dirents et orbite


homocline si les deux points d'quilibres sont identiques).
En rsum, lorsque la trajectoire reste borne elle converge soit vers un
point soit vers une courbe ferme du plan, courbe qui est tangente au champs

de vecteurs

v(x).

Ainsi en dimension

2,

on ne peut pas avoir de comporte-

ments asymptotiques trs compliqus : il est d'usage de dire qu'en dimension


deux, il ne peut pas y avoir de chaos. Il faut bien comprendre que cela n'est
1
1
vrai que pour le plan (sur le tore S S ce n'est plus vrai, les trajectoires
peuvent tre partout denses), et que pour les systmes continus autonomes,
i.e., dnis par deux quations direntielles scalaires ne dpendant pas du
temps. L'argument essentiel de dmonstration est l'unicit des trajectoires.
Dans le plan deux trajectoires ne peuvent se couper sans tre confondues.
Si l'on rajoute par exemple une dpendance priodique en temps

v(x, t + 2)

v(x, t)

alors ce n'est plus vrai. Le systme autonome sous-jacent est de

40

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0

0.2

0.4

0.6

0.8

Figure 1.11  Premire bissectrice et graphes de la fonction logistique [0, 1] 3


x 7 f (x) = 4x(1x) [0, 1] et de ses deux premires itres, f f
dimension

3 : (x1 , x2 , ) R2 S1

et

f f f .

avec

d
d
d
x1 = v1 (x1 , x2 , ),
x2 = v2 (x1 , x2 , ),
= 1.
dt
dt
dt
Ce n'est plus vrai non plus avec les systmes discrets mme de dimension
un. Par exemple les solutions de l'quation logistique

xk+1 = 4xk (1 xk )

qui

x0 [0, 1] restent toujours dans [0, 1] mais elles sont partout


[0, 1]. Pour comprendre ce phnomne il faut tudier des itres

dmarrent en
denses dans

de la formule de rcurrence. On a reprsent les applications correspondantes


sur la Figure 1.11. Les rgimes asymptotiques pour les indices

grands sont

complexes.
Sous une hypothse supplmentaire, on peut spcier la nature de la
limite.

Thorme 13 (Critre de Bendixon). Soit R2 3 x 7 v(x) R2 une fonction

v
v
continue et drivable. On suppose que div(v)(x) = x1 (x) + x2 (x) < 0 pour
1
2
d
2
presque tout x R . Soit t 7 x(t) une solution de dt x = v(x) qui reste

borne pour les temps

positifs. Alors, sa limite quand


un point d'quilibre, i.e., une solution x
R2 de v(
x) =

t tend
0.

vers

est

Ce rsultat n'est plus du tout vrai en dimension suprieure deux. Il sut


de prendre le systme chaotique de Lorenz (reprsent sur la Figure 1.12) de
l'exemple suivant.

1.3.

STABILIT DES SYSTMES NON LINAIRES

41

45
40
35
30
25
20
15
10
5

10
0
10

10

20

10

20

Figure 1.12  Systme chaotique de Lorenz.


Exemple 9 (Systme de Lorenz).

avec

s = 10, r = 28

et

dx1
dt
dx2
dt
dx3
dt

= s(x1 + x2 )
= rx1 x2 x1 x3
= bx3 + x1 x2 ,

b = 8/3.

divergence du champs de vecteurs,

Toutes les trajectoires sont bornes, la

s 1 b < 0,

et les trajectoires ont

des comportements asymptotiques complexes et encore aujourd'hui assez mal


compris.
De la caractrisation des rgimes asymptotiques illustrs sur la Figure 1.10,
on peut montrer directement le rsultat suivant, rsultat utile pour montrer
l'existence d'une orbite priodique (cycle limite) tel qu'illustre sur la Figure 1.13.

Thorme 14

R2 3 x = v(x) R2 une fonction


d
1
de classe C . On considre le systme dynamique dt x = v(x). On suppose
qu'il existe dans le plan un ensemble compact tel que
 toute trajectoire ayant sa condition initiale dans reste dans pour
les temps t > 0 ( est positivement invariant).
(Poincar-Bendixon)

Soit

42

CHAPITRE 1.

Figure

SYSTMES DYNAMIQUES ET RGULATEURS

1.13  Existence d'un cycle limite dans un compact positivement

invariant et qui ne comporte qu'un seul point d'quilibre type foyer instable
ou nud instable .

 soit

ne contient aucun point d'quilibre, soit

contient un unique

point d'quilibre dont toutes les valeurs propres sont partie relle strictement positive.
alors

contient une orbite priodique (cycle limite).

L'ide derrire cet nonc est que les trajectoires bornes dans le plan
doivent approcher des orbites priodiques ou des points d'quilibre lorsque
le temps tend vers l'inni. Si

ne contient aucun point d'quilibre alors il

doit contenir une orbite priodique. Si

contient un unique point

d'quilibre

hyperbolique instable dans toutes les directions, alors au voisinage de ce point,


les trajectoires sont repousses par ce point. Il est alors possible de dnir
une courbe ferme permettant d'exclure ce point et de se ramener au cas
prcdent.

Exemple 10

(Exemple de cycle limite : l'onde de densit)

Un exemple de

cycle limite observ en pratique sur site industriel est donn par l'onde de
densit. Ce phnomne apparat sur les puits de ptrole activs par gas-lift.
La technique d'activation par gas-lift des puits de ptrole (reliant un rservoir situ en profondeur aux installations de surface) permet de produire des
hydrocarbures partir de champs matures. Au dbut de la production d'un
puits la pression du rservoir sut frquemment propulser les hydrocarbures
jusqu' la surface o le ptrole est rcupr. C'est une phase de production

1.3.

STABILIT DES SYSTMES NON LINAIRES

43

vanne de production
E

fond de l'ocan

production
de gaz et d'huile

arrive
de gaz

tubing
D
casing
B

vanne C
d'injection
rservoir
d'hydrocarbures

rservoir
F
dbit d'huile du rservoir

Figure 1.14  Schma d'un puits de ptrole activ par gas-lift.

dite naturelle qui, suivant les caractristiques du rservoir, peut durer de


quelques de nombreuses annes. Malheureusement en expulsant les euents
vers la surface, le rservoir tend se dpressuriser jusqu' n'tre plus capable
de contrebalancer le poids de la colonne de liquide dans le puits. Il faut alors
recourir des moyens d'activation. Le gaz est inject au fond du puits, il
peut alors tre utilis pour pousser le liquide ou pour s'y mler de faon
diminuer la masse volumique moyenne. On peut se reporter la Figure 1.14
pour voir les dirents lments permettant la production (tubing, partie centrale) et l'injection de gaz (casing, partie annulaire). On a reprsent sur la
Figure 1.15 le cycle limite observ sur site. Ces oscillations nonlinaires font
sensiblement diminuer le dbit de production et donc la rentabilit du champs
ptrolier (elles concourent galement endommager les installations par les
-coups de pression coups de blier ds l'inhomognit de l'coulement).
Comme cela a t mentionn dans la Section 1.1, on constate en pratique une
parfaite rptabilit de l'tablissement du cycle limite, et que sa forme (mais
pas sa phase) ne dpend pas des conditions initiales. Il s'agit eectivement

44

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

0.5

0
0

0.5

1.5

2.5

3.5

0.5

1.5

2.5

3.5

0.5

0
0

Figure 1.15  Onde de densit dans un puits activ en gas-lift. On peut clairement observer un cycle limite suivi par la pression en tte de tubing (courbe
du haut) et une production par bouchons (courbe du bas) trs dommageable
pour le dbit d'huile produit (donnes normalises TOTAL 2006).

d'un cycle limite. On pourra se rfrer [65] pour plus de dtails.

Exemple 11

(Les systmes de Linard et leurs cycles limites)


d
T
systme de Linard les systmes de dimension 2 d'tat (x, dt x)

On appelle

d2
d
x
+
f
(x)
x + g(x) = 0
dt2
dt
o

et

1.

est paire et

sont des fonctions

C1

satisfaisant les conditions suivantes

est impaire et strictement positive sur

f nulle en zro F (x) = 0 f (x)dx est ngative sur un


0 < x < a, nulle en a, jamais dcroissante pour x > a et
+ lorsque |x| .

2. La primitive de
intervalle
tend vers

R+

Rx

Ces systmes possdent une unique solution priodique. Ce rsultat est connu
sous le nom de thorme de Linard (on pourra se rfrer [12]). Un exemple
de tel systme est l'oscillateur de Van der Pol

d2
d
2
x
+
(x

1)
x+x=0
dt2
dt
Ces quations reprsentent un circuit lectrique oscillant rsistance ngative (telle qu'on peut les reproduire avec des lampes de puissance). Ce circuit

1.4.

45

SYSTMES MULTI-CHELLES LENTS/RAPIDES

5
4
3
2
1
0
-1
-2
-3
-4
-5

-2

Figure 1.16  Oscillations du systme de Van der Pol et attraction du cycle


limite.

augmente naturellement l'amplitude des faibles oscillations tandis qu'elle attnue celle des oscillations trop fortes. On a reprsent sur la Figure 1.16
le portrait de phases d'un oscillateur de Van der Pol. Pour

 > 0,

le cycle

limite prvu par le thorme de Linard est attractif, tandis que l'origine est
un point d'quilibre instable. Plus

est grand plus les trajectoires convergent

rapidement vers ce cycle limite. La priode laquelle est parcourue de manire asymptotique le cycle limite est approximativement gale pour

grand

(3 2 ln(2)).

1.4 Systmes multi-chelles lents/rapides


Toutes les analyses mathmatiques que nous proposons reposent sur un
modle de la physique du systme que nous avons tudier. Dans ce contexte,
toute simplication pralable des quations peut sembler la bienvenue, mais
on peut lgitimement se demander si ces simplications ne risquent pas de
remettre en cause la validit des conclusions qu'elles ont permis d'tablir.
Le systme rel est en gnral nettement plus complexe que la modlisation
qu'on en fait. Une tendance naturelle est de proposer des modles de plus
en plus compliqus et de fait inextricables, ce qui est, en y rchissant bien

46

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

assez facile et ne mne pas trs loin dans la comprhension des phnomnes.
Par exemple, on ne peut pas en gnral mener d'analyse thorique de stabilit comme nous l'avons fait sur un systme de grande dimension. Il est en
revanche nettement plus dicile de proposer un modle de complexit minimale compte tenu des phnomnes que l'on souhaite comprendre et contrler.
Le but de cette section est de donner quelques rsultats gnraux sur les systmes multi-chelles et leur approximation, sous certaines hypothses, par
des systmes moins complexes et ne comportant essentiellement qu'une
seule chelle de temps. C'est une des voies possibles pour justier la pertinence de modles rduits sur lesquels on sait prouver mathmatiquement
des rsultats de stabilit et de robustesse. Les modles plus compliqus, plus
proches en quelque sorte de la ralit au sens platonicien du terme et trs
utile comme modles de simulation, sont alors vu comme des perturbations,
prenant en compte des dynamiques rapides et donc des phnomnes hautes
frquences, de modles plus simples, de petites dimensions et trs souvent
utiliss en contrle.

1.4.1 Perturbations singulires


Le premier outil que nous prsentons est la thorie des perturbations sin-

gulires . Cette thorie a pour origine l'tude des phnomnes de couches


limites dans les coulements prs des parois d'un uide avec une faible viscosit. Certaines terminologies en sont directement inspires.
La thorie des perturbations permet de relier les trajectoires de deux
systmes ayant des espaces d'tat de dimensions direntes. Dans ce cadre,
le systme perturb possde un nombre d'tats plus grand que le systme
rduit. Plus prcisment, cette thorie vise liminer les eets court terme
et ne conserver que les eets long terme. C'est un outil prcieux pour
la construction de modles rduits rsumant l'essentiel des comportements
qualitatifs long terme.
De manire gnrale, on distingue deux cas illustrs par la Figure 1.17 :
 premier cas : les eets rapides se stabilisent trs vite et on parle alors
de perturbations singulires, d'approximation quasi-statique, ou encore
d'approximation adiabatique ;
 second cas : les eets rapides ne sont pas asymptotiquement stables
mais restent d'amplitude borne ; ils sont donc oscillants et l'on parle
alors indiremment de moyennisation ou d'approximation sculaire .
Seul le premier cas est abord ici. Le second est trait dans l'Annexe C
lorsque la dynamique rapide est priodique. Les cas plus gnraux o la
dynamique rapide n'est pas priodique sont nettement plus diciles formaliser : il faut passer par la thorie ergodique des systmes dynamiques

1.4.

47

SYSTMES MULTI-CHELLES LENTS/RAPIDES

systme lent-rapide

systme lent

perturbations

singulires

0
x

0
x

moyennisation

Figure 1.17  La thorie des perturbations consiste liminer les eets


court terme,

t ,

qu'ils soient asymptotiquement stables ou oscillants, an

de ne conserver que les eets long terme,

t 1 (0 <  1).

pour obtenir la dynamique lente en prenant des moyennes faisant intervenir la mesure asymptotique du rapide : la dynamique rapide est alors vue
comme un bruit haute frquence dont il faut connatre la loi de probabilit
(la mesure asymptotique) qui dpend en gnral des variables lentes.
On considre les systmes continus du type

( )

dx

dt = f (x, z, )

dz = g(x, z, )
dt

avec

x Rn , z Rp ,

0 <  1 est un petit paramtre, f et g sont


x correspond aux variables dont l'vosignicative sur une dure en t de l'ordre 1) et z

des fonctions rgulires. L'tat partiel


lution est lente (variation

correspond aux variables dont l'volution est rapide (variation signicative


sur une dure en

de temps rapide et

de l'ordre de

t1

).

On dit que

l'chelle de temps lente.

correspond l'chelle

48

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

Figure 1.18  Le champs des vitesses est quasi-vertical pour la forme nor
male de Tikhonov ( ).

Considrons pour commencer l'exemple suivant

11

x=z
dt

d z = x z
dt
avec 0 <  1. Intuitivement, on voit que x est une variable lente (sa vitesse
est petite et d'ordre 1), tandis que z est une variable rapide (sa vitesse est
d'ordre 1/). On a donc envie de dire que z atteint rapidement son point
d
x = x. Cette ide est
d'quilibre z = x et que, par suite, x volue selon
dt
fondamentalement correcte ds que les eets rapides sont asymptotiquement
stables.
La situation gomtrique est donne par la Figure 1.18 : pour
petit et localement autour de

g(x, z, 0) = 0,

> 0 assez

les trajectoires du systme sont

quasi-verticales et convergent toutes vers le sous-ensemble de l'espace d'tat


(sous-varit ) donn l'ordre

en

par l'quation

g(x, z, 0) = 0.

Les rsultats ci-dessous justient alors, sous essentiellement l'hypothse


d
de stabilit asymptotique x constant de la dynamique rapide en z , z =
dt

g(x, z, 0), l'approximation des trajectoires du systme perturb ( ) par celles


0
du systme lent ( ) obtenu en faisant = 0 dans les quations

( )

dx
dt

= f (x, z, 0)

0 = g(x, z, 0)
11. Comme autre exemple caractristique citons la cintique chimique o les constantes
de vitesses de certaines ractions peuvent tre nettement plus grandes que d'autres (cintiques lentes et cintiques trs rapides).

1.4.

49

SYSTMES MULTI-CHELLES LENTS/RAPIDES

On nglige ainsi les convergences rapides vers la sous-varit donne approximativement par les quations statiques g(x, z, 0) = 0. Toute trajectoire du

systme ( ) dmarrant en (x, z) est proche, aprs une dure en t de l'ordre


0
de , de la trajectoire du systme lent ( ) dmarrant avec le mme x (projection selon la verticale, voir Figure 1.18).
Nous voyons que cette approximation s'accompagne d'une diminution de
la dimension de l'tat. En fait, la rduction n'est qu'une restriction une

sous-varit invariante attractive, les quations de cette sous-varit tant


approximativement donnes par

g(x, z, 0) = 0.

On a le premier rsultat g-

nral suivant (sa dmonstration gure dans [71])

Thorme 15 (Tikhonov). Soit le systme ( ). Supposons que


H1 l'quation g(x, z, 0) = 0 admet une solution, z = (x), avec
rgulire de

fonction

telle que la matrice Jacobienne partielle

g
(x, (x), 0)
z
est une matrice dont toutes les valeurs propres sont partie relle strictement ngative (Hurwitz) ; on dit alors que le systme est sous forme
standard ;

H2

le systme rduit

dx
dt

= f (x, (x), 0)
x(t=0) = x0

admet une unique solution


Alors, pour

x0 (t)

susamment proche de

pour

0,

(1.16)

t [0, T ], 0 < T < +.


( )

admet une
0
unique solution (x (t), z (t)) sur [0, T ] ds que la condition initiale z appar0
tient au bassin d'attraction du point d'quilibre (x ) du sous-systme rapide

le systme complet

d
= g(x0 , , 0).
dt

De plus on a

lim0+ x (t) = x0 (t)


uniformment pour

lim0+ z (t) = z0 (t)

t dans tout intervalle ferm de la forme [a, T ] avec a > 0.

Par le Thorme 4, l'hypothse


de

et

H1 implique que, x x, la dynamique

d
= g(x, , 0).
dt

50

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

est localement asymptotiquement stable autour du point d'quilibre


Remarquons aussi que

(0 )

(x).

s'crit ainsi

d
x = f (x, (x), 0)
dt
avec

z = (x), la fonction x 7 (x) tant dnie implicitement par g(x, , 0) =

0.
Sans hypothses supplmentaires, l'approximation du Thorme 15 n'est
valable, en gnral, que sur des intervalles de temps

de longueur borne

T.

L'hypothse supplmentaire, qu'il convient alors d'utiliser pour avoir une


bonne approximation pour tous les temps positifs, concerne le comportement
asymptotique du systme rduit (1.16) : si ce dernier admet un point d'quilibre dont le linaire tangent est asymptotiquement stable, l'approximation
est alors valable pour tous les temps positifs (pourvu que la condition initiale
x0 soit dans le bassin d'attraction de l'quilibre de la dynamique lente).

Thorme 16

(Prservation de la stabilit)

Supposons en plus des hypo-

thses du Thorme 15 que le systme rduit (1.16) admet un point d'quilibre

x : f (
x, (
x), 0) = 0

et que les valeurs propres de la matrice

f
f
+

x z x


(
x,(
x),0)

sont partie relle strictement ngative. Alors, pour tout 0 assez proche

de 0, le systme perturb ( ) admet un point d'quilibre proche de (


x, (
x))
et dont le linaire tangent est asymptotiquement stable.

Preuve

L'existence du point stationnaire pour le systme perturb est lais-

se en exercice (il sut d'utiliser le thorme des fonctions implicites pour

g=0

f = 0). Quitte faire, pour chaque une translation,


(0, 0) est point stationnaire du systme perturb

et ensuite pour

nous supposons que

f (0, 0, ) = 0,

g(0, 0, ) = 0

x proche de 0, z = (x), la solution proche de 0 de g(x, z, ) =


(0) = 0. Considrons le changement de variables (x, z) 7 (x, w = z (x)). Dans les coordonnes (x, w),
le systme perturb admet (x, w) = (0, 0) comme point d'quilibre et ses

Notons, pour

0.

Suite la translation prcdente, on a

quations ont la forme suivante

d
x = F (x, w, ),
dt

d
w = G(x, w, )
dt

1.4.

51

SYSTMES MULTI-CHELLES LENTS/RAPIDES

avec

F (x, w, ) = f (x, w+ (x), ),


Sa matrice Jacobien en


J =

(0, 0)

G(x, w, ) = g(x, w+ (x), )

F (x, w, ).
x

est alors donne par

F
(0, 0, )
x
1 G
(0, 0, )
x

F
(0, 0, )
w
1 G
(0, 0, )
w


=

A
C A

B
1
D + E

A =

f
f

(0, 0, ) +
(0, 0, )
(0), B =
(0, 0, ), C =
(0),
x
z
x
z
x
f
g
(0, 0, ), E =
(0) (0, 0, )
D =
z
x
z

On a utilis le fait que g(x, 0+ (x), ) 0 et que F (0, 0, ) = 0. Les matrices


A , B , C , D et E dpendent rgulirement de et convergent vers A0 , B0 ,
C0 , D0 et E0 quand tend vers 0 avec, par hypothse A0 et D0 stables. On
va montrer que pour > 0 assez petit, J est stable. Soit et Y une valeur
propre et vecteur propre de J . On peut toujours supposer Y de longueur
1 et que 7 ( , Y ) est continue (les valeurs propres, vecteurs propres
dpendent continment des coecients de la matrice). On dcompose alors

en

(X , W )

selon les coordonnes

A X + B W =

C A X +

On a alors

1
D


+ E W =

W .

0 est valeur propre de D0 donc <( ) < 0 pour


 >0
W0 = 0 est alors X0 6= 0 et avec A0 X0 = lim70+ X0 on
dduit aussi que pour > 0 assez petit, <( ) < 0.
Ainsi les valeurs propres de J sont parties relles strictement ngatives
pour > 0 assez petit.
Soit

W0 6= 0

X ,

(x, w).

est alors

assez petit. Soit

Cette preuve peut tre amliore pour montrer que l'approximation du


Thorme 15 devient valide, localement autour de
les temps

positifs, ds que

indpendant de

(
x, (
x))

et pour tous

est assez petit (le caractre local tant alors

tendant vers zro).

1.4.2 Feedback sur un systme deux chelles de temps


12

En thorie des systmes, le Thorme 16 est utilis constamment


de

la manire suivante. Rajoutons une commande u ( ) et supposons,


12. C'est un peu comme Monsieur Jourdain dans le Bourgeois Gentil-Homme de Molire
lorsqu'il ralise qu'il parle constamment en prose.

52

CHAPITRE 1.

commande

SYSTMES DYNAMIQUES ET RGULATEURS

xe, que les hypothses du Thorme 15 de Tikhonov soient

valables. Ainsi

dx
dt

= f (x, z, u, )
(1.17)

dz = g(x, z, u, )
dt
avec (x, u) le point d'quilibre asymptotiquement stable de la partie rapide
d
= g(x, , u, 0). Le systme lent est alors dx
= f (x, (x, u), u, 0).
dt
dt
Supposons que nous ayons un retour d'tat lent u = k(x) tel que le
systme lent boucl soit asymptotiquement stable autour du point d'quilibre

(
x, u = k(
x)).

Alors pour tout

>0

assez petit, le systme perturb (1.17)

u = k(x), admet un point d'quilibre hyperbolique proche


(
x, z = (
x, u)). Cela veut simplement dire que l'on peut, pour la synthse

avec le bouclage lent


de

d'un bouclage, ignorer des dynamiques asymptotiquement stables et assez


rapides. On parle alors de robustesse par rapport aux dynamiques ngliges.
Noter que le retour d'tat ne porte que sur la partie lente,
du type

u = k(x, z)

x.

Un bouclage

apparat directement est envisageable mais alors il

faut vrier que la dpendance en

de

ne dtruise pas la stabilit de la

dynamique rapide

d
= g(x, , k(x, ), 0)
dt

C'est toujours le cas lorsque

ne dpend pas de

g
u

= 0.

1.4.3 Modle de contrle et modle de simulation


Pour les besoins de simulation ou de conception d'un rgulateur, on n'a
pas besoin d'utiliser le mme modle. Ainsi il n'y a pas de modle universel.
Pour

petit il sut, pour concevoir le feedback

u = k(x)

de prendre par

exemple comme modle, l'approximation lente de (1.17)

d
x = f (x, (x, u), u, 0).
dt
Pour la simulation, il peut cependant tre utile de vrier que le feedback

u = k(x)

inject dans les quations (1.17) donne des rsultats proches de

ceux que l'on aurait avec le modle lent en boucle ferme

d
x = f (x, (x, k(x)), k(x), 0)
dt
Cela permet de vrier si

est assez petit pour que le thorme soit ap-

plicable. En pratique, on remarque que

n'a pas besoin d'tre trs petit :

1.4.

53

SYSTMES MULTI-CHELLES LENTS/RAPIDES

on constate qu'un rapport de

entre les constantes de temps de la dyna-

mique rapide et celles de la dynamique lente donne bien souvent une bonne
approximation. Cela veut dire que

= 1/2

est dj petit.

Voyons en dtail la conception d'un contrleur. On part d'un modle


de contrle issu d'une modlisation mme trs grossire du systme pour
dcrire les corrlations entre les entre

(u, w) et les mesures y . Ce modle est

le modle d'tat

d
x = f (x, u, w, p), y = h(x)
dt
dpendant des paramtres p. On labore partir de ce modle de contrle et
pour une valeur nominale des paramtres p
, une loi de contrle sous la forme
d'un retour dynamique de sortie (comme l'est un contrleur PI )

d
=a
(y, , v),
dt
o

, v)
u = k(y,

est le nouveau contrle (pour le PI c'est la consigne). On est alors sr

du comportement du systme boucl nominal

x = f (x, k(h(x),
, v), w, p),
dt

d
=a
(h(x), v)
dt

Par exemple, on sait que lorsque les perturbations

et le nouveau contrle

sont constant, le systme est asymptotiquement stable.


On peut bien sr rsoudre numriquement le systme direntiel ci-dessus

pour vrier que nous ne nous sommes pas tromps dans les choix de

et

a
. On peut aussi, dans une seconde tape, simuler le systme prcdent mais
avec un paramtre p dirent de p
, pour vrier que notre contrleur n'est pas
trop sensible aux erreurs de paramtres et surtout pour quantier les erreurs
paramtriques au del desquelles le contrleur conduit des comportements
non acceptables. On quantie en simulation la robustesse paramtrique du

contrleur . On voit donc ici que nous avons encore deux modles : le modle
de contrle de paramtre

p et

le modle de simulation de paramtre

mthodes usuelles de contrle garantissent alors que pour

p,

p.

Les

assez proche de

tout se passe bien : de petites erreurs de paramtres n'engendrent que

de petits carts sur les trajectoires. En gnral, il n'existe pas de mthode


simple qui permet de quantier analytiquement les valeurs critiques de

au

del desquelles le systme change de comportement. C'est l'objet de la thorie des bifurcations et des catastrophes, thories mathmatiquement assez
techniques (on pourra se reporter [30]).
Il convient aussi de faire quelques simulations pour quantier la robustesse
du contrleur par rapport des dynamiques ngliges. Le but est en autre de
vrier que les gains ne sont pas irralistes (en gnral trop grands) : pour

54

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

simplier, il ne faut pas que, dans les formules servant calculer

et

a
,

il y

ait de trop grands coecients et/ou de petits diviseurs.


Les dynamiques ngliges sont de trois ordres qualitativement : celles
lies au processus de mesure et donc aux capteurs donnant

y;

celles lies au

processus de contrle et donc aux actionneurs assurant des valeurs arbitraires


pour

u;

celles lies au systme lui-mme, indpendamment des actionneurs

et des capteurs.

y et u des premiers ordres avec des


petites chelles de temps y > 0 et u > 0 pour prendre en compte le fait que
Par exemple, on peut associer

la rponse des capteurs n'est pas instantane et que les actionneurs ne sont
pas parfaits. On simule alors le systme tendu

d
x = f (x, um , w, p)
dt
d
=a
(y m , v)
dt
d

y y m = h(x) y m

dt

u d um = k(y
m , , v) um
dt

et on teste pour diverses valeurs

et

les performances en quantiant les

seuils critiques au del desquels les performances se dgradent notablement


pour conduire des instabilits

13

Si, par exemple, on s'aperoit que la constante de temps

que l'on avait

nglige au dpart, est en fait trop grande compte tenu des performances
demandes au contrleur, alors il nous faut changer le modle de contrle et
l'enrichir avec une partie de la dynamique du capteur. Cela signie qu'on a
pris comme modle de contrle de dpart, un modle trop grossier, compte
tenu des objectifs.
Il ne faudrait pas en conclure qu'il faille ds le dpart prendre le modle
le plus complet possible comme modle de contrle. Comme en physique,
il est en fait bien plus ecace de partir d'une vision trop synthtique qui
s'appuie sur des a priori trs forts mais dont on est conscient

14

. D'en dduire

13. Une autre faon de prendre en compte des dynamiques rapides ngliges consiste
introduire un petit retard de l'ordre de
Comme

ym = e dt y

>0

en posant, par exemple,

ym (t) = y(t ).

on voit que l'on est aussi en face d'un phnomne de perturbation

d
dt ) mais cette fois en dimension innie
d
dt
, ym = e
y devient ym = 1+1 d y et on

singulire (petit paramtre positif multipliant


d'tat. Avec l'approximation

d
dt

retrouve le ltre du premier ordre

1
d
1+ dt

dt

d
y = ym + dt
ym .

14. Citons l'exemple des calculs perturbatifs de trajectoires spatiales pour lesquels on
remet en cause les hypothses simplicatrices au fur et mesure : trajectoire plane puis

1.5.

55

CAS D'TUDE

un modle simple et ultra-simpli, dont on sait pertinemment qu'il est faux


mais dont, si ncessaire, on identiera les faiblesses et que l'on corrigera au
bout de quelques itrations de la mthodologie rsume ci-dessus. On aura
alors obtenu un modle de complexit rduite qui reprsentera l'essentiel de
la dynamique que l'on souhaite contrler.
Moralit : les choses sont dj assez compliques naturellement, gardons
nous de les rendre encore plus obscures et utilisons des modles de complexit
aussi rduite que possible compte tenu des objectifs atteindre.

1.5 Cas d'tude : PI et thermostat


L'objet de cette section est l'tude d'un rgulateur proportionnel-intgral (rgulateur PI ) sur un systme non linaire du premier ordre. On prend
en compte les contraintes sur le contrle

par une gestion du terme int-

gral grce un algorithme d'anti-emballement ( anti-windup  en anglais).


L'immense majorit des systmes industriels de contrle sont construits
partir de tels rgulateurs PI lmentaires. Il est donc naturel de les tudier
en dtails.
Ce cas d'tude est aussi l'occasion d'utiliser un grand nombre des notions
importantes issues de la thorie des quations direntielles ordinaires que
nous avons prsente dans ce chapitre : stabilit asymptotique (voir Dnition 2), relations entre la stabilit et les valeurs propres du systme linaire
tangent autour d'un point d'quilibre (voir Thorme 10), systmes avec des
chelles de temps trs direntes (voir la Section 1.4), liens avec les cascades
de rgulateurs et robustesse par rapport aux dynamiques ngliges. Nous
ferons aussi appel aux rsultats fondamentaux de Poincar et de Bendixon
(voir Thormes 12 et 13) sur les systmes stationnaires dans le plan. Enn,
nous montrerons l'intrt de rajouter la rtro-action PI (feedback ) de la

pr-compensation (feedforward ) pour anticiper et ainsi mieux grer des transitoires importants en particulier ceux lis aux changements de consignes.

1.5.1 Prsentation du systme


Considrons un btiment quip d'une chaudire. Notre objectif est d'ajuster la marche de la chaudire en fonction d'une consigne de temprature

(librement choisie par un habitant) et d'une mesure en temps rel de la temprature ambiante

l'intrieur du btiment. Intuitivement, si l'cart

est positif il convient de baisser la chaudire, dans le cas contraire il convient


dans l'espace, anomalie des potentiels de gravit, non-sphricit des plantes, eets atmosphriques en altitude basse,...

56

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

Figure 1.19  Rgulation PI de la temprature sa consigne avec une


vanne trois voies de position

u [0, 1].

de l'augmenter. An d'aranchir l'habitant des incessants ajustements ncessaires pour que la temprature

reste le plus proche possible de la consigne

une question intressante est : comment faire cela de faon automatique

et able ?

1.5.2 Un rgulateur PI
Comme l'illustre la Figure 1.19, l'algorithme usuellement utilis avec une
vanne proportionnelle 3 voies est le suivant. La marche de la chaudire est directement relie la position de la vanne trois voies note

u : pour u = 0, l'eau

qui arrive des radiateurs ne passe pas par la chaudire et repart directement
avec la mme temprature ; pour

u = 1,

toute l'eau arrivant des radiateurs

ch (tem ; pour
prature constante), temprature bien sr nettement plus haute que
les valeurs intermdiaires de u ]0, 1[, l'eau qui arrive des radiateurs n'est
passe par la chaudire et ressort la temprature de la chaudire

que partiellement rchaue et repart avec une temprature intermdiaire.


Le rgulateur (thermostat) lectronique qui se trouve dans une pice de vie,
comporte une sonde de temprature
de consigne
vanne

. L'habitant peut xer une temprature

Le rgulateur pilote, via un signal lectrique, la position de la

u.

L'algorithme usuellement rencontr dans ce type de d'quipement est celui


d'un rgulateur proportionnel/intgral, rgulateur dit PI, qui s'crit, entre

1.5.

57

CAS D'TUDE

deux instants spars par

t > 0,
uk+1 = Kp ( k ) + Ik

uk+1

en fonction de la temprature
intgral

(k + 1)t,

est la nouvelle position de la vanne, l'instant

Ik

kt.

l'instant

k ,

de la consigne

Ik

Kp

calcule

de la valeur d'un terme

La priode d'chantillonnage

de la seconde. Le gain proportionnel

terme intgral

et

est de l'ordre

est un paramtre positif. Enn, le

se calcule par une rcurrence

Ik+1 = Ik + t Ki ( k )
o

Ki

est le gain intgral . Contrairement

u,

le terme

est donc gard en

mmoire entre deux calculs successifs. C'est une valeur interne au contrleur
(tat).
En somme, la commande

est calcule rcursivement par l'algorithme

uk+1 = Kp ( k ) + Ik
Ik+1 = Ik + t Ki ( k )
o, en mme temps qu'on calcule

uk+1 ,

on met jour le terme intgral

Ik+1

uk+2 ). Tel quel, cet algorithme ne marche pas.


imparable : u doit rester entre 0 et 1. Or un tel

pour le calcul suivant (celui de


La raison est brutale mais

algorithme ne garantit nullement ces conditions. Pour prendre en compte ces


limitations, on sature

et on obtient l'algorithme modi suivant

uk+1 = S at Kp ( k ) + Ik
Ik+1 = Ik + t Ki ( k )
o

S at (x) = x

si

x [0, 1], S at (x) = 0

pour

x<0

et

S at (x) = 1

pour

x > 1.

Un tel algorithme ne marche pas non plus. La raison est en plus sophistique.
Imaginons que nous soyons l't par temps de canicule. Dans ce cas
toujours nettement suprieur
donc le terme intgral

(une

chaudire n'est pas un climatiseur) et


restera du fait de la fonction

S at

0.

aura une valeur ngative trs grande en valeur absolue.

Lorsque les premiers froids arrivent,

sera

deviendra au cours du temps de plus en plus ngatif,

on parle d'emballement ou windup,


la n de l't

sera tellement ngatif que, mme si

u restera
Kp ( )

descend largement en dessous de la consigne,

Il faudra attendre que

remonte au dessus de

toujours zro.
pour avoir enn

un peu de chauage. Cela peut prendre des semaines. On comprend donc


qu'il faut modier aussi la faon dont on met jour

I.

terme tmoignant de la saturation de la commande. Si

On va rajouter un

uk+1

ne sature pas,

58

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

ce terme sera nul, sinon ce terme cherchera s'opposer l'emballement dont


on vient de parler. C'est le mcanisme d'anti-emballement (ou anti-windup )
qui conduit l'algorithme suivant


uk+1 = S at Kp ( k ) + Ik


Ik+1 = Ik + t Ki ( k ) + Ks (uk+1 Kp ( k ) Ik )
avec un gain

Ks

choisit assez grand de faon avoir

Ks Kp > Ki .

(1.18)

Tout rgu-

lateur industriel PI comporte un tel mcanisme d'anti-windup pour prendre


en compte les contraintes sur le contrle

u.

Cette version est la bonne, nous

allons l'tudier en dtails.


Dans un premier temps, demandons-nous quoi sert le terme (intgral)

et pourquoi n'avons nous pas tout simplement considr le rgulateur proportionnel P

uk+1 = S at (Kp ( k ))
Comme on pourrait le voir par exemple avec des simulations (et conformment l'intuition) un tel algorithme a tendance limiter les variations de
temprature

Cependant, en rgime stabilis, il n'y a aucune raison pour

. Cet algorithme est incapable d'assurer, en


. En eet si = alors
rgime stationnaire le fait que rejoigne sa consigne
u = 0 et donc il ne faut pas chauage : ce qui est certes trs conomique mais

que

soit gal sa consigne

assez inconfortable et compltement idiot. Rapidement, on va s'loigner de


ce point qui ne correspond pas une situation d'quilibre. En revanche avec

u reste constant et l'intrieur (non strict) des

contraintes 0 et 1 (et o et restent eux aussi constants) on voit trs simplement que I ne peut tre que constant. En eet, la seconde quation de (1.18)
. Comme on le voit, le terme I garantit que,
implique ncessairement =
. Le terme I annule l'erreur statique.
si on atteint un quilibre, c'est =
le PI, en rgime stabilis o

1.5.3 Une modlisation simplie


Si on relve les signaux

t 7 u(t)

et

t 7 (t)

sur une priode de temps

assez longue (par exemple une journe), on s'aperoit qu'ils sont fortement
corrls. La modlisation consiste tablir ces corrlations. On peut partir de telles mesures identier un modle. On peut aussi utiliser les lois de
conservation de la physique. Bien sr, il n'est pas question ici d'crire un modle dtaill prenant en compte un maximum de phnomnes. Notre objectif
consiste rguler une temprature moyenne, telle que mesure par une seule
sonde, en utilisant un seul actionneur (la chaudire). Si, en revanche, on s'intresse la temprature en dirents points, son inhomognit spatiale,

1.5.

59

CAS D'TUDE

on aura recours des modles plus sophistiqus tels que ceux utiliss pour
la simulation ne des transferts thermiques.
Dans notre situation, nous avons besoin d'un modle minimal nous permettant de comprendre pourquoi un rgulateur PI fonctionne
avoir besoin de rgler de faon trs pointue les gains

Kp

et

15

Ki .

, et ce sans
Ce modle

sera bien-sr grossier et donc faux. En d'autres termes, il ne reprsentera


qu'une vision en rduction de la ralit physique. Il ne prendra en compte
que des eets moyens en espace et en temps, moyennes relatives aux chelles
qui nous intressent. Ici l'chelle spatiale est dnie par la taille du btiment,
alors que l'intervalle temporel le plus court pris en considration est la demiheure. Un tel modle simpli a l'immense avantage d'claircir l'analyse :
de bien cerner les congurations pour lesquelles l'algorithme PI fonctionne ;
de bien cerner aussi les cas o des instabilits (oscillations, pompages, ...)
peuvent apparatre pour donner des pistes de solutions et ainsi traiter ces
dicults.

1.5.4 Passage en temps continu


Nous allons raisonner en temps continu pour suivre la formulation habituelle des lois de conservation de la physique.

d
I
Ik+1tIk , on obtient la version en temps continu de (1.18)
Avec
dt k

u(t) = S at (Kp ( (t)) + I(t))

(1.19)
d I(t) = Ki ( (t)) + Ks (u(t) Kp ( (t)) I(t)).
dt
Pour construire un modle reliant la position de la vanne u et la temprature , nous allons faire, en accord avec notre choix des chelles de temps
et d'espace, les hypothses simplicatrices illustres sur la Figure 1.20.

. Il change des carad , et avec l'extrieur


> 0 et ext > 0, les coe-

On suppose le btiment homogne en temprature


lories avec les radiateurs de temprature uniforme
dont la temprature est

ext .

En notant

rad

cients d'changes thermiques avec les radiateurs et l'extrieur, le bilan global


d'nergie donne le modle suivant

M Cp
o

d
= rad (rad ) + ext (ext )
dt

est la masse du btiment,

Cp sa capacit calorique spcique (J/kg/K).

Nous pouvons faire un bilan thermique stationnaire autour des radiateurs en


15. Il faut savoir que pour l'immense majorit des installations domestiques, un algorithme PI pilotant une vanne 3 voies donne entirement satisfaction avec quelques rglages
standards pour

Kp

et

Ki

choisis selon la taille et l'inertie thermique de l'installation.

60

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

Figure 1.20  Modlisation simplie avec un seul compartiment de temprature uniforme

qui change de la chaleur avec l'extrieur de temprature

ext et avec les radiateurs de temprature rad dont une fraction de l'eau
u [0, 1] passe par la chaudire et ressort la temprature sortie chaudire
ch .
supposant que le ux de chaleur perdue par les radiateurs

rad (rad )

est

instantanment compens par la chaudire via la fraction du dbit d'eau des


radiateurs qui passe par la chaudire et en ressort la temprature

ch . Cela

donne la relation statique suivante

u(ch rad ) = rad (rad )


o

>0

est un coecient donn.

rad
u

avec des coef-

d
urad
=
(ch ) + ext (ext )
dt
u + rad

(1.20)

On peut alors calculer


cients tant fonction de

rad =

comme barycentre de

ch

et

rad
u
ch +

u + rad
u + rad

Ainsi, nous obtenons le modle suivant

M Cp

1.5.5 Simulations en boucle ouverte et en boucle ferme


On va utiliser les notations qui suivent


est l'tat du systme, i.e. les grandeurs satisfaisant des quations

direntielles. Ici


y = h(x)

x = .

est la partie de l'tat qui est mesure (sortie), ici

y = x,

on

mesure tout l'tat.




u reprsente les contrles (commandes), i.e., les variables d'entre qu'on


peut choisir comme on le souhaite.

1.5.

61

CAS D'TUDE

dsigne les perturbations , i.e., les variables d'entre qu'on ne peut

w = ext (t).
p est un ensemble de paramtres constants apparaissant dans le modle
(ce sont des entres particulires qui sont des constantes) : ici p =
(, rad , ext , M Cp ).

pas choisir car elles sont imposes par l'environnement ; ici




Ces notations nous permettent d'crire le modle sous la forme d'tat

d
x = f (x, u, w, p),
dt
o

et

y = h(x)

sont des fonctions issues de la modlisation ; ici

f (x, u, w, p) =

ext
urad
(ch ) +
(ext ),
(M Cp )(u + rad )
M Cp

h(x) = x

La simulation d'un tel systme consiste rsoudre numriquement l'quad


tion direntielle
x = f (x, u, w, p) partir d'une condition initiale x(0) =
dt
x0 , d'un scnario de perturbations t 7 w(t) donn l'avance et de certaines
valeurs des paramtres

p.

Les valeurs du contrle sont galement requises.

t 7 u(t), on parle
u est au contraire calcul

Lorsque le contrle est une loi horaire donne l'avance


de simulation en boucle ouverte . Lorsque le contrle
en fonction de

ou de

(i.e. par bouclage d'tat ou de sortie), on parle de

simulation en boucle ferme .


Le contrle
avec un tat

I,

donn par (1.19) fait apparatre une quation direntielle


c'est un bouclage dynamique . Pour calculer l'volution de

la temprature, il faut aussi xer la condition initiale


mentaire

I.

I0

sur l'tat suppl-

Enn, pour simuler, il faut aussi se donner le scnario pour la

consigne de temprature

t 7 (t)

et connatre les paramtres

Kp , Ki

et

Ks

de rglage du rgulateur.
Considrons une simulation en boucle ferme. Le modle correspondant
est

d
(t)
dt
d
I(t)
dt
avec u(t)

ext
rad
= (M Cpu(t)
( (t)) + M
( (t))
)(u(t)+rad ) ch
Cp ext

= Ki ( (t)) + Ks (u(t) Kp ( (t)) I(t))


+ I(t))
= S at (Kp ( (t)

w = (ext , ch ) constant. Si on choisit des


Ks > 0 tels que Ks Kp > Ki , on constate que les

avec

gains

(1.21)

Kp > 0, Ki > 0 et
t 7 ((t), I(t))

trajectoires

convergent toutes vers le mme point, indpendamment de leur condition


initiale. Ce point est donc globalement asymptotiquement stable. Le contrle

u(t)

converge vers une valeur

ncessairement la limite de

(t)

dans

[0, 1].

De plus, si

est la consigne

0 < u < 1

alors

62

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

Avec ces rglages, on n'a pas besoin de connatre prcisment les valeurs
des coecients d'changes thermiques ni celles de l'inertie thermique du btiment ni la valeur de la temprature extrieure. Par ces simulations, on se
rend donc compte qu'avec un algorithme de contrle lmentaire de type
PI, il est possible de contrler la temprature d'une trs large gamme de
btiments dont les transitoires thermiques peuvent tre dcrits de faon approximative par une quation bilan du type de celle construite ci-dessus. En
fait, nous allons voir que cette constatation exprimentale correspond un
rsultat gnral.

d
x=
dt
et croissante de u pour

Considrons un systme avec un tat de dimension 1. Il sut que

f (x, u, w, p)

soit une fonction dcroissante de

qu'un tel rgulateur fonctionne.

x=

1.5.

63

CAS D'TUDE

1.5.6 Un rsultat gnral : rgulateur PI sur un systme


non linaire du premier ordre
Rsultat
On considre le systme (mono-dimensionnel) du premier ordre

d
x = f (x, u)
(1.22)
dt
d'tat x(t) R avec le contrle scalaire u(t) R soumis aux contraintes
u [umin , umax ] (umin < umax ). On suppose que R [umin , umax ] 3 (x, u) 7
f (x, u) R est une fonction continue et drivable par morceaux. Les seules
informations que nous avons sur notre modle, i.e. sur f , sont de nature
min
qualitative : pour tout (x, u) R [u
, umax ],
f
(x, u) 0
x

et

f
(x, u) > 0
u

On suppose en outre qu'il existe un rgime stationnaire respectant strictement les contraintes sur le contrle : il existe

(
x, u) R]umin , umax [

tel que

f (
x, u) = 0.
Nous allons montrer que le rgulateur PI avec anti-emballement

u = S at [Kp (
x x) + I] ,
o la fonction saturation

d
I = Ki (
x x)+Ks (u Kp (
x x) I)
dt
S at

(1.23)

est dnie par

min
u ,
u,
R 3 u 7 S at (u) =
max
u ,

si
si
si

u umin ;
umin u umax ;
umax u.

(1.24)

(
x, u) globalement asymptotiquement stable pour le
(x, I) ds que ses gains, Kp le gain proportionnel, Ki

rend le point d'quilibre


systme d'tat tendu
le gain intgral et

Ks

le gain d'anti-emballement , vrient

Kp > 0,

Ki > 0,

Ks > 0,

et

Ks Kp Ki

Dynamique tudier
Nous cherchons montrer la stabilit asymptotique globale du point

(
x, u). Nous cherchons donc tablir que,
(x , I 0 ), la solution t 7 (x(t), I(t)) du systme

d'quilibre
0

initiale

pour toute condition


boucl

d
x = f (x, S at [Kp (
x x) + I])
dt
d
I = Ki (
x x) + Ks (S at [Kp (
x x) + I] Kp (
x x) I)
dt

(1.25)

64

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

Figure 1.21  Le rectangle R est positivement invariant car le champs de


vecteurs
bord de

X 7 F (X)
R .

pointe vers l'intrieur lorsque

X = (x, I)

parcourt le

t 0 et que sa limite quand t tend vers + est (


x, u).
Dans tout ce qui suit, nous considrons l'tat tendu X = (x, I) et rd
crivons (1.25) sous la forme
X = F (X). La fonction F : R2 R2 est une
dt
= (
fonction continue et drivable par morceaux de X . On note aussi X
x, u)

le point d'quilibre de F : F (X) = 0.


existe pour tout temps

Les trajectoires sont bornes


Nous allons montrer que les trajectoires du systme (1.25) restent bornes
pour

t > 0.

Elles seront donc automatiquement dnies pour tout temps

0. Pour cela nous allons considrer le plan

de phases

t>

X = (x, I) et construire

une famille de rectangles embots les uns dans les autres. Chacun de ces
rectangles est positivement invariant par la dynamique (voir Dnition 22) :
si la condition initiale appartient l'intrieur d'un de ces rectangles alors il
est impossible la trajectoire d'en sortir. Pour tablir ce point, il sut de

F (X) quand X parcourt le bord du


F (X) pointe constamment vers l'intrieur, alors il est impossible

regarder la direction du vecteur vitesse


rectangle : si

de sortir du rectangle en intgrant selon les temps positifs. L'existence de ces


ensembles repose sur les hypothses dj voques

Ks Kp Ki , f
La fonction

croissante par rapport

S at

Kp > 0, Ki > 0, Ks > 0,


x.

et dcroissante par rapport

qui intervient dans (1.24) conduit un dcoupage en trois

zones du plan de phases

(x, I)

(voir Figure 1.21) selon la position de

Kp (
x

1.5.

65

CAS D'TUDE

x)+I par rapport umin et umax : les deux zones satures Kp (


x x)+I umax
et Kp (
x x)+I umin et la zone sans saturation umin Kp (
x x)+I umax .
max
min
Posons L = max(u
u, u u ) > 0. Comme reprsent sur la Figure 1.21, considrons, pour L, le rectangle R de centre (
x, u), de cots
parallles aux axes et coupant l'axe des x en x
/Kp et l'axe des I en u .
x
I
tudions maintenant, en dtaillant ses composantes F et F , la direction,
pour (x, I) sur le bord de R , du vecteur tangent la trajectoire
F (x, I) =
 x

F (x, I) = f (x, S at [Kp (
x x) + I])
F I (x, I) = Ki (
x x) + Ks (S at [Kp (
x x) + I] Kp (
x x) I)
 (cot horizontal suprieur) pour I = u
+ et
I
on voit que F (x, u
+ ) 0 ; en eet si x

x [
x /Kp , x + /Kp ],
[
x /Kp , x] on a

}|
{z }| {
}|
{
z
z
x x) +Ks (umax u ) 0;
F =(Ki Ks Kp )(
I

si

x [
x, x + (
u + umax )/Kp ]

on a

z }| {
z
}|
{
F I = Ki (
x x) +Ks (umax u Kp (
x x)) 0;
si

x [
x + (
u + umax )/Kp , x + /Kp ]

on a

z }| {
F = Ki (
x x) 0
 x 
F
F =
pointe vers le bas
FI
I

Ainsi, le vecteur

le long du cot hori-

zontal suprieur.
 (cot vertical droit) pour

x = x + /Kp

et

I [
u , u + ] on voit que

F x (
x + /Kp , I) 0;
en eet si

I [
u , umin + ]

on a

F x = f (
x + /Kp , umin ) f (
x, umin ) f (
x, u) = 0
car

f
x

et

f
u

> 0;

si

I [umin + , u + ]

on a de mme

F x = f (
x + /Kp , I ) f (
x, I ) f (
x, u) = 0
Ainsi, le vecteur

pointe vers la gauche le long du cot vertical droit.

66

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

On dmontre, de la mme faon, que

pointe vers le haut le long du cot

horizontal infrieur et pointe vers la droite le long du cot vertical gauche.


En conclusion, pour tout

L,

le vecteur tangent la trajectoire

pointe vers l'intrieur du rectangle

R .

F (X)

Cet ensemble est donc positivement

invariant.

0
Prenons maintenant une condition initiale X
= (x0 , I 0 ) arbitraire. Il
0
existe toujours au moins un (il sut de le prendre assez grand en fait)
d
0
X = F (X) avec
pour que X soit l'intrieur de R0 . Ainsi, la solution de
dt
X(0) = X 0 reste dans R0 pour tout temps positif : elle est donc dnie pour
tout temps

t>0

et reste borne.

Stabilit asymptotique
Nous cherchons maintenant tudier la convergence des trajectoires. On
suppose que l'quilibre

(
x, I)

rside strictement l'intrieur des contraintes,

c.--d.

umin < I = u < umax


Pour

(x, I)

autour de

,
(
x, I)

le systme s'crit

x = f (x, Kp (
x x) + I)
dt

d I = Ki (
x x)
dt

(1.26)

Le calcul du linaire tangent fait apparatre la matrice Jacobienne suivante

f
x (
x,
u)



Kp f
u (
x,
u)
Ki

f
u (
x,
u)

!
(1.27)

La trace de cette matrice 2 2 est strictement ngative car Kp > 0, Ki > 0,


f
0 et f
> 0 par hypothse. Son dterminant est strictement positif
x
u
pour les mmes raisons. Donc ses deux valeurs propres sont partie relle
strictement ngative. Ainsi, quels que soient les choix de

Kp > 0 et Ki > 0, le

linaire tangent est toujours localement asymptotiquement stable (voir par


exemple la Section 1.2.3).
C'est bien un systme continu et stationnaire dans le plan. On peut donc
utiliser le Thorme 12 de Poincar. Nous avons vu que les trajectoires restent
bornes. Donc, les trajectoires convergent soit vers un quilibre, soit vers une
courbe ferme du plan qui dlimite un domaine born.

(
x, I = u) dont on
est
contraintes. En eet, (
x, I)

Or, il n'existe pas d'autre quilibre que l'quilibre


a suppos l'existence l'intrieur strict des

1.5.

67

CAS D'TUDE

l'unique solution de

f (x, S at [Kp (
x x) + I]) = 0
Ki (
x x) + Ks (S at [Kp (
x x) + I] Kp (
x x) I) = 0

L'unicit rsulte du raisonnement suivant


 Si

umin Kp (
x x) + I umax ,

on a

alors la premire quation donne

x = x

par la seconde quation, et

comme solution de

f (
x, I) = 0.

Or,

f est strictement croissante par rapport son second argument, donc


I = I.
 Si Kp (
x x) + I > umax , la premire quation f (x, umax ) = 0 implique
que x > x
, car f (
x, umax ) > 0 et f est dcroissante par rapport x. La
seconde quation donne alors Ki (x
x) = Ks (umax (Kp (
xx)+I)) < 0,
car Ks > 0 par hypothse. Ceci contredit le fait que x est plus grand
que x
.
 Si Kp (
x x) + I < umin , la premire quation f (x, umin ) = 0 implique
que x < x
et la seconde le contraire.
de (1.25),
Pour montrer la convergence globale vers l'unique quilibre (
x, I)
il sut de montrer qu'il n'existe pas de courbe ferme du plan, forme partir de trajectoires du systme. Il ne restera que la convergence vers l'unique
quilibre comme rgime asymptotique possible.
Pour montrer qu'il n'existe pas de telles courbes fermes, nous procdons
par contradiction. Admettons qu' partir des trajectoires de (1.25), on puisse
former par raccordement une courbe ferme du plan. On note

l'intrieur

F
. Cette intgrale est gale l'intgrale sur le bord
16
sortant . Avec < ., . > le produit scalaire usuel, il vient
Z Z
I
divF =
< F, n > ds

de cette courbe ferme. Calculons l'intgrale de la divergence du champ


sur le domaine born
de son ux

n est la normale extrieure. Par construction, le champs de vecteur associ

(1.25)


F =

f (x, S at [Kp (
x x) + I])
at
Ki (
x x) + Ks (S [Kp (
x x) + I] Kp (
x x) I)

est tangent au bord

de

: son ux sortant est donc nul. Pourtant, on

remarque que sa divergence (trace de la matrice Jacobienne) est toujours


strictement ngative

f
f
Kp (S at )0 + Ks ((S at )0 1) < 0
x
u
16. Il s'agit du thorme de Gauss souvent utilis en lectrostatique.

68

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

(S at )0 vaut soit 0 soit 1. On obtient la contradiction recherche. En conclu est


sion, il n'existe pas de telle courbe ferme, et le point d'quilibre (
x, I)

car

globalement asymptotiquement stable.


En fait nous avons montr le point no 1 du rsultat suivant :

Thorme 17 (PI avec anti-emballement sur un premier ordre non-linaire


d
x = f (x, u) avec,
et stable). Soit le systme du premier ordre non-linaire
dt

x R, u [umin , umax ], f continue, drivable par morceau vriant f


(x, u)
x
f
min
max
0, u (x, u) > 0 pour tout avec (x, u) R [u , u ].
Soit le rgulateur PI avec anti-emballement de consigne x
R:
u = S at [Kp (
x x) + I] ,
avec

Kp , Ki > 0, Ks Kp > Ki

d
I = Ki (
x x) + Ks (u Kp (
x x) I)
dt
et

S at () max(umin , min(umax , )).

Alors on a

les deux cas suivants :

u ]umin , umax [ tel que f (


x, u) = 0 et alors l'quilibre
(x, I) = (
x, u) du systme boucl est unique et globalement asympto-

1. soit il existe

tiquement stable au sens de Lyapounov


2. sinon :

min
 soit [u
, umax ], f (
x, ) < 0 (resp. > 0) alors limt7+ u(t) =
max
min
u
(resp. u
) et limt7+ x(t) existe, est ventuellement innie

[, x[ (resp. ]
x, +])
max
soit f (
x, u ) = 0 (resp. f (
x, umin ) = 0) alors limt7+ u(t) = umax
min
(resp. u
) et limt7+ x(t) existe, est nie dans ] , x
[ (resp.
]
x, +[).
dans

Le point no 2 signie simplement que, compte tenu des contraintes, le


rgulateur PI fait au mieux, i.e., tente de rapprocher au maximum
consigne

x.

de sa

La preuve de ce point est laisse en exercice.

1.5.7 Dynamiques ngliges : rle du contrle dans l'approximation


Les simulations en boucle ferme du thermostat que nous pouvons dduire du modle (1.21) ne sont qu'une reprsentation approximative de la
ralit. Cela est d, entre autres, l'criture par un modle continu (1.19)
du rgulateur PI qui est l'origine rgi par des quations discrtes (1.18).
Si la priode d'chantillonnage

est petite nous ne faisons qu'une petite

erreur. D'autres erreurs proviennent des nombreux phnomnes dynamiques


ngligs comme par exemple l'htrognit des tempratures

et

rad ,

les

uctuations de la chaudire dues sa propre rgulation de temprature, ...

1.5.

69

CAS D'TUDE

Bref, nous avons implicitement suppos, en accord avec les rsultats de la


Section 1.4, que si d'autres phnomnes transitoires existent, ils sont rapides
et stables. En consquence, notre modle de simulation ne prend en compte
que les dynamiques les plus lentes (disons celles qui sont plus lentes que 30
minutes).
Est-ce gnant en pratique ? Bien qu'en thorie nous avons montr que
l'quilibre de (1.21) est globalement asymptotiquement stable pour tout gain

Kp , Ki

et

Ks

positifs vriant

Ks Kp > Ki ,

il apparat, lorsqu'on passe aux

exprimentations, un phnomne qui semble contredire ce rsultat. Le rsum


des direntes expriences qu'on peut raliser est qu'il n'est pas possible de
choisir ces gains aussi grands que nous le souhaiterions. Lorsque les gains
sont petits on constate un bon accord entre la thorie propose et la pratique.
Lorsque les gains sont grands, on constate des carts importants, voire des
instabilits.
Ceci est en fait en accord avec la thorie, si on en revient aux hypothses que nous avons formules plus ou moins explicitement. L'explication
est que des gains trs grands rendent le systme (1.21) trs rapide. Pour s'en
convaincre il sut de voir que les valeurs propres du systme linaire tangent
autour de l'quilibre

(
x, I)

sont celles de la matrice Jacobienne (1.27). Au

moins une des valeurs propres de cette matrice tend vers l'inni (en module)
quand

Kp

et/ou

Ki

tendent vers

+.

S'il est possible, en thorie, de rendre

le systme (1.21) aussi rapide qu'on le dsire grce un rgulateur PI avec


des grand gains, en pratique, les gains du rgulateur sont limits par l'apparition d'instabilits lies toutes les dynamiques rapides ngliges et qui sont
alors excites par le contrle. Les hypothses d'application des thormes
d'approximation ne sont plus vries. Par exemple, l'approximation du PI
discret par un PI continu n'est plus valable, si on prend

Ti = Kp /Ki
d'chantillonnage t. On va
le temps intgral

Kp

et

Ki

tels que

est du mme ordre de grandeur que la priode


se concentrer sur un des possibles problmes

qui est caractristique de ce phnomne : la dynamique nglige de la sonde


thermique.

Exemple : le rle de la sonde

Rajoutons au modle de simulation en

boucle ferme (1.21), la dynamique de la sonde de temprature. Le modle


le plus simple ayant une base physique vidente est une dynamique linaire
stable du premier ordre (ltre passe-bas) avec une constante de temps trs
petite car la sonde a trs peu d'inertie thermique et donc rpond trs rapidement (en quelques secondes pour xer l'ordre de grandeur) aux changements
de la temprature de l'air ambiant. Ce modle est vriable exprimentalement, par analyse de la rponse transitoire de la sonde thermique des

70

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

signaux d'excitation type chelon. En notant

> 0

cette petite constante

de temps, la temprature qu'on peut utiliser pour le calcul de u n'est plus


m relie via le ltre du premier ordre suivant

mais sa mesure note

d m m
=
dt

Cette dynamique supplmentaire complte le modle en boucle ferme tudier. Celui-ci est alors

d
(t)
dt
d
I(t)
dt
d m
dt (t)
avec u(t)

En posant

ext
rad
= (M Cpu(t)
( (t)) + M
( (t))
)(u(t)+rad ) ch
Cp ext
m
= Ki ( (t)) + Ks (u(t) Kp ( m (t)) I(t))
= (t) m (t)
= S at (Kp ( m (t) + I(t))

X = (, I)

et

Z = m ,

(1.28)

ce modle admet la structure suivante

d
X = F (X, Z),
dt

d
Z = G(X, Z),
dt

alors que le modle initial (1.21) correspond en fait

d
X = F (X, Z),
dt

=0

0 = G(X, Z).

G
(X, Z)
Z
sont toutes partie relle ngative (ce qui

En application du Thorme 15 de Tikhonov, si les valeurs propres de


pour

(X, Z) vriant G(X, Z) = 0

est trivialement le cas ici), alors, pour

> 0

assez petit, les trajectoires

des deux modles sont trs proches. Autrement dit, si la dynamique de la


sonde thermique est stable et rapide devant les autres dynamiques, on peut
la ngliger.
On comprend galement pourquoi on ne peut pas choisir les gains

Kp

Ki trop grands. Si tel est le cas, Kp et/ou Ki sont alors du mme


d
1
X comportera des termes en 1 . L'criture
ordre de grandeur que . Donc

dt
d
sous la forme
X = F (X, Z) avec dtd Z = G(X, Z) n'est plus valable et
dt
l'approximation prcdente peut tre mise en dfaut. On ne sait plus dduire
et/ou

de la stabilit de (1.21) une information sur celle de (1.28). Dans ce cas, la


dynamique de la sonde, bien que stable isolment, n'est plus rapide devant
les autres dynamiques. L'approximation n'est pas valable.

1.5.8 Intrt de la pr-compensation (feedforward)


Pour amliorer les performances de la rgulation de temprature (et donc
le confort), on peut complter le rgulateur prcdent en utilisant les techniques de pr-compensation et de feedforward.

1.5.

71

CAS D'TUDE

Trs souvent, on utilise aussi pour ajuster la position de la vanne trois


voies,

u, la temprature extrieure, ext . Ainsi, u ne dpend pas seulement de


et de sa consigne , mais aussi de ext . Souvent,

la temprature intrieure

on substitue alors aux quations (1.19) les quations suivantes

u(t) = S at (Kp ( (t))


+ I(t) Kext ext )

d I(t) = Ki ( (t)) + Ks (u(t) Kp ( (t)) I(t) + Kext ext )


dt
, lorsque la tempraavec Kext un coecient positif. Ainsi, mme si =
ture extrieure baisse, u a tendance augmenter pour anticiper la prochaine
baisse de . Le rajout de ext permet d'anticiper les variations de temprature
extrieure. C'est le terme de pr-compensation .
Une autre amlioration un peu plus subtile est celle qu'on utilise lors
de changement de la consigne
consigne de temprature

Il est assez frquent de programmer une

un peu plus basse dans la journe, pendant les

heures o les habitants sont absents, et un peu plus haute en dbut et en


n de journe. Ainsi
que la temprature

est

une fonction constante par morceaux. Il est clair

ne peut pas suivre

chacune de ses discontinuits : la

rponse de notre systme n'est pas instantane ; notre modle (1.20) implique
que est une
max > 0 cette

fonction drivable de
borne

et dont la drive est borne. Notons




d
(t) max

dt

pour la transformer en
(t)
est constante,
une fonction continue drivable par morceaux r (t) : l o
r est aussi constante ; l o admet un saut, alors r est la fonction ane
max
par morceau de pente infrieure en module
( 1) qui remplace le
saut par une rampe comme illustr sur la Figure (1.22). Ainsi, r (t) est une
, drivable par morceaux et dont la drive
approximation continue de (t)
max
reste toujours plus petite que
en valeur absolue. En quelque sorte, r (t)
tout en
est une consigne de temprature variable dans le temps, proche de
Il est naturel de modier localement la fonction

tant rellement ralisable par le systme. On parle de ltrage de consigne .

r (t) qui lisse la consigne

brute (t).
, on rajoute alors au PI (1.19) la drive r
Avec r (t) au lieu de (t)

u(t) = S at (Kp (r (t) (t)) + I(t) + Kr r (t))


d I(t) = Ki (r (t) (t)) + Ks (u(t) Kp (r (t) (t)) I(t) Kr r (t))
dt
avec Kr un coecient positif. L'eet de ce terme est le suivant. Supposons
que pour t < 0, = r . partir de t = 0, r commence une rampe de pente
Il est facile de calculer en temps rel la fonction

72

CHAPITRE 1.

Figure

SYSTMES DYNAMIQUES ET RGULATEURS

1.22  Approximation de la consigne brute

,
t 7 (t)

fonction

constante par morceaux impossible suivre cause des discontinuits, par


la rfrence

t 7 r (t),

fonction continue et drivable par morceaux corres-

pondant une trajectoire ralisable par le systme.

constante positive rsultant d'une augmentation de la consigne brute

t = 0.

Alors, le terme en

contrle

r ,

en

dit de feedforward aura tendance booster le

avec un surplus de chauage pour compenser l'inertie thermique

du btiment et ainsi avoir une temprature

qui suivra mieux la rfrence

ralisable. Il s'agit d'une anticipation sur la rampe de monte. De mme,


la n de la rampe de monte pour

r , r

retourne

et alors, le contrle

aura un saut vers le bas, une sorte de freinage pour viter que
en n de monte la valeur de

ne dpasse

(vite l'over-shoot). C'est le feedforward .

La combinaison de ses deux types d'anticipation, l'une sur la perturbation


mesure

ext , l'autre sur la consigne variable , conduit l'algorithme PI avec

anticipation suivant

h
i
u(t) =S at Kp (r (t) (t)) + I(t) + Kr r (t) Kext ext

d
I(t) =Ki (r (t) (t))

dt

h
i

+ Ks u(t) Kp (r (t) (t)) I(t) Kr r (t) + Kext ext


(1.29)
Des versions plus ou moins sophistiques de cet algorithme sont utilises dans
les thermostats vendus dans le commerce.

1.5.9 Pr-compensation et suivi de trajectoires sur un


systme linaire du premier ordre
Pour comprendre de faon plus formelle et plus prcise le rle de ces
deux types d'anticipation, prenons comme modle de contrle, le modle

u, ext ). On note et u les carts


(,
et u, donne
l'quilibre. La premire variation de (1.20) autour de l'quilibre
linaire tangent autour d'un quilibre

un systme du premier ordre stable. On va la calculer. Le modle (1.20) est

1.5.

73

CAS D'TUDE

de la forme

dt

u, ext ) = 0.
f (,

= f (, u, ext )

avec

fonction rgulire de ces arguments et

Il est d'usage de noter

par

y , u

par

et

ext

par

d
y = ay + bu + dw
dt



f
f
f
, b=
, d=
a=
,
u ,
ext ,
u,ext
u,ext
u,ext

avec

On remarque que

a > 0, b > 0

et

d > 0.

w.
(1.30)

Ainsi, le systme est asymptotique-

y comme
= 1/a, excit

ment stable en boucle ouverte. On peut interprter la temprature


la sortie d'un ltre du premier ordre de constante de temps
par le signal

(bu + dw)

en notant

d
1
y = ( bu + dw y)
dt

Pour simplier, nous considrons ici :

umin =

et

Supposons qu'on souhaite suivre une rfrence

umax = +.
t 7 yr (t) continue

et

drivable par morceaux tout en connaissant chaque instant la perturbation w(t). On dnit le contrle de rfrence comme tant la fonction
t 7 ur (t) continue par morceaux et telle que dtd yr = ayr + bur + dw, c'est
dire

y r (t) + ayr (t) dw(t)


b
alors ur une correction de

ur (t) =
u, on rajoute
e = y yr

Pour obtenir
de suivi,

u(t) = ur (t) + Kp (yr (t) y(t)) + I(t),

type PI sur l'erreur

d
I(t) = Ki (yr (t) y(t))
dt

La partie anticipation (feedforward ) correspond

ur

: elle compense, de

faon cohrente avec le modle, les eets transitoires dus aux variations de

yr

et

w.

On obtient ainsi en boucle ferme un systme direntiel autonome

pour les variables

e = y yr

et

d
e = (bKp + a) e + bI,
dt

d
I = Ki e
dt

Ce systme s'crit alors sous la forme d'un systme du second ordre

d2
d
e = 20 e (0 )2 e
2
dt
dt
avec les notations usuelles

20 = (bKp + a) ,

(0 )2 = bKi

(1.31)

74

CHAPITRE 1.

0 > 0

SYSTMES DYNAMIQUES ET RGULATEURS

est la pulsation de coupure et

> 0,

le facteur d'amortisse-

w et yr varient au cours du temps, leurs variations sont


ur qui est une combinaison linaire de yr , y r et w. On
comprend mieux l'intrt des termes Kr y r et Kext w dans (1.29).
En pratique, les coecients a, b et d ne sont connus qu'avec une certaine
approximation. Si l'on note a , b et d les carts entre leurs vraies valeurs
(celles du modle (1.30)) et celles utilises pour le calcul de ur par y r =
(a a )yr + (b b )ur + (d d )w, alors la dynamique de l'erreur e devient

ment . Ainsi, mme si


pr-compenses par

d
d2
e = 20 e (0 )2 e + b u r + d w + a y r
2
dt
dt
En absence de terme de feedforward, le simple contrleur PI

u = Kp (yr y) + I,

d
I = Ki (yr y)
dt

conduit un systme du second ordre similaire pour

e = y yr

d
d2
d2
2
e
=
2
e

(
)
e

yr + dw + ay r
0
0
dt2
dt
dt2
mais avec un terme source
que

b u r + d w + a y r

dtd 2 yr + dw ay r

(1.32)

a priori beaucoup plus grand

dans (1.31), puisque les erreurs paramtriques sont

supposes peu importantes. Ainsi, mme avec des erreurs de modlisation, le


rajout de

ur

plus prs de

conduit en gnral une amlioration notable du suivi :

reste

0.

En l'absence de feedforward, on voit que la partie rtro-action, le feedback, doit alors corriger aprs coup les variations de la rfrence
perturbations
rfrence

yr

w.

yr

et les

Il en rsulte une moins bonne prcision dans le suivi de la

et des performances dgrades car on demande au feedback de

compenser non seulement les erreurs de modle, ce qui est son rle premier,
mais aussi les variations de
feedforward

yr

et

w,

ce qui est mieux ralis par le contrle

ur .

1.6 Cas d'tude : contrle hirarchis et rgulateurs en cascade


La thorie des systmes lents/rapides (en particulier le Thorme 15 de
Tikhonov) permet de justier une pratique courante pour la synthse de
boucle de rgulation : le contrle hirarchis qui consiste imbriquer les rgulateurs. Un exemple sura pour comprendre ce dont il s'agit. Cet exemple

1.6.

75

CAS D'TUDE

est non trivial car il s'agit d'un systme du second ordre avec dynamique
inconnue et des contraintes la fois sur l'tat et sur le contrle. La synthse
d'un contrleur prenant explicitement les contraintes d'tat est un problme
largement ouvert et pour lequel on ne dispose pas, l'heure actuelle, de solution systmatique et simple. Des solutions plus numriques fondes sur les
techniques de commande prdictive peuvent tre considres mais elles sont
coteuses en temps de calculs et peuvent poser problme en particulier en
ce qui concerne l'existence de solutions et la convergence numrique

17

. Le

contrleur que nous proposons ci-dessus s'appuie sur le paradigme des systmes lents/rapides, sa structure est facile comprendre. Le rglage des gains
est simple et s'eectue partir des contraintes. Nous donnons des formules
explicites qui peuvent tre utilises.
Considrons un systme du second ordre de la forme suivante

d
d2
x
=
f
(x,
x) + u
dt2
dt
o

x et u sont dans R. De tels modles se rencontrent naturellement pour les

systmes mcaniques (par formulation variationnelle) : il s'agit par exemple


de l'quation de Newton qui relie l'acclration aux forces extrieures parmi
lesquelles se trouve le contrle
f (x, dtd x).

u.

On suppose qu'on ne connat pas bien

Il est possible de se ramener, au moins approximativement, au cas de deux


systmes du premier ordre. Le principe de la stratgie de contrle hirarchis
comporte deux tapes : un premier rgulateur proportionnel (rgulateur P)
d
x vers une consigne v. Un
assure la convergence rapide de la vitesse v =
dt
second rgulateur PI cherche stabiliser la position x x
et, pour ce faire,
met lentement jour la consigne du rgulateur de vitesse

v.

Comme nous

allons le voir, il est assez ais de prendre en compte des contraintes sur la
vitesse

et le contrle

u.

crivons l'quation du second ordre sous la forme d'un systme de deux

17. La technique MPC (Model Predictive Control) propose une slection optimale, au
sens d'un critre choisi par l'utilisateur, parmi des trajectoires satisfaisant des contraintes.
Elle suppose l'existence de telles trajectoires et l'unicit d'un optimum caractrisable numriquement. Ce sont ces hypothses qui sont bien souvent diciles garantir sur des
exemples concrets gnraux. Si ces hypothses sont vries, la technique MPC consiste
en la rsolution itre du problme d'optimisation avec mise jour chaque nouvelle
priode d'chantillonnage de la condition initiale. La fonction cot optimal est alors une
fonction de Lyapounov, elle garantit la stabilit.

76

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

quations du premier ordre

x=v
dt

d v = f (x, v) + u
dt

(1.33)

u [umax , umax ] et v [v max , v max ] (umax , v max > 0). On


considre un rgime stationnaire caractris par un tat admissible (
x, v = 0)
et un contrle admissible u
; soit |
u| < umax et f (
x, 0) + u = 0. On cherche par
un bouclage u stabiliser (x, v) en (
x, u), en respectant les contraintes sur u
max
et aussi sur v . Prcisment, si la vitesse initiale v0 appartient [v
, v max ]
alors on souhaite que pour t > 0 la vitesse v(t) du systme en boucle ferme
max
reste aussi dans [v
, v max ]. Cet objectif doit tre atteint de manire robuste
aux incertitudes sur la fonction f (x, v).
Sans hypothse supplmentaire sur f , il est dicile de donner une rponse
un peu gnrale ce problme. Nous allons supposer qu'il existe 0 < < 1
tel que pour tout (x, v),
|f (x, v)| umax
(1.34)
Les contraintes sont

Cela veut dire que pour toute valeur de

qui domine

f (x, v)

(x, v),

on peut choisir un contrle


d2
x. Cette hypothse est
et ainsi imposer le signe de
dt2

essentielle.
La cascade de deux rgulateurs, voque ci-dessus, donne l'algorithme de
contrle suivant

x x) + Ks (
v Kp (
x x) I)
dt I = Ki (

v = Svat [Kp (
x x) + I]
at
u = Su [Kp (
v v)/]

(1.35)

Kp > 0, Ki > 0, Ks > 0, Ks Kp > Ki , et  un paramtre positif. Les


Svat et Suat sont les fonctions de saturation usuelles (telles que celle
utilise en (1.24)) associe aux contraintes sur v et u (projections sur les
max
convexes [v
, v max ] et [umax , umax ]).

avec

fonctions

La dynamique en boucle ferme est le systme de trois quations direntielles non linaires suivant

x=v

dt
d
x x) + I] v)/]
v = f (x, v) + Suat [Kp (Svat [Kp (
dt

d I = Ki (
x x) + Ks (Svat [Kp (
x x) + I] Kp (
x x) I)
dt

1.6.

77

CAS D'TUDE

Pour

(x, v, I)

proche de
at

Sv et
ci-dessus devient

les fonctions

at

Su

(
x, 0, u),

les contraintes ne sont pas actives et donc

sont les fonctions identits. Ainsi, le systme boucl

x=v

dt

d
x x) + I) v)
 v = f (x, v) + Kp (Kp (

dt

d I = Ki (
x x)
dt
Ce systme est bien sous la forme standard du thorme 15 de Tikhonov :
l'tat lent est

(x, I),

l'tat rapide

v,

et la dynamique rapide est bien asymp-

totiquement stable. Le systme lent

d
x = v,
dt

d
I = Ki (
x x)
dt

est bien asymptotiquement stable. On conclut la stabilit via le thorme 16. En l'absence de contraintes, la preuve de la stabilit repose uniquement sur le fait que

est susamment petit.

Pour garantir la stabilit avec la prise en compte des eets non linaires
dus aux fonctions de saturation
et

Ki

Suat

et

Svat ,

il convient de ne pas choisir

Kp

n'importe comment. Intuitivement, si notre raisonnement par chelles

de temps est correct, il faut que le systme rapide soit en mesure de suivre
sa consigne

v = Svat [Kp (
x x) + I]

mme si cette dernire varie au cours du


d
v doit respecter les contraintes
temps : cela entrane qualitativement que
dt
sur u, tout au moins sur la partie de u qui reste disponible aprs avoir domin
la dynamique f (x, v). Cela veut dire approximativement que le module de
d
v ne doit pas dpasser (1 )umax . Il nous faut maintenant avoir une ide
dt
d
de l'ordre de grandeur de
v : pour cela on drive dans le cas non satur v
dt
d
et on nglige la variation de I . Cela nous donne comme estimation de
v :
dt
v max
Kp v . Ainsi, il est naturel d'imposer Kp (1)umax .
On constate, avec des simulations numriques qu'avec

Kp =

v max
,
(1 )umax

Ki =

Kp2
,
5

Ks =

2Kp
,
5

 = 3,

le contrleur (1.35) est bien stabilisant tout en respectant les contraintes sur

et approximativement les contraintes sur

v.

Ce qui prcde n'est pas une preuve formelle mais plutt une illustration
de la dmarche fonde sur la thorie des perturbations pour concevoir un
rgulateur simple pour un systme du second ordre dont le modle comporte
d'importantes incertitudes que l'on peut dominer par un contrle born. De
plus ce rgulateur (1.35) prend en compte la contrainte d'tat

|v| v max .

78

CHAPITRE 1.

SYSTMES DYNAMIQUES ET RGULATEURS

Chapitre 2
Fonctions de transfert

Les rsultats du Chapitre 1 sont essentiellement de nature qualitative.


La stabilit d'un systme est garantie sous l'hypothse qu'un paramtre

soit susamment petit. Dans ces conditions, on peut alors raisonner sur un
systme simpli (nominal). La question de la robustesse a t traite de
manire perturbative : si le systme nominal en boucle ferme ou en boucle
ouverte admet un quilibre asymptotiquement stable , alors le systme perturb
(rgulirement et/ou singulirement)

admet un quilibre voisin de celui du

systme nominal, quilibre qui est lui aussi asymptotiquement stable.


La question de savoir partir de quelle valeur critique

 de 

il y a perte

de stabilit est importante, notamment d'un point de vue pratique. Comme


nous allons le voir dans ce chapitre, une rponse est lie aux notions de

marges de robustesse que nous allons dnir. On notera que, d'un point de
vue formel, l'tude des changements qualitatifs de comportement d'un systme dynamique en fonction de paramtres intervenant dans les quations
est l'objet de la thorie des bifurcations et des catastrophes [21]. Cette thorie
dpasse largement le cadre de ce cours.
Les marges de robustesse sont des notions diciles aborder de faon
gnrale pour un systme non linaire. Cependant, il est possible, une fois de
plus, d'obtenir des informations prcieuses en considrant le systme linaris

tangent autour de l'quilibre.

1. On parle de perturbations rgulires lorsque

apparat dans les membres de droite


d
d
dt x = f (x, z, ) et dt z = g(x, z, ). On
parle de perturbations singulires lorsque  apparat gauche devant une drive en temps,
d
d
d
comme par exemple
dt x = f (x, z) et  dt z = g(x, z). Ainsi le systme dt x = f (x, z, ) et
d
 dt z = g(x, z, ) est la fois rgulirement et singulirement perturb. Ses solutions sont
d
alors proches de celles du systme nominal (obtenu en faisant  = 0,
dt x = f (x, z, 0) et
des quations direntielles, comme par exemple,

0 = g(x, z, 0))

sous certaines hypothses comme celles du thorme 15.

79

80

CHAPITRE 2.

FONCTIONS DE TRANSFERT

On utilise sur ce systme linaire le calcul symbolique , i.e. on remplace


d
par la variable de Laplace s C (en utilisant la transforme
l'oprateur
dt
3
de Laplace voir [53]). Grce ce formalisme , on peut faire des calculs algbriques pour aboutir une quation reliant entre et sortie. Le systme est
alors reprsent par une fonction de la variable complexe
correspondant enn

(note aussi

et

en thorie des circuits). Cette fonction est appele

fonction de transfert . L'analyse complexe fournit une rponse directe (par le


Thorme de Cauchy) la dnition des marges de robustesse.

2.1 Passage la fonction de transfert


Nous allons considrer l'exemple (1.30) de la n du chapitre prcdent

d
y(t) = ay(t) + bu(t) + dw(t)
dt

(2.1)

a, b et d positifs et constants. Ce systme est linaire. Le contrle est u, la


perturbation w et la mesure y . On a vu, toujours dans le chapitre prcdent,

avec

qu'un simple

rgulateur PI

d
I = Ki (yr y)
dt

u = Kp (yr y) + I,
avec

(2.2)

Kp , Ki > 0 assure la convergence asymptotique de y(t) vers la consigne


yr suppose constante, pour peu que la perturbation w soit cons-

(rfrence)

tante. Rappelons qu'on n'a pas besoin de connatre cette constante pour
prouver que de manire asymptotique

y = yr .

2.1.1 Questions de robustesse


tant donn le systme en boucle ferme (2.1)-(2.2), nous souhaitons
tudier les trois points suivants
1. Que se passe-t-il si la mesure de

n'est pas instantane mais est eec-

? Dans une telle conguration,


l'instant t, on connat la valeur de y(t ). La valeur y(t) n'est disponible, pour calculer u, qu' l'instant t + . Ce retard est par exemple
tue avec un certain temps de retard

2. Le calcul symbolique est aussi dnomm calcul oprationnel [73, 22] en rfrence
la thorie des oprateurs linaires [43].
3. Nous laissons de ct les problmes de convergence des transformes de Laplace qui
sont relativement hors-sujet ici et qui sont abords dans les cours [52, 53]. On pourra aussi
se reporter [15] pour un expos mettant en lumire le rle des bandes de convergence
dans le plan complexe.
4. Nous ne prenons pas en compte les contraintes sur

ici.

2.1.

81

PASSAGE LA FONCTION DE TRANSFERT

imputable la dynamique du capteur, la chane informatique tempsrel, des dlais d'chantillonnage de certains capteurs, ou des dlais
de communication de l'information.

w n'est plus constante


mais sinusodale de la forme w(t) = cos(t) avec constant. Ne peut-il

2. Que se passe-t-il si la perturbation non mesure

pas y avoir propagation de ces oscillations ? Est-ce gnant ?


3. Que se passe-t-il si l'on superpose les deux points prcdents, un retard
de mesure et une perturbation sinusodale ?

2.1.2 Principe des calculs


De manire prliminaire, nous montrons ici comment obtenir la fonc-

tion de transfert d'un systme. Le principe des calculs est trs simple : il
d
par s. Par abus de notation et soucis de
sut de remplacer l'oprateur
dt

simplicit, on note ici y(s) la transforme de Laplace de t 7 y(t) : ainsi


R +
y(s) = 0 est y(t)dt. Sauf indication contraire, on travaille toujours en Laplace unilatral par rfrence des problmes de Cauchy avec des conditions
s
initiales nulles en t = 0. Dans ce cas, l'oprateur retard devient e
o
est le retard

Considrons le systme boucl avec


la mesure de

yr

et

variables et un retard

sur

y(t) = ay(t) + bu(t) + dw(t)

dt
u(t) = Kp (yr (t) y(t )) + I(t)

d I(t) = Ki (yr (t) y(t ))


dt

5. On peut d'abord utiliser le calcul

est y(t )dt =

0
o

doit tre nulle pour les temps

es( +) y( )d = es y(s)

ngatifs. On a aussi formellement (sans chercher

()k (k)
(t). Comme y (k) =
k=0
k! y
k
P
k
+
()
d
y = sk y , on voit naturellement apparatre la srie k=0 k! sk qui n'est autre que
dtk
s
e
. Ainsi, en calcul symbolique, l'oprateur qui la fonction y associe la fonction y
s
retarde de n'est autre qu'une multiplication par e
. On trouvera toutes les formules
le justier) le dveloppement en srie

y(t ) =

P+

ncessaires des calculs oprationnels plus compliqus dans [22].

82

CHAPITRE 2.

FONCTIONS DE TRANSFERT

On obtient alors (dans le domaine des transformes de Laplace)

sy = ay + bu + dw
u = Kp (yr es y) + I

sI = Ki (yr es y)
On peut alors calculer algbriquement

y , u,

et

en fonction de

yr

et

w .

Il

sut de rsoudre ces quations par rapport aux variables recherches. La


sortie

est une combinaison linaire de yr et w , les coecients tant des


s et es . Tout calcul fait, on obtient

fractions rationnelles en

y=

sd
b(Ki + sKp )
yr +
w
s
s(s + a) + b(Ki + sKp )e
s(s + a) + b(Ki + sKp )es

La stabilit se dduit des zros des dnominateurs (nomms ples ), i.e., les
valeurs

s C pour lesquelles la formule ci-dessus donnant y

n'est pas dnie.

Nous reviendrons sur ce point dans la Dnition 5 et la Proposition 3.


S'il existe

> 0,

tel que les valeurs de

pour lesquelles la fonction de

la variable complexe (c'est une fonction dite entire car elle est dnie pour
toute valeur de

s C)
D(s) = s(s + a) + b(Ki + sKp )es

s'annule, sont toutes dans le demi plan

<(s) ,

(2.3)
alors le systme est

asymptotiquement stable en boucle ferme. En revanche, si un des zros est


partie relle strictement positive, le systme est instable et la sortie
n'est pas borne lorsque

y(t)

t +.

Cette caractrisation est une gnralisation naturelle de celle que nous


avons dj vue pour les systmes linaires (voir Thorme 4) sous forme
d
x = A(x x) : pour ce dernier systme, le point d'quilibre x est
d'tat
dt
asymptotiquement stable en boucle ouverte lorsque les zros de det(sI

A)

sont tous partie relle strictement ngative. La formule donnant la

transforme de Laplace de

x explicitement partir de celle de x ( conditions

initiales nulles)

x = (sI A)1 A
x
n'est pas dnie pour les valeurs de

det(sI A)

appartenant au spectre de

A.

Comme

est un polynme, il ne possde qu'un nombre ni de zros d'o

l'existence de

> 0.

Pour des fonctions de s plus compliques comme les polynmes en s et


s
e
(appels quasi-polynmes [31]), on a un nombre inni de zros en gnral. La localisation des zros de la fonction entire

D(s),

dnie par (2.3),

2.1.

83

PASSAGE LA FONCTION DE TRANSFERT

est un problme ardu et non compltement rsolu l'heure actuelle (voir [29]
pour un expos complet et la Section 2.4.1 pour un exemple de rsultats
qu'on peut obtenir).
Pour

= 0, D(s) = s2 + (bKp + a)s + bKi

n'a que deux zros et ils sont

partie relle strictement ngative (sous l'hypothse

Kp , Ki , b > 0 et a 0).
partir

Nous verrons comment il est possible de calculer le retard critique


duquel

D(s)

admet ncessairement des zros instables rendant le systme en

boucle ferme instable.

2.1.3 Rgime asymptotique forc


Lorsqu'un systme est asymptotiquement stable en boucle ferme, on peut
tudier comment il ragit des perturbations (on dit aussi excitations) sinusodales

w . Comme le prcise la Proposition 4, un systme asymptotiquement

stable soumis une telle excitation, converge, aprs un transitoire, vers un


rgime priodique de mme priode. Le systme oublie sa condition initiale
(de manire asymptotique), comme discut la Section 1.1.3.
Pour une excitation priodique
notant

w = exp(t)

w = cos(t),

et on cherche la solution

on passe en complexes en

(y, u, I),

pour

yr = 0,

des

quations

y(t) = ay(t) + bu(t) + d exp(t)

dt
u(t) = Kp (yr (t) y(t )) + I(t)

d I(t) = Ki (yr (t) y(t ))


dt
sous la forme

y(t) = Y exp(t), u(t) = U exp(t) et I(t) = I exp(t). Cela

revient faire exactement les mmes manipulations que celles faites la


d
s
par s et le retard par e
, mais avec s = .
Section 2.1.2 en remplaant
dt
On obtient

Y=


sd


s
s(s + a) + b(Ki + sKp )e
s=

Ce nombre complexe peut s'crire sous la forme



sd

= G() exp(())

s
s(s + a) + b(Ki + sKp )e
s=
o

G() 0

est le gain et

() [, [,

la phase. Il sut alors de prendre

la partie relle de la formule

y(t) = G() exp((t + ()))

84

CHAPITRE 2.

FONCTIONS DE TRANSFERT

y . La solution
w = cos(t), est

priodique du systme en boucle

pour avoir le rgime forc


ferme, avec

yr = 0

et

y(t) = G() cos(t + ())


6

On reprsente sur deux graphiques, appels diagrammes de Bode , le gain

G()

et le dphasage () en fonction de . Une grande


G en fonction de est la signature de rsonances , dont les

en fonction de

variation locale de

frquences caractristiques sont donnes approximativement par les maxima


locaux de

(les pics de rsonance ). Le diagramme de Bode peut s'obtenir

exprimentalement (jusqu' une certaine frquence au del de laquelle les


instruments sont inutilisables) avec un analyseur de frquence si le systme
est eectivement asymptotiquement stable.

2.1.4 Simplications ples-zros


Il y a une distinction entre la stabilit d'un systme reprsent sous forme
d
x = Ax + Bu, y = Cx, et celle de la relation entre-sortie y(s) =
d'tat
dt
H(s)u(s).
Il peut y avoir des simplications de ples avec des zros . En d'autres
termes, il se peut qu'on ait une racine commune entre le numrateur et le dnominateur de
que

H(s). Ainsi, H(s) peut ne possder que des ples stables alors

peut avoir des valeurs propres instables. On verra que la Dnition 5

et la Proposition 3 tiennent compte de ce phnomne.


Prenons un exemple trs simple qui fera bien comprendre le problme.
Supposons que nous ayons le systme suivant

d
d2
yy = uu
2
dt
dt

(2.4)

Le calcul symbolique dj utilis prcdemment donne


soit

y=

(s2 1)y = (s 1)u,

s1
1
u=
u
2
s 1
s+1

On pourrait en conclure que le systme est asymptotiquement stable car la


relation entre-sortie ne fait apparatre qu'un seul ple

s = 1 partie relle

ngative. Ceci est faux : le systme est du second ordre, il admet une autre
valeur propre. Cette dernire est instable et vaut

1. Pour comprendre l'origine


s 1 entre

du problme engendr par la simplication par le facteur commun


6. En gnral, on trace, sur le premier graphique
des ordonnes) en fonction de

()

en fonction de

log10 ().

log10 () (log10

20 log10 (G()) (dcibels comme chelle

comme chelle en abscisse), sur le second

2.1.

PASSAGE LA FONCTION DE TRANSFERT

85

le numrateur et le dnominateur de la fonction de transfert, il faut reprendre


la transformation de Laplace (voir [52]) et bien noter que, si on ne nglige
d
plus la condition initiale, la transformation de Laplace de
y donne en fait
dt
sy y(0) au lieu de sy comme nous l'avons fait, pour simplier les calculs.

t = 0 tout est l'quilibre et tout


u0 = 0. Si tel n'est pas le cas, il faut utiliser
t = 0 de (y, y)
et de u apparaissent

Ainsi, tous nos calculs sont corrects si


est nul, c.--d.

y0 = 0, y 0 = 0

les formules o les valeurs en

et

y(s) = s2 y(s) sy0 y 0 ,

u(s)

= su(s) u0 .
R +

Elles se dmontrent avec deux intgrations par partie pour


est y(t)dt et
0
R + st
une pour
e u(t)dt

et en supposant que y
(t) et u(t)

sont continus par


0
rapport t et que les intgrales sont absolument convergentes. Ainsi on a

(s2 1)y sy0 y 0 = (s 1)u u0


o

y0 , y 0

et

u0

sont les valeurs

t=0

de

y,

d
y et
dt

u.

En eet on a

Dans ce cas, on obtient le calcul complet

y(s) =

1
sy0 + y 0 u0
u+
s+1
s2 1

u y et celui des conditions initiales


y . La simplication initialement envisage n'est plus possible, sauf pour des
valeurs trs particulire de y0 , y 0 , et u0 . Le second terme dans la fonction de
transfert correspond une fonction qui diverge lorsque t +. Il est nul
si et seulement si on a y(0)

= y(0) u(0) = 0. En gnral, cette condition


n'est pas satisfaite, le systme est instable cause du ple en s = 1 qui ne
Cette quation rvle le transfert de

disparat plus.
Dans la suite du chapitre, nous supposerons qu'il n'y a pas de canular de ce
type. En pratique, ce genre de simplication se voit trs vite en inspectant les
quations. Il sut de modier un tout petit peu les coecients, par exemple
prendre

u 0.999u

pour casser cette simplication et revoir apparatre le

ple instable qui avait disparu. Ce type de simplication est surtout gnant
quand des ples instables sont en jeu. Pour des ples stables, c'est moins
embtant et ce d'autant plus s'ils ont des parties relles fortement ngatives.
Les termes correspondants convergent de toutes faons trs rapidement vers
zro lorsque

t +.

2.1.5 Formalisme
Dans ce qui suit, on s'attache donner des lments prcis (dnitions et
proprits) concernant les fonctions de transfert que nous avons introduites

86

CHAPITRE 2.

FONCTIONS DE TRANSFERT

partir d'exemples simples dans les Sections 2.1.2, 2.1.3 et 2.1.4. On considre
un systme avec

m1

est une matrice

entres

et

p1

sorties

sous forme d'tat

d
x = Ax + Bu, y = Cx
dt
n n coecients constants, B

(2.5)
est une matrice (dans

le cas o on a plusieurs entres, sinon c'est un vecteur colonne) de taille


coecients constants, et

nm

est une matrice (dans le cas o on a plusieurs

sorties, sinon c'est un vecteur ligne) de taille

pn

coecients constants.

La notion de stabilit dont nous avons parl pour les fonctions de transfert
correspond en fait la dnition suivante.

Dnition 5 (Stabilit Entre-Borne-Sortie-Borne).

Un systme de

la forme (2.5) est stable Entre-Borne-Sortie-Borne (on dit EBSB), si pour


toute entre borne

t 7 u(t)

la sortie

t 7 y(t)

reste borne.

Dnition 6 (Matrice et fonction de transfert).

On appelle matrice de

transfert du systme (2.5) la matrice dpendant de la variable complexe

C 3 s 7 H(s) = C(sI A)1 B


s strictement
sortie) H(s) est

. Les lments de cette matrice sont des fractions rationnelles en

p=m=1

propres. Lorsque

(systme une entre et une

une simple fraction rationnelle en

s et on parle alors de

fonction de transfert.

P (s)
est dite causale ou propre quand le degr du
Une fraction rationnelle
Q(s)
numrateur P (s) est plus petit que (ou gal ) celui du dnominateur Q(s).
Lorsque l'ingalit est stricte on dit que la fraction rationnelle est strictement

causale ou strictement propre.

Dnition 7 (Ples et zros d'une fonction de transfert).


zro d'une fonction de transfert (scalaire)

H(s)

On appelle

les racines de son numra-

teur. On appelle ples les racines de son dnominateur.


Il est facile de montrer le rsultat suivant partir de la formule de variation des constantes (1.14), page 27, donnant les solutions de (2.5) (prendre

b(t) = Bu(t)).

Proposition 3.

Si les valeurs propres de

sont toutes partie relle stric-

tement ngative, alors le systme (2.5) est stable EBSB.


d
x = Ax implique la stabilit EBSB
dt
mais l'inverse est faux comme on peut s'en convaincre simplement avec le
Ainsi la stabilit asymptotique de

systme o

n=2

et

m=p=1

d
x1 = x1 + u,
dt

d
x2 = x2 + u,
dt

y = x2 .

2.1.

87

PASSAGE LA FONCTION DE TRANSFERT

> 0, la matrice A est exponentiel1


lement instable. Un simple calcul de H(s) = C(sI A) B montre que le
1
facteur (s ) apparaissant dans les dnominateurs de (sI A)
disparat
du transfert entre y et u. Plus gnralement, la rciproque de la proposition 3

Ce systme est bien EBSB mais pour

est fausse cause de simplications ples-zros dans le calcul de la fonction


C(sI A)1 B . Ces cas pathologiques sont dus au fait que l'tat

de transfert

peut ne pas tre observable partir de la sortie

aussi au fait que l'tat

(cf thorme 28) et

peut ne pas tre commandable avec l'entre

(cf

thorme 23)
On a, de manire gnrale, la proprit suivante qui permet de caractriser
la rponse asymptotique d'un systme stable EBSB une entre sinusodale.

Proposition 4

(Rponse asymptotique d'un systme stable EBSB une

entre sinusodale)

Considrons le systme (2.5) avec

m=p=1

et suppo-

H(s) sa fonction de transfert. Si on excite ce


u(t) = cos(t + ) de pulsation et de phase
alors, de manire asymptotique lorsque t +, la sortie y(t)

(t+)
le signal < H()e
= |H()| cos(t + + arg H(i)).

sons le stable EBSB. Notons

systme par un signal d'entre

constantes,

converge vers

On notera ainsi que les pulsations correspondant aux zros de

H()

sont asymptotiquement rejetes. Si

H(s)

R 3 7

a un zro en zro (c'est sou-

vent le cas lorsqu'on recoure un contrleur PI ), alors les entres constantes


sont rejetes. On a rejet de l'erreur statique .

2.1.6 Du transfert vers l'tat : ralisation


La donne d'un transfert rationnel

H(s) est quivalente la donne d'une

forme d'tat canonique minimale que nous allons dnir. C'est ce qu'on appelle la ralisation sous forme d'tat d'un transfert rationnel .
De manire prliminaire, nous allons traiter un cas particulier qui permet
de comprendre l'algorithme gnral de construction du systme d'tat.

Exemple 12 (Ralisation d'un systme d'ordre 2).


posions du transfert suivant entre

y(s) =
o

(a0 , a1 , b0 , b1 )

s2

et

Supposons que nous dis-

b1 s + b0
u(s)
+ a1 s + a0

sont des paramtres. Ce transfert correspond l'quation

direntielle du second ordre suivante

d2
d
d
y + a1 y + a0 y = b 1 u + b 0 u
2
dt
dt
dt

88

CHAPITRE 2.

On pose

z = (z1 , z2 ) = (y, dtd y)


d
z1 = z2 ,
dt

FONCTIONS DE TRANSFERT

pour obtenir

d
d
z2 = a0 z1 a1 z2 + b1 u + b0 u
dt
dt

On regroupe les drives dans la seconde quation en une seule variable

z2 b1 u au lieu de z2 . Avec les variables (x1 = z1 , x2 )


(z1 , z2 ), on a la ralisation d'tat souhaite

d
x2 = a0 x1 a1 x2 + (b0 a1 b1 )u,
dt

d
x1 = x2 + b1 u,
dt

x2 =

au lieu des variables

y = x1

On notera les matrices


A=

0
1
a0 a1


,

B=

b1
b 0 a1 b 1


,

C = (1 0)

(2.6)

On voit que l'astuce est de faire disparatre par des changements astucieux
sur l'tat, les drives de

u.

Supposons maintenant que nous ayons eu un degr de plus au numrateur

y(s) =

b2 s 2 + b1 s + b0
u(s)
s2 + a1 s + a0

Alors, en reprenant les calculs prcdents, on a avec

d
z1 = z2 ,
dt

z = (y, dtd y)

d
d2
d
z2 = a0 z1 a1 z2 + b2 2 u + b1 u + b0 u
dt
dt
dt

On pose z
2 = z2 b2 dtd u. Avec les variables
2
u, dtd 2 u, disparat

d
d
z1 = z2 + b2 u,
dt
dt

(z1 , z2 ),

la plus haute drive de

d
d
z2 = a0 z1 a1 z2 + (b1 a1 b2 ) u + b0 u
dt
dt

On regroupe les drives dans les deux variables suivantes :

x1 = z1 b2 u,

x2 = z2 (b1 a1 b2 )u

On obtient alors la forme d'tat souhaite (avec une loi de sortie qui dpend
directement de

u)

d
x1 = x2 + (b1 a1 b2 )u,
dt
car

y = x 1 + b2 u .

d
x2 = a0 x1 a1 x2 + (b0 a0 b2 a1 (b1 a1 b2 ))u
dt

2.1.

89

PASSAGE LA FONCTION DE TRANSFERT

D'aprs l'exemple prcdent, on comprend ainsi que, par liminations


successives des plus hautes drives de

en rajoutant des drives de

dans les composantes de l'tat, il est toujours possible, lorsque la fraction

rationnelle

y(s)/u(s) = G(s)

est propre, d'obtenir la forme d'tat suivante

d
x = Ax + Bu,
dt
o

dim(x)

y = Cx + Du

est gal au degr du dnominateur de

G(s)

G(s) = (C(sI A)1 B + D)u


Cette mthode de ralisation se gnralise aux systmes multi-variables avec

m > 1

entres

et

p > 1

sorties

y,

le transfert entre

et

tant donn

(en accord avec la Dnition 6), par une matrice dont les lments sont des
fractions rationnelles en

s.

Un lecteur intress par un expos plus formel de

la thorie de la ralisation pourra consulter [38].


Plusieurs ralisation direntes peuvent conduire au mme transfert. Une
ralisation dirente de celle propose par (2.6) peut tre obtenue avec le
schma gnral de la Figure 2.1 qui fournit une ralisation d'une fonction de
transfert strictement propre

bn1 sn1 + ... + b0


sn + an1 sn1 + ... + a0
ainsi que les formes canoniques

x = Ax + Bu,
1.

(A1 , B1 , C1 )

avec

0
1
0
0
0
1

...
...
A1 =
0
... 0
a0 a1 ...

C1 = b0 ... bn1
2.

(A2 , B2 , C2 )

y = Cx

...
0
...
...
...
...
0
1
... an1

, B1 = 0

...

avec

0 a0
b
0
...
...
, B = ...
...
... 2
bn1
1 an1

0 ... 0 1

0
1
A2 =
...
0
C2 =

...
0
...
...

90

CHAPITRE 2.

FONCTIONS DE TRANSFERT

Figure 2.1  Ralisation d'une fonction de transfert strictement propre.

2.2 Schmas blocs et fonctions de transfert


Les schmas blocs sont un langage relativement universel. Ils permettent
d'exprimer l'action sur un systme des commandes, des perturbations, et
d'expliciter des schmas de rgulation. On prsente ici, pour une structure
trs gnrale de contrle (voir Figure 2.5), les fonctions de transfert en boucle
ferme.

2.2.1 De la forme d'tat vers le transfert

Figure 2.2  Le schma blocs de type fonctionnel pour le systme en boucle


ouverte avec comme contrle
sure)

u, comme perturbation w

et comme sortie (me-

y.

Reprenons les notations d'un systme non linaire telles que nous les
avons vues la Section 1.4.3. On considre un systme tout fait gnral
dcrit par

d
x = f (x, u, w, p),
dt
o

Rn 3 x 7 y = h(x) Rm<n

p reprsente des paramtres, u reprsente des commandes et w

reprsente

des perturbations. On dispose de capteurs qui fournissent chaque instant la

2.2.

91

SCHMAS BLOCS ET FONCTIONS DE TRANSFERT

Figure 2.3  Le schma blocs de type fonctionnel pour le systme en boucle


ferme o le nouveau contrle est

(typiquement la consigne que

doit

suivre).

valeur

(en gnral

dim(y) < dim(x)

c.--d. que l'tat du systme n'est pas

compltement mesur). Les dimensions de

x , u, w

et

sont ici arbitraires.

Ce systme est reprsent par le schma blocs de la Figure 2.2.


On labore une loi de contrle sous la forme d'un retour dynamique de

sortie , c.--d. un systme dynamique (comme l'est un rgulateur PI)

d
=a
(y, , v),
dt

, v)
u = k(y,

est le nouveau contrle. On complte alors le schma blocs en boucle

ouverte de la Figure 2.2 par une boucle de rtro-action en montrant bien que
les informations issues de la sortie

y,

sont utilises de manire causale pour

u de faon atteindre un objectif prcis. Typiquement, le


v sera la consigne que devra suivre y (lorsque v et y ont la
dimension) et u sera calcul de faon ce que y suive v . On obtient

ajuster le contrle
nouveau contrle
mme

ainsi le schma en boucle ferme de la Figure 2.3.


Supposons que l'on soit proche d'un point d'quilibre

v). On
(
x, y, u, w,
,

peut linariser toutes les quations ci-dessus, celle du systme et celle du


contrleur, et ainsi tudier de faon plus formelle et approfondie la dynamique
du systme en boucle ouverte et/ou en boucle ferme. On supposera ici pour
simplier que
doit suivre

de simplicit,

dim(u) = 1, dim(y) = 1

et que

v = yr

est la consigne que

(problme de rgulation mono-variable). On notera, par souci

(x, y, u, w, , v)

les carts l'quilibre

v).
(
x, yr , u, w,
,

92

CHAPITRE 2.

FONCTIONS DE TRANSFERT

Figure 2.4  Le schma blocs en boucle ouverte.

2.2.2 Transfert avec perturbation et bouclage


Les quations du systme linaris tangent s'crivent

x = Ax + Bu + Dw

dt

y = Cx

u = Ly + M + N v

d = F + Gy + Hv
dt
A, B , D, C , L, M , N , F , G, et H s'obtiennent
et a
partielles de f , h, k
. Par le calcul symbolique, on

o les matrices
drives
par

partir des
d
remplace
dt

pour obtenir le systme d'quations algbriques suivant

sx = Ax + Bu + Dw

y = Cx

u = Ly + M + N v

s = F + Gy + Hv
On rsoud simplement

x = (sI A)1 (Bu + Dw)

et on forme alors

y = G(s)u + Gw (s)w
avec

G(s)

et

Gw (s)

les fractions rationnelles suivantes

G(s) = C(sI A)1 B,

Gw = C(sI A)1 D

Ceci nous donne le schma blocs du transfert en boucle ouverte de la Fi1


gure 2.4. Comme = (sI F ) (Gy + Hv), on a





u = L + M (sI F )1 G y + N + M (sI F )1 H v

2.2.

93

SCHMAS BLOCS ET FONCTIONS DE TRANSFERT

Figure 2.5  Le schma blocs en boucle ferme ; conguration normale d'une


boucle d'asservissement.

Pour un problme de rgulation on note

v = yr
et on choisit

L = N

et

G = H .

On a donc

u = K(s)(yr y) = K(s)e
avec

K(s)

la fraction rationnelle

K(s) = N + M (sI F )1 H
On en dduit le schma blocs de la boucle ferme de la Figure 2.5. On notera
les indications de signe

. L'intrt de ces schmas blocs rside surtout dans

leur cot fonctionnel et visuel. Ils permettent de mieux comprendre les liens
de cause eet.
Pour rsumer, on a obtenu de faon directe les relations entre les entres

et

yr

et certaines variables comme

et

e = yr y

GK
Gw
yr +
w,
1 + GK
1 + GK
1
Gw
e=
yr
w
1 + GK
1 + GK

y=

Il est alors usuel de xer le cahier des charges d'un asservissement

(2.7)
(2.8)

K(s)

en

donnant les gabarits pour les diagrammes de Bode (surtout celui relatif au
gain en fonction de la pulsation

yr

) des transferts en boucle ferme entre y et


e et w (performances en rejet

(performances du suivi de consigne) et entre

de perturbation). Nous renvoyons aux ouvrages classiques [70] et au cours de


SI des classes prparatoires.

94

CHAPITRE 2.

FONCTIONS DE TRANSFERT

2.3 Marge de robustesse


2.3.1 Critre de Nyquist
Revenons au problme que nous avons voqu en introduction dans la
Section 2.1.1. tant donns le systme (2.1) et le rgulateur PI (2.2), on

cherche calculer le retard critique au del duquel le systme en boucle


ferme devient instable. Le schma blocs en boucle ferme correspond celui
de la Figure 2.5 avec ici les transferts suivants

b
,
G(s) =
s+a

d
Gw (s) =
,
s+a


K(s) =

Ki
Kp +
s

es

Comme prcis dans l'quation (2.7), on a

y=
Ici,

GK
Gw
yr +
w
1 + GK
1 + GK

G(s) et K(s) sont les quotients de fonctions de s globalement dnies sur

le plan complexe.
Les objets que nous allons devoir manipuler sont des fonctions mro-

morphes sur le plan complexe

riable complexe est en fait (voir par exemple [15]) le


deux fonctions entires

P (s)

et

F (s) de la vaquotient P (s)/Q(s) de

: une fonction mromorphe

Q(s),

la fonction

tant non identiquement

nulle. Une fonction entire est la fonction associe une srie dont le rayon
de convergence est innie. Ainsi,

est mromorphe sur

si et seulement si

P+
an s n
F (s) = Pn=0
+
n
n=0 bn s
an et bn deux suites de nombres complexes 7 telles que les sries associes
n
ont un rayon de convergence inni, c.--d. pour tout r > 0, limn7+ an r =

n
s
limn7+ bn r = 0. Ainsi e , cosh( s), sin(s)/s sont des fonctions entires
cos(s)
sin(s2 )
et
, 1/s,
sont des fonctions mromorphes sur C. En revanche,
sin(s)
cos(s3 )
exp(1/s) n'est ni une fonction entire, ni une fonction mromorphe sur C.
En eet, elle admet en 0 une singularit de degr inni. Pour une fonction
P
8
mromorphe F = Q , les zros de P sont les zros de F et les zros de Q sont
les ples de F . De manire informelle, les fonctions entires peuvent tre vues
avec

comme des polynmes de degr inni et les fonctions mromorphes comme


7. Il faut qu'au moins l'un de

bn

soit dirent de

8. On peut toujours choisir les fonctions entires


zro en commun.

0.
P

et

pour qu'elles n'aient aucun

2.3.

95

MARGE DE ROBUSTESSE

l'analogue des fractions rationnelles en remplaant les polynmes par des


fonctions entires. Autour d'un ple

z0 ,

fonctions mromorphes et fractions

rationnelles ont des dveloppements limits gnraliss trs similaires de la


forme

+
X

an (z z0 )n

n=n0
avec

n0 > 0 (an0 6= 0)

tant la multiplicit du ple.

Dans notre cas, on a les fonctions mromorphes

G(s) =
avec

NG (s)
,
DG (s)

K(s) =

et

qui suivent

NK (s)
DK (s)

NG = b, DG = s + a, NK = (sKp + Ki )es , DK = s
et on doit considrer dans le transfert en boucle ferme, la fonction mromorphe

T
T =

N (s)
NG NK
GK
=
=
1 + GK
D(s)
DG DK + NG NK

avec

N (s) = b(sKp + Ki )es ,

D(s) = s(s + a) + b(sKp + Ki )es

partir de laquelle D(s) admet au


moins un zro dans le demi plan <(s) 0, i.e., un zro instable. Ce zro sera
un ple instable de T (il sera galement un ple instable du transfert depuis
La valeur critique

la perturbation

est la valeur de

Gw
).
1+GK
0, b, Kp , Ki

il est clair que les zros instables de D(s),


sKp +Ki s
correspondent aux zros instables de 1 + GK = 1 + b
e
. La fonction
s(s+a)
Comme

s 7 1 + GK(s)

> 0,

est ici dnie pour

dirent de

et

a < 0.

On va maintenant utiliser un rsultat important d'analyse complexe qui


relie le nombre de zros et de ples d'une fonction mromorphe

F (s)

dnie

sur un domaine du plan complexe, la variation de son argument lorsque


l'on parcourt le bord du domaine dans le sens direct. On suppose, pour
que l'argument de

F (s)

soit dni sur le bord du domaine, que

est bien

dnie sur le bord (pas de ple sur le bord) et aussi qu'elle ne s'annule pas
(pas de zro sur le bord). Comme on eectue une boucle, il est clair que la
variation totale de l'argument est ncessairement un multiple de

2N

est alors le nombre de tours autour de

9. On remarque que

NG

et

DG

ne s'annulent pas en mme temps, ni

important : il faut prendre ici les fractions irrductibles pour

2 ,

disons,

que fait le point d'axe

et

K.

NK

et

DK .

C'est

96

CHAPITRE 2.

FONCTIONS DE TRANSFERT

Figure 2.6  Le thorme de Cauchy pour une fonction mromorphe F (s)


de

sC

et un domaine

dlimit par la courbe ferme note

Cs ; F (s)

CF lorsque s parcourt Cs dans le sens direct.


N que fait CF autour de 0 est reli aux nombres de
ples P et de zros Z de F (s) dans par N = Z P . Ici Z = 4 et P = 2,
donc F (s) fait deux fois le tour de 0 dans le sens direct, i.e., N = 2.

dcrit une courbe ferme note


Alors, le nombre de tours

F (s) lorsque s parcourt le bord dans le sens direct une seule fois. Le
Thorme 18 de Cauchy illustr sur la Figure 2.6, dit alors que N = Z P ,
o Z est le nombre de zros et P le nombre de ples l'intrieur du domaine.

complexe

Les zros et les ples sont compts avec leur multiplicit. On en donne ici
un nonc plus formel dont la preuve complte s'appuie sur le thorme des
0
rsidus appliqu la fonction F /F (voir [53]).

Thorme 18
complexe

(Cauchy)

Soient

Cs

une courbe ferme simple dans le plan

oriente dans le sens direct, et

F (s)

une fonction mromorphe

Cs . Soit CF la courbe ferme du plan complexe


F (s) lorsque s parcourt Cs dans le sens direct. Notons N le nombre
de tours (compts dans le sens direct) que fait CF autour de 0, et P et Z
respectivement le nombre de ples et de zros contenus l'intrieur de Cs .
n'ayant ni ples ni zros sur
dcrite par

Alors on a l'galit suivante

N =Z P
Dmonstration. Sur le domaine dlimit par
R(z)
avec
Q(z)

R(z) =

Z
Y

(z rk )R(z),

Q(z) =

k=1
o les

zk

sont les

zros et les

Cs on peut toujours crire F (z) =


P
Y

(z qk )Q(z)

k=1

qk

les

ples (apparaissant plusieurs fois

s'ils sont multiples) et o les fonctions analytiques

et

ne s'annulent ni

2.3.

97

MARGE DE ROBUSTESSE

Figure

2.7  La boucle que doit faire

pour englober tout le demi plan


p +Ki s
e
en
GK(s) = b sK
s(s+a)

partie relle positive tout en vitant le ple de

s = 0; R > 0

est grand et

sur la courbe ferme

Cs

log F (z) =

est petit.

ni sur le domaine qu'elle entoure. L'argument de

est la partie imaginaire de

Z
X

>0

log F

log(z rk )

k=1

P
X

log(z qk ) + log R(z)


log Q(z)

k=1

z dcrit Cs est la somme de trois


log(zrk ), les opposs des variations

des arguments des log(zqk ) et la variation de l'argument de log(R(z)/


Q(z))
.
Or la variation de l'argument de log(z rk ) ou de log(z qk ) est 2 car rk

et qk sont entours par Cs . Comme R(z)/


Q(z)
ne s'annule pas, la variation
10
de son argument vaut 0 lorsque z parcours une fois Cs . Ainsi la variation
de l'argument de F est bien Z P .

Ainsi la variation de l'argument de

lorsque

termes : les variations des arguments des

Dans notre cas,

p +Ki s
F = 1+GK = 1+b sK
e
admet un ple simple en 0.
s(s+a)

de la forme d'un demi-disque comme illustr sur la Figure 2.7 avec


R > 0 grand et  > 0 petit. On note CR, le bord de . On voit que si 1 + GK
admet un zro dans le demi-plan <(s) 0, il doit faire partie ncessairement
d'un tel pour un R assez grand et un  assez petit. Maintenant, il faut

Prenons

10. Pour s'en convaincre, il sut de dformer la courbe ferme

Cs

nment en un point, intrieur au domaine initialement entour par

en la rduisant conti-

Cs .

Au cours de cette

R(z)/
Q(z)
ne s'annule jamais, son argument est donc bien dni
et sa variation sur un tour de la courbe dforme est un multiple de 2 . la n de la
dformation, la courbe ferme suivie par z est rduite un point et donc la variation de

l'argument de R(z)/
Q(z)
est nulle. Au cours de la dformation, la variation ne peut pas
sauter brusquement d'un multiple non nul de 2 0 pour cause de continuit. Ainsi cette

dformation (homotopie),

variation doit tre nulle ds le dpart.

98

CHAPITRE 2.

compter le nombre de tour que fait


parcoure

CR,

FONCTIONS DE TRANSFERT

F = 1 + GK

: c'est ncessairement dans le sens positif car ici

pas de ple dans

c.--d.

0 lorsqu'on
1 + GK , n'a

autour de

P = 0.

F = 1 + GK au lieu de D = NG NK +
DG DK la place de F . On viterait le ple en s = 0 qu'on est oblig de
contourner avec le petit demi-cercle de rayon . Cela vient du fait que sur la
partie de CR, loin de l'origine (bref sur le grand demi cercle de rayon R) GK
est trs petit et reste donc trs proche de 0. Sur cette partie, F reste ainsi trs
proche de +1 et ne tourne donc pas autour de 0. Le fait que GK soit petit
pour les s de CR, loin de l'origine vient du fait que les transferts G et K sont
sKp +Ki s
e
tend vers 0 lorsque s tend
des transferts causaux : GK(s) = b
s(s+a)
vers l'inni tout en restant partie relle positive. On voit que > 0 est
capital ici pour avoir cette proprit et que ce n'est plus vrai pour s tendant
Maintenant, pourquoi considrer

vers l'inni avec une partie relle ngative.

1 + GK autour de 0 revient compter


le nombre de tours de GK autour de 1. Ainsi, si la courbe ferme du plan
complexe dcrite par GK(s) avec s dcrivant le contour de la Figure 2.7
n'entoure pas 1, alors, F = 1 + GK n'entoure pas 0. On a donc N = 0, or
P = 0 donc, d'aprs le Thorme de Cauchy 18, on dduit Z = 0, F n'admet
pas de zro dans le demi plan <(s) > 0. On vient de retrouver ici le critre
Compter le nombre de tours de

du revers (connu en classes prparatoires).

Figure 2.8  Exemple de systme pour l'tude du Thorme de Cauchy.


Exemple 13 (Illustration du Thorme de Cauchy pour dirents contours).

1
Soit le systme de fonction de transfert s+2 boucl par un contrleur PI de
K
40
fonction de transfert KP + sI = 3 + s . Pour l'tude du systme en boucle
ferme reprsent sur la Figure 2.8, on doit tudier l'annulation de la fonction

de transfert

1+

sKp + KI
s2 + 5s + 40
=
s(s + 2)
s(s + 2)

Ce transfert possde deux ples (0 et 2) et deux zros complexes conjugus

53i 15
. On peut, en utilisant dirents contours comme on l'a fait sur la
2
Figure 2.9, vrier la formule N = Z P du Thorme 18 de Cauchy.

2.3.

99

MARGE DE ROBUSTESSE

Z=0, P=0

N=0

50

1000

-50
-50

50

-1000
-200

200

400

600

800

-2
-2

-1

Z=2, P=2
50

1000

-50
-50

50

-1000
-200

200

400

600

800

-2
-2

-1

Z=2, P=1
1000

-50
0

50

-1000
-800

-600

-400

-200

200

-2
-2

-1

Z=0, P=1

N=-1

50

1000

-50
-50

N=1

50

-50

0
N=0

50

-1000
-800

-600

-400

-200

200

-2
-2

-1

Figure

2.9  Illustrations du Thorme 18 de Cauchy. Gauche : courbe


sKp +KI
ferme parcourue par s. Milieu : lieu de 1 +
. Droite : agrandissement
s(s+2)
du lieu autour de 0.

Des considrations ci-dessus on dduit sans peine le critre de Nyquist


pour les systmes boucls de la Figure 2.5.

Dnition 8 (Lieu de Nyquist).


en boucle ouverte

galement strictement causal


par des facteurs du type
pas sur des

s0

tant donne une fonction de transfert

G(s) strictement causale et un transfert de contrleur K(s)


11

. On suppose que, s'il y a des simplications

(s s0 )

dans le produit

la courbe dcrite dans le plan complexe par

vers

G(s)K(s),

elles ne portent

partie relle strictement positive. On appelle lieu de Nyquist

G()K()

lorsque

parcourt

Thorme 19

(Critre de Nyquist)

Avec les notations de la Dnition 8,

11. Par strictement causal, on signie ici que


morphes qui tendent vers zro quand

G(s)

et

K(s)

sont des fonctions mro-

tend vers l'inni dans le demi plan complexe

partie relle positive. C'est le cas pour des fractions rationnelles dont le degr du numrateur est strictement infrieur celui du dnominateur.

100

CHAPITRE 2.

FONCTIONS DE TRANSFERT

le systme en boucle ferme de transfert

GK
1 + GK
est asymptotiquement stable si et seulement si le lieu de Nyquist ne passe
pas par

GK

et s'il entoure le point

dans le sens indirect autant de fois que

admet de ples partie relle strictement positive (les ples sont compts

avec leur multiplicit).

Exemple 14 (Stabilisation avec retard). Considrons le systme de fonction


de transfert avec retard

 s  s2 + 4s + 2
G(s) = exp
2
s2 1

(2.9)

On boucle ce systme avec un contrleur P proportionnel de gain

k,

pour

obtenir le schma en boucle ferme reprsent sur la Figure 2.10. On se

Figure 2.10  Bouclage d'un systme retard.


demande sous quelle condition sur

k , le paramtre de rglage du contrleur, on

obtient la stabilit en boucle ferme. Pour rpondre cette question, il sut de


tracer le lieu de Nyquist de

kG(s), qu'on a reprsent sur la Figure 2.11 (pour

k = 1).

comporte un unique ple partie relle positive.

Le transfert

G(s)

D'aprs le Thorme 19, pour que le systme en boucle ferme reprsent sur
la Figure 2.10 soit asymptotiquement stable, il faut et il sut que le lieu de
Nyquist entoure une seule fois (dans le sens indirect) le point
pas le cas avec

1.

Ce n'est

k = 1,

comme on peut le constater sur la Figure 2.11. Le


1
1
paramtre k agit comme une homothtie. Pour k ] 2 , 1.1845 [, le systme est
asymptotiquement stable, il est instable sinon.
Si,

GK

admet des ples sur l'axe imaginaire, alors le lieu de Nyquist

admet des branches innies. Il convient alors pour compter correctement le


nombre tours de modier lgrement le contour le long de l'axe imaginaire
descendant comme on l'a fait auparavant pour le ple en

s = 0

(voir Fi-

gure 2.7) : on contourne chaque ple imaginaire avec un petit demi-cercle,


centr sur ce ple imaginaire et qui passe du cot de

<(s) > 0.

2.3.

101

MARGE DE ROBUSTESSE

1.5

0.5

-1.1845

-0. 5

-1

-1. 5

-2

-1. 5

-1

-0. 5

0.5

Figure 2.11  Lieu de Nyquist de kG(s) donn par (2.9) avec k = 1.


Noter enn que, en toute gnralit, pour que le critre de Nyquist implique la stabilit asymptotique, il faut qu'il existe

>0

tel que,

lim
G(s)K(s) = 0
|s| 7 +
<(s)

ce qui est le cas pour les fractions rationnelles et les fractions de quasipolynmes tels que ceux que nous avons considrs. En eet si
les conditions du critre de Nyquist, alors pour un parcours en
dcal vers la gauche,

s = + ,

allant de

GK

vrie

lgrement

+ vers et 0 <
GK( + ) lgrement

trs petit a priori, on aura un lieu de Nyquist,


dplac et qui entourera le point

avec le mme nombre de tours que

celui pour lequel = 0. Ainsi, on est sr que les zros de 1 + GK et donc de


D = NG NK +DG DK sont tous partie relle infrieure . Nous dtaillons
ces conditions ici car nous souhaitons prendre en compte des retards. Donc
on ne peut pas se contenter de prendre
rationnelles en
s
et e
.

et

dans la classe des fractions

uniquement. On souhaite aussi traiter des fractions en

102

CHAPITRE 2.

FONCTIONS DE TRANSFERT

2.3.2 Marge de phase


p +Ki s
e
. Nous allons calculer exG(s)K(s) = b sK
s(s+a)

plicitement le retard critique > 0 partir duquel, le lieu de Nyquist


commence entourer 1. Il est donn par ce que l'on appelle la marge de

Revenons l'exemple

phase .
On commence par une normalisation en posant

s
s = ,
a

k = abKp ,

Ki
,
Kp a

Alors

G(s)K(s) = G(
s)K(
s) = kes

= a

s +
s(
s + 1)

Ainsi, quitte changer l'chelle de temps, on peut toujours supposer


on confond dans la suite

s et s

a = 1,

et on crit

G(s)K(s) = kes

s+
s(s + 1)

Sur la Figure 2.12, on a trac le lieu de


parcours de la Figure 2.7. Le point

G(s)K(s)

pour

suivant le

est l'extrieur du domaine entour

par le lieu de Nyquist. En gnral, on ne reprsente pas le grand demi-cercle


du demi plan droit. On ne trace que la gure simplie qui est droite. On
sait alors qu'il faut refermer cette courbe en partant de la branche innie du
+

bas = = lorsque = 0 vers celle du haut = = + lorsque = 0 en


passant l'inni par le demi plan droit

< > 0.

On trouvera sur la Figure 2.13, les dformations successives qu'on observe

grandit, c.--d. lorsqu'on change les rglage du contrleur. On se convaincra sans dicult que lorsque = 0, le lieu de Nyquist de
G(s)K(s) n'entoure jamais 1 quels que soient k et > 0. Noter que lorsque
= 0, la stabilit est donne par les racines d'un polynme de degr deux et

lorsque le paramtre

on a dj vu, au premier chapitre, qu'un rgulateur PI sur un premier ordre


est toujours asymptotiquement stable. Mais ce n'est pas pour retrouver ce
fait trivial que l'on a fait tout cela. C'est pour voir ce qui se passe lorsque le
retard

est non nul.

Pour les mmes


de

,
=0
et

quelle relation y-a-t-il entre le lieu de Nyquist

G(s)K(s) lorsque
et > 0 ? Pour s = , G()K() subit une
(multiplication par e ). Comme l'illustre la Figure 2.14,

valeur critique partir de laquelle 1 rentre l'intrieur du domaine

rotation de
la

entour par le lieu de Nyquist, est directement lie aux points d'intersection
du lieu de Nyquist pour

= 0 avec le cercle unit. Pour chaque k et , on note

les deux valeurs de pulsation qui correspondent aux points d'intersection

2.3.

103

MARGE DE ROBUSTESSE

s+
Figure 2.12  Le lieu de Nyquist de G(s)K(s) = kes s(s+1)

=0

et

lorsque

= 0.5. ;

la courbe ferme

dcrit la courbe

CR,

de la

k = 1,
du plan complexe dcrite par G(s)K(s)
Figure 2.7 pour R  1 et 0 <   1.

s+
Figure 2.13  Le lieu de Nyquist de G(s)K(s) = kes s(s+1)

=0

et diverses valeurs de

avec

avec

k = 1,

104

CHAPITRE 2.

Figure 2.14  La marge de phase

pour

FONCTIONS DE TRANSFERT

s+
G(s)K(s) = k s(s+1)

avec

k = 1,

= 0.5.
avec le cercle unit. Un simple calcul faisant intervenir une quation bi-carre
(+)
traduisant le fait que le complexe k
est de module 1, donne
(+1)

s
=
On note

[0, [

(1 k 2 ) +

p
(1 k 2 )2 + 4k 2 2
2

l'argument suivant (noter le signe

e = k

au second membre)

( + )
( + 1)

c'est la marge de phase . Alors,

est le retard critique au del duquel des instabilits apparaissent. La marge


de phase n'a pas vraiment de sens intrinsque. Seul compte en fait le retard

critique qui s'en dduit : si, par exemple, la pulsation critique est trs

petit alors le retard critique est grand ds que n'est pas proche de 0.
Pour

k = 1

stabilit lorsque

et

= 0.5,

la Figure 2.15 montre la perte progressive de

grandit, la valeur critique tant autour de

2.7,

d'aprs

les formules ci-dessus. De ce graphique on tire aussi l'information suivante :

12
lorsque franchit le seuil , deux ples complexes
conjugus traversent en
12. Ce sont les ples en boucle ferme, pas ceux de

GK

mais ceux de

1/(1 + GK).

2.3.

105

MARGE DE ROBUSTESSE

Figure 2.15  Lieu


= 0.5

de Nyquist pour

et diverses valeurs du retard

s+
G(s)K(s) = kes s(s+1)

avec

k = 1,

mme temps l'axe imaginaire en venant de la partie stable. On sait cela car

juste aprs , 1 est entour deux fois donc on a exactement deux racines

partie relle strictement positive : un peu avant , le systme est trs oscillant

mais les oscillations sont lentement amorties ; un peu aprs , le systme est
toujours trs oscillant mais les oscillations sont lentement amplies.

2.3.3 Marge de gain


La marge de gain permet de quantier la prservation de la stabilit,
quand sur le modle

on connat mal le

d
y = ay + bu + dw
dt
coecient b devant u (on connat

son signe cependant),

c.--d. qu'on connat mal le gain de la commande. Cette incertitude revient


multiplier le bloc contrle K(s) par un coecient k > 0, en thorie proche
1
de 1.
tant stable, on cherche savoir partir de quelle valeur
1+G(s)K(s)

106

CHAPITRE 2.

FONCTIONS DE TRANSFERT

1
devient instable. Les valeurs
1+kG(s)K(s)
maximales et minimales admissibles de k sont appeles marges de gain .
s s+
Reprenons l'exemple G(s)K(s) = e
. On considre tout d'abord
s(s+1)
= 0. On voit d'aprs les divers lieux de Nyquist tracs sur la Figure 2.13 que,
de

(en partant de

1),

le transfert

quelle que soit l'homothtie de rapport

1.

par

positif, ce dernier ne passe jamais

Ainsi, on a une marge de gain innie dans ce cas. C'est une faon

indirecte de retrouver le rsultat du Chapitre 1 qui dit qu'un rgulateur PI


sur un 1er ordre stable est toujours asymptotiquement stable pourvu qu'on
connaisse le signe du gain sur le contrle.

Cependant, supposons que nous ayons un petit retard, par exemple

0.25

pour

= 0.5.

Alors on voit sur la Figure 2.15 que ce petit retard ne

modie sensiblement le lieu de Nyquist qu'autour de


sont grandes en valeurs absolues. Plus

exp()

0, l o les pulsations

est grand, plus la multiplication par

aura tendance enrouler le lieu de Nyquist autour de

est vident que, quelle que soit la taille du retard

> 0,

0.

Aussi, il

mme trs petit, on

trouvera toujours une dilatation du lieu de Nyquist, qui l'amne passer par

1.

Bien-sr, plus le retard sera petit, plus la dilatation

devra tre grande

pour introduire une instabilit.


On retrouve ainsi ce que nous avons vu dj au chapitre prcdent sur les
dynamiques ngliges : les gains

Kp

rement grands. Ici, un petit retard

et Ki ne peuvent pas
=  > 0 correspond

tre pris arbitrai une dynamique

rapide nglige. Il est intressant de remarquer que le Thorme de Tikhonov 15 porte sur des systmes singulirement perturbs, c'est dire avec un

 positif devant d/dt. C'est formellement et aussi fondamens


talement la mme chose pour un retard d'ordre  : dans l'oprateur e
on
retrouve bien le mme petit paramtre devant s = d/dt.
petit paramtre

2.3.4 Lecture des marges sur le diagramme de Bode


Il sut de prendre un exemple pour comprendre comment on fait. Sur la
1
s s+ 2
qui
gure 2.16 on a trac le diagramme de Bode pour G(s)K(s) = e
s(s+1)
n'admet aucun ple partie relle strictement positive. Ainsi on voit que

 la marge de gain k est gale l'inverse du module de GK() pour


la pulsation

= k

o l'argument de

GK

passe la premire fois par

(sur le diagramme cela correspond au premier saut de

180

+180

degrs).
 La marge de phase
et

pour la pulsation

GK par 1
(20 log10 )).

module de
dcibel

correspond l'cart entre la phase de

GK()

correspondant au premier passage du

(sur le diagramme cela correspond dont

en

2.3.

107

MARGE DE ROBUSTESSE

gain: module de GK en dB

40
30
20
10

0
10
20

phase: argument de GK en degr

30
2
10

(rad/s)

10

10

10

150
100
50
0
50
100
150
10

10

(rad/s)

10

10

Figure 2.16  Visualisation sur le diagramme de Bode des marges de gains


k

et de phase

lorsque

s+ 1

2
.
G(s)K(s) = es s(s+1)

Alors la marge de retard, qui seule une signication physique, est donne

. Dans cette formule l'unit d'angle pour et doit tre la


par =

mme (il est conseill prendre des radians pour ne pas se tromper).

2.3.5 Ples dominants


Supposons, comme nous l'avons fait dans le chapitre prcdent, que le
capteur qui fournit

n'est pas instantan mais a une petite dynamique que


1
. Ainsi G(s)
1+s
est remplac par G = G(s)R (s). Supposons 1/(1 + G(s)K(s)) stable. Alors

l'on peut reprsenter comme un ltre rapide de transfert

 > 0, susamment petit, 1/(1 + G (s)K(s)) reste stable.


Pour  assez petit, l'eet sur le lieu de Nyquist de G(s)K(s) de la multipli1
cation par
, n'est notable que pour des s = assez grands en module. Or,
1+s
pour de tels de l'ordre de 1/, G()K() est dj trs petit et donc seule
pour

la partie du lieu qui est proche de l'origine est modie. Donc le nombre de
tour autour du point

1 ne change pas, et donc le transfert 1/(1+G (s)K(s))

108

CHAPITRE 2.

FONCTIONS DE TRANSFERT

est lui aussi stable. Aussi, il est lgitime de faire brutalement


transfert

G

pour ne garder que

G.

On dit alors que

G(s)

=0

dans le

ne conserve que

les ples dominants : il est ainsi lgitime d'liminer les ples trs rapides et
stables.
En rsum, ne conserver que les ples dominants dans le transfert

est identique au fait de prendre comme modle de contrle la partie lente


du systme, la partie rapide tant stable : l'approximation, dcrite dans la

0
Section 1.4.1 du systme lent/rapide ( ) par le systme lent ( ) est de
mme nature que celle de

G

par

G = G0 .

2.4 Complments
2.4.1 Calcul de tous les contrleurs PID stabilisant un
systme du premier ordre retard
Comme on l'a vu, le contrleur PI et plus gnralement le contrleur

PID (D pour drive) est extrmement ecace et utilisable dans un nombre


important de situations. On a vu que le transfert K d'un PI est K(s) =
kP + ksI avec kP et kI les gains proportionnel et intgral. Le rgulateur PID
a simplement le transfert

K(s) = kP +
o

kD

kI
+ kD s
s

est le gain driv. Ainsi, rgler un PID revient trouver les bons gains,

quand c'est possible,

GK/(1 + GK)

kP , kI

et

kD ,

pour avoir un transfert en boucle ferme

au minimum stable.

On a vu comment tester sa robustesse , notamment au retard. On propose


ici quelques rsultats thoriques importants qui donnent des conditions ncessaires et susantes pour obtenir la stabilit en boucle ferme en utilisant
un tel contrleur. Ces rsultats se limitent aux systmes du premier ordre (on
se rfrera [64], pour direntes extensions aboutissant des noncs beaucoup plus indirects), leur dmonstration fait appel des rsultats d'analyse
complexe permettant de qualier la ngativit des racines d'un polynme
sans les calculer. De tels critres (critre de Routh, ou de Hermite-Biehler
noncs dans les Thormes 7 et 6) sont souvent utiliss car numriquement
trs simples.
On considre un systme du premier ordre retard dont la fonction de
transfert est

G(s) =

k
es
1 + s

(2.10)

2.4.

109

COMPLMENTS

k R+ , R , R+ .

Dans un premier temps, on considre qu'on

utilise seulement un contrleur proportionnel

K(s) = kP

(2.11)

et qu'on l'utilise tel que reprsent sur la Figure 2.17.

Figure 2.17  Bouclage d'un systme du premier ordre retard.


Deux cas sont alors considrer. Soit le systme est stable (cas du Thorme 20) en boucle ouverte, et on cherche juste amliorer ses performances
par un contrleur en boucle ferme, soit le systme est instable (cas du Thorme 21) et c'est la boucle ferme de le stabiliser.

Thorme 20

([64])

On suppose

> 0,

alors l'ensemble des contrleurs

proportionnels prservant la stabilit du systme (2.10) est dni par les valeurs admissibles suivantes

z1

1
1
< kP <
k
k cos z1

]/2, [

est l'unique racine sur

de l'quation

tan(z) =

On notera de plus que la borne suprieure sur


fonction dcroissante du retard

kP

dans cet nonc est une

. Dans le cas instable, on souhaite en gnral

que le contrleur stabilise galement le systme en l'absence de retard. On


aboutit alors l'nonc suivant.

Thorme 21

([64])

< 0.

On suppose

Une condition ncessaire pour

que le contrleur proportionnel (2.11) stabilise la fois le systme (2.10) et


ce mme systme en l'absence de retard est que

< | |.

On suppose cette

condition vrie, alors l'ensemble des contrleurs proportionnels assurant la


stabilit du systme (2.10) est dni par les valeurs admissibles suivantes

k
o

z1

est l'unique racine sur

z12

]0, /2[

2
< kP <

de l'quation

tan(z) =

1
k

110

CHAPITRE 2.

FONCTIONS DE TRANSFERT

La preuve de ces thormes utilise l'extension du Thorme 6 de HermiteBiehler pour les quasi-polynmes (i.e. des polynmes en s avec coecients en
es comme on en rencontre dans les fonctions de transferts des systmes
retard boucls).
Le cas de la stabilisation par un PID

K(s) = kP +

kI
+ kD s
s

(2.12)

est trait dans l'nonc suivant (un peu compliqu premire vue mais simple
mettre en uvre). Seul le cas des systmes stables en boucle ouverte est
trait ici. On se reportera [64] pour un expos concernant le cas des systmes
instables en boucle ouverte.

Thorme 22

([64])

On suppose

> 0,

alors l'ensemble des contrleurs

PID (2.12) prservant la stabilit du systme (2.10) est dni par les valeurs
admissibles suivantes


1
1
< kP <
1 sin(1 ) cos(1 )
k
k
racine sur ]0, [ de l'quation

tan() =

Pour

est l'unique

kp

en dehors de ces bornes, il n'existe pas de contrleur PID (2.12)

kp dans ces bornes,


(kI , kD ) comme suit.

stabilisant (2.10). Une fois choisi


stabiliser (2.10) de choisir
Soient

z1 , z2

il faut et il sut pour

les deux racines relles (ordonnes) sur

]0, 2[

de l'quation

z sin z = 0


sin z + z cos z , et mi = m(zi ), bi = b(zi ),

kkP + cos z
On note

m(z) =

2
,
z2

b(z) = kz

i = 1, 2.
kP ] k1 , k1 [, alors (kI , kD ) doit tre choisi de telle sorte que k <
kd < k , ki > 0 et kd > m1 kI + b1
1

si kP = k , alors (kI , kD ) doit tre choisi de telle sorte que kd < k ,


ki > 0 et kd > m1 kI + b1

1 1
si kP ] k , k 1 sin(1 ) cos(1 ) [, alors (kI , kD ) doit tre choisi de

telle sorte que m1 kI + b1 < kd < min(m2 kI + b2 , k ), et ki > 0

1. si
2.
3.

On pourra remarquer la similitude apparente entre les noncs des Thormes 22 et 20. Les bornes suprieures sur le gain proportionnels sont direntes. En eet, l'nonc 22 ncessite bien souvent l'usage eectif du terme
intgral et du terme driv car le point

(kI , kD ) = (0, 0)

l'adhrence des contraintes (dans le cas 3, on peut avoir

peut tre exclu de

b2 > b1 > 0).

2.4.

111

COMPLMENTS

2.4.2 Mthodes de rglage de Ziegler-Nichols


Il existe plusieurs mthodes systmatiques de rglage des rgulateurs PID.
Ces mthodes sont souvent utilises en pratique comme heuristiques, sans
justication. On propose de les re-situer dans le cadre d'analyse de stabilit que nous avons prsent, notamment la Section 2.4.1. Ces rgles sont
trs nombreuses et dirent par les performances qu'on peut en atteindre
en terme de temps de convergence, dpassement prvu, robustesse, etc. Historiquement, ce sont les rgles de Ziegler-Nichols [74, 75] qui sont apparues
les premires, elles sont toujours parmi les plus utilises. On trouve aussi
les rgles de Cohen-Coon [18], Chien-Hrones-Reswick [17], ou Lee-Park-LeeBrosilow [45].

Premire mthode de Ziegler-Nichols


Pour concevoir un rgulateur PID pour un process donn

G(s), on ralise

l'exprience boucle-ouverte suivante. On enregistre la rponse du systme


un chelon d'entre et on relve les paramtres

et

construits partir de

la ligne de plus grande pente de la rponse. On note galement

et

k tels que

reprsents sur la Figure 2.18, construits partir de la valeur asymptotique


1
estime et du temps de rponse 1 e
= 0.63 13 .

Figure 2.18  Dtermination d'un modle du premier ordre retard partir


de la rponse un chelon donn par

y(t) = k(1 e

)It .

Les rglages heuristiques de Ziegler-Nichols sont reports dans le tableau 2.1. Ils permettent de rgler au choix un contrleur
13. Un modle du premier ordre atteint environ
gal

fois sa constante de temps

63%

P,

un

PI

ou un

de sa valeur nale en un temps

112

CHAPITRE 2.

FONCTIONS DE TRANSFERT

P ID.

Contrleur kP
P
PI
PID

kI

kD

1/a
0.9/a 0.3/(a)
1.2/a 0.6/(a)

0.6/a

Table 2.1  Rglages de Ziegler-Nichols premire mthode.


Seconde mthode de Ziegler-Nichols
La seconde mthode de Ziegler-Nichols ncessite une exprimentation en
boucle ferme avec un contrleur dj install dont il sut de modier les
gains. On boucle le systme avec un rgulateur
et le gain driv

0)

(en mettant le gain intgral

dont on fait progressivement augmenter le gain jusqu'

atteindre un rgime oscillatoire entretenu. Autrement dit, on atteint la limite


de stabilit. Une fois ce rgime obtenu, on note
ultime et la priode des oscillations

Tu

ku

le gain proportionnel

lui correspondant et on rgle alors

le contrleur comme expliqu sur le tableau 2.2.

Contrleur kP
P
PI
PID

0.5ku
0.4ku
0.6ku

kI

kD

0.5ku /Tu
1.2ku /Tu

0.075ku Tu

Table 2.2  Rglages de Ziegler-Nichols seconde mthode.


Bien que trs simple utiliser, ce mode opratoire de rglage de contrleur a le dsavantage de ncessiter la presque dstabilisation de l'installation
qu'on souhaite contrler. Cet inconvnient peut tre vit. On pourra se reporter [70] pour une prsentation d'une mthode de rglage aboutissant aux
coecients de la seconde mthode de Ziegler-Nichols, sans risque de dstabilisation. Cette mthode, qui utilise un bloc relai en boucle ferme, consiste
faire apparatre un cycle limite dont on analyse les caractristiques pour
retrouver les paramtres du systme contrler.

Liens avec les rsultats de stabilisation


Il est assez simple de faire un lien entre la seconde mthode de ZieglerNichols et le Thorme 20 si on suppose que le systme qu'on cherche

2.4.

113

COMPLMENTS

contrler est eectivement un systme du premier ordre retard stable de la


forme (2.10). Ce thorme montre qu'il existe une valeur dstabilisante du
gain proportionnel. C'est cette valeur

ku

que l'exprience en boucle ferme

permet d'estimer sans connaissance des paramtres du modle. Ensuite, la


mthode de Ziegler-Nichols du tableau 2.2 propose de rduire ce gain et donc
de se retrouver avec un contrleur proportionnel stabilisant.
Les coecients proposs par la premire mthode de Ziegler-Nichols sont
en pratique trs proches de ceux de la deuxime mthode. Nanmoins, c'est
de ces derniers que nous allons prouver une proprit trs intressante. Dans
le cas o le systme contrler est eectivement un systme du premier ordre
retard stable de la forme (2.10), un calcul direct montre que le paramtre

tel que dni sur la Figure 2.18 vaut

a=k
Notons

= / .

Avec cette valeur, les gains proposs dans le tableau 2.1

sont

kP =

1.2
,
k

kI =

0.6
,
k2

kD =

0.6
k

(2.13)

Considrons en premier lieu le gain proportionnel suggr. Nous allons montrer qu'il est toujours acceptable, en d'autres termes, qu'il satisfait toujours
les hypothse du Thorme 22. Pour notre systme stable, le gain propos
1
. En ce qui concerne la borne suprieure indique dans
satisfait kP > 0 >
k
le Thorme 22, on peut la rcrire

kmax

1
=
k

1
1 sin 1 cos 1

1
. En liminant
1+ 1
fonction de 1 dans cette dernire quation, on peut tablir que
o

est l'unique solution sur

]0, [

de

tan 1 =

en

1
(1 sin 1 cos 1 1.2)
k


1
1
=
cos 1 +
1.2
k
sin 1

kmax kP =

Par construction,

1 ]0, [.

On vrie alors

kmax kP > 0.

Par consquent,

le gain proportionnel suggr par la premire mthode de Ziegler-Nichols satisfait toujours les hypothses du Thorme 22 de stabilisation par un PID
pour un systme du premier ordre retard. C'est une importante justication de cette mthode heuristique. En outre, on peut montrer par une tude

114

CHAPITRE 2.

FONCTIONS DE TRANSFERT

dtaille (on se reportera [64]) que les gains

kI

et

kD

dni dans (2.13)

par cette mme mthode satisfont galement les hypothses les concernant
de ce mme thorme. Plus prcisment, on peut tablir qu'ils les satisfont
mais de manire possiblement non robuste lorsque
le retard

devient grand (lorsque

devient grand devant la constante de temps

),

i.e. ils sont prs

des frontires des domaines dcrits dans le Thorme 22. C'est galement un
phnomne connu et observ en pratique qui engage souvent modier un
peu les gains au prix de performances moindres.

2.4.3 Prdicteur de Smith


Le prdicteur de Smith est un outil de rgulation pour les systmes
asymptotiquement stables en boucle ouverte retards mono-variables (propos dans [66]). Des gnralisations aux cas multi-variables et pour les systmes instables sont possibles mais alors il n'est plus possible de raliser le
bouclage avec un transfert rationnel. On utilise alors des bouclages retards
s
rpartis faisant apparatre des fractions rationnelles en s et e
. Nous ne
prsentons ici que la version historique publie par Smith.
Dans ce contexte, un retard sur l'entre ou la sortie est quivalent. En
eet les formes d'tat suivantes possdent la mme fonction de transfert

x(t)

= Ax(t) + Bu(t ), y(t) = Cx(t)


x(t)

= Ax(t) + Bu(t), y(t) = Cx(t )


o

x Rn , u R

et

y R.

Cette fonction de transfert est un produit d'une

fraction rationnelle propre et d'un oprateur retard

G(s) , G0 (s)es = C(sI A)1 Bes


L'intrt du prdicteur de Smith est de permettre d'utiliser un contrleur

Figure 2.19  Le prdicteur de Smith (zone grise).


K0

conu pour le systme sans retard

G0 (s)

en l'insrant dans le schma

2.4.

115

COMPLMENTS

0 et G(s)

G
reprsentent la

G0 = G0 et G = G. On suppose

gnral de la Figure 2.19. Les blocs additionnels


connaissance du systme. Idalement, on a
donc le transfert

G0

stable.

C'est sous cette hypothse qu'on comprend le fonctionnement du prdicteur de Smith. Grce la boucle interne au prdicteur (dans la zone grise
de la Figure 2.19), le signal entrant dans le contrleur

K0

est

e2 = yr G(s)u (G0 (s) G(s))u = yr G0 (s)u


Ce terme est la dirence entre la rfrence et la prdiction de la valeur de
sortie du systme l'horizon

Figure

2.20  Forme quivalente du systme boucl avec prdicteur de

Smith.
Le comportement entre-sortie du systme boucl par le prdicteur de
Smith est quivalent celui du systme donn sur la Figure 2.20. Articiellement, on a russi intercepter le signal de mesure avant le bloc retard et
donc nous ramener un problme de rgulation d'un systme sans retard.
On notera toutefois que le retard est toujours prsent sur la sortie. Il n'a pas
disparu du problme mais il n'interfre pas avec la rgulation.

Figure 2.21  Implmentation du prdicteur de Smith avec ltre additionnel


de robustesse.
En pratique, le prdicteur de Smith soure d'un manque de robustesse par
rapport une incertitude sur le retard, alors que la robustesse par rapport
aux paramtres est moins problmatique. En ce cas,
de mme que

0
G

et

.
G

et

sont dirents,

Il ne sut pas toujours de calculer un contrleur

procurant de bonnes marges de stabilit au systme

G0

K0

boucl (on pourra

se reporter [47, Chap 10.8] pour de nombreux contre-exemples). Certaines

116

CHAPITRE 2.

FONCTIONS DE TRANSFERT

conditions susantes de robustesse sont exposes dans [60] ; elles portent


sur le choix du contrleur

K0

mais sont diciles mettre en uvre. Il est

indispensable de l'utiliser dans la conguration propose sur la Figure 2.21.


On a rajout dans la boucle externe un ltre de robustesse qu'on peut
ajuster pour dgrader les performances mais assurer une stabilit en boucle
ferme en dpit d'une incertitude sur le retard. Lorsque ce ltre

F (s)

vaut

on retrouve le prdicteur de Smith des Figures 2.19 et 2.20.

2.4.4 Systmes non minimum de phase


N (s)
o N (s) et D(s) sont deux polynmes
D(s)
premiers entre eux (i.e., pas de racine commune dans C) est dit non miLe transfert rationnel

G(s) =

nimum de phase si l'un de ses zros (i.e. l'une des racines de

N (s))

est

partie relle strictement positive. On parle alors de zro instable. Ce type de


systmes est rput dicile contrler. Ces systmes sont souvent associs
une rponse inverse lors d'une variation en chelon de l'entre

14

Pour comprendre la dicult, rien ne vaut un petit exemple. Considrons


le second ordre suivant

G(s) =

1s
.
s2

Ce transfert correspond, sous forme d'tat, un double intgrateur, typiquement un systme mcanique rgi par la loi de Newton,

d
x1 = x2 ,
dt
o la mesure
vitesse

x2

d
x2 = u
dt

est une combinaison "contradictoire" de la position

x1

et la

y = x1 x2 .
x1 = x2 = y = u = 0 pour les t 0, considrons
la rponse un chelon unitaire u = 1 pour t > 0. Un calcul simple donne
2
y(t) = t2 t pour t > 0. Ainsi au tout dbut y commence par tre ngatif
pour terme devenir positif. Si au lieu de 1 s on avait eu 1 + s, nous
n'aurions pas eu cette rponse inverse. Ainsi, pour rguler y , un contrleur
proportionnel ne sait pas dans quelle direction partir. Le bouclage u = Kp y
conduit toujours une boucle ferme instable quelque soit le gain Kp choisi.
En partant de l'quilibre

En eet le systme boucl,

d
x1 = x2 ,
dt

d
x2 = Kp x1 + Kp x2 ,
dt

14. Cette rponse inverse n'est pas cependant une caractrisation mathmatique du fait
qu'un zro soit instable.

2.4.

117

COMPLMENTS


est instable ds que

Kp 6= 0

: la matrice

0
1
Kp Kp


est toujours instable

avec une trace et un dterminant de mme signe (voir le critre de Routh,


condition 1.12). En transfert, on retrouve ce rsultat en regardant les zros
1s
2
de 1 + GK avec K(s) = Kp , soit 1 + Kp 2 = 0 qui donne s Kp s + Kp = 0.
s
K
Avec un correcteur PI de transfert K(s) = Kp + i (Kp gain proportionnel
s
et Ki gain intgral) la situation est identique : 1 + GK = 0 s'crit 1 +

1s
Kp + Ksi = 0 soit
s2

s3 Kp s2 + (Kp Ki )s + Ki = 0.
Le critre de Routh (conditions 1.13) donne ici les conditions de stabilit

Kp > 0,

Kp Ki > 0,

Kp (Kp Ki ) > Ki

Ki > 0,

qui sont impossibles satisfaire quelques soient les valeurs de

Kp

et

Ki .

Il est possible, pour stabiliser, de remplacer le terme "intgral" par un


terme "driv"

K(s) = Kp + Kd s
de gain

Kd .

Maintenant,

1 + GK = 0

donne l'quation d'ordre

suivante :

(1 Kd )s2 + (Kd Kp )s + Kp = 0
Ces racines sont stables si, et seulement si,

Kd K p
> 0,
1 Kd

Kp
> 0.
1 Kd

Un raisonnement simple montre que ces conditions de stabilit sont quivalentes

0 < Kd < 1,

0 < Kp < Kd ,

Ces deux ingalits dnissent un triangle. Le fait que ce domaine de stabilit


soit si peu tendu dans le plan

(Kp , Kd ) est une indication de

petites marges

de robustesse. Pour s'en convaincre, il sut de tracer le lieu de Nyquist avec

Kd = 1/2

et

Kp = 1/4,

par exemple. De plus un terme "driv" amplie

notablement les bruits de mesure et donc il vaut mieux prendre

Kd

petit.

Pour les systmes d'ordre plus lev, une telle analyse avec Routh n'est
pas trs commode. Il est alors utile de tracer le lieu de Nyquist de
certaines valeurs des paramtres du correcteur
gain et de retard.

GK

pour

et d'analyser les marges de

118

CHAPITRE 2.

FONCTIONS DE TRANSFERT

Chapitre 3
Commandabilit, stabilisation,
feedback

d
x = f (x, u) est un systme sous-dtermin .
dt
La dirence entre le nombre d'quations (indpendantes) et le nombre de
Un systme command

variables donne le nombre de commandes indpendantes

m = dim u.

Il faut

noter que le degr de sous-dtermination est ici inni car on ne manipule


pas des scalaires mais des fonctions du temps. L'tude des systmes sousdtermins d'quations direntielles ordinaires est d'une nature dirente de
celle des systmes dtermins qui ont t l'objet du Chapitre 1. Nanmoins,
toutes les notions que nous y avons vues vont nous tre utiles.
La particularit de ces systmes sous-dtermins est qu'on peut utiliser la
commande pour agir sur eux. En pratique, deux problmes nous intressent :
la planication et le suivi de trajectoires .
La notion clef de ces problmes est la commandabilit . Dans ce chapitre,
aprs une rapide dnition de cette proprit dans le cas non linaire gnral
d
x =
(voir Dnition 10), nous tudions en dtails les systmes linaires
dt
Ax + Bu. Leur commandabilit est caractrise par le critre de Kalman
(voir Thorme 23). Nous prsentons alors deux mthodes pour rsoudre les
problmes qui nous proccupent.
La premire mthode utilise la forme normale dite de Brunovsky . L'criture sous cette forme met en lumire un paramtrage explicite de toutes les

m fonctions scalaires arbitraires t 7 y(t) et d'un


nombre ni de leurs drives. Ces quantits y , dites sorties de Brunovsky ,
sont des combinaisons linaires de x. Elles permettent de calculer trs simplement des commandes u faisant transiter le systme d'un tat vers un autre.
trajectoires en fonctions de

Le problme de planication de trajectoire est ainsi rsolu. Ce point est dtaill la Section 3.3.4. Les sorties de Brunovsky permettent galement de
construire le bouclage (feedback) qui assure le suivi asymptotique d'une tra-

119

120

CHAPITRE 3.

Figure

COMMANDABILIT, STABILISATION

3.1  Deux pendules accrochs au mme chariot d'abscisse

u,

le

contrle.

jectoire de rfrence arbitraire. La convergence est obtenue par la technique


de placement de ples . On se reportera au Thorme 25.
La seconde mthode s'attache optimiser les trajectoires. On caractrise
le contrle en boucle ouverte permettant d'aller d'un tat vers un autre tout
en minimisant un critre quadratique. On calcule galement la commande
minimisant l'cart quadratique entre la trajectoire de rfrence et la trajectoire relle. On montre que la solution optimale est donne par un feedback
dont les gains sont calculs partir d'une quation matricielle de Riccati.
C'est la commande linaire quadratique . Cette technique est dtaille la
Section 3.4.

3.1 Un exemple de planication et de suivi de


trajectoires
Nous considrons un systme de deux oscillateurs de frquences direntes soumis en parallle un mme contrle. Comme nous le verrons dans
l'Exemple 15, ce modle est d'une porte assez gnrale. Il correspond, une
rcriture prs, la dynamique linarise d'un systme quantique trois niveaux dont les transitions entre le niveau fondamental et les deux niveaux
excits (d'nergies direntes) sont contrles par la lumire d'un laser.

3.1.1 Modlisation de deux oscillateurs en parallle


On considre deux pendules ponctuels accrochs un mme chariot de
position

(la commande), tels que reprsents sur la Figure 3.1. On note

3.1. UN EXEMPLE DE PLANIFICATION ET DE SUIVI DE TRAJECTOIRES121

et

xi ,

l'inclinaison et l'abscisse

de la masse du pendule numro

i, i = 1, 2.

Autour de l'quilibre stable, les quations de Newton linarises sont

d2
x1 = a1 (x1 u),
dt2
o

a1 = g/l1

carrs des
rentes des

d2
x2 = a2 (x2 u)
dt2

(3.1)

a2 = g/l2 sont deux paramtres positifs correspondant aux


pulsations (l1 et l2 correspondant aux longueurs supposes dipendules l1 6= l2 ).
et

3.1.2 Planication de trajectoires


Soit

T >0

et un dplacement dsir

D.

On souhaite trouver un contrle

en boucle ouverte qui amne le systme de l'quilibre en

t=0

vers l'quilibre

x1 = x2 = u = D

en

x1 = x2 = u = 0

t = T.

Pour trouver de telles trajectoires, le plus simple est d'introduire la nouvelle variable

z=

x1 x2

a1
a2

Des calculs lmentaires donnent alors les relations suivantes

x1 x2

a1
a2
= x2 x1

z=
(2)

(3.2)

(4)
z = (a1 a2 )u + a1 x1 a2 x2

x1 , x2 et u s'expriment explicitement en fonction de z , z (2) et z (4) ds que


a1 6= a2 . Les deux quations (3.1), qui ne font intervenir que les trois variables
(x1 , x2 , u), s'obtiennent en liminant z des trois quations prcdentes. Ainsi,

elles sont bien contenues dans les trois quations ci-dessus. En fait (3.2) est
une description quivalente de la dynamique du systme dcrit initialement

z.
x1 , x2 et u avec
x1 (t), x2 (t) et u(t) vrient

par (3.1) mais avec une quation de plus et une variable de plus
L'intrt de rajouter

vient du fait que si l'on calcule

les formules (3.2), alors les fonctions du temps

automatiquement les quations direntielles (3.1). Rciproquement, si les


fonctions du temps

x1 (t), x2 (t)

et

u(t) vrient (3.1) alors


x2 et u via (3.2). Ainsi,

a2 x1 a1 x2 , on obtient encore x1 ,
via z qui est une fonction arbitraire

en posant

z =

on paramtrise

du temps, drivable au moins

fois,

toutes les solutions de (3.1). Le raisonnement prcdent montre clairement


1. En fait les vraies abscisses sont

x1

et

x 2 . u + c1

et

u + c2

x1 + c1

et

x2 + c2 , c1

et

c2

constantes, au lieu de

sont les abscisses des points auxquels sont suspendus les deux

pendules. Cependant les constants

ci

disparaissent dans les quations de Newton.

122

CHAPITRE 3.

COMMANDABILIT, STABILISATION

que nous n'en manquons aucune en les dcrivant comme des combinaisons
(2)
(4)
linaires de z , z
et z
.

t = 0, x1 = x2 = u = 0, imposent la
valeur 0 z et ses drives jusqu' l'ordre 3 (ordre 4 si on ne tolre pas de
(i)
discontinuits sur u) : z (0) = 0 pour i = 0, 1, 2, 3, 4. De mme en t = T ,


1
a12 D et z (i) (T ) = 0 pour i = 1, 2, 3, 4. Pour t 6= 0, T ,
on a z(T ) =
a1
z(t) est libre. Il faut cependant respecter la continuit pour z et ses drives
jusqu' l'ordre 4 (ou 3 si tolre des saut sur le contrle u). Une des fonctions
les plus simples z(t) qui respectent ces conditions est la suivante


 
1
1
t
z(t) =

D
(3.3)
a1 a2
T
Les trois conditions d'quilibre en

est la fonction

C4

croissante de

() =

dans

0,

si

5
,
5 +(1)5

si

1,

si

[0, 1]

dnie par

0;
0 1;
1

Nous avons obtenu explicitement une trajectoire allant de l'quilibre d'abscisse

l'quilibre d'abscisse

en temps ni

arbitraire. Si on utilise le

contrle en boucle ouverte (z(t) est donne par (3.3))

z(t) +

u(t) =

1
a1

1
a2

1
a1

z (2) (t) +

1
z (4) (t)
a1 a2

1
a2

alors la solution de (3.1) qui passe en t = 0 par l'quilibre x1 = x2 =


d
x = dtd x2 = 0, passe en t = T par l'quilibre x1 = x2 = D, dtd x1 = dtd x2 =
dt 1
On connat mme explicitement cette solution avec

x1 (t) =
x2 (t) =

0,
0.

1 (2)
z (t)
a2
1
a12
a1
z(t) + a11 z (2) (t)
1
a12
a1

z(t) +

Nous avons rsolu le problme de planication de trajectoires .

3.1.3 Stabilisation et suivi de trajectoires


Supposons donne une trajectoire de rfrence (par exemple issue de la
construction prcdente) note

t 7 (x1,r (t), x2,r (t), ur (t))

solution de (3.1).

3.1. UN EXEMPLE DE PLANIFICATION ET DE SUIVI DE TRAJECTOIRES123

On cherche un feedback qui assure le suivi asymptotique de cette trajectoire.


En d'autres termes, nous cherchons des corrections sur le contrle en boucle

ur (t)

ouverte

pour compenser les dviations entre la trajectoire relle et la

trajectoire de rfrence. Ici, l'tat du systme est form par les positions
(x1 , x2 ) et les vitesses (v1 , v2 ) (vi = dtd xi , i = 1, 2). On note xi = xi xi,r
et vi = vi vi,r les dviations en position et en vitesse par rapport la
rfrence (i

= 1, 2). On cherche u en fonction des xi et vi . Le contrle


u qu'on appliquera sera ur + u. Dans le cas particulier o

en boucle ferme

la trajectoire de rfrence correspond un point d'quilibre, on parle alors


de stabilisation plutt que de suivi.
Comme les quations du systme sont linaires, un calcul direct montre
que

xi

et

vrient les mmes quations que

d2
x1 = a1 (x1 u),
dt2

xi

et

d2
x2 = a2 (x2 u)
dt2

Aussi, il sut de rsoudre le problme de la stabilisation pour obtenir une


solution au suivi . Supposons donc que la trajectoire de rfrence est nulle

x1,r = x2,r = ur = 0.

La faon la plus simple de concevoir le feedback

stabilisant est alors d'utiliser une mthode de Lyapounov. Utilisons comme


fonction candidate tre de Lyapounov l'nergie du systme. Pour

u = 0,

l'nergie du systme,

a1
1
a2
1
V = (v1 )2 + (x1 )2 + (v2 )2 + (x1 )2 ,
2
2
2
2
reste constante les longs des trajectoires. Donc, comme les quations sont
linaires par rapport

u, la drive de V

de deux termes : le premier facteur est

le long des trajectoires est le produit

et le second est une fonction des

positions et vitesses uniquement. Il sut alors de prendre

du signe oppos

au second facteur (ce qui est facile comme nous allons le voir) pour faire
dcrotre cette nergie. On conclut alors par le Thorme 11 de LaSalle.
Faisons ici les calculs. On a

d
V = (a1 v1 + a2 v2 )u
dt
Avec

paramtre strictement positif, on considre le feedback suivant

min
u ,
k(a1 v1 + a2 v2 ),
u = K(v1 , v2 ) =
max
u ,

si
si
si

k(a1 v1 + a2 v2 ) umin ;
umin k(a1 v1 + a2 v2 ) umax ;
umax k(a1 v1 + a2 v2 )
(3.4)

On suppose bien sr que les contraintes sur

min

u sont telles que u

< 0 < umax .

124

CHAPITRE 3.

COMMANDABILIT, STABILISATION

Figure 3.2  Un atome trois niveaux en interaction avec une lumire laser
polarise linairement et associe au champ lectrique

Avec le feedback prcdent, la fonction

E R,

le contrle.

est toujours positive, innie

l'inni et maintenant elle dcrot le long des trajectoires. On peut donc


appliquer le Thorme 11 de LaSalle, qui caractrise l'ensemble vers lequel
tendent les trajectoires : les solutions du systme en boucle ferme avec le
d
V = 0 c.--d. a1 v1 + a2 v2 = 0. Dans ce cas
contrle 3.4 qui vrient en plus
dt
u = 0 et donc

a1

d
d
v1 + a2 v2 = (a1 )2 x1 (a2 )2 x2 = 0
dt
dt

En drivant encore deux fois, on a

(a1 )4 x1 (a2 )4 x2 = 0
Comme

a1 6= a2

et

a1 , a2 > 0,

on dduit que, ncessairement,

donc tout est nul. Les trajectoires convergent toutes vers


stabilise globalement asymptotiquement le systme en

0.

x1 = x 2 = 0

et

Notre feedback

0.

D'aprs ce qui prcde, le contrle complet avec suivi de trajectoire s'crit


trs simplement. On peut grer trs simplement des contraintes sur

u : il sut

ur

qui ne passe

par trop prs des bornes. Cette hypothse est vrie s'il existe

 > 0 tel que

de prendre une trajectoire de rfrence donnant un contrle


pour tout temps t,

ur (t) [umin + , umax ]. Dans ces conditions, le contrle

,
k(a1 v1 + a2 v2 ),
u = ur +

,
est chaque instant dans

si
si
si

k(a1 v1 + a2 v2 )  ;
 k(a1 v1 + a2 v2 )  ;
 k(a1 v1 + a2 v2 ).

[umin , umax ] et de plus assure la convergence asymp-

totique vers la trajectoire de rfrence.

3.1.4 Autres exemples


Exemple 15

(Un atome trois niveaux)

La fonction d'onde

de l'atome

trois niveaux schmatis sur la Figure 3.2 obit, sous l'approximation di-

3.1. UN EXEMPLE DE PLANIFICATION ET DE SUIVI DE TRAJECTOIRES125

E(t)

polaire lectrique et dans un champ lectrique

polaris linairement,

l'quation de Schrdinger

~
C3 est
H0 et H1 sont
o

d
= (H0 + E(t)H1 )
dt

la fonction d'onde appartenant l'espace de Hilbert

0 0
0
H0 = 0 ~1 0 ,
0 0 ~2
1 , 2

et

et o

les oprateurs auto-adjoints dcrits par les matrices

C3

0
H1 = 0 0
0 0

sont des paramtres rels et strictement positifs. Avec les

notations usuelles en mcanique quantique

1
|0i = 0 ,
0
on voit que

|0i

celui d'nergie

0
|1i = 1 ,
0

0
|2i = 0
1

E0 = 0, |1i celui d'nergie E1 = ~1 et |2i


~ = h/(2) tant la constante de Plank. Les pulsa-

est l'tat d'nergie

E2 = ~2 ,

tions de transitions (les raies atomiques donc) entre le niveau fondamental

|0i

|1i et |2i ont pour pulsations 1 et 2 .


= 0 |0i + 1 |1i + 2 |2i avec 0 , 1 et 2 trois nombres

et les deux niveaux excits


On a donc

complexes dont le carr du module reprsente la probabilit pour que l'atome


soit dans le niveau

|0i, |1i

|2i,

ou

respectivement. L'quation de Schrdinger

pour ce systme s'crit

d
0 = E(1 + 2 )
dt
~
d

1 = 1 1 + E0
dt
~
d

2 = 2 2 + E0
dt
~

On constate que

0 = 1, 1 = 2 = 0

et

E =0

est un rgime d'quilibre (tat

fondamental, laser teint). Linarisons les quations autour de cet quilibre.


En notant

i , i = 0, 1, 2,

et

les petits carts, on obtient les quations

linarises

d
0 = 0,
dt

1 = 1 1 + E,
dt
~

Il ne faut pas oublier que les

2 = 2 2 + E.
dt
~

sont des complexes. Au premier ordre

est constant. C'est une partie de l'tat qui n'est pas inuence par le contrle

126

CHAPITRE 3.

COMMANDABILIT, STABILISATION

(au moins au premier ordre). Cette partie est non commandable (au premier
ordre). Elle ne nous gne pas, elle correspond au fait que le module de
vaut

(conservation de la probabilit). Nous allons l'oublier ici. On a donc


2
4
le systme dans C , c'est dire dans R suivant

d
1 = 1 1 + E,
dt
~

2 = 2 2 + E
dt
~

En posant


1 x1 + dtd x1
1 =
,
~(1 )2


2 x2 + dtd x2
2 =
,
~(2 )2

E = u

on obtient exactement les quations des deux pendules (3.1) pour x1 , x2 et u


2
2
avec a1 = (1 ) et a2 = (2 ) . Il s'agit en fait du mme systme. Le carr
2
du module de i , |i | correspond alors, une constante prs, l'nergie
2
a
d
2
mcanique du pendule numro i : 2i (xi ) + dt xi .
Il est possible de reprendre les calculs de transitoires faits pour les deux
pendules et de les adapter pour traiter le problme suivant. On part de l'tat

t = 0. On cherche la forme de l'impulsion laser E(t) qui


assure le transfert en t = T d'une petite fraction 0 < p1  1 de la probabilit
2
sur l'tat |1i en gardant, au nal, nulle celle de l'tat |2i . Ce problme se
traduit de la faon suivante : en t = 0 on part de 1 = 2 = 0 avec E = 0.

p1 , 2 = 0 avec E = 0. Cela se
En t = T , on souhaite arriver en 1 =
traduit dans les variables x1 et x2 par des conditions suivantes. En t = 0,
tout est nul. En t = T , on doit avoir
fondamental

|0i

en

x1 = x1 =
Sur la variable

~1
,
p1

v 1 = x2 = v 2 = u = 0

cela donne comme condition en

t=0

(voir (3.3))

z = z (1) = z (2) = z (3) = z (4) = 0


et en

t = T,
z=

x1
,
a1

z (1) = z (3) = 0,

z (2) =
x1 ,

z (4) = a1 x1

Il sut alors de prendre


z(t) = x1

1
(t T )2 a1 (t T )4

+
a1
2
4!

  
t

2. L'intrt ventuel d'un transfert dans ces conditions vient du fait que nous ne supposons pas le contrle rsonnant comme il est usuel de le faire. Nous n'utilisons pas ici
l'approximation du champ tournant et les oscillations de Rabi.

3.1. UN EXEMPLE DE PLANIFICATION ET DE SUIVI DE TRAJECTOIRES127

et de calculer le contrle en boucle ouverte par la formule

z(t) +

E(t) =

1
a1

1
a2

1
a1

z (2) (t) +

1
z (4) (t)
a1 a2

1
a2

p1 << 1, il est facile de garantir en prenant un temps T assez


grand que |1 (t)| et |2 (t)| restent petits devant 1 tout au long du transfert.
Comme

C'est important pour que notre modle linaris reste valable et que le calcul
prcdent ait un sens.
Nous ne traiterons pas le problme du suivi de trajectoire car la notion de
feedback pour un tel systme est trs obscure l'heure actuelle, mme si, en
thorie, elle serait trs sduisante pour construire un calculateur quantique et
rendre les qubits insensibles la dcohrence due au couplage avec l'environnement. vrai dire, on se demande mme si la notion de feedback a un sens
de telles chelles. Pour un systme quantique la notion de rtro-action et
de feedback se heurtent au problme de la mesure. On ne peut pas supposer
que l'on connat chaque instant

et

2 .

En eet, toute mesure perturbe

notablement le systme et donc, pour ces systmes toutes petites chelles,


il n'est plus possible de dissocier l'appareil de mesure du systme lui mme
et de supposer que la perturbation due la mesure est arbitrairement petite.
Nous renvoyons un lecteur intress au cours du physicien S. Haroche [32].

Exemple 16

(Le hockey puck)

tant donn un corps rigide (de masse

unitaire) dans le plan, dont le centre de gravit est repr par les coordon-

(x, y), dont l'orientation est donne par l'angle , et dont l'inertie est
J . Ce systme est soumis exclusivement 3 une force (commande) u
s'exerant en un point bien dtermin (situ une distance r du centre de
nes

note

gravit) de ce corps. Il est reprsent sur la Figure 3.3. Les quations de la


dynamique sont

d2
x = u sin
dt2
d2
y = u cos
dt2
d2
J 2 = ru
dt
Ce systme mcanique est sous-actionn. Il possde 3 degrs de libert et
une seule commande. On souhaite pourtant le dplacer d'une conguration
une autre (c.--d. d'un point de dpart et d'une orientation un point
3. Il s'agit d'un hockey-puck, c.--d. un palet sur une table coussin d'air

128

CHAPITRE 3.

COMMANDABILIT, STABILISATION

Figure 3.3  Le hockey puck : un solide soumis une force u (commande).


Pour eectuer des dplacements (entre

et

B ),

il faut le faire tourner en

le faisant avancer puis le retourner brutalement avant de le faire avancer


nouveau pour enn le freiner en prenant en compte la rotation induite par
la dclration.

d'arrive et une orientation possiblement dirente). On ne dispose que


d'une seule commande. Pour raliser ces manoeuvres, on est oblig d'utiliser
des stratgies compliques. Par exemple, on ne peut pas dplacer latralement
le systme sans engendrer de rotation. Pour arrter le solide lorsqu'il a acquis
de la vitesse, il faut le faire tourner et adapter la force suivant l'angle de
rotation. On se reportera [57] pour un expos dtaill.

3.2 Commandabilit non linaire

Figure 3.4  Planication de trajectoire entre deux tats p et q.


On considre le systme (f tant une fonction rgulire)

d
x(t) = f (x(t), u(t)),
dt

x(t) Rn ,

u(t) Rm

(3.5)

3.2.

129

COMMANDABILIT NON LINAIRE

Dnition 9 (Trajectoire d'un systme command). On appelle trajec-

I 3 t 7 (x(t), u(t)) Rn Rm
d'intrieur non vide I de R les

toire du systme (3.5) toute fonction rgulire

qui satisfait identiquement sur un intervalle


quations (3.5).

Dnition 10 (Commandabilit).

Le systme (3.5) est dit commandable

T > 0 si et seulement si pour tout p, q Rn , il existe une loi horaire


[0, T ] 3 t 7 u(t) Rm , appele commande en boucle ouverte, qui amne le
systme de l'tat x(0) = p l'tat x(T ) = q , c.--d. , telle que la solution du
en temps

problme de Cauchy

d
x(t)
dt

= f (x(t), u(t))
x(0) = p

vrie

x(T ) = q .

pour

t [0, T ]

Le systme est dit simplement commandable lorsqu'il est

commandable pour au moins un temps

T > 0.

D'autres dnitions sont possibles : elles correspondent toutes des variantes

plus ou moins subtiles de la Dnition 10. Comme l'illustre la Fi-

gure 3.4, la commandabilit exprime une proprit topologique trs naturelle. En gnral, la commande en boucle ouverte

[0, T ] 3 t 7 u(t)

n'est pas

unique, il en existe une innit. Cette tape s'appelle planication de trajec-

toire. Calculer

t 7 u(t)

partir de la connaissance de

f, p

et

constitue

l'une des questions majeures de l'Automatique. Cette question est loin d'tre
compltement rsolue actuellement.
Trs souvent, l'absence de commandabilit est due l'existence d'intgrales

premires non triviales. Ce sont des quantits qui restent constantes le long
de toute trajectoire. Nous allons les tudier.

3.2.1 Exemple de non commandabilit par la prsence


d'intgrale premire
Considrons le racteur exothermique de la Figure 3.5. Les quations de
bilan matire et d'nergie donnent les quations direntielles suivantes

d
x
dt 1
d
x
dt 2
d
T
dt

= D(xin
1 x1 ) k0 exp(E/RT )x1
= Dx2 + k0 exp(E/RT )x1
= D(T in T ) + H exp(E/RT )x1 + u

(3.6)

4. titre d'exemple, on pourra considrer la notion de commandabilit en temps petits,


qui demande que toutes les directions soient accessibles en temps court. Un contre exemple
est constitu par une voiture n'ayant pas de marche arrire, qui bien que pouvant, au prix
d'un certain nombre de manuvres, atteindre tous les points de son espace d'tat, ne peut
se dplacer latralement.

130

CHAPITRE 3.

Figure

COMMANDABILIT, STABILISATION

3.5  Un racteur chimique exothermique o

correspond aux

changes thermiques avec l'extrieur.

On reconnat l'eet non linaire essentiel de la loi d'Arrhenius

k = k0 exp(E/RT )
qui relie la constante de vitesse

la temprature

T.

Comme nous l'avons

crit, la cintique est suppose du premier ordre. Les constantes physiques


in
in
usuelles (D , x1 , k0 , E , T , et H ) sont toutes positives. La commande u
est proportionnelle la puissance thermique change avec l'extrieur. On
note

xi

la concentration de l'espce chimique

Xi , i = 1, 2.

Il est assez facile

de voir que ce systme n'est pas commandable. En eet, le bilan global sur

X1 + X2 ,

limine le terme non linaire pour donner

d
(x1 + x2 ) = D(xin
1 x1 x2 ).
dt
La quantit = x1
D(xin
1 ). Donc

+ x2

vrie une quation direntielle autonome

in
= xin
1 + (0 x1 ) exp(Dt)

(3.7)

. Si, dans la Dnition 10, on prend l'tat


= x1 + x2 = xin
1 et q tel que = x1 + x2 = 0, il n'existe
pas de commande qui amne le systme de p vers q . En eet, pour toute
trajectoire dmarrant en un tel p, la quantit x1 + x2 reste constante et gale
in
x1 . Cette partie non commandable du systme reprsente par la variable
admet ici un sens physique prcis. Elle est bien connue des chimistes qui la
o

dt

initial

est la valeur initiale de

tel que

nomment invariant chimique .


L'exemple ci-dessus nous indique que l'absence de commandabilit peuttre lie l'existence d'invariants, i.e., des combinaisons des variables du

3.3.

131

COMMANDABILIT LINAIRE

systme et ventuellement du temps, qui sont conserves le long de toute train


jectoire. Pour (3.6), il s'agit de (x1 +x2 x1 ) exp(Dt) comme le montre (3.7).
Nous dnissons la notion d'intgrale premire pour les systmes commands.

Dnition 11 (Intgrale premire).


(t, x) 7 h(t, x) R

Une fonction rgulire

R Rn 3

est appele intgrale premire du systme (3.5), si elle

est constante le long de toute trajectoire du systme. Une intgrale premire


n
est dite triviale si c'est une fonction constante sur R R .
Si

est une intgrale premire, sa drive le long d'une trajectoire arbi-

traire est nulle pour toute trajectoire

t 7 (x(t), u(t))

du systme, c.--d.

h h d
d
h=
+
x0
dt
t
x dt
t 7 h(t, x) alors (3.5)
n
n'est pas commandable. Sinon, il existe T > 0, tel que pour tout p, q R et
tout instant initial t, h(t, p) = h(t + T, q) (il existe une trajectoire reliant p
q sur [t, t+T ]). Donc h est une fonction priodique du temps et indpendante
de x. Mais alors la drive de h le long des trajectoires du systme correspond

h. Comme elle est nulle, h est une constante, ce qui contredit l'hypothse.
t
Si (3.5) admet une intgrale premire non triviale

Nous avons montr la proposition suivante

Proposition 5.

Si le systme (3.5) est commandable, alors ses intgrales

premires sont triviales.


Il est possible de caractriser, partir de

et d'un nombre ni de ses

drives partielles, l'existence d'intgrales premires non triviales. Nous allons


nous restreindre dans ce cours au cas linaire. La dmarche est transposable
au cas non linaire mais elle conduit alors des calculs plus lourds qui,
pour tre prsents de faon compacte, ncessitent le langage de la gomtrie
direntielle et des crochets de Lie (voir par exemple [40]).

3.3 Commandabilit linaire


Nous considrons ici les systmes linaires stationnaires du type

d
x = Ax + Bu
dt
x Rn , la commande u Rm et les matrices A et B
tailles n n et n m, respectivement.

o l'tat
et de

(3.8)

sont constantes

132

CHAPITRE 3.

COMMANDABILIT, STABILISATION

3.3.1 Matrice de commandabilit et intgrales premires


h : RRn 3 (t, x) 7
x dni par x = exp(tA)z .

Supposons que (3.8) admette une intgrale premire

h(t, x) R.

Soit le changement de variables sur

Avec les variables

(z, u),

(3.8) devient

d
z = exp(tA)Bu
dt

(3.9)

d
(exp(tA)) = exp(tA) A = A exp(tA). Dans
dt
l'quation (3.9), il est notable que le second membre ne dpend que de u
car d'aprs la Proposition 1,

h(t, exp(tA)z) = l(t, z).


Comme la valeur de l est constante le long de toute trajectoire t 7 (z(t), u(t)),
(et de

mais pas de

z ).

L'intgrale premire devient

nous avons

l
l d
d
l=
+
z=0
dt
t z dt
Comme

d
z
dt

= exp(tA)Bu,

pour toute valeur de

et

u,

on a l'identit

suivante

En prenant,

l
l
(t, z) + (t, z) exp(tA)Bu 0
t
z
u = 0, z et t arbitraires, on en dduit
l
(t, z) 0
t

Donc, ncessairement,

est uniquement fonction de

z.

Ainsi

l
(z) exp(tA)B 0
z
En drivant cette relation par rapport

t,

on a,

l
(z) exp(tA)AB 0
z
Plus gnralement, une drivation n'importe quel ordre

l
(z) exp(tA)Ak B 0
z
En spciant

t = 0,

on obtient

l
(z)Ak B = 0,
z

k 0.

k0

donne

3.3.

133

COMMANDABILIT LINAIRE

l
(z) appartient l'intersection des noyaux gauche de la
z
k
k
famille innie de matrice (A B)k0 . Le noyau gauche de A B n'est autre
k

k
que Im(A B) , l'orthogonal de l'image de A B . Donc
Ainsi le vecteur

\
l
k

(z)
Im(A B)
z
k0
Mais

Im(A B)

Im(B)

+ . . . + Im(Ak B) + . . .

k0

Ek = Im(B) + . . . + Im(Ak B) est une suite


croissante pour l'inclusion, Ek Ek+1 . Si pour un certain k , Ek = Ek+1 ,
k+1
cela signie que Im(A
B) Ek , donc A(E k ) Ek . Mais Im(Ak+2 B) =
k+1
Im(AA
B) A(E k+1 ). Ainsi Im(Ak+2 B) Ek . On voit donc que pour
k+r
tout r > 0, Im(A
B) Ek , d'o Ek+r = Ek . La suite des Ek est une suite
n
de sous-espaces vectoriels de R embots les uns dans les autres. Cette suite
stationne ds qu'elle n'est plus, pour un certain k , strictement croissante. Il
sut donc de ne considrer que ses n premiers termes, c.--d. E0 ,. . . ,En1 ,
car automatiquement En1 = En+r pour tout r > 0.
k
En revenant la suite des noyaux gauche de A B , nous voyons que
l
(z) est dans le noyau gauche de la suite innie de matrices
le fait que
z
l
k
(A B)k0 , est quivalent au fait que z
(z) est dans le noyau gauche de la
k
5
suite nie de matrices (A B)0kn1 .
l
Ainsi, pour tout z ,
(z) appartient au noyau gauche de la matrice
z
n (nm),
C = (B, AB, A2 B, . . . , An1 B)
(3.10)
La suite d'espaces vectoriels

dite matrice de commandabilit de Kalman. Si


gauche est nul, donc
et

ne dpend pas de

z:l

est de rang

n,

son noyau

est alors une fonction constante

galement.

Rciproquement, si la matrice de commandabilit C n'est pas de rang


n
maximal, alors il existe un vecteur w R /{0}, dans le noyau gauche de
5. On pourrait aussi utiliser le thorme de Cayley-Hamilton qui donne un rsultat plus
prcis : toute matrice carre est racine de son polynme caractristique. Cela veut dire,
tant de taille

n,

que

An

est une combinaison linaire des

An =

n1
X

(Ak )0kn1

pk Ak

k=0
o les

pk

Pn1
det(In A) = n k=0 pk k . Nous avons prfr un argument
suite des Ek car il a l'avantage de s'appliquer au cas non linaire. Il

sont dnis par

plus simple avec la

correspond au calcul de l'algbre de Lie de commandabilit.

134

CHAPITRE 3.

COMMANDABILIT, STABILISATION

l(z, t) = wT z , on voit que dtd l = 0 le


long des trajectoires. En passant aux variables (x, u), on obtient une intgrale
T
premire non triviale h(t, x) = w exp(tA)x. Toute trajectoire du systme
se situe dans un hyperplan orthogonal w .
(3.10). En remontant les calculs avec

En rsum, nous avons dmontr la proposition suivante.

Proposition 6.

La matrice de commandabilit

C = (B, AB, A2 B, . . . , An1 B)


est de rang

n,

si, et seulement si, les seules intgrales premires du sys-

tme (3.8) sont triviales.


Des Propositions 5 et 6, il vient que, si le systme (3.8) est commandable, sa matrice de commandabilit est de rang

n.

Nous allons voir que la

rciproque est vraie. Pour cela, nous avons besoin de certaines proprits
d'invariance.

3.3.2 Invariance
Dnition 12 (Changement d'tat, bouclage statique rgulier).
changement linaire de coordonnes

x 7 x

est dni par une matrice

Un

n : x = M x. Un bouclage statique rgulier u 7 u est dni


N inversible d'ordre m et une autre matrice K , m n : u =

inversible d'ordre
par une matrice

K x + N u.

C'est un changement de variables sur les commandes paramtr

par l'tat.
L'ensemble des transformations

x
u


7

x
u


=

forment un groupe lorsque les matrices

M 0
K N

M, N

et



x
u

varient (M et

(3.11)

restant

inversibles).
d
x=
Si
dt

Ax + Bu est commandable (resp. n'admet pas d'intgrale pre


ex + Be
e u obtenu avec (3.11) est commandable (resp. n'admet
mire) alors x
e = Ae

pas d'intgrale premire). Les notions de commandabilit et d'intgrale premire sont intrinsques, c.--d. indpendantes des coordonnes avec lesquelles
les quations du systme sont tablies. Si la matrice de commandabilit dans

(x, u) est de rang n, la matrice de commandabilit dans


(
x, u) sera aussi de rang n. Cette simple remarque conduit

les coordonnes

les

coordonnes

au

rsultat non vident suivant


rang(B, AB, . . . A

n1

B) = n

quivaut

AB,
. . . , An1 B)

rang(B,

=n

3.3.

A
(
x, u)

135

COMMANDABILIT LINAIRE

et

d
x
dt

s'obtiennent en crivant

= Ax + Bu

dans les coordonnes

x = M 1 (AM + BK)
x + M 1 BN u.
soit

A = M 1 (AM + BK),

= M 1 BN
B

En fait, il est possible d'aller beaucoup plus loin et de montrer que les indices
de commandabilit dnis ci-dessous sont aussi invariants.

Dnition 13 (Indices de commandabilit). Pour tout entier k, on note


k

le rang de la matrice

(B, AB, A2 B, . . . , Ak B). Les (k ) sont appels

indices

de commandabilit du systme linaire (3.8),


La suite

est croissance, majore par

est quivalente

Proposition 7
Bu

n.

L'absence d'intgrale premire

n1 = n.

d
Les indices de commandabilit de dt x = Ax +
sont invariants par changement de variable sur x et bouclage statique

rgulier sur

(invariance)

u.

Nous laissons la preuve de ce rsultat par rcurrence sur

en exercice.

Il est important de comprendre l'ide gomtrique de cette invariance. Les


transformations

(x, u) 7 (
x, u) du type (3.11) forment un groupe. Ce groupe

dnit une relation d'quivalence entre deux systmes ayant mme nombre
d'tats et mme nombre de commandes. La proposition prcdente signie
simplement que les indices de commandabilit sont les mmes pour deux
systmes appartenant la mme classe d'quivalence, i.e le mme objet gomtrique vu dans deux repres dirents. En fait, on peut montrer que les
indices de commandabilit sont les seuls invariants : il y a autant de classes
d'quivalence que d'indices de commandabilit possibles. Nous ne montrerons pas en dtail ce rsultat. Tous les lments ncessaires cette preuve
se trouvent dans la construction de la forme de Brunovsky ci-dessous (voir
aussi [38, 67]).
Nous allons voir, avec la forme normale de Brunovsky, qu'une telle corres-

y et les trajectoires du systme est gnrale. Il sut que (3.8)


soit commandable. Tout revient donc trouver la sortie de Brunovsky y de
mme dimension que la commande u.
pondance entre

3.3.3 Critre de Kalman et forme de Brunovsky


Thorme 23

(Critre de Kalman)

d
Le systme dt x

= Ax + Bu

mandable si et seulement si la matrice de commandabilit

C = (B, AB, . . . An1 B)

est com-

136

CHAPITRE 3.

est de rang

COMMANDABILIT, STABILISATION

n = dim(x).
(A, B) est commandable
commandabilit C est maximum.

Pour abrger, on dit souvent que la paire


dire que le rang de la matrice de

pour

La preuve que nous allons donner de ce rsultat n'est pas la plus courte
possible. Cependant, elle permet de dcrire explicitement, pour toute dun
re T > 0 et pour p, q R , les trajectoires du systme qui partent de p et
arrivent en

q . Cette preuve utilise la forme

dite de Brunovsky , objet du tho-

rme suivant. La forme de Brunovsky se construit en suivant une mthode


d'limination proche du pivot de Gauss.

Thorme 24 (Forme de Brunovsky).

(B, AB, . . . An1 B), la matrice de


d
x = Ax + Bu, est de rang n = dim(x) et si B est de
commandabilit de
dt
rang m = dim(u), alors il existe un changement d'tat z = M x (M matrice
inversible n n) et un bouclage statique rgulier u = Kz + N v (N matrice
inversible m m), tels que les quations du systme dans les variables (z, v)
admettent la forme normale suivante (criture sous la forme de m quations
direntielles d'ordre 1)
(1 )

y1
avec comme tat

Si

(m )
, ym
= vm

= v1 ,

...

(1)

(1 1)

z = (y1 , y1 , . . . , y1

...

(3.12)

( 1)

(1)

, ym , ym , . . . , ym m

),

les

tant des entiers positifs.


Les

quantits

yi ,

qui sont des combinaisons linaires de l'tat

x,

sont

appeles sorties de Brunovsky.


Les indices de commandabilit

et les

entiers

de la forme de Bru-

novsky sont intimement lis (pour plus de dtail voir [38]) : la connaissance
des uns est quivalente celle des autres.

Dmonstration. La preuve de ce rsultat repose sur


 une mise sous forme triangulaire des quations d'tat et l'limination
de

u;

 l'invariance du rang de

(B, AB, . . . An1 B)

par rapport aux transfor-

mations (3.11) ;
 une rcurrence sur la dimension de l'tat.

Mise sous forme triangulaire


On suppose que

est de rang

m = dim(u)

(sinon, on peut faire un

m de faon se
x = (xr , xu ) avec

regroupement des commandes en un nombre plus petit que


ramener ce cas). Alors, il existe une partition de l'tat

3.3.

137

COMMANDABILIT LINAIRE

dim(xr ) = n m

et

dim(xu ) = m

telle que les quations (3.8) admettent la

structure bloc suivante

d
x
dt r
d
x
dt u
o

= Arr xr + Aru xu + Br u
= Aur xr + Auu xu + Bu u

Bu est une matrice carre inversible. Cette partition n'est pas unique, bien
u et en reportant cette

sr. En rsolvant la seconde quation par rapport


expression dans la premire quation, on obtient

d
x
dt r
d
x
dt u

= Arr xr + Aru xu + Br Bu1 ( dtd xu Aur xr Auu xu )


= Aur xr + Auu xu + Bu u

En regroupant les drives dans la premire quation, on a

d
x
dt r

Br Bu1 dtd xu = (Arr Br Bu1 Aur )xr + (Aru Br Bu1 Auu )xu
d
x = Aur xr + Auu xu + Bu u.
dt u

Avec la transformation du type (3.11) dnie par

xr = xr Br Bu1 xu ,
les quations

d
x
dt

= Ax + Bu

xu = xu ,

u = Aur xr + Auu xu + Bu u,

deviennent

d
x
dt r
d
x

dt u

= Ar xr + Au xu
= u

Ar = (Arr Br Bu1 Aur ) et Au = (Arr Br Bu1 Aur )Br Bu1 + (Aru


Br Bu1 Auu ). Dans cette structure triangulaire, o la commande u n'intervient
o

pas dans la seconde quation, on voit apparatre un systme plus petit d'tat

xr

et de commande

xu .

Cela nous permet de rduire la dimension de

et de

raisonner par rcurrence.

Invariance de rang
n1
Un simple calcul par blocs nous montre que si (B, AB, . . . A
B) est de
nm1
rang n alors (Au , Ar Au , . . . Ar
Au ) est de rang n m. Du systme de
d
x = Ar xr + Au xu
taille n on passe ainsi au systme de taille rduite n m,
dt r
(x
r l'tat, xu la commande).

Rcurrence sur le nombre d'tats


tant donn

n,

supposons le rsultat vrai pour toutes les dimensions


d
d'tat infrieures ou gales n 1. Considrons un systme
x = Ax + Bu
dt
avec n = dim(x), sa matrice de commandabilit de rang n, et B de rang

138

CHAPITRE 3.

m = dim(u) > 0.

COMMANDABILIT, STABILISATION

L'limination de

donne, aprs une transformation du

type (3.11),

d
x
dt r
d
x
dt u

= Ar xr + Au xu
= u

dim(u) = dim(xu ) = m et dim(xr ) = nm avec (Au , Ar Au , . . . Arnm1 Au )


de rang n m < n (les ont t enlevs pour allger les notations). Notons m

le rang de Au . Comme m
m, un changement de variable sur xu , (
xu , xu ) =
P xu avec P inversible, permet d'crire le systme sous la forme
o

d
x
dt r
d
x

dt u
d
x
dt u

= Ar xr + Au xu
= u
= u

(3.13)

(
u, u) = P u, dim(
xu ) = m
et Au de rang m
. Le rang de la matrice de
d

x = Ar xr + Au xu (xr est l'tat et xu la commande)


commandabilit de
dt r
est gal n m = dim(xr ), l'hypothse de rcurrence assure l'existence
d'un changement de variable xr = M z et d'un bouclage statique rgulier
xu = Kz + N v (v est la nouvelle commande ici) mettant ce sous-systme
sous forme de Brunovsky. Le changement d'tat (xr , x
u , xu ) dni par

M 0 0
z
xr
xu = K N 0 v
0 0 1
xu
xu
avec

et le bouclage statique rgulier sur

(
u, u)

u = KM 1 (Ar xr + Au xu ) + N v,

u = v

transforment le systme (3.13) sous forme de Brunovsky avec

v = (
v , v)

comme nouvelle commande.

Preuve du Thorme 23
des variables sur

La commandabilit est indpendante du choix

et d'un bouclage statique rgulier sur

u.

On peut donc

supposer le systme sous sa forme de Brunovsky. Dans ces coordonnes, aller


d'un tat un autre est lmentaire. Ce problme se ramne tudier la
()
commandabilit du systme scalaire y
= v . L'tat initial (y0 , . . . , y01 ),
1
) ainsi que la dure T tant donns, les lois horaires
l'tat nal (yT , . . . , yT
t 7 v(t) assurant le passage entre ces deux tats pendant la dure T correspondent alors la drive
les drives jusqu' l'ordre

(r) (0) = y0r ,

-ime de fonctions [0, T ] 3 t 7 (t) R,


1 en 0 et T sont imposes par
(r) (T ) = yTr ,

r = 0, . . . , 1

dont

3.3.

139

COMMANDABILIT LINAIRE

Figure 3.6  Deux masses couples par un ressort. L'ensemble est soumis
une seule force

u.

Il existe bien sr une innit de telles fonctions


un polynme de degr

Exemple 17

2 1,

(on peut prendre pour

par exemple).

(Un exemple d'utilisation de la forme de Brunovsky)

Soit le

systme mcanique deux degrs de libert et une seule commande reprsent


sur la Figure 3.6. En ngligeant les frottements et en supposant le ressort
linaire de raideur

k,

on obtient le modle suivant

m1 x1 = k(x2 x1 ) + u
m2 x2 = k(x1 x2 )

(3.14)

Montrons que ce systme est commandable. Il sut pour cela de remar-

x2 , l'abscisse de la masse qui n'est pas directement souu, joue un rle trs particulier ( sortie de Brunovsky). Si au
lieu de donner t 7 u(t) et d'intgrer (3.14) partir de positions et vitesses
m
initiales, on xe t 7 x2 (t) = y(t), alors, on peut calculer x1 = k2 y
+ y et
donc, u = m1 x
1 + m2 x2 = m1km2 y (4) + (m1 + m2 )
y . Ainsi, on peut crire le
systme en faisant jouer x2 un rle privilgi

quer que la quantit


mise la force

x1 = (m2 /k) y + y
x2 = y

u = (m1 m2 /k) y (4) + (m1 + m2 )


y
On obtient une paramtrisation explicite de toutes les trajectoires du systme. Les relations prcdentes tablissent une correspondance bi-univoque et
rgulire entre les trajectoires de (3.14) et les fonctions rgulires

t 7 y(t).

Cette correspondance permet de calculer de faon lmentaire une commande


[0, T ] 3 t 7 u(t) qui fait passer le systme de l'tat p = (xp1 , v1p , xp2 , v2p ) l'tat

140

CHAPITRE 3.

q = (xq1 , v1q , xq2 , v2q ) (vi

COMMANDABILIT, STABILISATION

d
correspond dt xi ). tant donnes les quations

x1 = (m2 /k) y + y

v1 = (m2 /k) y (3) + y


dt
(3.15)

x2 = y

v = dy
2
dt
il apparat qu'imposer p en t = 0 revient imposer y et ses drives jus(1) (2) (3)
qu' l'ordre 3 en 0 : (y0 , y0 , y0 , y0 ). Il en est de mme en t = T avec
(1) (2) (3)
(yT , yT , yT , yT ). Il sut donc de trouver une fonction rgulire [0, T ] 3
t 7 y(t) dont les drives jusqu' l'ordre 3 sont donnes a priori en 0 et
en T . Un polynme de degr 7 en temps rpond la question mais il existe
bien d'autres possibilits. Nous en dtaillons une ci-dessous qui est compltement explicite.
Soit la fonction

C 4 : [0, 1] 7 [0, 1]
() =

dnie par

4
.
4 + (1 )4

Il est facile de voir que est croissante avec


dk
(1) = 0 pour k = 1, 2, 3. La fonction
d k


y(t) =

dk
et d k (0)


  
t
t2 (2) t3 (3)
(1)
1
y0 + ty0 + y0 + y0
T
2
6
 

(t T )2 (2) (t T )3 (3)
t
(1)
+
yT +
yT
yT + (t T )yT +
T
2
6
k

(k)

y(0) = y0 , y(T ) = yT avec ddtky (0, T ) = y0,T , k = 1, 2, 3. On obtient


une trajectoire en x correspondant une telle transition en utilisant les

vrie
ainsi

(0) = 0, (1) = 1

formules (3.15) et le contrle correspondant avec

u = (m1 m2 /k) y (4) + (m1 + m2 )


y
x1 = x2 = 0 la
temps T s'obtient avec

En particulier, le transfert de la conguration stationnaire


conguration stationnaire

x1 = x2 = D > 0

durant le

le contrle en boucle ouverte suivant ( feedforward)

car alors



Dm1 m2 d4
D(m1 + m2 ) d2
u(t) =
+
kT 4 d 4 t
T2
d 2 t
T
T

t
y(t) = D T .

3.3.

141

COMMANDABILIT LINAIRE

3.3.4 Planication et suivi de trajectoires


Des preuves des Thormes 23 et 24, il est important de retenir deux
choses.

d
x = Ax + Bu est commandable , est quivalent
dt
l'existence d'un bouclage statique rgulier u = Kz + N v et d'un chan-

1. Dire que le systme

x = M z permettant de ramener le systme la forme


y () = v et z = (y, . . . , y (1) ) (par abus de notation
( )
( )
y = (y1 , . . . , ym ) et y () = (y1 1 , . . . , ym m )). Ces changements donnent

gement d'tat

de Brunovsky

x = M (y, . . . , y (1) ),
o la matrice

u = L(y, . . . , y () )

L est construite avec K , N et M . Lorsqu'on considre une


t 7 (t) Rm et qu'on calcule

fonction rgulire arbitraire du temps

x(t)

et

u(t)

par les relations

x(t) = M ((t), . . . , (1) (t)),

u(t) = L((t), . . . , () (t))

t 7 (x(t), u(t)) est une trajectoire du systme. L'quation dtd x(t)


Ax(t)Bu(t) = 0 est identiquement satisfaite. Rciproquement, toutes
alors

les trajectoires rgulires du systme se paramtrisent de cette faon,


grce

fonctions scalaires arbitraires

1 (t), . . ., m (t)

et un nombre

ni de leurs drives par les formules ci-dessus.

d
x = Ax + Bu implique la possibilit de stabidt
lisation par retour d'tat. La forme de Brunovsky fait apparatre cette

2. La commandabilit de

possibilit. Sous cette forme normale, chacun des m sous-systmes in(i )


dpendants s'crit yi
= vi . Soient i valeurs propres, 1 , . . . , i ,
correspondant au spectre d'une matrice relle de dimension i . Notons

sk

les fonctions symtriques des

gnes de degr

i
Y

k,

(des quantits relles donc) homo-

obtenues par le dveloppement suivant

(X k ) = X i s1 X i 1 + s2 X i 2 + . . . + (1)i si

k=1
Alors, ds que les

sont partie relle strictement ngative (c.--d.

qu'ils correspondent une matrice Hurwitz ), le bouclage

(i 1)

vi = s1 yi
assure la stabilit de

(i )

yi

(i 2)

s2 yi
= vi .

+ . . . + (1)i 1 si yi

En eet, les exposants caractristiques

(on dit aussi les ples) du systme boucl sont les

k .

142

CHAPITRE 3.

COMMANDABILIT, STABILISATION

Figure 3.7  Suivi de trajectoire.


Comme nous venons de le voir, de la forme de Brunovsky, on dduit directement le rsultat suivant

Thorme 25

(A, B) est commandable


(voir le Thorme 23) alors, pour toute matrice relle F de taille n n, il
existe une matrice m n, K (non ncessairement unique si m > 1), telle que
le spectre de A BK concide avec celui de F .
(Placement de ples)

Si la paire

d
x = Ax + Bu, la pladt
nication de trajectoire nous donne une trajectoire en boucle ouverte du sysDe retour dans les coordonnes de modlisation,

tme (par exemple la trajectoire que doit suivre une fuse au dcollage, la
manoeuvre d'atterrissage d'un avion,
avec l'indice

. . .).

Nous la notons

t 7 (xr (t), ur (t))

pour rfrence. En pratique, il convient, comme l'illustre la

Figure 3.7, de corriger en boucle ferme en fonction de l'cart


mande de rfrence
partir de

ur .

x,

la com-

Le problme est donc de calculer la correction

de faon revenir sur la trajectoire de rfrence. C'est un

problme de suivi de trajectoire . On peut galement le rsoudre en utilisant


un bouclage stabilisant par placement de ples sous la forme de Brunovsky.
Nous allons dtailler ce point.
d
x = Axr + Bur , on obtient, par dirence avec dtd x
Comme
dt r
l'quation d'erreur suivante

= Ax + Bu

d
(x) = A x + B u
dt
x = x xr et u = u ur . Le systme tant commandable, il existe K ,
matrice m n, telle que les valeurs propres de A + BK sont toutes partie
o

relle strictement ngative (d'aprs le Thorme de placement de ples 25).


La correction

u = K x
assure le suivi asymptotique de la trajectoire de rfrence

t 7 xr (t).

Nous terminerons par une constatation d'ordre exprimental : lorsque le


d
modle dynamique
x = Ax+Bu est d'origine physique, il n'est pas rare que
dt

3.4.

143

COMMANDE LINAIRE QUADRATIQUE LQR

sa partie non commandable, i.e., ses intgrales premires, ait une signication
physique immdiate, tout comme les grandeurs

y , fonction de x et intervenant

dans la forme de Brunovsky de sa partie commandable. Cet tat de fait n'est


vraisemblablement pas d entirement au hasard : en physique, les grandeurs
qui admettent une signication intrinsque, i.e., les grandeurs physiques, sont
celles qui ne dpendent pas du repre de l'observateur. En Automatique, le
passage d'un repre un autre correspond, entre autres, une transformation
de type (3.11). Il est alors clair que le sous-espace engendr par les sorties
de Brunovsky est un invariant. Il a donc toutes les chances d'avoir un sens
physique immdiat. Les sorties de Brunovsky admettent un quivalent non
linaire pour de nombreux systmes physiques (voir la Section 3.5.1).

3.4 Commande linaire quadratique LQR


Nous avons tudi la proprit de commandabilit (objet de la Dnition 10), qui requiert, pour tre satisfaite par un systme, l'existence pour
tout

p, q

d'une trajectoire reliant un tat

un tat

q.

Sous l'hypothse

de commandabilit, nous avons vu comment construire une telle trajectoire


par la forme de Brunovsky (voir Thorme 24). Cette trajectoire est loin
d'tre unique. On va maintenant montrer comment choisir la trajectoire la
meilleure au sens d'un critre quadratique. C'est l'objet de la commande

linaire quadratique .
Nous nous intressons ici, en toute gnralit, aux systmes linaires ins-

tationnaires du type

d
x(t) = A(t)x(t) + B(t)u
dt
o l'tat
matrices

(3.16)

x(t) Rn , la commande u(t) Rm et, pour


A(t) et B(t) sont de tailles n n et n m,

tout

t [0, +[

les

respectivement. Ces

systmes peuvent provenir de bilans exacts ou, plus souvent, de la linarisation autour de trajectoires de manuvre entre des points stationnaires. Ainsi
d
si t 7 (xr (t), ur (t)) est une trajectoire de rfrence de
x = f (x, u), on a
dt
d
x = f (xr , ur ) et on note
dt r


f
A(t) =
,
x (xr (t),ur (t))
En fait,

et


f
B(t) =
u (xr (t),ur (t))

dans (3.16), correspondent aux carts

Considrons un intervalle de temps donn

[0, tf ]

x xr (t)

et

u ur (t).

(sur lequel l'ventuelle

trajectoire de rfrence est dnie). On cherche minimiser le critre qua-

144

CHAPITRE 3.

COMMANDABILIT, STABILISATION

x 10
2.6

altitude
2.4
2.2
2
1.8
1.6
1.4
1.2
1
0.8

200

400

600

800

1000

1200

1400

1600

1800

2000

temps

Figure 3.8  Trajectoire de rentre d'un vhicule spatial (dpart en orbite,


arrive 80.000 pieds) . Les rebonds atmosphriques permettent de maximiser
le dport latral en utilisant les eets arodynamiques.

dratique suivant

tf


xT (t)Rx + uT (t)Qu(t) dt

J=

(3.17)

0
o

R est une matrice symtrique positive et Q une matrice symtrique dnie


6

positive .
Implicitement, on cherche une commande
pondre par

[0, tf ] 3 t 7 u(t)

faible (car

dans le calcul de l'intgrale) limitant les dviations de

elles-mmes pondres par

sur l'horizon temporel

[0, tf ].

La commande

minimisant (3.17) ralise le meilleur compromis (au sens prcis par les pondrations

et

Exemple 18

Q)

entre dviation de l'tat et eort sur les actionneurs.

(Rentre atmosphrique)

Un exemple de trajectoire dnis-

sant un systme linaris tangent instationnaire du type (3.16) est donn sur
la Figure 3.8. On y a reprsent l'historique des valeurs de l'altitude pour
une trajectoire de vaisseau spatial (type navette) dans la manuvre de rentre atmosphrique au cours de laquelle on cherche maximiser le dport
6. L'hypothse de symtrie n'enlve rien la gnralit. En eet pour tout

x Gx = x ((G + G )/2)x.
T
le calcul de x Gx.
a

Autrement dit, seule la partie symtrique de

x Rn ,

on

G compte dans

3.4.

145

COMMANDE LINAIRE QUADRATIQUE LQR

latral (i.e. en faisant pivoter l'appareil pour rejoindre une plus haute latitude o est situ le point de chute dsir pour l'engin). Cet objectif et les
contraintes arodynamiques (notamment la thermique et la variation de densit de l'atmosphre) confrent l'optimum de nombreuses bosses (appeles
rebonds atmosphriques). An d'assurer le suivi de cette trajectoire, on doit
concevoir un contrleur en boucle ferme. On linarise alors les quations autour de cette trajectoire rebonds et on obtient naturellement un modle de
la forme (3.16). On pourra se reporter [11] pour une prsentation dtaille
de ce problme.
Dans le cas multivariable en particulier, i.e. o on dispose de plusieurs
commandes, on a en gnral trop de degrs de libert pour rsoudre les
problmes de planication et de suivi de trajectoire. En voquant un critre
minimiser comme nous venons de le faire en (3.17), on dnit implicitement
l'utilisation des degrs de libert supplmentaires : ils permettent d'optimiser
cet indice de performance.

Exemple 19

(Racteur nuclaire eau pressurise)

On prsente ici un

exemple de systme multivariable pour lequel on peut raliser des transitoires


de trs nombreuses faons. De manire gnrale, les racteurs nuclaires de
production d'lectricit prsentent d'intressants problmes d'Automatique.
Leur schma de principe est donn sur la Figure 3.9, on pourra se rfrer
[48] pour une prsentation gnrale. Dans le circuit primaire, la neutronique
est contrle par la contre-ractivit des barres et du bore dont on peut agir
sur la concentration par un circuit de borication/dilution. Les changes avec
le circuit secondaire fournissent, travers le gnrateur de vapeur, de la
puissance la turbine qui est accouple une gnratrice. On peut utiliser
une vanne de contournement pour fournir plus ou moins de puissance la
turbine. En dehors des phases de rgulation, c.--d. de la stabilisation autour
d'un point de fonctionnement (on parle de rgulation de frquence du rseau),
on est souvent amen raliser des transitoires lorsque la demande du rseau
lectrique varie. Une manuvre dicile est l'iltage, qui consiste isoler le
rseau. Il faut alors utiliser les direntes commandes de manire coordonne
pour rduire la puissance en minimisant la fatigue des installations. Une
formulation type commande linaire quadratique permet de spcier ce genre
de cahier des charges.
De manire encore plus gnrale, on peut considrer le cot avec pondration nale

1
1
J = xT (tf )Sf x(tf ) +
2
2

Z
0

tf


xT (t)Rx(t) + uT (t)Qu(t) dt

(3.18)

146

CHAPITRE 3.

COMMANDABILIT, STABILISATION

gnrateur de vapeur
vanne de
contournement
barres de contrle

rseau lectrique

turbine

pressuriseur

borication/dilution

refroidissement
condenseur
racteur

pompe de circulation

Figure

pompe circuit secondaire

3.9  Schma de principe d'un racteur nuclaire eau pressuri-

se. Pour contrler la production d'lectricit, on peut utiliser 3 actionneurs


(commandes) : barres de contrle, systme de borication/dilution, vanne de
contournement de la turbine.

qui permet de rajouter de l'importance au point nal atteint (Sf tant une
matrice symtrique positive).
L'intrt des formulations quadratiques (3.18) (et (3.17)) est qu'elles sont
en gnral bien poses au sens mathmatique, et qu'elles admettent une solution unique, calculable numriquement

3.4.1 Multiplicateurs de Lagrange en dimension innie


Le but de cette section est de prsenter de faon simple la mthode
des multiplicateurs de Lagrange en dimension innie. Cette mthode permet
de caractriser l'optimum du critre (3.18) (ou (3.17)). Un lecteur intress
pourra consulter [4, 13] ou les notes de l'ES d'optimisation [61].
Commenons par la dimension nie. On part du problme suivant o le
J : Rn 7 R et les p contraintes scalaires hi : Rn 7 R sont des

critre

7. Calculable analytiquement pour un ou deux tats mais pas plus en pratique. C'est
trs dirent de l'approche utilisant la forme normale de Brunovsky, approche que l'on
peut conduire analytiquement sans dicult sur de nombreux exemples physiques bien
plus que trois tats.

3.4.

COMMANDE LINAIRE QUADRATIQUE LQR

147

fonctions drivables du temps

J(x)
min
x Rn
h1 (x) = 0

hp (x) = 0

.
.
.

Pour rsoudre ce problme on introduit




p multiplicateurs de Lagrange (les variables adjointes ) = (1 , ..., p )


Rp ;

 on calcule le Lagrangien

L(x, ) = J(x) +

p
X

i hi (x) = J(x) + T h(x);

i=1
 on calcule les conditions de stationnarit du Lagrangien au 1er ordre

x et pouvaient varier librement dans


toutes les directions. Ces conditions traduisent le fait que L = 0 pour
toutes variations innitsimales x et des variables x et .
condition L = 0 pour tout x donne n quations
en faisant comme si les variables

La

X hi
J
+
= 0,
i
xk
xk
i=1
La condition

L = 0

pour tout

redonne les

hi (x) = 0,
On a ainsi un systme de

k = 1, . . . , n

contraintes

i = 1, . . . p

n+p inconnues avec n+p quations rsoudre pour

trouver l'optimum. La partie la plus dure reste cependant faire : rsoudre


ce systme d'quations non-linaires et vrier que la solution trouve est

bien l'optimum .
Passons maintenant la dimension innie avec le problme suivant o
n
m
n
m
n
n
toutes les fonctions L : R R 7 R, f : R R 7 R , l : R 7 R sont
0
drivables et o le temps nal tf et la condition initiale x sont des constantes

8. On pourra alors regarder les conditions au second ordre.

148

CHAPITRE 3.

COMMANDABILIT, STABILISATION

donnes

min
[0, tf ] 3 t 7 (x(t), u(t)) Rn Rm
x(0) = x0
f1 (x(t), u(t)) dtd x1 (t) = 0, t [0, tf ]

tf

Z
l(x(tf )) +


L(x(t), u(t)) dt

.
.
.

fn (x(t), u(t))

d
x (t)
dt n

= 0, t [0, tf ]
(3.19)

On est en dimension innie car on minimise une fonctionnelle pour toutes

t 7 (x(t), u(t)) qui vrient les contraintes, i.e. pour toutes les
d
x = f (x, u) qui dmarrent en t = 0 de x0 .
trajectoires du systme
dt
d
On voit que les contraintes fi (x(t), u(t))
x (t) = 0 dpendent d'un
dt i
indice discret i et d'un indice continu t. Il est donc logique d'introduire les
multiplicateurs i (t) avec ces deux types d'indice. On forme le Lagrangien
L avec une somme discrte sur i et une somme continue sur t (une intgrale
donc) des produits contrainte d'indice (i, t) fois multiplicateur d'indice (i, t)
Z tf
L(x(t), u(t)) dt
L(x, u, ) = l(x(tf )) +
0


n Z tf
X
d
i (t) fi (x(t), u(t)) xi (t) dt
+
dt
i=1 0
les courbes

L est une fonctionnelle qui


rel L(x, u, ) calcul avec une

Le Lagrangien

aux fonctions

associe un

intgrale sur

x, u

t.

et

sur

[0, tf ]

On note de faon

plus compacte

Z
L(x, u, ) = l(x(tf ))+

tf



d
L(x(t), u(t)) + (t) f (x(t), u(t)) x(t) dt
dt
T

Les conditions de stationnarit du premier ordre s'obtiennent alors, comme


dans le cas de la dimension nie, en explicitant qu'au premier ordre la va-

x, u et
t 7 (t). Puisqu'on n'a pas
0
introduit de multiplicateur pour la contrainte x(0) = x , nous imposons la
variation x de vrier la contrainte x(0) = 0.
Commenons par la variation de . On doit avoir, pour toute variation de
la courbe , une variation de L nulle au premier ordre. En d'autres termes,
n
pour toute fonction t 7 (t) R on doit avoir


Z tf
d
T
L =
(t) f (x(t), u(t)) x(t) dt = 0
dt
0
riation

de

est nulle pour toute variation innitsimale

des courbes paramtres

t 7 x(t), t 7 u(t)

et

3.4.

COMMANDE LINAIRE QUADRATIQUE LQR

La seule possibilit

0.

est qu' chaque instant

149

t [0, tf ], f (x(t), u(t)) dtd x(t) =

On retrouve bien les contraintes comme en dimension nie.


Poursuivons avec la variation de

u.

On doit avoir, pour toutes variations

u, une variation de L nulle au premier ordre. Pour toute


t 7 u(t) Rm , on doit avoir
!


Z tf

L
f

L =
u(t) + T (t)
u(t) dt = 0

u
u (x(t),u(t))
0
(x(t),u(t))]

du contrle
tion

fonc-

u en facteur on obtient
!


Z tf

L
f

+ T (t)
u(t) dt = 0
L =


u
u
0
(x(t),u(t))
(x(t),u(t))

En mettant

Ceci donne la condition de stationnarit sur

L
f
(x, u) + T
(x, u) = 0, t [0, tf ]
(3.20)
u
u
Terminons par la variation de x. On doit avoir, pour toutes variations x
vriant x(0) = 0, une variation de L nulle au premier ordre. Pour toute
n
fonction t 7 x(t) R telle que x(0) = 0, on doit avoir
l
L =
(x(tf ))x(tf )+
x
"

Z tf
L
x(t) + T (t)

x
0
(x(t),u(t))]

!#

d
f
x(t) x(t)
dt = 0
x (x(t),u(t))
dt

Pour mettre, comme avec u, x en facteur dans l'intgrale, il nous faut


d
liminer
x. La seule possibilit est de faire une intgration par partie.
dt
d
. C'est ici que rside principalement la nouveaut par
Cela fait apparatre
dt
rapport la dimension nie. On a

tf

d
t
(t) x(t) dt = [T x]0f +
dt
T

tf

d T
(t) x(t) dt
dt
0
Z tf
d T
T
= (tf )x(tf ) +
(t) x(t) dt
dt
0

x(0) = 0. On a


l
T
L =
(x(tf )) (tf ) x(tf )+
x
#


Z tf "

L
f
d

+ T (t)
+ T (t) x(t) dt = 0


x (x(t),u(t))]
x (x(t),u(t)) dt
0

car

9. On se reportera au lemme de duBois-Reymond.

150

CHAPITRE 3.

Donc, pour toute fonction

tf

"

COMMANDABILIT, STABILISATION

t 7 x(t)

telle que

x(0) = x(tf ) = 0,

#



L
f
d

+ T (t)
+ T (t)
x (x(t),u(t))]
x (x(t),u(t)) dt

x(t) dt

on a

On en dduit



L
f
d T
T
(t) = 0
+

(t)
+
x (x(t),u(t))]
x (x(t),u(t)) dt
c.--d.

Enn, avec

L
x

T


+

(x,u)

x(tf ) 6= 0

f
x

T
+
(x,u)

on obtient de

(tf ) =

d
= 0, t [0, tf ]
dt

L = 0

(3.21)

la condition nale

l
(x(tf ))
x

En somme, les conditions d'optimalit du premier ordre pour le problme (3.19) sont pour

t [0, tf ]

x(t) = f (x(t), u(t))

dt

 T
 T
d

L
f
(t)
(t) =
dt
x (x(t),u(t))
x (x(t),u(t))






L
f

0=
+ T

u (x(t),u(t))
u (x(t),u(t))

(3.22)

avec comme condition au bord

x(0) = x0 ,

(tf ) =

l
(x(tf ))
x

(3.23)

Il s'agit d'un problme aux deux bouts , ce n'est pas un problme de Cauchy ,

t = 0 et t = tf comme
tat adjoint . Nous allons
f est linaire et o les fonc-

car la condition initiale est spare entre les temps


le prcise l'quation (3.23). On appelle souvent
maintenant utiliser ces formules dans le cas o
tions

et

sont quadratiques. C'est le cas dit linaire quadratique . Sous ces

hypothses, les conditions de stationnarit ci-dessus sont alors des conditions


ncessaires et susantes d'optimalit.

3.4.

151

COMMANDE LINAIRE QUADRATIQUE LQR

3.4.2 Problme aux deux bouts dans le cas linaire quadratique


La caractrisation de la commande optimale pour le problme de mi0
nimisation du critre (3.18) pour une condition initiale x(0) = x donne
passe par le calcul des conditions de stationnarit (3.22) avec f = Ax + Bu,
L = 21 (xT Rx + uT Qu) et l = 12 xT Sf x. Le problme aux deux bouts correspondant prend la forme

d
1 T

x(t) = A(t)x(t) BQ B (t)


dt
d

(t) = Rx(t) AT (t)(t)


dt

(3.24)

avec les conditions limites bilatrales

x(0) = x0 ,
L'tat adjoint

(tf ) = Sf x(tf )

est de la mme dimension que x. La commande optimale est

alors donne par la dernire quation de (3.22)

u(t) = Q1 B T (t)(t)
La particularit des quations (3.24) est qu'elles admettent une solution
explicite sous forme linaire

(t) = S(t)x(t)
avec

S(tf ) = Sf .

Nous allons dtailler ce point.

En substituant dans (3.24), on obtient

d
S(t)x(t) + S(t)A(t)x(t) S(t)B(t)Q1 B T (t)S(t)x(t)
dt
= Rx(t) AT (t)S(t)x(t)
Il sut alors de choisir

solution de l'quation direntielle matricielle

de Riccati en temps rtrograde (quadratique en l'inconnue

S)

d
1 T
T
S(t) = S(t)A(t) + S(t)B(t)Q B (t)S(t) R A (t)S(t)
dt

S(tf ) = Sf

(3.25)

pour obtenir nalement la commande optimale

u(t) = Q1 B T (t)S(t)x(t)

(3.26)

152

CHAPITRE 3.

COMMANDABILIT, STABILISATION

Le fait majeur retenir ici est que la commande optimale (3.26) s'exprime
prcisment comme une loi de feedback instationnaire dont le gain peuttre calcul hors-ligne

10

(i.e. avant de raliser la moindre exprience) par la

rsolution de l'quation de Riccati (3.25).

Exemple 20

([13])

d
Soit la dynamique dt x

= v,

minimiser

 1
1
J=
c1 v(tf )2 + c2 x(tf )2 +
2
2
o

c1 , c2

tf

et

d
v
dt

= u

et le critre

tf

u2 (t)dt

sont des constantes positives. La commande optimale est

u(t) = x (t)x(t) v (t)v(t)


o

x =

1/c2 + 1/c1 (tf t)2 + 1/3(tf t)3


D(tf t)

v =

1/c1 (tf t) + 1/2(tf t)2


D(tf t)

avec


D(tf t) =

1
1
+ (tf t)3
c2 3




1
1
+ tf t (tf t)4
c1
4

De manire intressante, il est possible d'exprimer simplement la valeur


du cot

(3.18) associe la commande optimale

(3.26). Considrons

l'galit

tf


d T
x (t)S(t)x(t) dt = xT (tf )Sf x(tf ) xT (0)S(0)x(0).
dt

Il vient alors

1
1
J xT (0)S(0)x(0) =
2
2

Z
0

tf


d T
x (t)S(t)x(t) dt
dt
Z
1 tf T
+
(x (t)Rx(t) + uT (t)Qu(t))dt
2 0

10. On peut montrer que le problme linaire instationnaire avec cot quadratique considr ici donne la solution au deuxime ordre d'un problme non-linaire plus prcis dont il
est l'approximation. La loi de feedback que nous venons de calculer procure alors le calcul
des extrmales de voisinages (voir [13]).

3.4.

153

COMMANDE LINAIRE QUADRATIQUE LQR

En dveloppant et en explicitant (3.26), on a

1
1
J xT (0)S(0)x(0) =
2
2

tf

(x (t) R SBQ B S + SA + A S + S x(t))dt


T

En utilisant (3.25), on obtient nalement

1
J xT (0)S(0)x(0) = 0.
2
On vient de calculer que le cot associ la commande optimale (3.26) est

1
J opt = xT (0)S(0)x(0)
2

(3.27)

Nous pouvons maintenant rcapituler nos rsultats dans la proposition suivante

Proposition 8 (contrleur LQR). Soit le systme linaire instationnaire (3.16)

d
x(t) = A(t)x(t)
dt
minimiser (3.18)

+ B(t)u

avec

x(0)

1
1
J = xT (tf )Sf x(tf ) +
2
2

comme condition initiale, et le critre

tf


xT (t)Rx(t) + uT (t)Qu(t) dt

A(t) est une matrice nn, B(t) est une matrice nm, Sf et R sont symtriques positives, Q est symtrique dnie positive. La solution ce problme
o

de minimisation est la loi de feedback optimal (3.26)

u(t) = Q1 B T (t)S(t)x(t)
o

est dnie par l' quation direntielle de Riccati rtrograde (3.25), et


opt = 1 xT (0)S(0)x(0).
la valeur du critre qui lui est associe est J
2

3.4.3 Planication de trajectoires


+ l'objectif de minimiser un critre quadratique du type (3.17), on peut
ajouter une contrainte nale , permettant d'exprimer le souhait de se rendre
exactement en un point donn. On se retrouve alors avec un problme de
planication de trajectoire optimale pour un systme linaire instationnaire .
La contrainte que nous considrons ici est

x(tf ) =

(3.28)

154

CHAPITRE 3.

Rn .

COMMANDABILIT, STABILISATION

Il est possible bien sr de considrer des contraintes plus gn-

rales, et/ou ne portant que sur certaines composantes de l'tat, on pourra se


rfrer [13] pour un expos des mthodes se rapportant ces cas.
Les conditions de stationnarit sont modies par l'adjonction de la contrainte (3.28). Il sut de remplacer la condition nale dans (3.23) par la
condition nale

x(tf ) = .

On obtient la commande optimale par la rsolu-

tion des quations suivantes

d
S(t) = S(t)A(t) + S(t)B(t)Q1 B T (t)S(t) R AT (t)S(t)
dt
S(tf ) = 0

d
V (t) = AT (t) S(t)B(t)Q1 B T (t) V (t)
dt
V (tf ) = I
d
H(t) = V T (t)B(t)Q1 B T (t)V (t)
dt
H(tf ) = 0
o

est la matrice identit de taille

(3.29)
(3.30)
(3.31)
(3.32)
(3.33)
(3.34)

n. On notera que (3.29) est une quation

direntielle de Riccati qu'on devra rsoudre en temps rtrograde depuis


sa condition terminale (3.30). Une fois cette quation rsolue, on pourra
calculer

V (t)

en rsolvant l'quation linaire (3.31) partir de la condition

terminale (3.32). Ensuite, on pourra calculer

H(t)

travers (3.33) et (3.34)

par une simple intgration en temps rtrograde. La matrice H(t) est toujours
d
H 0. Elle n'est pas singulire lorsque le systme
ngative car H(tf ) = 0 et
dt
est commandable (voir [13]). Finalement, la commande optimale est


u(t) = Q1 B T (t) S(t) V (t)H 1 (t)V T (t) x(t) Q1 B T (t)V (t)H 1 (t)
C'est encore une fois une loi de feedback instationnaire, complt par un
terme de feedforward lui aussi instationnaire.

Exemple 21.

Considrons le systme dynamique

d
x(t) = Ax(t) + Bu(t) ,
dt

0
1
1/2 0

On souhaite calculer une commande [0


0
T
systme de x = [0.5 1] xf = [1

Z
0


x(t) +

0
1


u(t)

3] 3 t
7 u(t) R transfrant le
0]T , en minimisant le critre

quadratique

1
J=
2

u(t)2 dt

3.4.

COMMANDE LINAIRE QUADRATIQUE LQR

155

On forme le systme

d
S(t) = S(t)A + S(t)BQ1 B T S(t) AT S(t)
dt
S(3) = 0

d
V (t) = AT S(t)BB T V (t)
dt
V (3) = I
d
H(t) = V T (t)BB T V (t)
dt
H(3) = 0

(3.35)
(3.36)
(3.37)
(3.38)
(3.39)
(3.40)

qu'on rsoud en cascade comme expliqu la Section 3.4.3. Tout d'abord, on


d
T
remarque que S(t) = 0. L'quation (3.37) se rcrit alors dt V (t) = A V (t),
qu'on peut rsoudre explicitement avec la condition terminale (3.38). Il vient

V (t) = exp (t 3)AT

Ensuite, on intgre numriquement (3.39) ce qui donne

Z
H(t) =

tf

V T ( )BB T V ( )d

pour nalement calculer le contrle optimal

u(t) = B T V (t)H 1 (t)V T (t)x(t) B T (t)V (t)H 1 (t)


La rsolution eective de ces calculs donne les trajectoires de la Figure 3.10.

3.4.4 Rgulateur LQR


On utilise souvent une version plus simple de la commande linaire quadratique que celle que nous venons de prsenter en considrant

tf +.

Le cot minimiser est alors

Z
J=


xT (t)Rx(t) + uT (t)Qu(t) dt

(3.41)

0
o

est une matrice symtrique positive,

est une matrice symtrique

dnie positive et la dynamique que nous considrons est linaire stationnaire

d
x(t) = Ax(t) + Bu
dt

(3.42)

156

CHAPITRE 3.

COMMANDABILIT, STABILISATION

0.5

0. 5

1. 5

0.5

1.5

2.5

Figure 3.10  Trajectographie sous contraintes nales (planication de trajectoire ) avec minimisation quadratique.

o l'tat

nn

et

x Rn , la commande u Rm
n m, respectivement.

et les matrices

et

sont de tailles

La rsolution de ce problme de commande optimale est plus simple. Elle


aboutit un feedback stationnaire qui possde d'intressantes proprits.

Thorme 26

(Rgulateur LQR)

Considrons le problme de minimisa-

tion du cot quadratique (3.41) pour le systme (3.42) sous les hypothses
suivantes :
1.

(A, B)

2.

est symtrique positive

3.

est symtrique dnie positive

est commandable

4. Il existe une racine de


11
pitre 4) .

telle que

(A, R1/2 )

est observable (voir Cha-

La solution ce problme de minimisation est la loi de feedback optimal

u(t) = Q1 B T S 0 x(t)
11. On entend par racine de

R,

note

R1/2

une matrice telle que

Toute matrice hermitienne positive admet une telle factorisation.

R = (R1/2 )T R1/2 .

3.4.

157

COMMANDE LINAIRE QUADRATIQUE LQR

S 0 est l'unique solution symtrique stabilisante (i.e. telle que dtd x = (A


BQ1 B T S 0 )x(t) est asymptotiquement stable) de l' quation de Riccati algo

brique

0 = SA + AT S SBQ1 B T S + R
et la valeur du critre qui lui est associe est

(3.43)

xT (0)S 0 x(0).

Dmonstration. La preuve de ce rsultat s'articule en plusieurs points. La


principale dicult rside dans la preuve de l'existence et de l'unicit d'une
solution symtrique stabilisante l'quation de Riccati algbrique (3.43).

i) Commenons par montrer l'existence d'une telle solution. Considrons


l'quation direntielle de Riccati obtenue partir de (3.25) en inversant le
temps

d
= A + AT BQ1 B T + R
dt
et notons

0 (t)

(3.44)

Comme on l'a vu la Proposition 8, on a alors, quel que soit


xT (t)Rx(t) + uT (t)Qu(t) dt = xT (0)0 (t)x(0)

min
u

0 (0) = 0.
x(0),

la solution correspondant la condition initiale

Cette fonction est croissante en

car

t2 t1


xT (t)Rx(t) + uT (t)Qu(t) dt
Z t1

min
xT (t)Rx(t) + uT (t)Qu(t) dt

min
u

t,

D'autre part, cette fonction est majore. En eet, la paire

(A, B)

tant com-

mandable, il existe, par le Thorme de placement de ples 25 un feedback

u(t) = Kx(t) procurant la convergence exponentielle


d
x = (A BK)x. L'tat, et donc la commande calcuau systme boucl
dt
le par ce feedback, convergent tous deux exponentiellement vers zro. On
linaire stationnaire

en dduit que, pour un certain

>0

correspondant la valeur du critre

obtenue en utilisant ce feedback linaire stationnaire, on a

Z
min
u


xT (t)Rx(t) + uT (t)Qu(t) dt

t 7 xT (0)0 (t)x(0) est croissante et majore donc elle converge


T
limite, ncessairement quadratique, que nous notons x (0) x(0)

La fonction
vers une

158

CHAPITRE 3.

COMMANDABILIT, STABILISATION

symtrique. Quel que soit x(0), on a limt xT (0)0 (t)x(0) =


x (0) x(0). On en dduit limt 0 (t) = . En utilisant l'quation did
rentielle de Riccati (3.44), on en dduit que, lorsque t , dt (t) converge
avec
T

lui aussi, et que sa limite est ncessairement nulle. On en dduit nalement,


que

satisfait l'quation de Riccati algbrique

0 = A + AT BQ1 B T + R
Montrons que

(3.45)

est dnie positive (dans le but de l'utiliser ensuite

pour construire une fonction de Lyapounov). Supposons qu'il existe un


T
non nul tel que x (0) x(0) = 0, alors, quel que soit t 0, on a


xT (t)Rx(t) + uT (t)Qu(t) dt = 0

min
u

Or

est symtrique dnie positive, on en dduit

a alors

x(0)

u=0

et, l'optimum, on

(R1/2 x(t))T R1/2 x(t)dt = 0

0
On a alors ncessairement, que pour tout

t 0, R1/2 x( ) = 0

pour tout
d
x = Ax
dt
car, comme nous venons de le voir, dans ce cas la commande est nulle. On

[0, t].

L'quation direntielle satisfaite pour cet optimum est

en dduit, par drivations successives,

R1/2 x(0) = 0 = R1/2 Ax(0) = R1/2 A2 x(0) = ... = R1/2 An1 x(0)
(A, R1/2 ) est observable (voir le critre de Kalman pour l'observabilit donn au Thorme 28). On en dduit x(0) = 0, d'o la contradiction.
Donc, est symtrique dnie positive.
1 T
Posons Ac = A BQ B la matrice obtenue en fermant la boucle.
Or la paire

On peut dduire de l'quation de Riccati (3.45) l'galit

Ac + ATc = R BQ1 B T
Considrons la fonction (candidate tre de Lyapounov)

V (x) = xT x
Cette fonction continment direntiable est strictement positive, sauf en
o elle est nulle. En drivant par rapport

t,

on obtient


d
V (x) = xT ( Ac + ATc )x = xT R + BQ1 B T x
dt

3.4.

159

COMMANDE LINAIRE QUADRATIQUE LQR

d
V (x) = 0 est donc dni par les quaL'ensemble des points tels que
dt
T
1/2
tions B x = 0 et R
x = 0. L'ensemble invariant contenu dans ce sousensemble est rduit l'espace des

satisfaisant

R1/2 x(0) = 0 = R1/2 Ac x(0) = R1/2 Ax(0) = ... = R1/2 An1 x(0)
Puisque la paire

(A, R1/2 )

est observable, ce sous-ensemble est rduit zro.

Par le Thorme de LaSalle 11, on en dduit la convergence asymptotique


du systme vers zro. La matrice

est donc stabilisante.

ii) Pour prouver l'unicit nous allons utiliser le lemme suivant.

Lemme 2.

L'quation matricielle d'inconnue

XA + BX = C
o

A, B

et

sont des matrices carres de dimensions bien choisies, possde

une unique solution si et seulement si

et

n'ont pas de valeur propre

commune.
On pourra se rfrer [38] pour la dmonstration de ce rsultat.
Considrons donc deux solutions symtriques distinctes

S1 et S2 de l'qua-

tion (3.43) telles que

A1 = A BQ1 B T S1

et

A2 = A BQ1 B T S2

sont toutes deux stables. Calculons alors

(S1 S2 )A1 + AT2 (S1 S2 )


= S1 A S1 BQ1 B T S1 S2 A + S2 BQ1 B T S1
T
+ A BQ1 B T S2 (S1 S2 ) = R + R = 0
en utilisant deux fois l'quation (3.43).
On en dduit l'quation matricielle

(S1 S2 )A1 + AT2 (S1 S2 ) = 0


qui est justement de la forme voque dans le Lemme 2. Or, par hypothse,

A1

et

A2

ne possdent pas de valeur propre commune car

A1

et

A2

sont

stables. On en dduit

S1 = S2
d'o l'unicit.

iii) Calculons enn la valeur obtenue pour la commande optimale. Consi1 T 0

drons la commande optimale candidate

u(t) = Q B S x(t)

et calculons

160

CHAPITRE 3.

la valeur du critre

COMMANDABILIT, STABILISATION

pour une autre commande

v.

Cette commande devant

tre stabilisante, on a

d T 0
(x S x)dt = xT (0)S 0 x(0)
dt

0
Poursuivons,

J = x (0)S x(0) +
0



d T 0
T
T
x (t)Rx(t) + v (t)Qv(t) + (x S x) dt
dt

= xT (0)S 0 x(0)+
Z

xT (R + AT S 0 + S 0 A)x + v T Qv + v T B T S 0 x + xT S 0 Bv dt
0
en utilisant l'quation de Riccati algbrique (3.43)

= xT (0)S 0 x(0)+
Z

xT S 0 BQ1 B T S 0 x + v T Qv + v T B T S 0 x + xT S 0 Bv dt
Z0

T
=
Q1 B T S 0 x + v Q Q1 B T S 0 x + v dt
0
Or

est par hypothse symtrique dnie positive. Donc, l'optimum est

atteint pour la commande optimale

Q1 B T S 0 x
et la valeur de cet optimum est

xT (0)S 0 x(0).

Utilisation pratique de la commande LQR


Si
et

(A, B)

est commandable,

diagonale termes strictement positifs

symtrique positive (par exemple diagonale termes positifs), alors

le thorme est applicable. Les matrices

et

permettent d'exprimer un

arbitrage entre l'importance des erreurs sur l'tat et l'eort sur la commande.
Plus un terme est grand, plus l'erreur s'y rapportant prend d'importance dans
la fonction cot et plus elle a tendance tre rduite par la solution optimale.
En rsolvant l'quation de Riccati, on obtient la loi de commande optimale.

Exemple
22. Considrons le systme dtd x =
R

+
J = 21 0 (ax2
associe est

+ bu2 )dt

a 0, b > 0.
0=

1
x+u et le critre quadratique

L' quation de Riccati algbrique

2
S2
Sa+

3.4.

161

COMMANDE LINAIRE QUADRATIQUE LQR

LQR

Systme

Figure 3.11  Utilisation du rgulateur LQR en boucle ferme.


Elle possde deux solutions

u=

1
2

a
b

x.

S =

b2
2

+ ab.

La commande associe est

La commande optimale correspond

S+ .

Rsolution de l'quation de Riccati algbrique


Lorsqu'on cherche eectivement rsoudre l'quation Riccati algbrique
(3.43) on peut utiliser deux approches. La premire consiste rsoudre l'quation de Riccati direntielle (3.25) en temps rtrograde (i.e. en rajoutant un
signe

devant le second membre) en partant de la condition initiale nulle.

La solution converge pour

t +

vers la solution de l'quation Riccati al-

gbrique (3.43) recherche. Cette mthode est de Kalman. C'est d'ailleurs


l'ide utilise dans la preuve du Thorme 26. Une autre mthode repose sur
la dcomposition de Schur de la matrice recherche (i.e. une dcomposition
sous la forme d'une matrice unitaire et d'une matrice triangulaire suprieure).
C'est ce genre d'approche qui est utilise dans les logiciels de calcul scientique. On pourra se rfrer dirents articles sur le sujet dont [8].

Marges de stabilit du rgulateur LQR


On s'intresse ici aux marges de stabilit, dnies au Chapitre 2, procures
par le rgulateur LQR du Thorme 26.
Utilis en boucle ferme tel que sur la Figure 3.11, on se retrouve tudier
le lieu de Nyquist de la fonction de transfert

1 + Q1 B T S 0 (sI A)1 B

. Ainsi dans les calculs ci-dessous, s = est imaginaire pur et donc s = s.


1 T 0
Notons K = Q B S . D'aprs l'quation de Riccati algbrique (3.43), on a,
en faisant apparatre

(sI A),

0 = S 0 (sI A) (sI + AT )S 0 R + K T QK

162

CHAPITRE 3.

COMMANDABILIT, STABILISATION

d'o

0 = (sI + AT )1 S 0 + S 0 (sI A)1 (sI + AT )1 (K T QK R)(sI A)1


(3.46)
car

((sI A)1 )T = (s I AT )1 = (sI + AT )1

puisque

correspond alors

la transposition hermitienne.
Calculons maintenant

(I + K(sI A)1 B) Q(I + K(sI A)1 B)


= (I + B T (sI AT )1 K T )Q(I + K(sI A)1 B)
qui donne aprs substitution partielle de


= Q + B T (sI + AT )1 S 0 + S 0 (sI A)1 B
B T (sI + AT )1 K T QK(sI A)1 B
et, en utilisant (3.46), il vient

= Q + (sI A)1 B R(sI A)1 B


Nous venons d'tablir dans un cadre gnral multivariable l'quation (dite
de retour et valable uniquement pour

s =

imaginaire)

(I + K(sI A)1 B) Q(I + K(sI A)1 B) = Q + (sI A)1 B R(sI A)1 B


(3.47)
Exprimons la dans le cas mono-entre. Alors,
positif,

est un vecteur ligne,

est un scalaire strictement

est un vecteur colonne. Il vient alors



1 + K(sI A)1 B 2 = 1 + Q
o

est un rel positif ou nul (car

(3.48)

n'est que positive et non pas positive

dnie).
Ceci implique que le lieu de Nyquist du systme est une distance plus
grande que

du point

1.

Ceci procure donc toujours une marge de phase

suprieure 60 degrs, une marge de gain (positive) innie, et une marge de


gain (ngative) d'au moins

Exemple 23.

1/2,

voir Figure 3.12.

d
Considrons le systme dt x


A=

0
1
1 0.3


,

= Ax + Bu o


0.25
B=
1

3.5.

163

COMPLMENTS

Lieu de Nyquist avec LQR

-1
zone d'exclusion

Figure 3.12  Utilisation du LQR en boucle ferme.



Avec les matrices de pondration
rgulateur LQR de gains

[0.8168

Q =
1.4823].

1 0
0 1


,

R = 1,

on obtient le

Le lieu de Nyquist du systme

ainsi boucl est reprsent sur la Figure 3.12. Il entoure

fois le point

dans le sens indirect. C'est le nombre de ples instables de la fonction de


transfert

K(sI A)1 B =

1.687s + 0.385
s2 0.3s + 1

Le rgultateur LQR assure la stabilit. Les marges de stabilit sont visibles


sur la Figure 3.12.

3.5 Complments
3.5.1 Linarisation par bouclage
Equivalence statique
d
x=
dt
commandable sous forme de Brunovsky peut tre prolonge au cas

La relation d'quivalence qui permet de mettre un systme linaire

Ax + Bu

164

CHAPITRE 3.

COMMANDABILIT, STABILISATION

des systmes non linaires de la manire suivante. Au lieu de considrer des


transformations du type

 


x
Mx
7
u
Kx + N u
avec

et

matrices inversibles, considrons des transformations inversibles

plus gnrales et non linaires suivantes

 


x
z = (x)
7
u
v = k(x, u)
o

est un diomorphisme et

bloqu,

u 7 k(x, u) galement. On va
d
x = f (x, u) et leur clasdt

considrer les systmes non linaires de la forme

sication, comme nous l'avons fait pour les systmes linaires, modulo le
groupe de transformations ci-dessus. La relation d'quivalence qui en rsulte
est appele quivalence par bouclage statique rgulier et changement de coordonnes (d'une faon plus abrge quivalence statique ). Dcider si deux
d
x = f (x, u)
systmes avec les mmes nombres d'tats et des commandes,
dt
d
z = g(z, v), (f , g rgulires) sont quivalents, est un problme de goet
dt
mtrie dicile et largement ouvert. En revanche, il existe une caractrisation
explicite des systmes non linaires quivalents aux systmes linaires commandables.

Exemple 24.

Soit le systme de la Figure 3.6. On suppose ici que le ressort

est non linaire. Dans (3.14) la raideur

k0 + a(x1 x2 )2

avec

k0

et

a > 0.

est fonction de

x1 x2

k =

On peut montrer que le systme reste

commandable et calculer sa sortie non linaire de Brunovsky (la sortie plate).

Exemple 25.

Reprenons le systme (3.6) en ne considrant que les deux

quations direntielles relatives

x1

et

(nous ne considrons que la partie

commandable). On peut montrer (formellement) que ce sous-systme deux


tats et une commande est commandable (la quantit

y = x1

joue le rle de

sortie non linaire de Brunovsky (la sortie plate)) et en dduire le bouclage

statique qui linarise le systme.

CNS de linarisation statique


d
x=
dt
sont en gnral non linaires dans les coordonnes de modlisation x

L'intrt pratique est le suivant. Les quations issues de la physique

f (x, u)
et u. La

question  Existe-t-il des coordonnes, z = (x) et v = k(x, u), qui


d
rendent les quations linaires,
z = Az + Bv avec (A, B) commandable ? 
dt
est alors d'importance. En eet, une rponse positive signie que le systme

3.5.

165

COMPLMENTS

est non linaire seulement en apparence : le systme est alors dit linarisable

par bouclage statique . Il sut de changer de repre pour que tout devienne
linaire.
partir de maintenant, nous considrons le systme

d
x = f (x, u),
dt
avec

f (0, 0) = 0.
(x, u) = (0, 0).

rgulire et

l'quilibre

Lemme 3.

x Rn ,

u Rm

Notre point de vue sera local autour de

Les deux propositions suivantes sont quivalentes

1. Le systme tendu

est linarisable par

x = f (x, u)
dt

d u = u
dt
bouclage statique (u
est

(3.49)

ici la commande)

2. Le systme

d
x = f (x, u)
dt

(3.50)

est linarisable par bouclage statique.

x = (z) et u = k(z, v) transforment (3.50) en un systme


d
linaire commandable
z = Az + Bv , alors (x, u) = ((z), k(z, v)) et u =
dt
k
k
(Az + Bv) + v v transforment (3.49) en
z

Dmonstration. Si

d
z = Az + Bv,
dt

d
v = v
dt

(3.51)

systme linaire commandable. Ainsi la seconde proposition implique la premire.


Supposons maintenant la premire proposition vraie. Comme tout sys-

(A, B)
(x, u) =
((z, v), (z, v)) et u = k(z, v, v) qui transforme (3.49) en (3.51) avec dim(z) =
dim(x). Cela veut dire que pour tout (z, v, v)
tme linaire commandable peut s'crire sous la forme (3.51) avec
commandable, (forme de Brunovsky ) il existe une transformation

(z, v)(Az + Bv) +


v = f ((z, v), (z, v)).
z
v
ne dpend pas de v et la transformation
(z, v) transforme (3.50) en dtd z = Az + Bv .

Donc

inversible

x = (z), u =

166

CHAPITRE 3.

COMMANDABILIT, STABILISATION

d
u = u et en prenant comme entre u,
dt
est ane en u, i.e., que le systme admet

Quitte tendre l'tat en posant


on peut toujours supposer que

les quations

d
x = f (x) + u1 g1 (x) + . . . + um gm (x)
dt
f

et les

gi

(3.52)

sont des champs de vecteurs rguliers. Il est alors facile de

x = (z)

et

linaire sont ncessairement anes en

v,

voir que les transformations


inversible pour tout

u = k(z, v) qui rendent le systme


k(x, v) = (x) + (x)v avec

i.e.,

x.

Prenons maintenant un changement rgulier de variables x = (z) d'in = 1 , z = (x). Considrons le systme dni par (3.52) dans le

verse

x.

repre

Dans le repre

gk )

devient

est

z,

on obtient

d
z = (D f + u2 D g1 + . . . + um D gm )x=(z)
(3.53)
dt
 
i
. Ainsi, f (respectivement
la matrice Jacobienne de :
xj
i,j

D f

(respectivement

D gk ).

partir de ces champs de vecteurs dnissant (3.52), on construit, par la


rcurrence suivante, une suite croissante d'espaces vectoriels indexs par

E0 = {g1 , . . . , gm },
o

[f, g]

Ei = {Ei1 , [f, Ei1 ]} i 1

est le crochet de Lie de deux champs de vecteurs

et

et o

{}

signie espace vectoriel engendr par les vecteurs l'intrieur des parenthses.
On rappelle que le crochet de deux champs de vecteurs

(f1 (x), ..., fn (x))

et

(g1 (x), ..., gn (x))

et

dans les coordonnes

comme composantes dans les mmes coordonnes

g , de composantes
(x1 , ..., xn ), admet

n
X
gi
fi
gk
fk
[f, g]i =
x
x
k
k
k=1
Un simple calcul montre que si

z = (x)

est un changement rgulier de

[f, g] dans les coordonnes z


coordonnes x. En d'autres termes

variables on obtient les composantes du crochet


par les mmes formules que dans les

D.[f, g] = [D.f, D.g]


On sait faire du calcul direntiel intrinsque sans passer par un choix particulier de repre. Les

Ek

deviennent, dans les coordonnes

z , D.Ek .

On

appelle ce type d'objet des distributions (rien voir avec les distributions de
L. Schwartz). Ce sont des objets intrinsques car la mthode de construction
de

Ek

ne dpend pas du systme de coordonnes choisi pour faire les calculs.

3.5.

167

COMPLMENTS

Thorme 27. CNS linarisation statique


(0, 0),

Autour de l'quilibre

(x, u) =

le systme (3.52) est linarisable par bouclage statique rgulier si et

seulement si les distributions

Ei , i = 1, . . . , n 1

dnies ci-dessus sont

involutives (stables par le crochet de Lie), de rang constant autour de

En1

et le rang de

vaut

Une distribution

f et g
E(x)) le

n,

la dimension de

x=0

x.

est dite involutive si et seulement si pour tous champs

de vecteurs

dans

vectoriel

crochet

x, f (x) et g(x) appartiennent l'espace


[f, g] reste aussi dans E .

(pour tout

Ei restent inchanges par


u = (x) + (x)v avec (x) inversible. Comme pour un
d
x = Ax + Bu, Ei correspond l'image de
systme linaire commandable
dt
i
(B, AB, . . . , A B), les conditions sur les Ei sont donc ncessaires.
Dmonstration. Il est vident que les distributions
bouclage statique

Leur cot susant repose essentiellement sur le thorme de Frobenius [28].


Ce rsultat classique de gometrie direntielle dit que toute distribution in-

E de rang
w = (w1 , ..., wn ),
volutive

constant

correspond, dans des coordonnes adaptes

m premires compo/wk le champs de vecteurs de composantes


coordonnes w . Alors E = {/w1 , ..., /wm }.
l'espace vectoriel engendr par les

santes. On a l'habitude de noter

(i,k )1in dans les


Si les Ei vrient

les conditions du thorme, alors il existe un systme

de coordonnes locales

(x1 , . . . , xn ) autour de 0 tel





,...,
Ei =
x1
xi

que

Ei . Dans ces coordonnes locales, dtd xi pour i > 0 ne dpend pas de la commande u. Ainsi, en remplaant u par (x)+(x)u avec une
matrice inversible bien choisie, la dynamique (3.52) s'crit ncessairement
o

est le rang de

sous la forme

Un raisonnement

(x1 , . . . , x0 )

car

d
xi = ui , i = 1, . . . , 0
dt
d
xi = fi (x), i = 0 + 1, . . . , n
dt
simple montre que, pour i > 1 , fi

E1

ne dpend pas de

est involutive. Ainsi nous avons la structure suivante

d
xi = ui , i = 1, . . . , 0
dt
d
xi = fi (x1 , . . . , xn ), i = 0 + 1, . . . , 1
dt
d
xi = fi (x0 +1 , . . . , xn ), i = 1 + 1, . . . , n
dt

168

CHAPITRE 3.

De plus, le rang de
Donc

COMMANDABILIT, STABILISATION

(f0 +1 , . . . , f1 )

par rapport

(x1 , . . . , x0 )

vaut

1 0 .

0 1 0 . Quitte faire des permutations sur les 0 premires


x, on peut supposer que (x1 , . . . , x1 0 ) 7 (f0 +1 , . . . , f1 )

composantes de

est inversible. Cela permet de dnir un nouveau systme de coordonnes en


remplaant les

1 0

premires composantes de

x par (f0 +1 , . . . , f1 ). Dans


u 7 (x)u avec

ces nouvelles coordonnes, aprs bouclage statique rgulier

(x) inversible bien choisi, nous obtenons la structure suivante (les notations
avec u, x et f sont conserves)
d
xi = ui , i = 1, . . . , 0
dt
d
xi = xi0 , i = 0 + 1, . . . , 1
dt
d
xi = fi (x0 +1 , . . . , xn ), i = 1 + 1, . . . , n
dt
On sait que ce systme est linarisable si et seulement si le systme rduit

d
xi = xi0 , i = 0 + 1, . . . , 1
dt
d
xi = fi (x0 +1 , . . . , xn ), i = 1 + 1, . . . , n
dt
l'est avec

(x1 , . . . , x1 0 )

comme commande. Comme les distributions

Ei

associes ce systme rduit se dduisent simplement de celles du systme

tendu en liminant les champs de vecteurs


, ...
, on voit qu'elles
x1
x0
vrient, elles aussi, les conditions du thorme. Il est donc possible de rduire
encore le systme. chaque tape, la linarisation du systme tendu est
quivalente celle du systme rduit. Au bout de cette limination (en au plus
de

n1

tapes), la linarisation du systme de dpart est alors quivalente

celle d'un systme rduit de la forme

d
x = f (x, u)
dt
o le rang de

par rapport

est gale la dimension de

x,

linarisation

qui est alors triviale.

Bouclage dynamique
Le Lemme 3 est trompeur. Il semble suggrer que le fait d'tendre un systme en rajoutant des drives de la commande dans l'tat ne rajoute rien

3.5.

169

COMPLMENTS

pour la linarisation. Ceci est vrai si on rajoute le mme nombre d'intgrateurs sur toutes les commandes (c.--d. si on eectue une prolongation totale). Par contre, des nombres dirents peuvent permettre de gagner quelque
chose. Par exemple le systme

x = u1 sin ,

z = u1 cos 1,

= u2

n'est pas linarisable par bouclage statique bien que le systme tendu

x = u1 sin ,
de commande

z = u1 cos 1,

u1 = u1 ,

= u2

(
u1 , u2 ) le soit. Ce fait n'est nullement en contradiction avec le
u1 a t prolonge par des intgrateurs deux

Lemme 3 puisque seule l'entre

fois. Pour un systme une seule commande, on ne gagne videment rien.


Cette remarque est l'origine de la technique de linarisation par boud
clage dynamique . Un systme dt x = f (x, u) est dit linarisable par bouclage
dynamique rgulier si et seulement si il existe un compensateur dynamique
rgulier

d
= a(x, , v),
dt

u = k(x, , v),

tel que le systme boucl

d
x = f (x, k(x, , v)),
dt

d
= a(x, , v)
dt

soit linarisable par bouclage statique rgulier. Noter que la dimension de

est

libre. La dimension de l'espace dans lequel on doit travailler peut a priori tre
arbitrairement grande. Noter galement que les compensateurs dynamiques
qui consistent ne prolonger que les entres, sont des compensateurs particuliers. Ils sont insusants car ils ne permettent pas de linariser certains
systmes comme celui ci

x = u2 cos u1 sin
z = u2 sin + u1 cos g
= u2
On peut montrer que, quel que soit le compensateur dynamique de la forme
( )
( )
u1 1 = u1 , u2 2 = u2 (1 et 2 entiers arbitraires), le systme tendu n'est
pas linarisable par bouclage statique. En revanche, il est linarisable par des
bouclages dynamiques plus gnraux.
Cette question est l'origine des systmes plats , les systmes linarisables
par des bouclages dynamiques dits endognes et auxquels est associe une relation d'quivalence (i.e., une gomtrie). Pour en savoir plus, on se reportera
[55].

170

CHAPITRE 3.

COMMANDABILIT, STABILISATION

3.5.2 Stabilisation par mthode de Lyapounov et backstepping


On a dj dcouvert cette mthode de stabilisation autour d'un point
d'quilibre lors de l'exemple reprsent sur la Figure 3.1. On reprend ici
simplement l'ide de base pour un systme non linaire

12

On part d'un systme dynamique avec un seul contrle

u (pour simplier),

d
x = f (x) + ug(x)
dt
et d'une fonction

V (x)

positive et qui tend l'inni quand

x Rn

tend

vers l'inni en norme. On suppose ici que toutes les fonctions sont drivables
autant de fois que ncessaire.
On suppose de plus que pour u = 0, la drive de V le long des trajectoires
d
x = f (x) est ngative ou nulle. Pour les systmes mcaniques, V est souvent
dt
l'nergie mcanique. Ainsi par hypothse pour tout x on a

V
f (x) 0
x
Avec

u 6= 0,

on a

d
V
V
V =
f (x) + u
g(x)
dt
x
x
K : R 7 R
K() > 0 si < 0

Le feedback est alors construit avec n'importe quelle fonction


assez rgulire qui s'annule en
et

K() < 0

si

uniquement et telle que

>0

u=K


V
g(x)
x

Le principe d'invariance de LaSalle s'applique alors (voir le Thorme 11).


L'ensemble vers lequel convergent les trajectoires du systme en boucle ferme est donn en rsolvant le systme sur-dtermin suivant

d
x = f (x),
dt

V
f (x) = 0,
x

V
g(x) = 0.
x

La mthode consiste driver un certain nombre de fois les deux quations


V
algbriques
f (x) = 0 et V
g(x) = 0 par rapport au temps et remplacer
x
x
d
chaque fois
x
par f (x). La fonction V est souvent appele controlled
dt
Lyapounov function ou CLF.
La mthode dite du  backstepping  rsout le problme suivant. Les donnes sont
12. L'ide s'applique aussi aux systmes de dimension innie, i.e., gouverns par des
quations aux drives partielles avec un contrle sur la frontire.

3.5.

171

COMPLMENTS

 un systme ane en contrle (on suppose toujours, pour simplier l'expos, un seul contrle scalaire)

d
x = f (x) + ug(x)
dt
 une fonction de Lyapounov

pour

u=0

(une CLF donc)

On peut donc utiliser la mthode ci-dessous pour construire le feedback,


not

u = k(x),

qui stabilise le systme. On souhaite en dduire un feedback

stabilisant pour le systme tendu

d
x = f (x) + g(x),
dt
o maintenant le contrle n'est plus
fonction suivante

Ainsi

d
=u
dt

mais sa drive

u.

On considre la

1
W (x, ) = V (x) + ( k(x))2
2

est bien innie l'inni et reste positive. Calculons sa drive par

rapport au temps



V
k
d
W =
(f (x) + g(x)) + p( k(x)) u
(f (x) + g(x))
dt
x
x
d
V = V
(f (x) + k(x)g(x)) est
dt
x
ngative. Cela conduit au rarrangement suivant du second membre
Utilisons le fait qu'avec

= k(x)

la drive



d
V
k
V
W =
(f (x)+k(x)g(x))+(k(x)) u
(f (x) + g(x)) +
g(x)
dt
x
x
x
Il sut, avec

paramtre positif, de poser

u=

k
V
(f (x) + g(x))
g(x) p( k(x))
x
x

pour avoir

V
d
W =
(f (x) + k(x)g(x)) p( k(x))2 0
dt
x
On conclut l'analyse toujours par l'invariance de LaSalle. Pour un expos
dtaill des possibilits de ces mthodes nous renvoyons le lecteur intress
[63].

Chapitre 4
Observabilit, estimation et
adaptation

Dans le chapitre prcdent, nous avons vu comment stabiliser un systme


par retour d'tat (feedback). La ralisation pratique de tels bouclages ncessite la connaissance chaque instant de l'tat

x.

Or, il est frquent que

seule une partie de l'tat soit directement mesure. On est alors confront
au problme suivant. Connaissant les quations du systme (i.e., ayant un
d
x = f (x, u), les relations entre les mesures y et l'tat, y = h(x),
modle),
dt
les entres t 7 u(t) et les mesures t 7 y(t) , il nous faut estimer x. Cela
revient rsoudre le problme suivant

d
x = f (x, u),
dt
o

y = h(x)

est l'inconnue (une fonction du temps) et o

et

sont des fonctions

connues du temps. Il est clair que ce problme est sur-dtermin. L'unicit de


la solution correspond la proprit d'observabilit que nous allons dnir.
L'existence d'une solution provient du fait que

et

u ne peuvent pas tre des

fonctions du temps indpendantes l'une de l'autre. Elles doivent vrier des


relations de compatibilit qui prennent la forme d'quations direntielles (le
modle).
Ce chapitre aborde ces questions. Tout d'abord nous donnons, dans un
cadre gnral, les dnitions et les critres assurant l'existence et l'unicit
de la solution. Pour les systmes linaires nous prsentons une mthode trs
conome en calculs pour obtenir

avec un observateur asymptotique. Nous

montrons aussi comment paramtrer de faon optimale un tel observateur


asymptotique grce au ltre de Kalman . Le couplage avec la loi de feedback est alors simple : il sut de remplacer dans les formules donnant la loi
de rtro-action les valeurs de l'tat par leur estimes. On montre alors que

173

174 CHAPITRE 4.

OBSERVABILIT, ESTIMATION ET ADAPTATION

le contrleur ainsi obtenu, celui qui part des sorties, estime l'tat et utilise
cette estimation pour calculer le contrle (observateur contrleur, commande
modale, bouclage dynamique de sortie), permet de stabiliser asymptotiquement tout systme linaire coecients constants commandable et observable (c'est le principe de sparation ). Enn, nous proposons quelques extensions aux cas non linaires avec la synthse d'observateurs asymptotiques
via l'injection de sortie et la notion de contraction.

4.1 Un exemple
Cet exemple est reprsentatif de ce que, dans certains domaines industriels, les ingnieurs appellent les capteurs logiciels . Il s'agit, pour un moteur
lectrique, d'estimer la vitesse de rotation et son couple de charge via les
signaux de courants (mesure) et de tension (contrle). Il est possible d'obtenir des estimations de ces deux variables mcaniques, coteuses mesurer,
en partant des variables lectriques, qui sont simples et faciles mesurer.
Pour simplier, nous traitons ici le cas des moteurs courant continu. Pour
les moteurs induction, le mme problme se pose mais il est nettement
plus complexe, non compltement rsolu et fait encore l'objet de travaux de

recherches et de dveloppement .
Les capteurs logiciels sont des outils de traitement en temps-rel de l'information. Ils fournissent (idalement) des informations non bruites sur des
grandeurs mesures ou non. Sur l'exemple choisi ici, il s'agit, partir de la
mesure des tensions et des courants qui traversent le moteur, d'estimer de
faon causale sa vitesse mcanique et son couple de charge. L'intrt pratique est vident : les informations lectriques sont toujours disponibles car
les capteurs sont simples et ables. Au contraire, les informations mcaniques
ncessitent une instrumentation complexe, chre et peu able. On cherche
s'en passer. Pour des raisons de cot mais aussi de scurit, dduire des courants et tensions, la vitesse de rotation est un enjeu technologique important
en lectro-technique.
Dans d'autres domaines, on rencontre des problmes trs similaires. Pour
les procds, les dbits, tempratures et pressions sont faciles avoir par des
capteurs simples et robustes alors que les compositions sont plus diciles
mesurer (temps de retard de l'analyse, ...). Un traitement de l'information contenue dans les signaux de tempratures, pressions et dbits permet
souvent d'obtenir des estimations prcieuses sur les compositions. Un autre
exemple intressant (galement voqu dans l'Exemple 28) est l'estimation
1. Le systme est inobservable au premier ordre et trs sensible aux paramtres basse
vitesse.

4.1.

175

UN EXEMPLE

de l'orientation relative d'un mobile par rapport un rfrentiel terrestre les


mesures sont de deux types : les gyromtres donnent de faon prcise et rapide les vitesses angulaires ; le GPS ou les images issues camra embarques
donnent des informations basse frquence sur les positions et orientations.
On peut dduire grce aux relations cinmatiques, une estimation robuste de
l'orientation du mobile (ses trois angles d'Euler, i.e., une matrice de rotation),
de sa vitesse et de sa position. Ce problme est central dans les techniques
de guidage de missiles et de drones.
L'exemple du moteur courant continu que nous prsentons en dtails
illustre la notion d'observabilit (voir la Dnition 14), la technique des ob-

servateurs asymptotiques (voir la Section 4.3.2), et l'observateur-contrleur


(voir la Section 4.4).

4.1.1 Un modle simple de moteur courant continu


Un premier modle de moteur courant continu est le suivant

J dtd = k p
L dtd = k R + u
o

self,

est la vitesse de rotation du moteur,

R>0

la rsistance,

L>0

la

le couple de charge et

le courant,

la constante de couple,

la tension,

l'inertie de la partie tournante (moteur + charge).

J > 0, k > 0, L > 0 et R > 0 connus et


l'intensit est mesure. La charge p est une

Nous supposons les paramtres


constants. En revanche, seule

constante inconnue. Il nous faut concevoir un algorithme qui ajuste en temps


rel la tension

u de faon suivre une vitesse de rfrence r (t) variable dans

le temps. Pour cela nous ne disposons que d'un capteur de courant.

4.1.2 Estimation de la vitesse et de la charge


Comme

est un paramtre constant,

d
p
dt

=0

et on peut l'inclure dans

les variables d'tat. On a alors le systme

d
p
dt
d
J dt
L dtd

= 0
= k p
= k R + u

u et comme sortie y = . +tudier l'observabilit de ce


systme revient se poser la question suivante : connaissant t 7 ((t), u(t))
et les quations du systme, est-il possible de calculer et p ? La rponse est
avec comme commande

176 CHAPITRE 4.

OBSERVABILIT, ESTIMATION ET ADAPTATION

positive et immdiate car

d
= (u L R)/k,
dt

p = k (J/k)

d
d2
d
u L 2 R
dt
dt
dt

Le systme est donc observable. On pourrait aussi reprendre le critre de


Kalman (Thorme 28). Dans l'esprit, il est issu du mme calcul.
Cependant les mesures de courant sont bruites. Il est donc hors de question de driver ce signal. Le fait d'tre en thorie observable ne donne pas un
algorithme d'estimation raliste. Il nous faut concevoir un algorithme qui soit
insensible au bruit, i.e., qui les ltre sans introduire de dphasage comme le
ferait un simple ltre passe-bas. Ici apparat une ide centrale : l'observateur

asymptotique . Cette ide consiste copier la dynamique du systme en lui


rajoutant des termes correctifs lis l'erreur entre la prdiction et la mesure.
Cela donne ici l'observateur suivant

d
p
dt
d
J dt

L dtd

= Lp ( )
= k p L ( )
= k
R + u L ( )

Il est d'usage de rajouter un   sur les estimes. On parle souvent pour


le paramtre

d'identication ,

d'estimation ou de ltrage ,

et

tant la valeur identie et pour

et

tant les valeurs estimes et ltres (c'est

dire dbarrasses des bruits hautes frquences). En choisissant correctement


les gains

Lp , L

et

les carts entre les estimes et les vraies valeurs tendent

vers zro. En eet la dynamique des erreurs


s'crit

d
e
dt p
d
J dt e
L dtd e

ep = pp, e =
et e =

= Lp e
= ep (k L )e
= (L + R)e ke

Il s'agit d'un systme linaire stationnaire dont les valeurs propres sont les
racines du polynme en

de degr

suivant

L + R 2 k(k L )
Lp k
s +
s+
L
LJ
LJ
jouant sur les Lp , L et L , on peut
s3 +

+tant donn qu'en

donner n'importe

quelles valeurs aux fonctions symtriques des racines, il est possible de les
choisir comme l'on veut. Si

Lp , L

et

vrient

L + R
= r1 + r2 + r3
L
k(k L )
= r1 r2 + r1 r3 + r2 r3
LJ
Lp k

= r1 r2 r3
LJ

4.1.

177

UN EXEMPLE

alors les racines seront

r1 , r2

et

r3 .

On peut choisir pour les ples d'obser-

vation (on le verra en dtail dans le Thorme 29 de placement des ples de

l'observateur ) les valeurs suivantes

R
r1 = (1 + 1),
L

R
r2 = (1 1),
L

r
r3 =

k2
LJ

Ce choix correspond aux chelles de temps caractristiques du systme en


boucle ouverte.

p,
et ainsi
horaire t 7 u(t).

Les valeurs
soit la loi

calcules convergent vers

p,

et

quelle que

4.1.3 Prise en compte des chelles de temps


Supposons, et c'est souvent le cas, que la dynamique lectrique est nettement plus rapide que la dynamique mcanique. Cela revient dire que la self

est trs petite, positive mais mal connue. Ainsi, tout ce que l'on sait c'est

que

L o est un petit paramtre positif. Il est alors facile de voir que les

rsultats thoriques sur les perturbations singulires (voir Section 1.4.1) s'appliquent ici : le systme reste stable en boucle ouverte avec une dynamique
du courant convergeant immdiatement vers son rgime quasi-statique

= (u k)/R
La dynamique lente de la vitesse tant alors

d
= (k 2 /R) + (k/R)u p.
dt

Il sut de remarquer que, puisque

= (uR)/k , la vitesse est indirectement

connue en combinant la tension et la mesure de courant.


L'observateur asymptotique aura alors la forme plus simple suivante

d
p
dt
d

J dt
o la mesure

= Lp (
z(t))
2
= (k /R)
+ (k/R)u p L (
z(t))

z(t) = (u(t) R(t))/k

correspond la vitesse

proximation quasi-statique pour le courant. Les gains

Lp

,
et

(4.1)

suite l'ap-

doivent

tre choisis positifs pour garantir la stabilit et pas trop grands cause de
l'approximation quasi-statique sur le courant.
Le suivi de la rfrence en vitesse
feedback

t 7 r (t)

sera alors assur par le

solution de

(k 2 /R) + (k/R)u p = J(

d
r ( r )/ )
dt

178 CHAPITRE 4.

OBSERVABILIT, ESTIMATION ET ADAPTATION

si on avait directement accs


de suivi.

et

p.

>0

Ici

est la constante de temps

ne doit pas tre trop petit toujours cause de l'approximation

quasi-statique sur le courant. Il est alors naturel de remplacer


estimes pour calculer

et

p par leur

(k 2 /R)
+ (k/R)u p = J(

d
r (
r )/ )
dt

Nous avons obtenu le bouclage dynamique de sortie


une rfrence continment drivable en
forme par l'observateur de

et

y = avec yr = r (t)

(la partie dynamique tant alors

p)

d
p
dt
d

J dt

= Lp (
z(t))
2
= (k /R)
+ (k/R)u(t) p L (
z(t))
z(t) = (u(t) Ry(t))/k



u(t) = k
+ Rk p + J

d
y (t)
dt r

yr (t)

4.1.4 Contraintes sur les courants


Il est important pour des raisons de scurit de garantir un courant

born. Ainsi nous avons comme contrainte

|| max
o max

>0

est le courant maximum support par le variateur et le moteur.

Les algorithmes prcdents ne garantissent pas le respect de cette contrainte


d'tat. Nanmoins, il est possible de prendre en compte cette contrainte en
ne modiant que le contrleur de la section prcdente sans toucher l'observateur. On considre donc un premier bouclage grand gain en courant :

1
u = R k
+ ( )

est

une rfrence de courant et

tel que

R  1.

Un tel bouclage rend

la dynamique du courant stable et bien plus rapide que celle de la vitesse. On


pourra remarquer que, mme si

L est petit, ce bouclage ne fait que renforcer

la rapidit du courant sans le dstabiliser. En eet on a

L
et donc

est

d
= ke (R + 1/)( )
dt

une trs bonne approximation. La dynamique de la vitesse

se rduit

d
= ki p
dt

4.2.

179

OBSERVABILIT NON LINAIRE

Une justication mathmatique de cette rduction relve encore de la thorie


des perturbations singulires.
La rfrence de courant peut alors tre calcule ainsi

J r J(
r )/ + p
k

> 0 est un temps nettement suprieur l'chelle de temps de la dynamique


du courant, i.e.,  L/(R + 1/) avec
et p solution de (4.1).
Si la rfrence de courant
ainsi calcule ne vrie pas la contrainte, alors
il sut de la saturer en valeur absolue max en prservant son signe. Il est
o

possible de voir qu'une telle saturation ne peut pas dstabiliser la vitesse.


Elle assure de fait le suivi au mieux de la rfrence

r .

4.2 Observabilit non linaire


Considrons les systmes non linaires de la forme

d x = f (x, u)
dt

y = h(x)
avec

x Rn , u Rm

et

y Rp ,

les fonctions

(4.2)

et

tant rgulires.

4.2.1 Dnition
Pour dnir l'observabilit, il convient d'abord de dnir la notion de
distinguabilit.

Dnition 14 (Distinguabilit).
distinguables (nots

xI x
e)

Deux tats initiaux

si pour tout

identiques pour toute entre

u(t)

t 0,
2

les sorties

x
e
y(t)

et

sont dits inet

ye(t)

sont

admissible . Ils sont dits distinguables si-

non.
L'indistinguabilit est une relation d'quivalence. Notons
d'quivalence de

x.

I(x)

la classe

L'observabilit est alors dnie de la manire suivante

Dnition 15 (Observabilit globale). Le systme (4.2) est dit observable


en

x
2.

si

I(x) = {x}

y(t) (resp. ye(t))


x (resp. x
e).

initiale

et il est observable si

I(x) = {x}

pour tout

correspond la sortie de (4.2) avec l'entre

u(t)

x.
et la condition

180 CHAPITRE 4.

OBSERVABILIT, ESTIMATION ET ADAPTATION

En fait, le systme est observable si pour tous les tats initiaux


il existe une entre admissible

y(t) 6= ye(t)

qui distingue

pour au moins un temps

t 0.

et

x
e,

et

x
e,

c'est dire telle que

Il peut exister des entres qui ne distinguent pas certains points. Cepen-

dant, le systme peut tre malgr tout observable. Par exemple

est observable (pour


tingue pas les points

d
x
dt 1
d
x
dt 2

= ux2
= 0
y = x1

u = 1 par exemple). Cependant l'entre u = 0 ne disx et x tels que x1 = x1 et x2 6= x2 . Notons que l'observa-

bilit ne signie pas que toute entre distingue tous les tats. L'observabilit
est un concept global. Il peut tre ncessaire d'aller trs loin dans le temps
et dans l'espace d'tat pour distinguer deux tats initiaux. Pour cela nous
introduisons le concept plus fort qui suit.

Dnition 16 (Observabilit locale en temps et en espace).


de (4.2) est localement observable, si pour tout

>0

L'tat

et pour tout voisinage

U de x, il existe > 0 plus petit que et un voisinage V de x contenu dans


U , tel que pour tout x
e V , il existe une entre [0, ] 3 t 7 u(t) qui distingue
x et x
e, i.e. telle que y() 6= ye(). Le systme (4.2) est localement observable
s'il l'est pour tout x.
Intuitivement, le systme (4.2) est localement observable si on peut instantanment distinguer chaque tat de ses voisins en choisissant judicieusement l'entre

u.

4.2.2 Critre
La seule faon eective de tester l'observabilit d'un systme est de consi-

y et ses drives en temps. Nous supposerons dans cette section que y et u sont des fonctions rgulires du temps.
d
u, . . .)
Nous supposerons galement que les rangs en x des fonctions de (x, u,
dt
drer l'application qui

associe

qui apparaissent ci-dessous sont constants.


Considrons donc (4.2). On note

h0 (x) := h(x). En drivant y par rapport

au temps on a

d
d
y = Dx h(x) x = Dx h(x) f (x, u) := h1 (x, u)
dt
dt
Des drivations successives conduisent donc une suite de fonctions

hk (x, u, . . . , u(k1) )

4.2.

181

OBSERVABILIT NON LINAIRE

dnie par la rcurrence

hk+1 =
Si pour un certain

k,

d
(hk ),
dt

le rang en

h0 (x) = h(x)

du systme

h0 (x) = y
d
h1 (x, u) = y
dt
.
.
.

hk (x, u, . . . , u(k1) ) = y (k)

n = dim(x) alors le systme est localement observable . Il sut d'utiliser


(k)
le thorme d'inversion locale pour calculer x en fonction de (y, . . . , y
)
(k1)
et (u, . . . , u
). Si partir d'un certain k , hk+1 ne fait plus apparatre de
0
nouvelle relation en x, i.e., si le rang en x de (h0 , . . . , hk ) est identique celui
0
de (h0 , . . . , hk , hk+1 ) , alors il en est de mme pour k + 2, k + 3, . . . Ainsi, il
n'est pas ncessaire de driver plus de n 1 fois y pour savoir si un systme
vaut

est localement observable ou non. Ce raisonnement est valable autour d'un


tat gnrique, nous ne traitons pas les singularits qui peuvent apparatre
en des tats et entres particulires. Nous renvoyons [27] pour les cas plus
gnraux avec singularits.
Ce calcul lmentaire montre aussi que

y et u sont relis par des quations

direntielles. Elles correspondent aux relations de compatibilit associes au


systme sur-dtermin (4.2) o l'inconnue est

et les donnes sont

On obtient toutes les relations possibles en liminant

et

y.

du systme

h0 (x) = y
d
h1 (x, u) = y
dt
.
.
.

hn (x, u, . . . , u(n1) ) = y (n)

On peut montrer que pour un systme localement observable,

et

sont

p = dim(y) quations direntielles indpendantes. Ces quations


intervenir y driv au plus n fois et u driv au plus n 1 fois.

relis par
font

La mise en forme des ides prcdentes est assez fastidieuse mais nanmoins instructive. Nous nous contenterons de retenir qu'en gnral l'observabilit signie que l'tat peut tre exprim en fonction des sorties, des entres

y et u sont
n 1 en u.

et d'un nombre ni de leur drives en temps. Dans ce cas,


par

quations direntielles d'ordre au plus

en

et

relis

182 CHAPITRE 4.

OBSERVABILIT, ESTIMATION ET ADAPTATION

Exemple 26. Pour conclure, reprenons l'exemple du racteur chimique (3.6)


an d'illustrer l'analyse formelle prcdente. Nous ne considrons que x1 et
T car l'invariant chimique x1 +x2 est suppos gal xin
1 . Nous supposons que
la temprature T est mesure (thermo-couple) mais pas la concentration x1 .
Nous avons donc rsoudre le systme sur-dtermin (les quantits autres
que

(x1 , u, y, T )

sont des constantes connues)

d
x
dt 1
d
T
dt

= D(xin
1 x1 ) k0 exp(E/RT )x1
= D(T in T ) + H exp(E/RT )x1 + u
y(t) = T

On a facilement

x1

en fonction de

x1 =

d
dt

et

d
y
dt

D(T in y) u
H exp(E/Ry)

Le systme est donc observable.


tielle du second ordre en
d
l'quation donnant dt x1

(y, dtd y)

et

sont relis par une quation diren-

et du premier ordre en

d
dt y

D(T in y) u
H exp(E/Ry)

(4.3)

u.

On l'obtient en utilisant

d
dt y

D(T in y) u
= Dxin

(D
+
k
exp(E/Ry))
0
1
H exp(E/Ry)
Il s'agit d'une condition de compatibilit entre

et

u.

(4.4)

Si elle n'est pas sa-

tisfaite alors le systme sur-dtermin de dpart n'admet pas de solution. On


conoit trs bien que ces relations de compatibilit sont la base du diagnostic
et de la dtection de panne.

4.2.3 Observateur, estimation, moindres carrs


Savoir que le systme est observable est bien. Calculer

x partir de y

et

est encore mieux. Cependant, la dmarche formelle prcdente ne rpond en


pratique qu' la premire question. En eet, avoir

en fonction de drives

des mesures s'avre d'une utilit fort limite ds que l'ordre de drivation

2 et/ou ds que les signaux sont bruits. Il convient en fait de calculer


fonction d'intgrales de y et u. Dans ce cas, le bruit sur les signaux

dpasse

en

est beaucoup moins gnant. La synthse d'observateur pose des problmes


supplmentaires (et nettement plus diciles en fait) que la caractrisation
des systmes observables.

4.2.

183

OBSERVABILIT NON LINAIRE

Revenons (4.2). Nous avons un nombre inni d'quations en trop. En


eet, puisque l'entre u est connue, l'tat x est entirement donn par sa
d
0
u
condition initiale x grce au ot t de
x = f (x, u(t)) : ut (x0 ) est la
dt
d
solution de
x = f (x, u(t)) qui dmarre en x0 t = 0. Ainsi x0 vrie
dt
chaque instant t, p quations, p tant donc le nombre de mesures

y(t) = h(ut (x0 ))


Il est trs tentant de rsoudre ce systme par les moindres carrs, mme si,
pour un systme non-linaire cela n'a pas beaucoup de sens. Considrons
0
un intervalle d'observation [0, T ]. x peut tre calcul comme l'argument du
minimum de

Z
J() =

(y(t) h(ut (x0 )))2 dt

est ainsi obtenu comme on obtient un paramtre partir de donnes

exprimentales et d'un modle o ce paramtre intervient : en minimisant


l'erreur quadratique entre l'observation y(t) et la valeur prdite par le modle
ut (x0 ). Les problmes d'observateurs sont fondamentalement proches des
problmes d'estimation pour lesquels l'optimisation joue un rle important.
Cependant, les dicults ne sont pas pour autant aplanies : la rsolution de
d
x = f (x, u) ne peut se faire que numriquement en
l'quation direntielle
dt
gnral ; la fonction J n'a aucune raison d'avoir les proprits de convexit qui
assurent la convergence des principaux algorithmes d'optimisation (voir par
exemple [61]). La synthse d'observateurs reste donc une question dicile en
gnral bien que trs importante en pratique. Noter enn que l'identication
d
x = f (x, u, ) en est un sous-problme :
de paramtres sur un modle
dt
l'identiabilit correspond alors l'observabilit du systme tendu

d
= 0,
dt

d
x = f (x, u, ),
dt
d'tat

(x, )

et de sortie

Dans le cas linaire,


0
ane en x

ut (x0 )

y = x.
f = Ax + Bu

et

y=x

h = Cx, ut (x0 )

est une fonction

exp((t s)A)Bu(s) ds

= exp(tA)x +
0

partir d'un intervalle d'observations

[0, T ], x0

peut tre calcul comme

l'argument du minimum de

Z
J() =
0

(z(t) C exp(tA)x0 )2 dt

(4.5)

184 CHAPITRE 4.

OBSERVABILIT, ESTIMATION ET ADAPTATION

z(t) = y(t) C

Rt

exp((t s)A)Bu(s) ds. Dans ces conditions J est


0
quadratique. On est en train de retrouver, dans un cadre dterministe pour

les moindres carrs, le ltre de Kalman trait dans la Section 4.5. Nous
allons maintenant aborder l'observabilit des systmes linaires avec un point
de vue moins classique qui met l'accent sur les observateurs asymptotiques.
Ces derniers fournissent, avec des calculs trs conomiques, directement
ut (x0 ) en fonction de y , u et leurs intgrales.

x=

4.3 Observabilit linaire


On considre ici le systme, d'entre

u,

d'tat

d
x = Ax + Bu,
dt
o

est une matrice

n n, B

une matrice

et de sortie

suivant

y = Cx
nm

(4.6)

et

une matrice

p n.

4.3.1 Le critre de Kalman


Thorme 28
y = Cx

d
Le systme (4.6) dt x = Ax + Bu,
est observable au sens de la Dnition 16 si et seulement si le rang
(Critre de Kalman)

de la matrice d'observabilit

O=

C
CA
..
.
n1

CA
est gal

n = dim(x).

Pour abrger, on dit souvent que la paire


rang de la matrice d'observabilit

(A, C)

est observable lorsque le

est maximum. On notera la dualit avec

le critre de commandabilit du Thorme 23.

Dmonstration. Drivons
rivation donne

Donc

et d'utilisons l'quation d'tat. Une premire d-

d
d
y = C x = CAx + CBu.
dt
dt

est ncessairement solution du systme (les fonctions

connues)

Cx = y
CAx = dtd y CBu.

et

sont

4.3.

185

OBSERVABILIT LINAIRE

ce niveau, tout se passe comme si la quantit

y1 =

nouvelle sortie. En la drivant de nouveau, nous avons


Maintenant,

d
y
dt

CBu tait une


CA x = y 1 CABu.
2

est ncessairement solution du systme tendu

Cx = y0 = y
CAx = y1 = dtd y CBu
CA2 x = y2 = y 1 CABu.
Il est alors facile de voir que, ainsi de suite,

x est ncessairement solution des

quations

CAk x = yk
yk sont
y0 = y .

o les quantits connues

CAk1 Bu

pour

k1

et

(4.7)

dnies par la rcurrence

yk =

d
y
dt k1

Si le rang de la matrice d'observabilit est maximum et gal


admet un inverse gauche (non ncessairement unique),
vriant

matrice

n, elle
n pn

C
CA

= 1n

.
.
.
n1

CA
Ainsi,

y0
.
.
.

x=P

yn1
La condition de rang est donc susante.
Supposons maintenant que la matrice d'observabilit, de taille
soit de rang

r < n.

pn n,

Nous allons montrer qu'il existe, au moins, deux trajec-

toires direntes avec les mmes commandes, donnant la mme sortie. Cela
montrera que la condition est aussi ncessaire.
n
Soit w R un lment non nul du noyau de la matrice d'observabik
lit. Pour k = 0, . . . , n 1, CA w = 0. Par un raisonnement identique
celui fait lors de la preuve de la Proposition 6 avec les noyaux gauche
k
k
de A B , on a ncessairement CA w = 0, pour toute k n. Donc, w est
k
dans le noyau de toutes les matrices CA . Prenons comme premire trajectoire

[0, T ] 3 t 7 (x, u) = 0.

Il vient,

y = 0.

Prenons maintenant

comme seconde trajectoire, celle qui, commande nulle, dmarre en

[0, T ] 3 t 7 (x, u) = (exp(tA)w, 0).

Sa sortie vaut

C exp(tA)w =

+ i
X
t
i=0

i!

CAi w = 0

186 CHAPITRE 4.

OBSERVABILIT, ESTIMATION ET ADAPTATION

car chaque terme de la srie est nul. Ceci conclut la preuve.

4.3.2 Observateurs asymptotiques


Comme on l'a dj dit, il est classique de noter par
la quantit

x(t).

x(t) une estimation de

Nous cherchons ici obtenir une estimation de l'tat sans

utiliser les drives de

et

u.

La premire ide qui vient l'esprit est de

copier la dynamique du systme. On intgre directement

d
x = A
x + Bu
dt
partir d'une condition initiale x0 et des valeurs connues du contrle u
chaque instant. Si la matrice A est stable, alors x
peut tre pris comme
estimation de x car l'erreur ex = x
x tend naturellement vers 0 puisque
d
e = Aex .
dt x
Si A est instable cette mthode ne marchera pas. En eet, une petite erreur initiale ex (0) sera amplie exponentiellement. Intuitivement, si l'erreur
x x devient grande alors, le systme tant observable, l'erreur sur les sorties
y y deviendra grande galement 3 . Comme y est connue, il est alors tentant
d
x = A
x + Bu par l'ajout d'un terme du type L(
y y) qu'on
de modier
dt
connat et qui correspond l'erreur d'observation. Le problme suivant se
pose : peut-on choisir la matrice

converge vers
la matrice

L de faon ce que la solution x du systme

d
x = A
x + Bu(t) L(
y y(t)), y = C x
dt
x ? Puisque y = Cx, la question se pose ainsi :

peut-on ajuster

de faon obtenir une quation direntielle d'erreur stable

d
ex = (A LC)ex ?
dt
Soyons plus exigeants encore, par un choix judicieux de

ALC

L, peut-on imposer

d'avoir toutes ses valeurs propres partie relle strictement ngative ?

Or, les valeurs propres restent inchanges par la transposition : A LC


0
0 0
admet le mme spectre que A C L . De plus la paire (A, C) est observable si,
0
0
et seulement si, la paire (A , C ) est commandable (comme on l'a dj voqu,
on obtient le critre de Kalman de commandabilit en transposant celui de
l'observabilit). Ainsi le thorme 25 se transpose de la manire suivante.

Thorme 29

est observable, il existe

L,

matrice

n p,

telle que le spectre de

le mme que celui de n'importe quelle matrice relle


3. On a not

(A, C)
A LC soit

(Placement de ples. Observateur asymptotique)

y = C x
.

nn

Si

librement choisie.

4.4.

187

OBSERVATEUR-CONTRLEUR

4.3.3 Observateurs rduits de Luenberger


Supposons que

soit de rang maximum

p = dim(y) et que la paire (A, C)

soit observable. On peut toujours supposer, quitte faire un changement de


correspond aux p premires composantes de l'tat x :
(y, xr ). L'quation d'tat dtd x = Ax + Bu s'crit alors sous forme blocs

variable sur

x=

x,

que

d
y
dt
d
x
dt r

= Ayy y + Ayr xr + By u
= Ary y + Arr xr + Br u

Il est facile de montrer, en revenant, par exemple la dnition de l'observa-

(A, C) est observable si, et seulement si, (Arr , Ayr ) l'est : en eet
d
y Ayy y By u, qui
connatre y et u implique la connaissance de Ayr xr =
dt
d
peut tre vue comme une sortie du systme
x
=
A
x
rr r + (Br u + Ary y).
dt r
En ajustant correctement la matrice des gains d'observation Lr , le spectre
de Arr Lr Ayr concide avec celui de n'importe quelle matrice relle carre
d'ordre n p = dim(xr ). Considrons alors la variable = xr Lr y au lieu
de xr . Un simple calcul montre que
bilit, que

d
= (Arr Lr Ayr ) + (Ary Lr Ayy (Arr Lr Ayr )Lr )y + (Br Lr By )u
dt
Ainsi en choisissant Lr , de faon avoir Arr Lr Ayr stable, nous obtenons
un observateur d'ordre rduit n p pour (donc pour xr = + Lr y ) en
recopiant cette quation direntielle

d
= (Arr Lr Ayr )+(Ary Lr Ayy (Arr Lr Ayr )Lr )y(t)+(Br Lr By )u(t)
dt
La dynamique de l'erreur sur , e = vrie l'quation autonome stable
d
e = (Arr Lr Ayr )e .
dt
Cet observateur rduit est intressant lorsque np est petit, typiquement
n p = 1, 2 : la stabilit d'un systme de dimension 1 ou 2 est en outre trs
simple tudier.

4.4 Observateur-contrleur
4.4.1 Version tat multi-entre multi-sortie (MIMO)

En regroupant les rsultats sur la commandabilit et l'observabilit linaires, nous savons comment rsoudre de faon robuste par rapport de
4. MIMO : pour Multi-Input Multi-Output

188 CHAPITRE 4.

OBSERVABILIT, ESTIMATION ET ADAPTATION

petites erreurs de modle et de mesures, le problme suivant : amener,


l'aide de la commande

en ne mesurant que

u, l'tat x du
y sachant que

systme de p q pendant le temps


d
:
x = Ax + Bu, y = Cx, (A, B)
dt

(A, C) observable.
comme (A, B) est commandable,

commandable et
En eet,

nous savons avec la forme de

Brunovsky construire explicitement une trajectoire de rfrence

(xr (t), ur (t))

pour aller de

q.

[0, T ] 3 t 7

Le respect de certaines contraintes peut-

tre important ce niveau et tre un guide dans le choix de cette trajectoire


de rfrence (et intervenir dans la dnition du critre pour la commande
optimale).
Toujours cause de la commandabilit, nous savons construire un bouclage statique sur

x, Kx,

de faon ce que la matrice

(placement de ple). La matrice

A BK

soit stable

est souvent appele matrice des gains de

la commande.
Grce l'observabilit, nous savons construire un observateur asymptotique sur

en choisissant les gains d'observation

de faon avoir

A LC

stable.
Alors le bouclage dynamique de sortie

u(t) = ur (t) K(
x xr (t)) contrleur
d
x = A
x + Bu(t) L(C x y(t)) observateur
dt
assure le suivi asymptotique de la trajectoire de rfrence

[0, T ] 3 t 7

(xr (t), ur (t)). Avec ce bouclage, appel commande modale ou encore observa
teur-contrleur, les petites erreurs de conditions initiales sont amorties lorsque

crot et les petites erreurs de modle et de mesures ne sont pas amplies

au cours du temps.
En eet, comme

d
x
dt

= Ax + Bu

et

y = Cx,

on a pour la dynamique du

systme boucl

d
x
dt
d
x
dt

= Ax + B(ur (t) K(
x xr (t)))
= A
x + B(ur (t) K(
x xr (t))) L(C x Cx)

o l'tat est maintenant (x, x


). Comme (xr , ur ) est une trajectoire du systme,
d
x
=
Ax
+
Bu
,
on
a
en
prenant comme variables d'tat (x = x
r
r
dt r
xr (t), ex = x x) au lieu de (x, x), la forme triangulaire suivante :

d
(x) = (A BK) x BK ex
dt
d
ex = (A LC) ex
dt
Ce qui montre que ex et x tendent vers 0 exponentiellement en temps. Le
spectre du systme d'tat (x, ex ) se compose du spectre de A LC et de
celui de A BK . C'est le principe de sparation .

4.4.

189

OBSERVATEUR-CONTRLEUR

4.4.2 Version transfert mono-entre mono-sortie (SISO)

1
Figure 4.1  Le transfert en boucle ferme, e = yc y = 1+GK
yc .
Dans le cas mono-variable o

et

u sont de dimension un, il est instructif

d'interprter l'observateur contrleur ci-dessus sous sa version tat, en terme


de transfert. On part donc du transfert rationnel y = G(s)u, avec G(s) =
P (s)
0
0
strictement causal (d P < d Q), P et Q premiers entre eux (pas de
Q(s)
racines communes dans

C).

On cherche, comme illustr sur la gure 4.1, un

contrleur K(s) aussi sous la forme d'un transfert rationnel causal, K(s) =
N (s)
0
0
(d N < d D ), de sorte que le systme boucl soit stable. Nous allons
D(s)
voir que l'observateur-contrleur rpond la question. Pour cela on passe
la forme d'tat. Pour viter tout confusion avec les fonctions de transfert, les
matrices sont notes en caractres calligraphiques.
d
x = Ax + Bu, y = Cx avec
Il existe trois matrices (A, B, C) telles que
dt
(A, B) commandable, (A, C) observable et G(s) = C(sI A)1 B . L'observateur contrleur

u = K
x,
correspond au transfert

d
x = A
x + Bu L(C x (y yc ))
dt
u = K(s)(yc y)

donn par

K(s) = K(sI A + BK + LC)1 L.


L'identit matricielle suivante


1
I CM1 N (M + N + LC)1 L
= I + C(M + N )1 N (M + LC)1 L.
conduit, avec

M = sI A, N = BK,

la formule explicite suivante :

1
= 1 C(sI A + BK)1 BK(sI A + LC)1 L
1 + G(s)K(s)
Ainsi le transfert en boucle ferme admet comme ples ceux du contrleur et
de l'observateur, ples que l'on peut choisir o l'on veut puisque
commandable et

(A, C)

(A, B)

est

est observable.

5. SISO : pour Single-Input Single-Output


6. Cette identit est un excellent exercice de calcul dans un cadre non commutatif.

190 CHAPITRE 4.

Figure

OBSERVABILIT, ESTIMATION ET ADAPTATION

4.2  Boucle ferme avec gnrations de trajectoires par un ltre

passe bas sur la consigne yc et dont l'ordre est au moins gal celui du
0
0
systme (d R d Q, R stable).

Le gain statique en boucle ferme

LC)1 L

entre

e = yc y

et

yc

1
1+G(0)K(0)

= 1 C(A BK)1 BK(A

n'a aucune raison d'tre nul. Pour avoir cela,

soit on rajoute un eet intgral lent (recalage), soit on rajoute

u, uc vriant

Q(0)yc = P (0)uc .
On peut aussi gnrer en temps rel et de faon causale des rfrences
et

ur

qui vrient identiquement

yr

Q(s)yr = P (s)ur et qui suivent asymptoQ(0)yc = P (0)uc . Il sut de

tiquement n'importe quelle consigne vriant


poser

yr =
avec

polynme stable,

P (s)
yc ,
R(s)

d0 R d0 Q

ur =
et

Q(s)
yc
R(s)

R(0) = 1.

Ainsi,

1/R(s)

est un ltre

passe-bas de gain statique unitaire, et on considre le contrleur

u = ur K(s)(y yr ).
Q(s)
y . On parle
R(s) c
alors de ltrage de la consigne yc . Ces petits calculs de gnration et suivi
qui donne comme transfert en boucle ferme

y = yr =

de trajectoires correspondent au schma bloc fonctionnel de la gure 4.2. Si

Q(0) 6= 0,

alors, avec le changement d'chelle

est bien une valeur ltre de

yc 7 yc /Q(0)

on voit que

yr

yc .

4.5 Filtre de Kalman


Nous proposons ici une prsentation simplie de la technique du ltrage
de Kalman. On se restreint au cas des ltres gains constants. Le ltre de
Kalman gains constants, tel que nous le prsentons ici, est un algorithme
utilis pour reconstruire les variables d'tat d'un systme continu soumis des
perturbations stochastiques en utilisant des mesures incompltes entches

4.5.

191

FILTRE DE KALMAN

de bruit. Cette technique (voir [39]) a t utilise de manire intensive dans le


domaine de la navigation inertielle [23]. Il en existe de nombreuses variantes :
version instationnaire, version discrte, version tendue pour tenir compte de
la variation du point de fonctionnement, etc. On pourra se reporter [59]
pour une prsentation complte et [9] pour des complments au sujet de la
robustesse dans le cadre stationnaire.
Le lien avec les observateurs asymptotiques de la section prcdente est
simple : ces derniers peuvent tre interprts comme des ltres de Kalman
o les matrices de covariance des bruits sur l'tat et la sortie paramtrisent
la matrice des gains

L du thorme 29. Au lieu de dnir L partir des ples


A LC , L est dni partir des

de l'observateur, i.e., des valeurs propres de

matrices de covariance. Comme pour la commande LQR, il dicile d'avoir


alors des formules analytiques pour

sauf pour les systmes un ou deux

tats .

4.5.1 Formalisme
On considre un systme sous forme d'tat linaire stationnaire

d
x(t) = Ax(t) + Bu(t) + D(t)
dt
o l'tat est
et

(4.8)

x(t) Rn , l'entre est un signal (dterministe) connu u(t) Rm ,

(t) Rq

reprsente la valeur d'un signal stochastique qui agit comme

une perturbation sur le systme. On suppose que ce dernier signal possde les
proprits statistiques suivantes (qui en font un bruit blanc gaussien centr ) :

t, (t) est une variable


cov ((t), ( )) = M (t )

pour tout

gaussienne de moyenne

E ((t)) = 0,

est la fonction Dirac (voir [42]), et M est une matrice constante de


Mq (R) symtrique dnie positive.
Sous ces hypothses, x(t) solution de (4.8) est un processus stochastique
o

gaussien color.
En ce qui concerne la mesure, nous disposons de

y(t) = Cx(t) + %(t)


y(t) Rp , et %(t) Rp reprsente lui aussi un bruit
indpendant de (t) tel que

(4.9)

blanc gaussien centr,

E (%(t)) = 0, pour tout t


cov (%(t), %( )) = M% (t )
7. Ce qui n'est pas le cas si

est dni en plaant les valeurs propres de

A LC .

192 CHAPITRE 4.

M%

OBSERVABILIT, ESTIMATION ET ADAPTATION

est une matrice constante de

Mp (R)

symtrique dnie positive.

On se place dans le cas o on connat les entres et les mesures jusqu'au


temps

t.

On note alors

U (t) = {u( ), ] , t]}


Y (t) = {y( ), ] , t]}
tant donn

U (t)

et

Y (t),

on cherche une estimation

x(t)

de l'tat

x(t)

qui

soit optimale en un certain sens. Le critre minimiser est la covariance


totale de l'erreur

x(t) = x(t) x(t)





J = E xT x = trace E(
x(t)
xT (t)

sous la contrainte d'estimation non biaise

E(
x(t)) = 0

4.5.2 Hypothses et dnition du ltre


Hypothses
Pour pouvoir construire le ltre de Kalman, on suppose que les deux
hypothses (fortes) sont vries

(H1) :
(H2) :

la paire
la paire

(A, D) est commandable


(A, C) est observable

(H1) signie que le bruit (t) excite tout l'tat du systme. (H2) implique
que la mesure non bruite Cx contient des informations sur tout l'tat. On
peut relcher ces deux hypothses en n'imposant seulement que

(H10 ) :
(H20 ) :

la paire
la paire

(A, D) est stabilisable


(A, C) est dtectable

en imposant que les modes non excits par le bruit

(t) soient asymptotique-

ment stables et que les modes non observs soient asymptotiquement stables.

Minimisation de la covariance
Le ltre de Kalman que nous prsentons est un ltre stationnaire de
dimension gale celle de l'tat du systme observer. Il admet comme entre
le signal

u(t)

et la mesure bruite

y(t).

Il s'crit, comme pour l'observateur

4.5.

193

FILTRE DE KALMAN

asymptotique de Luenberger, au moyen d'une matrice de gain

L sous la forme

suivante

d
x(t) = A
x(t) + Bu(t) L(C x(t) y(t))
dt

(4.10)

C x(t) y(t) est nomm innovation. La stabilit de ce ltre dpend


0
de la stabilit de la matrice A LC . D'aprs (H2), (ou (H2 )) il est possible
de stabiliser cette matrice par un choix appropri de L. La particularit du
ltre de Kalman rside dans le calcul de L partir des matrices de covariance
sur les bruits et %.
Le terme

Par dnition de l'quation (4.10), l'quation satisfaite par l'erreur est

d
x(t) = (A LC)
x(t) + D(t) L%(t)
dt
En utilisant la matrice de transition
un temps initial

t0

et

t,

(t, t0 ) = exp((A LC)(t t0 ))

entre

on peut crire la solution de ce systme comme-suit

(t, ) (D( ) L%( )) ( )d

x(t) = (t, t0 )x(t0 ) +


t0
En passant aux esprances, il vient

E(
x(t)) = (t, t0 )E(x(t0 ))
car les signaux

(t)

et

%(t)

sont d'esprance nulle par hypothse. Si

A LC

est asymptotiquement stable, on en dduit que lorsque le ltre de Kalman


est initialis au temps

t0 = ,

on a

E(
x(t)) = 0
et on conclut que l'estimation est, quel que soit le choix de

(stabilisant),

non biaise . Un calcul semblable permet de calculer la covariance de l'erreur,



note , E x
(t)
xT (t) comme l'unique solution symtrique positive de
l'quation matricielle de Lyapounov suivante

(A LC) + (A LC)T + DM DT + LM% LT = 0


Ainsi, pour toute valeur de la matrice de gain

L,

(4.11)

on peut calculer la cova-

riance de l'erreur par l'quation prcdente. Le critre que nous cherchons


minimiser est justement

J = trace().

Pour le ltre de Kalman,

est choisi

comme l'argument du minimum de cette fonction.


8. Si on initialise le ltre de Kalman en

t = 0

avec un tat

x(0) = x0

quelconque,

la stabilit permettra de conclure l'absence de biais de manire asymptotique, lorsque

t +.

194 CHAPITRE 4.

OBSERVABILIT, ESTIMATION ET ADAPTATION

Gain du ltre
Le gain du ltre de Kalman est

L = C T M%1
o

(4.12)

est l'unique solution symtrique positive de l'quation de Riccati alg-

brique

0 = A + AT + DM DT C T (M% )1 C
On peut montrer, par une dmonstration trs semblable au cas de la commande quadratique, que le gain

est stabilisant, i.e. est tel que

A LC

toutes ses valeurs propres partie relle strictement ngative. Ceci justie a
posteriori les hypothses que nous avons formules.

Exemple 27.

Considrons un systme autonome mono-dimensionnel trs

simple

d
x = x + u +
dt
y =x+%
o

E ((t)) = 0, pour tout t, cov ((t), ( )) = (t ), E (%(t)) = 0, pour


t, cov (%(t), %( )) = k 2 (t ). Le ltre de Kalman est de la forme

tout

d
x(t) =
x + u L(
x y(t))
dt
o

est calcul par

L = (k 2 )1
o

est l'unique solution positive de

0 = 2 + 1 2 k 2
Il vient

k2 + k4 k2

1

et l'quation du ltre de Kalman est alors

r
d
1
x(t) = 1 + 2 x + u +
dt
k

!
1
1+ 2 1 y
k

titre d'illustration, on a reprsent sur la gure 4.3 des rsultats de


simulation permettant de comprendre l'eet du ltre de Kalman. On peut
comparer sur la mme gure ses rsultats avec un autre rglage non optimal.

4.5.

195

FILTRE DE KALMAN

Bruit dexcitation
200
0
200

6
8
Mesure bruite

10

12

10
5
0

2
4
6
8
10
Etat rel et estimation de ltat (filtre de Kalman)

12

2
4
6
8
10
Estimation de la variance de lerreur (filtre de Kalman)

12

2
4
6
8
10
Etat rel et estimation de ltat (autre rglage de filtre)

12

10
5
0
4
2
0
10
5
0

2
4
6
8
10
12
Estimation de la variance de lerreur (autre rglage de filtre)

4
2
0

10

Figure 4.3  Utilisation d'un ltre de Kalman.

12

196 CHAPITRE 4.

Exemple 28

OBSERVABILIT, ESTIMATION ET ADAPTATION

Considrons un roTM
bot mobile roues indpendantes tel que le MobileRobots
Pioneer 3-AT
(Fusion de capteurs pour robot roues)

reprsent sur la Figure 4.4. Pour contrler ce vhicule, on peut librement


agir sur les quatres roues indpendantes. Pour le rendre autonome, c.--d.
capable de suivre une trajectoire prvue l'avance par exemple, la principale
dicult consiste estimer ( bord) prcisment la position et l'orientation
du vhicule. Pour rsoudre ce problme, on peut quiper le vhicule d'un certain nombre de capteurs embarqus : odomtres, rcepteur GPS, gyroscope
entre autres.
Chaque capteur prsente des dfauts bien spciques. Le GPS fournit un
signal actualis relativement basse frquence, entch d'un fort bruit de
mesure basse frquence. Le gyroscope fournit des informations frquemment
ractualises mais dgrades par un fort bruit de mesure haute frquence. Enn, les odomtres sont relativement ables, mais ont une rsolution limite.
Les quations de la dynamique du vhicule sont

(v + v2 )
d

x= 1
cos ,
dt
2

d = (v2 v1 )
dt
2l

d
(v1 + v2 )
y =
sin ,
dt
2

(4.13)

v1 , v2 reprsentent la vitesse du train roulant gauche et droit respectivement, x, y reprsentent la position du centre de masse du vhicule et
est l'orientation du chassis, l est la demi largeur de l'engin. En conditions
o

normales d'utilisation, le modle (4.13) est able.


Dans ce modle, on dispose de la connaissance de

v1

et

v2

par l'utilisa-

tion des odomtres (ici des capteurs incrmentaux situs dans les arbres des
d
roues). On mesure x et y par le rcepteur GPS et enn on mesure dt grce
9
un gyroscope un axe.
T
An d'estimer l'tat (x, y, ) du systme, on peut utiliser un observateur,
ou un ltre de Kalman. Ces techniques de fusion de capteurs utilisent la redondance de l'information et l'accord avec un modle dynamique, pour fournir
une estimation meilleure que l'information fournie par chacun des capteurs
sparment. Par exemple, si on intgre (en boucle ouverte) les donnes du
gyroscope et des odomtres, ce qui thoriquement permet de calculer les positions, on observe trs rapidement (aprs quelques dizaines de secondes) une
importante drive de l'estimation. Si on n'utilise que le GPS, on obtient assez
rapidement des aberrations signalant par exemple des mouvements latraux
de plusieurs mtres (alors que le vhicule en est totalement incapable).
On a reprsent sur la Figure 4.5, des rsultats de suivi en boucle ferme
d'une trajectoire de consigne. On donne aussi titre informatif, l'enregis9. Ce gyroscope de technologie MEMS mesure une vitesse angulaire.

4.5.

FILTRE DE KALMAN

197

Figure 4.4  Vhicule autonome roues indpendantes (remerciements au


Laboratoire de recherches balistiques et arodynamiques de la Dlgation
Gnrale pour l'Armement).

trement des valeurs donnes par le rcepteur GPS qu'on pourra comparer
l'estimation par fusion de capteurs (on dit aussi hybridation) de la position
du vhicule.

198 CHAPITRE 4.

OBSERVABILIT, ESTIMATION ET ADAPTATION

10

15

20

25
10

10

15

20

Figure 4.5  Suivi de trajectoire en boucle ferme pour un vhicule roues


en utilisant une fusion de capteurs : GPS, gyroscope et odomtres.

4.6.

199

COMPLMENTS

Utilisation dans un cadre dterministe


Lorsque le systme n'est pas aect par des bruits ou que ceux-ci sont mal
connus, on peut continuer utiliser le ltre de Kalman pour rgler l'observateur asymptotique stationnaire qu'il dnit. Les matrices

M%

et

agissent

comme des pondrations (on remarquera l'analogie avec la commande quadratique une fois de plus) avec les eets suivants :
1. lorsqu'on augmente

M% ,

on a tendance faire moins conance aux

mesures (ou certaines d'entre elles si on agit seulement sur certains


coecients dominants de la matrice) et donc naturellement l'inuence
de ces mesures sur la dynamique du ltre sera rduite travers le calcul
de la matrice de gain (4.12) ;
2. lorsqu'on augmente

M ,

on a tendance faire moins conance au

modle de la dynamique non bruite, naturellement on va acclrer


la dynamique de l'observateur pour en tenir compte en privilgiant
dans (4.10) l'innovation aux dpens du modle. Ceci est apparent dans
la contribution de

au gain

travers la covariance dans l'qua-

tion (4.11).

4.6 Complments
4.6.1 Estimation de paramtres et commande adaptative
Soit le systme d'tat

et de paramtre

d
x = f (x, t) + p g(x, t),
dt
On suppose que les trajectoires
tout temps

t 7 x(t)

pR

sont bornes et donc dnies pour

x.

On souhaite estimer

p.

K et sont des paramtres constants

(sorte de moindres carrs rcursifs)

d
x = f (x(t), t)+
p g(x(t), t)K(
xx(t)),
dt
o

x Rn ,

positif. On mesure ici tout l'tat

On considre l'estimateur suivant o

>0

h, i

est le produit scalaire dans

d
p = hg(x(t), t), (
x x(t))i
dt

Rn .

Cet estimateur donne en temps rel d'une part une valeur ltre de
et d'autre part reconstruit asymptotiquement le paramtre

x, x

lorsqu'il existe

200 CHAPITRE 4.

>0

tel que

OBSERVABILIT, ESTIMATION ET ADAPTATION

kg(x, t)k

x Rn

pour tout

et tout temps

t.

En eet, il

sut de considrer la fonction de Lyapounov suivante

1
1
x x)2 + (
p p)2
V = (
2
2
On voit que

d
V = K(
x x)2 0
dt
Ainsi x
tend vers x quand t tend vers l'inni. Et donc, intuitivement dtd x dtd x
converge vers 0 soit donc (p p
)g(x, t) converge zro. Comme le vecteur g(x, t)
est toujours de norme plus grande que > 0 on en dduit que p
converge
vers p.
Il est possible de gnraliser cet estimateur pour un nombre arbitraire m
de paramtres. On part de

X
d
x = f (x, t) +
pi gi (x, t)
dt
i=1
On considre avec

i > 0

paramtre (i

= 1, ..., m)

l'estimateur

X
d
x = f (x(t), t) +
pi gi (x(t), t) K(
x x(t))
dt
i=1
d
p1 = 1 hg1 (x(t), t), (
x x(t))i
dt
.
.
.

d
pm = m hgm (x(t), t), (
x x(t))i
dt
Il est alors facile de voir que la fonction

X 1
1
V = (
x x)2 +
(
pi pi ) 2
2
2
i
i=1
est dcroissante

d
V = K(
x x)2 0
dt
Donc on a toujours x
qui converge vers x. En revanche, la convergence des
pi vers les pi n'est pas garantie : tout dpend des gi (x, t) : s'ils forment pour
n
chaque x et t un systme libre de vecteurs de R , systme bien conditionn,
alors la convergence des paramtres est encore assure. Dans les autres cas,
cela dpend de la trajectoire suivie par

x. En revanche, il est trs intressant

4.6.

201

COMPLMENTS

de voir que

converge toujours vers

de ltre non linaire et adaptatif de

x.
x.

L'estimateur prcdent est une sorte

Cet estimateur est aussi la base de la commande adaptative qui estime


en mme temps que l'on contrle le systme via

et un seul contrle

u. Prenons un seul paramtre

(la gnralisation est simple partir de l)

d
x = f0 (x) + uf1 (x) + pg(x)
dt
Supposons que nous ayons un feedback
en

x=0

mais o le paramtre

u = k(x, p)

qui stabilise le systme

inconnu intervient. Alors, il est naturel de

considre le feedback construit partir des estimes

u = k(x, p) ou u = k(
x, p)

avec

d
x = f0 (x(t)) + u(t)f1 (x(t)) + p g(x(t), t) K(
x x(t))
dt
d
p = hg(x(t), t), (
x x(t))i
dt
Sous des hypothses raisonnables sur la dynamique en boucle ouverte pour
(pas d'explosion en temps ni essentiellement) on montre que
et ensuite que le feedback assure la convergence de

vers

0.

tend vers

x
x

Sans conditions

p reste born. Ainsi, la


p n'est pas ncessairement indispensable pour faire converger
x vers 0 avec le contrle u. C'est le principal paradoxe du contrle adaptatif.
supplmentaires, tout ce que l'on peut dire c'est que

connaissance de

Un lecteur intress pourra consulter [41]. On notera que l'une des hypothses
trs importante est la dpendance ane de la dynamique par rapport au
paramtre

p.

Dans le cas de dpendance non linaire trs peu de rsultats

existent.

4.6.2 Linarisation par injection de sortie


Il arrive parfois que, dans les bonnes coordonnes d'tat, coordonnes
notes

ici, les quations du systme s'crivent ainsi :

d
x = Ax + f (Cx, t),
dt
avec la paire

y = Cx

(A, C) observable et f (y, t) est une fonction a priori non linaire.


x

Il est clair qu'il faut avoir un peu de air pour choisir les bonnes variables

pour que le systme s'crive ainsi. Ce n'est en gnral pas possible. Parfois
c'est possible et mme vident comme pour le pendule command :

d2
g
= sin + u(t),
2
dt
l

y = .

202 CHAPITRE 4.

OBSERVABILIT, ESTIMATION ET ADAPTATION

En eet dans ce cas on a


x=

dt


,

A=


f (Cx, t) =

0 1
0 0


,

1 0

C=

0
g
l sin + u(t)

A + LC

Il est alors facile de construire un observateur pour


telle que

x.

Il sut de choisir

soit une matrice relle stable. Alors l'observateur

d
x = A
x + L(C x y(t)) + f (y(t), t)
dt
est exponentiellement convergent car lorsque l'on regarde la dynamique de

ex = x x,

l'erreur

les termes non linaires disparaissent et on a

d
ex = (A + LC)ex .
dt

4.6.3 Contraction
La notion de contraction [49, 33] pour un systme, avec une dynamique

x = f (x, t),

peut tre interprte comme la dcroissance exponentielle, avec

le temps, de la longueur de tout segment de conditions initiales transport


par le ot.

Dnition 17 (Contraction stricte).


f (x, t)

rgulier (C

une mtrique sur

d
Soit un systme dynamique dt x =
par exemple) dni sur une varit M rgulire. Soit g

M.

Soit

U M

un sous ensemble de

est dite strictement contractante sur

M.

La dynamique

au sens de la mtrique

g,

si la partie

symtrique de sa matrice Jacobienne est une matrice dnie ngative, c'est


dire, s'il existe
avons pour tout

>0

tel que, dans des coordonnes locales

et pour tout

sur

U,

nous

x,

f
g
f T
g(x) + g(x)
+
f (x, t) g(x)
x
x x
Nous avons le rsultat suivant qui justie cette dnition et cette terminologie.

Thorme 30.
une varit
associ

d
Soit un systme dynamique dt x = f (x, t) rgulier dni sur
rgulire. Soit g(x) une mtrique sur M . Soit X(x, t) le ot

f
d
X(x, t) = f (X(x, t), t) t [0, T [
dt
X(x, 0) = x

avec

T +.

4.6.

203

COMPLMENTS

Considrons deux points

x0

and

x1

x0 = (0) et x1 = (1). Si
 f est une stricte contraction

dans

et une godsique

sur un sous ensemble

(s)

U M,

qui joint
avec

la

constante prsente dans la dnition 17,


 et si

X((s), t) appartient U

pour tout

s [0, 1] et pour tout t [0, T [.

alors

dg (X(x0 , t), X(x1 , t)) e 2 t dg (x0 , x1 ) t [0, T [


o

dg

est la distance godsique associe la mtrique

Dmonstration. La preuve est la suivante

(X((s), t), s [0, 1])

. Soit

au sens de la mtrique

10

l(t) =
0

g.

l(t) la longueur de la courbe

dX((s), t) T
dX((s), t)
g(X((s), t))
ds
ds
ds

Nous avons alors

d
l(t) =
dt

Z
0

d
dt

dX((s),t) T
g(X((s), t)) dX((s),t)
ds
ds

q
ds
dX((s),t) T
dX((s),t)
2
g(X((s), t)) ds
ds

Comme

d
d dX((s), t)
= f (X((s), t), t) =
f (X((s), t), t) X((s), t)
dt
ds
ds
X
ds
nous obtenons

d
dt

dX((s), t)
dX((s), t) T
g(X((s), t))
ds
ds

avec

P (s, t) =

)
=

dX((s), t) T
dX((s), t)
P (s, t)
ds
ds

f (X) T
f (X) g(X)
g(X) + g(X)
+
f (X, t)
X
X
X

et

X = X((s), t)
Puisque

est une contraction sur

U,

il existe

>0

tel que

P (s, t) g(X((s), t))


10. Cette preuve s'inspire de calculs faits par Laurent Praly

204 CHAPITRE 4.

OBSERVABILIT, ESTIMATION ET ADAPTATION

On obtient alors l'ingalit suivante pour la drive

d
l(t)
dt

l(t) l(t)
dt
2
qui conduit

l(t) l(0)e 2 t
Puisque
godsique

t [0, T [

dg (X(x0 , t), X(x1 , t)) l(t) et l(0) = dg (x0 , x1 ) (en eet est
qui joint les deux points x0 et x1 ), le thorme est dmontr.

la

n
Lorsque la varit Riemannienne M est l'espace Euclidien R , la dynad
x = f (x, t) est une contraction lorsque la partie symtrique de la
mique
dt
matrice Jacobienne est ngative

f
+
x

f
x

T
0

Enn, l'intrt pour la construction d'observateurs non-linaires asymptotiques vient du fait qu'avec une dynamique contractante, il sut de simuler
le systme pour avoir une estimation de

d
x = f (
x, t)
dt
la dpendance en temps tant alors due aux entres et/ou aux termes d'erreur
entre la sortie estime et la mesure.
L'exemple typique est le suivant. On considre un systme mcanique
un degr de libert

x1 , de vitesse x2 obissant l'quation de Newton suivante


d
x1 = x2 ,
dt

avec comme seule mesure

y = x1

d
x2 = F (x1 , x2 , t)
dt
et on suppose que

F
x2

0.

On considrer

alors l'observateur

d
x1 = x2 (
x1 y(t))
dt
d
x2 = F (y(t), x2 ) (
x1 y(t))
dt
, > 0 deux paramtres de rglage. On crit symboliquement cet
d
x = f (
x, t) o la dpendance en t vient de la mesure y(t) =
dt
x1 (t). Cet observateur s'crit formellement dtd x = f (
x, t). Avec comme produit

avec

observateur

scalaire celui qui est associ la matrice constante symtrique dnie positive


g=

1 0
0 1

4.6.

205

COMPLMENTS

on a

f
x

T

f
=
g+g
x

2
0

0
F
2 x

Nous n'avons pas une contraction stricte comme dans la Dnition 17 mais
F
< 0 uniformment
au sens large. Il est cependant facile de voir que si
x2
pour tout x avec > 0, on a une contraction stricte et donc la convergence
exponentielle de

vers

x.

Annexe A
Sur le thorme de
Cauchy-Lipchitz

On considre donc le problme de Cauchy suivant :

x(0) = x0 ,

d
x(t) = v(x(t), t).
dt

(A.1)

Pour tablir des rsultats sur ces proprits (essentiellement, les Thormes 1
et 2) nous allons utiliser la notion de solution approchante qui s'appuie simplement sur le schma numrique d'Euler explicite

xk+1 = xk + v(xk , k),


o

est un petit temps

>0

et

xk

x0 = x(0),

kN

une approximation de

x(k).

Considrons le problme de Cauchy (A.1). On suppose, de manire gn0


rale, que v est continue dans une rgion R = {kx x k b, |t| a}. En
n
gnral on prend comme norme k k, la norme euclidienne sur R , mais ce
n'est pas une obligation. Par la suite, sauf mention contraire
norme euclidienne. Il en dcoule que
constante

est borne sur

kk

dsigne la

par une certaine

M > 0.

Dnition 18 (Solution approchante).

On appelle solution approchante

prs du problme de Cauchy (A.1), une fonction

(t, x(t)) R on


d

x(t) v(x(t), t) 
dt

drivable par morceaux, telle que pour tout

x(0) = x0 ,

t 7 x(t)

d
en tout point o dt x est dni.
207

continue,

208

ANNEXE A.

En d'autres termes,
points de

|t| a.

SUR LE THORME DE CAUCHY-LIPCHITZ

d
x(t) peut ne pas tre dni en un nombre ni de
dt

De telles solutions approchantes existent comme le prcise le rsultat


suivant.

Thorme 31.

Soit le problme de Cauchy (A.1) o

R = {kx x k b, |t| a}

et majore par

peut construire une solution approchante

|v| M .

est continue sur

 > 0, on
l'intervalle |t|

Pour tout

prs dnie sur

min(a, b/M ) , h.
v
 > 0,

Dmonstration. L'application

est continue sur

ment continue. Pour tout

il existe

>0

R,

elle est donc uniform-

tel que

|v(x1 , t1 ) v(x2 , t2 )| 
quels que soient

(x1 , t1 ) R

Considrons maintenant,
diaires entre

et

et

(x2 , t2 ) R

avec

kx1 x2 k , |t1 t2 | .

tant donn, un ensemble de temps interm-

h
t0 = 0 < t1 < t2 ... < tm = h

vriant

|ti ti1 | min(, /M ),

i = 1, ..., m

(A.2)

(par exemple, cette famille de temps intermdiaires peut tre de plus en plus
nombreuse lorsque

diminue). Nous allons montrer que la fonction dnie

par la relation de rcurrence (dite de Cauchy-Euler)

x(t) = xi1 + (t ti1 )v(xi1 , ti1 ),


est une solution approchante

ti1 t ti ,

xi = x(ti )

 prs. Cette fonction est continue, et elle pos-

sde une drive continue par morceaux (elle est en fait ane par morceaux
par construction). Sa drive est dnie partout sauf aux points
En dehors de ces points, on a, pour

(ti )i=1,...,m1 .

ti1 t ti ,



d

x(t) v(x(t), t) = kv(xi1 , t) v(x(t), t)k

dt
Par (A.2), et d'aprs la relation de rcurrence, on a

kx(t) xi1 k = M (t ti1 ) < M

=
M

(A.3)

209

D'aprs la continuit uniforme de

dj voque, on dduit de (A.2)-(A.3)

kv(xi1 , ti1 ) v(x(t), t)k 


On a donc tabli, que pour tout

|t| < a

en dehors des points

t1 , ..., tm

on a




d
x(t) v(x(t), t) 

dt
Enn, par construction

x(0) = x0 ,

ce qui achve la dmonstration.

Nous allons maintenant avoir besoin de la proprit Lipschitz permettant


de prouver une ingalit de croissance de la propagation des approximations.

Dnition 19 (Fonction Lipschitz).

Rn R v(x, t) R
en x si

Une fonction scalaire

est Lipschitz avec la constante

k>0

(ou

(x, t) R
k -Lipschitz)

kv(x1 , t) v(x2 , t)k k kx1 x2 k


pour tout

(x1 , t), (x2 , t)

dans

R.

Dnition 20 (Fonction Lipschitz vectorielle).


Rn R v(x, t) Rn

est Lipschitz en

Une fonction

(x, t)

si et seulement si chacune de ses

composantes l'est (les constantes Lipschitz de chaque composante peuvent


direr).
On notera, grce la proposition suivante, que la proprit Lipschitzienne est trs gnrale.

Proposition 9.

n
n
Soit R R (x, t) 7 v(x, t) R . Supposons que chaque
v(x,t)
drive partielle x
pour i = 1, ..., n existe et soit de norme borne par un
i

scalaire c, alors v(x, t) est Lipschitzienne en x avec comme constante c n.

Dmonstration. Quels que soient


n
vecteurs de

x = (x1 , ..., xn )

et

y = (y1 , ..., yn )

deux

, on peut crire,

v(y, t) = v(x, t) +

X Z
i=1,...,n


v
(xi yi ) d
xi (y+(xy),t)

Il sut alors d'utiliser



l'ingalit de Cauchy-Schwartz, l'ingalit triangulaire
v(x,t)
et l'hypothse
n pour avoir
xi

kv(y, t) v(x, t)k c n kx yk

210

ANNEXE A.

SUR LE THORME DE CAUCHY-LIPCHITZ

Nous allons maintenant pouvoir noncer, sous une hypothse de Lipschitz,


un rsultat important sur la propagation des direntes entre les solutions
approchantes.

Thorme 32
chantes). tant

(Propagation de la distance entre deux solutions appro-

R et k-Lipschitz en
1 et 2 prs du problme de Cauchy (A.1), dnies sur |t| b. La dirence d(t) = x1 (t) x2 (t)
satisfait, pour tout |t| b
x.

Soient

x1 (t)

donne

et

x2 (t)

v(x, t)

continue sur une rgion

deux solutions approchantes

kd(t)k exp(k |t|) kd(0)k +

1 + 2
(exp(k |t|) 1)
k

(A.4)

d
Dmonstration. La drive dt d(t) est dnie partout sauf en un nombre ni
de points. Par dnition des solutions approchantes, on a (en notant

 ,

1 + 2 )



d
d

d
d(t) = x1 (t) x2 (t) kv(x1 (t), t) v(x2 (t), t)k + 
dt
dt

dt
k kx1 x2 k +  k kd(t)k + 
d
d(t)
dt
0, on peut donc conclure d'aprs le Lemme 4 (donn un peu

o on a utilis la proprit Lipschitzienne de


existe et

d(t) 6=

v.

Aux points tels que

plus loin),

d
kd(t)k k kd(t)k + 
dt
On a alors trois cas :
1. si

d(t)

est identiquement nul, alors la conclusion est triviale

2. si

d(t)

ne s'annule jamais sur


exp(kt)

] b, b[,

alors on peut crire


Z t
d
kd(t)k k kd(t)k dt 
exp(kt)dt
dt
0

o le membre de gauche peut avoir un intgrand discontinu mais possde eectivement une primitive. Il vient

exp(kt) kd(t)k kd(0)k


d'o la conclusion


(1 exp(kt))
k

211

d(t) 6= 0, |t| b alors que d s'annule quelque part


], alors, par continuit de kd(t)k, il existe t1 , avec
sur l'intervalle [b, t
b t1 < t b tel que d(t1 ) = 0 et d(t) 6= 0 sur t1 < t < t. Par une

3. s'il existe

t tel

que

intgration semblable au cas prcdent mais eectue sur l'intervalle

[t1 , t],

on a alors

kd(t)k


(exp (k(t t1 )) 1)
k

qui est une majoration plus forte que celle recherche.

Lemme 4.

Si

x(t)

est continment direntiable sur un intervalle ouvert


]t1 , t2 [, alors, en tout point t tel que kx(t)k 6= 0, la drive dkx(t)k
existe et
dt
vrie




d kx(t)k dx(t)



dt dt
Pn 2
Dmonstration. Soit t ]t1 , t2 tel que kx(t)k =
6 0, avec kx(t)k =
i=1 xi (t),
Pn
dxi
xi dt
dkx(t)k
il vient
= i=1
qui est bien dnie. D'autre part, par passage la
dt
kx(t)k
p

limite dans l'ingalit suivante, on obtient le rsultat dsir.

1
1
|kx(t + t)k kx(t)k| kx(t + t) x(t)k
t
t

Nous pouvons maintenant nous intresser aux thormes d'existence et


d'unicit des solutions du problme de Cauchy.

Thorme 33 (Unicit de la solution au problme de Cauchy).


blme de Cauchy (A.1) o v(x, t) est continue et Lipschitz en
0
voisinage de (x , 0). Ce problme possde au plus une solution.
Dmonstration. Soient deux solutions (exactes)

x1

et

x2

Soit le pro-

dans un

du problme (A.1).

D'aprs le Thorme 32, on a

kx1 (t) x2 (t)k 0


d'o

x1 x2 .

Thorme 34

(Existence d'une solution au problme de Cauchy)

h.

x(t)

de

Soit le

v(x, t) est continue et Lipschitz en x dans la


a}. Soit M la borne suprieure de kf k sur R.
b
(A.1) dnie sur l'intervalle |t| min(a,
),
M

problme de Cauchy (A.1) o


0
rgion R = {|x x | b, |t|
Il existe une solution

212

ANNEXE A.

SUR LE THORME DE CAUCHY-LIPCHITZ

Dmonstration. Considrons une suite dcroissante positive

(n )nN

conver-

0. D'aprs le Thorme 31, on peut construire une suite de fonc(xn )nN qui sont chacune solution approchante n prs de (A.1). On
alors, pour |t| h,



d
xn v(xn (t), t) n , xn (0) = x0

dt

geant vers
tions
a

d
x est dnie partout sauf en un nombre ni de points
dt n
1, ..., mn . On va prouver trois proprits

La drive

i=

(n)

ti

(xn )nN converge uniformment sur |t| h vers


x(t)
R

Rt
t
la suite
f
(t,
x
(t))dt
converge uniformment vers 0 f (t, x(t))dt
n
0

1. la suite de fonctions

une fonction continue

2.

nN

0
3. la fonction x(t) est continment direntiable et vrie x(0) = x et
d
x(t) = v(x(t), t). Autrement dit x(t) est solution du problme de Caudt

chy.
preuve du point 1
Considrons

n < p

et appliquons l'ingalit du Thorme 32 aux deux so-

lutions approchantes
schitz de

xn (t)

et

xp (t).

Il vient, en notant

la constante Lip-

v(x, t)

kxn (t) xp (t)k

2n
n + p
(exp(|t|) 1)
(exp(|t|) 1)
k
k

donc la suite de fonctions continues

(xn (t)) est uniformment de Cauchy, elle


1

converge vers une fonction limite continue .

preuve du point 2
0
0
Considrons une rgion R = {|t| h, kx x k M h}. L'application v(x, t)
0
est continue dans R . Donc, pout tout  > 0, il existe > 0 tel que, pour
0
tout (t, x1 ), (t, x2 ) dans R , tels que kx1 x2 k , on a

kv(x1 , t) v(x2 , t)k 


Pour ce

, il existe d'aprs le rsultat de convergence tabli au point 1, N N


n > N on a

tel que, pour tout

kxn (t) x(t)k 


1. L'ensemble des fonctions continues bornes de
clos des fonctions bornes et est donc complet.

|t| h

dans

Rn

est un sous espace

213

pour tout

v(x(t), t)

|t| h.

et on a

(v(xn (t), t)) converge uniformment


(uniformment en t)
Z t
Z t
v(xn (t), t)dt =
v(x(t), t)dt
lim
Donc la suite

vers

preuve du point 3
Reprenons l'ingalit

d

xn (t) v(xn (t), t) n
dt

pour tout

|t| < h.

En int-

grant, on obtient

t1

or

xn (t)



d
( xn (t) v(xn (t), t))dt
n |t1 | n h
dt

est continue, donc l'intgration donne


Z

xn (t1 ) x0

t1



v(xn (t), t)dt
n h

D'aprs le point 2, on a alors par passage la limite

t1

v(xn (t), t)dt

x(t) = x +
0

v(x(t), t) est continu, donc x(t) est continment direntiable et


d
x(t) = v(x(t), t).
vaut
dt

L'intgrand
sa drive

Annexe B
Autour des fonctions de
Lyapounov

D'une faon moins restrictive que dans la dnition ci-dessous, dnition


que nous n'utiliserons que dans cette annexe, on appelle en gnral fonction

de Lyapounov toute fonction globalement dnie sur l'espace d'tat, valeurs


relles et dcroissante le long de toute trajectoire.

Dnition 21.

x un point d'quilibre d'un systme dtd x = v(x) dni


n
dans un domaine R , o v est Lipschitz. On appelle fonction de Lyapounov (centre en x
) une fonction V : R qui vrie les trois proprits
Soit

suivantes
1.

2.

V (
x) = 0

est continue et possde des drives partielles continues


et

V (x) > 0

sur

\ {
x}

d
3. dt V (x) = V (x)v(x) 0 pour tout
croissante le long des trajectoires).

(autrement dit

est d-

Thorme 35 (Stabilit et stabilit asymptotique locale par une fonction de


Lyapounov). Avec les notations de la Dnition B, s'il existe une fonction de
V (x) dans un voisinage centr en x alors x est un point d'quilibre
d
de plus, dt V < 0 pour tout x \ {
x}, alors x est un point

Lyapounov
stable. Si

d'quilibre (localement) asymptotiquement stable.


Dmonstration. Reprenons la Dnition 1, et montrons tout d'abord la sta-

x. On souhaite montrer que, pour tout  > 0 tel que la boule centre
 soit contenue dans , il existe > 0 tel que, pour toute
0
condition initiale kx x
k , on a

bilit de
en

de rayon

kx(t) xk ,

pour tout

215

t0

216

ANNEXE B.

AUTOUR DES FONCTIONS DE LYAPOUNOV

Figure B.1  Liens entre fonction de Lyapounov et la norme Euclidienne.


La fonction de Lyapounov va nous fournir ces ingalits qui portent sur la
norme Euclidienne. Notons

le minimum atteint par V (qui est continue) sur


B centre en x de rayon . Par hypothse,

la frontire (compacte) de la boule

= minkxxk= V (x) > 0.

Considrons maintenant le sous-ensemble

E 2 , {x B /V (x)

}
2

Ce sous-ensemble est strictement l'intrieur de B et est donc gal {x/V (x)

}. En eet, si ce n'tait pas le cas, il existerait un x la fois dans E 2 et


2
la frontire de B . On aurait alors

V (x )

et

k
x x k = 

donc

V (x )

d'o la contradiction.

V (
x) = 0. On peut
donc nalement construire une boule B centre en x
de rayon dans laquelle

on a V (x) . Cette boule est donc incluse dans E .


2
2
D'autre part, on note que

est continue et vrie

On vient d'tablir (voir Figure B.1)

B E 2 B
L'ensemble E est positivement invariant : pour toute condition initiale
2
x(0) = x0 appartenant E 2 , on a x(t) E 2 pour tout t 0. En eet, on
d
dduit de
V (x) 0 que V (x) V (x(0)) 2 .
dt

217

x(0) B on a
x(0) E et donc par l'invariance que vous venons d'voquer, x(t) E 2
pour tout t 0 et donc x(t) B pour tout t 0. D'o la conclusion
concernant la stabilit du point d'quilibre x
.
d
V < 0 pour tout
Considrons maintenant l'hypothse supplmentaire
dt
x \{
x}. La fonction t 7 V (x(t)) est dcroissante et borne infrieurement
par 0, donc elle converge. Notons
On peut alors conclure que pour toute condition initiale
,
2

lim V (x(t)) = l

t+

l 0, montrons par l'absurde que l = 0. Si ce n'tait pas le cas,


l
alors x(t) resterait en dehors, lorsque t +, de E l = {x /V (x) } et
2
2
donc, par la continuit de V et l'quation V (
x) = 0 dj voques, en dehors
d'une certaine boule Br de rayon r vriant  > r > 0 centre en x
. On peut
d
V
(x)
qui, par construction, vrie k < 0.
alors calculer k = maxrkxk
dt
Par hypothse

Enn,

V (x(t)) = V (x(0)) +
0

d
V (x(t))dt V (x(0)) kt
dt

ce qui est inV (x) 0.


Nous venons de montrer que limt+ V (x(t)) = 0. Il nous faut maintenant conclure sur x lui-mme. Considrons  > 0, et, comme prcdemment,
l'ensemble E B . Puisque limt+ V (x(t)) = 0, alors il existe un temps
2
T > 0 tel que x(t) E 2 pour tout t T . On en dduit que pour tout
 > 0, il existe un temps T > 0 tel que x(t) B . Le point x est donc
Le second membre de la dernire ingalit converge vers
compatible avec la proprit

asymptotiquement stable.
Au cours de la preuve du thorme prcdent, nous avons t capables
de construire un sous-ensemble de conditions initiales (not

E 2 )

fournissant

des trajectoires convergeant asymptotiquement vers le point d'quilibre

x.

Ce sous-ensemble fait donc partie d'un ensemble appel bassin d'attraction


du point

x.

Ce dernier est dni comme l'ensemble des conditions initiales

fournissant une trajectoire convergeant vers

x.

Caractriser prcisment cet

ensemble est dicile, et nous en avons pour l'instant simplement trouv une
partie. Une question intressante est de savoir sous quelle hypothse le bassin
n
d'attraction est l'espace R tout entier, c.--d. sous quelle hypothse x
est

globalement asymptotiquement stable.


De manire prliminaire, considrons l'exemple d'un systme de dimension 2, avec

V (x) =

x21
+ x22
1 + x21

218

ANNEXE B.

On peut vrier que

AUTOUR DES FONCTIONS DE LYAPOUNOV

minkxk= V (x) 1,

 > 0. Ainsi, la construc {x/V (x) 1/2} qui ne

pour tout

tion prcdente est limite des ensembles

couvrent pas l'ensemble du plan. On peut, en fait, garantir la possibilit


d'une construction de

E 2

aussi vaste que dsir si la fonction

est non

borne radialement, c.--d. si

lim

kx
xk

V (x) = +

On obtient alors le thorme suivant, qui sera trs utile en pratique

Thorme 36 (Stabilit asymptotique globale par une fonction de Lyapoun


nov). S'il existe une fonction de Lyapounov V (x) dnie sur R non borne

d
V < 0 pour tout x
dt
libre globalement asymptotiquement stable.

radialement telle que

6= x,

alors

est un point d'qui-

[0, +[3 a 7 r(a) = sup{x / V (x)a} kxk. Cette


fonction est bien dnie car V est non borne radialement. Le long d'une
d
trajectoire ayant x(0) pour condition initiale, on a par hypothse
V 0,
dt
et donc V (x(t)) V (x(0)) pour tout t 0. Donc, pour tout t 0, kx(t)k
sup{x / V (x)V (x(0))} kxk = r(V (x(0)). De cette ingalit on dduit que pour
toute condition initiale x(0), on peut, en chantillonnant la trajectoire qui
en est issue, construire la suite (x(i))iN et que, pour tout t i on a
Dmonstration. Dnissons

kx(t)k r(V (x(i)))

(B.1)

limt+ V (x(t)) = 0.
D'autre part, on va montrer que lima0 r(a) = 0. La fonction t 7 r(1/t)
est dcroissante et minore donc elle converge lorsque t +. Notons
la limite lima0 r(a) = l 0. Supposons que cette limite est non nulle.
Alors, pour toute suite (an )nN convergeant vers zro, il existe une suite
(xn )nN telle que kxn k l/2 et V (xn ) an . On dduit que, pour cette suite,
limn+ V (xn ) = 0 avec kxn k l/2 ce qui est impossible car V est non nulle
en dehors de x
. On a donc lima0 r(a) = 0.
On dduit donc de la suite d'ingalits (B.1) que limt+ x(t) = 0.
De la mme manire que dans le Thorme 35, on a

Bien souvent, on trouvera que la condition de stricte ngativit de la


d
drive
V en dehors du point d'quilibre x est trop contraignante. En eet,
dt
on pourra souvent trouver une fonction de Lyapounov (ce qui est dj dicile)
telle que l'ensemble des points x o sa drive est nulle n'est pas rduite un
d
point. Notons Z = {x/ V (x) = 0}. Dans ce cas, le thorme suivant permet
dt
de dterminer l'ensemble vers lequel le systme converge. Il utilise la notion
d'ensemble positivement invariant (dj rencontre plus haut dans la preuve
du Thorme 35 mais que nous formalisons ici).

219

Dnition 22 (Ensemble positivement invariant).

On dit que I est un


d
0
sous-ensemble positivement invariant de dt x = v(x), si quel que soit x I
d
0
condition initiale du problme de Cauchy dt x = v(x), x(0) = x , tous les
points de la trajectoire [0, +[3 t 7 x(t) appartiennent I .

Thorme 37

(Invariance de LaSalle (version locale)) Soit V fonction de


d
Lyapounov pour le systme dt x = v(x). Soient s > 0 et Es le sous-ensemble
{x / V (x) s}. On suppose que Es est borne et que dtd V (x) 0 l'intrieur
d
de Es . Notons Z l'ensemble des points de Es pour lesquels dt V (x) = 0. Toute

trajectoire issue d'une condition initiale dans

Es

converge lorsque

t +
Z.

vers le plus grand sous-ensemble positivement invariant contenu dans

Exemple 29.

Considrons l'oscillateur non linaire suivant

d
d2
x
+
k
x + g(x) = 0
dt2
dt
k est un paramtre strictement positif et g est telle
x 6= 0. On peut rcrire ce systme sous forme d'tat
o

que

xg(x) > 0

pour

d
x=y
dt
d
y = ky g(x)
dt
Une fonction candidate tre de Lyapounov est

g( )d +

V (x, y) =
0

y2
2

Cette fonction est continue et possde des drives partielles continues.


possde un unique minimum en

(x, y) = (0, 0).

Calculons maintenant

d
d
d
V (x, y) = g(x) x + y y = ky 2 0
dt
dt
dt
On peut en dduire la stabilit de l'origine par le Thorme 35. Pour dduire
la stabilit asymptotique, il nous faut utiliser le Thorme 37.
g
Le cas particulier g(x) = R sin x, correspond un pendule de longueur
soumis la gravit, tel que reprsent sur la Figure B.2.

220

ANNEXE B.

AUTOUR DES FONCTIONS DE LYAPOUNOV

Figure B.2  Pendule amorti.

Annexe C

Moyennisation

C.1 Introduction
On suppose ici que les eets rapides ont un caractre oscillant. La mthode de moyennisation a t utilise en mcanique cleste depuis longtemps
pour dterminer l'volution des orbites plantaires sous l'inuence des perturbations mutuelles entre les plantes et tudier la stabilit du systme
solaire. Gauss en donne la dnition suivante qui est des plus intuitives : il

convient de rpartir la masse de chaque plante le long de son orbite proportionnellement au temps pass dans chaque partie de l'orbite et de remplacer
l'attraction des plantes par celle des anneaux de matire ainsi dnis.
Dans ce cadre, les quations non perturbes du mouvement de la terre
sont celles qui ne prennent en compte que la force d'attraction due au soleil.
L'orbite de la terre est alors une ellipse dont le soleil est l'un des foyers. Les
quations perturbes sont celles o l'on rajoute les forces d'attraction entre
la terre et les autres plantes en supposant que ces dernires dcrivent toutes

correspond au
1/1000. L'chelle

des orbites elliptiques selon les lois de Kepler. Le paramtre


rapport de la masse du soleil celles des plantes :

de temps rapide est de l'ordre d'une priode de rvolution, quelques annes.


L'chelle de temps lente est de l'ordre de quelques millnaires. La question
est alors de savoir si ces petites perturbations d'ordre

peuvent entraner

terme, i.e. l'chelle du millnaire, une drive systmatique des longueurs


du grand axe et du petit axe de la trajectoire de la terre, ce qui aurait des
consquences catastrophiques pour le climat. En fait, les calculs (moyennisation) montrent qu'il n'en est rien. En revanche, l'excentricit des orbites
oscille lentement. Ces oscillations inuencent le climat.

221

222

ANNEXE C.

MOYENNISATION

C.2 Le rsultat de base


Considrons le systme

dx
dt

= f (x, z, )

dz
dt

= g(x, z, )

On passe de cette forme la forme

( )

choisie pour noncer le thorme

de Tikhonov (Thorme 15) par un simple changement d'chelle de temps.


On remplace

par

t/.

L'chelle de temps rapide correspond maintenant

d'ordre 1 et l'chelle de temps lente

priode

1/.

de l'ordre de

Le rgime oscillatoire le plus simple pour

est le rgime priodique, de


y=

y1
y2

dy1
dt

= y2

dy2
dt

= g1 (x, y, )
 2 2
T

y1 = g2 (x, y, ),

f (x, y(t), ) = f (x, t, ) : f est


priodique (priode T ). Le systme

Sans changer de notation, on pose


en

et dpend de

de faon

rgulire
perturb

s'crit alors

dx
dt

= f (x, t, ), 0  1

(C.1)

Le systme moyenn (ou systme lent) est alors

dz
dt

= T1

RT
0

f (z, t, 0) dt

df

(C.2)

f (z)

Remplacer les trajectoires du systme instationnaire (C.1) par celles du systme stationnaire (C.2), revient alors lisser les trajectoires de (C.1). Comme
pour le thorme 16, si le systme moyen admet un point d'quilibre hyperboliquement stable (les valeurs propres du tangent sont toutes partie relle
strictement ngative) alors le systme perturb oscille lgrement autour de
cet quilibre moyen.
De faon plus rigoureuse, thorme suivant montre qu' un point d'qui-

libre hyperbolique du systme moyen correspond une petite orbite priodique


du systme perturb (C.1) (dmonstration dans [30]).

Thorme 38

(Moyennisation une frquence)

perturb (C.1) avec

z + w(z, t)

de priode

avec

Considrons le systme

rgulire. Il existe un changement de variables,

en

t,

tel que (C.1) devienne

dz
= f (z) + 2 f1 (z, t, )
dt
avec

dnie par (C.2) et

f1

rgulire de priode

en

t.

De plus,

x=

C.2.

(i)

223

LE RSULTAT DE BASE

x(t) et z(t) sont respectivement solutions de (C.1) et (C.2) avec comme


conditions initiales x0 et z0 telles que kx0 z0 k = O(), alors kx(t)
z(t)k = O() sur un intervalle de temps de l'ordre de 1/.
Si z est un point xe hyperbolique stable du systme moyenn (C.2), alors
il existe > 0 tel que, pour tout ]0, ], le systme perturb (C.1) admet une unique orbite priodique (t), proche de z ( (t) = z + O())
et asymptotiquement stable (les trajectoires dmarrant prs de (t)

si

(ii)

ont tendance s'enrouler autour de cette dernire). L'approximation,

O()

prs, des trajectoires du systme perturb (C.1) par celles du

systme moyenn (C.2) devient valable pour

t [0, +[.

Il est instructif de voir comment est construit le changement de coordonnes

x = z + w(z, t) en enlevant x
T en t). On a, d'une part,

des termes oscillants d'ordre

(w

de

priode

dz
w
dz
w
dx
=
+ (z, t) + (z, t)
dt
dt
z
dt
t
et, d'autre part,

dx
= f (z + w(z, t), t, )
dt
Ainsi

1 
= I + w
(z, t)
f (z + w(z, t), t, )
z

dz
dt


= f (z, t, 0)
Comme la dpendance en

est

+ O(2 )

T -priodique, il n'est pas possible d'and'ordre 1 en car il n'y a aucune raison pour

de

nuler compltement le terme

w
(z, t)
t

w
(z, t)
t

que la fonction dnie par

f (z, s, 0) ds
0
soit

T -priodique

en temps. En revanche, on peut liminer la dpendance en

. Il sut de poser
Z t

w(z, t) =
f (z, s, 0) f (z) ds

temps du terme d'ordre

en

0
(noter que

est bien de

T -priodique)

pour obtenir

dz
= f (z) + O(2 )
dt
Si cette approximation n'est pas susante, il faut prendre en compte les
termes d'ordre

et liminer leur dpendance en temps par un changement


2
de variable du type x = z + w1 (z, t) + w2 (z, t) avec w1 et w2 T -priodique.

224

ANNEXE C.

MOYENNISATION

C.3 Un exemple classique


Soit l'quation du second ordre suivante :

d2
d
= + (1 2 ) .
2
dt
dt
C'est l'quation d'un pendule pour lequel on a rajout un petit frottement
positif pour les grandes amplitudes (

> 1) et ngatif pour les petites ( < 1).

Mettons d'abord ce systme sous la forme standard

dx
= f (x, t, )
dt
Le terme oscillant vient du systme non perturb

d2
=
dt2
dont les orbites sont des cercles. Les phnomnes lents (chelle de temps

1/)

sont clairement relatifs aux rayons de ces cercles (i.e. les amplitudes des
oscillations). C'est pourquoi il convient de passer en coordonnes polaires
d
= r sin(). Dans ces coordonnes, le systme
en posant = r cos() et
dt
perturb s'crit

dr
dt

= [1 r2 cos2 ()] sin2 ()

d
dt

= 1 + sin() cos()[1 r2 cos2 ()]

est quasiment gal, une constante prs, au temps

t.

On peut crire

dr
dr dt
=
.
d
dt d
Ainsi, on se ramne la forme standard en prenant

comme variable de

temps

[1 r2 cos2 ()] sin2 ()


dr
=
= f (r, , )
d
1 + sin() cos()[1 r2 cos2 ()]
Le systme moyenn est alors

du

= u(4 u2 )
d
8
u = 2 est un point d'quilibre hyperbolique attracteur pour , i.e. t
+. Donc pour susamment petit, l'quation perturbe possde un cycle

C.4.

RECHERCHE D'EXTREMUM (EXTREMUM SEEKING)

225

2
limite hyperbolique attracteur donc l'quation est approximativement +
d 2
= 4 + O().
dt
L'inconvnient principal de la thorie des perturbations est qu'il faut, ds
le dpart, avoir une ide assez prcise de ce que l'on cherche : il convient de
trouver un petit paramtre

et d'isoler la partie rapide du systme. ce

niveau l'intuition physique joue un rle important.

C.4 Recherche d'extremum (extremum seeking)

Figure

C.1  Boucle "extremum seeking" ; pour le systme statique y =


2
n'est pas connue mais uniquement suppose KC , u converge vers

f (u) o f

un minimum local de
l'amplitude

lorsque la pulsation

est choisie assez grande et

assez petite ((k, h) sont deux autres paramtres

> 0).

Pour conduire une optimisation en temps-rel, en ligne et sans modle,


les ingnieurs ont souvent recours une boucle de feedback dcrite sur la
gure C.1. Ce type de boucle est aussi couramment utilis en spectroscopie
pour ajuster, par exemple, la frquence

d'un laser sur une frquence ato-

mique en cherchant le maximum d'un signal de uorescence


fonction

y = f (u),

la

ayant la forme d'une Lorentzienne dont on cherche le maximum :


f (u) = (uup)12 +p2 + p3 avec p1 , p2 , p3 > 0 paramtres inconus et u, l'argument
du maximum de f , tant aussi inconnu.
Les quations associes au schma bloc de la gure C.1 sont

d
v = k sin(t)(f (v + a sin(t)) ),
dt

d
= h(f (v + a sin(t)) ).
dt

Supposons que f admette un minimum local en u = u


, avec l'approximation
f00
2
00
00

f (u) f + 2 (u u) o f = f (
u) et f = f (
u) > 0. Pour v autour de u

226

ANNEXE C.

MOYENNISATION

on a le systme approch (a assez petit) :



00
f
d
2
v = k sin(t) f + (v + a sin(t) u)
dt
2


00

d
f
2

= h f + (v + a sin(t) u)
dt
2
Alors si les gains

(k, a, h, )

sont tels que

ak f00  ,

h

on peut utiliser l'approximation sculaire et prendre la moyenne sur une


priode en temps. Le systme moyen est alors simplement

ak f00
d
v=
(
u v),
dt
2



f00 
d
a
2

=h f+
(
u v) +
.
dt
2
2

Ce systme triangulaire converge alors vers l'quilibre hyperbolique v = u


et
af00
= 4 .. Comme u = v + a sin(t) on voit que u converge en moyenne vers
u.

C.5 Boucle verrouillage de phase PLL


On dispose d'un signal d'entre

v(t)

bruit dont on souhaite estimer en

temps rel la frquence : cette dernire se situe autour d'une frquence de

0 > 0. Ainsi on a v(t) = a(t) cos((t)) + w(t) avec |


0 |  0 , a(t) > 0 avec |a|
 0 a et w(t) un bruit. L'cart type de w
peut tre bien plus grand que l'amplitude a : le rapport signal sur bruit
rfrence note

peut tre trs dfavorable. Pour ce faire, on dispose de circuits lectroniques

analogiques ou de systmes digitaux, dits de type PLL , qui donnent en


d
: ce type de
temps-rel une estimation non bruite de la frquence d'entre
dt
circuits spcialiss se retrouve dans quasiment tous les systmes lectroniques
de tl-communication (tlphone portable, carte WiFi, bre optique, laser,
horloges atomiques, GPS,....). Les PLL sont aussi utiliss par les physiciens

pour mesurer trs prcisment les constantes fondamentales . Le principe


de fonctionnement des PLL s'analyse trs bien avec la moyennisation une
frquence.
La gure C.2 donne un schma bloc simpli et de principe : chaque bloc
correspond soit un circuit spcique dans le cas d'une PLL analogique, soit
une tape de l'algorithme pour une PLL digitale. La dynamique est rgie
1. PLL pour Phase-Locked Loop.
2. A.L. Schawlow (physicien, prix Nobel 1981 pour ses travaux sur la spectroscopie
laser) disait que pour avoir une mesure trs prcise, il faut mesurer une frquence.

C.5.

227

BOUCLE VERROUILLAGE DE PHASE PLL

Figure C.2  Le schma bloc d'une PLL : la quantit 0 (1 kx) est une
d
du signal d'entre v qui peut tre trs
dt
fortement bruit et dont l'amplitude a n'est pas connue.

estimation ltre de la frquence

par

d
d
x = kf 0 (v(t) sin x),
= 0 (1 kx)
dt
dt
o  est un petit paramtre positif, kf et k deux gains positifs. On pose
v(t) = a cos avec dtd = 0 (1 + p) o a > 0 et p sont des paramtres
inconnus mais constants. Comme 2 cos sin = sin( ) + sin( + ), avec
= et = + , le systme
d
= 0 (1 kx),
dt

d
x = kf 0 (a cos sin x),
dt
devient dans l'chelle de temps

d
x = kf
d

a
2

dt

d
= 0 (1 + p)
dt

= 0 (2 + (p kx)))

sin + a2 sin x
,
2 + (p kx)

d
p + kx
= 
.
d
2 + (p kx)

Ainsi, on est sous la forme standard du thorme 38 avec

la place de

t.

Le systme moyen est

a
sin x
d
x = kf 2
,
d
2 + (p kx)
On nglige des termes d'ordre

en

d
p + kx
= 
.
d
2 + (p kx)
et on prend comme systme moyen :


d
kf  a
x=
sin x ,
d
2
2

d

= (p + kx).
d
2

Ce systme s'crit aussi sous la forme d'une seule quation du second ordre
avec

p
/ =  kf ka/8
r


d2
2kf d
2p
=
sin
.
d 2
ka d
ak

228

ANNEXE C.

MOYENNISATION

2p
= 2p
On choisit le gain k assez grand pour que < 1. Ainsi on pose sin
ak
ak
] , [. Ce systme admet donc deux points d'quilibre (angle
avec
2 2
dni 2 prs) :




est un col (deux valeurs propres relles de signes opposs)


=
est localement asymptotiquement stable (deux valeurs propres
=
partie relle strictement ngative).

On reprend en partie les arguments utiliss pour le PI avec anti-emballement


(systmes autonomes dans le plan, section 1.3.5). Ici, il faut faire un peu
attention car l'espace des phases est un cylindre et non un plan. Une tude
complte est faite au chapitre 7 de [6]. Nous en rsumons ici les grandes
lignes :
 Le calcul de la divergence du champ de vecteur dans les coordonnes

(, =

d
) donne
d

q
2k
kaf < 0.

Les trajectoires sont bornes dans le

cylindre (la vitesse est borne).


 Ainsi, il ne peut y avoir au plus qu'une seule orbite priodique et de
plus elle fait un tour autour du cylindre.
 Pour

et

kf

assez grands, on a deux points d'quilibre et on n'a pas

d'orbite priodique (bifurcation globale fonde sur l'espace rentrant du

).

k et kf assez

col
Pour

grands

converge donc vers une constante.

C'est le verrouillage de phase : la dirence

entre la phase

de la PLL et

du signal d'entre analyser converge vers une valeur constante


2 prs : = + cte.
d
converge vers dtd , comme dtd = 0 (1 kx), on voit que l'on
Ainsi
dt
d
avec 0 (1 kx).
a une estimation peu bruite de la frquence d'entre
dt
Pour cela, nous n'avons pas eu besoin de connatre prcisment l'amplitude a.
la phase

dnie

Noter que la mme PLL donne, lorsque la frquence reste xe, les modulations
de phase.

Annexe D
Automatique en temps discret

La reprsentation des systmes dynamiques sous forme discrte est souvent ncessaire lorsqu'on doit raliser de manire pratique le contrle avec
un systme numrique d'acquisition, de traitement des donnes et des algorithmes ainsi que leur application. Alors que jusque dans les annes 1960,
les contrleurs utilisaient seulement des composants analogiques, avec des
circuits lectriques assurant les tches de mesure, de calcul et de transmission des ordres vers les actionneurs, aujourd'hui la majorit des systmes de
contrle utilisent des convertisseurs analogiques-numriques , des microprocesseurs, et des convertisseurs numriques-analogiques .
Dans un tel schma, les algorithmes de contrle sont excuts en temps
discret, avec une priodicit (constante) correspondant une frquence choisie en fonction de la ractivit naturelle du systme contrler. On peut
considrer qu'en aronautique, les boucles de guidage-pilotage sont xcutes tous les quelques (10) millisecondes, alors que dans le gnie des procds
de la chimie lourde, les priodes sont plutt de l'ordre de la minute.
Ainsi, dans la chane d'action entourant le systme physique, on a des
signaux numriss utilisables par des microprocesseurs fonctionnant suivant
des cycles d'horloge cadencs une frquence d'chantillonnage

1/Te > 0.

En outre, on doit souvent considrer plusieurs horloges, dont les frquences


n'ont pas ncessairement de multiple commun. Nous laissons volontairement
de ct ces problmes diciles dits de multi-chantillonnage (multirate [3]),
mme s'ils ont une importance pratique certaine.
Dans la suite de ce chapitre, les mesures de signal sont supposes tre
eectues des instants

nTe

n N. Elles vont tre utilises par le contr0, Te ,


1
rsultat de calcul en un temps infrieur Te .

leur prenant la forme d'un algorithme excut chaque pas de temps

2Te ,

... suppos aboutir un

1. la question des problmes engendrs par des temps de calculs excdant

229

Te est discute

230

ANNEXE D.

CNA

contrleur

Figure

AUTOMATIQUE EN TEMPS DISCRET

actionneur

Systme

capteur

CAN

D.1  Schma d'implmentation numrique d'un algorithme de

contrle.

Le rsultat de cet algorithme est ensuite utilis pour actionner un organe de


commande (comme un moteur, une gouverne, etc...).
La description prcdente correspond la Figure D.1. Dans ce schma,
reprsentant une utilisation d'un algorithme de contrle en temps discret
la frquence

1/Te ,

deux lments n'ont pas encore t dcrits.

Le premier bloc est le CNA (convertisseur numrique-analogique ), il s'agit


d'un sous-systme prenant en entre des grandeurs discrtes et les transformant en signal continu. Cette conversion peut se faire suivant la mthode du
bloqueur d'ordre zro

yb (t) = y(nT e) = y[n], nTe t < (n + 1)Te


yb est le signal de sortie en temps continu, y est le signal discret d'entre
et n est la partie entire de t/Te . On peut utiliser d'autres types de bloqueur
pour rendre le signal yb continu, direntiable, ou plus rgulier encore. Ainsi

le bloqueur d'ordre 1 est

yb (t) = y[n] +

t nTe
(y[n] y[n 1]), nTe t < (n + 1)Te
Te

Le second bloc est le CAN (convertisseur analogique-numrique ). Il s'agit


d'un systme ayant en entre un signal en temps continu (comme
demment) et en sortie un signal en temps discret (comme

yb

prc-

prcdemment).

Un autre problme important est que la reprsentation du signal

est faite

en utilisant un nombre ni de bits composant la reprsentation numrique


binaire du signal chantillonn. On pourra se reporter [35] pour une prsentation des direntes technologies de conversion binaire. Laissant volontairement de ct les problmes de reprsentation binaire de grandeurs
valeur relle, il reste se soucier des problmes lis l'chantillonnage une
frquence

1/Te .

dans le cadre d'algorithmes numriquement intensifs comme la Model Predictive Control,


MPC [56]

D.1.

231

THORME D'CHANTILLONNAGE DE SHANNON

D.1 Thorme d'chantillonnage de Shannon


Le thorme de Shannon prcise les liens entre un signal en temps continu
et sa reprsentation chantillonne. Le dernier chapitre de [52] en propose une
dmonstration plus mathmatique. Nous allons la reprendre ici en insistant
sur ses implications en automatique.

Thorme 39
tR

(Thorme de Shannon)

Si le signal en temps continu

ne contient pas de frquence suprieure

y(t),

Hertz, alors il peut tre

reconstruit de manire exacte partir d'chantillons rgulirement espacs de

1/(2B)

secondes (ou moins).

Ce thorme fondamental en thorie de l'information, voir [72], doit tre


compris en dtails pour en saisir la port, et les limitations. Le signal
suppos tre dni pour tout
connus pour tout

n Z.

y(t) est

t R, et les chantillons y[n] sont supposs tre


y(t) est un signal

L'hypothse principale est que

contenu frquentiel born, c.--d. que sa transforme de Fourier

F (t 7 y(t), N ) =

y(t) exp(2iN t)dt

est support born inclus dans

] B, B[

(c.--d. qu'elle est nulle en dehors

de cet intervalle).
L'nonc ne s'applique pas des signaux en temps continu dni seulement sur un intervalle de temps born, car ces signaux ne sont en gnral

pas contenu frquentiel support born . L'hypothse de contenu frquentiel nul en dehors du domaine

] B, B[

peut en pratique tre relche, au

prix d'une reconstruction inexacte due au phnomne de repliement spectral


(aussi appel aliasing ) expos ci-dessous.
Le phnomne d'aliasing peut-tre mis en vidence trs simplement sur un
signal sinusoidal de frquence suprieure

1/(2Te ). Considrons la gure D.2

Si le signal chantillonner est pralablement ltr par un ltre anti-

aliasing ayant pour fonction d'attnuer compltement toute frquence sup-

1/(2Te ) (c.--d. d'avoir un gain nul toutes les frquences au dessus


1/(2Te )), ce signal ltr peut tre en thorie parfaitement reconstruit. Des

rieure
de

ltres de dimension nie peuvent approcher ce ltre anti-aliasing idal. On


peut ainsi utiliser les ltres de Butterworth, ou de Bessel rgls la bonne
frquence [35].
2. on notera la notation trs proche de celle du cours [52] avec la correspondance

F (t 7 y(t), N ) = (Fy)(2N ).
3. Si y est support compact,

alors sa transforme de Fourier est une fonction analy-

tique, et donc ne peut pas tre support compact car sinon elle est nulle, voir [26][31.5.4]

232

ANNEXE D.

AUTOMATIQUE EN TEMPS DISCRET

16
14
12
10
8
6
4
2
0

Figure

10

12

14

16

18

20

D.2  Apparition du phnomne de repliement spectral lors de

l'chantillonnage d'un signal sinusoidal. Des basses frquences apparaissent


lorsque la frquence d'chantillonnage choisie viole l'hypothse du Thorme 39 de Shannon (courbes du bas).

La formule de reconstruction est la formule de Shannon-Whittaker

y(t) =

+
X

y[n]sinc

n=

(t nTe )
Te

sin(t)
. Cette formule de ret
construction est quivalente au ltrage d'un signal constitu d'impulsions

o sinc est la fonction sinus-cardinal sinc(t)

de Dirac

pondres par les chantillons

y[n]

avec un ltre passe bas idal

(ayant une fonction de transfert rectangle dans le domaine frquentiel) la


frquence

1/(2Te ).

La formule de reconstruction prcdente est convergente sous la condip


tion susante que la suite (y[n])nZ appartient l'espace ` (Z, R)) c.--d.
P
p
nZ (y[n]) < , avec 1 < p < . Elle est aussi convergente si la suite est
constante.
Pour dmontrer le thorme de Shannon, on utilise un rsultat intermdiaire utilisant le lemme suivant (formule de Poisson).

Lemme 5
dans

C)
|y(x)|

y une fonction valeur relle (ou

f , f , f sont sommables et dcroissance


F (t 7 y(t), N ) sa transforme de Fourier.

(Formule de Poisson)
2

de classe C telle que


K
, K > 0. On note
1+x2

Soit

D.1.

233

THORME D'CHANTILLONNAGE DE SHANNON

Alors, on a la formule de sommation de Poisson


+
X

+
X

y[n] =

n=

F (t 7 y(t), k)

k=

Ce rsultat est dmontr dans [68], voir aussi [52] pour un nonc dans
l'espace de Schwartz, et [26] pour un nonc concernant les fonctions de classe
L1 (R).
On utilise ce lemme pour donner une expression simple la fonction
suivante, nomme sommation priodique de la transforme de Fourier de la
fonction

y
+
X

(N ) =

F (t 7 y(t), N k/Te )

(D.1)

k=
En utilisant les proprits usuelles de la transforme de Fourier (modulation
et translation en frquence, voir [52]), on obtient

F (t 7 y(t), N k/Te ) = Te F (t 7 exp(2tN Te )y(tTe ), k)


En utilisant la formule de Poisson du lemme 5, il vient

+
X

(N ) =Te

exp(2nN Te )y(nTe )

n=
+
X

=Te

y[n] exp(2nN Te )

(D.2)

n=
Lorsque
l'hypothse

F (t
7 y(t), N ) est nulle
1
que B <
, la formule
2Te

1
, 1 [, alors, sous
2Te 2Te
(D.1) s'interprte comme une somme
en dehors de

(innie) de fonctions supports disjoints. On peut isoler chaque terme de la


somme en procdant ainsi


F (t 7 y(t), N ) = (N )

1
0

si

|N | < B

sinon

o rect est la fonction nulle partout sauf sur

= (N ) rect(

[1,

1]

N
)
B

o elle vaut

utilisant (D.2), on a alors

F (t 7 y(t), N ) = Te

+
X
n=

exp(2nN Te )y[n]rect(N/B)

1.

En

234

ANNEXE D.

AUTOMATIQUE EN TEMPS DISCRET

or

1
t nTe
sinc(
), N )
Te
Te

exp(2nN Te )rect(N/B) = F (t 7
comme cela est aisment montr par le calcul.
Ainsi, on a

F (t 7 y(t), N ) = F (t 7

+
X


sinc

n=

t nTe
Te


y[n], N )

d'o l'identication

y(t) =

+
X


sinc

n=

t nTe
Te


y[n]

Ce rsultat ne peut plus tre tabli lorsqu'on a recouvrement des spectres


dans la sommation de Poisson. Des termes additionnels viennent s'ajouter
au signal

y(t),

ce phnomne est dsign aliasing [72].

En pratique, les principaux problmes lis l'chantillonnage sont lis


la violation des hypothses du thorme de Shannon. Pour limiter l'eet
d'aliasing, il est ncessaire de ltrer les signaux avant leur chantillonnage.
Nanmoins, mme si le signal considr

y(t)

satisfait l'hypothse, il advient

souvent que le signal eectivement accessible la mesure, c.--d. la conversion CAN, viole cette hypothse. En eet, les bruits sont souvent spectre
haute frquence et viennent donc se replier en signaux basse-frquence par
le phnomne d'aliasing dcrit prcdemment. Ce phnomne renforce la ncessit de ltrer avec l'chantillonnage.

D.2 Systmes dynamiques en temps discret


Nous reprenons ici pour le temps discret, les notions de stabilit dj
introduites dans le chapitre 1 pour le temps continu et la forme d'tat (1.1) :
d
x = v(x, u, t). Montrons d'abord comment associer une telle forme d'tat
dt
en temps continu, une forme d'tat en temps discret. Pour cela prenons la
priode d'chantillonnage
l'entre

u(t)

Te

et supposons que sur l'intervalle

u[k] (bloqueur d'ordre


Cauchy de kTe (k + 1)Te

soit constante la valeur

Supposons que le problme de

d
x = v(x, u[k], t),
dt

x(kTe ) = x[k]

[kTe , (k + 1)Te [
zro, k entier).

D.2.

235

SYSTMES DYNAMIQUES EN TEMPS DISCRET

soit bien dni (prendre par exemple les hypothses du lemme 1 assurant
l'existence et l'unicit globale en temps). On note alors par
de la solution en

u[k]

et

k.

t = (k + 1)Te .

x[k + 1] est

On voit que

x[k + 1] la valeur
x[k],

une fonction de

On peut donc poser

x[k + 1] = F (x[k], u[k], k)

(D.3)

F . En revanche, si v est une fonction continment drivable de ses arguments, alors F


sera aussi une fonction continment drivable de x[k] et u[k] (cf thorme 2).
x, u, t) = 0),
Si (
x, u) est un point d'quilibre de dtd x = v(x, u, t) (t, v(
alors (
x, u) est un point xe du systme dynamique en temps discret (D.3) :
k, x = F (
x, u, k). La rciproque n'est pas vraie en gnral : un point xe
d
x = v(x, u, t). Il
de (D.3) n'est pas en gnral un point d'quilibre de
dt
d
sut de prendre l'oscillateur harmonique de priode Te ( x1 = 2x2 /Te ,
dt
d
x = 2x1 /Te ) et de remarquer que tout tat x R2 est point xe de F .
dt 2
En gnral, on ne dispose pas de formule explicite pour la fonction

Les analogues en temps discret des dnitions 1 et 2 sont les suivantes :

Dnition 23 (Stabilit (au sens de Lyapounov) et instabilit).

Soit

une dynamique discrte en temps x[k + 1] = F (x[k], k] ayant un point xe


x Rn , i.e., k , x = F (
x, k). Le point xe x est dit stable (au sens de

 > 0, il existe > 0 tel que pour


toute condition initiale x[0] vriant kx[0] x
k , la suite des x[k] est
dnie pour tout entier k positif et vrie kx[k] x
k  pour tout temps
k 0. S'il n'est pas stable, il est dit instable.
Lyapounov) si et seulement si pour tout

Dnition 24 (Stabilit asymptotique).


nition 23, le point xe

seulement s'il est stable et si, de plus, il existe


telles que

kx[0] xk ,

Avec les notations de la D-

est dit localement asymptotiquement stable si et


convergent vers

>0

lorsque

tel que toutes suites

tend vers

x[k]

+.

x de x[k + 1] = F (x[k]) est localement asympx, si F est une contraction autour de x. Ainsi

Intuitivement un point xe


totiquement stable autour de

la dnition 4 et le thorme 10 admettent eux aussi des analogues en temps


discret.

Dnition 25 (Point xe hyperbolique). Un point xe x de la rcurrence


x[k + 1] = F (x[k])

est continment direntiable de

Rn

hyperbolique si les valeurs propres de la matrice Jacobienne

F
(
x) =
x

sont toutes de normes direntes de

Fi
xj

1.


1i,jn

dans

Rn

est dit

236

ANNEXE D.

AUTOMATIQUE EN TEMPS DISCRET

Thorme 40 (Stabilit asymptotique locale d'un point xe hyperbolique).


Rn 3 x 7 F (x) Rn continment drivable par rapport x et x Rn
tel que F (
x) = x. Le point xe x de x[k +1] = F (x[k]) est localement asymp-

Soit

totiquement stable (c.f. Dnition 23) si les valeurs propres de la matrice

Jacobienne

F
(
x) =
x

Fi
xj


1i,jn

sont toutes strictement l'intrieur du disque unit du plan complexe. Le

x est instable au sens de Lyapounov si au moins l'une des vaF


leurs propres de la matrice Jacobienne x (
x) est strictement l'extrieure
du disque unit.
point xe

On remarquera que ces conditions susantes de stabilit fondes sur les


valeurs propres de la matrice Jacobienne correspondent celles obtenues en
temps continu (thorme 10) via l'application exponentielle : le demi-plan
complexe partie relle strictement ngative est envoy par l'exponentielle
sur l'intrieur du disque unit. Ainsi pour un systme en temps discret les valeurs propres de la Jacobienne sont appeles multiplicateurs caractristiques
alors que pour un systme en temps continu elles sont appeles exposants
caractristiques.

D.3 Reprsentations externes et internes des


systmes linaires
Dans le domaine discret, les quations de rcurrence (appeles galement
quations aux dirences) remplacent les quations direntielles.
Comme dans le cas du temps continu, les relations entre les entres et les
sorties peuvent tre obtenues soient par une identication entre-sortie, on
parle alors de reprsentation externe, soit en modlisant avec des tats les
quations du fonctionnement du systme, c'est la reprsentation interne.
Le passage de la reprsentation interne externe est direct, travers le
calcul algbrique de la transforme en

z.

Ainsi, au systme 1 seule entre,

et une seule sortie dni par les quations matricielles de rcurrence

x[k + 1] = Ad x[k] + Bd u[k]


y[k] = Cx[k] + Du[k]
Ad
n 1,
o

et

Bd

sont, respectivement, une matrice

n n, n > 0

il correspond la fonction de transfert discrte

H(z) = C(zI Ad )1 Bd + D

(D.4)
(D.5)
et un vecteur

D.3. REPRSENTATIONS EXTERNES ET INTERNES DES SYSTMES LINAIRES237

On peut gnraliser ce calcul aux systmes plusieurs entres et plusieurs

H(z) est une matrice de fonctions de transfert discrtes.


de transfert est calcule partir de la transforme en z

sorties. Dans ce cas,


Cette fonction

des quations de la description interne (D.4) (D.5). Cette transforme est


prsente dans ce qui suit.

Ad , Bd peuvent avoir un lien avec des quations direnX = AX + BU , Y = CX + DU qu'on aura discrtises la priode
d'chantillonnage Te . Ainsi une manire de les discrtiser de manire dite
Les matrices

tielles

 exacte  (au sens du bloqueur d'ordre 0) est d'utiliser les matrices

Te

Z
Ad = exp(ATe ),

exp(At)Bdt

Bd =
0

Dans la suite, on simpliera la notation

Ad , Bd

pour n'utiliser que

et

dans un cadre discret.

D.3.1 Transforme en z
Considrons un signal en temps continu
aux valeurs

y(t),

pour lequel on s'intresse

y(nTe ) = y[n] aux instants d'chantillonnage nTe , n N.


z du signal y la fonction

On

appelle transforme en

Z(t 7 y(t), z) =

+
X

y(nTe )z

+
X

y[n]z n

(D.6)

n=0

n=0

z
Te . La transformation en z d'un signal

La dernire criture sera prfre dans la suite. Cette fonction de la variable


dpend de la priode d'chantillonnage

n'est pas une bijection (mme si on n'a pas encore prcis d'espace d'arrive
et d'espace de dpart) : tant donne un signal
forme en

y,

il existe une unique trans-

correspondante, mais une innit de signaux continus

image une transforme en

ont pour

donne. En eet, seules les valeurs aux instants

d'chantillonnage dterminent le signal continu antcdent d'une transforme


en

donne.

Une transforme en

dnie par (D.6) est une srie. Nous laissons de

ct les problmes de convergence, comme nous l'avons dj fait pour la


transforme de Laplace, le lecteur intress pourra se reporter [20][Chap.
XVI]. Dans le domaine des signaux chantillonns, les proprits de la transforme en

en font l'quivalent de la transforme de Laplace pour les si-

gnaux en temps continu. Ses proprits principales sont : la linarit (D.7),


la translation par un rel (pour les systmes retard (D.8) ou avance (D.9)),

238

ANNEXE D.

AUTOMATIQUE EN TEMPS DISCRET

l'homothtie exponentielle (D.10), la drivation (D.11) et la convolution

Z(a1 y1 (.) + a2 y2 (.), z) = a1 Z(y1 (.), z) + a2 Z(y2 (.), z)


Z(t 7 y(t nTe ), z) = z n Z(t 7 y(t), z), n N
Z(t 7 y(t + nTe ), z) = z n Z(t 7 y(t), z)

n1
X

(D.7)
(D.8)

!
y[i]z i

nN

(D.9)

i=0

Z(t 7 exp(at)y(t), z) = Z(t 7 y(t), exp(aTe )z)


Z(t 7 ty(t), z) = Te zZ(t 7 y(t), z)
Enn, on notera que la transforme en

(D.10)
(D.11)

est une isomtrie car elle prserve

l'nergie d'un signal au sens de l'galit de Parseval

+
X

1
y [n] =
2
n=0

z 1 Z(t 7 y(t), z)Z(t 7 y(t), z 1 )dz

est un contour entourant l'origine dans le plan complexe.

D.3.2 Ralisation canonique d'une fonction de transfert


discrte
Une ralisation de l'quation aux dirences

y[k] + a1 y[k 1] + ... + an y[k n] = b1 u[k 1] + ... + bn u[k n]


correspondant la fonction de transfert

G(z) =

b1 z 1 + ... + bn z n
1 + a1 z 1 + ... + an z n

est

Ad =

0
.
.
.

0
an

,
...
0
1
an1 ... a1

..
.

0
1

Cd = (bn , bn1 , ..., b2 , b1 )


D'autres ralisations canoniques peuvent tre considres. De manire
gnrale, soit T une matrice (inversible) de changement de base, le triplet
{T Ad T 1 , T Bd , Cd T } est une ralisation au mme ttre que {Ad , Bd , Cd }.
4. dont certains coecients peuvent tre nuls sans perte de gnralit

D.4.

STABILIT DES SYSTMES LINAIRES STATIONNAIRES

239

D.4 Stabilit des systmes linaires stationnaires


Considrons la fonction de transfert discrte

G(z) =

b0 + b1 z 1 + ... + bn z n
N (z)
=
1
n
1 + a1 z + ... + an z
D(z)

En soumettant le signal des signaux d'entre (y compris des conditions


initiales par exemple), on engendre des signaux de sortie qui peuvent se
calculer explicitement travers une dcomposition en lments simples de
la fraction rationnelle obtenue et identication de la transforme inverse de
chaque terme, pour obtenir une description complte de la sortie au cours du
temps (continu). Le comportement asymtotique de la solution, c.--d. lorsque
le temps tend vers l'inni, est dni comme suit.

Dnition 26. Un point d'quilibre x de l'quation aux dirences x[k +1] =


Ax[k]

est asymptotiquement stable si, pour toute condition initiale

solution

x[k]

tend vers

si

x[k]

k +. Le point est instable


kx[k]k + lorsque k +. Il

lorsque

une condition initiale telle que

x0 ,

la

s'il existe
est stable

reste born.

Il apparat la condition ncessaire et susante suivante.

Thorme 41 (Stabilit en temps discret [50]).

Une condition ncessaire et

x[k + 1] =
de A soient

susante pour qu'un point d'quilibre de l'quation aux dirences

Ax[k]

soit asymptotiquement stable est que les valeurs propres

toutes l'intrieur (strict) du cercle de rayon 1 ayant l'origine pour centre.


Si une valeur propre est en dehors de ce cercle, alors le systme est instable.
Comme dans le cas des systmes en temps continu, on dispose d'un rsultat permettant de tester le fait que les racines d'un polynme satisfont les
proprits requises pour les conditions ncessaires de stabilit asymptotique.

Thorme 42

(Critre de Jury,[16])

a1 z n1 + ... + an

avec

a0 > 0.

Ligne 1
Ligne 2
Ligne 3
Ligne 4
Ligne 5

Soit un polynme

On forme le tableau

a0 a1 ... ... an
a
 n an1 ... ... a0
b0 b1 ... bn1 0
= Ligne 1 aan0 Ligne 2
 bn1 bn2 ... b0 0
c0 c1 ... cn2 0 0
= Ligne 3 bn1
Ligne 4
b0

Ligne 6
..
.
Ligne

2n+1

...

w0

0 ... 0

P (z) = a0 z n +

240

ANNEXE D.

AUTOMATIQUE EN TEMPS DISCRET

Une condition ncessaire et susante pour que les racines de

P (z)

soient

toutes (strictement) l'intrieur du cercle de rayon 1 ayant l'origine comme


centre est que tous les lments de

(a0 , b0 , ..., w0 )

soient strictement positifs.

D.5 Commandabilit linaire en temps discret


Considrons maintenant l'quation aux dirences o intervient la commande

x[k + 1] = Ax[k] + Bu[k]

(D.12)

A est une matrice de dimension n n et B est une matrice


n m. Comme on va le voir, il faut distinguer, sauf dans le
o

de dimension
cas o

est

inversible, la notion de commandabilit (possibilit d'aller de n'importe quel


tat

0)

de l'atteignabilit (possibilit d'aller de

Dnition 27

n'importe quel tat).

(Commandabilit en temps discret)

Le systme en temps
x0 , il existe

discret (D.12) est dit commandable, si quel que soit l'tat initial
une squence de commande

u[0], u[1],..., u[n 1]

qui permet d'atteindre l'tat

0.

Dnition 28

Le systme en temps disf


cret (D.12) est dit atteignable, si quel que soit l'tat nal dsir x , il existe
(Atteignabilit en temps discret)

une squence de commande


0 l'tat xf .

u[0], u[1],..., u[n1] amenant le systme initialis

en

Par un simple calcul, on tablit la relation gnrale entre un tat initial

, une squence de commande

au bout de

u[0], u[1], ..., u[n 1]

et le point atteint

x[k]

itrations.

x[n] = An x[0] + [B, AB, ..., An1 B] [u[n 1], ..., u[0]]T
= An x[0] + C [u[n 1], ..., u[0]]T
o

est la matrice de commandabilit de la paire

(D.13)

(A, B) dj rencontre la

Proposition 6. En prenant comme inconnue la squence de commande dans


la dernire quation, on tablit directement le rsultat suivant (voir [38]).

Proposition 10

(Atteignabilit et commande en boucle ouverte atteignant

un point arbitraire en temps ni)

Soit un systme discret

x[k + 1] = Ax[k] +

Bu[k] avec dim x = n. Ce systme est atteignable si et seulement si la matrice


C = [B, AB, ..., An1 B] est de rang plein. Soit xf un point arbitraire qu'on
souhaite atteindre. La commande en boucle ouverte

[u[n 1], ..., u[0]]T = C 1 (xf An x[0])


permet de faire transiter en exactement

itrations le systme de

x[0]

xf .

D.5.

241

COMMANDABILIT LINAIRE EN TEMPS DISCRET

Si on souhaite que le systme atteigne l'tat

0, la condition que la matrice

C est de rang plein est une condition susante mais pas


C peut tre singulire si A est nilpotente, et dans ce cas, la
commande u = 0 sut a atteindre 0. Ainsi la proprit de commandabilit
dans le cas discret n'est pas quivalente au fait que la matrice C est de rang
de commandabilit

ncessaire. Ainsi

plein.

n 0
La condition ncessaire de commandabilit est que A x doit appartenir
n1
l'espace engendr par les vecteur B, AB, ..., A
B qui est l'espace accessible
la commande. Si

est inversible, on peut r-crire (D.13) sous la forme

An x[n] = x[0] + An C [u[n 1], ..., u[0]]T


En considrant la squence de commande comme inconnue dans cette dernire quation, on voit que dans ce cas, la commandabilit est quivalente au
n
fait que la matrice A
C soit de rang plein, ce qui est quivalent ce que C
soit de rang plein.

D.5.1 Placement de ples


Considrons l'quation aux dirences o intervient la commande

x[k + 1] = Ax[k] + Bu[k]


o

est une matrice de dimension

nn

et

est un vecteur de dimension

n. Comme dans le cas continu, il est possible lorsque le systme est commandable, de choisir le polynme caractristique det(zI A + BK) de A BK
en le choisissant gal un polynme P (z) librement choisi (de premier terme
n
normalis z ). Ceci est ralis en choisissant le gain K d'aprs la formule
d'Ackermann (qui sert galement dans le cas continu)

K = [0, ..., 0, 1] C 1 P (A)

D.5.2 Rendre une matrice nilpotente par feedback


Pour stabiliser asymptotiquement le systme (commandable) il est sufsant de rendre la matrice

A BK

nilpotente. Ainsi, quelle que soit la

condition initiale, le systme atteint le point

en au plus

itrations.

Pour raliser ceci, il sut d'utiliser la formule d'Ackermann avec

. Ainsi un gain qui rend la matrice

A BK

P (z) =

nilpotente est


1
K = [0, ..., 0, 1] C 1 An = [0, ..., 0, 1] An B, ..., A1 B
aprs simplication.

242

ANNEXE D.

AUTOMATIQUE EN TEMPS DISCRET

D.5.3 Synthse d'une commande pour aller en temps


ni un point d'quilibre arbitraire
En utilisant le rsultat prcdent, il est ais de calculer une loi de feedback
f
permettant d'atteindre en un nombre ni d'itrations un point d'quilibre x
arbitrairement choisi. Ceci rsoud le problme de planication de trajectoires
f
A ce point d'quilibre il correspond une commande d'quilibre u solution de
l'quation

xf = Axf + Buf
En utilisant le contrleur

prcdent, on forme la commande

u = K(x xf ) + uf

(D.14)

Ce qui donne l'quation aux dirences

x[k + 1] = Ax[k] BK(x[k] xf ) + Buf


d'o, aprs factorisation, et en utilisant (D.14),

(x[k + 1] xf ) = (A BK)(x[k] xf )
La matrice (A BK) tant nilpotente, grce au choix de K , on atteint donc
xf en au plus n intrations, quelle que soit la condition initiale. Ceci tablit
le rsultat suivant.

Proposition 11 (Commande en feedback atteignant un point d'quilibre en


temps ni). Soit un systme discret x[k + 1] = Ax[k] + Bu[k] atteignable avec
dim x = n.

Soit

xf

uf
u=

un point d'quilibre qu'on souhaite atteindre, et soit

la commande d'quilibre correspondante. La commande en boucle ferme


1
K(x xf ) + uf o K = [0, ..., 0, 1] [An B, ..., A1 B] permet d'atteindre
f
le point x en au plus n itrations.

D.5.4 Commande linaire quadratique LQR en temps


discret
Tout comme dans le cas continu, il est intressant de planier des transitoires optimaux entre deux points de l'espace d'tat, ainsi que de calculer
des rgulateurs stabilisants optimaux au sens d'un critre quadratique. On se
reportera 3.4 pour des explications gnrales sur la formulation du critre
et l'obtention des quations de stationnarit qui permettent de caractriser
la solution. Nous donnons ici la solution dans le cas du temps discret.

D.5.

COMMANDABILIT LINAIRE EN TEMPS DISCRET

243

Proposition 12 (Commande quadratique en temps discret). Soit un systme


discret x[k+1] = Ax[k]+Bu[k],
x0 . Soit le critre minimiser

dim x = n, dim u = 1, et sa condition initiale

JN = x [N ]Sf x[N ] +

N
1
X

x [i]Rx[i] +

N
1
X

i=1

avec

N > 0, Sf

et

uT [i]Qu[i]

i=0

matrices symtriques positives,

matrice symtrique

dnie positive. La loi de commande minimisant ce critre est la loi de feedback

u[i] = K[i]1 k[i]x[i]


avec

k[i 1] = B T S[i]A,
K[i] = Q + B T S[i]B
S[i 1] = AT S[i]A + R k[i 1]T K[i]1 k[i 1],
S[N ] = Sf
et le cot optimal associ est

i = N, ..., 0

(x0 )T S[0]x0 .

Les formules permettant de calculer le gain optimal et la commande en


boucle ferme sont, comme dans le cas du temps continu, des formules en
temps rtrograde.
Le passage la limite lorsque

N , l'horizon temporel sur lequel est formul

le critre, tend vers l'inni est trait par le rsultat suivant

Proposition 13 (Rgulateur LQR en temps discret). Soit un systme discret


x[k + 1] = Ax[k] + Bu[k], dim x = n, dim u = 1,

et sa condition initiale

x0 .

Soit le critre minimiser

J=

+
X

xT [i]Rx[i] +

i=1

avec

N > 0, Pf

et

+
X

uT [i]Qu[i]

i=0

matrices symtriques positives,

matrice symtrique

dnie positive. La loi de commande minimisant ce critre est la loi de feedback

u[i] = (B T SB + Q)1 B T SA x[i]


o S est l'unique solution stabilisante
T

de

0 = S A SA + A SB(B SB + Q) B T SA R

244

ANNEXE D.

AUTOMATIQUE EN TEMPS DISCRET

( quation algbrique de Riccati en temps discret pour laquelle l'existence


et l'unicit d'une solution stabilisante est garantie sous des hypothses de
commandabilit et d'criture du critre semblables au cas en temps continu
1/2
du Thorme 26, i.e. (A, R
) observable)) et le cot (optimal) associ est
0 T
0
(x ) S[0]x .

D.6 Observabilit linaire, estimation et ltrage


De mme qu'en ce qui concerne la commande, certaines subtilits apparaissent dans le domaine de la reconstruction d'tat partir des mesures
lorsqu'on considre un systme sous sa forme en temps discret. Ainsi, on
doit distinguer la proprit d'observabilit et celle de reconstructibilit d'un
systme (voir ci-dessous).
Considrons l'quation aux dirences, o intervient la mesure

y de l'tat x

x[k + 1] = Ax[k] + Bu[k]


y[k] = Cx[k]
A est une matrice de
n m, et C une matrice
o

Dnition 29

n n, B
dimension p n.

dimension
de

x[k] d'aprs les mesures


u[k], ..., u[k + n 2] futures.

univoque l'tat
commandes

Dnition 30

est une matrice de dimension

(Observabilit en temps discret)

cret (D.15) est dit observable, si, pour tout

k,

(D.15)

Le systme en temps dis-

on peut dterminer de manire

futures

y[k], ..., y[k + n 1]

(Reconstructibilit en temps discret)

et les

Le systme en temps

k , on peut dterminer de
x[k] d'aprs les mesures passes y[k n + 1], ..., y[k]
u[k n + 1], ..., u[k 1] passes.

discret (D.15) est dit reconstructible, si, pour tout


manire univoque l'tat
et les commandes

La constructibilit n'implique pas l'observabilit, on peut trouver des


contre-exemples simples dans [38].
Considrons les quations suivantes, obtenues par un calcul direct depuis
un indice

quelconque.

y[k] = Cx[k]
y[k + 1] = C(Ax[k] + Bu[k])
y[k + 2] = C(A2 x[k] + ABu[k] + Bu[k + 1])
.
.
.

y[k + n 1] = C(An1 x[k] + An2 Bu[k] + ... + Bu[k + n 2])

D.6.

OBSERVABILIT LINAIRE, ESTIMATION ET FILTRAGE

245

Il vient, en regroupant, sous la forme de vecteurs :

0
CB
CAB

y[k]

.
.
=
Ox[k]
+

y[k + n 1]

.
.
.
n2

CA
o

... ...
0 ...
CB
..

0
0
0

u[k]

.
.

u[k + n 2]

est la matrice d'observabilit de la paire

CB
(A, C)

dj rencontre dans

le cas du temps continu au Thorme 28. Dans cette dernire quation, il


apparat directement le rsultat suivant

Proposition 14 (Observabilit et reconstructibilit).

Soit un systme x[k +


dim x = n. Ce systme est observable
n1
d'observabilit O = [C; CA; ...; CA
] est de

1] = Ax[k] + Bu[k], y[k] = Cx[k]


si et seulement si la matrice

avec

rang plein. Ce systme est reconstructible si la matrice d'observabilit est de


rang plein.
Comme ceci est prcis dans [38], les proprits de commandabilit et
de reconstructibilit sont duales, de mme que celle d'atteignabilit et et
d'observabilit.

D.6.1 Filtre de Kalman en temps discret


Lorsqu'on cherche eectivement reconstruire l'tat partir de la connaissances des entres et des sorties du systme, on peut le faire par un observateur asymptotique, en utilisant, par dualit avec les problmes de commande,
les thormes de placement de ples, o invoquer un principe d'optimalit
pour prendre en compte au mieux les incertitudes sur le modle, les entres
et sur les mesures. Comme dans le cas du temps continu, l'outil permettant ce ltrage optimal au sens stochastique est le ltre de Kalman qui est
implment, dans le cas considr, sous forme d'quations aux dirences.

Proposition 15

(Filtre de Kalman en temps discret)

Soit un systme

x[k + 1] = Ax[k] + Bu[k] + D[k], y[k] = Cx[k] + [k], initialis en une


0
variable alatoire x , o est un bruit gaussien centr de matrice de covaj
riance cov([k], [j]) = k M , et est un bruit gaussien centr indpendant
j
de de matrice de covariance cov([k], [j]) = k M . Le ltre de Kalman
reconstruit, travers les quations de propagation et de recalage qui suivent

x de l'tat x. Notons xp [k] l'tat des quations de propagation,


des quations de recalage, ainsi que p [k] et r [k] les matrices

une estimation
et

xr [k]

l'tat

246

ANNEXE D.

AUTOMATIQUE EN TEMPS DISCRET

de covariance pour les tapes de propagation et de recalage, respectivement.


Au cours des itrations, l'estimation recherche de

(
Initialisation

(
Propagation

x[k]

est simplement

xp [0] = xr [0] = E(x0 )


p [0] = r [0] = var(x0 )

xr [k].

(D.16)

xp [k + 1] = A
xr [k] + Bu[k]

p [k + 1] = Ar [k]AT + DM DT

1
T
T
C
[k
+
1]C
+
M
K
=

[k
+
1]C

xr [k + 1] = xp [k + 1] + K(y[k + 1] C xp [k + 1])
Recalage

1

r [k + 1] = p [k + 1]1 + C T M1 C

(D.17)

(D.18)

Ces formules sont celles usuellement considres (voir [69]) Avantageusement, on pourra remplacer la dernire formule dans l'quation de recalage
par l'une ou l'autre des deux quations suivantes (formule de Joseph [14, 23])
obtenue par la formule de Sherman-Morrison-Woodbury applique l'inverse
1
de la matrice p [k + 1]
+ C T M1 C

r [k + 1] = p [k + 1] p [k + 1]C T Cp [k + 1]C T + M

1

Cp [k + 1]

qui se rcrit encore

r [k + 1] = (In KC)p [k + 1](In KC)T + KM K T


qui garantit que la mise jour
positive ds lors que

p [k + 1]

r [k + 1]
l'est.

est une matrice symtrique dnie

Bibliographie

[1] M. Abramowitz and I.A. Stegun. Handbook of Mathematical Functions.


Dover, New York, 1965.
[2] M. J. Abzug and E. Eugene Larrabee.

Airplane stability and control.

Cambridge Aerospace Series. Cambridge University Press, 2002.


[3] Hamed M. Al-Rahmani and Gene F. Franklin. Techniques in multirate
digital control.

In C.T. Leondes, editor, Digital Control Systems Im-

plementation Techniques, volume 70 of Control and Dynamic Systems,


pages 1  24. Academic Press, 1995.
[4] V. Alexeev, E. Galeev, and V. Tikhomirov. Receuil de Problmes d'Op-

timisation. Editions Mir, Moscou, 1987.


[5] B.D.O. Anderson, R.R. Bitmead, C.R. Johnson, P.V. Kokotovic, R.L.
Kosut, I.M.Y. Mareels, L. Praly, and B.D. Riedle. Stability of adaptive

systems : Passivity and averaging analysis. MIT Press, 1986.


[6] A. Andronov, S. Khaikin, and A. Vitt. Theory of Oscillators. Dover,
1987. English Translation.
[7] A. Angot. Complments de mathmatiques. Editions de la revue d'optique, Paris, third edition, 1957.
[8] W. F. III Arnold and A. J. Laub. Generalized eigenproblem algorithms
and software for algebraic Riccati equations. Proc. IEEE, 72 :17461754,
1984.
[9] M. Athans. The Control Handbook, chapter Kalman ltering, pages 589
594. CRC Press and IEEE Press, 1996.
[10] R. Bellman and K. L. Cooke. Modern elementary dierential equations.
Addison-Wesley, 1971.
[11] J. T. Betts. Practical Methods for optimal control using nonlinear pro-

gramming. Advances in Design and Control. Society for Industrial and


Applied Mathematics (SIAM), Philadelphia, PA, 2001.
[12] F. Brauer and J. A. Nohel. The qualitative theory of ordinary dierential

equations. W. A. Benjamin, Inc., New York, 1969.


247

248

BIBLIOGRAPHIE

[13] A. E. Bryson and Y. C. Ho. Applied Optimal Control. Ginn and Company, 1969.
[14] R. S. Bucy and P. D. Joseph.

Filtering for stochastic processes with

applications to guidance. Interscience, 1968.


[15] H. Cartan.

Thorie lmentaire des fonctions analytiques.

Hermann,

1961.
[16] C.-T. Chen. Signals and Systems. Oxford University Press, 2004.
[17] K. L. Chien, J. A. Hrones, and J. B. Reswick. On the automatic control
of generalized passive systems. Transactions ASME, 74 :175185, 1952.
[18] G. H. Cohen and G. A. Coon.

Theoretical consideration of retarded

control. Trans. A.S.M.E., Vol. 75(No. 1) :pp. 827834, 1953.


[19] R. F. Curtain and H. J. Zwart. An Introduction to innite-Dimensional

Linear Systems Theory.

Text in Applied Mathematics, 21. Springer-

Verlag, 1995.
[20] R. Dautray and J.-L. Lions. Analyse mathmatique et calcul numrique

pour les sciences et les techniques, volume 7. Masson, 1988.


[21] M. Demazure.

Bifurcations and Catastrophes. Universitext. Springer,

2000.
[22] V. Ditkin and A. P. Prudnikov. Formulaire pour le calcul oprationnel.
Masson et Cie., 1967.
[23] P. Faurre. Navigation inertielle et ltrage stochastique. Mthodes mathmatiques de l'informatique. Dunod, 1971.
[24] F.R. Gantmacher. Thorie des Matrices : tome 1. Dunod, Paris, 1966.
[25] F.R. Gantmacher. Thorie des Matrices : tome 2. Dunod, Paris, 1966.
[26] C. Gasquet and P. Witomski. Analyse de Fourier et applications. Masson, 1990.
[27] J.P. Gauthier and I. Kupka.

Deterministic Observation Theory and

Applications. Cambridge University Press, 2001.


[28] C. Godbillon.

Gomtrie direntielle et mcanique analytique.

Her-

mann, Paris, 1969.


[29] K. Gu, V. L. Kharitonov, and J. Chen. Stability of time-delay systems.
Birkhuser, 2003.
[30] J. Guckenheimer and P. Holmes.

Nonlinear Oscillations, Dynamical

Systems and Bifurcations of Vector Fields. Springer, New York, 1983.


[31] J. K. Hale and S. M. Verduyn Lunel. Introduction to functional die-

rential equations. Springer-Verlag, 1993.

249

BIBLIOGRAPHIE

[32] S.

Haroche.

priences,

Contrle

2004.

de

Notes

la
de

dcohrence
cours,

thorie

Collge

de

et

ex-

France.

http ://www.lkb.ens.fr/recherche/qedcav/college/college.html.
[33] P. Hartman. Ordinary Dierential Equations. Birkuser, Boston, 1982.
[34] M.W. Hirsch and S. Smale. Dierential Equations, Dynamical Systems

and Linear Algebra. Acamedic Press : New-York, 1974.


[35] P. Horowitz and H. Wineld. The art of electronics. Cambdrige University Press, 2 edition, 1989.
[36] W. Hurewicz. Lectures on ordinary dierential equations. Dover Phoenix
Editions, 1990.
[37] J. Istas. Introduction aux modlisations mathmatiques pour les sciences

du vivant. Number 34 in Mathmatiques & Applications. Springer, 2000.


[38] T. Kailath. Linear Systems. Prentice-Hall, Englewood Clis, NJ, 1980.
[39] R. E. Kalman and R. S. Bucy. New results in linear ltering and prediction problems. ASME Journal of Basic Engineering, pages 95108,
1961.
[40] H.K. Khalil. Nonlinear Systems. MacMillan, 1992.
[41] M. Krsti, I. Kanellakopoulos, and P.V. Kokotovic. Nonlinear and Adap-

tive Control Design. J. Wiley, New-York, 1995.


[42] O. Latte. Distributions et applications. Cours et exercices, cole Nationale Suprieure des Mines de Paris, 2005.
[43] C. Lanczos. Linear Dierential Operators. Dover Publications, 1997.
[44] L. Landau and E. Lifshitz. Mcanique. Mir, Moscou, 4th edition, 1982.
[45] Y. Lee, S. Park, M. Lee, and C. Brosilow.

PID controller for desired

closed-loop responses for SI/SO systems. AIChE Journal, Vol. 44(No.


1) :pp. 106115, 1998.
[46] W. Leonhard. Control of Electrical Drives. Elsevier, 1985.
[47] W. S. Levine. The Control Handbook. CRC Press and IEEE Press, 1996.
[48] J. Ligou.

Introduction au gnie nuclaire.

Presses Polytechniques et

Universitaires Romandes, 2 edition, 1997.


[49] W. Lohmiler and J.J.E. Slotine. On metric analysis and observers for
nonlinear systems. Automatica, 34(6) :683696, 1998.
[50] D. G. Luenberger. Introduction to Dynamic Systems : Theory, Models,

and Applications. John Wiley & Sons, 2 edition, 1979.


[51] F. Maisonneuve. Calcul direntiel. Cours et exercices, cole Nationale
Suprieure des Mines de Paris, 2006.

250

BIBLIOGRAPHIE

[52] F. Maisonneuve.

Calcul intgral.

Cours et exercices, cole Nationale

Suprieure des Mines de Paris, 2006.


[53] F. Maisonneuve. Fonctions d'une variable complexe. Cours et exercices,
cole Nationale Suprieure des Mines de Paris, 2006.
[54] I. Mareels, S. Van Gils, J. W. Polderman, and A. Ilchmann. Asymptotic
dynamics in adaptive gain control. In P. M. Frank, editor, Advances in

Control, Highlights of ECC'99, pages 391449. Springer, 1999.


[55] Ph.

Martin,

equivalence

R.

and

Murray,
trajectory

and

P.

Rouchon.

generation,

2003.

Flat

systems,

Technical

Report

http://www.cds.caltech.edu/reports/.
[56] D. Q. Mayne, J. B. Rawlings, C. V. Rao, and P. O. M. Scokaert.
Constrained model predictive control : stability and optimality.

Au-

tomatica, 36 :789814, 2000.


[57] M. B. Milam.

Real-time optimal trajectory generation for constrained

systems. PhD thesis, California Institute of Technology, 2003.


[58] R. Murray, Z. Li, and S. Sastry. A Mathematical Introduction to Robotic

Manipulation. CRC Press, 1993.


[59] N. E. Nahi. Estimation theory and applications. John Wiley & Sons,
Inc., 1969.
[60] Z. J. Palmor.

Stability properties of Smith dead-time compensator

controller. Int. J. Control, 32(6) :937949, 1980.


[61] N. Petit. Optimisation. Notes de cours, cole Nationale Suprieure des
Mines de Paris, 2004.
[62] W. J. Rugh and J. S. Shamma. Research on gain scheduling. Automatica,
36 :14011425, 2000.
[63] R. Sepulchre, M. Jankovi, and P. Kokotovi.

Constructive nonlinear

control. Springer Verlag, 1997.


[64] G. J. Silva, A. Datta, and S. P. Bhattacharyya.

PID controllers for

time-delay systems. Birkhuser, 2005.


[65] L. Singre. Etude des instabilits dans les puits activs par gas-lift. PhD
thesis, cole des Mines de Paris, 2006.
[66] O. J. M. Smith.

Closer control of loops with dead time.

Chemical

Engineering Progress, 53(5) :217219, 1958.


[67] E. Sontag. Mathematical Control Theory. Springer Verlag, 1990.
[68] E. M. Stein and G. Weiss. Introduction to Fourier Analysis on Euclidean

Spaces. Princeton University Press, 1971.

BIBLIOGRAPHIE

251

[69] R. F. Stengel. Optimal control and estimation. Dover Publications, 1994.


[70] K. J. +strm and T. Hgglund. PID Controllers : Theory, Design, and

Tuning. Instrument Society of America, 1995.


[71] A. Tikhonov, A. Vasil'eva, and A. Sveshnikov. Dierential Equations.
Springer, New York, 1980.
[72] M. Unser. Sampling-50 years after Shannon. Proceedings of the IEEE,
88(4) :569 587, 2000.
[73] K. Yosida. Operational Calculus. Springer, Berlin, 1999.
[74] J. G. Ziegler and N. B. Nichols. Optimum settings for automatic controllers.

Trans. A.S.M.E., Vol. 64 :pp. 759765, 1942.

Available from

www.driedger.ca.
[75] J. G. Ziegler and N. B. Nichols. Process lags in automatic-control circuits. Transp. A.S.M.E., Vol. 65 :pp. 433444, 1943.

252

BIBLIOGRAPHIE

Index

anti-windup, 55, 58

commande linaire quadratique en temps


discret, 243

approximation adiabatique, 46

commande linaire quadratique, 120,

approximation quasi-statique, 46

143, 145

approximation sculaire, 46
atome trois niveaux, 124

commande LQR, 143, 153

atteignabilit en temps discret, 240

commande LQR en temps discret, 243

attracteur, 33

commande modale, 188


consigne, 55

backstepping, 170

contrleur P, 100

bassin d'attraction, 49, 217

contrleur PI, 53, 87, 98

bouclage dynamique, 61

contraction, 202

bouclage statique rgulier, 134, 136

contrainte nale, 153

boucle ferme, 61

contrle en boucle ferme, 123

boucle ouverte, 61

contrle en boucle ouverte, 122


contrle hirarchis, 74

calcul direntiel intrinsque, 166

convergence exponentielle, 21, 157

capteurs logiciels, 174

convertisseur analogique-numrique, 229,


230

centre, 23

convertisseur numrique-analogique, 229,

champs de vecteurs, 39, 166

230

CNS de stabilit asymptotique d'un


systme linaire stationnaire,

critre d'atteignabilit en temps discret, 240

19
CNS de stabilit d'un systme linaire

critre d'observabilit en temps discret, 245

stationnaire, 21
col, 23

critre de Bendixon, 40

commandabilit en temps discret, 240

critre de Jury, 239

commandabilit, 119, 129, 143

critre de Nyquist, 94, 99

commandabilit linaire, 131

critre de Routh, 26

commandabilit non linaire, 128

critre du revers, 98

commande, 7

critre d'observabilit, 184

commande adaptative, 30, 199, 201

critre de commandabilit, 135

commande en boucle ferme, 123

crochet de Lie, 166

commande en boucle ouverte, 129

cycle limite, 39, 41, 42

253

254

INDEX

dpendance de la solution en la condition initiale, 13


distinguabilit, 179

fonction de transfert, 81, 86


fonction mromorphe, 94
fonction non borne radialement, 32,
34, 218

ensemble positivement invariant, 33,


64, 216, 218, 219
entre, 7
entrelacement, 25

fonctions mromorphes, 94
forme d'tat, 61
forme canonique d'un systme linaire,
24, 25

equation algbrique de Riccati en tempsforme d'tat, 7, 86


discret, 244

forme d'tat canonique, 89

quation de Lyapounov, 29, 193

forme d'tat canonique minimale, 87

quation de Riccati algbrique, 157,

forme de Brunovsky, 119, 136, 141,

158, 160, 161

143, 165, 188

quation de sortie, 8

forme de Jordan, 19

quation direntielle de Riccati, 151,

forme normale, 136

153, 154, 158


quivalence statique, 164

forme standard du thorme de Tikhonov, 49

estimation, 176, 182

formule de Joseph, 246

tat, 7

formule de Poisson, 232

tat, 60

formule de reconstruction de Shannon-

tat adjoint, 150, 151


excitation sinusodale, 83
existence d'une solution au problme
de Cauchy, 211

Whittaker, 232
formule de Sherman-Morrison-Woodbury,
246
foyer instable, 23, 42

existence et unicit des solutions d'une foyer stable, 23


quation direntielle, 12

frquence d'chantillonnage, 229

exponentielle de matrice, 18

fraction rationnelle causale, 86

exposants caractristiques, 38

fraction rationnelle propre, 86

facteur d'amortissement, 74

gain d'anti-emballement, 63

feedback, 8, 55, 119, 123

gain intgral, 57

feedback optimal, 153


feedforward, 55, 70, 72, 73, 140, 154
ltrage, 176
ltrage de consigne, 71
ltre de Kalman, 173
ltre de Kalman en temps discret, 245
fonction Lipschitz, 209

identication, 176
indices de commandabilit, 135, 136
intgrale premire, 129, 131, 132, 134
intgrale premire triviale, 131
invariance de LaSalle, 33, 219
invariant chimique, 130

fonction Lipschitz vectorielle, 209

Lagrangien, 147, 148

fonction de transfert, 80

lieu de Nyquist, 99, 100, 102, 105, 107,

fonction de Lyapounov, 33, 215, 218

162, 163

255

INDEX

linarisation par bouclage dynamique,


169
linarisation par injection de sortie,
201
loi d'Arrhenius, 130
marge de gain, 105, 106
marge de phase, 102, 104
marges de robustesse, 79, 94
marges de stabilit du rgulateur LQR,
161
matrice d'observabilit, 245
matrice d'observabilit, 184
matrice de commandabilit, 240
matrice de commandabilit, 132136
matrice de transfert, 86
matrice de transition, 193
matrice Hurwitz, 25, 29, 49, 141
mesure, 8
moteur courant continu, 175
moyennisation, 46, 222
multiplicateurs de Lagrange, 146
nud instable, 23, 42
nud stable, 23
observabilit en temps discret, 244
observabilit, 175

perturbation, 61
perturbations singulires, 46
phnomne d'aliasing, 231
pic de rsonance, 84
placement de ples en temps discret,
241
placement de ples, 120, 142, 157, 186
placement de ples pour l'observateur,
177
plan de phases, 22, 64
planication de trajectoire en temps
discret, 242
planication de trajectoires, 119122,
128, 129, 142, 153, 156
point d'quilibre, 9
point d'quilibre asymptotiquement stable, 79
point d'quilibre globalement asymptotiquement stable, 16, 19, 34,
217
point d'quilibre hyperbolique, 30, 42,
52, 222, 224
point d'quilibre instable, 15
point d'quilibre localement asymptotiquement stable, 15, 31
point d'quilibre stable (au sens de
Lyapounov), 15

observabilit globale, 179

point xe, 235

observabilit locale, 180, 181

point xe localement asymptotique-

observable, 156

ment stable, 235

observateur, 8, 182

point xe hyperbolique, 235

observateur asymptotique, 175, 176,

point xe instable, 235

186
observateur rduit de Luenberger, 187
observateur-contrleur, 175, 187, 188
orbite htrocline, 39

point xe localement asymptotiquement stable, 236


point xe stable (au sens de Lyapounov), 235

orbite homocline, 39

point stationnaire, 9

orbite priodique, 41

ple, 82

oscillateur de Van der Pol, 44

ple d'une fonction mromorphe, 94

oscillateur harmonique, 16

ple instable, 95

oscillateurs, 120

ples d'une fonction de transfert, 86

256

INDEX

ples dominants, 107, 108

retour de sortie, 8

polynme caractristique, 19, 24, 25

retour dynamique de sortie, 91

polynme Hurwitz, 25

rtro-action, 8

portrait de phases, 2224

robuste, 37

prdicteur de Smith, 114, 115

robustesse, 79, 80, 115

principe de superposition, 9

robustesse au retard, 108

principe de sparation, 174, 188

robustesse par rapport aux dynamiques

problme de Cauchy, 11, 12


problme aux deux bouts, 150, 151

ngliges, 52
robustesse paramtrique, 36, 53

problme de Cauchy, 129, 150, 207,


211

schma blocs, 90

pr-compensation, 55, 70, 71

simplications ples-zros, 84, 87

pulsation de coupure, 74

solution approchante, 207, 208, 210

priode d'chantillonnage, 57

sortie, 8
sortie de Brunovsky, 119, 136, 139

quasi-polynmes, 110

sortie de Brunovsky non linaire, 164


sous-varit invariante, 49

ralisation d'une fonction de transfert


discrte, 238
rponse une entre sinusodale, 87
racteur exothermique, 130
ralisation, 87
ralisation d'un transfert rationnel, 87

stabilisation, 119, 122, 123, 141


stabilit, 15
stabilit asymptotique, 15, 31, 86, 215,
218
stabilit asymptotique en temps discret, 235, 236

reconstructibilit en temps discret, 244 stabilit EBSB, 86


rduction de Jordan, 19

stabilit en temps discret, 235, 239

rentre atmosphrique, 144

stabilit Entre-Borne-Sortie-Borne,

rgime asymptotique forc, 83

86

rglages de Ziegler-Nichols, 111, 112

suivi asymptotique, 142

rgulateur LQR, 155, 156

suivi asymptotique de trajectoire, 123

rgulateur PI, 80, 94, 102, 108

suivi de trajectoire, 119, 120, 122, 123,

rgulateur PI, 55, 56

142

rgulateur PI avec anticipation, 72

systme nominal, 79

rgulateur PID, 108

systme non minimum de phase, 116

rejet de l'erreur statique, 87

systme autonome, 39

rponse un chelon, 111

systme discrtis exact, 237

rponse inverse, 116

systme instationnaire, 9

rsolution de l'quation de Riccati al-

systme libre, 9

gbrique, 161
rsonance, 84

systme linaris tangent, 9, 17, 36,


37, 79, 92

retard critique, 94, 104

systme perturb, 79

retour d'tat, 141

systme plan, 38

257

INDEX

systme sous-actionn, 127


systme stationnaire, 9
systmes de Linard, 44
systme autonome, 66
systme commandable, 129
systme command, 119
systme du second ordre, 75
systme linaire commandable, 141
systme linaire instationnaire, 143,
153
systme linaire stationnaire, 176
systme linaire cot quadratique,
150
systme linarisable par bouclage statique, 165
systme sous-dtermin, 119
systme stationnaire, 55
systmes plats, 169
terme intgral, 57
thorme d'invariance de LaSalle, 33
thorme de Cauchy, 96
thorme de Cauchy-Lipschitz, 12
thorme de Hermite-Biehler, 25
thorme de Poincar, 38
thorme de Poincar-Bendixon, 41
thorme de Shannon, 231
thorme de Sylvester, 29
thorme de Tikhonov, 49
thorie des bifurcations et des catastrophes, 79
trajectoire, 129, 141
trajectoire d'un systme command,
129
trajectoire de rfrence, 142
trajectoire en boucle ouverte, 142
transforme de Fourier, 231
transforme de Laplace, 80
transforme en

z,

237

unicit de la solution au problme de


Cauchy, 211

utilisation pratique de la commande


LQR, 160
zro d'une fonction mromorphe, 94
zros d'une fonction de transfert, 86
tat adjoint, 147

Anda mungkin juga menyukai